计算机语音信号的发音合成方法.pdf

上传人:奻奴 文档编号:1010377 上传时间:2018-03-25 格式:PDF 页数:11 大小:370.38KB
返回 下载 相关 举报
摘要
申请专利号:

CN97110082.9

申请日:

1997.04.14

公开号:

CN1196531A

公开日:

1998.10.21

当前法律状态:

终止

有效性:

无权

法律详情:

未缴年费专利权终止IPC(主分类):G06F 17/00申请日:19970414授权公告日:20030618终止日期:20110414|||授权|||实质审查的生效申请日:1997.4.14|||公开

IPC分类号:

G06F17/00

主分类号:

G06F17/00

申请人:

英业达股份有限公司;

发明人:

张景嵩; 曹洪; 张金玉

地址:

台湾省台北市

优先权:

专利代理机构:

中国专利代理(香港)有限公司

代理人:

程天正;王勇

PDF下载: PDF下载
内容摘要

本发明为一种计算机语音信号的发音合成方法,主要利用英语单词中的相邻两个音节中由前一个音节中间位置至后一个音节中间位置的过渡部分,作为英语单词合成发音的双音素。相对于传统使用的半音素和单音素而言,由于双音素是从英语单词中各音节的平稳段切分下来的,因而可最大程度地保留英语单词中各音节间的变化信息,因此,通过本发明将可针对英语单词合成出更逼近真人发音效果的计算机语音。

权利要求书

1: 一种计算机语音信号的发音合成方法,包括: 首先将单词的真人正确发音输入语音接收装置,该单词的语音信号 经模/数转换器采样处理后,产生该单词的数字语音数据; 经由声音编辑器,该数据按各元音或子音的位置及其与前后元音或 子音间之相互影响关系,由相邻两个音节中前一个音节中间位置至后一 个音节中间位置的过渡部分,切分出一个以上的双音素; 根据所切分出的各双音素,通过音质校正装置适当调整不同单词中 相同双音素的语音信号,并将该双音素的语音信号录制成发音数据库, 从而使发音数据库中所采集的双音素更适合作为合成不同单词语音时 的基本单元; 在利用双音素合成单词语音时,首先由计算机读入单词,通过分析 单词得到其对应的国际音标,再将所对应的国际音标分解成双音素,并 经转换为双音素序号后,计算机即按照该序号自所录制成的发音数据库 中提取相对应的数字语音信号,并借助解压缩程序予以解压缩,以取得 该双音素的语音信号,然后再将所取得的语音信号合并,并经平滑处 理,从而合成该单词的正确发音。
2: 如权利要求1所述的计算机语音信号的发音合成方法,其特征 在于,其中双音素的切分可由前一个音节的波峰切分到后一个音节的波 峰。
3: 如权利要求1所述的计算机语音信号的发音合成方法,其特征 在于,所述双音素的幅度、长度必须相当。
4: 如权利要求1所述的计算机语音信号的发音合成方法,其特征 在于,其中组成所述双音素的单音素的两端为波形周期起始点,且其波 形相接点必须相位相同。
5: 如权利要求1所述的计算机语音信号的发音合成方法,其特征 在于,其中不同双音素的同一音节,应有大致相同的周期。

说明书


计算机语音信号的发音合成方法

    传统的计算机由于受到其中央处理器的速度限制和存储装置(如:硬盘等)的存储容量限制,计算机语音合成的运算法及所使用的基本合成单元较简单,致使所合成出文字语音的效果与原声相距甚远,虽有部分业者为获得较符合原声效果的语音而设计有许多新的运算法,可是,至今不仅仍不能彻底解决问题,甚至语音效果上亦无明显的改善。

    由于现今计算机科技在相关硬件设备迅速进步之情形下,为设计者提供了更快的处理器及更大的存储空间,因此,对于语音合成技术而言,设计者不仅可采用复杂的合成和压缩运算法,且用来合成语音的单元也可更大,从而使这些单元中包含更多的语音信息,所以现今计算机科技确实塑造了一个极佳的设计环境。虽然如此,现今语音合成技术在制作合成语音时却仍存在着发音失真的问题,这种失真问题主要是由语音合成技术中的语音合成运算法及压缩运算法所造成。

    以英文单词“HELLO”为例,传统的语音合成技术在针对英文单词找出其国际音标<halo>后,首先按照传统的切分方法切分出<h>、<a>、<l>及<o>等组成音素,并找出其分界点,根据这些音素从相关的发音数据库中提取相关地发音,但实际上在这些音素相互合并连接时,由于各音素间交互影响,并不存在分界段,而存在一个交互影响的区段,且按采样点分断音素,必然导致音素不纯,不纯的音素在连接时,自然清晰度低、噪音大、声音粗糙且机器声明显。

    因此,本发明的目的在于提供一种计算机语音信号的发音合成方法,通过本发明的方法,能有效提高单词合成的准确率,令其发音产生更接近真人说话的效果,并有效增加合成发音的作业速度,从而克服上述传统方法对英语单词进行计算机语音合成处理时所产生的各种缺点。

    本发明的计算机语音信号的发音合成方法包括:

    首先将单词的真人正确发音输入语音接收装置,该单词的语音信号经模/数转换器采样处理后,产生该单词的数字语音数据;

    经由声音编辑器,该数据按各元音或子音的位置及其与前后元音或子音间之相互影响关系,由相邻两个音节中前一个音节中间位置至后一个音节中间位置的过渡部分,切分出一个以上的双音素;

    根据所切分出的各双音素,通过音质校正装置适当调整不同单词中相同双音素的语音信号,并将该双音素的语音信号录制成发音数据库,从而使发音数据库中所采集的双音素更适合作为合成不同单词语音时的基本单元;

    在利用双音素合成单词语音时,首先由计算机读入单词,通过分析单词得到其对应的国际音标,再将所对应的国际音标分解成双音素,并经转换为双音素序号后,计算机即按照该序号自所录制成的发音数据库中提取相对应的数字语音信号,并借助解压缩程序予以解压缩,以取得该双音素的语音信号,然后再将所取得的语音信号合并,并经平滑处理,从而合成该单词的正确发音。

    附图说明:

    图1所示是本发明中采集双音素单元的流程示意图;

    图2是说明本发明的双音素单元分析构成的示意图;

    图3所示是本发明利用双音素单元合成单词发音的流程示意图;

    图4和5是母音“O”的波形图和对应的能量谱;

    图6和7是经过降调处理后的母音“O”的波形图和对应的能量谱。

    以下,将结合附图详细叙述本发明的一个较佳实施例。

    本发明主要在于利用双音素作为英语单词合成发音的基本单元,其中所谓双音素是指英语单词中相邻两个音节的过渡部分,亦即英语单词的相邻两个音节中由前一个音节中间位置至后一个音节中间位置的过渡部分,如以单词“HELLO”为例,其国际音标为<halo>,则该单词中相邻两个音节的过渡部分表示如下:

    其中*符号代表空音或静音。若以国际音标表示,则该单词“HELLO”即系由<*h>、<ha>、<al>、<lo>及<o*>等双音素所组成。

    由此可知,英语单词的发音即由各双音素单元所组成,而采集双音素之方法,参见第1图所示,主要是先将单词经由真人以正确发音输入语音接收装置,单词的语音信号经模/数转换器的采样处理后,产生该单词的数字语音数据,该数据再经声音编辑器按照本发明方法进行切分处理,以切分出组成该单词语音信号的双音素。由于不同单词中相同双音素在发音上仍可能存在有若干差异,因而,借助音质校正装置适当调整不同单词中相同双音素的语音信号,就可使所获得的双音素能更适用于合成不同单词语音时的基本单元。最后,再将所采集的各双音素利用录音及压缩技术将其录制于一发音数据库中,在合成语音时,即可利用该发音数据库中的双音素,以合成单词的正确发音。

    本发明依据前述双音素原理可由8万个英语单词中归纳出约1600个双音素,并利用这些双音素合成单词的发音,因此,欲针对英语单词合成出更逼近真人发音效果的计算机语音,应完全取决于这些双音素之采集方式。因此,如何获得所需之双音素,将是决定本发明双音素合成法中合成音质好坏的关键,所以,在利用语音合成及录音技术录制双音素的发音数据库时,必需适当控制双音素的音速(发音的长短)与音量。

    本发明的双音素单元主要由英语国际音标最基本的母音和子音所组成,其组成方式包括子母音、母子音、母母音及子子音等组成方式,其中母音也称元音,子音也称辅音,一般来说,母音与子音各有其发音特色,母音振幅较大,波形较有规则,周期亦较明显,于音振幅小,波形不规则,周期较无规律性。

    然而,无论是子音或母音,其振幅仍大致有一个由低而高,由高而低的变化过程,因而在本发明中为保证所采样的双音素有足够的变化幅度及相关性,在选择用来切分双音素的语音段时,应按以下步骤进行(参见图2):

    1)先准备一个大容量的语音库,并得出与其对应的参数信息-音素编号(PhonemeLabel),音调级别(PitchLevel),能量级别(PowerLevel)。

    2)对语音库进行LPC(16阶)频谱分析。

    3)对相同音素编号的语音段计算出平均频谱特性,所得结果的平均值AverageK为各频谱参数的加权和。

    4)以频谱特性最接近AverageK的语音段作为合成单元数据。

    5)在选定语音段后,开始切分双音素。

    在切分双音素时,必须依据下列规则:

    1)自前一个音节的波峰切分到后一个音节的波峰。

    2)由于英语单词是由几个双音素拼接而成,因此,每个双音素的幅度、长度必需十分相当。

    3)为令双音素在拼接时保持其周期的完整,切分双音素开始和结束的两端均为波形周期起始点,意即组成该双音素的单音素两端为波形周期起始点,且其波形相接点必须相位相同。否则,若前一音素以正变化率上升,第二音素马上以负变化率连接,则将出现杂音。

    4)不同双音素的同一音节应有大致相同的周期,因此,将这些双音素拼接时,语调才会统一。

    与传统使用的半音素和单音素相比,本发明之双音素由于是从英语单词中各音节的平稳段切分下来的,因而可最大程度地保留英语单词中各音节间的变化信息,因此,利用本发明将可针对英语单词合成出更逼近真人发音的计算机语音。

    以英语单词“HELLO”为例,本发明的双音素切分是按照下列步骤进行的:

    1)首先,针对该英语单词“HELLO”找出其正确的国际音标<halo>;

    2)再根据该国际音标<halo>各元音或子音的位置及其与前后元音或子音间的相互影响关系,按照读音规则切分成<*h>、<ha>、<al>、<lo>及<o*>等区段,其中符号*代表空音或静音,而所切分出的<*h>、<ha>、<al>、<lo>及<o*>等区段,即本发明所称的双音素。

    特别需要注意的是,各区段的切分点是在纯音素的平稳段中点,如此,将该区段的发音拼接合成时,由于是以同一个音素连接,所以,连接比较平稳。

    本发明在利用双音素合成单词语音时,其处理步骤参见图3所示,首先,由计算机读入单词,通过分析单词得到其对应的国际音标,再将所对应的国际音标分解成双音素,并经转换为双音素序号后,计算机即依双音素序号自本发明所录制成之发音数据库中检索相对应的语音数字编码信号。若检索到,则提取所寻得的数字信号,并借助解压缩程序予以解压缩,以取得双音素的语音数据,然后,将所取得的语音数据予以合并,再经平滑处理,即合成该单词的正确发音。

    例如,将这些数据合并后所得到的、合并的语音信号称为S(i),对S(i)做均值平滑滤波处理。取该信号中邻近3帧(一帧指一个采样周期)做计算:当前帧的语音信号S(i)=A1S(p)+A2S(i)+A3S(s)。

    A1,A2,A3-加权系数

    S(p)-前一帧语音数据

    S(s)-后一帧语音数据

    由于语音信号是以脉冲编码调制(PCM)为基础的音调同步差分编码PSDC(Pitch Synchronized Differential Coding),合成时可方便地实现音调控制。将语音信号由周期长度Torg调整到目标周期长度Ttar时,使用一个长度为T=2Torg的哈明窗Hamming window W(i),变换后信号S(i)=W(i)S(i)+W(T/2-i)S(i+a),其中a=Ttar-Torg。为避免合成语音质量变坏,限制Torg/2<Ttar<2Torg。

    图4,5为母音“O”的波形图和对应的能量谱。

    图6,7为经降调处理后的母音“O”的波形图和对应的能量谱,与图4,5对比可看出,变换后的信号保留了原信号所有频带的语音特性,失真很小。

    仍以单词“HELLO”为例,其所对应的国际音标为<halo>,本发明在利用双音素合成单词语音时,系按以下步骤:

    1)先将该音标<halo>切分出<*h>、<he>、<el>、<lo>及<o*>等双音素;

    2)再按照各双音素对应至发音数据库中的双音素序号12、19、23、33及78等,从该发音数据库中提取这些双音素的数字语音信号;

    3)再借助解压缩程序就所提取的数字语音信号予以解压缩,以取得双音素的语音信号,然后,将所取得之语音信号予以合并,再经平滑处理,即合成该单词的正确发音。

    以上所述,仅是本发明的一个较佳实施例,正因如此,本发明的权利要求范围并不局限于此,凡是本领域的熟练技术人员,依据本发明所公开的技术内容所作出的修改和等效变化,均应不脱离本发明的保护范围。

计算机语音信号的发音合成方法.pdf_第1页
第1页 / 共11页
计算机语音信号的发音合成方法.pdf_第2页
第2页 / 共11页
计算机语音信号的发音合成方法.pdf_第3页
第3页 / 共11页
点击查看更多>>
资源描述

《计算机语音信号的发音合成方法.pdf》由会员分享,可在线阅读,更多相关《计算机语音信号的发音合成方法.pdf(11页珍藏版)》请在专利查询网上搜索。

本发明为一种计算机语音信号的发音合成方法,主要利用英语单词中的相邻两个音节中由前一个音节中间位置至后一个音节中间位置的过渡部分,作为英语单词合成发音的双音素。相对于传统使用的半音素和单音素而言,由于双音素是从英语单词中各音节的平稳段切分下来的,因而可最大程度地保留英语单词中各音节间的变化信息,因此,通过本发明将可针对英语单词合成出更逼近真人发音效果的计算机语音。 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1