汉语语音数字化方法和装置 (一)技术领域
本发明涉及汉语语音处理技术领域,具体为一种汉语语音数字化方法和装置。
(二)背景技术
21世纪人类进入数字化时代,正向自动化的宏伟目标前进。
由于人脑与电脑的关系实质是语音与数码的关系,故语言与数字的转换,成为当代科技发展的瓶颈。为了实现人机对话,就必须探索和谋求语言的数字化。专利号为ZL 2005100208451.8的发明专利“汉语语音编码输入法”将我国汉语的21个声母和35个韵母分别用十个阿拉伯数字来表示,这种编码不用依靠拉丁字母,更加易学易记易掌握,不认识中国字的人只要会讲汉语普通话,即可按读音用数字输入,有利于中文的识字学习。更有利于加快中文编程、软件汉化、文字识别、文字通讯、语音与文本的相互转换等等工作的进程。
但用此法也必须操作数字键盘,目前尚未见直接将汉语语音转换为数字的方法和装置。
(三)发明内容
本发明的目的是设计一种汉语语音数字化方法和装置,直接将汉语语音转换为数字代码。
本发明设计的汉语语音数字化方法,以汉语语音编码输入法为基础,每个汉语语音的编码包括声码和调码,我国汉语拼音方案中的21个声母按发音的特点分为5组为5声,即
喷发式发音 b、p、m、f,
弹发式发音 d、t、n、l,
高截式发音 g、k、h,
挤截式发音 j、q、x,
阻擦式发音 z、c、s、zh、ch、r、sh;
35个韵母根据基本单韵母a、e、i、o、u分为5组为5韵,即:
a组,包括:a、ai、ao、an、ang;
e组,包括:e、ei、en、eng;
i(y)组,包括:ia、ie、iao、iou、ian、in、iang、ing、iong、
yu、yue、yuan、yun;
o组,包括:o、ou、ong;
u组,包括:u、ua、uo、uai、uei、uan、uen、uang、ueng;
用0至9十个阿拉伯数字作为声码,即:
1 b、p、m、f
2 d、t、n、l
3 g、k、h
4 z、c、s、zh、ch、r、sh
5 j、q、x
6 u、ua、uo、uai、uei、uan、uen、uang、ueng
7 i、ia、ie、iao、iou、ian、in、iang、ing、iong、
yu、yue、yuan、yun
8 e、ei、en、eng
9 a、ai、ao、an、ang
0 o、ou、ong
阴平、阳平、上声、去声4种声调分别用1至4四个阿拉伯数字作为调码,即:
1 阴平
2 阳平
3 上声
4 去声。
每个汉语语音的编码由一个声码和一个调码组成。
单个汉语语音、或多个汉语语音集装的常用词汇、短语作为一个单元编码集装,同一单元的多个汉语语音的声码顺序在前、该单元的各汉语语音的调码顺序在后,组成词汇或短语的编码。
语音输入时,独立的汉语语音或者多个汉语语音集装的常用词汇、短语相互之间留有间隔,分为语音单元。对汉语语音的声母和韵母发音特点敏感的声码传感器和对汉语语音的声调敏感的调码传感器,在接收一个语音单元的汉语语音时,若为单音按其声母和韵母发音特点声码传感器送出特定信号,按其声调特点调码传感器送出特定信号,即得到该单音汉语语音单元的数字编码,若为连续的多个语音集装,声码传感器和调码传感器依次得到其中各个单音的数字编码,计算机系统再将该语音单元中的各音的声码在前、调码在后顺序排列,得到该多音汉语语音单元的数字编码。各语音单元的数字编码之间有空格分隔。
当有汉语语音编码数据库时,得到的语音单元数字代码与存储的单字及常用词汇、短语的代码比较,即可由语音单元的数字编码得到对应的汉字。
本发明设计的汉语语音数字化装置,包括与计算机连接的声码器和调码器,计算机内有与中央处理器相连接的暂存模块、数字编码存储器。
声码器为十个分别对上述十组声母或韵母发音特点敏感的声码传感器,调码器为四个对汉语语音的四个声调敏感的调码传感器,即有
对b、p、m、f敏感的声码传感器I,
对d、t、n、l敏感的声码传感器II,
对g、k、h敏感的声码传感器III,
对z、c、s、zh、ch、r、sh敏感的声码传感器IV,
对j、q、x敏感的声码传感器V,
对u、ua、uo、uai、uei、uan、uen、uang、ueng敏感的声码传感器VI,
对i、ia、ie、iao、iou、ian、in、iang、ing、iong、yu、yue、yuan、yun敏感的声码传感器VII,
对e、ei、en、eng敏感的声码传感器VIII,
对a、ai、ao、an、ang敏感地声码传感器IX,
对o、ou、ong敏感的声码传感器X;
以及
对阴平声调敏感的调码传感器①,
对阳平声调敏感的调码传感器②,
对上声声调敏感的调码传感器③,
对去声声调敏感的调码传感器④。
各声码传感器和调码传感器接入计算机的暂存模块。
在接收汉语语音时,间隔分开的每个语音单元中的各单音的声母和韵母发音特点和声调特点,声码传感器I~X中的某个和调码传感器①~④中的某个送出信号,对于单音的单元声码传感器I~X中的某个和调码传感器①~④中的某个送出的信号到暂存模块,得到由该声码传感器和调码传感器对应的数字即得到该单音语音单元的数字编码,由中央处理器送入数字编码存储器。对于连续多个汉语语音单元中央处理器将连续得到的该语音单元中各个语音信号的数字编码依次按各音的声码在前、各音的调码在后,组成该语音单元的数字编码送入数字编码存储器。
计算机内还有与中央处理器连接的汉语语音编码数据库,使本装置成为语音汉字录入装置。
汉语语音数字编码数据库中每个汉语语音的编码包括声码和调码,
用0至9十个阿拉伯数字作为声码,即:
1 b、p、m、f
2 d、t、n、l
3 g、k、h
4 z、c、s、zh、ch、r、sh
5 j、q、x
6 u、ua、uo、uai、uei、uan、uen、uang、ueng
7 i、ia、ie、iao、iou、ian、in、iang、ing、iong、
yu、yue、yuan、yun
8 e、ei、en、eng
9 a、ai、ao、an、ang
0 o、ou、ong
阴平、阳平、上声、去声4种声调分别用1至4四个阿拉伯数字作为调码,即:
1 阴平
2 阳平
3 上声
4 去声。
每个汉语语音的编码由一个声码和一个调码组成。
单个汉语语音、或多个汉语语音集装的常用词汇、短语作为一个单元语音集装编码,同一单元的各汉语语音的声码顺序在前、该单元的各汉语语音的调码顺序在后,组成词汇或短语的语音集装编码。
计算机的中央处理器将数字编码存储器中的语音单元的数字编码,和汉语语音编码数据库所存的单个字、或多个字的常用词汇、短语的数字代码比较,得到该语音单元的数字编码对应的汉字,即可确认,在屏幕显示,或录入到特定文件中。
本发明汉语语音数字化方法和装置的优点为:1、汉语语音直接转换为数字编码,方便快捷,便于进行语音汉字输入;2、因汉语语音直接转换为数字代码,有利于计算机编程或计算机控制等处理;如可用于对实用电器如冰箱、空调、电视机等的语音控制;3、以各汉语语音或词组短语的数字编码为基础可编制与多国文字语言相对照的国际词库。
(四)附图说明
图1为本汉语语音数字化方法实施例流程框图;
图2为本汉语语音数字化装置实施例结构框图。
(五)具体实施方式
本汉语语音数字化方法实施例
本汉语语音数字化方法实施例如图1所示,用0至9十个阿拉伯数字作为声码,即:
1 b、p、m、f
2 d、t、n、l
3 g、k、h
4 z、c、s、zh、ch、r、sh
5 j、q、x
6 u、ua、uo、uai、uei、uan、uen、uang、ueng
7 i、ia、ie、iao、iou、ian、in、iang、ing、iong、
yu、yue、yuan、yun
8 e、ei、en、eng
9 a、ai、ao、an、ang
0 o、ou、ong
阴平、阳平、上声、去声4种声调分别用1至4四个阿拉伯数字作为调码,即:
1 阴平
2 阳平
3 上声
4 去声。
每个汉语语音的编码由一个声码和一个调码组成。
单个汉语语音或者多个汉语语音集装的常用词汇、短语作为一个单元语音集装编码,同一单元的各汉语语音的声码顺序在前、该单元的各汉语语音的调码顺序在后,组成词汇或短语的语音集装编码。
语音输入时,独立的汉语语音或者多个汉语语音集装的常用词汇、短语相互之间留有间隔,分为语音单元。对汉语语音的声母和韵母发音特点敏感的声码传感器和对汉语语音的声调敏感的调码传感器,在接收一个语音单元的汉语语音时,若为单音按其声母和韵母发音特点声码传感器送出特定信号,按其声调特点调码传感器送出特定信号,即得到与该汉语语音单元相对应的数字编码,若为连续的多个音,声码传感器和调码传感器依次得到其中各个单音的数字编码,计算机系统再将该语音单元中的各音的声码在前、调码在后顺序排列,得到该多音汉语语音单元的数字编码。各语音单元的数字编码之间有空格分隔。
要将语音“fāmíngzhuānlìhéshíyòngxīnxíngzhuānlì”转换为数字编码,输出时分为“fāmíngzhuānlì”、“hé”、“shíyòngxīnxíngzhuānlì”三个语音单元,相互之间有间隔,即“fāmíngzhuānlìhéshíyòngxīnxíngzhuānlì”。
对于“fāmíngzhuānl ì”的语音单元,声码传感器依次对喷发式发音f、m,阻擦式发音zh,弹发式发音l,发出相应信号,依次得到声码为1142,与此同时调码传感器依次对这4个音的声调阴平,阳平,阴平,去声发出相应信号,依次得到调码为1214。计算机系统将单元中的各音的声码在前、调码在后顺序排列,得到“发明专利”的数字编码11421214。
“hé”为单音节语音单元,声码传感器对h发出相应信号,调码传感器对其声调阳平发出相应信号,得到“和”的数字编码为32。
同样,可得到“shíyòngxīnxíngzhuānlì”语音单元的数字编码为475542241214。
“fāmíngzhuānlìhéshíyòngxīnxíngzhuānlì”转换为数字编码“11421214 32 475542241214”。
汉语语音数字编码数据库中每个字的编码包括声码和调码,
用0至9十个阿拉伯数字作为声码,即:
1 b、p、m、f
2 d、t、n、l
3 g、k、h
4 z、c、s、zh、ch、r、sh
5 j、q、x
6 u、ua、uo、uai、uei、uan、uen、uang、ueng
7 i、ia、ie、iao、iou、ian、in、iang、ing、iong、
yu、yue、yuan、yun
8 e、ei、en、eng
9 a、ai、ao、an、ang
0 o、ou、ong
阴平、阳平、上声、去声4种声调分别用1至4四个阿拉伯数字作为调码,即:
1 阴平
2 阳平
3 上声
4 去声。
每个字的编码由一个声码和一个调码组成。
单个字或多个字集装的常用词汇、短语作为一个单元编码,各字的声码在前、各字的调码在后,组成词汇或短语的编码。
得到的语音单元的数字编码与汉语语音数字编码数据库存储的单字及常用词汇、短语的代码比较,即可由语音单元的数字编码得到对应的汉字。
如上例得到数字编码为“11421214 32 475542241214”,其中“11421214”对应的4字无重码,直接得到其对应的汉字“发明专利”,同样“475542241214”对应的6字也无重码,直接得到其对应的汉字“实用新型专利”。数字编码“32”对应的常用汉字有和、何、合、盒、禾、河、核、菏、涸、颌、阂、劾等十余个,当将前后三个单元同时考虑,可判断该单音单元的对应的汉字为“和”。
可在汉语语音数字编码数据库内对多个重音字设定其中最常用的单个字为单字编码,其它的同音字只在集装的词汇中出现。如本例中数据库中可设定音hé只对应“和”字为单字单元编码,其余发音hé的字均在二字集装的词汇中出现,如:hébì何必(3124)、rúhé如何(4322)、hérén何人(3422)、hézuò合作(3424)、hézī合资(3421)、hézǐ盒子(3423)、hémiáo禾苗(3122)、héliú河流(3222)、jiānghé江河(5312)、hénéng核能(3222)、hédiànzhàn核电站(324244)、hézéshì菏泽市(344224)、gànhé干涸(3312)、shànghé上颌(4342)、xiàhé下颌(5342)、géhé隔阂(3322)、tánhé弹劾(2322)等等,汉语中词汇重音极少。
另外在汉语语音数字编码数据库内对于重音的不同汉字,存储有以包括该字组成的词汇或者以该字字形说明语音与汉字关系的集装名,如:“和平的和”、“河水的河”、“阂外门内亥阂”等。在语音输入有重音字的单个语音时,间隔后补读该字音的集装名,由此确定该代码对应的汉字。上例中“hé”间隔后补读其4音集装名“hépíngdehé”,可确定“32”对应的汉字为“和”。计算机由间隔前后重复三次的“hé”音,可得知此为补读的集装名,不会将“hépíngdehé”的编码也列入输入的语音的数字编码内。
汉语语音数字化装置实施例
本汉语语音数字化装置实施例如图2所示,包括计算机,还有与计算机连接的声码器和调码器,计算机内有与中央处理器相连接的暂存模块、数字编码存储器和汉语语音编码数据库。
声码器为十个分别对上述十组声母或韵母发音特点敏感的声码传感器,调码器为四个对汉语语音的四个声调敏感的调码传感器,即有
对b、p、m、f敏感的声码传感器I,
对d、t、n、l敏感的声码传感器II,
对g、k、h敏感的声码传感器III,
对z、c、s、zh、ch、r、sh敏感的声码传感器IV,
对j、q、x敏感的声码传感器V,
对u、ua、uo、uai、uei、uan、uen、uang、ueng敏感的声码传感器VI,
对i、ia、ie、iao、iou、ian、in、iang、ing、iong、yu、yue、yuan、yun敏感的声码传感器VII,
对e、ei、en、eng敏感的声码传感器VIII,
对a、ai、ao、an、ang敏感的声码传感器IX,
对o、ou、ong敏感的声码传感器X;
以及
对阴平声调敏感的调码传感器①,
对阳平声调敏感的调码传感器②,
对上声声调敏感的调码传感器③,
对去声声调敏感的调码传感器④。
各声码传感器和调码传感器接入计算机的暂存模块。
汉语语音数字编码数据库中每个字的编码包括声码和调码,
用0至9十个阿拉伯数字作为声码,即:
1 b、p、m、f
2 d、t、n、l
3 g、k、h
4 z、c、s、zh、ch、r、sh
5 j、q、x
6 u、ua、uo、uai、uei、uan、uen、uang、ueng
7 i、ia、ie、iao、iou、ian、in、iang、ing、iong、
yu、yue、yuan、yun
8 e、ei、en、eng
9 a、ai、ao、an、ang
0 o、ou、ong
阴平、阳平、上声、去声4种声调分别用1至4四个阿拉伯数字作为调码,即:
1 阴平
2 阳平
3 上声
4 去声。
每个字的编码由一个声码和一个调码组成。
单个字、或多个字集装的常用词汇、短语作为一个单元编码,各字的声码在前、各字的调码在后,组成词汇或短语的编码。
本装置要将语音“fāmíngzhuānlìhéshíyòngxīnxíngzhuānlì”转换为汉字录入,输出时分为“fāmíngzhuānlìhéshíyòngxīnxíngzhuānlì”三个语音单元相互之间有间隔。
发出“fāmíngzhuānlì”的语音,依次声码传感器I对喷发式发音f、m发出信号,声码传感器IV对阻擦式发音zh发出信号,声码传感器II对弹发式发音l发出信号,送入暂存模块,在此依次得到“fāmíngzhuānlì”的声码为1142;与此同时调码传感器①②①④依次对这4个音的声调阴平,阳平,阴平,去声发出相应信号,送入暂存模块,在此依次得到调码为1214。中央处理器提取暂存模块声码和调码,按声码在前、调码在后顺序排列,得到“发明专利”的数字编码11421214送入数字编码存储器。
“hé”只有单音,声码传感器III对h发出相应信号,调码传感器②对其声调阴平发出相应信号送入暂存模块,得到相应的声码3和调码2,中央处理器将“hé”的数字编码32送入数字编码存储器。
同样,可得到“shíyòngxīnxíngzhuānlì”的数字编码为475542241214。
““Fāmíngzhuānlìhéshíyòngxīnxíngzhuānlì”数字编码“11421214 32475542241214”存储于数字编码存储器。
中央处理器将该数字编码与汉语语音编码数据库比较,因“11421214”对应的4字无重码,直接得到其对应的汉字“发明专利”,同样“475542241114”对应的6字也无重码,直接得到其对应的汉字“实用新型专利”。数字编码“32”对应的常用汉字有和、何、合、盒、禾、河、核、菏、涸、颌、阂、劾等十余个,中央处理器将前后三个单元同时考虑,其智能判断该单音单元的对应的汉字为“和”。
在汉语语音数字编码数据库内对多个重音字设定其中最常用的单个字为单字编码,其它的同音字均设定只在集装的词汇中出现。本例中只有“和”为单个语音的汉字。
或者,在汉语语音数字编码数据库内对于重音的不同汉字,存储有以包括该字组成的词汇或者以该字字形说明语音与汉字关系的集装名,在语音输入有重音字的单个语音时,间隔后补读该字的集装名,由此确定该代码对应的汉字。“和”的集装名为“和平的和”
本装置将语音“fāmíngzhuānlìhéshíyòngxīnxíngzhuānlì”转换为汉字在显示屏显示,确认后在相关文件中录入。
因为本汉语语音编码数据库中有大量4字或4字以上的词组或短语,基本没有重码,单音大多只是连词,故中央处理器的智能判断根据前后词组能准确得到单音对应的汉字,而极少误码。
本装置可安装于实用电器如冰箱、空调、电视机、计算器等,即可实现语音控制。如安装了本装置的电视机选台时,可直接讲“zhōngyāng yītái”、“zhōngyāng wǔtái”、“fènghuáng wèishì”等等,本装置的中央处理器可将语音转换为数字编码47721112,47621132、13644244,数字编码直接用于控制电视机的接收频率,实现语音控制电视机换台为中央一台、中央五台或凤凰卫视等等。计算器上安装本装置即可成为口令式计算器,只要讲“sānshíwǔchéngyǐliù”(三十五乘以六),本装置将其转为数字编码446123 4723 24——其中“乘以”可设为一个双音集装单元——显示器上即可出现结果“210”。
上述实施例,仅为对本发明的目的、技术方案和有益效果进一步详细说明的具体个例,本发明并非限定于此。凡在本发明的公开的范围之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围之内。