语义辨识方法.pdf

上传人:a2 文档编号:6181743 上传时间:2019-05-17 格式:PDF 页数:16 大小:2.15MB
返回 下载 相关 举报
摘要
申请专利号:

CN201210342128.7

申请日:

2012.09.14

公开号:

CN103680503A

公开日:

2014.03.26

当前法律状态:

撤回

有效性:

无权

法律详情:

发明专利申请公布后的视为撤回IPC(主分类):G10L 15/26申请公布日:20140326|||实质审查的生效IPC(主分类):G10L 15/26申请日:20120914|||公开

IPC分类号:

G10L15/26; G06F17/30

主分类号:

G10L15/26

申请人:

中瀚国际语识有限公司

发明人:

李志成

地址:

中国台湾台中市西屯区黎明路三段338号

优先权:

2012.08.31 TW 101131765

专利代理机构:

上海智信专利代理有限公司 31002

代理人:

王洁

PDF下载: PDF下载
内容摘要

本发明系提供一种语义辨识方法,包括下列步骤:接收一语音信号;将语音信号辨识为一包含有音译字符组的音译字符序列;将音译字符组的每一个音译字符转换为一拼音字母件组;将拼音字母件组予以依序比对于参考拼音字母件组而得到相似度系数;以及依据相似度系数决定对应的参考音译字符组,藉此改善语音辨识的正确率,使辨识出的语义更接近输入音讯的原意。

权利要求书

权利要求书
1.  一种语义辨识方法,其特征在于,包括下列步骤:
(a)接收一语音信号;
(b)将该语音信号辨识为一音译字符序列,该音译字符序列系包含有至少一个由一音译字符所组成的音译字符组;
(c)将该音译字符序列的每一个音译字符组的每一个音译字符转换为一拼音字母件组;
(d)将该音译字符组的每一个拼音字母件组予以依序比对于一数据库中的参考音译字符组的参考拼音字母件组而得到该音译字符组与该参考音译字符组的相似度系数;以及
(e)依据分别所得的该相似度系数决定该音译字符组于该数据库中所对应的该参考音译字符组。

2.  如权利要求1所述的语义辨识方法,其特征在于,该语音信号系为以非拉丁字母为字母的语音信号。

3.  如权利要求1所述的语义辨识方法,其特征在于,该拼音字母件组系为拉丁字母所拼音组成。

4.  如权利要求1所述的语义辨识方法,其特征在于,步骤(a)还包括:
(a1)将该语音信号录音并取样;
(a2)将该语音信号的取样转换为一语音数字数据;以及
(a3)将该语音数字数据传送至一辨识装置。

5.  如权利要求1所述的语义辨识方法,其特征在于,在步骤(b)与步骤(c)之间,还包括一步骤:
(b1)将该音译字符序列的音译字符组分组。

6.  如权利要求5所述的语义辨识方法,其特征在于,步骤(b1)中该音译字符序列的音译字符组系根据文法结构的分析来分组。

7.  如权利要求5所述的语义辨识方法,其特征在于,步骤(b)还包括给予该音译字符序列的音译字符组一对应词性的步骤,以及步骤(b1)系依据该对应词性而分组该音译字符序列的音译字符组。

8.  如权利要求5所述的语义辨识方法,其特征在于,该每一个组具有一预设的优先度。

9.  如权利要求8所述的语义辨识方法,其特征在于,步骤(d)系根据该每一个组的优先度而从优先度高的组至优先度低的组进行比对。

10.  如权利要求1所述的语义辨识方法,其特征在于,在步骤(e)之后还包括一步骤:
(f)依据该音译字符序列所对应的每一个参考音译字符组而决定该音译字符序列的对应的功能指令。

11.  如权利要求10所述的语义辨识方法,其特征在于,在步骤(f)之后还包括依据该功能指令而输出一执行信息的步骤。

12.  如权利要求11所述的语义辨识方法,其特征在于,该执行信息系为一搜寻关键词串,该搜寻关键词串系被输出至一搜寻引擎进行搜寻。

13.  如权利要求11所述的语义辨识方法,其特征在于,该执行信息系为一控制信号,该控制信号系被输出至一执行设备执行作业。

14.  如权利要求10所述的语义辨识方法,其特征在于,当无法决定该音译字符序列的特定的功能指令时,步骤(f)之后还包括下列步骤:
(g1)输出一再确认要求,该再确认要求系对该音译字符序列的音译字符组进行再确认的要求;
(g2)接受响应于该再确认要求的一再确认信号;以及
(g3)依据该音译字符序列所对应的每一个参考音译字符组及该再确认信号而决定该音译字符序列的对应的功能指令。

说明书

说明书语义辨识方法
技术领域
本发明系关于一种语音辨识方法,特别是关于一种语义辨识方法。
背景技术
早先,使用者与电子产品沟通的方式可以使用键盘、鼠标或触碰屏幕来输入信息,而随着科技的进步,一种较为自然的沟通方式也发展出来,即为语音输入。使用者利用语音输入的方式以及电子产品的语音输出而达到自然对话的效果。而语音输入的过程大体上如下所述,当声音藉由模拟到数字的转换而输入至计算机的内部,并以数值方式储存后,语音辨识程序将已事先储存好的声音样本与输入的测试声音样本进行比对。比对完成后输入一个它认为最「像」的声音样本序列,就可以知道使用者刚刚念进去的声音代表何意,进而能够控制电器设备作各种事情或其它用途。
语音辨识系统的性能受许多因素的影响,包括不同的人说出的话、说话方式、环境噪音及传输信道等等,因此辨识出来的往往会有错误,只有音对,而意不对,譬如,「脏话」和「彰化」、「市民大道」和「四名大盗」。甚至是音也不对,譬如,「姓胡」和「幸福」,所以辨识出来的通常只有音的转译,而不完全是语义的翻译。如此一来,当辨识出来的结果已经有误的情况下,利用文法结构校正的方式来作语义修正的效果是有限的,所以辨识出来的结果上总是会与实际输入的语音有差。
以习知方式要达到高准确率的语音辨识,必须要建立大量的声音样本,譬如男生的声音样本、女性的声音样本、同语言不同腔调的声音样本等等,而且声音的档案比文字的档案大上许多,比对的过程更是繁杂,导致语音辨识须利用高阶计算机比对才有较高的辨识率,也因此难以广泛使用。
发明内容
本发明的主要目的是提供一种语义辨识方法,以改善语音辨识的正确率,使辨识音讯出来的语义更接近输入音讯的原意。
本发明为解决习知技术的问题所采用的技术手段系提供一种语义辨识方法,包括下列步 骤:(a)接收一语音信号;(b)将语音信号辨识为一音译字符序列,音译字符序列包含有至少一个由一音译字符所组成的音译字符组;(c)将音译字符序列的每一个音译字符组的每一个音译字符转换为一拼音字母件组;(d)将音译字符组的每一个拼音字母件组予以依序比对于一数据库中的参考音译字符组的参考拼音字母件组而得到音译字符组与参考音译字符组的相似度系数;以及(e)依据分别所得的相似度系数决定音译字符组于数据库中所对应的参考音译字符组。
在本发明的一实施例中,语音信号系为以非拉丁字母为字母的语音信号。
在本发明的一实施例中,拼音字母件组系为拉丁字母所拼音组成。
在本发明的一实施例中,步骤(a)还包括:(a1)将语音信号录音并取样;(a2)将语音信号的取样转换为一语音数字数据;以及(a3)将语音数字数据传送至一辨识装置。
在本发明的一实施例中,在步骤(b)与步骤(c)之间,还包括将音译字符序列的音译字符组分组的步骤(b1)。
在本发明的一实施例中,步骤(b1)中音译字符序列的音译字符组系根据文法结构的分析来分组。
在本发明的一实施例中,步骤(b)还包括给予音译字符序列的音译字符组一对应词性,以及步骤(b1)系依据对应词性而分组音译字符序列的音译字符组。
在本发明的一实施例中,每一个组具有一预设的优先度。
在本发明的一实施例中,步骤(d)系根据每一个组的优先度而从优先度高的组至优先度低的组进行比对。
在本发明的一实施例中,步骤(e)之后还包括一依据音译字符序列所对应的每一个相似度最高的参考音译字符组而决定音译字符序列的对应的功能指令的步骤(f)。
在本发明的一实施例中,步骤(f)之后还包括依据功能指令而输出一执行信息的步骤。
在本发明的一实施例中,执行信息系为一搜寻关键词串,搜寻关键词串系被输出至一搜寻引擎进行搜寻。
在本发明的一实施例中,执行信息系为一控制信号,控制信号系被输出至一执行设备执行作业。
在本发明的一实施例中,当无法决定音译字符序列的特定的功能指令时,步骤(f)之后还包括下列步骤:(g1)输出一再确认要求,再确认要求系对音译字符序列的音译字符组进行再确认的要求;(g2)接受响应于再确认要求的一再确认信号;以及(g3)依据音译字符序列所对应的每一个参考音译字符组及再确认信号而决定音译字符序列的对应的功能指令。
本发明具有以下有益技术效果:
经由本发明所采用的技术手段,可以提高语音辨识的正确率,并且因为采用的拼音的比对是属于文字的比对,所以是建立文字的数据库来比对,而省去建立庞大的声音样本数据库。以及决定音译字符序列的对应的功能指令,并且依据功能指令而输出一执行信息,藉此,在语音输入的语义若是控制执行设备或是想得到某种信息时,使得语音输入的语义被辨识出来而更准确执行。
此外,本发明将音译字符组进行分组并给予优先度,以及给予对应词性,在比对流程的执行更有效率。
附图说明
图1系显示本发明的第一实施例的语义辨识方法的流程图。
图2系显示应用有本发明的第一实施例的语义辨识方法的电子设备的方块图。
图3系显示应用有本发明的第一实施例的语义辨识方法的电子设备的示意图。
图4系显示本发明的第二实施例的语义辨识方法的流程图。
图5系显示应用有本发明的第二实施例的语义辨识方法的电子设备的方块图。
主要组件符号说明
100电子设备
1撷取装置
11录音单元
12取样单元
13传输单元
2辨识装置
21辨识单元
22转换单元
3数据库
4拼音比对装置
41分组单元
42拼音转换单元
43比对单元
5输出单元
6执行设备
具体实施方式
本发明所采用的具体实施例,将藉由以下的实施例及附呈图式作进一步的说明。
参阅图1及图2所示,图1系显示本发明的第一实施例的语义辨识方法的流程图,图2系显示本发明的第一实施例的语义辨识方法的电子设备的方块图。
如图所示,本发明的第一实施例的语义辨识方法可执行于一电子设备中,用以辨识一输入音讯的语义,进而给予对应的回应。电子设备100在本实施例中包括一撷取装置1、一辨识装置2、一数据库3、一拼音比对装置4、以及一输出单元5。其中撷取装置1包含一录音单元11、一取样单元12及一传输单元13,辨识装置2包含一辨识单元21、一转换单元22,拼音比对装置4包含一分组单元41、一拼音转换单元42及一比对单元43。
首先,输入语音信号(步骤S110)。例如,撷取装置1中的录音单元11接收使用者讲的一段语音信号,并且将语音信号储存起来(步骤S111)。取样单元12将语音信号的背景杂音删除并且取样后转成语音数字数据(步骤S112)。然后传输单元13将所取样的语音数字数据传送至辨识装置2(步骤S113)。撷取装置1可为智能型手机、个人计算机或智能型电视等,辨识装置2可以是远程服务器,而传输单元13借着因特网将取样的语音数字数据传送至辨识装置2。
当取样的语音数字数据传送至辨识装置2后,辨识装置2运用语音识别技术(Automatic Speech Recognition,ASR)将取样的语音数字数据与数据库3中的参考语音数字数据进行比对,而得出最匹配的参考语音数字数据,并且根据所得的参考语音数字数据而取得取样的语音数字数据所对应的音译字符序列(步骤S120)。详细而言,在本实施例中,辨识单元21是利用隐藏式马可夫模型(Hidden Markov Model,HMM)及类神经网络(Neural Network,N.N.)的方法将取样的语音数字数据与数据库3中的参考语音数字数据进行比对,而得到最合适的参考语音数字数据。然后转换单元22根据最匹配的参考语音数字数据对应的音译字符而将步骤S110中输入的语音信号转换为所对应的音译字符序列,其中音译字符序列包含有至少一个由一音译字符所组成的音译字符组。音译字符主要是由语音信号的语言所使用的字符,举例来说,汉语的音译字符序列主要是由汉字所组成、日语的音译字符序列主要是由假名与日本汉字所组成,以及韩语的音译字符序列主要是由韩字所组成。
透过辨识装置2运用语音识别技术辨识后而得到的音译字符序列,会具有基本的字义分组,此分组即为音译字符组,而不光只是纯音译。举例来说,输入的语音信号为「花莲的海洋公园」的情况下,其辨识出来的音译字符序列可能由下列的音译字符组所组成,「花莲」、 「华丽」、「的」、「海洋」、「公元」、「公园」。如此一来,音译字符序列可能是「花莲的海洋公园」、「华丽的海洋公园」或「华丽的海洋公元」等,而不会是「华怜的海杨供圆」等只有纯音译的情况。其中,音译字符组由至少一个音译字符所组成,譬如音译字符组「花莲」是由两个音译字符「花」及「莲」所组成,而音译字符组「的」是由一个音译字符「的」所组成。
接下来,辨识出来的音译字符序列将传送至拼音比对装置4进行拼音转换与比对。拼音比对装置4在本实施例中是一服务器,与语音辨识装置2和数据库3以因特网连接传输。拼音比对装置4的分组单元41将辨识出来的音译字符序列的音译字符组进行分组(步骤S122),而且每一个组分别给予一个预设的优先度,使得在比对时可以根据优先度的高低而决定比对的顺序。较佳地,在分组之前给予音译字符序列的音译字符组一对应词性(步骤S121),譬如,本实施例中,中文的情况下,音译字符组的词性依照简易中文分词系统(Simple Chinese Words Segmentation,SCWS)来分组,并主要分成三大类,动词类、名词类及其它,而每个类别又包含许多组,例如名词类又再细分为人名组、地名组、机构团体组、名词性语素组及其它专名组。
此外,分组的时候,除了利用词性分组外,还可以配合文法结构的分析,使得分组时的正确率更高。例如在中文的情况下,一个字符或一个字符组往往有两种以上的词性,会使得在步骤S122中依词性而分组时容易分组错误。如此一来,配合文法结构的分析,分组的错误率能降低。在本实施例中,在中文的情况下,文法结构是利用中文句结构树数据库(Sinica Treebank)来分析。当然,本发明不限于此,词性分组也可以使用其它数据库或系统的分组方式,只要能分组即可,而文法结构也可以使用其它数据库或系统来分析,只要能分析文法即可。
接着,藉由拼音转换单元42将音译字符序列的音译字符组的音译字符转换为一拼音字母件组(步骤S130)。详细而言,在本实施例中,在中文的情况下,较佳地是使用英文字母来作拼音的拼音字母,以及使用汉语拼音系统(Hanyu Pinyin)来记写中文字读音。例如,音译字符组「台北」藉由拼音转换单元42而转换成汉语拼音「tai2bei3」(数字代表声调),其中「tai2」即为音译字符「台」的拼音字母件组,「bei3」即为音译字符「北」的拼音字母件组。当然,本发明不限于此,也可以使用拉丁字母或其它表音文字(Phonogram)来作拼音的拼音字母,或是采用通用拼音系统(Tongyong Pinyin)或其它拼音系统,只要能拼出该音译字符之音即可。
在步骤S130之后,比对单元43将音译字符组的每一个拼音字母件组予以依序比对于数据库3中的参考音译字符组的参考拼音字母件组而得到该音译字符组与该参考音译字符组的 相似度系数(步骤S140)。详细而言,藉由比对单元43将音译字符组的每一个拼音字母件组和数据库3中的参考音译字符组的参考拼音字母件组进行比对,并且根据组的优先度而依序从优先度高的组比对至优先度低的组,举例来说,「zhao3(找)」、「xiang3zhi1dao4(想知道)」等搜寻字的组的优先度在设定上高于地名或人名的组,在比对时会先将优先度高的组进行数据库比对,并在高优先度组比对完成后再进行优先度次高的组的数据库比对,然后依序比对至优先度最低的组,藉此使得比对更有效率。当然,本发明不限于此,在比对的过程中,若是已经比对至一个适当的结果而能进行下一个步骤,则不需要将音译字符序列的所有音译字符组去对数据库3中所有的参考音译字符组,只要比对的结果可以进行下个步骤即可,譬如,被归类至助词组的音译字符组「的」、「之」及「着」将不进行比对。
在本实施例中,进行比对的方式是计算两者的编辑距离(Levenshtein distance),然后将得出的编辑距离(L)换算为相似度系数(S),换算的方式为相似度系数S=1/(1+L)。譬如「xing4hu2(姓胡)」和「xing4fu2(幸福)」,「xing4(姓)」和「xing4(幸)」的拼音字母件组完全一样,则相似度系数S为1/(1+0)=1,而「hu2(胡)」和「fu2(福)」的编辑距离L为1,所以「hu2(胡)」和「fu2(福)」的相似度系数S为1/(1+1)=0.5。而若是比较一个音译字符组,如「姓胡」和「幸福」,则是两者的音译字符组的拼音字母件组一起比对「xing4hu2(姓胡)」和「xing4fu2(幸福)」,其编辑距离L为1,则两者的相似度系数S为1/(1+1)=0.5。当然,本发明不限于此,也可以利用其它比对方式,或是相似度系数与编辑距离的关系为S=1/(1+2L),只要能求出两者的相似度的相似度系数S即可。
然而,因为同一个音译字符组有时候会具有多重的词性而可以分配在不同的组进行比对,或是因为语音辨识出来的音译字符组有误,仅音译正确但音译字符错误而分配到错误的组,此情况下比对出来的结果得到的相似度系数S可能会不够好。因此在步骤S140中,可以配合文法结构的分析,将每一个音译字符组比对数据库3中一个以上词性的组,而得到在不同分组的比对下的相似度系数S,最后根据在不同分组情况下,综合各个音译字符组的相似度系数S的平均,从而得到最合适的分组方式,而得到音译字符组的最合适的相似度系数S。举例来说,输入的语音信号为「宜兰的蜜饯」,而辨识出的音译字符序列为「依然的密件」,则其音译字符组的分组分别为「依然」是副词组,「密件」是名词组,在比对时会在副词组中将音译字符组「依然」的拼音字母件组「yi1ran2」与数据库3中的参考音译字符组「依然」的参考拼音字母件组「yi1ran2」比对而得到相似度系数S=1,在名词组中将音译字符组「密件」的拼音字母件组「mi4jian4」与数据库3中的参考音译字符组「密件」的参考拼音字母件组「mi4jian4」比对而得到相似度系数S=1,其相似度系数的平均为1。接着,将音译字符组 「依然」的拼音字母件组「yi1ran2」与数据库3中的地名组比对,而得到与数据库3中参考字符组「宜兰」的参考拼音字母件组「yi2lan2」的相似度系数S=1/3,然后将音译字符组「密件」的拼音字母件组「mi4jian4」与数据库3中的名词组比对,而得到与数据库3中参考字符组「蜜饯」的参考拼音字母件组「mi4jian4」的相似度系数S=1,其相似度系数的平均为2/3。虽然第二次用另一种分组去比对时的相似度系数S的平均较低,但配合文法结构的分析,以及综合各种分组比对后的相似度系数S的平均,可以得到最合适的分组比对方式,将「依然」分配为地名组进行比对。
接着,依据所得的相似度系数S决定音译字符组于数据库3中所对应的参考音译字符组(步骤S150),详细而言,在步骤S140中,音译字符组与数据库3中参考音译字符组比对的时候,音译字符序列的各个音译字符组依所对应的词性分的组去比对于数据库3中所对应的组后,得到各个音译字符组与参考音译字符组的相似度系数S,然后决定一个最合适的对应的参考音译字符组,举例来说,「依然」与地名组比对后得出与参考字符组「宜兰」的相似度系数S为1/3,「密件」与名词组比对后得出与参考字符组「蜜饯」的相似度系数S为1,决定音译字符组依然所对应的参考音字字符组为「宜兰」,以及决定音译字符组「密件」所对应的参考音字字符组为「蜜饯」。如此一来,一般语音辨识所辨识的音译字符序列的有误的地方被修正改善了。
再者,依据音译字符序列所对应的每一个参考音译字符组而决定音译字符序列的对应的功能指令(步骤S160)。详细而言,根据参考音译字符组所对应的预设指令而决定音译字符序列的对应的功能指令。举例来说,参考音译字符组为「找」、「找寻」、「想知道」、「搜寻」等被归类为查询的功能指令,而参考音译字符组为「开」、「打开」、「开启」、「启动」等归类被为设备控制的功能指令。
进一步而言,在步骤S160后,是否决定出对应的功能指令(步骤S170),若是决定出对应的功能指令,则输出单元5依据功能指令而输出一执行信息(步骤S180),譬如,当音译字符组所对应的参考音译字符组为「搜寻」时,则对应的功能指令即为一搜寻关键词串,并且透过输出单元5输出至执行设备进行搜寻,并且将搜寻的数据回传给使用者,举例来说,使用者说「我想知道台中火车站的位置」,则输出单元5输出关键词串「台中火车站」至计算机(如google map)进行搜寻,然后将搜寻的结果如台中地图的数据回传给使用者。或是,当音译字符组所对应的参考音译字符组为「打开」时,则对应的功能指令即为一控制信号,并且透过输出单元5输出至执行设备6执行作业,例如将控制信号输出至冷气,然后将冷气开启。如此一来,将接收的语音信号转变成响应所搜寻信息,或是转变成控制一个电子设备 等,即为辨识出语音信号的语义。
当无法决定音译字符序列的特定的功能指令时,则输出单元5输出再确认要求,再确认要求是对音译字符序列的音译字符组进行再确认的要求(步骤S171)。接着再接受响应于再确认要求的一再确认信号(步骤S172)。然后依据音译字符序列所对应的每一个参考音译字符组及再确认信号而决定音译字符序列的对应的功能指令(步骤S173)。详细而言,输出单元输出再确认要求可以是透过屏幕显示的方式显示一段文字以向使用者确认功能指令,或是透过扬声器发出一段音讯以向使用者确认功能指令,譬如,屏幕显示「请再次输入语音信号」、或显示「请问所输入的语音信号是脏话还彰化」。当然,本发明不限于此,也可以是振动方式,只要能发出再确认要求即可。
然后使用者根据再确认要求而给予再确认信号,举例来说,智能型手机的屏幕显示「脏话」及「彰化」,让使用者触碰智能型手机的屏幕去决定功能指令是要搜寻「脏话」的信息还是「彰化」的信息。再者,或是显示「请再次输入语音信号」时,使用者重新输入一次语音信号。
接着,若使用者选择「彰化」,则配合之前的参考音译字符组,譬如「我想知道」,则决定出功能指令为查询,而查询的内容为彰化。若是请使用者再次输入语音信号的情况下,则使用者再次输入语音信号后进入步骤S110,并且经过上述的本发明辨识方法的流程,而得到再次输入的语音信号的参考音译字符组,并配合之前输入的语音信号所得到的参考音译字符组,而决定出功能指令,然后再依据得到的功能指令而输出一执行信息。
参阅图3所示,其系显示本发明的第一实施例的语义辨识的方法的电子设备的示意图。在实际应用上,在语义辨识的过程中,其较佳地流程如下。首先,撷取装置1(如智能型手机)接收并撷取语音信号,然后传输至辨识装置(如远程服务器)2辨识为音译字符序列。接着,拼音比对装置4(如远程服务器)将音译字符序列中各个拼音字符组的拼音字符转换成以拼音字母所组成的拼音字母件组,再与数据库3中的数据比对而得到音译字符组与参考音译字符组的相似度系数S。最后根据得到的相似度系数S而决定出音译字符组于数据库3中所对应的参考音译字符组,然后输出单元5根据得到的参考音译字符组所对应的功能指令输出执行信息至执行设备6(如电器设备、网络搜寻引擎),在本实施例中输出的执行信息为打开电视,当然也可是调整音量,或是控制其它电器设备。
参阅图4及图5所示,图4系显示本发明的第一实施例的语义辨识方法的流程图,图5系显示本发明的第一实施例的语义辨识方法的电子设备的方块图。在本实施例中,语音辨识方法的系统100a包含的撷取装置1、辨识装置2、数据库3及拼音比对装置4设置整合在一 起,例如智能型手机或笔记型计算机。这类型的装置的效能以及储存空间比服务器差,或是为了减少运算的复杂度以达到省电的效果,所以需要降低比对的复杂性、减少比对的时间以及简化数据库。因此,本实施例的语义辨识方法较第一实施例的步骤S精简,不同之处在步骤S120中将输入的语音信号转换音译字符序列后,接着步骤S130,将音译字符序列的每一个音译字符组的每一个音译字符转换为拼音字母件组。然后,在步骤S140中将音译字符组的每一个拼音字母件组予以依序比对于一数据库中的参考音译字符组的参考拼音字母件组而得到音译字符组与参考音译字符组的相似度系数。然后,接着在步骤S150中依据分别所得的相似度系数决定音译字符组于数据库中所对应的参考音译字符组。最后,将音译字符序列中每一个音译字符组所对应的参考音译字符组输出(步骤S190)。举例来说,在个人计算机的使用情况下,当使用者想使用语音输入方式来取代键盘的打字时,因为一般计算机内建的语音辨识的效果有限而导致语音输入常有错别字,所以必须要花费大量的时间去校正。因此,利用本实施例的语义辨识方法,可以提高语音输入的正确率,并且不需要使用庞大的数据库以及复杂的比对方式,可以单独在移动装置上使用而不需与服务器联机。
藉由本发明的语义辨识方法,能够在语音辨识后改善辨识的正确率,以及配合音译字符组所对应的参考音译字符组的功能指令而去执行对应的动作,进一步的达到辨识出语义的效果。
由以上的实施例可知,本发明所提供的语义辨识方法确具产业上的利用价值。然而,以上的叙述仅为本发明的较佳实施例说明,凡精于此项技艺者当可依据上述的说明而作其它种种的改良,然而这些改变仍属于本发明的发明精神及所界定的专利范围中。

语义辨识方法.pdf_第1页
第1页 / 共16页
语义辨识方法.pdf_第2页
第2页 / 共16页
语义辨识方法.pdf_第3页
第3页 / 共16页
点击查看更多>>
资源描述

《语义辨识方法.pdf》由会员分享,可在线阅读,更多相关《语义辨识方法.pdf(16页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 103680503 A (43)申请公布日 2014.03.26 CN 103680503 A (21)申请号 201210342128.7 (22)申请日 2012.09.14 101131765 2012.08.31 TW G10L 15/26(2006.01) G06F 17/30(2006.01) (71)申请人 中瀚国际语识有限公司 地址 中国台湾台中市西屯区黎明路三段 338 号 (72)发明人 李志成 (74)专利代理机构 上海智信专利代理有限公司 31002 代理人 王洁 (54) 发明名称 语义辨识方法 (57) 摘要 本发明系提供一种语义辨识方法,。

2、 包括下列 步骤 : 接收一语音信号 ; 将语音信号辨识为一包 含有音译字符组的音译字符序列 ; 将音译字符组 的每一个音译字符转换为一拼音字母件组 ; 将拼 音字母件组予以依序比对于参考拼音字母件组而 得到相似度系数 ; 以及依据相似度系数决定对应 的参考音译字符组, 藉此改善语音辨识的正确率, 使辨识出的语义更接近输入音讯的原意。 (30)优先权数据 (51)Int.Cl. 权利要求书 2 页 说明书 7 页 附图 6 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书2页 说明书7页 附图6页 (10)申请公布号 CN 103680503 A CN 1036805。

3、03 A 1/2 页 2 1. 一种语义辨识方法, 其特征在于, 包括下列步骤 : (a) 接收一语音信号 ; (b) 将该语音信号辨识为一音译字符序列, 该音译字符序列系包含有至少一个由一音 译字符所组成的音译字符组 ; (c) 将该音译字符序列的每一个音译字符组的每一个音译字符转换为一拼音字母件 组 ; (d) 将该音译字符组的每一个拼音字母件组予以依序比对于一数据库中的参考音译字 符组的参考拼音字母件组而得到该音译字符组与该参考音译字符组的相似度系数 ; 以及 (e) 依据分别所得的该相似度系数决定该音译字符组于该数据库中所对应的该参考音 译字符组。 2. 如权利要求 1 所述的语义辨识。

4、方法, 其特征在于, 该语音信号系为以非拉丁字母为 字母的语音信号。 3. 如权利要求 1 所述的语义辨识方法, 其特征在于, 该拼音字母件组系为拉丁字母所 拼音组成。 4. 如权利要求 1 所述的语义辨识方法, 其特征在于, 步骤 (a) 还包括 : (a1) 将该语音信号录音并取样 ; (a2) 将该语音信号的取样转换为一语音数字数据 ; 以及 (a3) 将该语音数字数据传送至一辨识装置。 5. 如权利要求 1 所述的语义辨识方法, 其特征在于, 在步骤 (b) 与步骤 (c) 之间, 还包 括一步骤 : (b1) 将该音译字符序列的音译字符组分组。 6. 如权利要求 5 所述的语义辨识方。

5、法, 其特征在于, 步骤 (b1) 中该音译字符序列的音 译字符组系根据文法结构的分析来分组。 7.如权利要求5所述的语义辨识方法, 其特征在于, 步骤(b)还包括给予该音译字符序 列的音译字符组一对应词性的步骤, 以及步骤 (b1) 系依据该对应词性而分组该音译字符 序列的音译字符组。 8. 如权利要求 5 所述的语义辨识方法, 其特征在于, 该每一个组具有一预设的优先度。 9.如权利要求8所述的语义辨识方法, 其特征在于, 步骤(d)系根据该每一个组的优先 度而从优先度高的组至优先度低的组进行比对。 10. 如权利要求 1 所述的语义辨识方法, 其特征在于, 在步骤 (e) 之后还包括一步。

6、骤 : (f) 依据该音译字符序列所对应的每一个参考音译字符组而决定该音译字符序列的对 应的功能指令。 11.如权利要求10所述的语义辨识方法, 其特征在于, 在步骤(f)之后还包括依据该功 能指令而输出一执行信息的步骤。 12. 如权利要求 11 所述的语义辨识方法, 其特征在于, 该执行信息系为一搜寻关键词 串, 该搜寻关键词串系被输出至一搜寻引擎进行搜寻。 13. 如权利要求 11 所述的语义辨识方法, 其特征在于, 该执行信息系为一控制信号, 该 控制信号系被输出至一执行设备执行作业。 14. 如权利要求 10 所述的语义辨识方法, 其特征在于, 当无法决定该音译字符序列的 权 利 要。

7、 求 书 CN 103680503 A 2 2/2 页 3 特定的功能指令时, 步骤 (f) 之后还包括下列步骤 : (g1) 输出一再确认要求, 该再确认要求系对该音译字符序列的音译字符组进行再确认 的要求 ; (g2) 接受响应于该再确认要求的一再确认信号 ; 以及 (g3) 依据该音译字符序列所对应的每一个参考音译字符组及该再确认信号而决定该 音译字符序列的对应的功能指令。 权 利 要 求 书 CN 103680503 A 3 1/7 页 4 语义辨识方法 技术领域 0001 本发明系关于一种语音辨识方法, 特别是关于一种语义辨识方法。 背景技术 0002 早先, 使用者与电子产品沟通的。

8、方式可以使用键盘、 鼠标或触碰屏幕来输入信息, 而随着科技的进步, 一种较为自然的沟通方式也发展出来, 即为语音输入。 使用者利用语音 输入的方式以及电子产品的语音输出而达到自然对话的效果。 而语音输入的过程大体上如 下所述, 当声音藉由模拟到数字的转换而输入至计算机的内部, 并以数值方式储存后, 语音 辨识程序将已事先储存好的声音样本与输入的测试声音样本进行比对。 比对完成后输入一 个它认为最 像 的声音样本序列, 就可以知道使用者刚刚念进去的声音代表何意, 进而能 够控制电器设备作各种事情或其它用途。 0003 语音辨识系统的性能受许多因素的影响, 包括不同的人说出的话、 说话方式、 环境。

9、 噪音及传输信道等等, 因此辨识出来的往往会有错误, 只有音对, 而意不对, 譬如,脏话 和 彰化 、市民大道 和 四名大盗 。甚至是音也不对, 譬如,姓胡 和 幸福 , 所以辨识出 来的通常只有音的转译, 而不完全是语义的翻译。 如此一来, 当辨识出来的结果已经有误的 情况下, 利用文法结构校正的方式来作语义修正的效果是有限的, 所以辨识出来的结果上 总是会与实际输入的语音有差。 0004 以习知方式要达到高准确率的语音辨识, 必须要建立大量的声音样本, 譬如男生 的声音样本、 女性的声音样本、 同语言不同腔调的声音样本等等, 而且声音的档案比文字的 档案大上许多, 比对的过程更是繁杂, 导。

10、致语音辨识须利用高阶计算机比对才有较高的辨 识率, 也因此难以广泛使用。 发明内容 0005 本发明的主要目的是提供一种语义辨识方法, 以改善语音辨识的正确率, 使辨识 音讯出来的语义更接近输入音讯的原意。 0006 本发明为解决习知技术的问题所采用的技术手段系提供一种语义辨识方法, 包括 下列步骤 : (a) 接收一语音信号 ; (b) 将语音信号辨识为一音译字符序列, 音译字符序列包 含有至少一个由一音译字符所组成的音译字符组 ; (c) 将音译字符序列的每一个音译字符 组的每一个音译字符转换为一拼音字母件组 ; (d) 将音译字符组的每一个拼音字母件组予 以依序比对于一数据库中的参考音译。

11、字符组的参考拼音字母件组而得到音译字符组与参 考音译字符组的相似度系数 ; 以及 (e) 依据分别所得的相似度系数决定音译字符组于数据 库中所对应的参考音译字符组。 0007 在本发明的一实施例中, 语音信号系为以非拉丁字母为字母的语音信号。 0008 在本发明的一实施例中, 拼音字母件组系为拉丁字母所拼音组成。 0009 在本发明的一实施例中, 步骤 (a) 还包括 : (a1) 将语音信号录音并取样 ; (a2) 将 语音信号的取样转换为一语音数字数据 ; 以及 (a3) 将语音数字数据传送至一辨识装置。 说 明 书 CN 103680503 A 4 2/7 页 5 0010 在本发明的一。

12、实施例中, 在步骤(b)与步骤(c)之间, 还包括将音译字符序列的音 译字符组分组的步骤 (b1)。 0011 在本发明的一实施例中, 步骤 (b1) 中音译字符序列的音译字符组系根据文法结 构的分析来分组。 0012 在本发明的一实施例中, 步骤 (b) 还包括给予音译字符序列的音译字符组一对应 词性, 以及步骤 (b1) 系依据对应词性而分组音译字符序列的音译字符组。 0013 在本发明的一实施例中, 每一个组具有一预设的优先度。 0014 在本发明的一实施例中, 步骤 (d) 系根据每一个组的优先度而从优先度高的组至 优先度低的组进行比对。 0015 在本发明的一实施例中, 步骤 (e)。

13、 之后还包括一依据音译字符序列所对应的每一 个相似度最高的参考音译字符组而决定音译字符序列的对应的功能指令的步骤 (f)。 0016 在本发明的一实施例中, 步骤 (f) 之后还包括依据功能指令而输出一执行信息的 步骤。 0017 在本发明的一实施例中, 执行信息系为一搜寻关键词串, 搜寻关键词串系被输出 至一搜寻引擎进行搜寻。 0018 在本发明的一实施例中, 执行信息系为一控制信号, 控制信号系被输出至一执行 设备执行作业。 0019 在本发明的一实施例中, 当无法决定音译字符序列的特定的功能指令时, 步骤 (f) 之后还包括下列步骤 : (g1) 输出一再确认要求, 再确认要求系对音译字。

14、符序列的音译字符 组进行再确认的要求 ; (g2)接受响应于再确认要求的一再确认信号 ; 以及(g3)依据音译字 符序列所对应的每一个参考音译字符组及再确认信号而决定音译字符序列的对应的功能 指令。 0020 本发明具有以下有益技术效果 : 0021 经由本发明所采用的技术手段, 可以提高语音辨识的正确率, 并且因为采用的拼 音的比对是属于文字的比对, 所以是建立文字的数据库来比对, 而省去建立庞大的声音样 本数据库。以及决定音译字符序列的对应的功能指令, 并且依据功能指令而输出一执行信 息, 藉此, 在语音输入的语义若是控制执行设备或是想得到某种信息时, 使得语音输入的语 义被辨识出来而更准。

15、确执行。 0022 此外, 本发明将音译字符组进行分组并给予优先度, 以及给予对应词性, 在比对流 程的执行更有效率。 附图说明 0023 图 1 系显示本发明的第一实施例的语义辨识方法的流程图。 0024 图 2 系显示应用有本发明的第一实施例的语义辨识方法的电子设备的方块图。 0025 图 3 系显示应用有本发明的第一实施例的语义辨识方法的电子设备的示意图。 0026 图 4 系显示本发明的第二实施例的语义辨识方法的流程图。 0027 图 5 系显示应用有本发明的第二实施例的语义辨识方法的电子设备的方块图。 0028 主要组件符号说明 0029 100 电子设备 说 明 书 CN 1036。

16、80503 A 5 3/7 页 6 0030 1 撷取装置 0031 11 录音单元 0032 12 取样单元 0033 13 传输单元 0034 2 辨识装置 0035 21 辨识单元 0036 22 转换单元 0037 3 数据库 0038 4 拼音比对装置 0039 41 分组单元 0040 42 拼音转换单元 0041 43 比对单元 0042 5 输出单元 0043 6 执行设备 具体实施方式 0044 本发明所采用的具体实施例, 将藉由以下的实施例及附呈图式作进一步的说明。 0045 参阅图 1 及图 2 所示, 图 1 系显示本发明的第一实施例的语义辨识方法的流程图, 图 2 系。

17、显示本发明的第一实施例的语义辨识方法的电子设备的方块图。 0046 如图所示, 本发明的第一实施例的语义辨识方法可执行于一电子设备中, 用以辨 识一输入音讯的语义, 进而给予对应的回应。电子设备 100 在本实施例中包括一撷取装置 1、 一辨识装置 2、 一数据库 3、 一拼音比对装置 4、 以及一输出单元 5。其中撷取装置 1 包含 一录音单元 11、 一取样单元 12 及一传输单元 13, 辨识装置 2 包含一辨识单元 21、 一转换单 元 22, 拼音比对装置 4 包含一分组单元 41、 一拼音转换单元 42 及一比对单元 43。 0047 首先, 输入语音信号 (步骤 S110) 。例。

18、如, 撷取装置 1 中的录音单元 11 接收使用者 讲的一段语音信号, 并且将语音信号储存起来 (步骤S111) 。 取样单元12将语音信号的背景 杂音删除并且取样后转成语音数字数据 (步骤 S112) 。然后传输单元 13 将所取样的语音数 字数据传送至辨识装置 2(步骤 S113) 。撷取装置 1 可为智能型手机、 个人计算机或智能型 电视等, 辨识装置 2 可以是远程服务器, 而传输单元 13 借着因特网将取样的语音数字数据 传送至辨识装置 2。 0048 当取样的语音数字数据传送至辨识装置 2 后, 辨识装置 2 运用语音识别技术 (Automatic Speech Recogniti。

19、on,ASR) 将取样的语音数字数据与数据库3中的参考语音数 字数据进行比对, 而得出最匹配的参考语音数字数据, 并且根据所得的参考语音数字数据 而取得取样的语音数字数据所对应的音译字符序列 (步骤S120) 。 详细而言, 在本实施例中, 辨识单元 21 是利用隐藏式马可夫模型 (Hidden Markov Model,HMM) 及类神经网络 (Neural Network,N.N.) 的方法将取样的语音数字数据与数据库 3 中的参考语音数字数据进行比 对, 而得到最合适的参考语音数字数据。然后转换单元 22 根据最匹配的参考语音数字数据 对应的音译字符而将步骤 S110 中输入的语音信号转。

20、换为所对应的音译字符序列, 其中音 译字符序列包含有至少一个由一音译字符所组成的音译字符组。音译字符主要是由语音 说 明 书 CN 103680503 A 6 4/7 页 7 信号的语言所使用的字符, 举例来说, 汉语的音译字符序列主要是由汉字所组成、 日语的音 译字符序列主要是由假名与日本汉字所组成, 以及韩语的音译字符序列主要是由韩字所组 成。 0049 透过辨识装置 2 运用语音识别技术辨识后而得到的音译字符序列, 会具有基本的 字义分组, 此分组即为音译字符组, 而不光只是纯音译。 举例来说, 输入的语音信号为 花莲 的海洋公园 的情况下, 其辨识出来的音译字符序列可能由下列的音译字符。

21、组所组成,花 莲 、华丽 、的 、海洋 、公元 、公园 。如此一来, 音译字符序列可能是 花莲的海洋 公园 、华丽的海洋公园 或 华丽的海洋公元 等, 而不会是 华怜的海杨供圆 等只有纯 音译的情况。其中, 音译字符组由至少一个音译字符所组成, 譬如音译字符组 花莲 是由 两个音译字符 花 及 莲 所组成, 而音译字符组 的 是由一个音译字符 的 所组成。 0050 接下来, 辨识出来的音译字符序列将传送至拼音比对装置 4 进行拼音转换与比 对。拼音比对装置 4 在本实施例中是一服务器, 与语音辨识装置 2 和数据库 3 以因特网连 接传输。拼音比对装置 4 的分组单元 41 将辨识出来的音译。

22、字符序列的音译字符组进行分 组 (步骤 S122) , 而且每一个组分别给予一个预设的优先度, 使得在比对时可以根据优先度 的高低而决定比对的顺序。较佳地, 在分组之前给予音译字符序列的音译字符组一对应词 性 (步骤 S121) , 譬如, 本实施例中, 中文的情况下, 音译字符组的词性依照简易中文分词系 统 (Simple Chinese Words Segmentation,SCWS) 来分组, 并主要分成三大类, 动词类、 名词 类及其它, 而每个类别又包含许多组, 例如名词类又再细分为人名组、 地名组、 机构团体组、 名词性语素组及其它专名组。 0051 此外, 分组的时候, 除了利用。

23、词性分组外, 还可以配合文法结构的分析, 使得分组 时的正确率更高。 例如在中文的情况下, 一个字符或一个字符组往往有两种以上的词性, 会 使得在步骤 S122 中依词性而分组时容易分组错误。如此一来, 配合文法结构的分析, 分组 的错误率能降低。在本实施例中, 在中文的情况下, 文法结构是利用中文句结构树数据库 (Sinica Treebank) 来分析。当然, 本发明不限于此, 词性分组也可以使用其它数据库或系 统的分组方式, 只要能分组即可, 而文法结构也可以使用其它数据库或系统来分析, 只要能 分析文法即可。 0052 接着, 藉由拼音转换单元 42 将音译字符序列的音译字符组的音译字。

24、符转换为一 拼音字母件组 (步骤 S130) 。详细而言, 在本实施例中, 在中文的情况下, 较佳地是使用英文 字母来作拼音的拼音字母, 以及使用汉语拼音系统 (Hanyu Pinyin) 来记写中文字读音。例 如, 音译字符组 台北 藉由拼音转换单元 42 而转换成汉语拼音 tai2bei3 (数字代表声 调) , 其中 tai2 即为音译字符 台 的拼音字母件组,bei3 即为音译字符 北 的拼音 字母件组。当然, 本发明不限于此, 也可以使用拉丁字母或其它表音文字 (Phonogram) 来作 拼音的拼音字母, 或是采用通用拼音系统 (Tongyong Pinyin) 或其它拼音系统, 。

25、只要能拼出 该音译字符之音即可。 0053 在步骤 S130 之后, 比对单元 43 将音译字符组的每一个拼音字母件组予以依序 比对于数据库 3 中的参考音译字符组的参考拼音字母件组而得到该音译字符组与该参考 音译字符组的相似度系数 (步骤 S140) 。详细而言, 藉由比对单元 43 将音译字符组的每 一个拼音字母件组和数据库 3 中的参考音译字符组的参考拼音字母件组进行比对, 并且 根据组的优先度而依序从优先度高的组比对至优先度低的组, 举例来说,zhao3(找) 、 说 明 书 CN 103680503 A 7 5/7 页 8 xiang3zhi1dao4(想知道) 等搜寻字的组的优先度。

26、在设定上高于地名或人名的组, 在比对 时会先将优先度高的组进行数据库比对, 并在高优先度组比对完成后再进行优先度次高的 组的数据库比对, 然后依序比对至优先度最低的组, 藉此使得比对更有效率。当然, 本发明 不限于此, 在比对的过程中, 若是已经比对至一个适当的结果而能进行下一个步骤, 则不需 要将音译字符序列的所有音译字符组去对数据库 3 中所有的参考音译字符组, 只要比对的 结果可以进行下个步骤即可, 譬如, 被归类至助词组的音译字符组 的 、之 及 着 将不 进行比对。 0054 在 本 实 施 例 中, 进 行 比 对 的 方 式 是 计 算 两 者 的 编 辑 距 离 (Levens。

27、htein distance) , 然后将得出的编辑距离 (L) 换算为相似度系数 (S) , 换算的方式为相似度系数 S=1/(1+L)。譬如 xing4hu2(姓胡) 和 xing4fu2(幸福) ,xing4(姓) 和 xing4(幸) 的拼音字母件组完全一样, 则相似度系数 S 为 1/(1+0)=1, 而 hu2(胡) 和 fu2(福) 的 编辑距离 L 为 1, 所以 hu2(胡) 和 fu2(福) 的相似度系数 S 为 1/(1+1)=0.5。而若是 比较一个音译字符组, 如 姓胡 和 幸福 , 则是两者的音译字符组的拼音字母件组一起比 对 xing4hu2(姓胡) 和 xing。

28、4fu2(幸福) , 其编辑距离 L 为 1, 则两者的相似度系数 S 为 1/(1+1)=0.5。 当然, 本发明不限于此, 也可以利用其它比对方式, 或是相似度系数与编辑距 离的关系为 S=1/(1+2L), 只要能求出两者的相似度的相似度系数 S 即可。 0055 然而, 因为同一个音译字符组有时候会具有多重的词性而可以分配在不同的组进 行比对, 或是因为语音辨识出来的音译字符组有误, 仅音译正确但音译字符错误而分配到 错误的组, 此情况下比对出来的结果得到的相似度系数 S 可能会不够好。因此在步骤 S140 中, 可以配合文法结构的分析, 将每一个音译字符组比对数据库 3 中一个以上词。

29、性的组, 而 得到在不同分组的比对下的相似度系数 S, 最后根据在不同分组情况下, 综合各个音译字符 组的相似度系数 S 的平均, 从而得到最合适的分组方式, 而得到音译字符组的最合适的相 似度系数 S。举例来说, 输入的语音信号为 宜兰的蜜饯 , 而辨识出的音译字符序列为 依 然的密件 , 则其音译字符组的分组分别为 依然 是副词组,密件 是名词组, 在比对时会 在副词组中将音译字符组 依然 的拼音字母件组 yi1ran2 与数据库 3 中的参考音译字 符组 依然 的参考拼音字母件组 yi1ran2 比对而得到相似度系数 S=1, 在名词组中将音 译字符组 密件 的拼音字母件组 mi4jia。

30、n4 与数据库 3 中的参考音译字符组 密件 的 参考拼音字母件组 mi4jian4 比对而得到相似度系数 S=1, 其相似度系数的平均为 1。接 着, 将音译字符组 依然 的拼音字母件组 yi1ran2 与数据库 3 中的地名组比对, 而得到 与数据库 3 中参考字符组 宜兰 的参考拼音字母件组 yi2lan2 的相似度系数 S=1/3, 然 后将音译字符组 密件 的拼音字母件组 mi4jian4 与数据库 3 中的名词组比对, 而得到 与数据库 3 中参考字符组 蜜饯 的参考拼音字母件组 mi4jian4 的相似度系数 S=1, 其相 似度系数的平均为2/3。 虽然第二次用另一种分组去比对。

31、时的相似度系数S的平均较低, 但 配合文法结构的分析, 以及综合各种分组比对后的相似度系数 S 的平均, 可以得到最合适 的分组比对方式, 将 依然 分配为地名组进行比对。 0056 接着, 依据所得的相似度系数 S 决定音译字符组于数据库 3 中所对应的参考音译 字符组 (步骤 S150) , 详细而言, 在步骤 S140 中, 音译字符组与数据库 3 中参考音译字符组 比对的时候, 音译字符序列的各个音译字符组依所对应的词性分的组去比对于数据库 3 中 所对应的组后, 得到各个音译字符组与参考音译字符组的相似度系数 S, 然后决定一个最合 说 明 书 CN 103680503 A 8 6/。

32、7 页 9 适的对应的参考音译字符组, 举例来说,依然 与地名组比对后得出与参考字符组 宜兰 的相似度系数 S 为 1/3,密件 与名词组比对后得出与参考字符组 蜜饯 的相似度系数 S 为 1, 决定音译字符组依然所对应的参考音字字符组为 宜兰 , 以及决定音译字符组 密 件 所对应的参考音字字符组为 蜜饯 。如此一来, 一般语音辨识所辨识的音译字符序列 的有误的地方被修正改善了。 0057 再者, 依据音译字符序列所对应的每一个参考音译字符组而决定音译字符序列的 对应的功能指令 (步骤 S160) 。详细而言, 根据参考音译字符组所对应的预设指令而决定音 译字符序列的对应的功能指令。举例来说。

33、, 参考音译字符组为 找 、找寻 、想知道 、搜 寻 等被归类为查询的功能指令, 而参考音译字符组为 开 、打开 、开启 、启动 等归 类被为设备控制的功能指令。 0058 进一步而言, 在步骤 S160 后, 是否决定出对应的功能指令 (步骤 S170) , 若是决定 出对应的功能指令, 则输出单元 5 依据功能指令而输出一执行信息 (步骤 S180) , 譬如, 当音 译字符组所对应的参考音译字符组为 搜寻 时, 则对应的功能指令即为一搜寻关键词串, 并且透过输出单元 5 输出至执行设备进行搜寻, 并且将搜寻的数据回传给使用者, 举例来 说, 使用者说 我想知道台中火车站的位置 , 则输出。

34、单元 5 输出关键词串 台中火车站 至 计算机 (如 google map) 进行搜寻, 然后将搜寻的结果如台中地图的数据回传给使用者。或 是, 当音译字符组所对应的参考音译字符组为 打开 时, 则对应的功能指令即为一控制信 号, 并且透过输出单元 5 输出至执行设备 6 执行作业, 例如将控制信号输出至冷气, 然后将 冷气开启。 如此一来, 将接收的语音信号转变成响应所搜寻信息, 或是转变成控制一个电子 设备等, 即为辨识出语音信号的语义。 0059 当无法决定音译字符序列的特定的功能指令时, 则输出单元 5 输出再确认要求, 再确认要求是对音译字符序列的音译字符组进行再确认的要求 (步骤S。

35、171) 。 接着再接受响 应于再确认要求的一再确认信号 (步骤 S172) 。然后依据音译字符序列所对应的每一个参 考音译字符组及再确认信号而决定音译字符序列的对应的功能指令 (步骤 S173) 。详细而 言, 输出单元输出再确认要求可以是透过屏幕显示的方式显示一段文字以向使用者确认功 能指令, 或是透过扬声器发出一段音讯以向使用者确认功能指令, 譬如, 屏幕显示 请再次 输入语音信号 、 或显示 请问所输入的语音信号是脏话还彰化 。 当然, 本发明不限于此, 也 可以是振动方式, 只要能发出再确认要求即可。 0060 然后使用者根据再确认要求而给予再确认信号, 举例来说, 智能型手机的屏幕。

36、显 示 脏话 及 彰化 , 让使用者触碰智能型手机的屏幕去决定功能指令是要搜寻 脏话 的 信息还是 彰化 的信息。再者, 或是显示 请再次输入语音信号 时, 使用者重新输入一次 语音信号。 0061 接着, 若使用者选择 彰化 , 则配合之前的参考音译字符组, 譬如 我想知道 , 则 决定出功能指令为查询, 而查询的内容为彰化。 若是请使用者再次输入语音信号的情况下, 则使用者再次输入语音信号后进入步骤 S110, 并且经过上述的本发明辨识方法的流程, 而 得到再次输入的语音信号的参考音译字符组, 并配合之前输入的语音信号所得到的参考音 译字符组, 而决定出功能指令, 然后再依据得到的功能指令。

37、而输出一执行信息。 0062 参阅图 3 所示, 其系显示本发明的第一实施例的语义辨识的方法的电子设备的示 意图。在实际应用上, 在语义辨识的过程中, 其较佳地流程如下。首先, 撷取装置 1(如智 说 明 书 CN 103680503 A 9 7/7 页 10 能型手机) 接收并撷取语音信号, 然后传输至辨识装置 (如远程服务器) 2 辨识为音译字符序 列。接着, 拼音比对装置 4(如远程服务器) 将音译字符序列中各个拼音字符组的拼音字符 转换成以拼音字母所组成的拼音字母件组, 再与数据库 3 中的数据比对而得到音译字符组 与参考音译字符组的相似度系数 S。最后根据得到的相似度系数 S 而决定。

38、出音译字符组于 数据库 3 中所对应的参考音译字符组, 然后输出单元 5 根据得到的参考音译字符组所对应 的功能指令输出执行信息至执行设备 6 (如电器设备、 网络搜寻引擎) , 在本实施例中输出的 执行信息为打开电视, 当然也可是调整音量, 或是控制其它电器设备。 0063 参阅图 4 及图 5 所示, 图 4 系显示本发明的第一实施例的语义辨识方法的流程图, 图 5 系显示本发明的第一实施例的语义辨识方法的电子设备的方块图。在本实施例中, 语 音辨识方法的系统 100a 包含的撷取装置 1、 辨识装置 2、 数据库 3 及拼音比对装置 4 设置整 合在一起, 例如智能型手机或笔记型计算机。。

39、这类型的装置的效能以及储存空间比服务器 差, 或是为了减少运算的复杂度以达到省电的效果, 所以需要降低比对的复杂性、 减少比对 的时间以及简化数据库。因此, 本实施例的语义辨识方法较第一实施例的步骤 S 精简, 不同 之处在步骤 S120 中将输入的语音信号转换音译字符序列后, 接着步骤 S130, 将音译字符序 列的每一个音译字符组的每一个音译字符转换为拼音字母件组。然后, 在步骤 S140 中将音 译字符组的每一个拼音字母件组予以依序比对于一数据库中的参考音译字符组的参考拼 音字母件组而得到音译字符组与参考音译字符组的相似度系数。然后, 接着在步骤 S150 中 依据分别所得的相似度系数决。

40、定音译字符组于数据库中所对应的参考音译字符组。最后, 将音译字符序列中每一个音译字符组所对应的参考音译字符组输出 (步骤 S190) 。举例来 说, 在个人计算机的使用情况下, 当使用者想使用语音输入方式来取代键盘的打字时, 因为 一般计算机内建的语音辨识的效果有限而导致语音输入常有错别字, 所以必须要花费大量 的时间去校正。因此, 利用本实施例的语义辨识方法, 可以提高语音输入的正确率, 并且不 需要使用庞大的数据库以及复杂的比对方式, 可以单独在移动装置上使用而不需与服务器 联机。 0064 藉由本发明的语义辨识方法, 能够在语音辨识后改善辨识的正确率, 以及配合音 译字符组所对应的参考音。

41、译字符组的功能指令而去执行对应的动作, 进一步的达到辨识出 语义的效果。 0065 由以上的实施例可知, 本发明所提供的语义辨识方法确具产业上的利用价值。然 而, 以上的叙述仅为本发明的较佳实施例说明, 凡精于此项技艺者当可依据上述的说明而 作其它种种的改良, 然而这些改变仍属于本发明的发明精神及所界定的专利范围中。 说 明 书 CN 103680503 A 10 1/6 页 11 图 1 说 明 书 附 图 CN 103680503 A 11 2/6 页 12 图 1 续 说 明 书 附 图 CN 103680503 A 12 3/6 页 13 图 2 说 明 书 附 图 CN 103680503 A 13 4/6 页 14 图 3 说 明 书 附 图 CN 103680503 A 14 5/6 页 15 图 4 说 明 书 附 图 CN 103680503 A 15 6/6 页 16 图 5 说 明 书 附 图 CN 103680503 A 16 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 乐器;声学


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1