语音搜索方法和设备.pdf

上传人:00****42 文档编号:273440 上传时间:2018-02-07 格式:PDF 页数:13 大小:2.15MB
返回 下载 相关 举报
摘要
申请专利号:

CN201310217287.9

申请日:

2013.05.31

公开号:

CN104216906A

公开日:

2014.12.17

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):G06F 17/30申请日:20130531|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

大陆汽车投资(上海)有限公司

发明人:

颜卿

地址:

200082 上海市虹口区大连路538号

优先权:

专利代理机构:

北京康信知识产权代理有限责任公司 11240

代理人:

江舟;吴贵明

PDF下载: PDF下载
内容摘要

本发明公开了一种语音搜索方法和设备,其中,该方法包括:将用于搜索的语音信息识别为文本信息;将文本信息转换为第一拼音信息;在本地或向服务器获取与第一拼音信息匹配的搜索结果。通过上述方式有效解决了相关技术中由于语音识别不准确而导致的无法得到正确的搜索结果的技术问题,达到了可以获取正确的搜索结果的技术效果。

权利要求书

1.  一种语音搜索方法,其特征在于,包括:
将用于搜索的语音信息识别为文本信息;
将所述文本信息转换为第一拼音信息;
在本地或向服务器获取与所述第一拼音信息匹配的搜索结果。

2.
  根据权利要求1所述的方法,其特征在于,
若无法获取到与所述第一拼音信息匹配的搜索结果,则获取与所述第一拼音信息对应的模糊拼音信息,其中,所述模糊拼音信息中的拼音的声母为所述第一拼音信息中的拼音的声母的模糊音,和/或,所述模糊拼音信息中的拼音的韵母为所述第一拼音信息中的拼音的韵母的模糊音;
获取与所述模糊拼音信息匹配的搜索结果。

3.
  根据权利要求2所述的方法,其特征在于,获取与所述第一拼音信息对应的模糊拼音信息包括:
根据用户个性化偏好设置来获取与所述第一拼音信息对应的模糊拼音信息。

4.
  根据权利要求2所述的方法,其特征在于,所述获取与所述第一拼音信息对应的模糊拼音信息包括以下方式之一:
获取的所述模糊拼音信息中的拼音的声母为所述第一拼音信息中的拼音的声母的模糊音、且获取的所述模糊拼音信息中的拼音的韵母为所述第一拼音信息中的拼音的韵母;
获取的所述模糊拼音信息中的拼音的声母为所述第一拼音信息中的拼音的声母、且获取的所述模糊拼音信息中的拼音的韵母为所述第一拼音信息中的拼音的韵母的模糊音;
获取的所述模糊拼音信息中的拼音的声母为所述第一拼音信息中的拼音的声母的模糊音、且获取的所述模糊拼音信息中的拼音的韵母为所述第一拼音信息中的拼音的韵母的模糊音。

5.
  根据权利要求3所述的方法,其特征在于,所述用户个性化偏好设置包括用户地域指示信息;所述第一拼音信息中的拼音的声母的模糊音为与所述用户地域指示信息对应的模糊音,和/或,所述第一拼音信息中的拼音的韵母的模糊音为与所述用户地域指示信息对应的模糊音。

6.
  根据权利要求1所述的方法,其特征在于,在本地或向服务器获取与所述第一拼音信息匹配的搜索结果包括:
将所述本地或所述服务器的数据库中用于表示记录项的名称的文本信息转换为第二拼音信息;
判断所述第一拼音信息和所述第二拼音信息是否相同;
若所述第一拼音信息和所述第二拼音信息相同,则将所述记录项的名称作为所述搜索结果进行显示。

7.
  根据权利要求6所述的方法,其特征在于,将所述数据库中用于表示记录项的名称的文本信息转换为第二拼音信息包括:
通过第三方提供的搜索引擎将所述数据库中用于表示记录项的名称的文本信息转换为所述第二拼音信息。

8.
  根据权利要求6或7所述的方法,其特征在于,所述数据库中的记录项记录兴趣点的信息,其中,所述兴趣点的信息包括:兴趣点的名称、兴趣点的位置信息,兴趣点的地址。

9.
  一种语音搜索设备,其特征在于,包括:
语音识别装置,用于将用于搜索的语音信息识别为文本信息;
信息处理装置,用于将所述文本信息转换为第一拼音信息;
搜索装置,用于在本地或者向服务器获取与所述第一拼音信息匹配的搜索结果。

10.
  根据权利要求9所述的设备,其特征在于,
所述信息处理装置还用于在无法获取到与所述第一拼音信息匹配的搜索结果,获取与所述第一拼音信息对应的模糊拼音信息,其中,所述模糊拼音信息中的拼音的声母为所述第一拼音信息中的拼音的声母的模糊音,和/或,所述模糊拼音信息中的拼音的韵母为所述第一拼音信息中的拼音的韵母的模糊音;
所述搜索装置还用于在所述本地或者向所述服务器获取与所述模糊拼音信息匹配的搜索结果。

11.
  根据权利要求9所述的设备,其特征在于,所述设备还包括:显示装置;
所述信息处理装置还用于将所述本地或者服务器中的数据库中用于表示记录项的名称的文本信息转换为第二拼音信息;
所述搜索装置用于判断所述第一拼音信息是否与所述第二拼音信息相同;在所述第一拼音信息和所述第二拼音信息相同的情况下,将所述记录项的名称作为所述搜索结果发送给所述显示装置;
所述显示装置用于显示所述搜索结果。

说明书

语音搜索方法和设备
技术领域
本发明涉及互联网领域,具体而言,涉及一种语音搜索方法和设备。
背景技术
语音识别就是让机器通过识别和理解的过程将语音信号转变为相应的文本或命令的技术。近二十年来,语音识别技术取得了显著进步,语音识别也被用在了越来越多的领域,例如:手机、带语音识别的浏览器、车载的导航系统等等。
语音识别难免会存在多音字、同音字混淆不清的状况,这样就导致如果输入的语音本身是多音字或者是同音字则很容易出现识别错误或者是识别不到语音输入的内容的情况。目前存在的解决方式是根据输入内容的上下文来确定对应该多音字或者同音字应该对应的汉字,然而如果输入的内容是不存在上下文的,例如,在车载导航系统中,如果需要查找某个地点,则输入的就是这个地点的名字,这种词语并没有其对应的上下文。因此,如果在这种没有上下文的情况下输入一个词,而该词又存在多个同音词或者该词中有多音字,则通过上述方式仍旧无法解决输入的语音难以被识别的问题。由于语音识别不准确,从而导致基于识别出的语音信息进行搜索得到的搜索结果不正确。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种语音搜索方法和设备,以至少解决相关技术中由于语音识别不准确而导致的无法得到正确的搜索结果的技术问题。
根据本发明的一个方面,提供了一种语音搜索方法,包括:将用于搜索的语音信息识别为文本信息;将所述文本信息转换为第一拼音信息;在本地或向服务器获取与所述第一拼音信息匹配的搜索结果。
可选地,若无法获取到与第一拼音信息匹配的搜索结果,则获取与第一拼音信息对应的模糊拼音信息,其中,模糊拼音信息中的拼音的声母为第一拼音信息中的拼音的声母的模糊音,和/或,模糊拼音信息中的拼音的韵母为第一拼音信息中的拼音的韵母的模糊音;获取与模糊拼音信息匹配的搜索结果。
可选地,获取与第一拼音信息对应的模糊拼音信息包括:根据用户个性化偏好设置来获取与第一拼音信息对应的模糊拼音信息。
可选地,获取与第一拼音信息对应的模糊拼音信息包括以下方式之一:获取的模糊拼音信息中的拼音的声母为第一拼音信息中的拼音的声母的模糊音、且获取的模糊拼音信息中的拼音的韵母为第一拼音信息中的拼音的韵母;获取的模糊拼音信息中的拼音的声母为第一拼音信息中的拼音的声母、且获取的模糊拼音信息中的拼音的韵母为第一拼音信息中的拼音的韵母的模糊音;获取的模糊拼音信息中的拼音的声母为第一拼音信息中的拼音的声母的模糊音、且获取的模糊拼音信息中的拼音的韵母为第一拼音信息中的拼音的韵母的模糊音。
可选地,用户个性化偏好设置包括用户地域指示信息,第一拼音信息中的拼音的声母的模糊音为与用户地域指示信息对应的模糊音,和/或,第一拼音信息中的拼音的韵母的模糊音为与用户地域指示信息对应的模糊音。
可选地,在本地或向服务器获取与第一拼音信息匹配的搜索结果包括:将本地或服务器的数据库中用于表示记录项的名称的文本信息转换为第二拼音信息;判断第一拼音信息和第二拼音信息是否相同;若第一拼音信息和第二拼音信息相同,则将记录项的名称作为搜索结果进行显示。
可选地,将数据库中用于表示记录项的名称的文本信息转换为第二拼音信息包括:通过第三方提供的搜索引擎将数据库中用于表示记录项的名称的文本信息转换为第二拼音信息。
可选地,数据库中的记录项记录兴趣点的信息,其中,兴趣点的信息包括:兴趣点的名称、兴趣点的位置信息,兴趣点的地址。
根据本发明的另一方面,提供了一种语音搜索设备,包括:语音识别装置,用于将用于搜索的语音信息识别为文本信息;信息处理装置,用于将所述文本信息转换为第一拼音信息;搜索装置,用于在本地或者向服务器获取与所述第一拼音信息匹配的搜索结果。
可选地,信息处理装置还用于在无法获取到与第一拼音信息匹配的搜索结果,获取与第一拼音信息对应的模糊拼音信息,其中,模糊拼音信息中的拼音的声母为第一拼音信息中的拼音的声母的模糊音,和/或,模糊拼音信息中的拼音的韵母为第一拼音信息中的拼音的韵母的模糊音;搜索装置还用于在本地或者向服务器获取与模糊拼音信息匹配的搜索结果。
可选地,设备还包括:显示装置;信息处理装置还用于将本地或者服务器中的数据库中用于表示记录项的名称的文本信息转换为第二拼音信息;搜索装置用于判断第一拼音信息是否与第二拼音信息相同;在第一拼音信息和第二拼音信息相同的情况下,将记录项的名称作为搜索结果发送给显示装置;显示装置用于显示搜索结果。
在本发明实施例中,先将接收到的语音信息转换为其对应的拼音信息,然后通过该拼音信息搜索相匹配的搜索结果。由于在获取搜索结果的过程中,比对的是拼音信息,而不是字符本身,这样,在由于同音字的存在而使得语音信息被错误地识别成拼音相同的其他字符时,仍然可以采用正确的拼音信息来搜索与该拼音信息匹配的搜索结果,从而解决了由于语音识别不准确而导致的无法得到正确的搜索结果的技术问题,达到了可以获取正确的搜索结果的技术效果。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本发明实施例的语音搜索设备的一种结构框图;
图2是根据本发明实施例的语音搜索设备的另一种结构框图;
图3是根据本发明实施例的语音搜索方法的一种流程图;以及
图4是根据本发明实施例的获取与拼音信息匹配的搜索结果的一种流程图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
实施例1
本实施例提供的语音搜索设备,如图1所示包括:语音识别装置102、信息处理装置104和搜索装置106。下面对该结构进行具体描述:
1)语音识别装置102,用于将用于搜索的语音信息识别为文本信息。可选地,语音识别装置102将接收到的语音信息或者输入的语音信息转化为文本信息,例如:如果用户在导航的过程中需要查找兴趣点“广霖大厦”的位置,则可以通过车载电子系统中的麦克风输入语音信息“广霖大厦”,然后,语音识别装置102可以将上述语音信息识别为文本信息。需要说明的是,上述导航场景仅是一个示例,语音识别装置102还可以在其他场景下将输入的语音信息识别为对应的文本信息,例如,在车辆未启动的场景下,或者,在车辆运行但未开启导航的场景下。
2)信息处理装置104,与语音识别装置102耦合,用于将上述文本信息转换为第一拼音信息。例如,信息处理装置104可以将上述文本信息转换为其对应的拼音信息“guang lin da sha”。
3)搜索装置106,与信息处理装置104耦合,用于在本地或者向服务器获取与所述第一拼音信息匹配的搜索结果。可选地,与第一拼音信息匹配的搜索结果对应的拼音信息与第一拼音信息相同。可选地,可以预先在语音搜索设备本地或服务器的数据库中保存了多个待匹配的内容,以便搜索装置106可以在上述数据库中获取与所述第一拼音信息匹配的搜索结果。例如,语音搜索设备在本地具有一个地图数据库,该地图数据库中相应地存储了多个记录项,每个记录项包括:记录项的名称(例如,兴趣点的名称)和对应的地址,具体如下表所示:
表1

兴趣点的名称地址广霖大厦北京路1号中广酒店南京路1号上海交通大学天津路1号

这样在获取上述拼音信息“guang lin da sha”后,搜索装置106可以到地图数据库中获取与拼音信息“guang lin da sha”匹配的兴趣点的名称,这里,所匹配到的兴趣点的名称的拼音为“guang lin da sha”。
可选地,可以通过如下步骤在本地或者向服务器获取与所述第一拼音信息匹配的搜索结果:信息处理装置104将所述本地或者服务器中的数据库中用于表示记录项的名称的文本信息转换为第二拼音信息;搜索装置106判断所述第一拼音信息是否与所述第二拼音信息相同;在所述第一拼音信息和所述第二拼音信息相同的情况下,搜索装置106将该记录项的名称作为所述搜索结果进行返回。
可选地,信息处理装置104可以通过第三方提供的搜索引擎将所述数据库中用于表示记录项的名称的文本信息转换为所述第二拼音信息。上述的第三方可以是搜索服务器,即提供拼音查找的第三方服务器。
需要说明的是,第二拼音信息也可以预先记录在本地或服务器的数据库中,例如,可以如下表所示:
表2
兴趣点的名称地址拼音信息广霖大厦北京路1号guang lin da sha中广酒店南京路1号zhong guang jiu dian上海交通大学天津路1号shang hai jiao tong da xue

在这种场景下,搜索装置106可以直接从本地或服务器的数据库中获取待匹配的兴趣点的拼音信息,并将该拼音信息与信息处理装置104转换得到的拼音信息进行比较,若两者相同,则将对应的兴趣点的名称作为搜索结果进行返回。
可选地,在返回搜索结果的时候,将兴趣点的名称作为搜索结果进行返回,这仅是一种示例。本发明不仅限于此,还可以返回数据库中与拼音信息匹配的记录项中的其他信息,例如,返回记录项中包含的兴趣点的地址,兴趣点的评价等信息。
可选地,如图2所示,本实施例中的语音搜索设备还可以包括:显示装置108。搜索装置106将上述搜索结果返回给显示装置108进行显示。在本实施例中,显示装置108可以但不限于为车载电子系统中的触摸屏。
需要说明的是,本实施例中的语音搜索设备可以适用于语音识别装置102将用于搜索的语音信息识别为正确的文本信息或包括同音字的文本信息的场景。例如,当语音识别装置102将输入语音信息“广霖大厦”识别为“广霖大厦”时,或者,当语音识别装置102将输入语音信息“广霖大厦”识别为“广林大厦”时,本实施例中的语音搜索设备都可以采用上述的方式搜索到正确的搜索结果。
在本发明实施例中,先将接收到的语音信息转换为其对应的拼音信息,然后通过该拼音信息搜索相匹配的搜索结果。由于在获取搜索结果的过程中,比对的是拼音信息,而不是字符本身,这样,即使由于同音字的存在而使得语音信息被错误地识别成拼音相同的其他字符,本实施例中的语音搜索设备仍然可以采用正确的拼音信息来搜索与该拼音信息匹配的搜索结果,从而解决了由于语音识别不准确而导致的无法得到正确的搜索结果的技术问题,达到了可以获取正确的搜索结果的技术效果。
当用户的发音不准确时,例如,将输入的语言信息“lin”说成“ling”,在将语音信息转换到文本信息的过程中可能将“霖”转换为“凌”,从而导致基于文本信息对应的拼音信息进行的搜索得到的搜索结果不准确。对此,为了进一步保证搜索结果的正确性,本实施例还提供了如下方案:当搜索装置106无法在本地或向服务器获取与所述第一拼音信息匹配的搜索结果时,信息处理装置104获取与所述第一拼音信息对应的模糊拼音信息,其中,所述模糊拼音信息中的拼音的声母为所述第一拼音信息中的拼音的声母的模糊音,和/或,所述模糊拼音信息中的拼音的韵母为所述第一拼音信息中的拼音的韵母的模糊音;然后,搜索装置106在所述本地或者向所述服务器获取与所述模糊拼音信息匹配的搜索结果。可选地,与所述模糊拼音信息匹配的搜索结果对应的拼音信息与所述第一拼音信息相同。
可选地,声母的模糊音可以包括但不限于:s和sh、c和ch、f和h、r和l。韵母的模糊音可以包括但不限于:an和ang、en和eng、in和ing、ian和iang、以及uan和uang。
例如,若语音识别装置102将用于搜索的语音信息“广霖大厦”识别为文本信息“广凌大厦”,则信息处理装置104将该文本信息“广凌大厦”转换得到的拼音信息为“guang ling da sha”,这样将无法从表1中获取到与该拼音信息匹配的兴趣点名称。在该场景下,信息处理装置104进一步获取拼音信息“guang ling da sha”的模糊拼音信息“guang lin da sha”,然后,搜索装置106可以在表1中获取到与模糊拼音信息“guang lin da sha”匹配的兴趣点的名称“广霖大厦”,从而在语音识别装置识别错误的情况下可以得到准确的搜索结果。
作为一种可选的方案,可以通过以下方式之一获取与所述第一拼音信息对应的模糊拼音信息:
1)获取的所述模糊拼音信息中的拼音的声母为所述第一拼音信息中的拼音的声母的模糊音、且获取的所述模糊拼音信息中的拼音的韵母为所述第一拼音信息中的拼音的韵母;
可选地,可以将第一拼音信息中的一个或多个拼音的声母都替换成该声母所有可能的模糊音,例如,将拼音信息“guang lin da sha”转换为模糊拼音信息“kuang nin ta sa”,“kuang nin ta sha”,“kuang nin ha sa”,“kuang nin ta sha”等。可选地,搜索装置106将替换得到的所有模糊拼音信息与本地或服务器中的数据库进行匹配。
2)获取的所述模糊拼音信息中的拼音的声母为所述第一拼音信息中的拼音的声母、且获取的所述模糊拼音信息中的拼音的韵母为所述第一拼音信息中的拼音的韵母的模糊音;
可选地,可以将第一拼音信息中的一个或多个拼音的韵母都替换成该韵母所有可能的模糊音,例如,将拼音信息“guang lin da sha”转换为“guan ling dao shan”,“guan ling dao shang”等。可选地,搜索装置106将替换得到的所有模糊拼音信息与本地或服务器中的数据库进行匹配。
3)获取的所述模糊拼音信息中的拼音的声母为所述第一拼音信息中的拼音的声母的模糊音、且获取的所述模糊拼音信息中的拼音的韵母为所述第一拼音信息中的拼音的韵母的模糊音。
可选地,可以将第一拼音信息中的一个或多个拼音的声母都替换成该声母所有可能的模糊音,并将第一拼音信息中的一个或多个拼音的韵母都替换成该韵母所有可能的模糊音,例如,将拼音信息“guang lin da sha”转换为“kuang ning ta sa”,“kuang ning ta sha”,“kuang ning ha sa”,“kuang nin ta sha”等。可选地,搜索装置106将替换得到的所有模糊拼音信息与本地或服务器中的数据库进行匹配。
当然,上述方式只是一个示例,本发明不仅限于此。
可选地,若所述用户个性化偏好设置包括用户地域指示信息,则所述第一拼音信息中的拼音的声母的模糊音为与所述用户地域指示信息对应的模糊音(优选的,所述第一拼音信息中的拼音的声母的模糊音为所述第一拼音信息中的拼音的声母的所有模糊音中与所述用户地域指示信息对应的模糊音),和/或,所述第一拼音信息中的拼音的韵母的模糊音为与所述用户地域指示信息对应的模糊音(优选的,所述第一拼音信息中的拼音的韵母的模糊音为所述第一拼音信息中的拼音的韵母的所有模糊音中与所述用户地域指示信息对应的模糊音)。
例如,如果用户是湖南人,则可能存在“l”和“n”不分的情况,用户可以预先将用户个性化偏好设置包括用户地域指示信息“湖南”,在本实施例中,用户个性化偏好设置可以但不限于存储在存储器中,例如,存储在车载电子系统的存储器中。这样,信息处理装置104在内部的映射表中增加记录项,以表示将l和n设置为互为声母的模糊音。这样,在语音信息对应的拼音信息为“lin”时,信息处理装置104会根据该记录项将拼音信息“lin”替换成模糊拼音信息“nin”。
可选地,上述数据库中的记录项记录了兴趣点的信息,其中,所述兴趣点的信息包括:兴趣点的名称、兴趣点的位置信息,兴趣点的地址。
可选地,上述实施例中的语音信息可以表示一个完整的兴趣点的名称,例如,“广霖大厦”或者,上述实施例中的语音信息可以表示一个完整的兴趣点的名称的缩写,例如,“交大”(上海交通大学的缩写)。当语音信息表示一个完整的兴趣点的名称的缩写时,数据库还可以进一步包括兴趣点的名称的缩写和对应的拼音信息,例如,如下表所示,语音搜索设备可以按照上述方式来搜索与拼音信息相匹配的搜索结果,在此不再赘述。
表3
兴趣点的名称名称缩写地址拼音信息缩写的拼音信息广霖大厦广霖北京路1号guang lin da shaguang lin中广酒店中广南京路1号zhong guang jiu dianzhong guang上海交通大学交大天津路1号shang hai jiao tong da xuejiao da

此外,在信息处理装置104获取拼音信息的模糊拼音信息时,或者,在搜索装置106根据拼音信息或拼音信息的模糊拼音信息进行搜索时,还可以考虑用户当前所处的位置(例如,该用户所处的地区信息“上海”、“北京”等)。以语音信息为兴趣点的缩写为例,当用户当前的位置处于北京时,用户输入的语音信息为“清华”,语音识别装置102将该语音信息识别为文本信息“庭华”,信息处理装置104在获取拼音信息的模糊拼音信息时,考虑到该用户当前的位置信息为“北京”,在北京包含“清华”的兴趣点的热度应较高,因此,将“庭华”对应的拼音信息“ting hua”转换为模糊拼音信息“qing hua”,进而搜索到兴趣点“清华大学”。
实施例2
基于图1和图2所示的语言搜索设备,本发明实施例还提出了一种可选地语音搜索方法,如图3所示,本实施例中的语音搜索方法包括以下步骤:
S302:将用于搜索的语音信息识别为文本信息;
可选地,步骤S302可以参照上述语音识别装置102所执行的步骤,在此不再赘述。
S304:将所述文本信息转换为第一拼音信息;
可选地,步骤S304可以参照上述信息处理装置104所执行的步骤,在此不再赘述。
S306:在本地或向服务器获取与所述第一拼音信息匹配的搜索结果。可选地,所述与所述第一拼音信息匹配的搜索结果对应的拼音信息与所述第一拼音信息相同。
可选地,步骤S306可以参照上述信息处理装置106所执行的步骤,在此不再赘述。
在该步骤中,可以预先在本地或服务器的数据库中保存了多个待匹配的内容,以便可以在上述数据库中获取与所述第一拼音信息匹配的搜索结果。例如,本地或服务器具有一个地图数据库,该地图数据库中相应地存储了多个记录项,每个记录项包括:记录项的名称(例如,兴趣点的名称)和对应的地址,具体如表1所示。
可选地,如图4所示,可以通过如下步骤在本地或者向服务器获取与所述第一拼音信息匹配的搜索结果:
S402:将所述本地或者服务器中的数据库中用于表示记录项的名称的文本信息转换为第二拼音信息;
S404:判断所述第一拼音信息是否与所述第二拼音信息相同;
S406:在所述第一拼音信息和所述第二拼音信息相同的情况下,将该记录项的名称作为所述搜索结果进行返回。
可选地,可以通过第三方提供的搜索引擎将所述数据库中用于表示记录项的名称的文本信息转换为所述第二拼音信息。上述的第三方可以是搜索服务器,即提供拼音查找的第三方服务器。
需要说明的是,第二拼音信息也可以预先记录在本地或服务器的数据库中,例如,可以如表2所示。
在这种场景下,可以直接从本地或服务器的数据库中获取待匹配的兴趣点的拼音信息,并将该拼音信息与转换得到的拼音信息进行比较,若两者相同,则将对应的兴趣点的名称作为搜索结果进行返回。可选地,可以将上述搜索结果返回给显示装置进行显示。
可选地,在返回搜索结果的时候,将兴趣点的名称作为搜索结果进行返回,这仅是一种示例。本发明不仅限于此,还可以返回数据库中与拼音信息匹配的记录项中的其他信息,例如,返回记录项中包含的兴趣点的地址,兴趣点的评价等信息。
在本发明实施例中,先将接收到的语音信息转换为其对应的拼音信息,然后通过该拼音信息搜索相匹配的搜索结果。由于在获取搜索结果的过程中,比对的是拼音信息,而不是字符本身,这样,在由于同音字的存在而使得语音信息被错误地识别成拼音相同的其他字符时,仍然可以采用正确的拼音信息来搜索与该拼音信息匹配的搜索结果,从而解决了由于语音识别不准确而导致的无法得到正确的搜索结果的技术问题,达到了可以获取正确的搜索结果的技术效果。
当用户的发音不准确时,例如,将输入的语言信息“lin”说成“ling”,在将语音信息转换到文本信息的过程中可能将“霖”转换为“凌”,从而导致基于文本信息对应的拼音信息进行的搜索得到的搜索结果不准确。对此,为了进一步保证搜索结果的正确性,本实施例还提供了如下方案:当无法在本地或向服务器获取与所述第一拼音信息匹配的搜索结果时,获取与所述第一拼音信息对应的模糊拼音信息,其中,所述模糊拼音信息中的拼音的声母为所述第一拼音信息中的拼音的声母的模糊音,和/或,所述模糊拼音信息中的拼音的韵母为所述第一拼音信息中的拼音的韵母的模糊音;然后,在所述本地或者向所述服务器获取与所述模糊拼音信息匹配的搜索结果,其中,所述与所述模糊拼音信息匹配的搜索结果对应的拼音信息与所述第一拼音信息相同。
可选地,声母的模糊音可以包括但不限于:s和sh、c和ch、f和h、r和l。韵母的模糊音可以包括但不限于:an和ang、en和eng、in和ing、ian和iang、以及uan和uang。
作为一种可选的方案,获取与所述第一拼音信息对应的模糊拼音信息可以采用上述实施例1中的方式1)-3)中的一个,在此不再赘述。
当然,上述方式只是一个示例,本发明不仅限于此。
可选地,若所述用户个性化偏好设置包括用户地域指示信息,则所述第一拼音信息中的拼音的声母的模糊音为与所述用户地域指示信息对应的模糊音(优选的,所述第一拼音信息中的拼音的声母的模糊音为所述第一拼音信息中的拼音的声母的所有模糊音中与所述用户地 域指示信息对应的模糊音),和/或,所述第一拼音信息中的拼音的韵母的模糊音为与所述用户地域指示信息对应的模糊音(优选的,所述第一拼音信息中的拼音的韵母的模糊音为所述第一拼音信息中的拼音的韵母的所有模糊音中与所述用户地域指示信息对应的模糊音)。
可选地,上述数据库中的记录项记录了兴趣点的信息,其中,所述兴趣点的信息包括:兴趣点的名称、兴趣点的位置信息,兴趣点的地址。
可选地,上述实施例中的语音信息可以表示一个完整的兴趣点的名称,例如,“广霖大厦”或者,上述实施例中的语音信息可以表示一个完整的兴趣点的名称的缩写,例如,“交大”(上海交通大学的缩写)。当语音信息表示一个完整的兴趣点的名称的缩写时,数据库还可以进一步包括兴趣点的名称的缩写和对应的拼音信息,例如,如表3所示,可以按照上述方式来搜索与拼音信息相匹配的搜索结果,在此不再赘述。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

语音搜索方法和设备.pdf_第1页
第1页 / 共13页
语音搜索方法和设备.pdf_第2页
第2页 / 共13页
语音搜索方法和设备.pdf_第3页
第3页 / 共13页
点击查看更多>>
资源描述

《语音搜索方法和设备.pdf》由会员分享,可在线阅读,更多相关《语音搜索方法和设备.pdf(13页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN104216906A43申请公布日20141217CN104216906A21申请号201310217287922申请日20130531G06F17/3020060171申请人大陆汽车投资(上海)有限公司地址200082上海市虹口区大连路538号72发明人颜卿74专利代理机构北京康信知识产权代理有限责任公司11240代理人江舟吴贵明54发明名称语音搜索方法和设备57摘要本发明公开了一种语音搜索方法和设备,其中,该方法包括将用于搜索的语音信息识别为文本信息;将文本信息转换为第一拼音信息;在本地或向服务器获取与第一拼音信息匹配的搜索结果。通过上述方式有效解决了相关技术中由于语音识。

2、别不准确而导致的无法得到正确的搜索结果的技术问题,达到了可以获取正确的搜索结果的技术效果。51INTCL权利要求书2页说明书8页附图2页19中华人民共和国国家知识产权局12发明专利申请权利要求书2页说明书8页附图2页10申请公布号CN104216906ACN104216906A1/2页21一种语音搜索方法,其特征在于,包括将用于搜索的语音信息识别为文本信息;将所述文本信息转换为第一拼音信息;在本地或向服务器获取与所述第一拼音信息匹配的搜索结果。2根据权利要求1所述的方法,其特征在于,若无法获取到与所述第一拼音信息匹配的搜索结果,则获取与所述第一拼音信息对应的模糊拼音信息,其中,所述模糊拼音信息。

3、中的拼音的声母为所述第一拼音信息中的拼音的声母的模糊音,和/或,所述模糊拼音信息中的拼音的韵母为所述第一拼音信息中的拼音的韵母的模糊音;获取与所述模糊拼音信息匹配的搜索结果。3根据权利要求2所述的方法,其特征在于,获取与所述第一拼音信息对应的模糊拼音信息包括根据用户个性化偏好设置来获取与所述第一拼音信息对应的模糊拼音信息。4根据权利要求2所述的方法,其特征在于,所述获取与所述第一拼音信息对应的模糊拼音信息包括以下方式之一获取的所述模糊拼音信息中的拼音的声母为所述第一拼音信息中的拼音的声母的模糊音、且获取的所述模糊拼音信息中的拼音的韵母为所述第一拼音信息中的拼音的韵母;获取的所述模糊拼音信息中的。

4、拼音的声母为所述第一拼音信息中的拼音的声母、且获取的所述模糊拼音信息中的拼音的韵母为所述第一拼音信息中的拼音的韵母的模糊音;获取的所述模糊拼音信息中的拼音的声母为所述第一拼音信息中的拼音的声母的模糊音、且获取的所述模糊拼音信息中的拼音的韵母为所述第一拼音信息中的拼音的韵母的模糊音。5根据权利要求3所述的方法,其特征在于,所述用户个性化偏好设置包括用户地域指示信息;所述第一拼音信息中的拼音的声母的模糊音为与所述用户地域指示信息对应的模糊音,和/或,所述第一拼音信息中的拼音的韵母的模糊音为与所述用户地域指示信息对应的模糊音。6根据权利要求1所述的方法,其特征在于,在本地或向服务器获取与所述第一拼音。

5、信息匹配的搜索结果包括将所述本地或所述服务器的数据库中用于表示记录项的名称的文本信息转换为第二拼音信息;判断所述第一拼音信息和所述第二拼音信息是否相同;若所述第一拼音信息和所述第二拼音信息相同,则将所述记录项的名称作为所述搜索结果进行显示。7根据权利要求6所述的方法,其特征在于,将所述数据库中用于表示记录项的名称的文本信息转换为第二拼音信息包括通过第三方提供的搜索引擎将所述数据库中用于表示记录项的名称的文本信息转换为所述第二拼音信息。8根据权利要求6或7所述的方法,其特征在于,所述数据库中的记录项记录兴趣点的信息,其中,所述兴趣点的信息包括兴趣点的名称、兴趣点的位置信息,兴趣点的地址。权利要求。

6、书CN104216906A2/2页39一种语音搜索设备,其特征在于,包括语音识别装置,用于将用于搜索的语音信息识别为文本信息;信息处理装置,用于将所述文本信息转换为第一拼音信息;搜索装置,用于在本地或者向服务器获取与所述第一拼音信息匹配的搜索结果。10根据权利要求9所述的设备,其特征在于,所述信息处理装置还用于在无法获取到与所述第一拼音信息匹配的搜索结果,获取与所述第一拼音信息对应的模糊拼音信息,其中,所述模糊拼音信息中的拼音的声母为所述第一拼音信息中的拼音的声母的模糊音,和/或,所述模糊拼音信息中的拼音的韵母为所述第一拼音信息中的拼音的韵母的模糊音;所述搜索装置还用于在所述本地或者向所述服务。

7、器获取与所述模糊拼音信息匹配的搜索结果。11根据权利要求9所述的设备,其特征在于,所述设备还包括显示装置;所述信息处理装置还用于将所述本地或者服务器中的数据库中用于表示记录项的名称的文本信息转换为第二拼音信息;所述搜索装置用于判断所述第一拼音信息是否与所述第二拼音信息相同;在所述第一拼音信息和所述第二拼音信息相同的情况下,将所述记录项的名称作为所述搜索结果发送给所述显示装置;所述显示装置用于显示所述搜索结果。权利要求书CN104216906A1/8页4语音搜索方法和设备技术领域0001本发明涉及互联网领域,具体而言,涉及一种语音搜索方法和设备。背景技术0002语音识别就是让机器通过识别和理解的。

8、过程将语音信号转变为相应的文本或命令的技术。近二十年来,语音识别技术取得了显著进步,语音识别也被用在了越来越多的领域,例如手机、带语音识别的浏览器、车载的导航系统等等。0003语音识别难免会存在多音字、同音字混淆不清的状况,这样就导致如果输入的语音本身是多音字或者是同音字则很容易出现识别错误或者是识别不到语音输入的内容的情况。目前存在的解决方式是根据输入内容的上下文来确定对应该多音字或者同音字应该对应的汉字,然而如果输入的内容是不存在上下文的,例如,在车载导航系统中,如果需要查找某个地点,则输入的就是这个地点的名字,这种词语并没有其对应的上下文。因此,如果在这种没有上下文的情况下输入一个词,而。

9、该词又存在多个同音词或者该词中有多音字,则通过上述方式仍旧无法解决输入的语音难以被识别的问题。由于语音识别不准确,从而导致基于识别出的语音信息进行搜索得到的搜索结果不正确。0004针对上述问题,目前尚未提出有效的解决方案。发明内容0005本申请的主要目的在于提供一种语音搜索方法和设备,以至少解决相关技术中由于语音识别不准确而导致的无法得到正确的搜索结果的技术问题。0006根据本发明的一个方面,提供了一种语音搜索方法,包括将用于搜索的语音信息识别为文本信息;将所述文本信息转换为第一拼音信息;在本地或向服务器获取与所述第一拼音信息匹配的搜索结果。0007可选地,若无法获取到与第一拼音信息匹配的搜索。

10、结果,则获取与第一拼音信息对应的模糊拼音信息,其中,模糊拼音信息中的拼音的声母为第一拼音信息中的拼音的声母的模糊音,和/或,模糊拼音信息中的拼音的韵母为第一拼音信息中的拼音的韵母的模糊音;获取与模糊拼音信息匹配的搜索结果。0008可选地,获取与第一拼音信息对应的模糊拼音信息包括根据用户个性化偏好设置来获取与第一拼音信息对应的模糊拼音信息。0009可选地,获取与第一拼音信息对应的模糊拼音信息包括以下方式之一获取的模糊拼音信息中的拼音的声母为第一拼音信息中的拼音的声母的模糊音、且获取的模糊拼音信息中的拼音的韵母为第一拼音信息中的拼音的韵母;获取的模糊拼音信息中的拼音的声母为第一拼音信息中的拼音的声。

11、母、且获取的模糊拼音信息中的拼音的韵母为第一拼音信息中的拼音的韵母的模糊音;获取的模糊拼音信息中的拼音的声母为第一拼音信息中的拼音的声母的模糊音、且获取的模糊拼音信息中的拼音的韵母为第一拼音信息中的拼音的韵母的模糊音。说明书CN104216906A2/8页50010可选地,用户个性化偏好设置包括用户地域指示信息,第一拼音信息中的拼音的声母的模糊音为与用户地域指示信息对应的模糊音,和/或,第一拼音信息中的拼音的韵母的模糊音为与用户地域指示信息对应的模糊音。0011可选地,在本地或向服务器获取与第一拼音信息匹配的搜索结果包括将本地或服务器的数据库中用于表示记录项的名称的文本信息转换为第二拼音信息;。

12、判断第一拼音信息和第二拼音信息是否相同;若第一拼音信息和第二拼音信息相同,则将记录项的名称作为搜索结果进行显示。0012可选地,将数据库中用于表示记录项的名称的文本信息转换为第二拼音信息包括通过第三方提供的搜索引擎将数据库中用于表示记录项的名称的文本信息转换为第二拼音信息。0013可选地,数据库中的记录项记录兴趣点的信息,其中,兴趣点的信息包括兴趣点的名称、兴趣点的位置信息,兴趣点的地址。0014根据本发明的另一方面,提供了一种语音搜索设备,包括语音识别装置,用于将用于搜索的语音信息识别为文本信息;信息处理装置,用于将所述文本信息转换为第一拼音信息;搜索装置,用于在本地或者向服务器获取与所述第。

13、一拼音信息匹配的搜索结果。0015可选地,信息处理装置还用于在无法获取到与第一拼音信息匹配的搜索结果,获取与第一拼音信息对应的模糊拼音信息,其中,模糊拼音信息中的拼音的声母为第一拼音信息中的拼音的声母的模糊音,和/或,模糊拼音信息中的拼音的韵母为第一拼音信息中的拼音的韵母的模糊音;搜索装置还用于在本地或者向服务器获取与模糊拼音信息匹配的搜索结果。0016可选地,设备还包括显示装置;信息处理装置还用于将本地或者服务器中的数据库中用于表示记录项的名称的文本信息转换为第二拼音信息;搜索装置用于判断第一拼音信息是否与第二拼音信息相同;在第一拼音信息和第二拼音信息相同的情况下,将记录项的名称作为搜索结果。

14、发送给显示装置;显示装置用于显示搜索结果。0017在本发明实施例中,先将接收到的语音信息转换为其对应的拼音信息,然后通过该拼音信息搜索相匹配的搜索结果。由于在获取搜索结果的过程中,比对的是拼音信息,而不是字符本身,这样,在由于同音字的存在而使得语音信息被错误地识别成拼音相同的其他字符时,仍然可以采用正确的拼音信息来搜索与该拼音信息匹配的搜索结果,从而解决了由于语音识别不准确而导致的无法得到正确的搜索结果的技术问题,达到了可以获取正确的搜索结果的技术效果。附图说明0018此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请。

15、的不当限定。在附图中0019图1是根据本发明实施例的语音搜索设备的一种结构框图;0020图2是根据本发明实施例的语音搜索设备的另一种结构框图;0021图3是根据本发明实施例的语音搜索方法的一种流程图;以及0022图4是根据本发明实施例的获取与拼音信息匹配的搜索结果的一种流程图。说明书CN104216906A3/8页6具体实施方式0023下文中将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。0024实施例10025本实施例提供的语音搜索设备,如图1所示包括语音识别装置102、信息处理装置104和搜索装置106。下面对该结构进行。

16、具体描述00261)语音识别装置102,用于将用于搜索的语音信息识别为文本信息。可选地,语音识别装置102将接收到的语音信息或者输入的语音信息转化为文本信息,例如如果用户在导航的过程中需要查找兴趣点“广霖大厦”的位置,则可以通过车载电子系统中的麦克风输入语音信息“广霖大厦”,然后,语音识别装置102可以将上述语音信息识别为文本信息。需要说明的是,上述导航场景仅是一个示例,语音识别装置102还可以在其他场景下将输入的语音信息识别为对应的文本信息,例如,在车辆未启动的场景下,或者,在车辆运行但未开启导航的场景下。00272)信息处理装置104,与语音识别装置102耦合,用于将上述文本信息转换为第一。

17、拼音信息。例如,信息处理装置104可以将上述文本信息转换为其对应的拼音信息“GUANGLINDASHA”。00283)搜索装置106,与信息处理装置104耦合,用于在本地或者向服务器获取与所述第一拼音信息匹配的搜索结果。可选地,与第一拼音信息匹配的搜索结果对应的拼音信息与第一拼音信息相同。可选地,可以预先在语音搜索设备本地或服务器的数据库中保存了多个待匹配的内容,以便搜索装置106可以在上述数据库中获取与所述第一拼音信息匹配的搜索结果。例如,语音搜索设备在本地具有一个地图数据库,该地图数据库中相应地存储了多个记录项,每个记录项包括记录项的名称(例如,兴趣点的名称)和对应的地址,具体如下表所示0。

18、029表10030兴趣点的名称地址广霖大厦北京路1号中广酒店南京路1号上海交通大学天津路1号0031这样在获取上述拼音信息“GUANGLINDASHA”后,搜索装置106可以到地图数据库中获取与拼音信息“GUANGLINDASHA”匹配的兴趣点的名称,这里,所匹配到的兴趣点的名称的拼音为“GUANGLINDASHA”。0032可选地,可以通过如下步骤在本地或者向服务器获取与所述第一拼音信息匹配的搜索结果信息处理装置104将所述本地或者服务器中的数据库中用于表示记录项的名称的文本信息转换为第二拼音信息;搜索装置106判断所述第一拼音信息是否与所述第二拼音信息相同;在所述第一拼音信息和所述第二拼音。

19、信息相同的情况下,搜索装置106将该记录项的名称作为所述搜索结果进行返回。说明书CN104216906A4/8页70033可选地,信息处理装置104可以通过第三方提供的搜索引擎将所述数据库中用于表示记录项的名称的文本信息转换为所述第二拼音信息。上述的第三方可以是搜索服务器,即提供拼音查找的第三方服务器。0034需要说明的是,第二拼音信息也可以预先记录在本地或服务器的数据库中,例如,可以如下表所示0035表20036兴趣点的名称地址拼音信息广霖大厦北京路1号GUANGLINDASHA中广酒店南京路1号ZHONGGUANGJIUDIAN上海交通大学天津路1号SHANGHAIJIAOTONGDAXU。

20、E0037在这种场景下,搜索装置106可以直接从本地或服务器的数据库中获取待匹配的兴趣点的拼音信息,并将该拼音信息与信息处理装置104转换得到的拼音信息进行比较,若两者相同,则将对应的兴趣点的名称作为搜索结果进行返回。0038可选地,在返回搜索结果的时候,将兴趣点的名称作为搜索结果进行返回,这仅是一种示例。本发明不仅限于此,还可以返回数据库中与拼音信息匹配的记录项中的其他信息,例如,返回记录项中包含的兴趣点的地址,兴趣点的评价等信息。0039可选地,如图2所示,本实施例中的语音搜索设备还可以包括显示装置108。搜索装置106将上述搜索结果返回给显示装置108进行显示。在本实施例中,显示装置10。

21、8可以但不限于为车载电子系统中的触摸屏。0040需要说明的是,本实施例中的语音搜索设备可以适用于语音识别装置102将用于搜索的语音信息识别为正确的文本信息或包括同音字的文本信息的场景。例如,当语音识别装置102将输入语音信息“广霖大厦”识别为“广霖大厦”时,或者,当语音识别装置102将输入语音信息“广霖大厦”识别为“广林大厦”时,本实施例中的语音搜索设备都可以采用上述的方式搜索到正确的搜索结果。0041在本发明实施例中,先将接收到的语音信息转换为其对应的拼音信息,然后通过该拼音信息搜索相匹配的搜索结果。由于在获取搜索结果的过程中,比对的是拼音信息,而不是字符本身,这样,即使由于同音字的存在而使。

22、得语音信息被错误地识别成拼音相同的其他字符,本实施例中的语音搜索设备仍然可以采用正确的拼音信息来搜索与该拼音信息匹配的搜索结果,从而解决了由于语音识别不准确而导致的无法得到正确的搜索结果的技术问题,达到了可以获取正确的搜索结果的技术效果。0042当用户的发音不准确时,例如,将输入的语言信息“LIN”说成“LING”,在将语音信息转换到文本信息的过程中可能将“霖”转换为“凌”,从而导致基于文本信息对应的拼音信息进行的搜索得到的搜索结果不准确。对此,为了进一步保证搜索结果的正确性,本实施例还提供了如下方案当搜索装置106无法在本地或向服务器获取与所述第一拼音信息匹配的搜索结果时,信息处理装置104。

23、获取与所述第一拼音信息对应的模糊拼音信息,其中,所述模糊拼音信息中的拼音的声母为所述第一拼音信息中的拼音的声母的模糊音,和/或,说明书CN104216906A5/8页8所述模糊拼音信息中的拼音的韵母为所述第一拼音信息中的拼音的韵母的模糊音;然后,搜索装置106在所述本地或者向所述服务器获取与所述模糊拼音信息匹配的搜索结果。可选地,与所述模糊拼音信息匹配的搜索结果对应的拼音信息与所述第一拼音信息相同。0043可选地,声母的模糊音可以包括但不限于S和SH、C和CH、F和H、R和L。韵母的模糊音可以包括但不限于AN和ANG、EN和ENG、IN和ING、IAN和IANG、以及UAN和UANG。0044。

24、例如,若语音识别装置102将用于搜索的语音信息“广霖大厦”识别为文本信息“广凌大厦”,则信息处理装置104将该文本信息“广凌大厦”转换得到的拼音信息为“GUANGLINGDASHA”,这样将无法从表1中获取到与该拼音信息匹配的兴趣点名称。在该场景下,信息处理装置104进一步获取拼音信息“GUANGLINGDASHA”的模糊拼音信息“GUANGLINDASHA”,然后,搜索装置106可以在表1中获取到与模糊拼音信息“GUANGLINDASHA”匹配的兴趣点的名称“广霖大厦”,从而在语音识别装置识别错误的情况下可以得到准确的搜索结果。0045作为一种可选的方案,可以通过以下方式之一获取与所述第一拼。

25、音信息对应的模糊拼音信息00461)获取的所述模糊拼音信息中的拼音的声母为所述第一拼音信息中的拼音的声母的模糊音、且获取的所述模糊拼音信息中的拼音的韵母为所述第一拼音信息中的拼音的韵母;0047可选地,可以将第一拼音信息中的一个或多个拼音的声母都替换成该声母所有可能的模糊音,例如,将拼音信息“GUANGLINDASHA”转换为模糊拼音信息“KUANGNINTASA”,“KUANGNINTASHA”,“KUANGNINHASA”,“KUANGNINTASHA”等。可选地,搜索装置106将替换得到的所有模糊拼音信息与本地或服务器中的数据库进行匹配。00482)获取的所述模糊拼音信息中的拼音的声母为。

26、所述第一拼音信息中的拼音的声母、且获取的所述模糊拼音信息中的拼音的韵母为所述第一拼音信息中的拼音的韵母的模糊音;0049可选地,可以将第一拼音信息中的一个或多个拼音的韵母都替换成该韵母所有可能的模糊音,例如,将拼音信息“GUANGLINDASHA”转换为“GUANLINGDAOSHAN”,“GUANLINGDAOSHANG”等。可选地,搜索装置106将替换得到的所有模糊拼音信息与本地或服务器中的数据库进行匹配。00503)获取的所述模糊拼音信息中的拼音的声母为所述第一拼音信息中的拼音的声母的模糊音、且获取的所述模糊拼音信息中的拼音的韵母为所述第一拼音信息中的拼音的韵母的模糊音。0051可选地,。

27、可以将第一拼音信息中的一个或多个拼音的声母都替换成该声母所有可能的模糊音,并将第一拼音信息中的一个或多个拼音的韵母都替换成该韵母所有可能的模糊音,例如,将拼音信息“GUANGLINDASHA”转换为“KUANGNINGTASA”,“KUANGNINGTASHA”,“KUANGNINGHASA”,“KUANGNINTASHA”等。可选地,搜索装置106将替换得到的所有模糊拼音信息与本地或服务器中的数据库进行匹配。0052当然,上述方式只是一个示例,本发明不仅限于此。0053可选地,若所述用户个性化偏好设置包括用户地域指示信息,则所述第一拼音信息中的拼音的声母的模糊音为与所述用户地域指示信息对应的。

28、模糊音(优选的,所述第一说明书CN104216906A6/8页9拼音信息中的拼音的声母的模糊音为所述第一拼音信息中的拼音的声母的所有模糊音中与所述用户地域指示信息对应的模糊音),和/或,所述第一拼音信息中的拼音的韵母的模糊音为与所述用户地域指示信息对应的模糊音(优选的,所述第一拼音信息中的拼音的韵母的模糊音为所述第一拼音信息中的拼音的韵母的所有模糊音中与所述用户地域指示信息对应的模糊音)。0054例如,如果用户是湖南人,则可能存在“L”和“N”不分的情况,用户可以预先将用户个性化偏好设置包括用户地域指示信息“湖南”,在本实施例中,用户个性化偏好设置可以但不限于存储在存储器中,例如,存储在车载电。

29、子系统的存储器中。这样,信息处理装置104在内部的映射表中增加记录项,以表示将L和N设置为互为声母的模糊音。这样,在语音信息对应的拼音信息为“LIN”时,信息处理装置104会根据该记录项将拼音信息“LIN”替换成模糊拼音信息“NIN”。0055可选地,上述数据库中的记录项记录了兴趣点的信息,其中,所述兴趣点的信息包括兴趣点的名称、兴趣点的位置信息,兴趣点的地址。0056可选地,上述实施例中的语音信息可以表示一个完整的兴趣点的名称,例如,“广霖大厦”或者,上述实施例中的语音信息可以表示一个完整的兴趣点的名称的缩写,例如,“交大”(上海交通大学的缩写)。当语音信息表示一个完整的兴趣点的名称的缩写时。

30、,数据库还可以进一步包括兴趣点的名称的缩写和对应的拼音信息,例如,如下表所示,语音搜索设备可以按照上述方式来搜索与拼音信息相匹配的搜索结果,在此不再赘述。0057表30058兴趣点的名称名称缩写地址拼音信息缩写的拼音信息广霖大厦广霖北京路1号GUANGLINDASHAGUANGLIN中广酒店中广南京路1号ZHONGGUANGJIUDIANZHONGGUANG上海交通大学交大天津路1号SHANGHAIJIAOTONGDAXUEJIAODA0059此外,在信息处理装置104获取拼音信息的模糊拼音信息时,或者,在搜索装置106根据拼音信息或拼音信息的模糊拼音信息进行搜索时,还可以考虑用户当前所处的位。

31、置(例如,该用户所处的地区信息“上海”、“北京”等)。以语音信息为兴趣点的缩写为例,当用户当前的位置处于北京时,用户输入的语音信息为“清华”,语音识别装置102将该语音信息识别为文本信息“庭华”,信息处理装置104在获取拼音信息的模糊拼音信息时,考虑到该用户当前的位置信息为“北京”,在北京包含“清华”的兴趣点的热度应较高,因此,将“庭华”对应的拼音信息“TINGHUA”转换为模糊拼音信息“QINGHUA”,进而搜索到兴趣点“清华大学”。0060实施例20061基于图1和图2所示的语言搜索设备,本发明实施例还提出了一种可选地语音搜索方法,如图3所示,本实施例中的语音搜索方法包括以下步骤0062S。

32、302将用于搜索的语音信息识别为文本信息;0063可选地,步骤S302可以参照上述语音识别装置102所执行的步骤,在此不再赘述。说明书CN104216906A7/8页100064S304将所述文本信息转换为第一拼音信息;0065可选地,步骤S304可以参照上述信息处理装置104所执行的步骤,在此不再赘述。0066S306在本地或向服务器获取与所述第一拼音信息匹配的搜索结果。可选地,所述与所述第一拼音信息匹配的搜索结果对应的拼音信息与所述第一拼音信息相同。0067可选地,步骤S306可以参照上述信息处理装置106所执行的步骤,在此不再赘述。0068在该步骤中,可以预先在本地或服务器的数据库中保存。

33、了多个待匹配的内容,以便可以在上述数据库中获取与所述第一拼音信息匹配的搜索结果。例如,本地或服务器具有一个地图数据库,该地图数据库中相应地存储了多个记录项,每个记录项包括记录项的名称(例如,兴趣点的名称)和对应的地址,具体如表1所示。0069可选地,如图4所示,可以通过如下步骤在本地或者向服务器获取与所述第一拼音信息匹配的搜索结果0070S402将所述本地或者服务器中的数据库中用于表示记录项的名称的文本信息转换为第二拼音信息;0071S404判断所述第一拼音信息是否与所述第二拼音信息相同;0072S406在所述第一拼音信息和所述第二拼音信息相同的情况下,将该记录项的名称作为所述搜索结果进行返回。

34、。0073可选地,可以通过第三方提供的搜索引擎将所述数据库中用于表示记录项的名称的文本信息转换为所述第二拼音信息。上述的第三方可以是搜索服务器,即提供拼音查找的第三方服务器。0074需要说明的是,第二拼音信息也可以预先记录在本地或服务器的数据库中,例如,可以如表2所示。0075在这种场景下,可以直接从本地或服务器的数据库中获取待匹配的兴趣点的拼音信息,并将该拼音信息与转换得到的拼音信息进行比较,若两者相同,则将对应的兴趣点的名称作为搜索结果进行返回。可选地,可以将上述搜索结果返回给显示装置进行显示。0076可选地,在返回搜索结果的时候,将兴趣点的名称作为搜索结果进行返回,这仅是一种示例。本发明。

35、不仅限于此,还可以返回数据库中与拼音信息匹配的记录项中的其他信息,例如,返回记录项中包含的兴趣点的地址,兴趣点的评价等信息。0077在本发明实施例中,先将接收到的语音信息转换为其对应的拼音信息,然后通过该拼音信息搜索相匹配的搜索结果。由于在获取搜索结果的过程中,比对的是拼音信息,而不是字符本身,这样,在由于同音字的存在而使得语音信息被错误地识别成拼音相同的其他字符时,仍然可以采用正确的拼音信息来搜索与该拼音信息匹配的搜索结果,从而解决了由于语音识别不准确而导致的无法得到正确的搜索结果的技术问题,达到了可以获取正确的搜索结果的技术效果。0078当用户的发音不准确时,例如,将输入的语言信息“LIN。

36、”说成“LING”,在将语音信息转换到文本信息的过程中可能将“霖”转换为“凌”,从而导致基于文本信息对应的拼音信息进行的搜索得到的搜索结果不准确。对此,为了进一步保证搜索结果的正确性,本实施例还提供了如下方案当无法在本地或向服务器获取与所述第一拼音信息匹配的搜索结果时,获取与所述第一拼音信息对应的模糊拼音信息,其中,所述模糊拼音信息中的拼音的声母为所述第一拼音信息中的拼音的声母的模糊音,和/或,所述模糊拼音信息中的拼音的说明书CN104216906A108/8页11韵母为所述第一拼音信息中的拼音的韵母的模糊音;然后,在所述本地或者向所述服务器获取与所述模糊拼音信息匹配的搜索结果,其中,所述与所。

37、述模糊拼音信息匹配的搜索结果对应的拼音信息与所述第一拼音信息相同。0079可选地,声母的模糊音可以包括但不限于S和SH、C和CH、F和H、R和L。韵母的模糊音可以包括但不限于AN和ANG、EN和ENG、IN和ING、IAN和IANG、以及UAN和UANG。0080作为一种可选的方案,获取与所述第一拼音信息对应的模糊拼音信息可以采用上述实施例1中的方式1)3)中的一个,在此不再赘述。0081当然,上述方式只是一个示例,本发明不仅限于此。0082可选地,若所述用户个性化偏好设置包括用户地域指示信息,则所述第一拼音信息中的拼音的声母的模糊音为与所述用户地域指示信息对应的模糊音(优选的,所述第一拼音信。

38、息中的拼音的声母的模糊音为所述第一拼音信息中的拼音的声母的所有模糊音中与所述用户地域指示信息对应的模糊音),和/或,所述第一拼音信息中的拼音的韵母的模糊音为与所述用户地域指示信息对应的模糊音(优选的,所述第一拼音信息中的拼音的韵母的模糊音为所述第一拼音信息中的拼音的韵母的所有模糊音中与所述用户地域指示信息对应的模糊音)。0083可选地,上述数据库中的记录项记录了兴趣点的信息,其中,所述兴趣点的信息包括兴趣点的名称、兴趣点的位置信息,兴趣点的地址。0084可选地,上述实施例中的语音信息可以表示一个完整的兴趣点的名称,例如,“广霖大厦”或者,上述实施例中的语音信息可以表示一个完整的兴趣点的名称的缩。

39、写,例如,“交大”(上海交通大学的缩写)。当语音信息表示一个完整的兴趣点的名称的缩写时,数据库还可以进一步包括兴趣点的名称的缩写和对应的拼音信息,例如,如表3所示,可以按照上述方式来搜索与拼音信息相匹配的搜索结果,在此不再赘述。0085显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。0086以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。说明书CN104216906A111/2页12图1图2说明书附图CN104216906A122/2页13图3图4说明书附图CN104216906A13。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1