基于语音识别的语音呼叫方法和接入网关.pdf

上传人:r5 文档编号:669791 上传时间:2018-03-02 格式:PDF 页数:15 大小:1.38MB
返回 下载 相关 举报
摘要
申请专利号:

CN201410347198.0

申请日:

2014.07.21

公开号:

CN104092829A

公开日:

2014.10.08

当前法律状态:

驳回

有效性:

无权

法律详情:

发明专利申请公布后的驳回IPC(主分类):H04M 1/725申请公布日:20141008|||实质审查的生效IPC(主分类):H04M 1/725申请日:20140721|||公开

IPC分类号:

H04M1/725; H04M1/27; H04M7/00

主分类号:

H04M1/725

申请人:

苏州工业园区服务外包职业学院

发明人:

商琦; 曹纪清; 伏玉琛

地址:

215000 江苏省苏州市工业园区独墅湖高教区若水路99号

优先权:

专利代理机构:

北京品源专利代理有限公司 11332

代理人:

胡彬;邓猛烈

PDF下载: PDF下载
内容摘要

本发明实施例提供一种基于语音识别的语音呼叫方法和接入网关。该方法包括:接入网关获取用户输入的呼叫语音,所述呼叫语音包括被叫方信息;接入网关根据所述呼叫语音,识别获得被叫号码,并执行语音呼叫。本发明实施例提供的基于语音识别的语音呼叫方法和接入网关,通过接入网关识别用户的呼叫语音,能够从呼叫语音中识别获得被叫号码,基于识别获得的被叫号码,从而与被叫进行语音通话。由于无需用户逐位按下话机上与被叫号码对应的一连串按键,因此能够简化语音呼叫流程,实现快速呼叫被叫号码的目的,同时由于避免了用户操作按键,因此能够适应残疾人或手脚不便的老年人这类特定人群的需求,提升了用户体验。

权利要求书

1.  一种基于语音识别的语音呼叫方法,其特征在于,包括:
接入网关获取用户输入的呼叫语音,所述呼叫语音包括被叫方信息;
所述接入网关根据所述呼叫语音,识别获得被叫号码,并执行语音呼叫。

2.
  根据权利要求1所述的方法,其特征在于,所述呼叫语音包括下述至少一项:被叫号码的自然语言、被叫姓名的自然语言以及被叫短号的自然语言;
其中,在所述呼叫语音为被叫姓名的自然语言时,所述接入网关中预先配置有电子通讯录,所述电子通讯录包括被叫姓名和被叫号码的第一映射关系;
在所述呼叫语音为被叫短号的自然语言时,接入网关中预置被叫号码和被叫短号的第二映射关系。

3.
  根据权利要求2所述的方法,其特征在于,所述接入网关根据所述呼叫语音,识别获得被叫号码,包括:
所述接入网关将所述呼叫语音进行模数转换,并进行语音预处理;
所述接入网关从经语音预处理后的呼叫语音中获取语音特征;
所述接入网关在预设语音模型库中匹配所述语音特征,确定与所述语音特征对应的语音模板;
所述接入网关根据所述语音模板,利用预设语音库中的语音查询表,得到被叫号码。

4.
  根据权利要求3所述的方法,其特征在于,所述接入网关根据所述语音模板,利用预设语音库中的语音查询表,得到被叫号码,包括:
所述接入网关根据所述语音模板,利用预设语音库中的语音查询表,识别获得被叫姓名;
所述接入网关利用所述第一映射关系,得到被叫号码;或
所述接入网关根据所述语音模板,利用预设语音库中的语音查询表,识别 获得被叫短号;
所述接入网关利用所述第二映射关系,得到被叫号码。

5.
  根据权利要求3或4所述的方法,其特征在于,所述语音预处理包括:数字滤波处理、预加重处理、加窗分帧处理和端点检测处理。

6.
  根据权利要求3或4所述的方法,其特征在于,在接入网关获取用户输入的呼叫语音之前,还包括:
接入网关获取用户通过话机按键输入的按键值;
接入网关在预配置的语音识别业务键号码表中匹配所述按键值,如果匹配成功,则触发获取用户输入的呼叫语音的操作。

7.
  根据权利要求3或4所述的方法,其特征在于,接入网关获取用户输入的呼叫语音,包括:
接入网关按预设数图DigitMap收号规则或预设拨号计划DialPlan收号规则获取用户输入的呼叫语音,其中所述DigitMap收号规则包括:首位拨号定时器的时长、位间定时器的时长。

8.
  一种基于语音识别的接入网关,其特征在于,包括:
呼叫语音获取模块,用于获取用户输入的呼叫语音,所述呼叫语音包括被叫方信息;
语音呼叫模块,用于根据所述呼叫语音,识别获得被叫号码,并执行语音呼叫。

9.
  根据权利要求8所述的接入网关,其特征在于,所述呼叫语音包括下述至少一项:被叫号码的自然语言、被叫姓名的自然语言以及被叫短号的自然语言;
其中,在所述呼叫语音为被叫姓名的自然语言时,所述接入网关中预先配 置有电子通讯录,所述电子通讯录包括被叫姓名和被叫号码的第一映射关系;
在所述呼叫语音为被叫短号的自然语言时,接入网关中预置被叫号码和被叫短号的第二映射关系。

10.
  根据权利要求9所述的接入网关,其特征在于,语音呼叫模块包括:
预处理单元,用于将所述呼叫语音进行模数转换,并进行语音预处理;
语音特征获取单元,用于从经语音预处理后的呼叫语音中获取语音特征;
语音特征匹配单元,用于在预设语音模型库中匹配所述语音特征,确定与所述语音特征对应的语音模板;
被叫号码获取单元,用于根据所述语音模板,利用预设语音库中的语音查询表,得到被叫号码。

说明书

基于语音识别的语音呼叫方法和接入网关
技术领域
本发明实施例涉及通信技术领域,尤其涉及一种基于语音识别的语音呼叫方法和接入网关。
背景技术
近几年,随着国家大力提倡的“宽带中国”和“最后一公里”建设,大量的接入网关应运而生。随着2013年工业和信息化部提出新建小区必须实施光纤到户的规定,接入网关作为最后一公里,与终端用户的关系更加紧密;特别是语音业务,作为运营商提供的最基本业务,目前使用最为广泛。以家庭网关为例,家庭网关与用户的终端设备接触紧密,用于将家庭内部的所有终端设备与外部的所有接入网连接。例如,如果某一家庭要通过家庭内的话机与外界终端进行语音通话,则需要通过家庭网关接入网络后与外界终端进行语音通话。
现有技术中,话机通过家庭网关进行语音呼叫时,首先在用户摘机后,由用户通过操作话机按键拨被叫号码,然后话机通过家庭网关发起语音呼叫请求,最终接通被叫终端,从而实现与被叫语音通话的目的。
上述语音呼叫技术存在以下缺陷:由于需要用户操作话机按键拨被叫号码,也即需要用户逐位按下话机上与被叫号码对应的一连串按键,尤其是对于被叫是手机用户、外市或外国用户,对应的被叫号码通常在11位以上,需要在话机上按11个以上的按键,操作过程繁琐,容易出错;而且一旦按错一个键,就得挂机后重新摘机拨号呼叫,既不方便又耗费大量时间。此外,这种通过按键实现语音呼出的方式无法适应残疾人或手脚不便的老年人等特定人群的需求。
发明内容
本发明实施例提供一种基于语音识别的语音呼叫方法和接入网关,以简化语音呼叫流程、实现快速呼叫被叫号码的目的,并提升用户体验。
第一方面,本发明实施例提供了一种基于语音识别的语音呼叫方法,包括:
获取用户输入的呼叫语音,所述呼叫语音包括被叫方信息;
根据所述呼叫语音,识别获得被叫号码,并执行语音呼叫。
第二方面,本发明实施例还提供了一种基于语音识别的接入网关,包括:
呼叫语音获取模块,用于获取用户输入的呼叫语音,所述呼叫语音包括被叫方信息;
语音呼叫模块,用于根据所述呼叫语音,识别获得被叫号码,并执行语音呼叫。
本发明实施例提供的基于语音识别的语音呼叫方法和接入网关,通过接入网关识别用户的呼叫语音,能够从呼叫语音中识别获得被叫号码,基于识别获得的被叫号码,从而能够与被叫进行语音通话。由于无需用户逐位按下话机上与被叫号码对应的一连串按键,因此能够简化语音呼叫流程,实现快速呼叫被叫号码的目的,同时由于避免了用户操作按键,因此能够适应残疾人或手脚不便的老年人这类特定人群的需求,提升了用户体验。
附图说明
为了更清楚地说明本发明,下面将对本发明中所需要使用的附图做一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获 得其他的附图。
图1为本发明实施例一提供的一种基于语音识别的语音呼叫方法的流程图;
图2为本发明实施例二提供的一种基于语音识别的语音呼叫方法的流程图;
图3为本发明实施例三提供的一种基于语音识别的语音呼叫方法的流程图;
图4为本发明实施例四提供的一种基于语音识别的语音呼叫方法的流程图;
图5为本发明实施例五提供的一种基于语音识别的语音呼叫方法的流程图;
图6为本发明实施例六提供的一种基于语音识别的接入网关的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施例中的技术方案作进一步详细描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。可以理解的是,此处所描述的具体实施例仅用于解释本发明,而非对本发明的限定,基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。
实施例一
请参阅图1,为本发明实施例一提供的一种基于语音识别的语音呼叫方法的流程图。本发明实施例的方法可以由硬件和/或软件实现的语音呼叫装置来执行,该实现装置典型的是配置在接入网关设备中,如家庭网关。
如图1所示,所述方法包括:
步骤110、接入网关获取用户输入的呼叫语音,所述呼叫语音包括被叫方信息;
本步骤具体是获取主叫用户输入的包含有被叫方信息的呼叫语音。具体地,主叫用户可以通过话机的话筒或者免提按键输入所述呼叫语音,并将所述呼叫语音发送至接入网关,以使接入网关接收到主叫用户输入的呼叫语音。主叫用于也可以通过接入网关内置的麦克风或功放设备输入所述呼叫语音。
所述呼叫语音可以有多种实施方式,例如包括下述至少一项:被叫号码的自然语言、被叫姓名的自然语言以及被叫短号的自然语言。
具体地,被叫号码的自然语音包括被叫方信息,也即被叫号码。被叫号码的自然语音是所述呼叫语音中常见的一种语音形式,例如主叫用户在摘机后通过话机的话筒说出被叫方的手机号码“13012345678”,则主叫用户的语音“13012345678”即为被叫号码的自然语音。
其中,在所述呼叫语音为被叫姓名的自然语言时,所述接入网关中预先配置有电子通讯录,所述电子通讯录包括被叫姓名和被叫号码的第一映射关系。具体地,被叫姓名的自然语言包括被叫方信息,也即被叫姓名。
例如,主叫用户在摘机后通过话机的话筒说出被叫方的姓名“黄小明”,则主叫用户的语音“黄小明”即为被叫姓名的自然语言。
其中,电子通讯录是被叫方信息的载体,而电子通讯录具体反映了被叫方的各信息之间的关联关系。所述电子通讯录还可以包括被叫家庭地址和被叫电子邮件地址等。
作为在接入网关中预先配置电子通讯录这一操作的一种可选的实施方式,具体可以包括:
将电子通讯录导入到接入网关,具体地,可以将智能手机中的电子通讯录导入到接入网关;
接入网关解析所述电子通讯录,以得到所述第一映射关系,并所述第一映 射关系存储在接入网关的数据区。
可选地,所述导入到网关中的电子通讯录的格式可以为VCF格式、VCard格式、CSV格式、doc格式或excel格式。优选地,所述导入到网关设备中的电子通讯录的格式为VCF格式、VCard格式或CSV格式,以增加电子通讯录的通用性。
优选地,接入网关在解析所述电子通讯录,以得到所述第一映射关系之后,还可以包括:接入网关将解析后的电子通讯录预先发送至话机。
换言之,主叫用户在摘机后,可以通过话机上的上翻按键和/或下翻按键查看显示在显示屏上的电子通讯录,以确定被叫方;然后通过话机听筒输入被叫姓名的自然语言,例如“黄小明”。
在所述呼叫语音为被叫短号的自然语言时,接入网关中预置被叫号码和被叫短号的第二映射关系,被叫短号的位数可以为1-3。
被叫短号适用于缩位呼叫,具体地,用户可以根据呼叫被叫号码的频率,设置与被叫号码对应的被叫短号,例如,根据用户的行为习惯,可以将呼叫频率较高的被叫号码“13012345678”设置对应的被叫短号“01”,当用户在摘机后通过话机的话筒说出被叫短号“01”时,则主叫用户的语音“01”即为被叫短号的自然语言。
以上以被叫短号的位数为2为例进行说明,需要注意的是,当被叫短号的位数为3位时,不能与现有的常规业务对应的3位号码设置冲突,也即不能将被叫短号设置为“110”、“119”以及“120”等短号。需要说明的是,当被叫为手机用户、外市或外国用户时,对应的被叫号码通常在11位以上,而被叫短号的位数优选为1-3位,便于用户执行呼叫操作。
步骤120、接入网关根据所述呼叫语音,识别获得被叫号码,并执行语音呼 叫。
本步骤具体是通过语音识别,获得被叫号码,然后根据获得的被叫号码进行语音呼叫,以实现与被叫语音通话的目的。
本实施例的技术方案,通过接入网关识别用户的呼叫语音,能够从呼叫语音中识别获得被叫号码,基于识别获得的被叫号码,从而实现语音呼叫。由于无需用户逐位按下话机上与被叫号码对应的一连串按键,因此能够简化语音呼叫流程,实现快速呼叫被叫号码的目的,同时由于避免了用户操作按键,因此能够适应残疾人或手脚不便的老年人这类特定人群的需求,提升了用户体验。
实施例二
请参阅图2,为本发明实施例二提供的一种基于语音识别的语音呼叫方法的流程图。本实施例在上述实施例的基础上,提供了根据所述呼叫语音,识别获得被叫号码的优选方法。本实施例提供的基于语音识别的语音呼叫方法适用于呼叫语音为被叫号码的自然语言。本实施例的方法可以由接入网关执行。
如图2所示,所述方法包括:
步骤210、接入网关获取用户输入的呼叫语音,所述呼叫语音包括被叫方信息;
步骤220、接入网关将所述呼叫语音进行模数转换,并进行语音预处理;
本步骤具体是在对所述呼叫语音进行语音预处理之前,进行模数转换,也即将用户的自然语言从模拟信号转换为数字电信号;然后进行语音预处理。
优选地,所述语音预处理包括:数字滤波处理、预加重处理、加窗分帧处理和端点检测处理。
其中,数字滤波处理是利用离散时间系统的特性对所述数字电信号的波形 进行滤波处理,以降低噪声,使得输出信号的频谱变得平坦。
本领域的技术人员可以理解,在很高的频率(GHz以上)下,高频信号在传输中的衰减很明显,为了补偿传输中的高频信号衰减,可以采取信号预加重方法,对传输信号中的高频部分进行补偿,使得接收到的高频和低频信号的幅度一致。
加窗处理是使原本没有周期性的语音信号呈现出周期性的语音特征,同时也避免出现吉布斯效应。其中,吉布斯效应是当用信号的谐波分量的和来表述具有间断点的波形时出现,并能够观察的现象。
本领域的技术人员可以理解,语音端点检测是语音识别是否正确的关键技术之一,可以在语音识别中提高识别精度及减少识别时间。常用语音端点检测方法包括能量法、过零率法和相关系数法等。
步骤230、接入网关从经语音预处理后的呼叫语音中获取语音特征;
语音特征主要是指语音特征参数,包括线性预测倒谱系数、MF2CC(美尔倒谱系数)、小波分析的特征参数。这些参数本质上是一个个语音的帧。也就是说,利用短时傅立叶分析,将预处理后的语音信号分割成10-20ms的帧,或者通过小波分析获取语音特征。
步骤240、接入网关在预设语音模型库中匹配所述语音特征,确定与所述语音特征对应的语音模板;
其中,语音模型库中既包括语音模板,也包括语音查询表,所述语音查询库中包括所述语音模板与对应的字段。在本实施例中所述对应的字段为数字。
在本步骤中,优选将匹配度最高的语音模板作为与所述语音特征对应的语音模板。
步骤250、接入网关根据所述语音模板,利用预设语音库中的语音查询表,得到被叫号码,并执行语音呼叫。
本步骤具体是根据匹配到的最优语音模板,以及语音查询表,将语音查询表中与匹配到的最优语音模板对应的字段作为被叫号码,从而得到用户输入的呼叫语音的识别结果,然后执行语音呼叫,进行实现与被叫语音通话的目的。
例如,用户输入的呼叫语音为“13012345678”的自然语言,通过本实施例的方法可以匹配到最优的语音模板,通过在语音查询库中查询,识别到与最优语音模板对应的字段为“13012345678”,即得到了被叫号码。
本实施例中,可以采用上述离线语音识别方式,即接入网关通过自身的离线语音模型库进行识别呼叫语音,也可以采用在线语音识别方式。区别在于:在线语音识别时,需要建立接入网关与能够提供语音识别功能的服务器之间的连接链路,通过所述服务器实现呼叫语音识别,然后接入网关基于所述识别结果执行语音呼叫。
本实施例的技术方案,在接入网关获取用户的呼叫语音之后,接入网关通过从经模数转换和语音预处理后的呼叫语音中提取特征,并进行特征匹配,能够识别用户的呼叫语音,并根据匹配结果从呼叫语音中识别获得被叫号码,基于识别获得的被叫号码,从而实现语音呼叫。由于无需用户逐位按下话机上与被叫号码对应的一连串按键,因此能够简化语音呼叫流程,实现快速呼叫被叫号码的目的,同时由于避免了用户操作按键,因此能够适应残疾人或手脚不便的老年人这类特定人群的需求,提升了用户体验。
实施例三
请参阅图3,为本发明实施例三提供的一种基于语音识别的语音呼叫方法的流程图。本发明在上述实施例的基础上,提供了根据所述语音模板,利用预设语音库中的语音查询表,得到被叫号码的优选方案。本实施例提供的基于语音 识别的语音呼叫方法适用于呼叫语音为被叫姓名的自然语言。本实施例方法可以由接入网关执行。
如图3所示,所述优选方法包括:
步骤310、接入网关根据所述语音模板,利用预设语音库中的语音查询表,识别获得被叫姓名;
与上述实施例的区别在于:第一,本实施例中用户输入的呼叫语音为被叫姓名的自然语言;而上述实施例中用户输入的呼叫语音为被叫号码的自然语言。第二,本实施例中语音查询库既包括语音模板,也包括语音查询表,所述语音查询库中包括所述语音模板与对应的字段,其中对应的字段为汉字;而上述实施例中语音模型库中既包括语音模板,也包括语音查询表,所述语音查询库中包括所述语音模板与对应的字段,其中所述对应的字段为数字。第三,本实施例中所述接入网关中预先配置有电子通讯录,所述电子通讯录包括被叫姓名和被叫号码的第一映射关系。
作为在接入网关中预先配置电子通讯录这一操作的一种可选的实施方式,具体可以包括:将电子通讯录导入到接入网关,具体地,可以将智能手机中的电子通讯录导入到接入网关;接入网关解析所述电子通讯录,以得到所述第一映射关系,并所述第一映射关系存储在接入网关的数据区。
进一步优选地,在接入网关解析所述电子通讯录,以得到所述第一映射关系之后,还可以包括:接入网关将解析后的电子通讯录预先发送至话机。
换言之,主叫用户在摘机后,可以通过话机上的上翻按键和/或下翻按键查看显示在显示屏上的电子通讯录,以确定被叫方;然后通过话机听筒输入被叫姓名的自然语言。
第四,本实施例中接入网关的识别结果为与呼叫语音对应的被叫姓名;而 上述实施例中接入网关的识别结果为与呼叫语音对应的被叫号码。
步骤320、接入网关利用所述第一映射关系,得到被叫号码,并执行语音呼叫。
本步骤具体是根据匹配到的最优语音模板,以及语音查询表,将语音查询表中与匹配到的最优语音模板对应的字段作为被叫姓名,并利用接入网关中存储的所述第一映射关系得到被叫号码,然后执行语音呼叫,进行实现与被叫语音通话的目的。
需要说明的是,接入网关中存储通过解析获得的所述第一映射关系,以在接入网关识别到所述被叫姓名的自然语言对应的被叫姓名后,基于预先存储的所述第一映射关系,从而得到与被叫姓名对应的被叫号码,进而执行语音呼叫。
优选地,在接入网关解析所述电子通讯录,以得到所述第一映射关系之后,还可以包括:接入网关将解析后的电子通讯录预先发送至话机,以使主叫用户在摘机后,可以通过话机上的上翻按键和/或下翻按键查看显示在显示屏上的电子通讯录,从而确定被叫方。
实施例四
请参阅图4,为本发明实施例四提供的一种基于语音识别的语音呼叫方法的流程图。本发明在实施例二的基础上,提供了根据所述语音模板,利用预设语音库中的语音查询表,得到被叫号码的优选方案。本实施例提供的基于语音识别的语音呼叫方法适用于呼叫语音为被叫短号的自然语言。本实施例的方法可以由接入网关执行。
如图4所示,所述优选方法包括:
步骤410、接入网关根据所述语音模板,利用预设语音库中的语音查询表, 识别获得被叫短号;
本实施例在于实施例二的区别在于:第一,本实施例中用户输入的呼叫语音为被叫短号的自然语言;而实施例二中用户输入的呼叫语音为被叫号码的自然语言。第二,本实施例中接入网关中预置被叫号码和被叫短号的第二映射关系,被叫短号的位数可以为1-3。第三,本实施例中接入网关的识别结果为与呼入语音对应的被叫短号;而实施例二中接入网关的识别结果为与呼入语音对应的被叫号码。
步骤420、接入网关利用所述第二映射关系,得到被叫号码,并执行语音呼叫。
本步骤具体是根据匹配到的最优语音模板,以及语音查询表,将语音查询表中与匹配到的最优语音模板对应的字段作为被叫短号,并利用接入网关中存储的所述第二映射关系得到被叫号码,然后执行语音呼叫,进行实现与被叫语音通话的目的。
需要说明的是,接入网关中预置的所述第二映射关系,以在接入网关识别到所述被叫短号的自然语言对应的被叫短号后,基于所述第二映射关系,能够得到与被叫短号对应的被叫号码,进而执行语音呼叫。
优选地,接入网关可以将所述第二映射关系发送至话机,也即,所述第二映射关系预置在话机中,以使主叫用户在摘机后,可以通过操作话机上的1-3位按键,能够采用传统的按键呼叫方式实现与被叫语音通话的目的。也即,被叫短号的自然语音的呼叫方式可以与传统的按键呼叫方式兼容应用,主叫用户可以根据自身的呼叫习惯和实际需求,决定采用哪种呼叫方式,简化了呼叫流程,并增加了呼叫的灵活性。
实施例五
请参阅图5,为本发明实施例五提供的一种基于语音识别的语音呼叫方法的流程图。本实施例在上述各实施例的基础上,提供了获取用户输入的呼叫语音的优选方案。如图5所示,所述优选方法包括:
步骤510、接入网关获取用户通过话机按键输入的按键值;
步骤520、接入网关在预配置的语音识别业务键号码表中匹配所述按键值,如果匹配成功,则触发获取用户输入的呼叫语音的操作。
用户通过话机输入的按键值,传输至接入网关,如果用户输入的按键值与接入网关预配置的语音识别业务键号码表匹配一致,则接入网关触发获取用户的呼叫语音以及语音识别流程,即接入网关将此后从话机接收到的语音作为呼叫语音进行识别。接入网关也可以显式地向话机发送启动语音识别的指令,控制话机向用户提示,可以开始输入语音信息。
其中,话机与接入网关一般是通过POTS口连接。
示例性的,接入网关预配置的语音识别业务键号码表中语音识别业务键设置为*#,那么当用户摘机并且依次按下*#按键,则匹配成功。
需要说明的是,如果匹配失败,可以将该匹配结果返回话机,以提示用户,例如通过在话机听筒播放“请重新输入”的语音提示,或在话机的显示屏显示“输入失败”或“请重新输入”的提示。
除了上述通过话机上的按键值进行触发操作之外,还可以通过用户与话机之间的交互进行触发,例如语音交互,或者触摸话机的显示频的设定区域的方式进行触发,所述设定区域可以预先设定为语音获取区域。
本实施例的技术方案,在获取用户输入的按键值之后,通过在预配置的语音识别业务键号码表中匹配所述按键值,并根据匹配结果决定是否触发获取用 户输入的呼叫语音以及语音识别的操作。
在本实施例的基础上,接入网关获取用户输入的呼叫语音优选包括:
接入网关按预设DigitMap(数图)收号规则或预设DialPlan(拨叫计划)收号规则获取用户输入的呼叫语音,其中所述DigitMap收号规则包括:首位拨号定时器的时长、位间定时器的时长。
换言之,本优选方案具体是通过所述DigitMap收号规则或所述DialPlan收号规则获取用户的呼叫语音。
以DigitMap收号规则为例进行说明。
首位拨号定时器、位间定时器用在用户摘机到呼叫结束的不同阶段。具体地可以有多种实施方式,下面介绍其中两种。
方式一、摘机到输入呼叫语音前的阶段由首位拨号定时器控制,如果在首位拨号定时器的时长(例如15s)内,用户没有输入呼叫语音,则接入网关向话机下发催挂音或忙音提示。如果在首位拨号定时器的时长内,用户开始输入呼叫语音,接入网关则启用位间定时器,当用户的呼叫语音停顿间隔时长超过位间定时器的时长(比如5s),接入网关对呼叫语音进行语音识别,也即对之前的语音进行一次识别,然后进行后续呼出流程。
方式二、摘机到输入呼叫语音前的阶段由首位拨号定时器控制,如果在首位拨号定时器的时长(例如15s)内,用户没有输入呼叫语音,则接入网关向话机下发催挂音或忙音提示。如果在首位拨号定时器的时长内,用户开始输入呼叫语音,接入网关进行实时语音识别,例如,用户输入一位呼叫语音,接入网关就进行一次语音识别,同时启用位间定时器,当用户的呼叫语音停顿间隔时长超过位间定时器的时长(比如5s),则进行后续呼出流程。
方式一和方式二的区别在于:接入网关进行语音识别的时间点不同,进行 语音识别的次数不同。
换言之,用户通过呼叫语音与被叫进行语音通话过程中,是以预先配置的各个定时器的时长为依据,决定是否结束收取用户的呼叫语音以便执行识别流程。
需要说明的是,各定时器的时长可通过配置来设置和更改。
实施例六
请参阅图6,为本发明实施例六提供的一种基于语音识别的接入网关的结构示意图。所述接入网关包括:呼叫语音获取模块610和语音呼叫模块620。
其中,呼叫语音获取模块610用于获取用户输入的呼叫语音,所述呼叫语音包括被叫方信息;语音呼叫模块620用于根据所述呼叫语音,识别获得被叫号码,并执行语音呼叫。
本实施例的技术方案,通过识别用户的呼叫语音,能够从呼叫语音中识别获得被叫号码,基于识别获得的被叫号码,从而实现语音呼叫。由于无需用户逐位按下话机上与被叫号码对应的一连串按键,因此能够简化语音呼叫流程,实现快速呼叫被叫号码的目的,同时由于避免了用户操作按键,因此能够适应残疾人或手脚不便的老年人这类特定人群的需求,提升了用户体验。
在上述方案中,所述呼叫语音包括下述至少一项:被叫号码的自然语言、被叫姓名的自然语言以及被叫短号的自然语言;
其中,在所述呼叫语音为被叫姓名的自然语言时,所述接入网关中预先配置有电子通讯录,所述电子通讯录包括被叫姓名和被叫号码的第一映射关系;
在所述呼叫语音为被叫短号的自然语言时,接入网关中预置被叫号码和被叫短号的第二映射关系,被叫短号的位数可以为1-3。
在上述方案中,语音呼叫模块620优选包括:预处理单元、语音特征获取单元、语音特征匹配单元和被叫号码获取单元。
其中,预处理单元用于将所述呼叫语音进行模数转换,并进行语音预处理;语音特征获取单元用于从经语音预处理后的呼叫语音中获取语音特征;语音特征匹配单元用于在预设语音模型库中匹配所述语音特征,确定与所述语音特征对应的语音模板;被叫号码获取单元用于根据所述语音模板,利用预设语音库中的语音查询表,得到被叫号码。
作为被叫号码获取单元的一种优选的实施方式,所述被叫号码获取单元优选包括:第一识别子单元和第一映射子单元。
其中,第一识别子单元用于根据所述语音模板,利用预设语音库中的语音查询表,识别获得被叫姓名;第一映射子单元用于利用所述第一映射关系,得到被叫号码。
作为被叫号码获取单元的另一种优选的实施方式,所述被叫号码获取单元优选包括:第二识别子单元和第二映射子单元。
其中,第二识别子单元用于根据所述语音模板,利用预设语音库中的语音查询表,识别获得被叫短号;第二映射子单元用于利用所述第二映射关系,得到被叫号码。
在上述方案中,所述语音预处理包括:数字滤波处理、预加重处理、加窗分帧处理和端点检测处理。
作为本实施例的一种优选的实施方式,该装置还可以包括:按键值获取模块和触发模块。
其中,按键值获取模块用于在获取用户输入的呼叫语音之前,获取用户通过话机按键输入的按键值;触发模块用于在预配置的语音识别业务键号码表中 匹配所述按键值,如果匹配成功,则触发获取用户输入的呼叫语音的操作。
在上述方案中,呼叫语音获取模块610具体用于:
按预设DigitMap收号规则或预设DialPlan收号规则获取用户输入的呼叫语音,其中所述DigitMap收号规则包括:首位拨号定时器的时长、位间定时器的时长。
本发明实施例提供的基于语音识别的接入网关可执行本发明任意实施例所提供的基于语音识别的语音呼叫方法,具备执行方法相应的功能模块和有益效果。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用于说明本发明的技术方案,而非对其进行限制;实施例中优选的实施方式,并非对其进行限制,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

基于语音识别的语音呼叫方法和接入网关.pdf_第1页
第1页 / 共15页
基于语音识别的语音呼叫方法和接入网关.pdf_第2页
第2页 / 共15页
基于语音识别的语音呼叫方法和接入网关.pdf_第3页
第3页 / 共15页
点击查看更多>>
资源描述

《基于语音识别的语音呼叫方法和接入网关.pdf》由会员分享,可在线阅读,更多相关《基于语音识别的语音呼叫方法和接入网关.pdf(15页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN104092829A43申请公布日20141008CN104092829A21申请号201410347198022申请日20140721H04M1/725200601H04M1/27200601H04M7/0020060171申请人苏州工业园区服务外包职业学院地址215000江苏省苏州市工业园区独墅湖高教区若水路99号72发明人商琦曹纪清伏玉琛74专利代理机构北京品源专利代理有限公司11332代理人胡彬邓猛烈54发明名称基于语音识别的语音呼叫方法和接入网关57摘要本发明实施例提供一种基于语音识别的语音呼叫方法和接入网关。该方法包括接入网关获取用户输入的呼叫语音,所述呼叫语音包。

2、括被叫方信息;接入网关根据所述呼叫语音,识别获得被叫号码,并执行语音呼叫。本发明实施例提供的基于语音识别的语音呼叫方法和接入网关,通过接入网关识别用户的呼叫语音,能够从呼叫语音中识别获得被叫号码,基于识别获得的被叫号码,从而与被叫进行语音通话。由于无需用户逐位按下话机上与被叫号码对应的一连串按键,因此能够简化语音呼叫流程,实现快速呼叫被叫号码的目的,同时由于避免了用户操作按键,因此能够适应残疾人或手脚不便的老年人这类特定人群的需求,提升了用户体验。51INTCL权利要求书2页说明书9页附图3页19中华人民共和国国家知识产权局12发明专利申请权利要求书2页说明书9页附图3页10申请公布号CN10。

3、4092829ACN104092829A1/2页21一种基于语音识别的语音呼叫方法,其特征在于,包括接入网关获取用户输入的呼叫语音,所述呼叫语音包括被叫方信息;所述接入网关根据所述呼叫语音,识别获得被叫号码,并执行语音呼叫。2根据权利要求1所述的方法,其特征在于,所述呼叫语音包括下述至少一项被叫号码的自然语言、被叫姓名的自然语言以及被叫短号的自然语言;其中,在所述呼叫语音为被叫姓名的自然语言时,所述接入网关中预先配置有电子通讯录,所述电子通讯录包括被叫姓名和被叫号码的第一映射关系;在所述呼叫语音为被叫短号的自然语言时,接入网关中预置被叫号码和被叫短号的第二映射关系。3根据权利要求2所述的方法,。

4、其特征在于,所述接入网关根据所述呼叫语音,识别获得被叫号码,包括所述接入网关将所述呼叫语音进行模数转换,并进行语音预处理;所述接入网关从经语音预处理后的呼叫语音中获取语音特征;所述接入网关在预设语音模型库中匹配所述语音特征,确定与所述语音特征对应的语音模板;所述接入网关根据所述语音模板,利用预设语音库中的语音查询表,得到被叫号码。4根据权利要求3所述的方法,其特征在于,所述接入网关根据所述语音模板,利用预设语音库中的语音查询表,得到被叫号码,包括所述接入网关根据所述语音模板,利用预设语音库中的语音查询表,识别获得被叫姓名;所述接入网关利用所述第一映射关系,得到被叫号码;或所述接入网关根据所述语。

5、音模板,利用预设语音库中的语音查询表,识别获得被叫短号;所述接入网关利用所述第二映射关系,得到被叫号码。5根据权利要求3或4所述的方法,其特征在于,所述语音预处理包括数字滤波处理、预加重处理、加窗分帧处理和端点检测处理。6根据权利要求3或4所述的方法,其特征在于,在接入网关获取用户输入的呼叫语音之前,还包括接入网关获取用户通过话机按键输入的按键值;接入网关在预配置的语音识别业务键号码表中匹配所述按键值,如果匹配成功,则触发获取用户输入的呼叫语音的操作。7根据权利要求3或4所述的方法,其特征在于,接入网关获取用户输入的呼叫语音,包括接入网关按预设数图DIGITMAP收号规则或预设拨号计划DIAL。

6、PLAN收号规则获取用户输入的呼叫语音,其中所述DIGITMAP收号规则包括首位拨号定时器的时长、位间定时器的时长。8一种基于语音识别的接入网关,其特征在于,包括呼叫语音获取模块,用于获取用户输入的呼叫语音,所述呼叫语音包括被叫方信息;语音呼叫模块,用于根据所述呼叫语音,识别获得被叫号码,并执行语音呼叫。权利要求书CN104092829A2/2页39根据权利要求8所述的接入网关,其特征在于,所述呼叫语音包括下述至少一项被叫号码的自然语言、被叫姓名的自然语言以及被叫短号的自然语言;其中,在所述呼叫语音为被叫姓名的自然语言时,所述接入网关中预先配置有电子通讯录,所述电子通讯录包括被叫姓名和被叫号码。

7、的第一映射关系;在所述呼叫语音为被叫短号的自然语言时,接入网关中预置被叫号码和被叫短号的第二映射关系。10根据权利要求9所述的接入网关,其特征在于,语音呼叫模块包括预处理单元,用于将所述呼叫语音进行模数转换,并进行语音预处理;语音特征获取单元,用于从经语音预处理后的呼叫语音中获取语音特征;语音特征匹配单元,用于在预设语音模型库中匹配所述语音特征,确定与所述语音特征对应的语音模板;被叫号码获取单元,用于根据所述语音模板,利用预设语音库中的语音查询表,得到被叫号码。权利要求书CN104092829A1/9页4基于语音识别的语音呼叫方法和接入网关技术领域0001本发明实施例涉及通信技术领域,尤其涉及。

8、一种基于语音识别的语音呼叫方法和接入网关。背景技术0002近几年,随着国家大力提倡的“宽带中国”和“最后一公里”建设,大量的接入网关应运而生。随着2013年工业和信息化部提出新建小区必须实施光纤到户的规定,接入网关作为最后一公里,与终端用户的关系更加紧密;特别是语音业务,作为运营商提供的最基本业务,目前使用最为广泛。以家庭网关为例,家庭网关与用户的终端设备接触紧密,用于将家庭内部的所有终端设备与外部的所有接入网连接。例如,如果某一家庭要通过家庭内的话机与外界终端进行语音通话,则需要通过家庭网关接入网络后与外界终端进行语音通话。0003现有技术中,话机通过家庭网关进行语音呼叫时,首先在用户摘机后。

9、,由用户通过操作话机按键拨被叫号码,然后话机通过家庭网关发起语音呼叫请求,最终接通被叫终端,从而实现与被叫语音通话的目的。0004上述语音呼叫技术存在以下缺陷由于需要用户操作话机按键拨被叫号码,也即需要用户逐位按下话机上与被叫号码对应的一连串按键,尤其是对于被叫是手机用户、外市或外国用户,对应的被叫号码通常在11位以上,需要在话机上按11个以上的按键,操作过程繁琐,容易出错;而且一旦按错一个键,就得挂机后重新摘机拨号呼叫,既不方便又耗费大量时间。此外,这种通过按键实现语音呼出的方式无法适应残疾人或手脚不便的老年人等特定人群的需求。发明内容0005本发明实施例提供一种基于语音识别的语音呼叫方法和。

10、接入网关,以简化语音呼叫流程、实现快速呼叫被叫号码的目的,并提升用户体验。0006第一方面,本发明实施例提供了一种基于语音识别的语音呼叫方法,包括0007获取用户输入的呼叫语音,所述呼叫语音包括被叫方信息;0008根据所述呼叫语音,识别获得被叫号码,并执行语音呼叫。0009第二方面,本发明实施例还提供了一种基于语音识别的接入网关,包括0010呼叫语音获取模块,用于获取用户输入的呼叫语音,所述呼叫语音包括被叫方信息;0011语音呼叫模块,用于根据所述呼叫语音,识别获得被叫号码,并执行语音呼叫。0012本发明实施例提供的基于语音识别的语音呼叫方法和接入网关,通过接入网关识别用户的呼叫语音,能够从呼。

11、叫语音中识别获得被叫号码,基于识别获得的被叫号码,从而能够与被叫进行语音通话。由于无需用户逐位按下话机上与被叫号码对应的一连串按键,因此能够简化语音呼叫流程,实现快速呼叫被叫号码的目的,同时由于避免了用户操作按说明书CN104092829A2/9页5键,因此能够适应残疾人或手脚不便的老年人这类特定人群的需求,提升了用户体验。附图说明0013为了更清楚地说明本发明,下面将对本发明中所需要使用的附图做一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。0014图1为本发明实施例一提供的一种基于语。

12、音识别的语音呼叫方法的流程图;0015图2为本发明实施例二提供的一种基于语音识别的语音呼叫方法的流程图;0016图3为本发明实施例三提供的一种基于语音识别的语音呼叫方法的流程图;0017图4为本发明实施例四提供的一种基于语音识别的语音呼叫方法的流程图;0018图5为本发明实施例五提供的一种基于语音识别的语音呼叫方法的流程图;0019图6为本发明实施例六提供的一种基于语音识别的接入网关的结构示意图。具体实施方式0020为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施例中的技术方案作进一步详细描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。可以理解的是,此处。

13、所描述的具体实施例仅用于解释本发明,而非对本发明的限定,基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。0021实施例一0022请参阅图1,为本发明实施例一提供的一种基于语音识别的语音呼叫方法的流程图。本发明实施例的方法可以由硬件和/或软件实现的语音呼叫装置来执行,该实现装置典型的是配置在接入网关设备中,如家庭网关。0023如图1所示,所述方法包括0024步骤110、接入网关获取用户输入的呼叫语音,所述呼叫语音包括被叫方信息;0025本步骤具体是获取。

14、主叫用户输入的包含有被叫方信息的呼叫语音。具体地,主叫用户可以通过话机的话筒或者免提按键输入所述呼叫语音,并将所述呼叫语音发送至接入网关,以使接入网关接收到主叫用户输入的呼叫语音。主叫用于也可以通过接入网关内置的麦克风或功放设备输入所述呼叫语音。0026所述呼叫语音可以有多种实施方式,例如包括下述至少一项被叫号码的自然语言、被叫姓名的自然语言以及被叫短号的自然语言。0027具体地,被叫号码的自然语音包括被叫方信息,也即被叫号码。被叫号码的自然语音是所述呼叫语音中常见的一种语音形式,例如主叫用户在摘机后通过话机的话筒说出被叫方的手机号码“13012345678”,则主叫用户的语音“1301234。

15、5678”即为被叫号码的自然语音。0028其中,在所述呼叫语音为被叫姓名的自然语言时,所述接入网关中预先配置有电子通讯录,所述电子通讯录包括被叫姓名和被叫号码的第一映射关系。具体地,被叫姓名的自然语言包括被叫方信息,也即被叫姓名。说明书CN104092829A3/9页60029例如,主叫用户在摘机后通过话机的话筒说出被叫方的姓名“黄小明”,则主叫用户的语音“黄小明”即为被叫姓名的自然语言。0030其中,电子通讯录是被叫方信息的载体,而电子通讯录具体反映了被叫方的各信息之间的关联关系。所述电子通讯录还可以包括被叫家庭地址和被叫电子邮件地址等。0031作为在接入网关中预先配置电子通讯录这一操作的一。

16、种可选的实施方式,具体可以包括0032将电子通讯录导入到接入网关,具体地,可以将智能手机中的电子通讯录导入到接入网关;0033接入网关解析所述电子通讯录,以得到所述第一映射关系,并所述第一映射关系存储在接入网关的数据区。0034可选地,所述导入到网关中的电子通讯录的格式可以为VCF格式、VCARD格式、CSV格式、DOC格式或EXCEL格式。优选地,所述导入到网关设备中的电子通讯录的格式为VCF格式、VCARD格式或CSV格式,以增加电子通讯录的通用性。0035优选地,接入网关在解析所述电子通讯录,以得到所述第一映射关系之后,还可以包括接入网关将解析后的电子通讯录预先发送至话机。0036换言之。

17、,主叫用户在摘机后,可以通过话机上的上翻按键和/或下翻按键查看显示在显示屏上的电子通讯录,以确定被叫方;然后通过话机听筒输入被叫姓名的自然语言,例如“黄小明”。0037在所述呼叫语音为被叫短号的自然语言时,接入网关中预置被叫号码和被叫短号的第二映射关系,被叫短号的位数可以为13。0038被叫短号适用于缩位呼叫,具体地,用户可以根据呼叫被叫号码的频率,设置与被叫号码对应的被叫短号,例如,根据用户的行为习惯,可以将呼叫频率较高的被叫号码“13012345678”设置对应的被叫短号“01”,当用户在摘机后通过话机的话筒说出被叫短号“01”时,则主叫用户的语音“01”即为被叫短号的自然语言。0039以。

18、上以被叫短号的位数为2为例进行说明,需要注意的是,当被叫短号的位数为3位时,不能与现有的常规业务对应的3位号码设置冲突,也即不能将被叫短号设置为“110”、“119”以及“120”等短号。需要说明的是,当被叫为手机用户、外市或外国用户时,对应的被叫号码通常在11位以上,而被叫短号的位数优选为13位,便于用户执行呼叫操作。0040步骤120、接入网关根据所述呼叫语音,识别获得被叫号码,并执行语音呼叫。0041本步骤具体是通过语音识别,获得被叫号码,然后根据获得的被叫号码进行语音呼叫,以实现与被叫语音通话的目的。0042本实施例的技术方案,通过接入网关识别用户的呼叫语音,能够从呼叫语音中识别获得被。

19、叫号码,基于识别获得的被叫号码,从而实现语音呼叫。由于无需用户逐位按下话机上与被叫号码对应的一连串按键,因此能够简化语音呼叫流程,实现快速呼叫被叫号码的目的,同时由于避免了用户操作按键,因此能够适应残疾人或手脚不便的老年人这类特定人群的需求,提升了用户体验。0043实施例二0044请参阅图2,为本发明实施例二提供的一种基于语音识别的语音呼叫方法的流程说明书CN104092829A4/9页7图。本实施例在上述实施例的基础上,提供了根据所述呼叫语音,识别获得被叫号码的优选方法。本实施例提供的基于语音识别的语音呼叫方法适用于呼叫语音为被叫号码的自然语言。本实施例的方法可以由接入网关执行。0045如图。

20、2所示,所述方法包括0046步骤210、接入网关获取用户输入的呼叫语音,所述呼叫语音包括被叫方信息;0047步骤220、接入网关将所述呼叫语音进行模数转换,并进行语音预处理;0048本步骤具体是在对所述呼叫语音进行语音预处理之前,进行模数转换,也即将用户的自然语言从模拟信号转换为数字电信号;然后进行语音预处理。0049优选地,所述语音预处理包括数字滤波处理、预加重处理、加窗分帧处理和端点检测处理。0050其中,数字滤波处理是利用离散时间系统的特性对所述数字电信号的波形进行滤波处理,以降低噪声,使得输出信号的频谱变得平坦。0051本领域的技术人员可以理解,在很高的频率GHZ以上下,高频信号在传输。

21、中的衰减很明显,为了补偿传输中的高频信号衰减,可以采取信号预加重方法,对传输信号中的高频部分进行补偿,使得接收到的高频和低频信号的幅度一致。0052加窗处理是使原本没有周期性的语音信号呈现出周期性的语音特征,同时也避免出现吉布斯效应。其中,吉布斯效应是当用信号的谐波分量的和来表述具有间断点的波形时出现,并能够观察的现象。0053本领域的技术人员可以理解,语音端点检测是语音识别是否正确的关键技术之一,可以在语音识别中提高识别精度及减少识别时间。常用语音端点检测方法包括能量法、过零率法和相关系数法等。0054步骤230、接入网关从经语音预处理后的呼叫语音中获取语音特征;0055语音特征主要是指语音。

22、特征参数,包括线性预测倒谱系数、MF2CC美尔倒谱系数、小波分析的特征参数。这些参数本质上是一个个语音的帧。也就是说,利用短时傅立叶分析,将预处理后的语音信号分割成1020MS的帧,或者通过小波分析获取语音特征。0056步骤240、接入网关在预设语音模型库中匹配所述语音特征,确定与所述语音特征对应的语音模板;0057其中,语音模型库中既包括语音模板,也包括语音查询表,所述语音查询库中包括所述语音模板与对应的字段。在本实施例中所述对应的字段为数字。0058在本步骤中,优选将匹配度最高的语音模板作为与所述语音特征对应的语音模板。0059步骤250、接入网关根据所述语音模板,利用预设语音库中的语音查。

23、询表,得到被叫号码,并执行语音呼叫。0060本步骤具体是根据匹配到的最优语音模板,以及语音查询表,将语音查询表中与匹配到的最优语音模板对应的字段作为被叫号码,从而得到用户输入的呼叫语音的识别结果,然后执行语音呼叫,进行实现与被叫语音通话的目的。0061例如,用户输入的呼叫语音为“13012345678”的自然语言,通过本实施例的方法可以匹配到最优的语音模板,通过在语音查询库中查询,识别到与最优语音模板对应的字段为“13012345678”,即得到了被叫号码。说明书CN104092829A5/9页80062本实施例中,可以采用上述离线语音识别方式,即接入网关通过自身的离线语音模型库进行识别呼叫语。

24、音,也可以采用在线语音识别方式。区别在于在线语音识别时,需要建立接入网关与能够提供语音识别功能的服务器之间的连接链路,通过所述服务器实现呼叫语音识别,然后接入网关基于所述识别结果执行语音呼叫。0063本实施例的技术方案,在接入网关获取用户的呼叫语音之后,接入网关通过从经模数转换和语音预处理后的呼叫语音中提取特征,并进行特征匹配,能够识别用户的呼叫语音,并根据匹配结果从呼叫语音中识别获得被叫号码,基于识别获得的被叫号码,从而实现语音呼叫。由于无需用户逐位按下话机上与被叫号码对应的一连串按键,因此能够简化语音呼叫流程,实现快速呼叫被叫号码的目的,同时由于避免了用户操作按键,因此能够适应残疾人或手脚。

25、不便的老年人这类特定人群的需求,提升了用户体验。0064实施例三0065请参阅图3,为本发明实施例三提供的一种基于语音识别的语音呼叫方法的流程图。本发明在上述实施例的基础上,提供了根据所述语音模板,利用预设语音库中的语音查询表,得到被叫号码的优选方案。本实施例提供的基于语音识别的语音呼叫方法适用于呼叫语音为被叫姓名的自然语言。本实施例方法可以由接入网关执行。0066如图3所示,所述优选方法包括0067步骤310、接入网关根据所述语音模板,利用预设语音库中的语音查询表,识别获得被叫姓名;0068与上述实施例的区别在于第一,本实施例中用户输入的呼叫语音为被叫姓名的自然语言;而上述实施例中用户输入的。

26、呼叫语音为被叫号码的自然语言。第二,本实施例中语音查询库既包括语音模板,也包括语音查询表,所述语音查询库中包括所述语音模板与对应的字段,其中对应的字段为汉字;而上述实施例中语音模型库中既包括语音模板,也包括语音查询表,所述语音查询库中包括所述语音模板与对应的字段,其中所述对应的字段为数字。第三,本实施例中所述接入网关中预先配置有电子通讯录,所述电子通讯录包括被叫姓名和被叫号码的第一映射关系。0069作为在接入网关中预先配置电子通讯录这一操作的一种可选的实施方式,具体可以包括将电子通讯录导入到接入网关,具体地,可以将智能手机中的电子通讯录导入到接入网关;接入网关解析所述电子通讯录,以得到所述第一。

27、映射关系,并所述第一映射关系存储在接入网关的数据区。0070进一步优选地,在接入网关解析所述电子通讯录,以得到所述第一映射关系之后,还可以包括接入网关将解析后的电子通讯录预先发送至话机。0071换言之,主叫用户在摘机后,可以通过话机上的上翻按键和/或下翻按键查看显示在显示屏上的电子通讯录,以确定被叫方;然后通过话机听筒输入被叫姓名的自然语言。0072第四,本实施例中接入网关的识别结果为与呼叫语音对应的被叫姓名;而上述实施例中接入网关的识别结果为与呼叫语音对应的被叫号码。0073步骤320、接入网关利用所述第一映射关系,得到被叫号码,并执行语音呼叫。0074本步骤具体是根据匹配到的最优语音模板,。

28、以及语音查询表,将语音查询表中与匹配到的最优语音模板对应的字段作为被叫姓名,并利用接入网关中存储的所述第一映射关系得到被叫号码,然后执行语音呼叫,进行实现与被叫语音通话的目的。说明书CN104092829A6/9页90075需要说明的是,接入网关中存储通过解析获得的所述第一映射关系,以在接入网关识别到所述被叫姓名的自然语言对应的被叫姓名后,基于预先存储的所述第一映射关系,从而得到与被叫姓名对应的被叫号码,进而执行语音呼叫。0076优选地,在接入网关解析所述电子通讯录,以得到所述第一映射关系之后,还可以包括接入网关将解析后的电子通讯录预先发送至话机,以使主叫用户在摘机后,可以通过话机上的上翻按键。

29、和/或下翻按键查看显示在显示屏上的电子通讯录,从而确定被叫方。0077实施例四0078请参阅图4,为本发明实施例四提供的一种基于语音识别的语音呼叫方法的流程图。本发明在实施例二的基础上,提供了根据所述语音模板,利用预设语音库中的语音查询表,得到被叫号码的优选方案。本实施例提供的基于语音识别的语音呼叫方法适用于呼叫语音为被叫短号的自然语言。本实施例的方法可以由接入网关执行。0079如图4所示,所述优选方法包括0080步骤410、接入网关根据所述语音模板,利用预设语音库中的语音查询表,识别获得被叫短号;0081本实施例在于实施例二的区别在于第一,本实施例中用户输入的呼叫语音为被叫短号的自然语言;而。

30、实施例二中用户输入的呼叫语音为被叫号码的自然语言。第二,本实施例中接入网关中预置被叫号码和被叫短号的第二映射关系,被叫短号的位数可以为13。第三,本实施例中接入网关的识别结果为与呼入语音对应的被叫短号;而实施例二中接入网关的识别结果为与呼入语音对应的被叫号码。0082步骤420、接入网关利用所述第二映射关系,得到被叫号码,并执行语音呼叫。0083本步骤具体是根据匹配到的最优语音模板,以及语音查询表,将语音查询表中与匹配到的最优语音模板对应的字段作为被叫短号,并利用接入网关中存储的所述第二映射关系得到被叫号码,然后执行语音呼叫,进行实现与被叫语音通话的目的。0084需要说明的是,接入网关中预置的。

31、所述第二映射关系,以在接入网关识别到所述被叫短号的自然语言对应的被叫短号后,基于所述第二映射关系,能够得到与被叫短号对应的被叫号码,进而执行语音呼叫。0085优选地,接入网关可以将所述第二映射关系发送至话机,也即,所述第二映射关系预置在话机中,以使主叫用户在摘机后,可以通过操作话机上的13位按键,能够采用传统的按键呼叫方式实现与被叫语音通话的目的。也即,被叫短号的自然语音的呼叫方式可以与传统的按键呼叫方式兼容应用,主叫用户可以根据自身的呼叫习惯和实际需求,决定采用哪种呼叫方式,简化了呼叫流程,并增加了呼叫的灵活性。0086实施例五0087请参阅图5,为本发明实施例五提供的一种基于语音识别的语音。

32、呼叫方法的流程图。本实施例在上述各实施例的基础上,提供了获取用户输入的呼叫语音的优选方案。如图5所示,所述优选方法包括0088步骤510、接入网关获取用户通过话机按键输入的按键值;0089步骤520、接入网关在预配置的语音识别业务键号码表中匹配所述按键值,如果匹配成功,则触发获取用户输入的呼叫语音的操作。0090用户通过话机输入的按键值,传输至接入网关,如果用户输入的按键值与接入网说明书CN104092829A7/9页10关预配置的语音识别业务键号码表匹配一致,则接入网关触发获取用户的呼叫语音以及语音识别流程,即接入网关将此后从话机接收到的语音作为呼叫语音进行识别。接入网关也可以显式地向话机发。

33、送启动语音识别的指令,控制话机向用户提示,可以开始输入语音信息。0091其中,话机与接入网关一般是通过POTS口连接。0092示例性的,接入网关预配置的语音识别业务键号码表中语音识别业务键设置为,那么当用户摘机并且依次按下按键,则匹配成功。0093需要说明的是,如果匹配失败,可以将该匹配结果返回话机,以提示用户,例如通过在话机听筒播放“请重新输入”的语音提示,或在话机的显示屏显示“输入失败”或“请重新输入”的提示。0094除了上述通过话机上的按键值进行触发操作之外,还可以通过用户与话机之间的交互进行触发,例如语音交互,或者触摸话机的显示频的设定区域的方式进行触发,所述设定区域可以预先设定为语音。

34、获取区域。0095本实施例的技术方案,在获取用户输入的按键值之后,通过在预配置的语音识别业务键号码表中匹配所述按键值,并根据匹配结果决定是否触发获取用户输入的呼叫语音以及语音识别的操作。0096在本实施例的基础上,接入网关获取用户输入的呼叫语音优选包括0097接入网关按预设DIGITMAP数图收号规则或预设DIALPLAN拨叫计划收号规则获取用户输入的呼叫语音,其中所述DIGITMAP收号规则包括首位拨号定时器的时长、位间定时器的时长。0098换言之,本优选方案具体是通过所述DIGITMAP收号规则或所述DIALPLAN收号规则获取用户的呼叫语音。0099以DIGITMAP收号规则为例进行说明。

35、。0100首位拨号定时器、位间定时器用在用户摘机到呼叫结束的不同阶段。具体地可以有多种实施方式,下面介绍其中两种。0101方式一、摘机到输入呼叫语音前的阶段由首位拨号定时器控制,如果在首位拨号定时器的时长例如15S内,用户没有输入呼叫语音,则接入网关向话机下发催挂音或忙音提示。如果在首位拨号定时器的时长内,用户开始输入呼叫语音,接入网关则启用位间定时器,当用户的呼叫语音停顿间隔时长超过位间定时器的时长比如5S,接入网关对呼叫语音进行语音识别,也即对之前的语音进行一次识别,然后进行后续呼出流程。0102方式二、摘机到输入呼叫语音前的阶段由首位拨号定时器控制,如果在首位拨号定时器的时长例如15S内。

36、,用户没有输入呼叫语音,则接入网关向话机下发催挂音或忙音提示。如果在首位拨号定时器的时长内,用户开始输入呼叫语音,接入网关进行实时语音识别,例如,用户输入一位呼叫语音,接入网关就进行一次语音识别,同时启用位间定时器,当用户的呼叫语音停顿间隔时长超过位间定时器的时长比如5S,则进行后续呼出流程。0103方式一和方式二的区别在于接入网关进行语音识别的时间点不同,进行语音识别的次数不同。0104换言之,用户通过呼叫语音与被叫进行语音通话过程中,是以预先配置的各个定时器的时长为依据,决定是否结束收取用户的呼叫语音以便执行识别流程。说明书CN104092829A108/9页110105需要说明的是,各定。

37、时器的时长可通过配置来设置和更改。0106实施例六0107请参阅图6,为本发明实施例六提供的一种基于语音识别的接入网关的结构示意图。所述接入网关包括呼叫语音获取模块610和语音呼叫模块620。0108其中,呼叫语音获取模块610用于获取用户输入的呼叫语音,所述呼叫语音包括被叫方信息;语音呼叫模块620用于根据所述呼叫语音,识别获得被叫号码,并执行语音呼叫。0109本实施例的技术方案,通过识别用户的呼叫语音,能够从呼叫语音中识别获得被叫号码,基于识别获得的被叫号码,从而实现语音呼叫。由于无需用户逐位按下话机上与被叫号码对应的一连串按键,因此能够简化语音呼叫流程,实现快速呼叫被叫号码的目的,同时由。

38、于避免了用户操作按键,因此能够适应残疾人或手脚不便的老年人这类特定人群的需求,提升了用户体验。0110在上述方案中,所述呼叫语音包括下述至少一项被叫号码的自然语言、被叫姓名的自然语言以及被叫短号的自然语言;0111其中,在所述呼叫语音为被叫姓名的自然语言时,所述接入网关中预先配置有电子通讯录,所述电子通讯录包括被叫姓名和被叫号码的第一映射关系;0112在所述呼叫语音为被叫短号的自然语言时,接入网关中预置被叫号码和被叫短号的第二映射关系,被叫短号的位数可以为13。0113在上述方案中,语音呼叫模块620优选包括预处理单元、语音特征获取单元、语音特征匹配单元和被叫号码获取单元。0114其中,预处理。

39、单元用于将所述呼叫语音进行模数转换,并进行语音预处理;语音特征获取单元用于从经语音预处理后的呼叫语音中获取语音特征;语音特征匹配单元用于在预设语音模型库中匹配所述语音特征,确定与所述语音特征对应的语音模板;被叫号码获取单元用于根据所述语音模板,利用预设语音库中的语音查询表,得到被叫号码。0115作为被叫号码获取单元的一种优选的实施方式,所述被叫号码获取单元优选包括第一识别子单元和第一映射子单元。0116其中,第一识别子单元用于根据所述语音模板,利用预设语音库中的语音查询表,识别获得被叫姓名;第一映射子单元用于利用所述第一映射关系,得到被叫号码。0117作为被叫号码获取单元的另一种优选的实施方式。

40、,所述被叫号码获取单元优选包括第二识别子单元和第二映射子单元。0118其中,第二识别子单元用于根据所述语音模板,利用预设语音库中的语音查询表,识别获得被叫短号;第二映射子单元用于利用所述第二映射关系,得到被叫号码。0119在上述方案中,所述语音预处理包括数字滤波处理、预加重处理、加窗分帧处理和端点检测处理。0120作为本实施例的一种优选的实施方式,该装置还可以包括按键值获取模块和触发模块。0121其中,按键值获取模块用于在获取用户输入的呼叫语音之前,获取用户通过话机按键输入的按键值;触发模块用于在预配置的语音识别业务键号码表中匹配所述按键值,如果匹配成功,则触发获取用户输入的呼叫语音的操作。说。

41、明书CN104092829A119/9页120122在上述方案中,呼叫语音获取模块610具体用于0123按预设DIGITMAP收号规则或预设DIALPLAN收号规则获取用户输入的呼叫语音,其中所述DIGITMAP收号规则包括首位拨号定时器的时长、位间定时器的时长。0124本发明实施例提供的基于语音识别的接入网关可执行本发明任意实施例所提供的基于语音识别的语音呼叫方法,具备执行方法相应的功能模块和有益效果。0125本领域普通技术人员可以理解实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。0126最后应说明的是以上各实施例仅用于说明本发明的技术方案,而非对其进行限制;实施例中优选的实施方式,并非对其进行限制,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。说明书CN104092829A121/3页13图1图2说明书附图CN104092829A132/3页14图3图4图5说明书附图CN104092829A143/3页15图6说明书附图CN104092829A15。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 电学 > 电通信技术


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1