语音识别操作便携电话机的方法和系统.pdf

上传人:1*** 文档编号:1154383 上传时间:2018-04-03 格式:PDF 页数:26 大小:1.03MB
返回 下载 相关 举报
摘要
申请专利号:

CN00128445.2

申请日:

2000.11.23

公开号:

CN1316863A

公开日:

2001.10.10

当前法律状态:

撤回

有效性:

无权

法律详情:

发明专利申请公布后的视为撤回|||公开

IPC分类号:

H04Q7/32; H04M1/247

主分类号:

H04Q7/32; H04M1/247

申请人:

李秀星;

发明人:

李秀星

地址:

韩国汉城

优先权:

2000.04.04 KR 17741/2000

专利代理机构:

中国国际贸易促进委员会专利商标事务所

代理人:

杨国旭

PDF下载: PDF下载
内容摘要

便携电话机的语音识别系统包括一个语音识别处理器,所述语音识别处理器通过度量预定基准模式与根据包括语音命令和电话号码的语音信号通过对一些特定参数的采样获得的输入模式之间的相似性识别输入语音;一个与所述语音识别处理器、一个手机按键输入装置和一个护盖开关连接的接口单元,所述接口单元逻辑上组合具有与一个由所述语音识别处理器识别的信号值相应的功能的所述护盖开关或所述手机按键输入单元的输出信号值;以及一个控制单元。

权利要求书

1: 一种通过语音识别操作便携电话机的方法,所述方法包括下 列步骤: (a)在被叫等待状态,在识别出是一个“Power On(通电)”命 令的语音时转入通话等待状态,而在检测到振铃期间识别出是一个 “Connect(连接)”命令的语音时转入通话状态; (b)在通话等待状态,在识别出是在预定时间内连续输入的一个 电话号码和一个“Send(发送)”命令的语音时在拨出这个电话号码 后转入通话状态;以及 以及(c)在通话状态,在识别出是一个“Call Stop(通话停止)” 命令的语音时结束通话,转入被叫等待状态。
2: 如在权利要求1中所提出的通过语音识别操作便携电话机的 方法,其中所述步骤(b)在识别出“Stop Clear(停止、清除)”命 令的语音时重新转入被叫等待状态。
3: 如在权利要求1中所提出的操作便携电话机的方法,其中所 述步骤(b)包括下列步骤: 识别和存储完整的电话号码的语音,产生和输出所存储的电话号 码; 在产生和输出电话号码后在识别出是“Stop Clear”命令的语音 时确定这个电话号码有差错,删除所存储的这个完整的电话号码,转 入通话等待状态;以及 在产生和输出电话号码后如果识别出是“Send”命令,就拨出 这个存储的电话号码。
4: 如在权利要求1中所提出的通过语音识别操作便携电话机的 方法,其中在一个执行所述步骤(a)到(c)的语音识别处理器的电源使 用的是一个内置电源的情况下,ON/OFF(接通/断开)这个语音识别 处理器的操作受一个选择开关的输出信号控制。
5: 如在权利要求1中所提出的通过语音识别操作便携电话机的 方法,其中在一个执行所述步骤(a)到(c)的语音识别处理器由一个外 接电源通过一个免提插座供电的情况下,在语音识别处理器安置到这 个免提插座上时,这个外接电源总是为它供电,使它一直工作。
6: 如在权利要求1中所提出的通过语音识别操作便携电话机的 方法,其中存储在一个执行步骤(a)到(c)的语音识别处理器内的基准 语音模式是通过用一个用户的语音输入和登记相应的语音命令、数字 和符号创建的。
7: 如在权利要求1中所提出的通过语音识别操作便携电话机的 方法,其中存储在一个执行步骤(a)到(c)的语音识别处理器内的基准 语音模式是用一些人的平均语调获得的相应的语音命令、数字和符号。
8: 如在权利要求1中所提出的操作便携电话机的方法,其中所 述步骤(b)还包括下列步骤: 在一段预定时间内识别出一个预定用于快捷键拨号功能的语音命 令连同一个关键字和一个“Send(发送)”命令的情况下,检索出一 个与这个识别的关键字相应的电话号码,拨出这个检索出的电话号码 后转入通话状态。
9: 如在权利要求8中所提出的通过语音识别操作便携电话机的 方法,其中所述关键字包括人名、公司名、国内或国外地区、国家和 用分机号码区分的部门名。
10: 如在权利要求9中所提出的通过语音识别操作便携电话机的 方法,其中所述关键字电话号码拨号步骤连同通信业务运营方的国际 电话连接号码,国家代码和地区代码一起拨出一个被叫方的电话号码。
11: 一个便携电话机的语音识别系统,所述语音识别系统包括: 一个语音识别处理器,所述语音识别处理器通过度量预定基准模 式与根据包括语音命令和电话号码的语音信号通过对一些特定参数的 采样获得的输入模式之间的相似性识别输入语音; 一个与所述语音识别处理器、一个手机按键输入装置和一个护盖 开关连接的接口单元,所述接口单元逻辑上组合具有与一个由所述语 音识别处理器识别的信号值相应的功能的所述护盖开关或所述手机的 输出信号值;以及 一个控制单元,所述控制单元按照来自所述接口单元的复合信号 控制便携电话机的与存储和删除识别的电话号码、拨电话号码、发起 呼叫和结束呼叫有关的全体操作。
12: 如在权利要求11中所提出的便携电话机的语音识别系统, 其中所述语音识别处理器通过按照一个选择开关的ON/OFF(接通/断 开)操作有选择地接受一个内置电池的供电得到驱动。
13: 如在权利要求11中所提出的便携电话机的语音识别系统, 其中所述语音识别处理器通过一个外接电源通过一个免提插座接受供 电得到驱动。
14: 如在权利要求11中所提出的便携电话机的语音识别系统, 其中所述语音识别处理器包括一个存储器,用来存储通过一个用户的 语音输入语音命令和电话号码而产生的基准模式。
15: 如在权利要求11中所提出的便携电话机的语音识别系统, 其中所述语音识别处理器包括一个存储器,用来存储由根据一些人的 平均语调获得的语音命令和电话号码产生的基准模式。
16: 如在权利要求11中所提出的便携电话机的语音识别系统, 其中所述语音识别处理器通过度量预定基准模式与根据包括语音命 令、关键词和电话号码的语音信号通过对一些特定参数的采样获得的 输入模式之间的相似性识别输入语音。
17: 如在权利要求16中所提出的便携电话机的语音识别系统, 其中所述语音识别处理器具有一个检测使用的是一个外接电源还是一 个内置电池的单元,所述语音识别处理器只有在连接到外接电源上时 才可工作。
18: 如在权利要求16中所提出的便携电话机的语音识别系统, 其中所述语音识别处理器安装在便携电话机外通过免提插座扩展的接 口单元连接到控制器上,所述语音识别处理器在由外接电源供电时工 作。
19: 一种语音识别系统,所述语音识别系统包括: 一个免提插座,所述免提插座包括一个识别通过送话器输入的语 音命令和电话号码的语音识别处理器;以及 一个与所述免提插座连接、与之进行有线/无线通信的手机,所述 手机接收在语音识别处理器中识别的语音命令和电话号码、按照相应 命令执行与拨电话号码、发起呼叫和结束通话有关的相应操作。
20: 如在权利要求19中所提出的语音识别系统,其中所述语音 识别处理器包括一个存储器,用来存储通过一个用户的语音输入语音 命令和电话号码而产生的基准模式。
21: 如在权利要求19中所提出的语音识别系统,其中所述语音 识别处理器包括一个存储器,用来存储由根据一些人的平均语调获得 的语音命令和电话号码产生的基准模式。
22: 如在权利要求19中所提出的语音识别系统,其中所述语音 识别处理器包括一个存储器,用来预先登记个人、公司、国内或国外 地区、国家和部门的名称,以及相应存储通信业务运营方的国际电话 连接号码、各国的国家代码、各国内或国外地区的地区代码和各人或 公司的电话号码。

说明书


语音识别操作便携电话机的方法和系统

    本发明与便携电话机有关,具体地说,涉及用语音识别操作便携电话机的方法和系统,可以通过理解语音命令拨电话号码、发起呼叫和接收呼叫。

    假如一个用户想要用一个普通便携或蜂窝电话机或者汽车电话机进行呼叫,这个用户就应该打开便携电话机的护盖开关或拿起汽车电话机的手机,使电话机转换入通话等待状态,按出被叫人员的电话号码,再按一下SEND(发送)按键,执行电话拨号程序,拨出电话号码。此外,假如这个用户想要在被叫等待状态接收一个呼叫,他就应该打开护盖开关或按SEND按键,以便接收呼叫,进行通话。如果用户按了一个不正确的电话号码,他就要按一个CLEAR(清除)按键,以便取消输入的电话号码。

    然而,如上那样操作电话机,例如用手打开护盖开关和用眼确认输入的号码,在用户正在开车时可能会引起意外。此外,这样的便携电话机在用户用手做其他工作或者眼或手有某些障碍时使用起来就非常不方便。

    因此,本发明设计成能克服先前技术的上述问题。本发明的一个目的是提供通过语音识别操作便携电话机的方法和系统,通过识别用语音实现地简单命令和电话号码的键入,操作便携电话机,执行拨电话号码、进行呼叫和挂断通话的功能。

    本发明的另一个目的是提供通过语音识别操作便携电话机的方法和系统,其中除了以上功能,用户还可以用语音登记经常用到的个人或公司名、用分机号码区分的部门名、具有地区代码和国家代码(包括每个通信业务运营方的国际电话连接号码)的地区名,以便给定利用语音识别的快捷键拨号功能。

    本发明的又一个目的是提供通过语音识别操作便携电话机的方法和系统,具有用语音命令删除不正确的输入或有差错的电话号码的功能。

    本发明的再一个目的是提供一种便携电话机,可以通过按照使用的电源选择性地确定是否进行语音识别处理来降低功耗。

    为了达到上述目的,本发明提供了一种便携电话机的语音识别系统,这种便携电话机的语音识别系统包括:一个语音识别处理器,所述语音识别处理器通过度量预定基准模式与根据包括语音命令和电话号码的语音信号通过对一些特定参数的采样获得的输入模式之间的相似性识别输入语音;一个与所述语音识别处理器、一个手机按键输入装置和一个护盖开关连接的接口单元,所述接口单元逻辑上组合具有与一个由所述语音识别处理器识别的信号值相应的功能的所述护盖开关或所述手机的输出信号值;以及一个控制单元,所述控制单元按照来自所述接口单元的复合信号控制便携电话机的与存储和删除识别的电话号码、拨电话号码、发起呼叫和结束通话有关的全体操作。

    为了实现上述目的,本发明还提供了一种语音识别系统,这种语音识别系统包括:一个免提插座(handfree socket),所述免提插座包括一个识别通过送话器输入的语音命令和电话号码的语音识别处理器;以及一个与所述免提插座连接、与之进行有线/无线通信的手机,所述手机接收在语音识别处理器中识别的语音命令和电话号码、按照相应命令执行与拨电话号码、发起呼叫和结束通话有关的相应操作。

    语音识别处理器可以按照一个选择开关的ON/OFF(通/断)操作有选择地接受内置电池供电。

    语音识别处理器还可以通过免提插座接受外接电源供电。

    语音识别处理器可以包括一个存储器,用来存储通过用一个用户的语音输入语音命令和电话号码而产生的基准模式。

    语音识别处理器还可以包括一个存储器,用来存储由根据一些人的平均语调获得的语音命令和电话号码产生的这些基准模式。

    语音识别处理器通过度量预定基准模式与根据包括语音命令、关键词和电话号码的语音信号通过对一些特定参数的采样获得的输入模式之间的相似性识别输入语音。

    语音识别处理器可以有一个检测使用的是外接电源还是内置电池的单元,使得语音识别处理器只有在与外接电源连接时才可工作。

    语音识别处理器可以安装在便携电话机外,通过免提插座扩展的接口单元与控制器连接,语音识别处理器由外接电源供电进行工作。

    语音识别处理器可以包括一个存储器,用来预先登记个人名字、公司、国内或国外地区、国家和部门,相应存储通信业务运营方的国际电话连接号码、各国的国家代码、各国内或国外地区的地区代码和个人或公司的电话号码。

    为了达到上述目的,本发明还提供了一种通过语音识别操作便携电话机的方法,这种方法包括下列步骤:(a)在被叫等待状态,在识别出是一个“Power On(通电)”命令的语音时转入通话等待状态,而在检测到振铃期间识别出是一个“Connect(连接)”命令的语音时转入通话状态;(b)在通话等待状态,在识别出是在预定时间内连续输入的一个电话号码和一个“Send(发送)”命令的语音时在拨出这个电话号码后转入通话状态;以及(c)在通话状态,在识别出是一个“Call Stop(通话停止)”命令的语音时转入被叫等待状态。

    步骤(b)可以在识别出是一个“Stop Clear(停止、清除)”命令的语音时再转入通话等待状态。

    步骤(b)还可能包括下列步骤:识别和存储完整的电话号码的语音,产生和输出所存储的电话号码;在产生和输出电话号码后在识别出是“Stop Clear”命令的语音时确定这个电话号码有差错,删除所存储的这个完整的电话号码,转入通话等待状态;以及在产生和输出电话号码后如果识别出是“Send”命令就拨出这个存储的电话号码。

    在执行步骤(a)到(c)的语音识别处理器的电源用的是内置电源的情况下,ON/OFF(接通/断开)语音识别处理器的操作受一个选择开关的输出信号控制。

    在执行步骤(a)到(c)的语音识别处理器由一个外接电源通过一个免提插座供电的情况下,这个外接电源在语音识别处理器安装到免提插座时就总是为它供电。

    存储在执行步骤(a)到(c)的语音识别处理器内的基准语音模式可以通过用一个用户的语音输入和登记相应语音命令、数字和符号创建。

    存储在执行步骤(a)到(c)的语音识别处理器内的基准语音模式也可以是用一些人的平均语调得从的相应语音命令、数字和符号。

    参考以下说明、所附权利要求和附图可以对本发明的这些和其他一些特征、状况和优点有更好的了解,其中同样的组成部分用同样的参考数字标示。在这些附图中:

    图1示出了按照本发明实现的便携电话机操作系统的配置情况;

    图2示出了按照本发明实现的便携电话机操作系统的状态和操作流程;

    图3为例示按照本发明通过语音识别操作便携电话机的方法的流程图;以及

    图4和图5为例示按照本发明操作便携电话机的方法的其他实施例的流程图。

    以下将结合这些附图对本发明的优选实施例进行详细说明。

    传统的便携电话机包括送话单元、受话单元、逻辑单元、天线、显示器和电源。本发明除了传统的便携电话机还包括一个语音识别处理器,以便通过语音识别操作便携电话机,而不需要改变常规体制的配置。

    图1示出了按照本发明实现的便携电话机的配置情况。

    如图所示,控制器100与接收信号处理单元110、发送信号处理单元120、电源130、存储单元140和接口180连接。控制器100控制便携电话机的全体操作。

    接收信号处理单元110受控制器100控制,接收来自天线(未示出)的无线电信号,对接收的无线电信号进行解调。解调后的信号通过受话器111以语音信号的形式输出。发送信号处理单元120受控制器100控制,对来自送话器121的语音信号进行调制,通过天线输出调制后的信号。

    电源130可以是一个在手机内的内置电池,也可以是一个在免提插座内的外接电源,电源130在控制器100的控制下为各单元供电。

    存储单元140包括易失/非易失存储器,用来存储控制器100的主处理程序和暂时存储在执行主处理程序时产生的各种数据。

    接口180与语音识别处理器150、手机按键输入单元160和护盖开关170连接。接口180对来自语音识别处理器150、手机按键输入单元160和护盖开关170的各输出信号进行逻辑组合,将组合后的信号提供给控制器100。这些逻辑组合操作对具有与语音识别处理器150识别出的信号值相同作用的手机按键输入单元和护盖开关的输出信号值进行逻辑加或逻辑乘操作,将操作后得到的值提供给控制器100。因此,在用户按压一个按键或说出一个命令或数字时,控制器就接收到一个相应的输出信号,执行同样的操作。

    语音识别处理器150通过已知的语音识别算法从语音信号中提取时域或频域的特征参数,识别出从送话器121输入的相应语音信号,例如语音命令("Power On(通电)","Stop Clear(停止、清除)","Send(发送)","Connect(连接)","Call Stop(通话停止)"或"Keyword(关键字)"),保留字(关键字)和语音手机按键值(数字或符号)。

    语音识别处理器150可以以软件或者以硬件的形式实现。在以硬件形式实现的情况下,虽然在这些图中没有示出,语音识别处理器150可以包括:一个第一存储器,用来存储基准模式(语音命令,保留字(关键字)和手机按键值);一个处理器,用来通过对来自送话器121的语音的各种参数的采样创建输入模式,通过估计输入模式与预定基准模式之间的相似性(或者通过模式匹配)识别输入语音;一个辅助存储器,用来暂时存储在语音识别处理器150内识别出的语音;以及一个第三存储器,用来存储与各保留字(关键字)分别相应的经常用到的个人和公司的电话号码、地区代码、国家代码、分机号码和通信业务运营方的国际电话连接号码。

    另一方面,在这个优选实施例中,基准模式可以在一个数据库内按照与呼叫者有关的方法或者与呼叫者无关的方法生成。在用与呼叫者有关的方法的情况下,便携电话机的用户用他自己的语音直接说出语音命令、关键字、电话号码、诸如升半音号(_#)和星号(*)之类的符号等等,进行登记。如果使用在诸如EEPROM(电可擦可编程只读存储器)之类的存储器内存有他自己的语音的基准模式的便携电话机,语音识别的准确度高于90%,非常有效。在用与呼叫者无关的方法的情况下,预先在存储器内存储了从各种人员那里收集到的语音命令、关键字、电话号码、诸如升半音号(_#)和星号(*)之类的符号等等的平均模式。

    语音识别处理器150按照控制器100的控制通过接口180从电源130得到供电,如上面所述。

    另一方面,语音识别处理器150也可以直接从一个内置电池或外接电源得到供电。因此,语音识别处理器150包括一个检测是与外接电源还是内置电池连接的单元。在使用内置电池的情况下,安装了一个语音拨号选择开关,用来选择语音识别处理器150与手机内置电池的通断。有了这样的选择开关,可以减小便携电话机的尺寸和重量,节约语音识别处理器150的耗电,延长电池的使用时间。

    此外,在使用诸如汽车蓄电池之类的外接电源的情况下,外接电源直接对语音识别处理器150供电,以便在手机安装到免提插座上时就一直驱动语音识别处理器150。在这样的配置中,可以提供足够功率的外接电源直接驱动语音识别处理器150,即使是用户没有按压选择开关,因为用语音识别拨号这种功能对于用户在驾驶时是必不可少的。此外,在不使用外接电源时,语音识别处理器150按照选择开关的ON/OFF操作驱动。这样的配置对用户是方便的,而且是很经济的。

    在另一个实施例中,为了使用户只在车内才可以使用语音识别功能,语音识别处理器150可以配置成只在用外接电源作为电源130时工作。这可以保证更加减少便携电话机内置电池的功耗。

    在又一个实施例中,语音识别处理器150可以安装在便携电话机外,通过免提插座扩展的接口180与控制器100连接。在这时候,语音识别处理器150利用外接电源供电进行工作。

    下面将结合图2和3说明通过语音识别操作便携电话机的方法。图2示出了按照本发明通过语音识别操作便携电话机的方法,而图3为例示按照本发明通过语音识别操作便携电话机的方法的流程图。

    如图2所示,便携电话机有五种状态,按照用户的语音从一种状态改变为另一种状态。虚线表示按照按键输入的传统过程,而实线表示本发明的按照语音输入的过程。为语音识别登记的检索词不应该是在通常会话中经常使用的一个字,而是一些公众的、就语音识别采样而言很容易记住的字。

    以下将对每个状态进行说明。

    1)在被叫等待状态,打开护盖开关将使便携电话机转入通话等待状态。即使不打开护盖开关,便携电话机在用户说出语音命令“PowerOn(通电)”时也转入被叫等待状态。检索词“Power On”的作用不同于用来接通便携电话机的电源按键(<PWR>)的作用。也就是说,“Power On”命令是一个准备用接通的便携电话机进行通话的命令。

    2)在通话等待状态,传统上,用户可以在便携电话机上按压所需的电话号码后再按压SEND(发送)按键进行通话。但是,在本发明中,为了转入产生模式,用户对于数字“1,2,3,4,5,6,7,8,9,0”说出相应的“一,二,三,四,五,六,七,八,九,零”,对于“*”说出“星号”,对于“#”说出“升半音号”,然后再说“Send(发送)”,转入产生模式。在产生模式,便携电话机重新产生和输出识别出和存储的电话号码,给用户确认。如果语音识别处理器识别用户的言语正确,用户就说声“Send(发送)”,便携电话机便拨出识别的电话号码后转入通话状态。如果语音识别处理器没能识别出用户的言语,用户就说“Stop Clear(停止、清除)”,便携电话机便重新转入通话等待状态。

    3)在被叫等待状态,传统上,如果响铃,用户应该打开便携电话机的护盖开关,以便通过电话机说话。如果在护盖开关打开的情况下响铃,用户应该按压SEND(发送)按键。但是,在本发明中,在检测到响铃时,如果用户说“Connect(连接)”,便携电话机就从被叫等待状态转到通话状态。也就是说,便携电话机只有在响铃期间用户说“Connect”时才可以转入通话状态。

    4)在通话状态,传统上,为了结束通话,用户应该关闭护盖或按压END(结束)按键。但是,在本发明中,便携电话机在用户说“CallStop(通话停止)”时就结束通话,转入被叫等待状态。

    5)在通话等待状态,传统上,在用户输入电话号码不正确时,用户应该按压CLEAR(清除)按键。如果用户按压CLEAR按键时间很短,那末这个电话号码的一部分被删除,而如果按压时间比较长,那末这个电话号码全部被删除。但是,在本发明中,在用户说了一个不正确的电话号码或者语音识别处理器识别用户的言语有差错时,用户说声“Stop Clear(停止、清除)”,就可以删除这个电话号码,输入另一个电话号码。于是,便携电话机转入通话等待状态,可以识别另一个电话号码。

    参看图3,假设语音识别处理器150在使用内置电池的情况下由于接通了选择开关或者使用的是外接电源而正在工作。

    首先,在步骤300的被叫等待状态,图1的控制器100通过接收信号处理单元110检测到有一个呼入控制信号,于是就输出一个振铃信号。然后,在步骤311,控制器100检验语音识别处理器150是否将从送话器121输入的语音识别为“Connect”。此时,语音识别处理器150将识别结果通过接口180发送给控制器100。接口180对识别为“Connect”语音的脉冲值与检测振铃的信号进行逻辑乘,将结果提供给控制器100。

    如果语音识别处理器150没有将这语音识别为“Connect”,就在步骤320按照控制器100的主处理程序执行相应操作,而如果识别为“Connect”,就在步骤312提供上面说明的通话服务。

    在步骤313,控制器100检验语音识别处理器150是否将输入语音识别为“Call Stop”。如果语音识别处理器150将输入语音识别为“ CallStop”,就在步骤314结束占线的通话,便携电话机转入被叫等待状态。

    另一方面,在步骤300、310,在被叫等待状态没有检测到振铃时,控制器100在步骤330检验语音识别处理器150是否将一个输入语音识别为“Power On”。此时,语音识别处理器150的识别结果信号通过接口180发送给控制器100。接口180对手机按键输入单元160的一个输出脉冲值与识别为“Power On”语音的一个脉冲值进行逻辑加,将结果提供给控制器100。

    如果语音识别处理器150没有将输入语音识别为“Power On”,就在步骤320按照控制器100的主处理程序执行相应操作。如果语音识别处理器150将输入语音识别为“Power On”,控制器100就在步骤33l检验语音识别处理器150是否识别出是电话号码的一个数字。如果语音识别处理器150没有识别出是一个数字,就再执行步骤331,而如果识别出是一个数字,就将识别的电话号码存储在存储器内。

    另一方面,在执行步骤332期间,控制器100在步骤333检验语音识别处理器150是否将一个输入语音识别为“Stop Clear(停止、清除)”。

    如果语音识别处理器150将输入语音识别为“Stop Clear”,控制器100就确定用户说错了一个数字,即使是用户已经说了一系列数字而且这些数字已经存储。然后,控制器100删除全部识别的数字,转到步骤331,再从第一个开始接收这些数字。

    如果语音识别处理器150没有将输入语音识别为“Stop Clear”,控制器100就在步骤334检验语音识别处理器150是否将输入语音识别为“Send(发送)”。如果语音识别处理器150没有将输入语音识别为“Send”,控制器100就转到步骤320,执行相应操作。另一方面,如果语音识别处理器150将输入语音识别为“Send”,控制器100就在步骤335读取存储在存储器内的电话号码产生和用声音输出电话号码。

    在另一个实施例中,在用户想要对一个例如为02-7007000的电话号码进行呼叫的情况下,用户应该说出“零,二,七,零,零,七,零,零,零”,以便发起对这个目的地的呼叫。然而,如果这个用户说成“零,二,七,零,零,嗯…,七,零,零,零”,语音识别处理器150就应该只识别数字而不带字“嗯…”。

    然后,控制器在步骤336检验语音识别处理器150是否将一个输入语音识别为“Send”。如果不是“Send”,控制器100确定语音识别处理器150识别的电话号码是不正确的,于是转到步骤331,以便重新接收这个电话号码。如果识别出是“Send”,控制器100确定这个电话号码是正确的,于是在步骤337拨出识别的电话号码。此时,语音识别处理器150的识别结果通过接口180发送给控制器100。接口180对SEND按键的一个输出脉冲值和识别的“Send”语音的一个脉冲值进行逻辑加操作,再将操作结果提供给控制器100,这使得SEND按键的输出脉冲值和识别的“Send”语音的脉冲值引起同样的操作。

    然后,一个无线电基站按照通用的呼叫信号设置协议与被叫终端交换信号,以便得到一个指配频道,建立一条语音线路。此时,在步骤338,控制器100确定呼叫是否得到连接,如果呼叫没有连接,就转到步骤320。

    在步骤338,如果呼叫得到连接,控制器100就转到步骤339,提供通话业务服务。在通话业务服务期间,控制器100在步骤340检验语音识别处理器150是否将输入语音识别为“Call Stop(通话停止)”。如果识别为“Call Stop”,控制器100就在步骤341结束这个建立的呼叫,与无线电基站执行执行呼叫拆线过程,然后在步骤300转到被叫等待状态。

    在又一个实施例中,识别语音的语音识别处理器可以安装在一个免提插座内。

    如果语音识别处理器150识别出通过免提插座的送话器输入的语音命令或电话号码,就有一个与识别的语音命令或电话号码相应的信号值通过一个在免提插座与手机之间的连接器(接口)以有线或无线方式提供给手机的控制器。在免提插座内的语音识别处理器的配置和操作以及便携电话机按照控制器根据语音命令或电话号码进行的操作类似于以上对图1、2和3的说明,因此不再详细说明。图4和图5为例示本发明的其他实施例的流程图。在以下说明中,假设语音识别处理器150在使用内置电池的情况下由于接通了选择开关或者使用的是外接电源而正在工作。

    参看图4,在步骤400的被叫等待状态期间,如果在步骤410检测到振铃,控制器100就在步骤411检验语音识别处理器150是否将通过送话器121输入的语音识别为“Connect(连接)”。

    如果语音识别处理器150没有识别为“Connect”,就在步骤440执行按照主处理程序预定的相应操作。如果识别为“Connect”,控制器100就在步骤412以传统方式连接所接收的呼叫。然后,控制器100在步骤413确定所接收的呼叫连接是否成功。如果连接到所接收的呼叫,过程转到步骤431、432,转入通话状态,为所接收的呼叫提供通话业务服务。然后,控制器100在步骤433检验语音识别处理器150是否将通过送话器121输入的语音识别为“Call Stop(通话停止)”。如果识别为“Call Stop”,过程就转到步骤434,结束通话,转入被叫等待状态。

    另一方面,如果在步骤400、410在被叫等待状态没有检测到振铃,控制器100就在步骤420检验语音识别处理器150是否将一个输入语音识别为“Power On(通电)”。

    如果在步骤420没有识别为“Power On”,就在步骤440按照主处理程序执行相应操作。一个如果识别为“Power On”,控制器100就在步骤421检验语音识别处理器150是否将一个输入语音识别为一个数字或电话号码。如果没有识别为一个数字,过程转到图5中的步骤450,对“Keyword(关键字)”命令进行识别,以便执行快捷键拨号功能。如果识别为一个数字,控制器100就在步骤422将从语音识别出的电话号码存储在存储器内。

    另一方面,在执行步骤422期间,控制器100在步骤423检验语音识别处理器150是否将一个输入语音识别为“Clear(清除)”。

    如果识别为“Clear”,控制器100就在步骤424确定在逐个存储数字期间用户说了一个不正确的数字,因此删除全部当前正输入的这个电话号码。然后,过程转到步骤421,重新识别电话号码。

    如果在步骤423没有识别为“Clear”,控制器100就在步骤425检验语音识别处理器150是否将一个输入语音识别为“Send(发送)”。如果没有识别为“Send”,过程转到步骤421,执行确定语音识别处理器150是否识别出是一个数字或一个保留字(关键字)的操作。然而,如果识别为“Send”,控制器100就在步骤426读取存储在存储器内的电话号码,用声音输出这个电话号码。

    现在,在步骤427,控制器100检验语音识别处理器150是否将输入语音识别为“Send”。如果没有识别为“Send”,控制器100就确定语音识别处理器150识别电话号码不正确,便转到步骤421。如果识别出是“Send”,控制器100确定这个电话号码是正确的,于是在步骤428拨出识别的电话号码。于是,在步骤429,无线电基站和被叫终端按照通用呼叫信号设置协议发送信号,建立一条通信通路。此时,控制器100在步骤430检验呼叫连接是否成功。如果不成功,过程转到步骤427,重新拨号,再执行步骤428到430。

    如果控制器100在步骤430成功地连接了呼叫,过程就转到步骤431,转入通话状态,然后执行步骤432,提供通话业务服务。在通话业务服务期间,控制器100在步骤433检验语音识别处理器150是否将输入语音识别为“Call Stop(通话停止)”。如果识别为“Call Stop”,控制器100在步骤434与无线电基站按照通用呼叫拆线过程结束通话,转入被叫等待状态。

    另一方面,在图5的步骤450,控制器100检验语音识别处理器150是否将输入语音识别为一个为快捷键拨号功能预定的“Keyword(关键字)”命令。如果识别出是“Keyword”,控制器100就在步骤451转入关键字输入状态,再在步骤452确定语音识别处理器150是否识别出任何关键字。此时,如果语音识别处理器150识别出任何关键字,控制器100就在步骤454将识别的关键字存储在存储器内。然而,如果语音识别处理器150在一段预定时间内没有识别出任何关键字,控制器100就在步骤453输出一个出错消息,然后转到步骤400,从而转入被叫等待状态。

    在步骤454后,控制器100在步骤455检验语音识别处理器150是否将输入语音识别为“Clear(清除)”。如果识别出是“Clear”,控制器100就在步骤456删除当前识别的关键字。然而,如果没有识别为“Clear”,控制器100就在步骤457检验语音识别处理器150是否识别出是至少一个数字。如果语音识别处理器150识别出是至少一个数字,控制器确定这个数字是与关键字配合组成一个被叫方电话号码所需要的,从而在步骤458将这个识别的数字存储在存储器内。然后,控制器在步骤459检验语音识别处理器150是否将一个输入语音识别为“Clear”。如果识别出是“Clear”,控制器100就在步骤460删除这些当前识别的数字。然而,如果没有识别为“Clear”,控制器100就在步骤461确定语音识别处理器150是否将一个输入语音识别为“Send(发送)”。此时,如果在步骤457语音识别处理器150没有识别出是一个数字,过程直接转到步骤461,以便识别一个“Send”命令。在这种情况下,控制器100认为这个关键字相当于完整的电话号码,那就是说,要形成被叫方电话号码除了与这个关键字相应的号码不需要任何其他数字。

    如果在步骤461语音识别处理器150在一段预定时间内没有识别出一个"Send"命令,处理器就转到步骤400,从而转入被叫等待状态。然而,如果语音识别处理器150识别出“Send”命令,控制器100就在步骤462检索出存储在第三存储器内的与识别的关键字相应的保留号码,然后在步骤463产生和输出检索出的电话号码,如果需要的话,这些识别的数字用语音输出。

    于是过程返回到图4的步骤427,然后如果语音识别处理器150将一个输入语音识别为“Send”,控制器100就拨出与识别的关键字相应的电话号码。

    这种使用快捷键拨号功能的拨号过程可以以各种方式执行。

    第一,在语音识别处理器150将一系列数字(例如为1,2,3,4,5,6,7)识别为一个电话号码后,控制器就拨出与这些数字相应的电话号码(123-4567)。

    第二,在用语音登记了一个人的名字或一个公司的名字后再登记一个与这个名字相应的电话号码的情况下,在语音识别处理器150识别出登记的名字和语音命令(例如Stewart Send)时,控制器100就检索出和产生与这个名字相应的电话号码(例如,如果“Stewart”用一个相应的电话号码123-4567登记,就会检索出电话号码123-4567),于是在识别出“Send”命令时将拨出这个电话号码。

    第三,在用语音登记了一个地区的名字和相应地区的地区代码的情况下,在识别出用语音说出的这个地区的名字(例如,Pusan)后,控制器100就检索出和产生一个地区代码(例如,如果“Pusan”用一个相应的地区代码051登记,就会检索出这个地区代码051),于是在识别出“Send”命令时将自动与其他电话号码(用语音输入的或先前登记的)一起拨出这个地区代码。

    第四,在用语音登记了世界各地城市及其相应的地区代码、国家代码和国际电话连接号码的情况下,在识别出用语音说出的与一个特定的城市(例如,San Jose)相应的关键字后,控制器100就会检索出和产生这个登记的城市的地区代码、国家代码和通信业务运营方的国际电话连接号码(例如,001(一个通信业务运营方的国际电话连接号码),01(美国的国家代码),408(San Jose的地区代码)),于是在识别出“Send”命令时将自动与一个电话号码(用语音输入的或先前登记的)一起拨出这个通信业务运营方的国际电话连接号码、国家代码和地区代码。

    第五,在用语音登记了可以用一个分机号码区分的部门和登记了这个相应部门的分机号码的情况下,在识别出用语音说出的与这个登记的部门相应的关键字(例如,对于这个行政部门是123)时,控制器100就会检索出和产生相应的分机号码,于是在识别出“Send”命令时将自动拨出这个分机号码。

    这种采用语音识别的便携电话机可以减少用户的不方便,特别对于在驾驶时使用便携电话机的用户、希望快速拨出电话号码而不用按压按键的用户和失明的用户。

    如上所述,本发明通过在传统的便携式系统(手机或免提插座)上添加语音识别处理器和进行简单逻辑操作的接口就使便携电话机可以用语音操作而不需要变更传统的便携电话机的电路。

    此外,在使用便携电话机内置电池的情况下,本发明通过有选择地驱动语音识别处理器可以减少功率消耗。本发明还可以通过在便携电话机安置到免提插座上和使用外接电源时总是接通语音识别处理器来防止在驾驶中由于操作按键而发生的事故。

    此外,本发明可以用于普通家用电话和公用电话。

    以上详细说明了按照本发明实现的通过语音识别对便携电话机进行操作的系统和方法。然而,很清楚,这个详细说明和具体例子,虽然示出了本发明的一些优选实施例,但都只是例示性的。根据以上详细说明,在发明的精神和范围内的种种变动和修改对于熟悉该技术的人员来说都是显而易见的。

语音识别操作便携电话机的方法和系统.pdf_第1页
第1页 / 共26页
语音识别操作便携电话机的方法和系统.pdf_第2页
第2页 / 共26页
语音识别操作便携电话机的方法和系统.pdf_第3页
第3页 / 共26页
点击查看更多>>
资源描述

《语音识别操作便携电话机的方法和系统.pdf》由会员分享,可在线阅读,更多相关《语音识别操作便携电话机的方法和系统.pdf(26页珍藏版)》请在专利查询网上搜索。

便携电话机的语音识别系统包括一个语音识别处理器,所述语音识别处理器通过度量预定基准模式与根据包括语音命令和电话号码的语音信号通过对一些特定参数的采样获得的输入模式之间的相似性识别输入语音;一个与所述语音识别处理器、一个手机按键输入装置和一个护盖开关连接的接口单元,所述接口单元逻辑上组合具有与一个由所述语音识别处理器识别的信号值相应的功能的所述护盖开关或所述手机按键输入单元的输出信号值;以及一个控制。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 电学 > 电通信技术


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1