选择用于自动话音识别的语言的技术.pdf

上传人:b*** 文档编号:2238647 上传时间:2018-08-03 格式:PDF 页数:18 大小:1.25MB
返回 下载 相关 举报
摘要
申请专利号:

CN201380057227.3

申请日:

2013.08.20

公开号:

CN104756184A

公开日:

2015.07.01

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):G10L 15/24申请日:20130820|||公开

IPC分类号:

G10L15/24(2013.01)I; G10L15/28(2013.01)I; G06F3/16

主分类号:

G10L15/24

申请人:

谷歌公司

发明人:

马丁·扬舍; 中岛海佐; 成允轩

地址:

美国加利福尼亚州

优先权:

61/694,936 2012.08.30 US; 13/912,255 2013.06.07 US

专利代理机构:

北京集佳知识产权代理有限公司11227

代理人:

杜诚; 李春晖

PDF下载: PDF下载
内容摘要

一种计算机实现的技术包括在包括一个或更多个处理器的计算设备处接收来自用户的触摸输入。触摸输入包括(i)指示向计算设备提供话音输入的请求的斑点输入,(ii)跟在斑点输入之后的指示用于话音输入的自动话音识别的期望语言的滑动输入。该技术包括在计算设备处接收来自用户的话音输入。该技术包括在计算设备处获得由使用期望语言的话音输入的自动话音识别导致的一个或更多个识别的字符。该技术还包括在计算设备处输出一个或更多个识别的字符。

权利要求书

1.  一种计算机实现的方法,包括:
在包括一个或更多个处理器的计算设备处接收来自用户的触摸输入,所述触摸输入包括(i)指示向所述计算设备提供话音输入的请求的斑点输入,(ii)跟在所述斑点输入之后的指示用于所述话音输入的自动话音识别的期望语言的滑动输入;
在所述计算设备处接收来自所述用户的所述话音输入;
在所述计算设备处获得由使用所述期望语言的所述话音输入的自动话音识别导致的一个或更多个识别的字符;以及
在所述计算设备处输出所述一个或更多个识别的字符。

2.
  根据权利要求1所述的计算机实现的方法,还包括:
在所述计算设备处确定从所述斑点输入起所述滑动输入的方向;以及
在所述计算设备处基于所述方向以及与供所述用户选择的一种或更多种语言相关联的预定方向来确定所述期望语言。

3.
  根据权利要求2所述的计算机实现的方法,其中所述一种或更多种语言中的每种语言与预定方向范围相关联,并且其中确定所述期望语言包括选择所述一种或更多种语言中具有关联的预定方向范围的一种语言,其中所述关联的预定方向范围包括从所述斑点输入起所述滑动输入的方向。

4.
  根据权利要求2所述的计算机实现的方法,其中在所述滑动输入离所述斑点输入的距离大于预定距离之后确定所述期望语言。

5.
  根据权利要求2所述的计算机实现的方法,还包括:
通过在所述计算设备处接收来自所述用户的第一输入,在所述计算设备处确定所述预定方向,其中所述第一输入指示针对供所述用户选择的所述一种或更多种语言中的每种语言的特定方向;
在所述计算设备处接收来自所述用户的第二输入,所述第二输入指示供所述用户选择的所述一种或更多种语言;以及
在所述计算设备处基于所述用户的过去的计算行为自动地确定供所述用户选择的所述一种或更多种语言。

6.
  根据权利要求2所述的计算机实现的方法,还包括在所述计算设备处响应于接收所述斑点输入而输出用户接口,所述用户接口提供供所述用户选择的所述一种或更多种语言。

7.
  根据权利要求6所述的计算机实现的方法,其中在接收所述斑点输入预定延迟时段之后输出所述用户接口,所述预定延迟时段被配置成允许所述用户在所述预定方向中的一个方向上提供所述滑动输入。

8.
  根据权利要求7所述的计算机实现的方法,其中关于所述用户接口提供从所述用户接收的所述滑动输入,并且其中所述用户接口是包括所述一种或更多种语言的弹出窗口。

9.
  根据权利要求1所述的计算机实现的方法,还包括在所述计算设备处响应于接收所述斑点输入而输出用户接口,所述用户接口提供供所述用户选择一种或更多种语言。

10.
  根据权利要求9所述的计算机实现的方法,还包括在所述计算设备处接收来自所述用户的输入,该输入指示要由所述用户接口提供的所述一种或更多种语言,其中关于所述用户接口提供从所述用户接收的所述滑动输入,并且其中响应于接收所述斑点输入而输出所述用户接口,并且其中所述用户接口是包括所述一种或更多种语言的弹出窗口。

11.
  一种计算设备,包括:
触摸显示器,其被配置成接收来自用户的触摸输入,所述触摸输入包括(i)指示向所述计算设备提供话音输入的请求的斑点输入,(ii)跟在所述斑点输入之后的指示用于所述话音输入的自动话音识别的期望语言的滑动输入;
麦克风,其被配置成接收来自所述用户的所述话音输入;以及
一个或更多个处理器,其被配置成获得由使用所述期望语言的所述话音输入的自动话音识别导致的一个或更多个识别的字符,
其中所述触摸显示器还被配置成输出所述一个或更多个识别的字符。

12.
  根据权利要求11所述的计算设备,其中所述一个或更多个处理器还被配置成:
确定从所述斑点输入起所述滑动输入的方向;以及
基于所述方向以及与供所述用户选择一种或更多种语言相关联的预定方向来确定所述期望语言。

13.
  根据权利要求12所述的计算设备,其中所述一种或更多种语言中的每种语言与预定方向范围相关联,并且其中所述一个或更多个处理器被配置成通过选择所述一种或更多种语言中具有关联的预定方向范围的一种语言来确定所述期望语言,其中所述关联的预定方向范围包括从所述斑点输入起所述滑动输入的方向。

14.
  根据权利要求12所述的计算设备,其中在所述滑动输入离所述斑点输入的距离大于预定距离之后确定所述期望语言。

15.
  根据权利要求12所述的计算设备,其中所述触摸显示器还被配置成:
通过接收来自所述用户的第一输入来确定所述预定方向,其中所述第一输入指示针对供所述用户选择一种或更多种语言中的每种语言的特定方向;
接收来自所述用户的第二输入,其中所述第二输入指示供所述用户选择的所述一种或更多种语言;以及
基于所述用户的过去的计算行为,自动地确定供所述用户选择的所述一种或更多种语言。

16.
  根据权利要求12所述的计算设备,其中所述触摸显示器还被配置成响应于接收所述斑点输入而输出用户接口,所述用户接口提供供所述用户选择的所述一种或更多种语言。

17.
  根据权利要求16所述的计算设备,其中在接收所述斑点输入预定延迟时段之后输出所述用户接口,所述预定延迟时段被配置成允许所述用户在所述预定方向中的一个方向上提供所述滑动输入。

18.
  根据权利要求17所述的计算设备,其中关于所述用户接口提供从所述用户接收的所述滑动输入,并且其中所述用户接口是包括所述一种或更多种语言的弹出窗口。

19.
  根据权利要求11所述的计算设备,其中所述触摸显示器还被配置成响应于接收所述斑点输入而输出用户接口,所述用户接口提供供所述用户选择一种或更多种语言。

20.
  根据权利要求所述的计算设备19,其中所述触摸显示器还被配置成接收来自所述用户的输入,该输入指示要由所述用户接口提供的所述一种或更多种语言,其中关于所述用户接口提供从所述用户接收的所述滑动 输入,其中响应于接收所述斑点输入而输出所述用户接口,并且其中所述用户接口是包括所述一种或更多种语言的弹出窗口。

说明书

选择用于自动话音识别的语言的技术
相关申请的交叉引用
本申请要求于2013年6月7日提交的13/912,255号美国发明专利申请的优先权,该发明专利申请要求于2012年8月30日提交的61/694,936号美国临时申请的权益。上述申请中的每个申请的公开内容通过引用整体合并于此。
技术领域
本公开内容涉及自动话音识别,更具体地,涉及选择用于自动话音识别的语言的技术。
背景技术
这里所提供的背景技术描述是出于大体介绍本公开内容的背景的目的。就本背景技术部分描述的范围而言,目前指明的发明人的工作,以及在提交时不能称得上是现有技术的本说明书的诸方面,既没有明确地也没有隐含地被承认是相对于本公开内容的现有技术。
自动话音识别是指使用计算设备将口述言语翻译成文本。与例如使用一个或更多个手指或指示笔的用户向计算设备进行的文本手工输入相比,自动话音识别能够提供更有效率的用户向计算设备文本输入。例如,计算设备可以是移动电话,并且用户可以提供话音输入,该话音输入被捕获并被自动翻译成文本,以例如用于电子邮件或文本消息。
发明内容
提出一种计算机实现的技术。该技术能够包括在包括一个或更多个处理器的计算设备处接收来自用户的触摸输入,该触摸输入包括(i)指示向计算设备提供话音输入的请求的斑点输入(spot input),(ii)跟在斑点输入之后的指示用于话音输入的自动话音识别的期望语言的滑动输入。该 技术能够包括在计算设备处接收来自用户的话音输入。该技术能够包括在计算设备处获得由使用期望语言的话音输入的自动话音识别导致的一个或更多个识别的字符。该技术也能够包括在计算设备处输出一个或更多个识别的字符。
在一些实施方式中,该技术还包括在计算设备处确定从斑点输入起滑动输入的方向,以及在计算设备处基于与供用户选择的一种或更多种语言相关联的预定方向和滑动输入的方向确定期望语言。
在另外的实施方式中,一种或更多种语言中的每种语言与预定方向范围相关联,并且确定期望语言包括选择具有关联的预定方向范围的一种或更多种语言中的一种,其中关联的预定方向范围包括从斑点输入起滑动输入的方向。
在一些实施方式中,在滑动输入离斑点输入的距离大于预定距离之后确定期望语言。
在另外的实施方式中,该技术还包括:通过在计算设备处接收来自用户的指示针对供用户选择的一种或更多种语言中的每种语言的特定方向的第一输入,在计算设备处确定预定方向,在计算设备处接收来自用户的指示供用户选择的一种或更多种语言的第二输入,以及在计算设备处基于用户的过去的计算行为自动地确定供用户选择的一种或更多种语言。
在一些实施方式中,该技术还包括在计算设备处响应于接收斑点输入而输出用户接口,该用户接口提供供用户选择的一种或更多种语言。
在另外的实施方式中,在接收斑点输入预定延迟时段之后输出用户接口,该预定延迟时段被配置成允许用户在预定方向中的一个方向上提供滑动输入。
在一些实施方式中,关于用户接口提供从用户接收的滑动输入,并且用户接口是包括一种或更多种语言的弹出窗口。
在另外的实施方式中,该技术还包括在计算设备处响应于接收斑点输入而输出用户接口,该用户接口提供供用户选择的一种或更多种语言。
在一些实施方式中,该技术还包括在计算设备处接收来自用户的指示要由用户接口的一种或更多种语言的输入,其中关于用户接口提供从用户接收的滑动输入,并且其中响应于接收斑点输入而输出用户接口,并且其中用户接口是包括一种或更多种语言的弹出窗口。
还提出一种计算设备。该计算设备能够包括触摸显示器、麦克风以及一个或更多个处理器。触摸显示器能够被配置成接收来自用户的触摸输入,触摸输入包括(i)指示向计算设备提供话音输入的请求的斑点输入,(ii)跟在斑点输入之后的指示用于话音输入的自动话音识别的期望语言的滑动输入。麦克风能够被配置成接收来自用户的话音输入。一个或更多个处理器能够被配置成获得由使用期望语言的话音输入的自动话音识别导致的一个或更多个识别的字符。触摸显示器也能够被配置成输出一个或更多个识别的字符。
在一些实施方式中,一个或更多个处理器还被配置成:确定从斑点输入起滑动输入的方向,以及基于该方向和与供用户选择的一种或更多种语言相关联的预定方向来确定期望语言。
在另外的实施方式中,一种或更多种语言中的每种语言与预定方向范围相关联,并且一个或更多个处理器被配置成通过选择具有包括从斑点输入起滑动输入的方向的关联的预定方向范围的一种或更多种语言之一来确定期望语言。
在一些实施方式中,在滑动输入离斑点输入的距离大于预定距离之后确定期望语言。
在另外的实施方式中,触摸显示器还被配置成:通过接收来自用户的指示针对供用户选择的一种或更多种语言中的每种语言的特定方向的第一输入来确定预定方向,接收来自用户指示供用户选择的一种或更多种语言的第二输入,以及基于用户的过去的计算行为自动地确定供用户选择的一种或更多种语言。
在一些实施方式中,触摸显示器还被配置成响应于接收斑点输入而输出用户接口,该用户接口提供供用户选择的一种或更多种语言。
在另外的实施方式中,在接收斑点输入预定延迟时段之后输出用户接口,该预定延迟时段被配置成允许用户在预定方向中的一个方向上提供滑动输入。
在一些实施方式中,关于用户接口提供从用户接收的滑动输入,并且用户接口是包括一种或更多种语言的弹出窗口。
在另外的实施方式中,触摸显示器还被配置成响应于接收斑点输入而输出用户接口,该用户接口提供供用户选择的一种或更多种语言。
在一些实施方式中,触摸显示器还被配置成接收来自用户的指示要由 用户接口提供的一种或更多种语言的输入,其中关于用户接口提供从用户接收的滑动输入,并且其中响应于接收斑点输入而输出用户接口,并且其中用户接口是包括一种或更多种语言的弹出窗口。
根据下文中提供的详细描述,本公开内容适用的另外的领域将变得明显。应理解的是:详细的描述以及具体示例仅意在为了说明的目的而并不意在限制公开内容的范围。
附图说明
根据具体实施方式和附图,本公开内容将变得更充分地被理解,其中:
图1是根据本公开内容的一些实现方式的用户与示例计算设备交互的图;
图2是根据本公开内容的一些实现方式的包括示例话音识别控制模块的图1的示例计算设备的功能框图;
图3是图2的示例话音识别控制模块的功能框图;
图4A-4B是根据本公开内容的一些实现方式的示例用户接口的图;以及
图5是根据本公开内容的一些实现方式的选择用于自动话音识别的语言的示例技术的流程图。
具体实施方式
例如移动电话的计算设备可以包括自动话音识别系统。计算设备的用户可以能够讲多种不同语言。然而自动话音识别系统在给定的时间可能仅识别单种语言的话音。因此计算设备可以允许用户选择用于自动话音识别的期望语言。例如,用户可能为了选择期望语言不得不搜索整个自动话音识别系统的设置。该过程能够是耗时的,尤其是在用户期望在短时间期间内以多种不同语言提供话音输入时,例如在快速相继以不同语言讲单个句子或两个或更多个话音输入时。
因此,提供选择用于自动话音识别的语言的技术。该技术总体上提供对用于自动话音识别的期望语言的更有效的用户选择,其能够提高用户的效率和/或改善他们的整体体验。该技术能够在包括一个或更多个处理器 的计算设备处接收来自用户的触摸输入。触摸输入能够包括(i)指示向计算设备提供话音输入的请求的斑点输入,(ii)跟在斑点输入之后的指示用于话音输入的自动话音识别的期望语言的滑动输入。应当理解,触摸输入能够可选择地包括跟在该斑点输入之后的一个或更多个附加斑点输入,该一个或更多个附加斑点输入指示用于话音输入的自动话音识别的期望语言。该技术能够在计算设备处接收来自用户的话音输入。
该技术能够在计算设备处获得由使用期望语言的话音输入的自动话音识别导致的一个或更多个识别的字符。在一些实现方式中,能够由计算设备执行自动话音识别。然而,应当理解,也能够在例如服务器的远程计算设备处完整地或部分地执行自动话音识。例如,计算设备能够经由网络向远程服务器发送话音输入和期望语言,并且计算设备然后能够经由网络从远程服务器接收一个或更多个识别的字符。该技术也能够在计算设备处输出一个或更多个识别的字符。
现在参考图1,示出了与示例计算设备100的用户交互。虽然示出移动电话,但应当理解,如本文中所使用的术语“计算设备”能够指包括一个或更多个处理器的任何合适的计算设备(台式计算机、膝上型计算机、平板计算机等)。如所示出的,用户104能够与计算设备100的触摸显示器108交互。触摸显示器108能够被配置成接收来自用户104的信息和/或向用户104输出信息。虽然在这里示出和描述了触摸显示器108,应当理解也可以实现被配置成接收和/或输出信息的其它合适的用户接口,例如物理键盘。触摸显示器108能够输出用户接口112。用户104能够观看用户接口112并且能够关于用户接口112经由触摸显示器108提供输入。
如所示出的,用户接口112能够包括虚拟键盘。虚拟键盘能够包括能够被选择以启用自动话音识别的部分116。例如,部分116可以是虚拟键盘的按钮或麦克风键。用户104能够通过关于触摸显示器108在部分116的位置处提供斑点输入来选择用户接口112的部分116。如本文中所使用的术语“斑点输入”能够指触摸显示器108的位置处的单触摸输入。由于用户104使用手指120,该单触摸输入可以被接收为“斑点”而不是单个点(single point)。相比之下,如本文中所使用的术语“滑动输入”能够指触摸显示器108处的从斑点输入的位置到另一位置的滑动触摸输入。通常,在对部分116进行选择以启用自动话音识别之后,用户104然后能够提供话音输入,计算设备100能够经由麦克风(未示出)接收该话音输入。
现在参考图2,示出了示例计算设备100的功能框图。计算设备100 能够包括触摸显示器108、麦克风200、处理器204、存储器208、话音识别控制模块212以及通信设备216。应当理解,如本文中所使用的术语“处理器”能够指以并行或分布架构运行的两个或更多个处理器。处理器204也能够完整地或部分地执行话音识别控制模块212。另外,虽然仅示出麦克风200,但应当理解计算设备100能够包括用于捕获和/或过滤来自用户104的话音输入的其它合适的部件。
麦克风200能够被配置成接收音频信息。具体地,麦克风200能够接收来自用户104的话音输入。麦克风200能够是将话音输入转换成计算设备100能够使用的电信号的任何合适的声电麦克风(电磁的或动态的麦克风、电容麦克风或电容传声器等)。应当理解,虽然示出麦克风200被集成为计算设备100的一部分,但麦克风200也能够是经由例如通用串行总线(USB)线缆的合适的通信线缆或经由无线通信信道连接至计算设备100的外围设备。
处理器204能够控制计算设备100的操作。处理器204能够进行如下的功能:包括但不限于加载并执行计算设备100的操作系统、处理接收自触摸显示器108的信息和/或控制经由触摸显示器108的信息输出、处理经由麦克风200接收的信息、控制存储器208处的存储/检索操作和/或控制经由通信设备216进行的例如与服务器220的通信。如先前提到的,处理器204也能够例如经由话音识别控制模块212来完整地或部分地执行本公开内容的技术。存储器208能够是被配置成在计算设备100处存储信息的任何合适的存储介质(闪存、硬盘等)。
话音识别控制模块212能够控制计算设备100的自动话音识别。在启用了自动话音识别的情况下,话音识别控制模块212能够将由麦克风200捕获的话音输入转换成一个或更多个识别的字符。话音识别控制模块212能够经由触摸显示器108接收来自用户104的控制参数和/或能够从存储器208检索控制参数。例如,控制参数能够包括用于(在计算设备100处或在服务器220处)进行自动话音识别(在下面描述)的期望语言。话音识别控制模块212也能够执行本公开内容的技术(在下面详细描述)。
应当理解,话音识别控制模块212也能够使用通信设备216获得来自服务器220的一个或更多个识别的字符,服务器220位于远离计算设备100的位置,例如在网络(未示出)上。通信设备216能够包括用于在计算设备100和服务器220之间通信的任何合适的部件。例如,通信设备216可以包括用于经由网络(局域网(LAN)、例如因特网的广域网(WAN)、 它们的组合等)来通信的收发器。更具体地,服务器220能够进行使用期望语言的话音输入的自动话音识别以获得一个或更多个识别的字符,然后能够向计算设备100提供一个或更多个识别的字符。例如,计算设备100能够向服务器220发送话音输入和期望语言以及进行自动话音识别的请求,并且计算设备100然后能够接收一个或更多个识别的字符作为响应。
现在参考图3,示出了示例话音识别控制模块212的功能框图。话音识别控制模块212能够包括输入确定模块300、用户接口控制模块304、语言选择模块308和话音处理模块312。如先前提到的,处理器204能够完整地或部分地执行话音识别控制模块212和它的子模块。
输入确定模块300能够确定例如由用户104经由触摸显示器108向计算设备100的输入。输入确定模块300能够先确定是否经由触摸显示器108接收到了指示向计算设备100提供话音输入的请求的斑点输入。例如,斑点输入能够是在用户接口112的部分116(见图1)处。在已接收到提供话音输入的请求时,输入确定模块300能够通知用户接口控制模块304。
在一些实现方式中,用户104能够经由触摸显示器108提供输入以设置用于自动话音识别的各种参数。这些参数能够包括但不限于能够被选择的多种语言、与多种语言中的每种语言相关联的滑动输入的距离和/或方向范围以及弹出窗口出现之前的时间。(在下面详细描述)。然而,可以自动地确定这些参数中的一些参数。仅作为示例,基于用户104在计算设备100处的过去的计算行为能够自动地确定能够被选择的多种语言。
根据实现方式和各种参数,用户接口控制模块304然后可以调整在触摸显示器108处显示的用户接口(见图4A-4B)。仅作为示例,用户接口控制模块304可以在触摸显示器108处提供弹出窗口以用于用户104选择用于自动话音识别的语言。因此,输入确定模块300然后能够确定在触摸显示器108处例如从用户104接收到什么附加输入。此外,根据用户接口控制模块304提供的配置,附加输入能够包括例如在弹出窗口处的跟在斑点输入之后的滑动输入或附加斑点输入。输入确定模块300然后能够向语言选择模块308通知接收到的附加输入。
语言选择模块308然后能够基于接收到的附加输入选择要用于自动话音识别的多种语言中的一种语言。在确定哪种语言与附加输入相关联的过程中,语言选择模块308可以与用户接口控制模块304通信。语言选择模块308然后能够向话音处理模块312通知所选择的语言。话音处理模块312然后能够启用麦克风200以接收所请求的话音输入。例如,话音处理 模块312也能够经由触摸显示器108来向用户104提供通知以开始接收话音输入。
麦克风200能够捕获例如来自用户104的话音输入,并且将话音输入传递给话音处理模块312。话音处理模块312然后能够基于所选择的语言进行话音输入的自动话音识别以获得一个或更多个识别的字符。话音处理模块312能够使用任何合适的自动话音识别处理技术。例如,如先前讨论的,在服务器220执行了使用期望语言的话音输入的自动话音识别以获得一个或更多个识别的字符的情况下,话音处理模块312能够使用通信设备216从自服务器220获得一个或更多个识别的字符。话音处理模块312然后能够向触摸显示器108输出一个或更多个识别的字符。例如,用户104然后能够在计算设备100处使用一个或更多个识别的字符来执行各种任务(文本消息发送、发电子邮件、万维网浏览等)。
现在参考图4A-4B,示出了示例用户接口400和用户接口450。例如,用户接口400和/或用户接口450能够在触摸显示器108处(见图1)作为用户接口112显示给用户104。用户104然后能够在触摸显示器108处关于用户接口400和/或用户接口450提供输入以选择用于自动话音识别的期望语言。应当理解,用户接口400和用户接口450以及它们的对应的语言是用于说明性和解释性目的,并且可以实现例如关于不同的虚拟键盘配置的其它合适的用户接口。
现在参考图4A,示例用户接口400能够包括用于激活自动话音识别的部分116。该部分116在下文中能够被称为麦克风图标116,因为在用户104选择麦克风图标116时,能够激活麦克风200以用于自动话音识别。在本实施方式中,用户104能够在麦克风图标116处提供斑点输入,然后能够在多个方向中的一个方向上提供滑动输入。多个方向中的每个方向能够与用于自动话音识别的不同语言相关联。应当理解,虽然示出了三个不同的方向404、408和412,但能够实现其它数量的方向。
仅作为示例,方向404能够与汉语相关联,方向408能够与日语相关联,方向412能够与韩语相关联。也能够实现其它合适的语言。应明了的是,滑动输入能够穿过用户接口400的一个或更多个其它图标,例如,方向412上的滑动输入穿过键盘图标416。如本文先前所描述的,在一些实现方式中,在用户104已提供了方向404、408和412中的一个方向上的大于预定距离的滑动输入之后,然后可以选择相应的语言用于自动话音识别。
然而,用户104经由触摸显示器108提供的滑动输入可能不是精确地在与方向404、408和412中的一个方向相同的方向上。因此计算设备100能够首先确定从斑点输入起滑动输入的方向,然后将该方向和与方向404、408、412中的每个方向相关联的预定方向范围进行比较。仅作为示例,方向404、408和412可以各自具有60度的方向范围(用于总共180度的弧)。计算设备100然后能够选择一种或更多种语言中相关联的预定方向范围包括从斑点输入起的滑动输入的方向的一种语言。
现在参考图4B,另一示例用户接口450能够包括麦克风图标116。在本实施方式中,用户104能够在麦克风图标116处提供斑点输入,该斑点输入使弹出窗口454出现。如示出的,弹出窗口454可以覆盖下面的虚拟键盘。然而应当理解,能够以另一合适的配置布置弹出窗口454,例如集成入虚拟键盘。弹出窗口454能够被配置成展现供用户104选择的用于自动话音识别的一种或更多种语言。仅作为示例,弹出窗口454能够包括汉语图标458、日语图标462和韩语图标466。如先前提到的,也能够实现其它语言。用户104能够提供从麦克风图标116到弹出窗口454的图标458、462和466之一的滑动输入。如为先前说明的,滑动输入能够穿过用户接口450的一个或更多个其它图标,例如滑动输入470也穿过键盘图标416。
或者,在一些实现方式中弹出窗口454可以被配置成在图标458、462和466之一处接收另一斑点输入。此外,如先前说明的,在一些实现方式中,弹出窗口454可以在用户104已在麦克风图标116处提供斑点输入超过预定时段前不出现。换言之,可以延迟弹出窗口454的出现,例如以允许用户104有一个时段来关于图4A的用户接口400提供滑动输入。可以实现该特征,因为根据图4A的用户接口400的语言选择配置可以比根据图4B的用户接口450的语言选择配置更快,因此弹出窗口454可以被实现为次级或后备语言选择配置。
现在参考图5,示出了选择用于自动话音识别的语言的示例技术500。在504处,计算设备100能够接收来自用户104的触摸输入。触摸输入能够包括(i)指示向计算设备提供话音输入的请求的斑点输入,(ii)跟在斑点输入之后的指示用于话音输入的自动话音识别的期望语言的滑动输入。在508处,计算设备100能够接收来自用户104的话音输入。在512处,计算设备100能够获得由使用期望语言的话音输入的自动话音识别导致的一个或更多个识别的字符。在516处,计算设备100能够输出一个或 更多个识别的字符。技术500然后能够结束,或返回到504以用于一个或更多个另外的循环。
提供了示例实施方式以使本公开内容将是透彻的,并且将范围充分传达给本领域技术人员。阐述了诸如具体部件、设备和方法的示例的许多具体细节,以提供对本公开内容的实施方式的透彻理解。本领域技术人员明白的是,无需采用具体细节,示例实施例可以以多种不同的形式来体现,并且也不应被解读为限制本公开内容的范围。在一些示例实施例中,没有详细描述公知的过程、公知的设备结构和公知的技术。
本文中所使用的术语仅是为了描述特定示例实施方式的目的,而并不意在进行限制。如本文中所使用的,除非上下文另外明确指明,否则单数形式“一个”、“一”以及“该”也可以意在包括复数形式。术语“和/或”包含一个或更多个相关联的所列举的项目中的任何一个以及所有组合。术语“包括(comprise)”、“包括(comprising)”、“包括(including)”以及“具有(having)”是包含性的,因此指定所陈述的特征、整体、步骤、操作、元件和/或部件的存在,但不排除一个或更多个其它特征、整体、步骤、操作、元件、部件和/或它们的组的存在或添加。除非具体标识为执行的顺序,否则本文中所描述的方法步骤、过程和操作不应被解读为必须要求按照所讨论或示出的特定顺序来执行。还应理解的是可以采用另外的或替代的步骤。
虽然本文中可以使用术语“第一”、“第二”、“第三”等来描述各元件、部件、区域、层和/或部分,但这些元件、部件、区域、层和/或部分不应被这些术语所限制。这些术语仅用于将一个元件、部件、区域、层或部分与另一区域、层或部分区分开。除非上下文明确表示,否则诸如“第一”、“第二”和其它数值术语的术语在本文使用时并不暗示序列或顺序。因此,在不偏离示例实施方式的教导的情况下,可以将以下讨论的第一元件、第一部件、第一区域、第一层或第一部分称为第二元件、第二部件、第二区域、第二层或第二部分。
如本文中所使用的,术语“模块”可以指以下项,或是以下项的一部分,或者包括以下项:专用集成电路(ASIC);电子电路;组合的逻辑电路;现场可编程门阵列(FPGA);执行代码或过程的处理器、或处理器(共享、专用或成组的)与网络集群或数据中心中的存储装置的分布式网络;提供所描述的功能的其它合适部件;或者上述项中的一部分或全部的组合,诸如片上系统。术语“模块”可以包括存储由一个或多个处理器执行 的代码的存储器(共享、专用或成组的)。
如上述所使用的,术语“代码”可以包含软件、固件、字节代码和/或微代码,并且可以指程序、例程、函数、类和/或对象。如上述所使用的,术语“共享”意味着可以使用单个(共享的)处理器来执行来自多个模块的一些或全部代码。另外,可以由单个(共享的)存储器存储来自多个模块的一些或全部代码。如上述所使用的,术语“组”意味着可以使用一组处理器来执行来自单个模块的一些或全部代码。另外,可以使用一组存储器来存储来自单个模块的一些或全部代码。
本文中所描述的技术可以利用由一个或更多个处理器执行的一个或更多个计算机程序来实现。这些计算机程序包括存储在非暂态有形计算机可读介质上的处理器可执行指令。计算机程序还可以包括存储的数据。非暂态有形计算机可读介质的非限制性示例是非易失性存储器、磁存储装置和光存储装置。
根据对信息的操作的算法和符号表示,以上描述的一些部分展现了本文中所描述的技术。这些算法描述和表示是数据处理领域的技术人员为了最有效地将他们的工作的实质传达给本领域的其它技术人员所使用的手段。这些操作在被功能性地或逻辑地描述时,被理解为由计算机程序来实现。此外,己证明在不失一般性的情况下,将操作的这些布置称为模块或由功能名称来指代有时是便利的。
除非另外具体陈述,否则如根据以上讨论显而易见的,应当理解在整个说明书中,利用诸如“处理”或“运算”或“计算”或“确定”或“显示”等术语的讨论是指如下计算机系统或类似电子计算设备的动作或处理:该计算机系统或类似电子计算设备对计算机系统存储器或寄存器或者其它这种信息存储装置、传输或显示设备中被表示为物理(电子)量的数据进行操控和变换。
所描述的技术的某些方面包括本文中以算法的形式描述的处理步骤和指令。应当注意:所描述的处理步骤和指令能够以软件、固件或硬件来体现,并且在以软件体现时,能够被下载以驻留在实时网络操作系统所使用的不同平台上以及从这些不同平台来操作。
本公开内容还涉及用于执行本文中的操作的设备。该设备可以具体地被构造成用于所需的目的,或者可以包括通用计算机,可以利用存储在计算机可以访问的计算机可读介质上的计算机程序来选择性地激活或重新 配置该通用计算机。这样的计算机程序可以存储在有形的计算机可读存储介质中,该有形的计算机可读存储介质诸如但不限于:包括软盘、光盘、CD-ROM、磁光盘的任意类型的盘;只读存储器(ROM);随机存取存储器(RAM);EPROM;EEPROM;磁卡或光卡;专用集成电路(ASIC);或者适合于存储电子指令的任何类型的介质,并且每个都耦合至计算机系统总线。此外,本说明书中所提及的计算机可以包含单个处理器,或者可以是采用多处理器设计以提高计算能力的架构。
本文中所展示的算法和操作不是固有地与任何特定计算机或其它设备相关。根据本文中的教导,各种通用系统也可以与程序一起使用,或者可以证明构造更多个专用设备来执行所需的方法步骤是方便的。对于本领域技术人员而言,多个这些系统的所需结构以及等同变型将是显然的。另外,没有参考任何特定的编程语言来描述本公开内容。应当理解可以使用各种编程语言来实现如本文中所描述的本公开内容的教导,提供对特定语言的任何参考是为了公开本发明的实现和最佳模式。
本公开非常适合于许多拓扑结构的广泛的计算机网络系统。在该领域内,大型网络的配置和管理包括下述存储装置和计算机:该存储装置和计算机经由网络(诸如因特网)通信耦合至不同的计算机和存储装置。
出于说明和描述的目的,已经提供了前面的实施方式描述。该描述并不是意在穷举或限制本公开内容。即使没有具体示出或描述,特定实施方式的各元件或特征通常并不限于该特定实施方式,而是在适用的情况下是可互换的并且能够被用在所选择的实施方式中。特定实施方式的各元件或特征也可以以很多方式变化。这些变化并不视为是对本公开内容的偏离,所有这些修改意在被包括在本公开内容的范围内。

选择用于自动话音识别的语言的技术.pdf_第1页
第1页 / 共18页
选择用于自动话音识别的语言的技术.pdf_第2页
第2页 / 共18页
选择用于自动话音识别的语言的技术.pdf_第3页
第3页 / 共18页
点击查看更多>>
资源描述

《选择用于自动话音识别的语言的技术.pdf》由会员分享,可在线阅读,更多相关《选择用于自动话音识别的语言的技术.pdf(18页珍藏版)》请在专利查询网上搜索。

一种计算机实现的技术包括在包括一个或更多个处理器的计算设备处接收来自用户的触摸输入。触摸输入包括(i)指示向计算设备提供话音输入的请求的斑点输入,(ii)跟在斑点输入之后的指示用于话音输入的自动话音识别的期望语言的滑动输入。该技术包括在计算设备处接收来自用户的话音输入。该技术包括在计算设备处获得由使用期望语言的话音输入的自动话音识别导致的一个或更多个识别的字符。该技术还包括在计算设备处输出一个或更。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 乐器;声学


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1