移动终端和用于修正其文本的方法.pdf

上传人:t**** 文档编号:966101 上传时间:2018-03-21 格式:PDF 页数:59 大小:2.38MB
返回 下载 相关 举报
摘要
申请专利号:

CN200910138034.6

申请日:

2009.05.04

公开号:

CN101593076A

公开日:

2009.12.02

当前法律状态:

驳回

有效性:

无权

法律详情:

发明专利申请公布后的驳回IPC(主分类):G06F 3/048公开日:20091202|||实质审查的生效|||公开

IPC分类号:

G06F3/048; H04M1/247

主分类号:

G06F3/048

申请人:

LG电子株式会社

发明人:

赵在珉; 郭宰到; 尹种根

地址:

韩国首尔

优先权:

2008.5.28 KR 10-2008-0049897

专利代理机构:

中原信达知识产权代理有限责任公司

代理人:

夏 凯;谢丽娜

PDF下载: PDF下载
内容摘要

公开了一种用于按词选择在移动终端中创建的文本并且对其进行修正或改变为另一个词的方法以及一种实现该方法的移动终端。该移动终端包括:显示单元,用于显示文本的一个或多个词,并且显示用于该一个或多个词的每一个的标记;输入单元,用于选择被标记的一个或多个词中的至少一个作为所选择的一个词;以及控制器,用于显示与经由该输入单元所选择的词的发音具有相似发音的候选词,选择这些候选词中的一个作为所选择的一个候选词,并且将从该文本选择的一个词改变成所选择的一个候选词。

权利要求书

1.  一种移动终端,包括:
显示单元,被配置为显示文本的一个或多个词,并且显示用于所述一个或多个词的每一个的标记;
输入单元,被配置为选择所标记的一个或多个词中的至少一个作为所选择的一个词;以及
控制器,被配置为控制与经由所述输入单元选择的所选择的一个词的发音具有相似发音的候选词的显示,选择所述候选词中的一个,并且将所选择的一个词改变成所选择的一个候选词。

2.
  根据权利要求1所述的移动终端,其中,所述控制器将由用户输入的语音转换成所述文本,并且通过按所述一个或多个词中的每一个区别所述文本来标记所述文本。

3.
  根据权利要求1所述的移动终端,其中,与所述文本中其他词相比,所述控制器强调地显示所选择的一个候选词。

4.
  根据权利要求1所述的移动终端,其中,所述控制器标记所述一个或多个词中的每一个的下端或上端,或调整要被标记的信息的透明度并且将所述信息显示为与所述一个或多个词中的每一个重叠。

5.
  根据权利要求1所述的移动终端,其中,所述控制器在所述显示单元的屏幕的一个区域显示所述候选词,并且以从具有最高语音识别率的一个开始的顺序来显示所述候选词。

6.
  根据权利要求1所述的移动终端,其中,当从所述文本选择的所选择的一个词被完全改变成所选择的一个候选词时,与所述文本中未被选择或改变的其他词相比,所述控制器强调地显示所选择的一个候选词。

7.
  根据权利要求1所述的移动终端,其中,当由所述用户连续输入用于指示所述文本修正的语音指令、所述文本中所选择的要被修正的一个词、以及用于修正所选择的一个词的新词时,所述控制器立即将所选择的要被修正的一个词改变成所述新词,并且显示所述新词。

8.
  根据权利要求1所述的移动终端,其中,根据由所述用户先前设置的键、触摸、接近、手指手势、施加于特定部分的压力、姿势(倾斜方向)和语音中的至少一种方法,所述输入单元接收用于选择所选择的一个词和/或所选择的一个候选词的指令。

9.
  一种用于修正移动终端的文本的方法,所述方法包括:
将从用户接收的语音消息转换成文本;
按所述文本的一个或多个词中的每一个来标记所转换的文本;
从所述文本选择所述一个或多个词中的至少一个作为所选择的一个词;
显示与所选择的一个词的发音具有相似发音的候选词;以及
当将所述候选词中的一个选择为所选择的候选词时,将从所述文本所选择的一个词改变为所选择的候选词。

10.
  根据权利要求9所述的方法,其中,通过使用标记所述一个或多个词中的每一个的信息来从所述文本选择所选择的一个词。

11.
  根据权利要求9所述的方法,其中,当将所述语音消息转换成所述文本时或每当由所述用户输入预先设置的特定指令时,自动显示所述标记。

12.
  根据权利要求9所述的方法,其中,所述标记是对于在一个屏幕上显示的所述文本进行显示、按在一个屏幕上显示的所述文本的每一个句子进行显示以及作为数字信息进行显示。

13.
  根据权利要求9所述的方法,其中,在所述文本中选择的或改变的所选择的一个词在至少其色彩、亮度或粗度方面被改变,或在其显示中被闪烁或加下划线,以使得与所述文本中未被选择或改变的其他词相比被强调地显示。

14.
  根据权利要求9所述的方法,其中,当由所述用户连续输入关于用于指示所述文本的修正的语音指令、所述文本中所选择的要被修正的一个词、以及用于修正所选择的一个词的新词的语音信息时,所述文本中所选择的要被修正的一个词立即被改变为所述新词,并且显示所述新词。

15.
  一种移动终端,包括:
显示单元,被配置为显示文本的多个词,其中,分别标记所述多个词中的每一个,以用于识别;
输入单元,被配置为从用户接收输入;以及
控制器,用于通过使用与所选择的一个词的发音具有相似发音的候选词中的一个,基于所述用户经由所述输入单元的所述输入,替换所述文本的所述多个词中所选择的一个。

16.
  根据权利要求15所述的移动终端,其中,所述控制器控制所述显示单元以显示多个所述候选词。

17.
  根据权利要求15所述的移动终端,其中,所选择的一个词被正确地拼写。

18.
  根据权利要求15所述的移动终端,其中,用于所述多个词中的每一个的所述识别是数字。

19.
  根据权利要求15所述的移动终端,其中,相对于所述文本的未被选择的其他词,强调所选择的一个词。

说明书

移动终端和用于修正其文本的方法
技术领域
本发明涉及一种用于按词选择修正在移动终端中创建的文本或将其改变成不同的词的方法,以及具有该方法的移动终端。
背景技术
移动终端是可以被配置为执行各种功能的设备。这样的功能的示例包括数据和语音通信,经由照相机捕捉图像和视频,记录音频,经由扬声器系统播放音乐文件,以及在显示器上显示图像和视频。某些终端包括支持玩游戏的附加功能,而其他终端被配置为多媒体播放器。最近,移动终端已经被配置为接收广播和多播信号,这允许浏览诸如视频和电视节目的内容。
正在努力支持和增加移动终端的功能。这样的努力包括软件和硬件改善,以及在形成该移动终端的结构组件中的改变和改善。就设计而言,可以将折叠型、滑盖型、直板型或旋转型设计应用于移动终端。
此外,正在做出将语音识别功能应用至移动终端的努力。例如,将语音转换成文本的STT(话音至文本)功能允许用户简单地输入文本,从而在移动终端中很容易地创建文本消息。然而,不能期望始终完美的语音识别,而且可能输出错误识别的文本。因此,为了修正错误识别的文本,用户应将光标移动至错误识别的文本,并且逐个字母地修正该文本。
发明内容
因此,本发明的一个目的是解决上面所指出的以及其他问题。
本发明的另一目的是提供一种用于按词选择在移动终端中创建的文本并且对其进行修正或将其改变成另一个词的方法,以及实现该方法的移动终端。
本发明的再一目的是提供一种用于标记并显示在移动终端中创建的文本使得能够按词来选择所标记的文本的方法,以及实现该方法的移动终端。
本发明的又一目的是提供一种用于通过使用语音或通过使用多个输入单元按词选择在移动终端中创建的文本的方法,以及实现该方法的移动终端。
本发明的另一目的是提供一种用于显示与从在移动终端中创建的文本选择的特定词的发音具有相似发音的候选词并且将该选择的词改变成候选词之一的方法。
为了实现如此处所具体实施和广泛描述的这些和其他优势并且根据本发明的目的,本发明在一方面提供一种移动终端,该移动终端包括:显示单元,其被配置为显示文本的一个或多个词并且显示用于该一个或多个词中的每一个的标记;输入单元,其被配置为选择被标记的一个或多个词中的至少一个作为所选择的一个词;以及控制器,其被配置为控制候选词的显示,所述候选词与经由输入单元所选择的一个所选词的发音具有相似的发音,选择所述候选词中的一个,并且将所选择的词改变成所选择的一个候选词。
为了实现如此处所具体实施和广泛描述的这些和其他优势并根据本发明的目的,本发明在另一方面提供一种用于修正移动终端的文本的方法,该方法包括:将从用户接收的语音消息转换成文本;按照该文本的一个或多个词中的每一个来标记所转换的文本;从文本中选择该一个或多个词中的至少之一作为所选择的一个词;显示与所选择的一个词的发音具有相似发音的候选词;并且当选择候选词中的一个作为所选择的候选词时,将从文本所选择的一个词改变成所选择的候选词。
为了实现如此处所具体实施和广泛描述的这些和其他优势并根据本发明的目的,本发明在另一方面提供了一种移动终端,该移动终端包括显示单元,其被配置为显示文本的多个词,其中,分别标记多个词中的每一个,以用于识别;输入单元;其被配置为从用户接收输入;以及控制器,其通过利用与选择的一个词的发音具有相似发音的候选词中的一个,基于用户经由输入单元的输入,替换文本的多个词中被选择的一个。
根据本发明的移动终端具有以下效果:它可以按词简单地选择在识别语音之后所转换的文本,并且可以对其修正或将其变成不同的词。
根据本发明的移动终端具有以下效果:它可以按词标记在识别语音之后所转换的文本并且显示文本,以使得能够简单地选择这些词。
根据本发明的移动终端具有以下效果:通过使用语音或通过使用多个输入单元,可以从在识别语音之后所转换的文本中选择特定的词。
根据本发明的移动终端具有以下效果:显示与从语音识别之后所转换的文本中选择的特定词的发音具有相似发音的候选词,并且将所选择的词改变成候选词中的一个。
根据下文的具体描述,本发明的应用性的进一步范围将变得显而易见。然而,应理解的是,虽然示出了本发明的优选实施例,但具体描述和特定示例仅是说明目的,因为根据该具体描述,在本发明的精神和范围内的各种变更和修改对于本领域的技术人员将是显而易见的。
附图说明
根据下文所给出的详细描述和附图,本发明将得到更全面的理解,详细描述和附图仅通过说明而给出,因此,不限制本发明,其中:
图1是实现本发明实施例的移动终端的示意性框图;
图2是实现本发明实施例的移动终端的前视图;
图3是实现本发明实施例的移动终端的后视图;
图4是无线通信系统的框图,利用该无线通信系统,根据本发明实施例的移动终端可操作;
图5是示出根据本发明实施例的用于通过使用语音控制移动终端的菜单的方法的过程的流程图。
图6A是示出根据本发明实施例的用于激活移动终端的语音识别功能的方法的显示屏概略图;
图6B和6C是示出根据本发明实施例的用于输出移动终端的帮助信息的方法的显示屏概略图;
图7A是示出根据本发明实施例的用于识别移动终端的语音指令的方法的过程的流程图;
图7B是示出根据本发明实施例的移动终端的语音识别方法的视图;
图8是示出根据本发明的用于根据移动终端的语音识别率显示菜单的方法的视图;
图9是示出根据本发明实施例的移动终端的语音指令识别方法的显示屏概略图;
图10是示出根据本发明实施例的在移动终端的语音识别方法中所使用的数据库系统的框图;
图11是示出根据本发明实施例的移动终端的文本修正方法的过程的流程图;
图12A至12C是示出根据本发明实施例的用于在移动终端中标记语音识别的文本的方法的显示屏概略图;
图13是示出根据本发明实施例的用于选择任意词以修正在移动终端屏幕上显示的文本的方法的显示屏概略图;
图14是示出根据本发明实施例的用于为用户在移动终端屏幕上显示的文本中选择的特定词显示候选词的方法的显示屏概略图;
图15A和15B是示出根据本发明实施例的用于通过选择在移动终端上显示的候选词中的一个来改变文本词的方法的显示屏概略图;
图16是示出根据本发明实施例的用于通过使用移动终端中的语音指令来修正文本的方法的过程的流程图;
图17是示出根据本发明实施例的用于通过使用语音指令从在移动终端屏幕上显示的文本选择任意词的方法的显示屏概略图;
图18A是示出根据本发明实施例的用于通过语音选择在移动终端屏幕上显示的候选词中的一个的方法的显示屏概略图;以及
图18B是示出根据本发明实施例的用于通过语音从在移动终端上显示的文本中选择任意词并且修正该词的方法的显示屏概略图。
具体实施方式
现在将具体参考本发明的某些示例性实施例,其示例在附图中示出。在描述本发明中,如果对于相关已知功能或构造的具体解释被认为是不必要地转移本发明的要旨,那么这种解释已经被省略,但本领域的技术人员应当理解。在参考附图描述本发明中,将相同的附图标记用于执行相同或相似功能的元件。现在将参考附图,具体描述根据本发明实施例的移动终端。
图1是根据本发明实施例的移动终端的框图。该移动终端可以以各种结构或形式实现。这样的移动终端的示例包括移动电话、用户设备、智能电话、计算机、数字广播终端、个人数字助理、便携式多媒体播放器(PMP)、导航设备等。
如图1所示的移动终端100可以包括无线通信单元110、A/V(音频/视频)输入单元120、用户输入单元130、感测单元140、输出单元150、存储器160、接口单元170、控制器180、以及电源单元190等。图1示出了具有各种组件的移动终端100,但应理解的是,不需要实现所有示出的组件。可以选择性地实现其更多或更少组件。
下面将具体描述该移动终端的元件。无线通信单元110通常包括一个或多个组件,该一个或多个组件允许在移动终端100与无线通信系统或该移动终端100所处的网络之间进行无线电通信。广播接收模块111经由广播信道从外部广播管理服务器(或其他网络实体)接收广播信号和/或广播相关信息。该广播信道可以包括卫星信道和地面信道。该广播管理服务器可以指生成和发送广播信号和/或广播相关信息的系统,或者接收先前生成的广播信号和/或广播相关信息并将其发送至终端的服务器。广播相关信息的示例可以包括关于广播信道、广播节目、广播服务提供商等的信息。广播信号可以包括TV广播信号、无线电广播信号、数据广播信号等。而且,该广播信号可以进一步包括与TV或无线电广播信号合成的广播信号。
也可以经由移动通信网络(例如,根据诸如3GPP、3GPP2、IEEE、CDMA、GSM、OMA、所谓的4G技术等标准操作的移动通信网络)提供广播相关信息,并且,在该情形下,可以通过移动通信模块112接收广播相关信息。广播信号可以以各种形式存在。例如,它可以以数字多媒体广播(DMB)的电子节目指南(EPG)、手持数字视频广播(DVB-H)的电子服务指南(ESG)等形式存在。
广播接收模块111可以被配置为通过使用各种类型的广播系统来接收广播信号。具体而言,广播接收模块111可以通过使用诸如地面多媒体广播(DMB-T)、卫星数字多媒体广播(DMB-S)、手持数字视频广播(DVB-H)、被称为媒体仅前向链路(MediaFLOTM)的数据广播系统、地面集成服务数字广播(ISDB-T)等的数字广播系统来接收数字广播信号。广播接收模块111被配置为适合于提供广播信号的每个广播系统以及上述数字广播系统。可以将经由广播接收模块111所接收的广播信号和/或广播相关信息存储在存储器160(或其他类型存储介质)中。
移动通信模块112向基站(例如,接入点、节点B等)、外部终端(例如其他用户设备)以及服务器(或其他网络实体)的至少一个发送无线电信号和/或从其接收无线电信号。这样的无线电信号可以包括语音呼叫信号、视频呼叫信号或根据文本和/或多媒体消息发送和/或接收的各种类型数据。
无线因特网模块113支持用于该移动终端的因特网接入。该模块可以内部地或外部地耦接至移动终端100。短程通信模块114指用于支持短程通信的模块。短程通信技术的某些示例包括蓝牙(BluetoothTM)、射频识别(RFID)、红外数据协会(IrDA)、超宽带(UWB)、紫蜂(ZigBeeTM)等。
位置信息模块115是用于检查或获取移动终端的位置(或定位)的模块。例如,通过使用从多个卫星接收位置信息的GPS(全球定位系统)模块,可以实现位置信息模块115。此处,位置信息可以包括由纬度和经度值所表示的坐标信息。例如,GPS模块可以测量离三颗或更多卫星的准确的时间和距离,并且基于三个不同距离,根据三角法(或三角测量)准确地计算移动终端100的当前位置。可以使用获取离三颗卫星的距离和时间信息并且利用单个卫星执行误差修正的方法。具体而言,GPS模块可以从卫星接收的位置信息,获取准确时间与三维速度信息以及纬度、经度和高度值的位置。
A/V输入单元120被配置为接收音频或视频信号。A/V输入单元120可以包括照相机121(或其他图像捕捉设备)以及麦克风122(或其他拾音设备)。照相机121处理通过在视频捕捉模式或图像捕捉模式中的图像捕捉设备所获取的静止图片或视频的图像数据。处理后的图像帧可以在显示单元151(或其他可视输出设备)上显示。可以将由照相机121处理的图像帧存储在存储器160(或其他存储介质)中或经由无线通信单元110发送。根据移动终端的构造,可以提供两个或更多照相机121。
麦克风122可以在电话呼叫模式、记录模式、语音识别模式等中经由麦克风(或类似设备)接收声音(听觉数据),并且可以将这样的声音处理成音频数据。在电话呼叫模式情形下,可以将处理后的音频(语音)数据转换成可经由移动通信模块112发送至移动通信基站(或其他网络实体)格式以用于输出。麦克风122可包括各种类型的噪声消除(或抑制)算法,以消除(或抑制)在接收和发送音频信号过程中产生的噪声或干扰。
用户输入单元130(或其他用户输入设备)可以根据用户输入的命令生成键输入数据,以控制移动终端的各种操作。用户输入单元130允许用户输入各种类型的信息,并且可以包括小键盘、薄膜开关、触摸板(例如,检测电阻、压力、电容等变化的触感元件)、滚轮(jogwheel)、微动开关等。具体而言,当触摸板以分层方式覆盖在显示单元151上时,它可以被称为触摸屏。
感测单元140(或其他检测装置)检测移动终端100的当前状况(或状态),诸如移动终端100的打开或关闭状态、移动终端100的位置、用户与移动终端100的接触(即触摸输入)存在与否、移动终端100的朝向、移动终端100的加速或减速运动和方向等,并且生成用于控制移动终端100的操作的命令或信号。例如,当移动终端100是滑盖型移动电话时,感测单元140可以感测滑盖型电话是打开还是关闭。此外,感测单元140可以检测电源单元190是否供电或接口单元170是否与外部设备耦接。
接口单元170(或其他连接装置)作为与移动终端100连接的至少一个外部设备的接口。例如,外部设备可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的设备的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等。
此处,识别模块可以是芯片(或其他具有存储器或存储能力的元件),其存储用于验证使用移动终端100的授权的各种信息,并且可以包括用户身份模块(UIM)、订户身份模块(SIM)、通用订户身份模块(USIM)等。此外,具有识别模块的设备(下文中被称为“识别设备”)可以采用智能卡的形式。因此,该识别设备可以经由端口或其他连接装置与终端100连接。
接口单元170可以用于从外部设备接收输入(例如,数据、信息、电力等),并且将接收到的输入传送至在移动终端100内的一个或多个元件,或可以被用于在移动终端和外部设备之间传送数据。输出单元150被配置为以视觉、听觉和/或触觉方式(例如音频信号、视频信号、警报信号、振动信号等)提供输出。输出单元150可以包括显示单元151、音频输出模块(或声音输出模块)152、警报单元153等。
显示单元151可以输出在移动终端100中处理的信息。例如,当移动终端100处于电话呼叫模式时,显示单元151可以显示与呼叫或其他通信(诸如文本消息、多媒体文件下载等)相关的用户界面(UI)或图形用户界面(GUI)。当移动终端100处于视频呼叫模式或图像捕捉模式时,显示单元151可以显示捕捉到的图像和/或接收到的图像、示出视频或图像以及与其相关的功能的UI或GUI等。
同时,当显示单元151和触摸板以分层方式覆盖形成触摸屏时,显示单元151可以起到输入设备和输出设备的作用。显示单元151可以包括液晶显示器(LCD)、薄膜晶体管-LCD(TFT-LCD)、有机发光二极管(OLED)、柔性显示器、三维(3D)显示器等中的至少之一。移动终端100根据其实施例可以包括两个或更多个显示单元(或其他显示装置)。例如,移动终端可以包括外部显示单元(即使在移动电话被关闭时也可以查看),以及内部显示单元(如果移动电话被打开时,则可以被查看)。
音频输出模块152在呼叫信号接收模式、呼叫模式、记录模式、语音识别模式、广播接收模式等中,可以输出从无线通信单元110接收的或在存储器160中存储的音频数据。而且,音频输出模块152可以提供关于由移动终端100所执行的特定功能的听觉输出(例如,呼叫信号接收声音、消息接收声音等)。音频输出模式152可以包括扬声器、蜂鸣器或其他声音产生设备。
]警报单元153(或其他类型的用户通知装置)可以提供输出,以通知移动终端100的事件的发生。典型的事件可以包括呼叫接收、消息接收、键或按钮输入等。除了音频或视频输出,警报单元153可以以不同方式提供输出,以通知事件的发生。例如,警报单元153可以以振动的形式提供输出(或其他触觉输出)。当接收到呼叫、消息或其他进入的通信时,警报单元153可以提供触觉输出(即,振动)以通知用户。通过提供触觉输出,用户可以识别各种事件的发生,即使他的移动电话在其口袋中。通知事件发生的输出也可以经由显示单元151或音频输出模块152来提供。
存储器160(或其他存储装置)可以存储软件程序或类似的用于由控制器180执行的处理和控制操作,或可以临时存储已经被输入或要输出的数据(例如,电话簿、消息、静止图像、视频等)。存储器160可以包括至少一种类型的存储介质,该存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如SD或DX存储器等)、随机存取存储器(RAM)、静态随机存取存储器(SRAM)、只读存储器(ROM)、电可擦可编程只读存储器(EEPROM)、可编程只读存储(PROM)磁存储器、磁盘、光盘等。而且,移动终端100可以通过网络连接与执行存储器160的存储功能的网络存储设备协作。
控制器180(诸如微处理器等)通常控制移动终端100的总体操作。例如,控制器180执行与语音呼叫、数据通信、视频呼叫等相关的控制和处理。此外,控制器180可以包括用于再现(或回放)多媒体数据的多媒体模块181。多媒体模块181可以被构造在控制器180内或可以被构造为与控制器180分离。电源单元190接收外部电力(经由电缆连接)或内部电力(经由移动电话的电池),并且提供用于在控制器180的控制之下操作各个元件和组件所需要的适当电力。
可以使用例如计算机软件、硬件或其组合,在计算机可读介质中实现此处所描述的各种实施例。对于硬件实现,可以通过使用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑设备(PLD)、场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器、设计为执行此处所描述的功能的电子单元中的至少一个,实现此处描述的实施例。在某些情形中,这样的实施例可以实现在控制器180中。对于软件实现,诸如过程或功能的实施例可以与允许执行至少一个功能或操作的单独软件模块一起实现。可以通过以任何适当的编程语言所写的软件应用(或程序)实现软件代码。软件代码可以存储在存储器160中,并且可由控制器180执行。
到目前为止,已经从移动终端功能的角度描述了该移动终端。下文,将参考图2和3,从外部元件功能的角度描述移动终端的外部元件。移动终端可以以多种不同构造实现。这样的构造的示例包括折叠型、直板型、旋转型、滑盖型、以及各种其他构造。下列描述将主要涉及滑盖型移动终端。然而,这样的描述可以同样应用于其他类型移动终端。
图2是根据本发明的实施例的移动终端的前视图。这样的移动终端可以包括第一主体200以及可相对于第一主体200沿着至少一个方向滑动地移动的第二主体205。第一主体设置成与第二主体205重叠的状态可以被称为关闭构造,如在图2中所示,第二主体205的至少部分曝露的状态可以被称为打开构造。在关闭构造中,移动终端主要在待机(或空闲)模式中操作,并且在用户操控时可以释放该待机模式。在打开构造中,移动终端主要在呼叫模式等中操作,并且随着时间流逝或在用户操控时,其可以改变成待机模式。
构成第一主体200的外观的壳体(或外壳、外罩、盖子等)可以包括第一前壳体220以及第一后壳体225。将各种电子组件安装在第一前壳体220和第一后壳体225之间的空间中。一个或多个中间壳体可以被附加地设置在第一前壳体220和第一后壳体225之间。这些壳体可以通过合成树脂注射成模形成,或可以由诸如不锈钢(STS)或钛(Ti)等的金属材料制成。
显示单元151、音频输出模块152、照相机121或第一用户输入单元210可以位于第一主体200上,具体而言,在第一主体200的第一前壳体220上。显示单元151可以包括视觉地显示信息的LCD(液晶显示器)、OLED(有机发光二机管)等。触摸板可以以分层方式覆盖在显示单元151上,以允许显示单元151用作显示屏,以通过用户手势或触摸输入来输入信息。也可以通过所谓的接近检测技术实现用户触摸输入,通过该技术,当用户的手指或触笔置于屏幕附近而不用实际触摸屏幕本身时,可以被检测到。
音频输出单元152可以以扬声器或其他声音产生设备的形式实现。照相机121可以实现为适合于捕捉关于用户和其他物体的图像或视频。
如同第一主体200,构成第二主体205的外观的壳体可以包括第二前壳体230和第二后壳体235。第二用户输入单元215可以设置在第二主体205的前部,具体而言,在第二前壳体230上。第三用户输入单元245、麦克风122和接口单元170可以设置在第二前壳体230和第二后壳体235中的至少一个上。
第一至第三用户输入单元210、215和245可以被统称为操控单元130,并且可将各种方法和技术用于该操控单元130,只要它们能够被用户以触觉方式操作。例如,用户输入单元130可以实现为薄膜开关、致动器、或能够根据用户触摸操作(例如按压、推动、敲击、拖放等)接收用户命令或信息的触摸板区域,或可以以可转动控制轮(或盘)、键或按钮、拨杆、操纵杆等形式实现。就其功能而言,将第一用户输入单元210用于输入(键入)诸如启动、结束、滚动等的命令,并且将第二用户输入单元215用于输入(键入)数字、字符、符号等。而且,第三用户输入单元245可以支持所谓的热键功能,热键功能允许更方便地激活用于该移动终端的特定功能。可以将麦克风122(或其他声音采集设备)适当地实现为检测用户语音输入、其他声音等。
接口单元170可以用作通信链路(或通道、路径等),通过该通信链路,终端可以与外部设备交换数据等。例如,接口单元170可以以用于经由固定或无线装置将耳机连接至移动终端的连接端口、用于短程通信的端口(例如,红外数据协会(IrDA)端口、蓝牙(BluetoothTM)端口、无线LAN端口等)、用于向移动终端供电的电源端口等形式实现。而且,接口单元170可以是卡槽,用于容纳SIM(订户识别模块)卡或UIM(用户身份模块)卡或用于存储信息的诸如存储卡的外部卡。用于向终端供电的电源单元190可以位于第二后壳体235。电源单元190可以是例如可拆卸的可充电电池。
图3是根据示例性实施例的图2的移动终端的后视图。如在图3中所示,照相机121(或其他图像拾取设备)可以附加地设置在第二主体205的第二后壳体235的后表面上。第二主体205的照相机121可以具有与第一主体200的照相机121基本相反的图像捕捉方向(即,这两个照相机可以被实现为朝向相反的方向,诸如前方和后方),并且可以支持与第一主体的照相机121不同数目的像素(即,具有不同分辨率)。
例如,在反向链路带宽能力可能受限的视频呼叫通信等期间,第一主体200的照相机121可以以相对较低的分辨率操作,以捕捉用户面部的图像,并且立即将这样的图像实时发送至另一方。而且,第二主体205的照相机121可以以相对高的分辨率操作,以高画面质量捕捉一般物体的图像,这些图像可能不需要立即实时传送,但可以被存储以用于未来查看或使用。附加的照相机相关组件,诸如闪光灯250和镜子255,可以附加地设置在第二主体205的照相机121的附近。当利用第二主体205的照相机121捕捉对象的图像时,闪光灯250照亮该对象。当用户希望通过使用第二主体205的照相机121来捕捉其自己的图像(即,自我图像获取)时,镜子255允许用户看到其自己。
第二后壳体235还可以包括音频输出模块152。音频输出模块152与第一主体200的音频输出模块152结合,可以支持立体声功能,并且也可以被用于在扬声器电话模式中发送和接收呼叫。除了用于移动通信的天线以外,广播信号接收天线260可以(外部地或内部地)设置在第二后壳体235的一侧或区域。天线260也可以被配置为可从第二主体205缩回。
允许第一主体200和第二主体205相对于彼此滑动的滑动模块265的一部分可以设置在第一主体200的第一后壳体225上。滑动模块265的另一部份可以设置在第二主体205的第二前壳体230上,其可以不像图3所示被曝露。
第二照相机121和其他组件可以设置在第二主体205上,但并不意味着限制于这样的构造。例如,设置在第二后壳体235上的一个或多个元件(例如,260、121和250以及152等)可以安装在第一主体200上,主要在第一后壳体225上。在这种情形下,在移动终端100的关闭构造中,通过第二主体205保护(或遮盖)设置在第一后壳体225上的那些元件。此外,即使未将单独的照相机设置在第二主体,照相机模块121可以被配置为旋转(或以其他方式移动),从而允许以各种方向捕捉图像。
如图1至3所示的移动终端100可以被配置为与通信系统操作,该通信系统经由帧或分组发送数据,诸如有线和无线通信系统,以及基于卫星的通信系统。现在将参考图4,描述根据本发明的移动终端可以在其中操作的这样的通信系统。
这样的通信系统可以使用不同的空中接口和/或物理层。例如,通信系统所利用的空中接口包括例如:频分多址(FDMA)、时分多址(TDMA)、码分多址(CDMA)以及通用移动通信系统(UMTS)(具体而言,长期演进(LTE))、全球移动通信系统(GSM)等。作为非限定性示例,下文的描述涉及CDMA通信系统,但这些教导同样适用于其他类型系统。
参考图4,CDMA无线通信系统可以包括多个移动终端100、多个基站(BS)270、基站控制器(BSC)275、以及移动交换中心(MSC)280。移动交换中心280被配置为与公共交换电话网络(PSTN)290对接。MSC 280也被配置为与BSC 275对接,BSC 275可以经由回拉线路耦连至基站270。该回拉线路可以根据若干个已知接口中的任何一个来构造,这些接口包括例如E1/T1、ATM、IP、PPP、帧中继、HDSL、ADSL或xDSL。应理解的是,如在图4中所示的系统可以包括多个BSC 275。
每个BS 270可以服务一或多个区段(sector)(或区域),每个区段由具有全向天线或指向放射状远离BS 270的特定方向的天线所覆盖。可选地,每个区段可以由用于分集接收的两个或更多个天线覆盖。每个BS 270可以被配置为支持多个频率分配,每个频率分配都具有特定频谱(例如,1.25MHz、5MHz等)。区段与频率分配的交会可以被称为CDMA信道。BS 270也可以指基站收发器子系统(BTS)或其他的等价术语。在这种情形下,术语“基站”可被用来统称单个BSC 275和至少一个BS 270。基站也可以被称为“小区站点”。可选地,特定BS 270的各个区段可以被称为多个小区站点。
如在图4中所示的,广播发送器(BT)295将广播信号发送至在该系统中操作的移动终端100。在终端100提供如在图1中所示的广播接收模块111以接收由BT 295所发送的广播信号。在图4中,示出了若干个全球定位系统(GPS)卫星300。卫星300协助定位多个终端100中的至少一个。在图4中,描述了两个卫星300,但应理解的是,可以利用任何数目的卫星获取有用的定位信息。如在图1中所示的GPS模块115通常被配置为与卫星300协作,以获取期望的定位信息。作为GPS跟踪技术的替代,或除了GPS跟踪技术以外,可以使用可以跟踪移动终端位置的其他技术。此外,GPS卫星300中的至少一个可以选择性地或附加地处理卫星DMB传输。
作为无线通信系统的一种典型操作,BS 270从各种移动终端100接收反向链路信号。移动终端100通常进行呼叫、消息传送以及其他类型通信。由特定基站270所接收的每个反向链路信号在特定BS 270内被处理。结果数据被转发至相关的BSC 275。BSC提供呼叫资源分配和移动性管理功能,包括在BS 270之间的软切换过程的协调。BSC275还将接收到的数据路由至MSC 280,MSC 280提供用于与PSTN290对接的附加路由服务。类似地,PSTN 290与MSC 280对接,MSC与BSC 275对接,并且BSC 275进而控制BS 270,以将前向链路信号发送至移动终端100。
根据本发明的实施例的移动终端包括存储在存储器160中的用于语音识别的算法和用于STT(话音至文本)的算法,并且通过关联在该移动终端中所提供的任意功能,即语音识别功能和STT功能,将用户输入的语音转换成文本。转换的文本可以被输出至该功能的执行屏幕。此处,该特定功能可以包括创建用于文本消息的文本或邮件的功能。当执行文本消息或邮件创建功能时,控制器180可以激活语音识别功能,并且自动操作STT功能。
图5是示出了根据本发明实施例的用于通过使用语音来控制移动终端的菜单的方法的过程的流程图。在接收到激活控制信号时,移动终端的控制器180可以开始激活语音识别功能(S101)。可以使用该激活控制信号来终止激活的语音识别功能。
通过操控在该终端中设置的特定硬件按钮、在显示单元151上显示的软件按钮、通过施加触摸或通过操控在显示单元151上显示的特定菜单,可以生成激活控制信号。或者,通过特定声音、短程无线电信号或远程电无线信号,或者甚至通过包括手的运动或用户的手势的人体运动信息,可以生成该激活控制信号。特定声音可以包括诸如拍手声音的特定等级或更高等级的一种冲击声音。可以通过使用简单的声音等级检测算法(未示出)来检测特定等级的声音或更高等级的声音。
声音等级检测算法较之语音识别算法可以相对简单,消耗较少量的移动终端的资源。声音等级检测算法(或电路)可以被配置为从语音识别算法(或电路)分离,或者可以被实现为限制语音识别算法的部分功能。
经由无线通信单元110可以接收无线电信号,并且经由感测单元140可以接收用户的手的移动或手势。用于接收激活控制信号的无线通信单元110、用户输入单元130和感测单元140可以被统称为信号输入单元。
当语音识别功能被激活时,控制器参考特定数据库,分析经由麦克风122所接收的语音数据或语音指令的上下文或内容,以确定该语音指令的含义(S103、S104)。此处,随着语音识别功能被激活,被参考以识别语音指令的含义的数据库的信息域可以被指定给与特定功能或菜单相关的信息(S102)。例如,该指定信息域可以被指定给与在显示单元151上当前输出的菜单相关的信息或与从菜单中选择的特定菜单的子菜单相关的信息。因为指定了被参考以识别语音指令的数据库的信息域,因此能够进一步提高语音指令的识别率。
与子菜单相关的信息可以被配置为数据库。该信息可以具有关键字形式,并且多个信息可以对应于一个功能或一个菜单。根据信息的特性可以配置多个数据库并且可以将这些数据库存储在存储器160中。通过学习,可以更新每个数据库中所配置的信息。此外,为了改善语音指令的识别率,每个数据库的信息可以被指定给与当前输出功能或菜单相关的信息。随着菜单深度的增加,可以改变该信息域。
在临时存储输入的语音指令以后,当激活的语音识别功能被终止时,可以立即启动用于确定语音指令含义的操作,或当在语音识别功能被激活的状态中输入语音指令时,可以同时执行用于确定语音指令含义的操作。
同时,虽然语音识别功能处于激活状态,控制器可以连续地驱动用于检测触摸或按钮输入的算法。因此,即使处于语音识别功能被激活的状态,除了语音指令以外控制器180可以经由诸如触摸或按钮的任何其他输入单元选择或执行特定菜单(S109、S110)。当语音指令的含义被确定时,控制器180可以输出相应结果(S105)。该结果可以包括:控制信号,该控制信号用于执行与对应于语音指令的含义的功能或服务相关的菜单或控制该终端的特定元件;或与识别的语音指令相关的数据显示信息。
当输出或执行结果时,控制器180可以接收关于结果是否正确的用户配置(S106)。例如,如果语音指令具有低识别率或被识别为具有多个含义,则控制器180输出与每个含义相关的多个菜单,并且根据用户的选择执行这些菜单。或者,控制器可以简单地询问是否执行具有较高识别率的特定菜单,并且根据用户选择或响应,执行或显示相应功能或菜单。
通过输出消息或语音(例如,希望执行文本消息创建功能?请回答是或否,如果不回复,则在五秒钟后将自动执行文本消息创建功能),可以向用户确认是否执行特定菜单。因此,用户可以通过使用语音或其他输入单元进行响应(例如,1:是;2:否),并且其他输入单元可以包括硬件按钮或软件按钮或触摸。如果不存在来自用户的响应,则控制器180可以将其确定为肯定响应,并且自动执行该功能或菜单(S107)。如果用户的响应是否定的,即,如果语音指令的含义未被准确地确定,则可以执行错误处理过程(S108)。
在错误处理过程中,再次接收语音指令或者显示特定识别率或更高识别率的多个菜单(或被解释为具有相似含义的多个菜单),然后,用户可以选择其中一个。如果具有特定或更高识别率的功能或菜单的数目小于特定数目(例如,两个),则该功能或该菜单可以被自动执行。
图6A是示出根据本发明实施例的用于激活移动终端的语音识别功能的方法的显示屏概略图。当语音识别功能保持在激活状态时,连续驱动语音识别算法增加了资源和电力消耗。因此,为了减少移动终端的不必要的电力或资源消耗,应该控制语音识别功能激活的启动或终止。在本发明中,可以使用用户输入单元130的任意按钮来控制该激活(411)。
该任意按钮可以是硬件按钮、软件按钮或在显示单元151上显示的图标(411)。软件按钮包括处于待机状态的菜单调用按钮。即,在待机状态中当输入菜单调用按钮时,控制器180可以激活语音识别功能,同时输出菜单列表。此外,如果触摸显示单元151的未显示内容的任意区域(即,未显示按钮或菜单图标的区域),通过控制器可以控制语音识别功能的激活(420)。
如果输入特定等级或更高等级的声音,则控制器180可以控制语音识别功能的激活(430)。例如,可以以两种类型的模式驱动语音识别功能。即,可以以第一模式和第二模式驱动语音识别功能,在该第一模式中,简单地检测特定等级或更高等级的声音;在第二模式中,识别语音指令并且确定其含义。在第一模式中当输入特定等级或更高等级的声音时,可以激活第二模式以识别语音指令。当输入短程或远程无线电信号或包括用户的手运动或手势的身体运动信息时,可以控制语音识别功能的激活(440)。
随着语音识别功能被激活,控制器180可以将能够被参考以用于语音识别的特定数据库的信息域指定给在显示单元151上显示的菜单列表相关的信息。如果从菜单列表中选择或执行特定菜单,则数据库的信息域可以被指定给与所选择的菜单或其子菜单相关的信息。
当根据语音指令或触摸输入选择或执行特定菜单时,控制器180可以通过语音或以气球帮助形式输出与子菜单相关的帮助信息。例如,如在图6B中所示的,当选择“多媒体菜单”时,与其子菜单(例如,广播、照相机、文本浏览器、游戏等)相关的信息可以被输出为帮助信息(441、442)。或者,如在图6C中所示的,当用户手指接近特定菜单443以选择特定菜单时,可以输出子菜单列表444。当在显示单元151上显示时,根据接近距离,可以调整帮助信息的透明度或亮度。
在保持激活状态一定时间以后,控制器可以自动终止该激活状态。此外,控制器180可以仅当特定按钮或触摸被输入时才保持激活状态,并且当输入被释放时,控制器180可以终止该激活状态。而且,如果在激活状态启动之后的一定时间或更长时间未输入语音,则控制器可以自动终止该激活状态。
图7A是示出了根据本发明实施例的用于识别移动终端的语音指令的方法的过程的流程图。随着语音识别功能被激活,控制器180可以将能够被参考以用于语音识别的信息域指定给与在显示单元151上显示的菜单、其子菜单或当前执行的功能或菜单相关的信息(S201)。可以将在语音识别功能被激活之后接收的语音指令存储在存储器160的特定数据库中(S202、S203)。
当在信息域被指定的状态中接收到语音指令时,控制器180通过使用语音识别算法,在数据库的指定信息域内分析该语音指令的内容和上下文。为了分析该语音指令,该语音指令可以被转换成文本类型的信息,并且可以将该文本类型的信息存储在存储器160的特定数据库中(S204)。然而,该语音指令可以不必被转换成文本类型的信息。
为了分析内容和上下文,控制器180可以检测在语音指令中包含的特定词或关键字(S205)。基于该检测到的词或关键字,控制器180可以分析语音指令的内容或上下文,并且参考在特定数据库中存储的信息来确定其含义(S206)。
可以将被参考的数据库的信息域指定为与当前执行的功能或菜单相关的信息域,并且可以执行与参考数据库所确定的语音指令的含义相对应的功能或菜单(S207)。例如,假设执行文本消息创建功能,然后通过使用STT功能输入文本,用于识别语音指令的信息域的优先级可以被设置给与文本修正相关的指令,或者与搜索用于消息传输的其他方相关或者与消息传输相关的指令。因为将用于语音识别的信息域指定给与特定菜单相关的信息,所以可以改善语音识别的速度和识别率,并且可以减少资源的消耗。
识别率可以指与在特定菜单中设置的名称一致的程度。通过在包含在语音指令中的信息中的与特定功能或菜单相关的信息条的数目,可以确定语音指令的识别率。因此,如果语音指令中包括与特定功能或菜单精确一致的信息,则该语音指令的识别率可能是高的。例如,如在图7B中所示的,如果输入了包括六个词(例如,I want to send textmessage(我想发送文本消息))的自然语言的语音指令,则通过与特定菜单(例如,文本消息)相关的有意义的词(例如,“send(发送)”、“text(文本)”、“message(消息)”)的数目,可以确定其识别率。在语音指令中包含的词是否与特定功能或菜单相关可以根据存储在数据库中的信息而不同。例如,在自然语言的语音指令中(例如,I wantto send text message(我想发送文本消息)),与菜单无关的无意义词可以是语法上的主语(I)或介词(to)。
此处,自然语言是人们在日常生活中所通常使用的语言,它区别于人工创建的人工语言,并且通过使用自然语言处理算法可以对其进行处理。自然语言可以包含或可以不包含与特定菜单相关的准确名称,因此,实际上可能难以以100%的比率准确地识别语音指令。因此,如果识别率高于特定值(例如,80%),可以认为是准确的。如果存在具有这样识别率的多个含义(即,如果输入的语音指令可以被解释为若干个含义,每个都具有相似的识别率),则显示相应的多个菜单,并且可以根据用户选择,执行至少一个功能或菜单。
在显示菜单中,可以按照从具有最高识别率的菜单开始的顺序来显示菜单。例如,如在图8中所示的,具有最高识别率的菜单图标可以显示为更靠近屏幕中心(510)。或者,具有最高识别率的菜单图标可以被显示为更大或更暗(520)。或者,可以根据从具有最高比率的菜单开始的顺序不同地显示多个菜单的大小、位置、色彩和对比度中的至少一种,或可以为高亮的,或者调整其透明度。
在多个显示的菜单中具有较高用户选择的菜单的识别率可以被改成更高。即,对于识别率而言,如果用户频繁选择一个菜单,则其选择的次数可以被学习,并且关于该选择的菜单的识别率可以被改变。因此,随后以相同或相似发音或内容输入的语音指令的识别率可以被改变。
图9是示出了根据本发明实施例的移动终端的语音指令识别方法的显示屏的概略图。假设该移动终端处于待机状态,并且在该待机状态中用户选择了特定菜单(例如,消息),则控制器180显示该选择菜单的子菜单。然后,控制器180开始内部地激活语音识别功能。随着该语音识别功能开始被激活,控制器180可以根据预先设置的环境设置选项,通过将数据库的信息域指定给与显示的子菜单(610)相关的信息,来设置用于识别语音指令的数据库的信息域。
随着子菜单被显示,控制器180可以从用户接收语音指令、触摸或按钮,并且选择特定菜单621。当选择了特定菜单621时,控制器180可以显示子菜单(620)。随着子菜单被显示(620),当输入以自然语言形式的语音指令(例如,I want to send text message(我想发送文本消息))时,控制器180检测与该特定功能或菜单相关的有意义的词或关键字(例如,send(发送)、text(文本)、message(消息)),将他们与在特定数据库中的与子菜单相关的信息相比较,并且确定具有最高识别率的含义。然后,控制器180执行与该确定的含义相关的菜单(例如,发送文本)。
此外,如果根据语音指令或触摸输入选择或执行特定菜单,则根据该终端的操作状态或操作模式(例如,用于引导语音识别功能的模式),控制器180可以通过语音或以文本形式的气球帮助信息,输出与子菜单相关的帮助信息。
根据与环境设置菜单相关的选项,可以设置用于输出帮助的操作模式。因此,在本发明中,无论用户对于语音指令的熟悉或熟练程度如何,通过输入按钮、触摸或语音指令,可以控制与特定功能或服务相关的菜单。
同时,当识别出语音指令具有多个含义时,即,如果以自然语言形式的语音指令不包含菜单的准确名称,例如,如果用户希望从“发送照片”、“发送短信(shotmail)”和“发件箱”中选择的菜单未被准确确定,则控制器180可以显示具有特定值(例如,80%)或更高的识别率的多个菜单。然而,如果具有特定值或更高的菜单小于两个,则相应功能或菜单可以被自动执行。
图10是示出了根据本发明实施例的用于移动终端的语音识别方法中的数据库系统的框图。该数据库存储用于确定语音指令的含义的信息,并且根据该信息的特性,可以配置多个数据库。通过在控制器180的控制下的连续学习过程,可以更新根据信息的特性所配置的每个数据库的信息。
用于数据库的学习过程指将由用户所发出的语音与相应词进行匹配。例如,如果用户已经发出“waiting(等候)”的音,但是其被识别为“eighteen(十八)”,则用户可以将“eighteen(十八)”修正为“waiting(等候)”,从而控制器180将随后发出的相同发音识别为“waiting(等候)”。通过这样的学习过程,可以将多个语音信息与在数据库中的信息进行匹配。
例如,数据库可以包括用于存储语音信息的第一数据库161,该语音信息允许通过麦克风输入的用户语音通过格式、音节、语素而被识别;用于存储信息(例如语法、发音的精确性、句子结构)的第二数据库162,该信息允许控制器180基于识别的语音信息来确定语音指令的总体含义;第三数据库163,用于存储与用于执行移动终端的功能或服务的菜单相关的信息;第四数据库164,用于存储从移动终端输出的消息或语音信息,该消息或语音信息用于用户确认关于确定的语音指令的含义。第三数据库163可以根据设置用于识别上述语音指令的消息域,指定与特定分类的菜单相关的信息。每个数据库可以存储语音(发音)信息或与语音(发音)信息相对应的格式、音节、语素、词、关键字或句子信息。
因此,控制器180可以通过使用多个数据库161-164中的至少一个,来确定语音指令的含义,并且执行与该语音指令的确定含义相对应的功能或服务相关的菜单。此外,在本发明中,通过使用指示符或图标或特定形状,可以显示其中应用语音指令识别功能或SST功能的操作状态或操作模式。当输出指示符或图标时,输出特定声音或语音,以通知用户。
图11是示出根据本发明实施例的移动终端的文本修正方法的过程的流程图。假设用户执行文本消息创建功能并且使用STT功能通过语音创建消息内容。如在图11中所示的,当用户输入语音时(S301),控制器180将语音转换成文本,并且将其显示在屏幕上(S302)。为了将语音转换成文本,控制器可以使用任意的(或预定的)语音识别算法。
当从用户接收到的语音至文本的转换完成时,控制器180有差别地(或个别地)以词为单位(例如按词)对文本进行标记(S303)。该标记信息仅显示在屏幕上。当存储标记信息时,其不与文本一起被存储。当通过STT功能将该语音转换成文本时,可以自动地显示标记信息,或每当用户输入预先设置的特定指令时,可以显示标记信息。该标记信息可以被显示为数字,并且可以以句子或屏幕为基础进行标记。例如,如果存在多个转换成文本的句子,标记仅被选择的句子,或标记仅在当前屏幕上显示的句子。
如果在该文本中存在错误转换的词,则用户可以选择标记信息之一,以修改该错误转换的词(S304)。为了选择标记信息之一,用户可以使用预先设置的键、触摸、接近、手指手势、施加于特定部分的压力、姿势(倾斜方向)或语音指令。
在显示标记信息以后,控制器180选择与由用户通过使用各种方法输入的标记信息相对应的词。例如,如果用户通过各种方法之一输入“3”作为标记信息,则选择了与标记信息“3”所对应的词。与其他词相比,所选择的词被强调显示。然后,显示与所选择的词(S306)的发音具有相似发音的词(以下称之为“候选词”)。例如如果选择的词是“eighteen(十八)”,那么,“eighteenth(第十八)”、“waiting(等候)”、“meeting(会见)”等可以被显示为具有相似发音的候选词。在该情形下,侯选词可能未被预先设置在数据库中,并且在语音识别步骤中识别的具有特定或更高识别率的词可以被顺序地显示,从具有最高识别率的一个开始。
如果用户选择了候选词之一(S306)(例如,waiting(等候)),则控制器180可以将从文本中选择的词(例如,eighteen(十八))改变成所选择的候选词(例如,waiting(等候))(S307)。为了选择候选词之一,用户可以使用预先设置的键、触摸、接近、手指手势、施加于特定部分的压力、姿势(倾斜方向)或语音指令。
可以重复执行将文本中的特定词改变成候选词的过程,并且当错误词的修正完成时,不显示标记信息。当存储该文本时,控制器180可以确定修正已经完成,并且通过使用上述各种输入方法,可以完成文本修正。
图12A至图12C是示出根据本发明实施例的用于标记移动终端中语音识别的文本的方法的显示屏概略图。例如,当用户在移动终端中执行文本消息或电子邮件创建功能并且通过语音输入消息内容时,控制器180通过使用在存储器160中存储的STT算法,将由用户输入的语音转换成文本,并且例如在文本消息或电子邮件创建屏幕上显示转换的文本。
如在图12A中所示的,控制器180按每个词显示被转换的文本的标记信息(710)。该标记信息可以显示在每个词的上端或下端,或可以被显示为与每个词重叠。当该标记信息被显示为与每个词重叠时,可以调整词或标记信息的透明度。此外,标记信息的形状或色彩可以被显示为与文本不同。当用户的语音输入完成时或当用户输入预先设置的特定指令时,可以自动地显示标记信息。
如在图12B中所示的,在单一屏幕中显示的文本的词可以被顺序编号。因此,当在单一屏幕中显示的文本词滚动时,标记信息可以被改变成新编号的词的号码。可选地,随后的序列号可以被用于在下一屏幕中显示的文本的词。
如在图12C中所示的,当在单一屏幕中存在多个句子时,控制器180可以按句显示标记信息。例如,可以仅为用户选择的句子显示标记信息。为了选择要显示标记信息的句子,用户可以使用预先设置的键、触摸、接近、手指手势、施加于特定部分的压力、姿势(倾斜方向)或语音指令。
图13是示出根据本发明实施例的用于选择任意词以修正在移动终端屏幕上显示的文本的方法的显示屏概略图。如上所述,该文本按词具有标记信息。因此,用户可以根据预先设置的方法,通过输入标记信息之一来选择词。
例如,如在图13(a)中所示的,控制器180选择与用户通过使用预先设置键、触摸、接近、手指手势、施加于特定部分的压力、或姿势(倾斜方向)输入的标记信息相对应的词。然后,与其他的词相比,控制器强调显示所选择的词(720)。例如,如果用户通过使用上述各种方法输入标记信息“3”,则选择与该标记信息“3”对应的词。然后,可以改变所选择的词的色彩或亮度,或者所选择的词可以被显示为更粗或更大,以闪烁方式显示,或加下划线。
作为另一示例,如在图13(b)中所示的,通过语音命令,控制器可以立即从用户接收与标记信息相对应的词。类似地,与其他词相比,控制器180可以强调地显示接收到的词。当选择文本的任意词时,控制器180显示与被选择的词的发音具有类似发音的词(下文称之为“候选词”)。
图14是示出了根据本发明实施例的用于为在移动终端屏幕上显示的文本中用户所选择的特定词显示候选词的方法的显示屏概略图。可以在屏幕的一个区域中作为弹出窗口显示关于所选择的特定词的候选词,并且可以根据所选择的特定词的位置改变该弹出窗口的显示位置。例如,如果所选择的词是“eighteen(十八)”,可以在弹出窗口(730)上显示与所选择词的发音具有相似发音的候选词(eighteen(十八)、waiting(等候)、meeting(会见))。在该情形下,可以从具有最高语音识别率(例如,具有指示与所选择的词最接近的值)的词开始,显示在弹出窗口上显示的候选词。
当显示候选词时,如在图15A和15B中所示的,用户可以选择这些词中的一个,并且改变所选择的词。即,如在图15A中所示的,当用户通过使用预先设置的键、触摸、接近、手指手势、施加于特定部分的压力、姿势(倾斜方向)或语音(740)来选择这些候选词中的一个(例如waiting(等候))时,控制器将从文本中选择的词(例如,eighteen(十八))改变为所选择的候选词(例如,waiting(等候))。当候选词被选择时,控制器180可以删除弹出窗口730,并且当将从文本中选择的词(eighteen(十八))改变为候选词(waiting(等候))完成时,与文本中其他的词相比,控制器180可以强调地显示(或强调)被改变的词(waiting(等候))(750)。
如在图15B(a)中所示的,当用户通过使用任意键或触摸,从文本中选择要修正的词(例如,eighteen(十八)),并且如图15B(b)所示,通过语音输入词(例如,waiting(等候))以修正所选择的词时,控制器180立即将从文本选择的词(eighteen(十八))改变成语音输入的词(waiting(等候)),如在图15B(c)中所示。当在文本中的选择的词的修正完成时,不需要显示标记信息。如果在文本中存在要修正的任何另外的词,通过使用上述各种输入方法之一,可以手工显示标记信息。可以重复执行选择候选词之一并且将文本中要修正的词改变成选择的候选词的过程。
图16是示出了根据本发明实施例的用于在移动终端中通过使用语音指令修正文本的方法的过程的流程图。如上所述,当用户输入语音时(S401),控制器180将语音转换成文本(S402),并且通过按词标记显示该文本(S403)。如果在转换的文本中存在错误转换的词,用户可以选择该错误转换的词以修正它。
控制器180可以从用户接收语音指令,以修正错误转换的词(S404)。此外,通过语音,可以选择在文本中要修正的词。此外,可以接收在文本中要修正的词处所显示的标记信息。例如,可以将预先设置的指令(例如,词“modify(修改)”)接收为语音指令。该语音指令可以具有用于指示修正的指令含义,以及用于选择要修正的词的指令含义。在该语音指令之后,可以继续从用户接收用户期望选择的词(例如,eighteen(十八))(S405)。
当通过语音指令选择要修正的词时,与其他词相比,控制器强调地显示所选择的词(S407)。用于强调地显示所选择词的方法可以是如上所述的多个强调地显示的方法之一。当通过语音选择文本中要修正的词时,控制器180显示与所选择词的发音具有相似发音的候选词(S408)。
当用户选择候选词之一(例如,waiting(等候))时(S409),控制器180将从文本中选择的词(例如,eighteen(十八))改变成从候选词中选择的词(waiting(等候))(S410)。如果用户通过语音连续输入语音指令(modify(修改))、要从文本中选择的词(eighteen(十八))、以及用于修正所选择词的词(waiting(等候))(S406),则控制器180立即将所选择的词(eighteen(十八))改变成用于修正的词(waiting(等候))(S410)。
图17是示出了根据本发明实施例的用于通过使用语音指令从在移动终端屏幕上显示的文本选择任意词的方法的显示屏概略图。如在图17(a)中所示的,当用户输入的语音到文本的转换完成,并且用户输入用于修正转换的文本的语音指令时,控制器180显示按词转换的文本的标记信息,如图17(b)中所示。
然后,控制器从文本中选择与用户连续输入的标记信息或词信息相对应的词,并且与其他词相比强调地显示该选择的要修正的词。例如,当从用户通过语音接收到用于修正文本的指令和文本中要修正的词时,控制器180可以改变所选择的词的色彩和亮度,并且将该选择的词显示为比其他词更粗或更大,或对该所选择的词加闪烁或下划线,以强调该选择的词。强调该选择的词的其他方式是可能的。当选择在文本中的任意词时,如在图17(c)中所示的,控制器180显示与该选择词的发音具有相似发音的候选词。
图18A是示出根据本发明实施例的用于通过语音选择在移动终端屏幕上显示的候选词之一的方法的显示屏概略图,并且图18B是根据本发明实施例的用于通过语音从在移动终端上显示的文本中选择任意词并且将其修正的方法的显示屏概略图。如在图18A(a)中所示的,当用户输入的语音至文本的转换完成并且用户输入用于修正该转换的文本的语音指令以及要修正的词时,控制器180显示与要修正的词的发音具有相似发音的候选词,如在图18A(b)中所示。候选词可以被显示为在屏幕的一个区域上的弹出窗口,并且可以根据该选择的特定词的位置来改变弹出窗口的显示位置。
随着候选词被显示,当用户通过语音选择候选词之一(例如,“waiting(等候)”)时,控制器180将所选择的词(例如,“eighteen(十八)”)改变成所选择的候选词(waiting(等候)),如在图18A(c)中所示。当用户输入语音指令(modify(修改))时,如图18B(a)所示,然后,通过语音连续输入要从文本中选择的词(eighteen(十八)),然后,输入用于修正该选择的词的词(waiting(等候)),如图18B(b)所示,控制器180立即将选择的词(eighteen(十八))改成用于修正的词(waiting(等候)),如在图18B(c)中所示。当从文本选择的词(eighteen(十八))被完全改成候选词(waiting(等候))时,控制器180可以与文本中其他词相比强调地显示该改变的词(waiting(等候))。在各种实施例中,当其被改成所选择的候选词时,该选择的词,诸如eighteen(十八),已经被正确地拼写。
在本发明的实施例中,可以将上述方法实现为在记录程序的介质中的能够由计算机读取的软件代码。计算机可读介质可以包括各种类型的记录设备,在这些设备中,存储能够被计算机系统读取的数据。计算机可读介质可以包括ROM、RAM、CD-ROM、磁带、软盘、光学数据存储设备等。此外,计算机可以包括终端的控制器180。
由于在不脱离示例性实施例的特性的条件下,可以以若干种形式实现示例性实施例,因此,应理解的是,上述实施例不受前面描述的任何细节所限制,除非另有说明,而是应在如随附的权利要求所定义的范围内作最广泛的解释。因此,落入本发明权利要求范围内或该范围的等价内容范围内的各种更改和修改应包含在随附的权利要求范围内。

移动终端和用于修正其文本的方法.pdf_第1页
第1页 / 共59页
移动终端和用于修正其文本的方法.pdf_第2页
第2页 / 共59页
移动终端和用于修正其文本的方法.pdf_第3页
第3页 / 共59页
点击查看更多>>
资源描述

《移动终端和用于修正其文本的方法.pdf》由会员分享,可在线阅读,更多相关《移动终端和用于修正其文本的方法.pdf(59页珍藏版)》请在专利查询网上搜索。

公开了一种用于按词选择在移动终端中创建的文本并且对其进行修正或改变为另一个词的方法以及一种实现该方法的移动终端。该移动终端包括:显示单元,用于显示文本的一个或多个词,并且显示用于该一个或多个词的每一个的标记;输入单元,用于选择被标记的一个或多个词中的至少一个作为所选择的一个词;以及控制器,用于显示与经由该输入单元所选择的词的发音具有相似发音的候选词,选择这些候选词中的一个作为所选择的一个候选词,并。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1