精确语音输入法 本发明涉及一种用于计算机、通讯、娱乐等智能系统的,用语音来输入文字和命令的方法。
目前,现有的语音输入方法都有一个重要的缺点,就是识别率在理论上和实际上都无法达到百分之百。为了提高识别率,语音输入软件越来越复杂,占用的计算机内存也越来越大,使得语音输入在手持无线电话等便携式小型智能系统上的应用受到了限制;而且,错误的识别导致错误的输入再导致修改,使得这些语音输入方法的效率大打折扣。
本发明的目的是为计算机、通讯、娱乐等智能系统提供一种精确可靠、快速便捷的用语音输入文字和命令的方法。
本发明的技术方案是,确定一组简单、易区分的发音单元,使其与一种输入法的各个码元一一对应;按照该输入法编码的规则,依次读出欲输入的文字和命令的编码所对应地发音单元;再使智能系统把这些经过了编码的发音单元按照该输入法的编码规则转换成对应的文字和命令,从而实现这些文字和命令的输入。本方案的特点,是按照一定的编码输入法规则,用发音单元组成的声音编码来实现智能系统的文字和命令输入,而不是直接按照文字或命令的自然语音本身来输入。
本发明的有益效果:使语音软件大大地简化,占用的计算机内部资源也大大减少,使得语音输入在手持无线电话等超小型智能系统上的也能方便地应用;由于该输入法最少可以只接受40个左右的发音单元,所以能够轻易地排除其它声音的干扰,在理论上可达到准零误输;可以在非常嘈杂的环境中工作,甚至有人在旁边大声说话也不影响正常输入;也可以用耳语输入以免干扰他人;输入者可用语音的方式按自己熟悉的键盘输入法来输入,简单易行;熟练后的输入汉字的速度约相当于自然语言速度的1.3倍。
实施例1:确定一组简单、易区分的发音单元,使其与计算机、通讯、娱乐等智能系统的输入键盘上用于文字输入的键(如字母键、数字键、符号键、空格键、回车键、功能键等)建立一一对应的关系;每当操作者说出一个发音单元时,就使智能系统作出一个反应,相当于使对应的键被击下;按照一定的键盘输入法的编码规则,确定欲输入的文字和命令的编码及该编码所对应的各个键;说出与这些键对应的发音单元,再使智能系统对这些经过了编码的发音单元依次作出反应,相当于使对应的键被依次击下;从而按照该输入法实现文字和命令的输入。
实施例2:确定一组简单、易区分,并且与所要输入的文字本身具有较强关联性的发音单元,是将本发明成功用于各种输入法的关键之一。下面是一个将本发明用于汉字的笔顺或笔形输入法时,确定发音单元的实施例。
笔顺或笔形输入法一般把汉字的笔划归为五种:横(heng)、竖(shu)、撇(pie)、捺(na)、折(zhe);取这五种笔划的任意两种,可形成25种笔顺,把这五种笔划的汉语读音分别简化为:横(ho)、竖(su)、撇(pi)、捺(na)、折(ze)。这些简化后的读音的特点是,均由一个单声母和一个单韵母组成,声母和韵母都不重复使用,既保留了这些笔划的原汉语读音的主要特征,又使这些读音简单短促、容易区分。
把25种笔顺的读音再作一次简化,用一个“特音”来代表。特音是这样构成的:第一个笔划简化读音的声母+第二个笔划简化读音的韵母。25种笔顺组合及其特音列表如下:
横横(ho)、横竖(hu)、横撇(hi)、横捺(ha)、横折(he)
竖横(so)、竖竖(su)、竖撇(si)、竖捺(sa)、竖折(se)
撇横(po)、撇竖(pu)、撇撇(pi)、撇捺(pa)、撇折(pe)
捺横(no)、捺竖(nu)、捺撇(ni)、捺捺(na)、捺折(ne)
折横(zo)、折竖(zu)、折撇(zi)、折捺(za)、折折(ze)
使这些特音与一种笔顺或笔形输入法的码元一一对应;按照该输入法编码的规则,依次说出欲输入的文字和命令的编码所对应的特音;再使智能系统把这些经过了编码的特音按照该输入法的编码规则转换成对应的文字和命令,从而实现这些文字和命令的输入。
将本发明及本实施例的特音的确定方法与笔顺或笔形输入法结合起来使用,具有极好的直观性,这样就可使输入者见字会读,使汉字的输入实现“音形书统一”。