简易式汉字拼音数字化输入法及宿位法 技术领域:
本发明涉及一种汉字拼音输入方法,尤其是一种适用于手机、并可利用手机上的十个数字键实现汉字输入的拼音数字化输入法及宿位法。
背景技术:
随着信息技术的飞速发展,为了适应人机对话的需要以及方便信息的传输,各种汉字输入方法纷纷出现,并被各类计算机系统和手机等信息设备所广泛采用,这些汉字输入方法各有其特点,大大地方便了人们向这些信息设备中输入汉字的操作过程。不过,也有一些汉字输入方法其编码较为复杂,人们难以识记和学习,因此,设计者也一直在探索以求找到更为适用和方便易学的汉字输入方法。
发明内容:
本发明的目的就在于提供一种非常简单易学且输入速度快的汉字拼音数字化输入法及宿位法,该输入法及宿位法主要是应用在手机的操作系统上、当使用者用拼音形式输入汉字时使用。
为实现上述目的,本发明的技术方案为:它将汉字拼音分为两部分,第一部分为汉字拼音的首字母,第二部分为汉字拼音的第二个及第二个以后的字母;其中,使用频率最高的几个首字母分别用一个数字作为代码,其余的首字母则分成几组,每组分别用一个数字做母码,每组中的各个字母又分别设置一个识别码;汉字拼音地第二个及第二个以后的各个字母分别用一数字做代码。
用来作为汉字拼音代码的数字为0~9这十个数字,其中,首字母中使用频率最高的字母Y、C、Z、J、S、H分别用数字1~6做为代码,使用频率次之的首字母则分为四组,各组分别用数字6~9以及0这五个数字作为母码,每组中的各个字母又分别设置有识别码。
使用频率次之的首字母中的R用数字6做母码;L、X、K、F这四个字母共用数字7做母码;并分别用D、B、Q、W、M这五个字母用数字8做母码;G、P、N、T这四个字母用数字9作为母码;A、E、O、I、U、V这六个字母则用数字0作为母码。
用数字6、7、8、9做母码的各组字母中排在第一位的字母无需识别码,排在第二位的字母的识别码为与母码相同的数字,排在第三位的字母的识别码为母码左边的数字,排在第四位的字母的识别码为母码右边的数字,但用8做母码的字母中的W其识别码为6;用数字0做母码的字母组中的A用1做识别代码,E用2做识别码,O用3做识别码,I用4做识别码,U用5做识别码,V用6做识别码。
在汉字拼音中第二位及第二位以后的字母中,对于由韵母加N或NG合成的韵母词组,将N和NG用与韵母相同的代码表示。
汉字拼音中第二位及第二位以后的字母中,R和H共用相同的代码。
对超过四位编码数字的汉字拼音可用宿位法进行压缩,该宿位方法主要是利用不会在第二位及第二位以后出现的7、8、9这三个数字以及数字6,宿位对象是带N、G的韵母,即分别利用6、7、8、9来分别代表带N、G的韵母拼音。
还可利用汉字拼音组中的自然空位来跨越式去除一些字母以达到宿位的目的。
本发明的有益效果在于:它充分利用和挖掘了汉字拼音的特点,它可将50%以上的拼音组(其附带50%以上的汉字数量)以一个字母对应一个数字的方式输入手机中,其余的汉字拼音也仅需加一个识别码而已,学习和使用起来十分轻松方便。另外,本发明的输入方法中,每一个拼音组都有自己的独立编码,消除了现有一些拼音输入方法中存在的大量重复编码的问题,可以令输入一步到位,大大减少了跨键次数,使输入速度大为提高。此外,在本发明所述的输入法的基础上设立的宿位法,又可将绝大多数四位以上的汉字拼音编码压缩为四位以下,从而使输入速度进一步提高。
附图说明:
下面结合附图对本发明做进一步的说明:
附图1为本发明输入法的标准代码图
附图2为本发明宿位法的代码图之一
附图3为本发明宿位法的代码图之二
附图4为本发明宿位法的代码图之三
具体实施方式:
下面结合附图和具体实施例对本发明的原理做进一步的说明,但并不因此而限定本发明的保护范围。
众所周知的是:汉语拼音多以声母加韵母组成或者是以单个的韵母出现,它存在着如下几个特点:
一、全部汉字拼音组中,第一个字母涉及的字母包含了二十六个字母中除I、V以外的二十四个,但第二个及第二个以后的字母就仅限于5个韵母(A、E、I、O、U)和4个声母(H、R、N、G)这九个字母,而手机上的数字键为0~9十个数字,因此,所有汉字拼音的第二个及第二个以后的字母皆分别可用手机上0~9这十个数字来做一一对应的转换。
二、所有的汉字拼音组都无重叠字,如AA、BB等,这就为压缩第二位及第二位之后的拼音字母个数创造了条件。在汉字拼音中大量使用了由一个韵母加“N”或“NG”合成的韵母词组,如Ang、En等。根据拼音无连续重叠字母的特点,对Ang这类带“N”和“NG”的韵母词组,本输入法将其视为该韵母词组中第一个韵母字的重叠,如ANG=AAA,EN=EE等。通过该重叠压缩方法,拼音组第二位及第二位以后的字母数可减少为7个。
三、出现在拼音组第二位及第二位以后的H、R这两个字母出现的条件均不相同。其中,H只在第二位出现,且其前一字母必为C、S或Z,而R则只能出现在韵母E的后面。因此,本输入法在编码时令H和R共用一码,这样,拼音组第二位及第二位以后的字母数可减少到6个。
通过对上述汉字拼音字母组特点的了解,本输入法用异数位异功能的方式进行编码和运行,异数位异功能即相同的数字在不同的位置代表不同的字母,如1在第一位代表Y,在第二位代表A,在第三位代表N,在第四位代表G,1111=YANG。
当然,每个位置的数字代表什么还得看它前面的一个字母是什么方可决定,除上面所提到的各特点,再综合使用习惯、使用频率和使用效率等因素,本输入法得到如附图1所示的标准流程图。
见附图1所示,A、E、I、O、U、H/R分别排在1~6的位置,这样就等于将拼音组的第二位及第二位以后的字母编码完毕,只剩下第一位的字母(即首字母)如何编码的问题了。由于以韵母为首字母的拼音组仅为极少数,所以可以使用1~5这几个数字来编码使用频率最高的五个字母:Y、C、Z、J、S,至数字6代表的H/R码,由于它既有可能在第一位出现,也有可能在第二位出现(但出现条件不同),因此,本输入法规定6在第一位出现时代表H。
由于Y、C、Z、J、S、H/R这几个字母仅为可能在拼音组的首位出现的二十四个字母中的一小部分,其它字母无法用一个数字对应代表一个字母的方式来编码。因此,本输入法使用母码加识别码的方式来编码其它的字母,具体方式是用一个数字作为多个字母所构成的字母组的母码,再用识别码来区分各字母组中的具体字母。
见附图1所示,6为H、R这两个字母组的母代码,7为L、X、K、F这四个字母组的母码,8为D、B、Q、W、M这六个字母组的母码,9为G、P、N、T这四个字母组的母码,0为A、E、I、O、U、V这六个字母组的母码。为了识别各字母中的每一字母,本输入法用识别码来区别各字母组中的每一字母,另外,为了让使用者易学易记,识别码的编排应有规律可寻,因此,本输入法规定:各字母组中的第一个字母无须另加识别码,而第二个字母的识别码与母码相同,第三个字母的识别码为母码左边相邻的数字,第四个字母的识别码为母码右边相邻的数字。但应注意的是,以8做母码的字母组中,由于它包含了5个字母,其识别码的编排稍有不同,其中的字母W单独用数字6作为识别码。另外,以0作为母码的字母组中,由于其所含的字母数多达6个,因此,上述规律并不适用于该字母组,但其中各字母的识别码的编排亦相当有规律,即、各字母的识别码的数字与该字母所在位置一致。上述母码和识别码的编排规定和规律可用以下几个简单的公式来表示:
6=H,R6
7=L、X7、K8、F9
8=D、W6、B8、Q7、M9
9=G、P9、N7、T8
0=A1、E2、I3、O4、U5、V6
本发明所述输入法的使用方法,实际上已在前面所述的编排规定和规律中做了详细解释。即在用拼音法输入汉字时,如首字母无需加识别码,则照该汉字的拼音,用一个数字对应一个字母的方式输入即可,如DAO=813;如首字母需加识别码,则将首字母加上识别码后再按一个数字对应一个字母的方式输入即可,如Tian=98411,Ai=014;韵母带N或NG时只需重复N的前一位字母即可,如Ang=0111,Jin=444。可以看出,本发明所提出的输入法非常简单易学易记,即使是完全不懂输入法的人也可在非常短的时间内熟悉该方法并轻松输入任何汉字。
由于部分的汉字的拼音字母数较长,为提高输入速度,本发明使用宿位法针对超过四位编码数字的拼音组进行四位及四位以下的压缩,压缩对象主要是带N或NG的韵母,宿位方法主要是利用不会在第二位及第二位以后出现的7、8、9这三个号码。宿位法与前面所述的标准编码方法既相互独立,又相辅相成。宿位法有二种实施方式,这二种实施方式都是以拼音组的首字母为依据,具体如下所述:
一、对以S、C、Z为首字母,其后带H的声母字的宿位(见附图2所示)
1.C、S、Z加数字6,标准码是加h,但同时又是han的宿位码,重复一次即表示加hang,再重复一次即表示加huang。
2.C、S、Z加数字7,表示加hua,重复一次加huan,再重复一次表示加huang,C、S、Z加7再加4则是表示加huai。
3.C、S、Z加数字8表示加hen,重复一次表示加heng。
4.C、S、Z加数字9,表示加ang,重复一次加eng,再重复一次表示加ing。
二、对母码为7、8、9,识别码亦为7、8、9的首位声母字,其宿位方法同样是用6、7、8、9这几个数字来作为宿位码(见附图3所示)
1.母码加识别码再重复识别码等于加an,再次重复表示加ang。
2.母码加识别码加8、9、7无固定表示方法,但一般代表ing,eng,iang。
应注意的是,X、Q两声母依首字母时,第二位字母除U外,其余全为I,故在本宿位法中会自动按需要带上I,无需专门添加,J同样如此。
除了上述提到的宿位法外,本发明还利用汉字拼音组中的自然空位来跨越去除一些字母,同样可达到宿位目的,可以利用的韵母组如下所述:
1.ian其标准码是411,宿位码为41,即去除N码。
2.iao其标准码是413,宿位码是43,即去除A码。
3.uan其标准码是511,利用空位码6作为宿位码,重复一次6即为uang。
4.对于3号0码的宿位方法是:(1)、首字母如与O作为独立拼音组的,则加3一次等于标准编码中的加O,若还于ong又是独立拼音组的,则重复一次加3表示加ong;(2)、首字母如与O不是独立拼音组而与ong是独立拼音组的,则加3一次等于加ong,重复一次加3表示加ou,由于3号的O与Z为同一码,故3号作为首码时是zong,重复一次表示加zhong。
应该注意的是,上述几种宿位方法并不适合于所有的拼音组,因为按上述四种方法运算所有的字母组则有许多重码出现。如nian,标准码是97411,代入上述宿位法中则为9741,但9741又是nia的标准码,故nian的宿位码不能是9741,而应该采用标准码中的979;又如zuan,其标准码是3511,但代入上述宿位码中后为36,但它既为zh的标准码,同时又是zhan的宿位码,故带H为声母的C、S、Z不适合于上述的第3条,而应该利用其设有zua这个拼音组的空位作为宿位码;zuan、cuan、suan的宿位码应是:Z、C、S+51/UAN。其它不适用于上述几种宿位方法的拼音组在此不再一一举例说明,总之,只要拼音组按上述方法代入宿位码后不与标准码重叠即可,能达到上述条件的拼音组如附图4所示。
通过以上几种宿位方法基本上将四位以上编码的拼音组压缩掉了,还剩下几个不能用上述几种宿位方法宿位的,就只好用非常规式宿位了,见以下所列举的几个例子:
4/J+F=jiang,6/H+7=hai,6/H+8=huan,6/H+9=huang。
L/F+17=liang,L/F+6=luan,D/8+51=duan,L/F+3=dong。
总的来讲,使用宿位法可基本上将拼音组的数字代码压缩为四个数字以内,且宿位方法同样简单易记,同样有规律可寻,能极大地提高输入速度。另外,宿位方法继承标准代码的两大特点,一是必须确定首字母为单一字母;二是用重复码方式加N和G,因此,使用者只需稍微熟悉一下标准流程图,即可很快掌握宿位法。韵母做首字母的不设宿位码。