计算机汉字输入的编码方法 本发明涉及的是一种计算机汉字输入的编码方法,计算机汉字输入编码方法有:五笔字型、自然码、拼音输入法、普通码等等,总的来讲这些编码方法可归结为拼音输入、拼形输入或拼音和拼形这两种方式组合的输入。
其中拼音和拼形结合的编码方案中,音码部分都大同小异,而其形码部分均采用字根编码方案。如自然码中的形码就有67个字根。在任何编码方案中一旦采用了字根,要掌握此汉字输入法,就必须要对字根进行记忆、要学习字根在键盘上的配置,以及要学习对汉字进行拆解和录入的许多规则。
针对以上之不足,本发明的目的就是要解决计算机汉字输入法学习的难易与输入的效率这一对矛盾,即要提供一种学习方便,输入效率高的计算机汉字输入的编码方法。
本发明的主要内容:形码中取消了字根这一概念,而采用二维坐标确定形码的编码原则。
本发明所提供地计算机汉字输入的编码方法,由音码和形码构成,其中形码是先分别以汉字中约定位置的相邻两个笔画为二维参数确定一个坐标,然后使这一坐标对应键盘上的一个键位为输入符。
在对汉字编码时,音码是以汉字的汉语拼音的第一个字母为输入符。形码是分别以汉字中约定位置的相邻两个笔画作为二维参数,即区和位确定一个坐标为一个输入符。其中笔画选取横、竖、撇、捺、折五种基本笔画。为便于描述可以1、2、3、4、5分别代表横、竖、撇、捺、折这五种基本笔画。这样音码共有a、b、c、d、e、f、g、h、j、k、l、m、n、o、p、q、r、s、t、w、x、y等23个输入符,形码共有11、12、13、14、15、21、22、23、24、25、31、32、33、34、35、41、42、43、44、45、51、52、53、54、55等25个输入符。
在键盘上,音码输入符可以直接与字母键相对应,形码输入符则要对键盘进行分区、位,选取25个键位与坐标号一一对应。
本发明所提供的计算机汉字输入的编码方法,由于采用了人们所熟知的5个基本笔画来组成汉字的形码输入符,又以拼音第一字母作音码输入符。对于普通人士,只要告知编码方法和键盘区位,便可自行进行汉字输入操作,几乎不必学习。这一编码方法不象其他采用字根来构成形码输入符,读音区分前后鼻音、平卷舌音等对操作人员的汉字书写、读音水平要求严格,它只要求操作人员对汉字的音、形稍有印象便可准确输入,有较大的容错性。本发明所提供的计算机汉字输入的编码方法,圆满地解决了学习难度和输入效率之间的矛盾,提供了一种既便于学习掌握,又有较高输入效率的计算机汉字输入的编码方法,为广泛普及计算机消除了汉字录入难的障碍。
下面介绍二种利用本发明实施的汉字编码方案:
汉字编码方案一:声+形+形
1.字的编码(三码一字):
汉字的第一个码为声码。取该字汉语拼音的第一个字母,汉字的第二、三个码是形码,取第二码为汉字的头两笔画组合,得到一个坐标作为在键盘平面上的键位;第三码为汉字的末两笔画组合而得到的坐标。
单字编码举例,如:“章”、“凹”(下面的两位数表示码的坐标)
对于笔画少于4个的字,第二、三码采用重复取笔画的办法。例如:
乙=y+(乙乙)55+(乙乙)55 丁=d+(一乙)15+(一乙)15
习=x+(乙\)54+(\一)41
2.词组编码(四码一词):
两字词:每个字的前两码组合而成;如:凹凸=a+25+t+21
三字词:每个字的第一码和第三字的第二码构成;
如:计算机=j+s+j+(一丿)12
四字及四字以上的词:由一、二、三、末字的第一码构成;
如:中华人民共和国=z+h+r+g
3.利用一级简码、二级简码以及把三码字中的最常用字放在提示行的首位,来提高汉字输入效率。
4.设定一万能键可对疑难字进行查询。
汉字编码方案二:声+形+形+形
汉字音码取法和组成以及形码的组成方式同方案一。只是在形码的取法上要作稍微调整。再增加一个形码,第一个形码由第一、二笔画构成的坐标确定;第二个形码由第三、四笔画构成的坐标确定;第三个形码由最后两笔构成的坐标确定,方法同方案一。
例如“朱”=z+(丿一)31+(一丨)12+(丿\)34
“大”=d+(一丿)13+(丿\)34(允许重复取笔画)
“攀”=p+(一丨)12+(丿\)34+(一乙)15
“葫”=h+(一丨)12+(丨一)21+(一一)11
“仄”=z+(一丿)13+(丿\)34+(丿\)34
“胡”=h+(一丨)12+(丨乙)25+(一一)11
“连”=1+(一乙)15+(一丨)12+(\乙)45
“逾”=y+(丿\)34+(一丿)13+(\乙)45
“边”=b+(丿乙)35+(\乙)45
再利用简码的技术处理,方案二的重码率将达到微乎其微。
对于形码输入符在键盘上的配置,可以采用与五笔字形输入法相同的配置方法,也可进行重新编排,如采用gfdsa为第一区,hjkl;为第二区,trewq为第三区,yuiop为第四区,bvcxz为第五区,位序自里向外。