本发明是一种兼顾简便、易学、快速等优点的汉字编码方法,用于汉字信息微机处理。 现有的若干种汉字编码方法,从使用效果看,各有利弊,归纳起来有两大特点:一是规则简单、记忆量少的编码,其重码率都比较高,输入速度低,工作效率差,如《拼音输入法》;二是重码率低、输入速度高的编码,其规则都比较复杂,记忆量大,不易接受,如《五笔字型》,亦有130多个字根需要记忆,非专职操作人员使用起来比较困难。
本发明的目的是要提供一种具有规则简单、易学易用、重码率低、输入速度高等优点,不仅适合于专职操作人员,而且适合于广大非专职操作人员使用的汉字信息微机处理编码方法。
本发明是将汉字字音的现代汉语拼音第一字母和字形的四角号码代码有机地结合起来,以字、词为对象进行编码。在采用汉字字音的现代汉语拼音进行编码时,只采用现代汉语拼音的第一字母,而不涉及其余字母、声调等复杂因素;在采用汉字字形的四角号码代码进行编码时,按字形左上角、右上角、左下角、右下角的顺序,且遵守同一笔形,前角用过,后角跳过,缺角,跳过的规则进行取码。其具体规则如下:
1、单字采用该字字音的现代汉语拼音第一字母和字形的1至3位四角号码代码进行编码,最多4码,不足4码时用空格表示结束。
2、双字词组采用该词组每字字音的现代汉语拼音第一字母和每字字形左上角的四角号码代码进行编码,共4码。
3、三字词组采用该词组每字字音地现代汉语拼音第一字母和第三字字形左上角的四角号码代码进行编码,共4码。
4、四字词组采用该词组每字字音的现代汉语拼音第一字母进行编码,共4码。
5、五字以上词组采用该词组前三字和最后一字字音的现代汉语拼音第一字母进行编码,共4码。
6、对单字还采用1至4位四角号码代码进行编码,最多4码,不足4码时用空格表示结束,以解决不认识的汉字的编码。
7、对高频单字还采用该字字音的现代汉语拼音第一字母加空格进行编码,共2码;对常用单字还采用该字字音的现代汉语拼音第一字母和字形左上角的四角号码代码加空格进行编码,共3码。
8、对高频双字词组还采用该词组每字字音的现代汉语拼音第一字母加空格进行编码,共3码;对常用双字词组还采用该词组每字字音的现代汉语拼音第一字母和第一字左上角的四角号码代码加空格进行编码,共4码。
9、对常用三字词组还采用该词组每字字音的现代汉语拼音第一字母加空格进行编码,共4码。
这种编码方法具有以下优点:一是规则简单、易学易用。编码只采用汉字字音的现代汉语拼音第一字母(分别用除i、u、v之外的23个英文字母表示),而不涉及其余字母、声调等复杂因素,很好地解决了发音不准的难题;四角号码代码把汉字角形分为十类(分别用0到9十个数字符号表示),只要记住“横1竖2点捺3,叉4插5方框6,7角8八9是小,点下有横变0头”四句口诀,且能灵活运用即可。
二是重码率低、输入速度高。重码单字数最多为13个、词组为7组,重码首屏提示率高于99.97%。每字平均编码低于2码,熟练操作人员每分钟可输入150多个汉字。