本发明为一种汉字字元拼码输入方法。是根据国家标准局要求“易懂、易学、易记、易应用”的原则,为促使汉字信息交换规范化,统属化而研究的。 我国汉字信息处理正朝着计算机网络化方向发展。近几年来有二千多人对汉字输入计算机进行研究和探讨,涌现出五百多种编码方案,但是在现有信息处理中,不同程度地出现“异字同码”较多的问题,如中国专利申请公开CN85104343A、CN86105505汉字编码方法,在字量多时,重码率都较高。按国家要求汉字编码输入技术中,被列入编码的所有字符和汉字必须是一个号码对应一个字符或汉字,不能一码对应多个字符和汉字。否则在汉字输入计算机等设备和信息交换中将出现差错。
本发明的目的是为了解决其他编码方法中,编码数位少,字容量少,重码率高的问题,提供一种使一般人容易掌握,而且字容量多(可容3至4万),重码率又最低的快速汉字编码输入方法。使之与现行计算机系统所通用的国内外标准七单位信息交换用字符码具有各种级别的相容性。并且排列符合实际使用需要,以便利一般人的使用和系统软件与硬件的设计。
本发明“三元一体”汉字输入方法的形成,是根据汉字归纳起来都是由笔画形成字元,由字元组拼成不同的汉字,字元组拼位置不同,所产生的汉字和字义也就不同的原理,而研究成功的。如同样是一个“口”字与一个“巴”字,一个“木”字或一个“力”字,这四个字元位置不同,就形成“吧”与“邑”,“杏”与“呆”,“另”和“加”等等。
本发明由图3、从笔画(横1、竖2、点3、撇4、捺5、折弯勾6)到字元图1,由字元占据某个汉字的位置(上7、下8、中间9、左右各为0)都定上数附码,构成一种由笔元(笔画码)、字元(字根码)、加上位元(字元位置码)相结合的“三元一体”汉字编码输入方法。
本发明特殊之点是,“三元一体”汉字输入方法中有同行没有的“把汉字中的字元位置定上位元码”的编码方法,这可以解决大量异字同码问题,使字码对应率极大提高。
本发明的优点是突破了四位数编码,采用六位数编码方法,使字容量大大增加。并与国内外标准七单位通用信息交换用字符编码具有相容性、使码组便于统一。
本发明为了解决人机反映速度和书写顺序反映不一致的问题,提高输入速度,其中有五百零六个常用汉字为一字多码。这一字多码都可作为有效编码使用。如图4中“湾”字拆散后,由三个位元、三个字元“左边0氵03、上方7亦87、下方8弓88”组拼成六位数编码038788、003787、003888都为湾字有效编码。再如“礃”字,按照对照表图1中的字元可折成“左边0石06、上方792、中间9口52、下方8手56”,组拼成069252、006792、006952、006856都为“礃”字有效编码。
本发明的实例结合下列附图说明:
图1为“三元一体”一百五十个有效字元对应100个二位数码对照表。
图2为“三元一体”汉字编码对应表简例表字码对应表是按横、竖交叉压字对应。横二位数为负码、竖四位数为字码,每个汉字码组为六位数。
图3为“三元一体”笔元(笔画码),位元(位置码)数码对应表。
图4为“三元一体”一字多码常用汉字举例图。
中国汉字属方块式,按字元拼形可分为“上、下、中、左、右”五个位置。本发明将笔画定为图3:横1、竖2、点3、撇4、5、6弯折(勾、挑)笔元。挑“”归纳到折弯勾中去是固为“”与“丶”发生冲突。将字元位置码位元定为:上7、下8、中间9、左右字元各为0。为了拼形汉字输入计算机等设备和信息交换的数模转换的需要,将字元都定二位数附码、图1为一百五十个有效字元对应一百个二位数附码的数码对照表。字元有两种:一种是能独立成字字元,如“水、”火、土”一种是不能独立成字字元,如“氵、灬、、”等,为了拼形汉字的需要,都定二位数附码。
本发明“三元一体”汉字编码输入规则有四种。当一个汉字出现在你眼里或脑中,首先要想到这个字拆散后,有没有图1对照表中地字元,有几个?这些字元在这个字的(上、中、下、左、右)的什么位置上。
A、有一个对照表中的字元,用位元码×与字元码××加三个笔元码×××(不足三笔元后面用0补)、即位元字元三笔元。
例A:“乱”是由“舌47”与折弯勾“乚”构成,“舌”在左边为“0”位元,“乚”在在边为一笔元、补二个“0”、“乱”的码组是047600、
“友”字仅下方8有“又65”,上方不足三笔,后面加“0”,“友字的码组是140865。
B、有两个字元,用位元码×加字元码××再加另一个字元的位元码×加字元码××,即位元字元位元字元。例B:“稽”字左方0“禾13”,在下示8“日22,“稽”字的码组是013822、
“鹦”字有“贝、贝、女、鸟”三个字元构成,应取第一个“贝”,上7“贝76”和右0“鸟72”、“鹦”字是776072、
C、有三个字元以上组成的汉字,可连拼三个字元码(不一定成汉字)便是码组,即字元字元字元。
例C:“慰”字是由“尸、示、寸、心、”四个字元组成、“16”59”、“心40”三个连接不一定成汉字,“慰”码是165940、
“涮”字由“氵03、尸58、巾59、刂43”四字元组成,三个连拼不一定成汉字,“涮”码是035859、
D、没有字元,只有笔元汉字,按书写顺序连取六个笔画,不足六位,前面加“0”补。即六笔元。
例D:“事”字是“一1、丨2、6、一1、6、一1”序笔构成六笔,“事”字码组是126161。
“也”字是“6、12、乚6”序笔构成,因不足六笔,前面加“0”,“也”码是000626。
另图4举例说明了本发明中有506个常用汉字采取了一字多码的方式,对位元字元三笔元,位元字元位元字元、字元字元字元、六笔元四种组拼码都为有效,这对快速输入汉字带来方便。
本发明每个字元附二位数码,每个汉字数码组为六位数、汉字字码对应表图2是按横、竖交叉压字对应编排汉字。横二位数为页码、竖四位数为字码,这样组合便于输入计算机等内存安排,并且字容量多,可容3至4万,但重码率又最低。汉字输入迅速、一字击三键即可,击键次数少。