汉字二十九形字根码编码输入方法 随着计算机在各个领域的普遍应用,个人电脑的普及,易学、易记、快速地输入汉字的方法及其设备,成为国内外信息专家共同关注的课题,解决的方案也日新月异。
现在,在中国使用较为广泛的有根椐汉字结构编码的“五笔字型”,但其方法提出的字根与其键位代码的关系需要凭记忆掌握,字根也较多,还用到了笔画代码和字形代码,编码规则也较为复杂,学习和掌握的难度大,需要经过专项训练才有较快的输入速度;使用较广泛也有根椐汉字拼音编码的输入方法如:全拼双音输入方法、简拼双音输入方法。但这些输入方法都要对汉语拼音熟练掌握,重码率较高,输入速度慢。
本发明寻求最简便的输入方法,增强其直观性,使其易学、易记,降低其学习和掌握的难度,提高汉字的输入速度。
本发明根椐汉语拼音声母与英文字母绝大多数有对应关系的特点,将汉语拼音声母定义在键盘上相应的英文字母的键位上,对于汉语中没有声母的汉字,将声母看作“O”,声母“CH、SH、ZH”分别与英文字母“I、U、V”相应。汉语拼音声母与其键位代码如下:
英文字母 汉语拼音声母 英文字母 汉语拼音声母
A B b
C c D d
E F f
G g H h
I ch J j
K k L l
N n M m
O 零声母 P p
Q q R r
S s T t
U sh V zh
W w X x
Y y Z z
本发明根椐汉字结构特点,对GB2312-80中全部汉字进行统计和分析,归纳总结出以偏旁、部首、单字为形字根,并根椐形字根在汉语中习惯读音的声母分布在现有英文键盘上,同时将与形字根书写笔画或读音相近似的形字根也归入了相应的形字根内,定义为形字根异体字根。本发明所述的形字根,形字根异休字根,及形字根与其键位代码如形字根总表。
本发明根椐汉字地结构的特点,把包括在汉字结构内的可单独成为一个汉字的笔画组合定义为音字根。
为充分利用现有键盘,在保持已有键盘上的字母、符号及其他功能外,将优选的汉字形字根及异体字根、汉语拼音声母分布在二十六个英文字母的键位上,见健盘图。每个健位的排列顺序如下:
本发明根椐汉字结构的特点对GB2312-80中的全部汉字进行拆分、分析总结得出本发明的汉字拆分规律如下:
(A)本发明中已归入形字根的字根不再作为音字根,GB2312-80的二级字厍中的生避字不作音字根。
(B)按汉字书写笔画顺序,取汉字第一笔画所在的书写笔画最少的音字根;如果此时取得的音字根是整个汉字本身,应按书写笔画的顺序,取汉字第一笔画所在的笔画数最多的形字根。这一次拆分为第一次拆分,所得到的形字报或音字根称为第一字根。
(C)移开第一字根,将余下的部分按书写顺序取第一笔画所在的笔画数最少的音字根;如果此时无法取音字根,应取第一笔画所在的笔画数最多的形字根;或此时音字根包括余下部分的全部,应取第一笔画所在的笔画数最多的形字根。这一次拆分为第二次拆分,所得到的音字根或形字根称为第二字根。
(D)移开第二字根,将余下部分按书写笔画顺序取第一笔画所在的笔画数最少的音字根,如果此时无法取音字根,应取第一笔画所在的笔画数最多的形字根。这一次拆分为第三次拆分,所得到的音字根或形字根称为第三字根。
(E)移开第三字根,将余下部分按书写笔画取最末一笔画所在的笔画数最多的音字根,此时如果无法取音字根时,应取最末一笔画所在的笔画数最多的形字根。这一次拆分为最末一次拆分,取得的音字根或形字根称为最末字根。
(F)如果第一次拆分将汉字拆分完,即不再进行第二次拆分;第二次拆分将汉字拆分完,即下再进行第三次拆分,第三次将汉字拆分完即不再进行最末拆分。
本发明,由于采用了形字根,音字根及拆分规律,音字根无需记忆,匀可由拆分规律得到;形字根很少仅为二十九个;并且全部音字根的输入码能根椐其汉语拼音声母迅速得到;拆分规律简单易学;使用者无需经专项训练即可迅速输入汉字。实际编码过程表明,用到的音字根为三百个左右,且绝大多数为书写简单的常用字。由于音字根在编码时仅用到其汉语拼音声母,只要具有小学生毕业水平的汉语拼音识字能力的使用者即可迅速学会输入汉字。
由于本发明在缩码时未用到本字的声母,因此能够输入不认识的汉字及词组;大多数常用字为三码输入;本发明静态重码率低于2%;大多数重码为一到二位,即使在输入重码时也不会影响输入速度。
同时为了便于在输入汉字的同时,有时也需要输入英文字母,本发明同时将二十六个英文字母编入了汉字编码系统中,从而在以输入汉字为主的中文输入方式时,包容了英文字母的输入,当需要输入这些字母时,减少了转换操作的麻烦,对原键盘上上档符号仍保留了原来的输入方式。
汉字二十九形字根码编码方法、拆分规律及键盘输入法如下:
(一)输入单字根汉字,打入字根的输入码再加空格键结束。如输入“一”时即打入“一”的第一字根的输入码:“Y”,再打入空格键结束,整字编码为“Y”。
(二)输入含二个字根的汉字,即打入第一字根、第二字根的输入码再加空格键结束。如输入“郅”字,先取第一笔画所在的笔画数最少的音字根“至”,移开第一字根“至”,再取余下的部份第一笔画所在的笔画数最少的音字根,此时已无法取音字根,即取余下部份第一笔画所在的笔画数最多的形字根“阝”,汉字拆分完。即打入“至、阝”的输入码V、R,再打入空格键结束,整字编码为“VR”。
(三)输入含有三个字根的汉字,即打入汉字的第一字根、第二字根、第三字根的输入码,再打入空格键结束。如输入“部”字,先取第一笔画所在的笔画数最少的音字根“立”,移开第一字根,再取余下部分的第一笔画所在的笔画数最少的音字根“口”,移开第二字根,再取余下部分第一笔画所在的笔画数最少的音字根,此时已无法取音字根,应取第一笔画所在的笔画数最多的形字根“阝”,整字拆分完,即输入″立、口、阝”的输入码L、K、R,整字编码是LKR。
(四)输入含有四个字根的汉字,即打入第一字根、第二字根、第三字根的输入码,再打入最末字根的输入码。如输入“输”字,按书写顺序先取第一笔画所在的笔画数最少的音字根,此时音字根是“车”,移开第一字根再取余下部分第一笔画所在的笔画数最少的音字根,此时音字根是“人”,移开第二字根,取余下部分第一笔画所在的笔画数最少的音字根,此时已无法取音字根,应取第一笔画所在的笔画数最多的形字根,此时形字根是“一”,移开第三字根,再取余下部份最末一笔画所在的笔画数最多的音字根,此时已无法取音字根,应取最末一笔画所在的笔画数最多的形字根,此时形音字根是“刂”,整字已拆分完,即输入“车、人、一、卩”的输入码“V、R、Y、D”,整字编码为VRYD。
(五)输入由两个汉字组成的词组,即打入第一个汉字、第二个汉字的第一字根和第二字根的输入码,如输入“进步”时,先取“进”的第一字根和第二字根“井、廴”,输入码是“J、 Z”;再取“步”的第一字根,第二字根“止、小”,输入码是“V、X”。词组编码为“JZVX”。
(六)输入由三个汉字组成的词组,即打入第一个汉字,第二汉字的第一字根的输入码。再打入第三个汉字的第一字根和第二字根的输入码。如输入“计算机”时,先取“计”的第一字根“讠”,输入码是“P”,再取“算”的第一个字根“竹”,输入码是“V”,再取第三个汉字“机”的第一字根和第二字根“木、丿”,输入码是“M、P”。词组编码是PVMP。
(七)输入由四个或四个以上汉字组成的词组,打入第一汉字、第二汉字、第三汉字的第一字根和最末汉字的第一字根的输入码。如输入词组“中华人民共和国”时,取“中”的第一字根“囗”,输入码是“A”,再取“华”的第一字根“亻”,输入码是“E”,再取“人”的第一字根“丿”,输入码是“P”,最末取“国”的第一字根“囗”,输入码是“A”。整字编码是AFPA。
(八)输入汉字的过程中需要输入英文字母时,先打入英文字母的键位代码,再打入英文字母“E”的健位代码,再打入空格健结束。如输入英文字母“A”,编码为AE。
本发明的汉字二十九形字根码输入方法及其键盘。码长为四码,重码率低、直观,记忆量少,易学易记,输入速度大于是100字每分钟。适用于一切大、中、小型汉字信息处理系统及各种打字、照排、电脑通讯系统。
附图说明:
图1 汉字二十九形字根码编码法形字根总表
图2 汉字二十九形字根码编码法键盘图