形轨汉字输入法 本发明涉及的是一种用于计算机汉字输入方法,更具体地说是一种拆分成字根与笔画,对应设置在通用标准101键键盘上,通过击键输入汉字的方法。
汉字输入法已有多种,但很难说一种汉字输入法被公认为完全符合中文语音、文字规定,能够与国民教育同步学习,适合用于幼儿教育,这正是各界教育家呼吁有识之士来研制的课题。
于1994年12月18至20日召开的中文信息学会汉字编码专委会第六届学术交流会会议纪要指出:“电脑应用已从政府机关和企事业单位开始走向家庭。然而,汉字输入技术仍是普及应用的关键。虽然经过广大科技工作者的共同努力,汉字输入系统从无到有,初步解决了汉字输入计算机的问题,但是,应该看到市场上流行的一些汉字编码方法易学性差,特别在规范化方面问题更为严重,不利于计算机的普及和中、小学语文教育,这些问题已引起教育界强烈关注。纷纷呼吁改变这种状态。因此,当前不宜强制地规定某种输入法作为公务员考核和学生考试的内容。”与会代表特别强调加强基础理论研究,加紧规范化、标准化工作。
目前市场上流行的形码、音形码所普遍存在的缺点是:违背中文规范,对不能拆分的传统部首、偏旁、独体字乱拆,破坏中文的传统;自定的规则不规范,与语文教学相矛盾,需死记硬背,难学易忘。全拼、双拼码容易学,但重码多,需要多次翻屏,使用极不方便。拼音有国家标准,但键盘上韵母、双声母部署未按拼音分组,不易记,有些键手指负担重。为减少拼音重码,改用大、小写,增加定义键,不仅难记易错,而且击键次数增多。因此有人认为单字输入法无法突破3键/字,转向“单字依赖词语”的做法,转向智能选语句,然而其结果是存储占用量增大,而效益却增加较少。
本发明的目的是提供完全符合中文规范、易学、击键少的单字输入法,在单字优化基础上优化词语,大幅度减少击键数,解决已有汉字编码方法的不规范、难记忆、击键多、容易忘问题,充分利用国民教育中人人必学的中文知识,不便拆地字,不乱拆,保持汉字的完整性。本发明与传统语文教学没有矛盾,可与国民教育同步学习,辅助语文教学,帮助教师纠正学生学语文中的错误。
本发明汉字编码方法是:按规范将合体汉字拆成字根,独体字和传统部首不拆,将字根、笔画按本发明规则与键盘各键位相对应。在输入汉字时,对于独体字(不拆的汉字),键入该汉字的声母和首、次、末笔画;对两字根组成的汉字,键入两字根和首、末笔画;对三字根汉字,键入三字根和末笔画;对四个以上字根的汉字,键入前三个和最后一个字根。本方法采用“单字为基础”的原则,单字优化排序,尽量减少常用字的击键数,每组码一字,击空格键上屏。字后带词,用数字选择上屏。
本方法适合于儿童学习汉字、青壮年扫除文盲、外国人学汉字和电脑处理汉字。将本方法用于教学,可将识字、写字、查字和打字四结合,纠正识字、写字的错误,提高正确率,做到“字有定码、词有定位”。熟练后,成条件反射,可盲打。
下面对本发明的汉字编码方法详细说明如下:一、拆字规则:
为实现本发明的目的,拆字规则必需符合中文规范,符合公认的传统方法,不便拆的字,不乱拆,保持汉字的完整性,充分利用国民教育中人人必学的中文知识。为适应标准键盘,只补充制定少数规则。本发明拆字规则是:
1、相聚型的汉字,如:鱼广非革角食示穴金,它们本身多是传统部首,用作字根,不拆。
2、相交型的汉字,如:聿禺禹必本册丹东果尹井,也作为字根,一般不拆。例外情况是:将“办”、“来”两字拆成“力”和“未”及两点。
3、相离型的汉字,如:语赢仰驼货,拆开,例如将“语”拆成“言”、“五”、“口”三个字根。汉字中的独立笔画也拆,例如将“旧”字拆为“丨”和“日”两字根的组合。
4、相接型的汉字,其中:多笔相接的汉字,如卓爱幸展甬妻表,拆开;传统部首,如:米文足衣羊,不拆;单笔与多笔相接的汉字,如:永歹于互方千广户禾开少生丕千丘壬刃天兀矢成习正主自,不拆。 二、字根键位设置:
本发明采用字根与键盘键位的对应关系简单明了、便于记忆,本发明的键盘键位布置,如下表所示,采用了表后面列举的三条对应规则:
乾坤形轨汉字输入法以音、形、笔画数映射键盘位置图
1、音托为主,共26键(见下表第二行),即当字根是独体汉字时,采用该汉字声母所相应键位,如字根“东”的键位是“D”;字根“开”键位是“K”等等。
2、形托为辅,共3键(见下表第三行),即“卩”、“阝”采用形状相似的“P”键;“杀”字的上部字根“”采用“X”键;字根“扌”采用“F”键。
3、数托为辅,共3键(见下表第四行),对说不出名称的杂根,按其笔画数目分为三类:二笔采用“E”键、三笔采用“S”键、多笔采用“O”键。三、笔画键位设置:
在本发明中,笔画只有横竖撇点折五种,按左右排列与非左右排列型的汉字,分别用是如下两组键位表示:
笔画 横 竖 撇 点 折
左右排列(形似) E I A O U
非左右排列(音似) H V P D Y
需要说明的是:横类包括提;竖类不包括竖钩(算折笔);撇类包括长撇和短撇;点类包括捺;折类指各种各样的折笔。四、组字规则:
独根字:声母+首笔+次笔+末笔
双根字:首根+次根+首笔+末笔
三根字:首根+次根+三根+末笔
多根字:首根+次根+三根+末根
根顺和笔顺一致,矛盾时,笔顺服从根顺,其中所述首笔是指首根的第一笔画,末笔是指末根的最后一笔。五、五级定位规则:
在采用上述组字规则的同时,本发明的一个重要特点是为了最大限度减少击键次数而采用五级定位规则,进行优化排序,常用字优先,罕见字靠后,最常用的特高频字用特定键,一键上屏,常用字减去后三码,只用一码,即采用不等长、非全息方法,使常用字击键数减少,做到“字有定码、词有定位”。第一级:一键上屏,共18汉字,其中:
1、提示行显示10字,击数字上屏,它们是:
1的、2不、3和、4是、5在6有、7中、8个、9为、0了;
2、符号键上八个字。不显示,击键上屏,它们是:我(丶)、一(-)、十(=)、人([)、大(])、这(\)、上(;)、来(′)。第二级:一键显示,空格上屏,共26字,它们是:
q其、w出、e而、r人、t地、y之、u就、l也、o上、p将、a到、s以、d大、f把、g工、h一、j几、k国、l加、z发、x下、c过、v十、b并、n他、m面。第三级:二键显示,音托、形托、数托组字,空格上屏。
音托组字,例如:x(西)n(女)要r(日)c(寸)时
n(女)k(口)如n(亻)m(门)们
音托、形托,例:f(扌)r(日)提p(阝)r(人)阶
w(车)l(六)较l(立)k(口)部
数托、音托,例:E(二笔杂根,表示“斗”左上两点)V(十)斗
S(三笔杂根,表示“须”字的左边三撇)I(页)须
O(多笔杂根,表示“段”字的左边部分)J(几)I(又)段第四级:三键显示,击空格上屏。
例:f(扌)l(立)n(女)接f(扌)b(巴)e(横)扑
u(夂)k(口)P(撇)各r(人)y(止)p(撇)企
S(三笔杂根)B(比旁)I(竖)北第五级:四键显示,空格字上屏,例如:
t(土)k(口)h(首笔横)h(末笔横)吉
a(月)b(八)k(开)l(竖)胼
采用上述五级定位方法,各级字在常见文献中出现的频度为:
18个一键上屏字:16~18%;
18个一键上屏字加26个一键显示的字(共44字):35~40%;
上述44个字加670个二键显示字(共714字):83~85%;
三键显示字:96%以上。
字后可以带数个词:
此外,由于根据本发明,在提示行中只出现一个单字,为充分利用提示行空间,字后可以带数个词,一键、二键显示的字后也可带四字以上词,运用得当,可大幅度减少击键数。每词前面冠以数字2、3、4....8,选数字上屏。
本发明所采用的编词方法是:
1键字后词:首字首根;
2键字后词:首字+次字首根;
3键字后词:首字首根+次字首根+末字首根;
4键字后词:首字首根+次字首根+三字首根+末字首根。
其中:一键显示、二键上屏词180~230个;二键显示、三键上屏词5000~6000个;三键显示、四键上屏词可达4万个。根据不同用户需求,可装配专用词语库。本发明的形轨汉字输入法着重在单字上下了功夫,使常用单字击键大幅度降低,单字后配上词语,比其它方法击键少。
形轨法只用一页纸的教材,30分钟学习可入门。
六种汉字输入法对占统计频度50%的163单字击键比较
五笔 全拼 双拼 乾坤音轨 乾坤音形 形轨总击键数 530 718 489 337 339 458击键数/字 3.25 4.40 3.00 2.06 2.08 2.8百分比 157.27% 213.05% 145.10% 100% 100.59% 135.9%五种汉字输入法对现代文《创造》287字用单字击键比较
五笔 双拼 乾坤音轨 乾坤音形 形轨总击键数 903 894 661 666 731击键数/字 3.27 3.12 2.30 2.32 2.55百分比% 136.61 135.24 100 101.66 110.6五种汉字输入法对古文《施氏食狮史》98字用单字击键比较
五笔 双拼 乾坤音轨 乾坤音形 形轨总击键数 363 432 319 281 331击键数/字 3.70 441 3.26 2.87 3.38百分比% 129.18 153.7 113.5 100 117.8乾坤形轨不选键,击空格上屏,相对速度快。