计算机汉字笔顺区位输入法及其键盘 一、本计算机汉字笔顺区位输入法所属技术领域为计算机汉字信息输入和处理,且属于以笔划为主、笔划声结合的汉字编码输入方法。
二、目前已有的汉字输入方法大体可以分为:
1、声码类:此类输入方法以汉语拼音为主,如标准、全拼等;优点是简单易学,缺点是重码率较高,输入速度较低。
2、形码类:此类输入方法以汉字的部首、偏旁、形状为主进行汉字拆分编码,如五笔字型等;优点是输入速度高,缺点是人为规定多,记忆量大,需专门培训,较难学。
3、声形结合类:此类输入方法是在形码的基础上加入汉语拼音因素进行组合编码,如自然码、六笔声形汉字输入法等;优缺点介于以上两类输入方法之间。
我们认为,目前已有的编码方法都没有在学习速度和输入速度之间找到最佳结合点,不能很好地适应普及计算机汉字输入技能的需要。
我们还认为,形音结合是解决“两个速度”关系的方向,而使形码简洁、富于规律、尽量摈除机械记忆,则是解决问题的关键。
目前已有的输入法中与本输入法最为接近的是“六笔声形汉字输入法”,清华大学出版社1992年12月出版的《汉字操作系统及文字处理系统实用指南》较好地介绍了该输入法。该方法将汉字基本笔划分为六种:横、竖、撇、捺、折、拐,并将其中任意两个笔划的组合编为形码(字根码),再以声码和形码的组合编制汉字输入码;该方法将笔划组合引入汉字编码,一定程度上解决了根据汉字偏旁部首编码记忆困难的缺点,是汉字形码编码领域的一大进步。但该方法仍存在着一些问题:
1、用“独立字根”(汉字的各种笔画、偏旁部首)为单位拆分汉字组成编码,仍未摆脱各类形码的通病。由于汉字的部首多达几百个,一些界限不很清楚或相互交叉、重叠的部首之间应如何区分和拆分,哪些算部首、哪些不算等,都需要较多的人为规定,因而增加了记忆量和学习难度。
2、合体字的取码方法为:第一码取声码,第二码取合体字第一个独立字根码,第三码取合体字第二个独立字根码,第四码取合体字最后一个独立字根码。这样,多数合体字的拆分要有三次,拆分的次数相对较多。例如:动-D111663(DGGE),照-Z615344(ZHEO)等。拆分次数多,输入汉字时的思考环节就多,输入效率就低。
3、先将字根分成36类,再将这36类字根分成26类,布置到26个键位上,多了一次分类,不够简明;而且这样一来,16个键位上有两类字根,10个键位上只有一类字根,键位的“负担”显得不均衡,缺乏美感。
4、码位的布置规律性不强。
三、本发明的目地,就是试图克服以上各种声码、形码和声形码存在的问题,提供较为完善的计算机汉字输入法。利用人们对汉字都有的书写和拼音知识,对形和声取长补短,使汉字的编码规律性强、易理解、好记忆,又使重码率被控制在非常低的水平;从而使任何人都能以较快的学习速度达到较高的输入速度,甚至通过口授的方式也能很快掌握,且一般不会遗忘。
需要特别指出的是,本输入方法收入70000字、词左右,字词重码率在12%左右,平均每字击键2.24次;加上极为规则的、按区位布置的码位和简单清晰的单字一次拆分,普通人从学习的开始就自然而然地进入了盲打状态。
四、技术方案
我们知道,汉字最基本的组成单元是笔划,人们认识、熟悉和书写汉字首先是从笔划,而不是从部首开始的;汉字的书写是按规定的顺序一笔一划地写;根据这一特点,我们以国家规定的标准汉语拼音方案、标准汉字书写笔顺和标准印刷宋体字为基准,以非常简洁的方式,从汉字的书写笔顺和读音中提取最明显的特征作为汉字的输入码,并将这种计算机汉字输入方法称为“汉字笔顺区位输入法”。
1、汉字笔顺区位输入法的输入码由笔顺区位码和声码两种码构成。
A:笔顺区位码:
(1)将汉字的笔划分为五类:
横:单向笔划,运笔方向从左至右,基本水平,轻重一致;
竖:单向笔划,运笔方向从上至下,基本垂直,轻重一致;
撇:单向笔划,运笔方向从右上至左下,先重后轻或轻重一致;
点:单向笔划,先轻后重(包括“捺”);
杂:以上四种笔划以外的其他笔划。
(2)将以上5类笔划两两组合可以得到以下25种笔顺:横横、横竖、横撇、横点、横杂、竖横、竖竖、竖撇、竖点、竖杂、撇横、撇竖、撇撇、撇点、撇杂、点横、点竖、点撇、点点、点杂、杂横、杂竖、杂撇、杂点、杂杂。
(3)将键盘的主键区按“横、竖、撇、点、杂”分为五个“小区”,从右侧中排起,逆时针旋转排列;每个小区又分为“横、竖、撇、点、杂”五个“键位”,分别对应左右双手的食指、中指、无名指和小指;任何两个有序的笔划都有一组唯一的“区、位”与之对应,由此而确定的汉字输入码就叫笔顺区位码,简称笔顺码。
键盘布置见附图。
B、声码:汉字的拼音的第一个字母。如果第一个字母为韵母A、E、O,则其声码一律为“A”。
例如,“本”、“好”的汉语拼音分别是“BEN”、“HAO”,其声码分别为“B”、“H”; “爱”、“欧”的汉语拼音分别是“AI”、“OU”,其声码均为“A”。
所有声码的键位在普通键盘上均与同名的英文字母键位相同。
2、单字与词组的输入方法:
(1)单字的输入方法:
一般单字:首笔顺码+第二笔顺码+声码+空格键。
一级简码字输入方法:首笔顺码+空格键;
二级简码字输入方法:首笔顺码+第二笔顺码+空格键。
(2)词组的输入方法:
词组输入码均为四位,由笔顺码组成。
二字词:第一字的两个笔顺码+第二字的两个笔顺码。
三字词:第一字的两个笔顺码+第二字首笔顺码+第三字首笔顺码。
四字词和四字以上词组:
第一字首笔顺码+第二字首笔顺码+第三字首笔顺码+最后一字的首笔顺码。
由以上看出,每个单字最多拆分一次。
3、笔顺码取码方法——“层撕拆字法”(简称“层撕法”)
(1)将汉字的结构分为四类:即横层、纵层、套层和独层结构;这些结构分别类似于我们平常所说的上下或上中下结构、左右或左中右结构、包围或半包围结构和独立结构。
横层结构:如蓝、思、爱、垫、碧、雷、兴、旦等;
纵层结构:如使、海、纵、独、撕、别、倒、楷等;
套层结构:如国、园、风、阔、同、用、医、迁、建、左、发、武、式、载、病、展、等;
独层结构:以上三种结构以外的其他结构,如中、东、母、为、办、重、乘、成等。
另外,带下框的字,如击、画、幽、函等,国家规定为独体字,所以本输入法将它们作独层结构处理。
(2)笔顺码的确定:
首笔顺码的确定:取每个字的第一笔、第二笔组成首笔顺码;例如:“和”的第一笔为撇,第二笔为横,首笔码顺就为“撇横”。
第二笔顺码的确定:用“层撕拆字法”规定将字已取过首笔顺码的那层“撕去”,取剩下部分的第一笔、第二笔组成第二笔顺码。
(3)“层撕拆字法”规定:
a)纵层结构(即左右结构)的字:
将取完首笔顺码的最左边一层撕去。
b)横层结构(即上下结构)的字:
取完首笔顺码后,先看字的下层有没有字,如有字,将最大的字留下,其余部分均撕去,如“碧”、“蒙”、“常”、“惫”、“赛”、“舞”等字,分别将“石”、“豕”、“吊”、“思”、“贝”、“舛”留下,撕去其余部分。
如该字的下层没有字,则看它的上层有没有字,如有字,将最大的字撕去,留下其余部分。如“举”、“荒”、“弈”、“令”等字,分别将“兴”、“芒”、“亦”、“人”撕去。
如该字的下层和上层均没有字,则将该字取完笔顺码的最上一层撕去(把字看成是一层一层地摞起来的一样),如“象”、“立”、“夏”均有三层,“甚”、“衣”有两层,撕去最上一层即可。
c)套层结构(即包围、半包围结构)的字:
先写外层(包围)部分的字。如内层(被包围)部分本身或它的下部是字,则将最大的字留下,将其余部分撕去。如“国”、“痘”、“鹰”、“摩”、“席”、“戴”等字,将“玉”、“豆”、“鸟”、“手”、“巾”、“共”留下,撕去其余部分。如被包围部分的下部不是字,则直接将包围部分撕去。
有些包围结构的字,如“式”、“可”、“医”等,按照标准笔顺,在写完包围部分的第一笔后,就要接着写被套部分。为便于拆字,这里规定这类字要先取包围部分的首两笔作第一码,再取被套部分的首两笔作第二码,可理解为写完包围部分再写被包围部分;所以,“式”的第一码和第二码的取法分别为“横杂”和“横竖”,“可”的第一码和第二码的取法分别为“横杂”和“口”,“医”的第一码和第二码的取法分别为“横杂”和“撇横”。
先写内层(被包围)部分的字,如“连”、“建”等,直接将被包围部分撕去。
d)独层结构(一般是独立结构)的字:
取首两笔和尾两笔分别作第一码和第二码,如“乘”的第一码和第二码分别为“撇横”和“撇点”,“东”的第一码和第二码分别为“横杂”和“撇点”,“生”的第一码和第二码分别为“撇横”和“竖横”。
(4)“层撕法”特殊规定:
a)由于“撇竖”和“撇点”这两种笔顺都很少,将它们并入“I”键。
b)为使各键位的使用率较为均衡、避开过多的重码,对以下12个字或部首不按它们本来的笔顺码击键,而击特殊规定的键:
日:竖竖(U)键;
月:杂撇(C)键,可把“C”想像成弯月;
宝:点竖(F)键(包括宝盖头),可把宝盖头的前两笔看成是“点竖”;
竹:竖撇、竖点(I)键(包括竹头),可把“I”看成一根竹竿;
木:M键,M是木的声母;
草:横点(L)键(包括草头),可把草头的前两笔看成是“横点”;
金:撇撇(E)键(包括金旁);
山:杂竖(V)键,可把“V”看成是一坐倒过来的山;
口:O键,口与“O”很像;
十:竖横(Y)键,可把“Y”想像成一个人高举双手;
虫:杂点(X)键,可把“X”想像成一只四腿伸得很长的爬虫;
手:N键(包括提手旁)。
可用口诀来记忆:“日月宝,竹木草;金山口,十虫手”;如不愿意死记,也可把这十二个字写成小卡片(大小为键位面积的三分之一左右),用透明胶带纸贴到相应的键位上。
其中,口、木、日、十有与别的笔划交叉的或因取前一个笔顺码而被拆开的,均不再用以上规定的键;如,“中”(口字被交叉)的第一码应为“竖杂”;“本”(木字被交叉)的第一码应为“横竖”;“禾”(木字被分开)的第一、第二码应为“撇横”、“撇点”;“申、旧”(日字被交叉或分开)的第一码应为“竖杂”、“竖竖”;“共、老”(十字被交叉)的第一码应为“横竖”。
c)如单字取完第一码后只剩一笔,则第二码就取该笔“本键”所对应的码(横的本键为“横横”,竖的本键为“竖竖”,等等);如“刃”字,取“杂撇”为第一码后,只剩一笔“点”,则取“点点”为第二码;“引”字,取“杂横”为第一码后,只剩一笔“竖”,则取“竖竖”为第二码。如单字仅由一笔组成,则该字只有一个笔顺码,即该笔的“本键”所对应的码;如“一”的笔顺码为“横横”,“乙”的笔顺码为“杂杂”。
d)字的第一笔悬空,单独构成一层的,这一笔要与它后面的部分共同构成新的一层来取首笔顺码,即此单独的一笔和其后面部分的第一笔组成笔顺码;如“豆”的笔顺码为:横竖+点撇;“亘”的笔顺码为:横竖+横横,“旧”的笔顺码为:竖竖+横横。
e)仅有一个笔顺码的字,如只有一笔和两笔的字,还有前面列出的12个特别字,都只有一个笔顺码,输入时应连击两次这个笔顺码(“一”字除外);如“乙”字击“杂杂+杂杂、“厂”字击“横撇+横撇”、“手”字击“N+N”、“金”字击“E+E”等等。
f)大写数字二、三、四、五、六、七、八、九、十的输入方法为首笔顺码+N+空格键;例如:“五”击“横竖+N”,“九”击“撇杂+N”等等。
4、其它:
弄不清汉字的输入码时,可击波浪号“~”代替输入码来查询。
建立自己专用的词组:按下“Ctrl+~”,将词组中的每个字逐个输入,然后再按下“Ctrl+~”,下次就可以按词组规则输入该词组了。
由于“横杂”键占用了分号“;”的位置,输入分号时,先击一下左手小指旁的“Caps Lock”键,再击原来的分号键即现在的“横杂键”。
5、输入方法举例:
(1)单字(空格键省略):容:FW、兴:SWX、哥:J;G、命:WJ、凸:YBT、凹:PBA、修:RIX、或:;O、链:E;L、满:SL、勃:YCB、生:TY、 速:JAS、业:UH、买:XW、卖:YXM。
(2)二字词
国家:PHFK 足球:OYH; 金融:EEJX 经济:ZXSG
军事:A;J; 非常:YYIO 蛀虫:XGXX 满意:SLGA
(3)三字词
阿拉伯:V;NR 大使馆:KARQ 联合国:JDWP
脊梁骨:ACSP 里程碑:PYTK
(4)四字词
国有企业:PKWU 股票交易:CJGU
翻山越岭:WVYV 故步自封:YYRY
家喻户晓:FOAU 先见之明:TPAU
(5)多字词
中华人民共和国:PRWP 世界经贸组织:JPZZ
6、关于键盘
本输入法适用于普通键盘,关于笔顺码和特殊部首在键盘主键区的布置如附图所示。
五、本输入法与已有的输入法相比,所具有的特点和积极效果:
1、除收入国家标准汉字集的全部6763个汉字外,收入常用词汇和惯用短语58000个左右;字词重码率为12%;简码字的总频度为84%左右;平均每字击键2.24次。这里提到的词汇量、重码率、简码字总频度、平均每字击键次数五项指标,在目前已有的各种输入法中,均是最好的之一。
2、首创的“层撕法”,把人们从大量的、关系复杂的部首中解放出来,几乎不会产生“怎样打”的问题。由于只对单字作一次拆分,即只“撕”一次,避免了其他以形为主的输入法因对汉字拆分过多而“累人”的弊病。
3、单字的输入最多只需三码。
4、以形为主,以音为辅,词组输入完全用形码,既收到了形音互补的效果,又避免了输入过程中形音的频繁转换而造成的“二维思维干扰”(正常输入时,平均每100字次中只有4字次需要音码辅助)。
5、将所有韵母合并成一个,使得南方口音的人在输入声码时也没有任何障碍。
6、笔顺码在键盘上排列规律性强、直观,而且美观。笔划区是从右手起逆时针旋转排列,笔划位是从食指到小指排列,符合中国人的日常习惯;对于在不同的区但在同样的位的笔顺码,都是用同样的手指(左手或右手)击键,完全对称。如横位和竖位都是用食指,撇位都是用中指,等等。打字时不必看键找键,根据字的笔顺就能知道在什么位置、用哪个指头击键,自然就养成了正确的指法,并且很快就可以盲打。
如输入“繁”字,其首笔顺码是“撇横”,当操作者大脑中反映出“撇”时,他(她)的左手可几乎同时挪到撇区;当操作者大脑中再反映出“横”时,左手的食指也可几乎同时在横位上击下;其他笔顺码的输入过程也一样。
7、除了12个部首(结构)和包围结构中少数单字的笔顺有特殊规定(也是有规律的)外,完全按国家语言文字工作委员会规定的标准读音、标准笔顺、标准印刷宋体字以及人们对汉字结构的共同认识进行编码;在一定意义上对汉字的规范教学和规范应用有很大促进。
六、本发明人已编制出第四版“计算机汉字声笔顺区位输入法”软件,可方便地在DOS和WINDOWS下安装使用,安装方法是:
(1)在DOS下,将本输入软盘插入驱动器,然后执行:a>setup。
(2)在WINDOWS下,将本输入软盘插入驱动器,然后运行:setup。