电脑、字典共用新部首汉字输入法及其键盘 本发明涉及一种可以用于在字典上对汉字进行检索,同时又可以作为电脑汉字编码的汉字输入法及其键盘。
现有的汉字编码方式大致可以分为按拼音编码方式,整字编码方式和字形分解方式三大类。目前最通用的几种输入法是:双拼输入法、郑码、王码五笔字型输入法等。对于双拼输入法,对一些汉语拼音基础差的人操作十分困难。而对郑码、王码等一些形码在设计编码时,是按部首或形体的笔划构成的情况,按各自的设计要求大同小异地把汉字部首或形体人为地分配到各个键位上进行编码。这样就容易把水字和三点水氵,衣字的衣字旁衤,心字和竖心旁忄,爪字和爪字头爫,耳字和耳字旁阝等看成是不同的部首。这使编码不同于传统的部首检字法、不同于查字典、并和中小学的语文教育相脱节。有些地方还违背了汉字的书写规则。由于抓不住汉字之间的根本区别,通常要用四码才能表达一个汉字,不仅按键次数多,输入效率慢;同时对简体字、繁体字、异体字不能共存混排,适用面窄;而且规则也极为复杂,极大地加重了大众的思维负担,减慢了电脑汉字输入大众化普及推广使用的进程。
本发明的目的是提供一种能保持传统部首检字法精华,能与中小学语文常识相吻合,既能用于字典检索,又能用于电脑汉字编码的汉字输入法,使汉字编码变为象查字典那样简单易学,既适宜普及推广,又能使简繁字共存,方便各类人员使用的汉字输入法及键盘。
本发明的技术解决方案是:用36个新部首编码,三码为一字组成一切汉字及词组,每一码都有具体的中文和数字名称。每个部首除了部首字外,数字部首规定了一些部首笔划,汉字部首还以部首字的笔划增减、约定俗成、习惯组合的方法规定了三个主要字定位号为1、2、3,一些从属字从属部首的定位号为4,用以辅助编码,汉字输入的部首代码在键盘上各键代表如下: 一、 丨、丿、; 丿、 丶、; 乙、 二、十、厂、ナ匚、 卜、リ、刂、 儿、几、匕、勹、、ク、 冫、亠、冖 又、九、厶、凵、 <=>金、食、全、佥、钅、饣、 <=>木、本、禾、末、我、禾、 <=>水、小、永、雨、少、川、氵、彡、 <=>火、谷、米、为、业、灬、 <=>土、工、去、在、士、专、 <=>日、申、由、白、曰、臼、丑、曲、瓦、 <=>月、舟、用、骨、夕、甫、<=>山、上、止、石、、、<=>草、早、革、平、半、甘、艹、、廿、 卄、<=>四、西、皿、黑、酉、 罒、<=>人、八、大、天、太、入、彳、夭、亻、 癶、天、<=>手、丁、刀、毛、力、寸、卅、扌、;<=>口、巾、中、束、柬、<=>耳、其、聿、车、东、乍、长、阝、卩、 镸、<=>目、贝、见、艮、身、臣、且、且、 身、<=>足、兄、古、舌、、舌;<=>衣、龙、立、辛、示、尤、尢、礻、衤、 <=>门、内、同、国、戊、口、 、冋、<=>丝、竹、羽、弓、了、非、予、乡、幺、纟、 、<=>虫、鱼、鸟、斤、丘、<=>马、牛、豕、犬、马、 犭、豸;<=>王、丰、羊、韦、玉、、 ;<=>不、爪、勿、女、瓜、爫、<=>心、己、巴、也、片、爿、巳、 丩、丬、片、<=>宝、尸、广、方、万、穴、宀、 <=>言、之、文、弋、戈、戋、讠、辶、廴、攵、
数字234还可以用来表示它后面相同地部首或形体连续书写的数量。
本发明的优点在于只采用36个新部首编码,三码一字组成一切汉字,并且直接用部首作为键名,每一码都有具体的中文和数字名称,可以同时用于字典检索。尊从文字规范,遵守书写规则,记忆量少,编码直观,规则简单,易学易懂。同时取较短的码长,合理的重码,按键次数少,输出效率高,输出GB2312(80)中6763个汉字图形中的6720个汉字只要按键22114下便能完成,比四码一字的编码的26880下快4766下,比王码靠记忆的简码的26205下快4091下。本发明保持了传统部首检字法精华,能和中小学语文常识相吻合。因此,既能用于字典检索,又能用于电脑汉字编码的汉字输入,使汉字编码变为如查字典一样简单易学,易于普及推广,方便各类人员使用。
下面结合实例对本发明作详细说明:
图1为数字部首安排图;
图2为汉字部首安排图;
图3为新部首安排学习图;
图4为新部首键盘安排图。
本发明是根据汉字的起源和传统的部首检字法,精简为36个新部首编码,三码一字组成一切汉字及词组,一切汉字可用12345、67890、金木水火土、日月山水田、人手口、耳目足、衣门丝虫马、王不心宝言这36个新部首来组成。
本发明用于电脑编码时,在键盘上是按自己的顺序排列,用中文和数字表示,便于记忆和操作,原有西文键名不变,中西文符号对应,键盘安排如图4所示。
编码规则:按汉字书写规则,书写顺序取汉字的第一、第二和结尾的最大的部首为码,三码一字,不足三码的末部首是部首字的直接按空格键结束,末部首是主要字、从属字、从属部首的,先取其位号,不足三码再按空格键结束。有重码的按电脑提示,按任意键,空格键或提示键序号结束。词组为等长三码,输出二字词组时,取第一字的第一部首,末字的首尾部首为码,输出三字以上词组取前二字的第一部首,结尾字的结尾部首为码。词组和单字同码的按转换键转换为词组。
如:保(人口木)、水(水□)、冯(9马□)、兵(虫9□)、卜(7□)、泛(水3言)、涎(水3言□)、沥(水6手③)方案(宝宝木),事半功倍(1草□)……等等。
注:括弧内是此汉字或词组的编码,↓代表按任意键,□代表按空格键,③代表按电脑提示的序号的键号(下同)。
以上规则中,(1)汉字的书写规则即文字规范中的先横后竖,先撇后捺,先左后右,先里后外,先中间后两边,先里面后封口。
如先左后右:乃(350□)及(354),先中间后两边:兆(399)、脊(39月)。
(2)最大的部首是指笔划最多的部首,但应取到不破坏下一部首为止。
如l于(620□)不取(112)或(160□),豆(1口草)不取(1口1),译(言06)不取(言02),(67目)不取(11目),但辰(61衣)不取66因拆散了,尊(9田手)不取草部因拆散了酉,函(5水1),函(5水0)不取丝部因拆散了水、等等。
(3)用2、3、4表示它后面相的部首或形体连续书写的数量时规则一样,相同的形体用其首尾部首表示,但超过三码就不能用。如吕(2口□),森(3木□),磊(3山3),掇(手40),邋(35言),删(2门7),噪(4口木)等,但操(手口木)不能取(手3口木)。
(4)重码处理的具体办法是:如有重码电脑鸣笛提示,是二字重码的,两个字同时出现在光标处,较常用的在前,接任意健输入(即不必选字直接输入下一字),其它字在后按空格键输入。是三字以上重码的,各字及序号提示在下,按序号键输入。
本发明有编码一样的输出GB2312(80)中6763个汉字的《常用字编码检字表》,供暂不使用简化字地区使用的《汉字编码检字表》和输出94年版《新华字典》中11315个单字的《字典字编码检字表》可供选择。使用后者可以简、繁字混排,随意选择,但对简繁同码部首在显示简化字后,如英文大小写转换那样按capsLock转换键转换为繁体字。本发明容量特大,用三码可以输入常用的词组5OO0多个以及92年版的《汉语成语小词典》的3559条成语。
以下是一些汉字和词组用字典检索和电脑编码输入的实例:
十。一看就知这是横起两画,属6部。如字典检索十字,翻到6部,在空格键符号□处就找到②十425,在字典的425页就可以找到十字。如电脑输出,按键,不足三码,末部是部首字,按空格键结束。这时电脑鸣笛两下提示该码有三个或以上字重码。①二②十③厂提示在下。按键就把十字输出。
马。一看知到这是部首字。查字典,找到马部,在空格键□处有马310、CL馬3l0。在310页可找马字。电脑输出、按马键,按空格键□结束。马字就显示出来。如要输出繁体字、再CapsLock键即转换成馬字。
牛。属马部,位号1。查字典找马部、在第二部首1处查到马1□牛346、在346页可查到牛字。电脑输出,按键、键、不足三码,按空格键□结束,得牛字。
对。第一部首又、是折起两画、属0部,第二首寸、属手部主要要字、位号4。查字典,找O部、手部、4处见↓对106、查106页就见对字;电脑输出、按键、键、不足三码、末部首是主要字,加其位号4、按键结束。此时,电脑鸣笛一声提示这是二字重码、对劝同时显示在光标处、因我们要输入前字,所以就不必选字,直接按一下字的编码,劝就消除得对字。
沐。属水部、第二部首木部。查字典、水部、木部、□处、有沭333,可在333页打到沐字。按键、键、末部首是部首字、按空格键□结束。输出沐字。
碧。王部,第二部首白属白部,第三部首石属山部。查字典王部、日部、山处有碧26、在26页能查到碧字。编码按、电脑输出碧字。
啃。口部、第二部首止属山部,月部、查字典口部、山部、月处有:①啃255,找255页见啃字;按,电脑鸣笛两声提示这是三字或以上的重码,①啃②嘣⑧哕④嘴显示在下,按键就可选出啃字。
囊。虽然复杂。担很易看出一二尾三个部首是一口、查一部、口部、衣处有囊338、找338页。在电脑上按键得囊。
鑫。3部、金部、口处,鑫5l7。按键、得鑫。
兢。由两个克组成,克由十兄组成,十属6部,兄属足部,查2部6部足处有兢233;按键得兢。
合理:是二字词组,取合的人部,理的王部土部按三键输出合理二字。
中国:是二字词组,按电脑鸣笛提示词字同码,按CapsLock键转换显示中国二字。
承前启后:是四字成语,按键输入。
中华人民共和国:是三字以上词组,按电脑鸣笛提示词,字同码,按CapsLock键转换显示中华人民共和国词组。
图2中:括号内的部首是简繁同码部首。