本发明涉及一种将所要处理的数据转变成为计算机能够处理的形式的输入方法及其装置,更确切地说是涉及一种计算机汉字信息输入的方法及其装置。 以书写笔顺为基础的计算机汉字信息输入编码,如五笔码、八笔码等,符合人们的书写习惯,容易掌握,但因每码仅代表一笔,因而码长、输入速度慢。双笔码每码代表两笔,输入速度提高,如“双笔顺计算机汉字输入方案及其键盘(CN87100555A)”、“一种汉字笔形编码方法(CN1049920A)”,均以横、竖、撇、点、折五种基本笔画两两搭配形成25种双笔形组合,并分配到国际标准打字键盘的键位上,按各自的编码规则输入汉字。前者双笔顺方案使用35个键位,且键盘排列没有规律,选用了13个偏旁部首以减少重码字,用了九个键分别代表单笔。后者笔形方案使用30个键位,其组序呈奇偶排列,也就是说,在五笔划中,前笔在偶数位置上的码排在键盘左边,前笔在奇数位置上的码排在键盘右边,其列序是左半部从右向左排,右半部又反过来从左向右排,选用25个偏旁部首以减少重码,专门用了五个键解决单笔问题。
“八笔首音(傻瓜)码汉字输入方法”(CN1037598A)将汉字的笔划归类为八种,以其笔划名的声母作代表,将汉字的拼音首字符作为第一码,再根据书写笔顺,取该汉字的起、次、未笔划名的声母作为二、三、四码。
本发明的目的是保留按书写笔顺、用前后两笔双笔划编码的优点,使用比现有技术少的键位并有规律地分配键位,选择尽可能少的偏旁部首并合理解决单笔划问题,使之好记好用,以提高输入速度,通过组合功能键,可随意选择双笔初级码、双笔字词结合码、双笔单字码和声母、双笔结合码中的任一种码输入汉字。
本发明以“札”字笔顺名即“横、竖、撇、点、折”为基础,笔顺规则参考人民教育出版社地《小学生词典》,笔划规则按《现代汉语词典》编排,具有唯一性。利用26个英文小写字母键编码,每码代表书写顺序上的前后两笔。“札”字笔划按书写顺序依次命名为“横(包括提)、竖、撇、点(包括捺)、折(包括竖勾、横折勾、竖弯等所有带死弯或拐大弯的笔划),上述五笔划可描述所有汉字的书写过程,将它们成双搭配,得到25种互不相同的组合,构成本双笔码的25个基本码。其构成和命名如表1所示(见下表):
由表可知,双笔码共五组五列,其组序依据前笔,其列序依据后笔,均按“札”字笔顺排列。
本发明选择五个偏旁部首单独编码,它们是“钅、艹、囗(中间有笔划,读作围)、木、口(中间无笔划)”。将25种双笔、5种单笔、5个偏旁部首及26个汉语拼音声母、韵母分配到a~z共26个键位上,构成本发明的键盘。操作功能键,即可选择双笔初级码、双笔字词结合码、双笔单字码和声母、双笔结合码中的一种码编码输入汉字。
下面结合实施例附图详细说明本发明:
附图1为双笔码键盘结构示意图。
参见附图1,本发明的键盘排列也遵从“札”字笔顺,即其组序、组中的列序均按“横、竖、撇、点、折”排列,并参照了表1的顺序。横组、竖组、撇组分别从Q键、A键、Z键开始,点组、折组分别从Y键和H键开始,并一律从左向右排。受键盘制约,最后一个LL码排在H键下方的N键上。用R、S、D、F、M键分别代表偏旁部首“钅、艹、囗、木、口”。用Q、W、E、R、T键分别代表单笔划一横、一竖、一撇、一点、一折。从而构成Q、W、E、R、T键的第二定义(它们的第一定义是横组的双笔码)。用B、P、M、F、D、T、N、L、G、K、H、J、Q、X、V、I、U、Z、C、S、A、O、E、Y、W键分别代表b、p、m、f、d、t、n、l、g、k、h、j、q、x、zh、ch、sh、r、z、c、s共21个汉语拼音声母和a、o、E、Y、W五个韵母。
由上可知,本发明的键盘排列很有规律,编码规则又符合人们的书写习惯,记忆量少又好记,因而容易掌握,输入速度也快。
有了上述键盘,可有四种输入汉字的编码实施方案:
一.双笔初级码,按25种双笔基本码、五种单笔码,一个偏旁部首“口”编码输入汉字,在一、二级汉字库全部6721个汉字中只有一和乙两个一笔汉字,因此单笔码大都对编码过程中余下的单笔划编码用。如义的编码是(VR),双笔初级码规则简单,但用它把一、二级汉字库的6721个汉字分成字数不多于10的字组,要用1~5码,如“王”(QA)“另”(M、K)。另外,双笔初级码需要在提示行上显示的一串字中按序号选字。
二.双笔字词结合码,操作ALT+F10,可按双笔字词结合码输入汉字,按25种双笔基本码、五种单笔码、“钅、艹、囗、木、口”五个偏旁部首编码输入汉字,并规定双笔字词结合码的字码长1~3位,词码4位等长,也就是说6721个汉字要在三码内编完,当键入第四码时,提示行上应出现若干条不少于两字的词供选择。
为减少重码字数,在双笔字词结合码中对偏旁“扌、忄、氵、纟”的编码只取前两笔,分别对应为-(T)、丨(U)、(O)、(N),例如“汁”的编码是、-丨(O、W);另外对分离型汉字(可用一横线或一竖线分开的汉字),当左部或上部已组完两码,所要的字还未出现时,就用右部或下部组第三码。例如“蛇”的编码是丨、-丨、(G、W、O),“彗”的编码是--、-丨、-(Q、W、H);对偏旁为“疒、辶、廴”以及“走、鬼”组成的字按分离型汉字处理,例如赴的编码是-丨、-丨、丨(W、W、F),“疼”的编码是-、/、/(Y、V、B)。
在双笔字词结合码中,除首码外,25种双笔基本码加口码,总是优先于由偏旁部首等形成的扩展码和单笔划码(即Q、W、E、R、T的第二定义)。例如,另的编码是口、/(M、K),吉的编码是-丨、-丨、-(W、W、H)司的编码是-、口(H、M)。
由于英文键盘没有句号和顿号,双笔字词码中特地定义顿号的编码是-(R),句号的编码是口(M),但它们都需用翻页键才能找到。
做了上述处理后,双笔字词码的同码字最多不超过19个,只有在已取足码,所要的字还未出现时,才需用翻页键寻找下一页同码字,而且只能翻一页,这样的字仅32个,都是极少用到的生僻字或偏旁。
双笔字词码中的词码是四位等长码,本实施例共选用了近七千条词(或词组),两字词取每字的前两码;三字词取第一字的前两码和后两字的首码;四字及四字以上的词,均取前四字的首码。每个字的编码规则与前述字码一致,再按提示行显示,由序号选择所要的词。只有一种特殊情况,就是按词码规则应取两码,但该字的笔划用一码已经取足,此时要重复该字编码,如“一点点”的编码是--、--、丨-、丨-(Q、Q、A、A)。
双笔字词结合码的编码规则比双笔初级码复杂,但输入速度快得多,其不足之处是要在提示行上显示的一串字中选字,易造成眼睛疲劳。
三.双笔单字码。操作ALT+F2,可按双笔单字码输入汉字,双笔单字码同双笔字词结合码一样,按25种双笔基本码、五种单笔码、五个偏旁部首编码输入汉字,还规定“提土”旁也象“扌、忄、氵、纟”一样只取前两笔。但当编完三码后,所需字还没在提示行上出现时,第四码取该字的最后两笔。对“麻、莫、厌”做字头的字也按分离型字处理,即采用双笔字词码中规定的分离型字编码规则。当一个字的码已取足且码长小于4时,所要的字还未出现,则重复最后一个码,如丹的编码/、-、-(BRR)。
双笔单字码的1~4码均为字码,编码时,提示行上也会有相应待选字显示,但一般只有一字,需要时用空格键调出,同码字最多不超过4个。
四.声母、双笔结合码,操作ALT+F9,可按声母、双笔结合码(声笔码)输入单字,是1~4位不等长码,基本做到一组码对应一个汉字,重码率为2.1%。按21种汉语拼音声母码、5种汉语拼音韵母码和25种双笔基本码、五种单笔码、五个偏旁部首编码输入汉字,规定声笔码首码取汉字的声母,(若该汉字无声母,则取该汉字的第一个拼音字母为其首码)。其2~4码按双笔字词码规则取,取足4码后唯一的对应字会自动入选。
本发明的双笔码,键盘排列很有规律,按下笔顺序编码符合书写习惯,键盘输入速度快,使用同一键盘,既可字词结合编码,也可基本做到一组码对应一个字,实现盲打。