汉字前续码 本发明涉及汉字编码及计算机汉字输入技术。目前,就已在计算机上推广使用的汉字编码方案来看,简单易学的方案输入速度不够快,而输入速度快的方案又都较难学。本发明的目的在于提供一种既易学又输入快的汉字编码方案。
以下详细阐述本发明的具体实施方法。
一、字根及键位安排
本发明所设字根及键位安排如图1。图1中,U键上的“ㄅ”代表折笔,折笔是指向下向左转折的笔划;I键上的“乙”代表弯笔,弯笔是指向右边转折的笔划;既折又弯的笔划以其最后的一个转折归类(参见图2)。
图1中,中间小框内的D、F、G、H、J、K6个键称为续键,其余24个键称为前键,相应地D、F、G、H、J、K6个字母称为续码,其余20个字母和4个标点符号称为前码。本发明将4个标点符号也用作了汉字代码。
二、编码规则
本发明属全形码,拆字编码的步骤是:先拆取字的首字根和末字根,然后将字划分为2个或2个以上的结构,从未曾被拆用的第二个结构上按书写顺序拆取单笔划字根,最后根据拆得的字根和拆分次序编配字的代码。
首末字根的拆分规则是按书写顺序拆至最大并兼顾直观,另外,拆取的首字根必须是安排在前键上的字根。实际上,除了字根“”需注意不要拆为首字根外,其余续键上的字根并不可能在拆首字根时拆到。
划分字地结构,若左右可分以左右分,左右不可分按直观分,如“警”字,上部是左右型结构,应按左右划分为“苟、攵”两个结构,加上其下边的“言”,“警”字应划分为“苟、攵、言”三个结构,而一个单独的“苟”字,则应按直观划分为“艹、句”两个结构。“警”字在拆取首末字根“艹口”后,往下的单笔划字根应从其第二个结构“攵”上拆取。“苟”字在拆取首末字根“艹口”后,其第二个结构只剩下了“勹”,单笔划字根应从余下的“勹”上拆取。
按规则从第二个结构上拆得单笔划字根后,按下位取码的方式编配代码。下位取码的含义是:若拆得笔划“丿”,丿笔在T键上,T键的下位键是G键(从键盘上看,G键在T键的下边,故称G键是T键的下位键。同理,F键是R键的下位键。其余类推),所以拆得丿笔应取G码。
若按规则拆不到单笔划字根,或拆完后还不够,一律加配以K码。
单字根字的编码方法是先取其本身再加空格符(即输入时击空格键),往下再重新对其按书写顺序拆分单笔划字根并以下位取码方法编配代码。
依据以上编码规则,再看一看单笔划字根所在键的下位键正好是6个续键,可知本发明所编的汉字代码有着这样的特点:代码的第1位码必定是前码而第3位以下必定是续码。
本发明不设固定码长,所编代码的码长最短为2位(空格符也算作一位),最长为7位。2位代码配给最常用的汉字,配有4位以上代码的字基本上是非常用字。
例“深”字,属最常用的字,配给2位代码,首末字根是“氵木”,配代码SM。
例“哑”字,属一般常用字,配给3位代码,首末字根是“口一”,再从其第二个结构“亚”上拆得单笔划字根“一”,配代码OED。
例“岽”,属非常用字,配给4位代码,首末字根是“山小”,往下按规则拆得的2个单笔划字根是“一乙”,配代码WVDK。
例“耶”字,配给3位代码,但拆取首末字根“耳 阝”后已拆不到单笔划字根,因此其代码的第3位按规则配以K码,所以耶字的代码是PPK。
虽然字的代码长短不一,但本发明所编制的输入法程序能通过检测输入的代码是前码还是续码并进行输入码计数而能将连续输入的码串分隔为一条条字代码并作出正确无误的处理。
三、汉字输入
本发明依据编码方案编写的输入法程序提供了简易输入和全码输入两种输入方法。
简易输入法的输入操作步骤是:
先拆取字的首字根并据此击键。如从所要输入的字上拆得的首字根在A键上,击A键后计算机屏幕上的提示行中的提示内容如下:半角前续码:a(如果″)从q念i个f如h好x始c含b合,
提示行中圆括号内的内容是关于词语的提示,如所要输入的正是“如果”一词,再击一下″键(英文引号键)即可。如所要输入的字是圆括号后面8个字中的一个,那么根据提示击键就行了。
如所要输入的字不在提示行中,则应再拆取字的末字根并据此击键。假如拆得的末字根在E键上,击键后提示如下:半角前续码:ae 金(钱 色″)娅d妲f丛g姗j
此时,圆括号中的内容是关于联想字的提示。圆括号前的“金”字已被输入,如所要输入的就是“金”字,那就可接着往下输入第二个字,在输入第二个字的同时,“金”字将自动转到屏幕光标处。
如所要输入的字不是“金”而是“丛”字,那么根据提示击G键后,已输入的“金”字又被舍弃而“丛”字出现在原“金”字所在的位子上,即“丛”字完成了输入。
如所要输入的字还不在提示行中,可击K键翻页查找,就如同其它编码方案的重码字查找选取的处理方法一样,所不同的是本发明从提示行中选字一律使用续码而不用数字键。
简言之,简易输入就是拆取首、末字根击键后再击K键翻页查找。简易输入法充分体现了本发明的简单易学性。
在击下第一键就出现在提示行中的字是不规则码字,不规则码都是2位码,其第2位码是定义编配的。使用不规则码的目的在于尽可能给最常用的字编配最短的代码。不规则码的编配会使操作人员在初学时感到一点点麻烦,但使用时间一长,这些不规则码会自然而然地被背记下来,因为不规则码字都是最常用的字,在日常的输入操作中将会经常地碰到,而一当这些不规则码被背记下来后,其优越性就会充分显示出来,一个字击两键输入无疑比击三键四键输入方便快捷得多。这一点在本发明的试用中已得到证明。
本发明共有可编2位代码744个(第1位码可选码24个,即24个前码,第2位码可选码31个,其中包括24个前码,6个续码和1个空格符,24×31=744),这744个2位代码编配给了744个最常用的汉字(其中240个为不规则码),其余常用字绝大部分编配以3位代码,配有4位以上代码的基本上是非常用字。以上的配码情况说明了什么呢?可以这么说,使用本发明输入一般的文稿,如果拆字击键无误,基本上可以在两键之内从提示行中找到所要输入的字。据本发明人初略统计,一般的文稿输入,以字次计,约有65%的字以两键输入,需以四键或四键以上输入的字不足1%。正是这一点保证了本发明具有很高的输入速度。
全码输入法与简易输入法在同一输入法程序的同一状态下兼容,字代码的前两码的输入方法两者完全相同,从第3位码开始,全码输入法是按规则拆取单笔划字根并以击下位键(与编码时的下位取码办法相应)的方式输入。使用全码输入可减少对提示行的依赖,只要记住了一个字的拆分及码长后便可盲打输入。
如果以全码输入法输入字代码的前3码后再从提示行中选字,那么码长在5-7位的字也可全以四键输入。
四、其它功能
本发明使用空格键和″键输入联想字,这样虽然联想字的数量不多,但使用起来方便而快捷,因为字少而找字方便,因为可根据联想字的位置前后选择击键而操作反应快。另外,本发明还运用了二次联想的技术。如击键UD(输入“马”字)后提示如下:半角前续码:ud 马(上 克思″)孟f鹛g盈j卫k
圆括号中的字(词)可称为一次联想字(词),前面的“上”字以空格键输入,后面的“克思”二字以″键输入。若再击″键,则提示如下(“马”字已转到屏幕光标处): 前续码:ud 克思(列宁 主义″不d是f在g的h地j了k)
此时圆括号中的字(词)可称为二次联想字(词)。二次联想字可重复选用。此时“马克思”三字已经输入,所以继续击空格键后再击″键就是输入了“马克思列宁主义”。
圆括号中后面的“不”、“是”等6个联想字是在任何一字的二次联想时都将定字定码固定地出现的,如此安排利用效率不高,但在用得上时因其固定不变而可盲打输入。
因为本发明有744个最常用的字以2键输入,再加上有方便灵活的二次联想字(词)技术的运用,所以,为常用词语编制词语代码已意义不大,考虑到专业术语和专有名词快速输入的需要,本发明提供有用户自定义词语代码的功能,可编代码有24个1位码和744个2位码,以按码击键再加击Tab键的方式输入。
本发明在24个前键上设有24个中文标点及符号,以击前键后再击回车键的方式输入,并设有在提示行中显示标点符号及其代码的功能。
本发明还具有首、末字根拆分取码的查阅功能,在遇到拆字有困难时可按专设组合键进入查阅状态,然后根据字的起首或末尾的笔划进行分类查看。汉字虽然繁多且结构复杂,不过归结到字的首、末结构类型还是较有限的,因此,这一功能使用起来十分方便和有效。
五、键盘设计
本发明设计的键盘见图4。本发明有了这样的键盘后,使用者只要稍稍熟悉一下图3所示的从属字根表就行了,可免去背记字根表的麻烦。