本发明涉及一种计算机的汉字编码输入法及其键盘,特别是一种字根首音编码输入法及其键盘。 计算机的汉字输入一直被称作汉字信息处理的瓶颈,而采用计算机原装键盘的26个字母键来完成庞大的汉字和词组的纯字根形式的编码,并设计出简单易行的高效能汉字输入键盘,则一直是使用汉字的国家和地区汉字信息革命中的重大难题。
在现有实用技术中,采用的各种汉字编码方案,都存在着对某一方面要求过高的缺陷,针对操作员的,则必须有较高的汉语水平如普通话要好,认识的字要多,对字形结构要有很好的了解等;或必须有良好的记忆能力,能对许多规则方法、字根进行记忆或死记硬背。针对设备的,则必须有专用输入设备配套,如大键盘、中键盘等。这样就造成在实用中,有的重码多,有的使用困难,有地输入速度慢,有的理论概念混乱,有的不能在国际间通用的26个英文字母键盘上使用,有的不能简、繁体兼容,有的不能字词兼容,有的取码具有歧义性等。
本发明的目的在于提供一种简单易学的拼字根首音组合汉字、词的字根首音编码输入法及其输入键盘。
字根首音编码输入法及其键盘,则是在对汉字信息进行系统分析研究之后产生出来的。它以偏旁部首为主调形成本发明的优选字根,依据其字根的习惯起首读音,对它们进行归类如图1,图2所示,并将首音ch、sh、zh分别代替原标准英文键盘上的英文字母键I、U、V,而形成的拼字根首音字母组字、拼字根首音字母组词的一种24个汉语拼音字母键位序列形式的汉字字根首音字母键盘,如图3所示,这一键盘可以用ch、sh、zh平面不干胶标签粘在原I、U、V键帽上方来实现。字母“O”键用作汉字字根拆分时出现的零笔划键。利用这一发明的字根首音,可以像写字一样,依据不同码长的码本,方便地组合成数千、或数万、或几十万个简、繁汉字和词汇,并实现不同型号计算机汉字与词汇易学易用的高效率输入。字根首音字母键之外的“A”键留作机动,可代替操作者一时不知道的任何字根首音字母,进行人机对话式的输入法学习。本发明涉及一切大、中、小微型计算机中文信息处理系统和通讯系统,并将在汉字终端、汉字电传、电脑打字和计算机汉字排版印刷等方面获得广泛的应用。
本发明采用拼字根首音的办法,视字根、字、词均为字根首音组合文字,字根编码只考虑字根在字根表中的拼音字母码位置,如图2所示,按照汉字字根先左后右,先上后下,先外后内,先左右后上下的视读书写顺序。以字根为单位组字、组词。只要熟悉汉字的偏旁部首,依据该输入法的几条简单规则,即可在键盘上按键完成编码输入,并通过计算机的中央处理单元和转换装置,将其转化为一个内码序列,计算机据此从一个汉字库中选出该汉字、词组,并执行显示、打印、传输或存贮指令。
本发明按字根视读书写顺序拆分汉字,使其字根数尽可能少。在字根数相同的情况下,选用占据笔划数相对多的大元字根优先的顺序。分解后的字根数少于码本码长数时,把原第一字根按最少字根数分解并取其分解后的第一、二字根首音字母码作为编码键入的第一、二字根码,若总字根数仍不足码本码长数时,则增加一个新末尾字根字母码此新增未尾字根的笔划数要尽量多,但要少于原先末尾字根的笔划数。若仍不足码本码长数,继续新增末尾字根码,直至达到码长数为止。若末笔划用完,仍不足码长数时,则键入零笔划键“O”,直至达到码长数。
分解后的字根数等于码本码长数时,输入时按字根视读书写顺序键入全部字根首音字母码。汉字经分解后的字根数超过码本码长数时,按序键入前面比码长数少一个字根的字根码数,再键入末尾字根码。对于字根字,按最少字根数分解,键入分解后的第一、二大元字根首音字母码,四码、五码码本则分别键以字母O、OO,末尾键入码为其字常用读音的首音字母码。例如表1、表2和表3。
本发明按词组的视读书写顺序拆分词组。
在把词组编成三码或在键盘上键入三码时,对于二字词组,第一字按最少字根数分解,并编码键入前二个大元字根首音字母码,第二字的末尾字根首音字母码为编码键入的第三码;对于三字及三字以上的词组,第一、二字按序编码键入其第一大元字根首音字母码,末尾字的末尾字根首音字母为编码键入的第三码。例如表4:
在把词组编码键入四码时,对于三字及三字以下的词组,第一个字根按最少字根数分解,并编码键入前二个大元字根首音字母码。对于二字词组,第二字编码键入第一、末尾二个大元字根首音字母码;若第二字为字根字,则采取上述汉字拆分处理中的新增末尾字根码办法处理。对于三字词组,第二字编码键入第一大元字根首音字母码,第三字编码键入末尾大元字根首音字母码,对于四字及四字以上的词组,第一、二、三字各编码键入其第一大元字根首音字母码,末尾字编码键入末尾字根首音字母码,例如表5。
表5 四码词组编码键入法示例
在把词组编成五码或在键盘上键入五码时,对于四字及四字以下的词组,第一个字按最少字根数分解,并按顺序编码键入前二个大元字根首音字母码。对于二字词组,第二字键入第一、二、末尾三个大元字根首音字母码,若第二字为少于三码的字时,则采取上述汉字拆分处理中编码键入新增末尾字根码的办法处理。对于三字词组,第二字编码键入第一大元字根首音字母码,第三字编码键入第一、末尾二个大元字根首音字母码,若第三字为字根字,则采取前述汉字拆分处理中的编码键入新增末尾字根码的办法处理。对于四字词组,第二、三字各编码键入其第一大元字根首音字母码,第四字编码键入末尾大元字根首音字母码。对于五字及五字以上的词组,第一、二、三、四字各编码键入其第一大元字根首音字母码,末尾字的末尾大元字根首音字母码为其编码键入的第五个字根码。
例如表6。
本发明的三码处理法,在其处理字集上,可以选择国标一级常用字以内的字,或外加部分常用词组。四码处理法,在其处理字集上,可以选择国标全部汉字的简、繁体或外加几千常用词组(不限)。由于词语是现代汉语中出现的主要形式,因此本发明中的五码,其最佳的实现方法就是用来设计大容量的,以词输入为主的现代汉语操作系统,因此,中国大陆及使用汉字的其他国家和地区可以选择《现代汉语词典》中全部汉字及词组作为本发明的处理字集。
在用本发明编码键入过程中,若出现重码字、词时,会有长声报警信号,表示键入是重码。重码字、词按拼音顺序排列,这时出现在显示屏幕编辑位置上的是重码中首位字、词,若用这个字、词可继续键入下文。若不用这个字、词,则在提示行中选择所需的字、词,依其序号键入数字,该字、词便可替代编辑位置上的那个重码字、词。
键盘输入汉字、词组时,若输入码无对应的字、词,即出现空码时,光标在原位置不动,并可听到短声报警,这时可重新键入正确的代码。
【附图说明】
图1:汉字组合字根字母表
图2:简、繁体汉字字根及首音字母总表
图3:汉字信息处理设备的汉字字根首音字母键盘