角码及拼角码计算机汉字输入方法 利用计算机进行汉字信息处理的一个关键性问题是计算机汉字输入问题,计算机汉字输入不仅要求有较高的输入速度,而且应便于各类专业人员和非专业人员掌握、以利于其普及和推广。近年来所出现的几百种计算机汉字输入方法,其基本思路都是按照某种特定的汉字编码方案对汉字进行编码,并利用相应的输入键盘将编出的汉字代码键人计算机,以实现汉字的计算机输入。各种输入方法虽然各有千秋,但就编码方案而言,差不多都是以汉字的字形和读音特征为基础形成的,其中比较有代表性的方案有以汉字读音特征为基础的拼音法和简拼法以及以汉字字形特征为基础的五笔字型法。拼音法和简拼法的长处是可以采用标准键盘输入,但是对汉字的读音必须准确,而且由于同音字(同码字)太多,多次选字使汉字的输入效率很低。五笔字型法是一种非常好的输入方法,它不仅可采用标准键盘,便于盲打,而且字与词兼容,输入速度较快,但是,五笔字形法需要记忆的字根和规则比较多,因而不便于非专业人员掌握。
本发明的目的是获得一种输入速度快,且便于各类专业和非专业人员掌握的计算机汉字输入方法。
为了实现上述目的,本发明根据汉字的角形并采用角码编码法对汉字进行编码(角码),或者根据汉字的角形结合拼音并采用拼角码编码法对汉字进行编码(拼角码),或者采用连拼编码法对汉语词组进行编码(连拼码),并利用经重新定义的标准键盘将角码、拼角码和连拼码键入计算机,以实现汉字和汉语词组的计算机输入,同码字或同码词组利用数字键和选字表选择键入。以下结合具体实施例对本发明角码及拼角码计算机汉字输入方法的技术特征作进一步的详细说明。
附图1和附图2分别为拼角码及连拼码输入键盘和角码输入键盘的示意图。
本发明角码及拼角码计算机汉字输入方法中,输入计算机地汉字编码有角码和拼角码两种并分别采用角码编码法和拼角码编码法编成,其中拼角码是主要使用的汉字代码,角码作为拼角码的辅助性代码。输入计算机的汉语词组代码为连拼码,并采用连拼编码法编成。输入键盘采用经重新定义键位的标准键盘,拼角码、角码和连拼码同键盘兼容。
一、角码及角码编码法
角码编码法是一种纯字形编码法,它根据方形汉字的四角笔画形状对汉字进行编码,其要点如下。
1、将全部汉字的四角笔画形状归纳为10种角形,即“”形、“丨”形、“”形、“丿”形、“√”形、“”形、“”形、“一”形、“”形等9种特定角形,并分别给出相应的角形码和1-9阿拉伯数字码作为上述9种角形的代码,上述9种特定角形以外的角形统称为“0”形并以阿位伯数字0为其代码。这样,即得到了10种汉字角形和相应的10个阿拉伯数字代码以及9个角形码,其相应关系如下表所列。
表1角形 丨 丿 √一0角形码 丨 丿 √一数字码1 2 3 4 567890
2、汉字四角的取角范围按汉字结构型式分为以下两种情况。
①对左右型结构的汉字,左部上下各1/2分别为左上角和左下角,右部上下各1/2分别为右上角和右下角。例如:
②非左右型结构的汉字称为其它型。对其它型结构的汉字,则利用垂直线和水平线将汉字均分为4等份,其左上角、右上角、左下角、右下角各占1/4。例如:
3、取角时应遵循以下原则:
①对居中的笔画,取角时两角可同时借用。例如:
②遇“点”笔画时,可按其走向分别归于斜笔丿、笔或直笔丨。例如:4芯6 2情。
③字头、字旁、字角出现的单笔或短笔优先取角。例如:扑66拍4 4朴。
④横直笔画居角而又无法确定角形码时,采用“上角取上、下角取下”的原则取角形码。例如:操9 搜2。
4、取角注意以下事项:
①必须采用规范字体取角。
②角笔的角内不能有笔画遮挡。例如:(正)(误)(正)(误)。
③斜笔(包括上直下斜)取角或与其它笔画相交后取角,按斜笔或斜交取角。例如:4儿(正) 2儿(误) 0月(正) 7月(误)8丙8(正) 9丙7(误) 0风0(正) 7风9(误)。
5、角码是由汉字的4个角形码编排而成的4位编码,其编码顺序为(左上角形码)(右上角形码)(左下角形码)(右下角形码)。例如:字的角码为6345。
6、角码码本可按以下两种型式编制:
①按汉字的拼音顺序编排汉字,使汉字与角码一一对应。
②按汉字的角码由小到大顺序编排汉字,并将角码与汉字一一对应。如果在汉字之后再加上字典正文的页码,则码本实际上即成为字典的角码检字表。对同码字可采用先左右型,后其它型的方式排列,部首相同的字放在一起会使检字更加快捷。
二、拼角码及拼角码编码法
拼角码编码法是建立在汉字拼音和角形码基础上的音形结合的编码方法,其要点如下:
1、拼角码是由一位拼音码和两位角形码编排而成的3位编码。
2、拼角码的首位码为拼音码,即组成拼音汉字的首位拼音字母。在全部26个拼音字母中,I、U和V不用作首位拼音字母,故拼角码中的拼音码实际只涉及23个拼音字母。
3、根据汉字的结构型式,拼角码的第2位和第3位角形码有两种编排法。
①对左右型结构的汉字,其拼角码的第2位和第3位角形码依次为(左上角形码)和(右上角形码)。
②对其它型结构的汉字,其拼角码的第2位和第3位角形码依次为(左上角形码)和(右下角形码)。
4、拼角码码本可按拼角码——汉字——键位码——对应的方式编制,汉字的编排顺序是按首位拼音码顺序排列,在首位拼音码相同的情况下,按第2位和第3位角形码由小到大顺序排列,键位码即输入键盘上与拼角码相对应的键位代码,键位码为3位码,用英文字母或汉语拼音字母表示。
三、连拼码及连拼编码法。
连拼编码法是专用于对汉语词组进行编码的方法,连拼码由组成汉语词组各汉字的首位拼音字母连续编排而成,其编排顺序与词组中汉字的字序相同。
四、输入键盘
本发明角码及拼角码计算机汉字输入方法中的输入键盘采用包括0-9共10个阿位伯数字键的数字键盘(副键盘)和包括A-Z共26个英文字母键的字母键盘(主键盘)的标准键盘,并对数字键盘和字母键盘各键位重新定义。
1、字母键盘(主键盘)
①26个英文字母键中,除I、U、V三个字母键外,其余23个字母键均为相应的拼音字母键并在各键位上标明相应的拼音字母或英文字母。
②主键盘右侧的O、I、U、K、J、H、M、N、B、G共10个键和与之对称的主键盘左侧的E、W、Q、D、S、A、C、X、Z、F共10个键分别兼作左右型汉字和其它型汉字的角形码键,并以两种不同颜色加以区分。E、O键定义为“”角形码键,W、I定义为“一”角形码键,Q、U键定义为“”角形码键,D、K键定义为“”角形码键,S、J键定义为“√”角形码键,A、H键定义为“丿”角形码键,C、M键定义为“”角形码键,X、N键定义为“丨”角形码键,Z、B键定义为“”角形码键,上述各键位上同时标明拼音字母和相应的角形码及数字码。F、G键定义为上述9个角形码以外的角形码键,并同时标明相应的拼音字母和0数字码。拼音字母键与角形码键和数字码键的对应关系如表2所示。
表2数字码键 9 8 7 6 5 4 3 2 1 0角形码键 一 √ 丿 丨 右侧拼音字母键 O I U K J H M N B G左侧拼音字母键 E W Q D S A C X Z F
③V字母键定义为连拼码起始键,连拼码的键入方式为(V+连拼码+空格键)结束。
2、数字键盘(副键盘)
副键盘的10个数字键兼作角形码键,其中9字键定义为“”角形码键,8字键定义为“一”角形码键,7字键定义为“”角形码键,6字键定义为“”角形码键,5字键定义为“√”角形码键,4字键定义为“丿”角形码键,3字键定义为“”角形码键,2字键定义为“丨”角形码键,1字键定义为“”角形码键,上述各角形码与相应的阿拉伯数字同时标明在各键位上,0字键定义为上述9个角形码以外的角形码键。副键盘中数字键与角形码键的对应关系如表3所示。
表3数字键 1 2 3 4 5 6 7 8 9 0角形码键 丨 丿 √ 一
五、键入方式
1、角码的键入
汉字的角码(4位码)利用副键盘中的10个数字键(或角形码键)直接键入。
角码是有重码字的方案,有的重码字还比较多。采用角码编码法对商务印书馆1979年版《新华字典》收录的9907个汉字共编角码1591个,重码率为6.2字/码。重码字可利用输入键盘的显示行(选字表)和数字键选择键入,选字表中依使用频率的高低列入4位角码相同的全部汉字。因此,利用角码输入汉字的一般键入方式为(角码+数字键)结束。若输入的汉字为选字表中居首位的字,则无需数字选择。当重码字超过10个时,可利用输入键盘的键或光标移动键翻页查找后选择键入。
2、拼角码的键入
汉字的拼角码(3位码)可利用主键盘中的23个拼音字母键和左右两侧共20个角形码键直接键入。
拼角码也是有重码字的方案,利用拼角码编码法对国家标准中收录的6588个汉字编拼角码1772个,其重码率为3.7字/码。重码字利用选字表和数字键选择键入,选字表中依汉字使用频率的高低列入3位拼角码相同的全部汉字。因此,利用拼角码输入汉字的一般键入方式为(拼角码+数字键)结束。若输入的汉字为选字表中居首位的字,则无需数字选择。当重码字超过10个时,仍采用翻页查找后选择键入的方法。
为了减少输入汉字时的击键次数,提高输入速度,可对拼角码建立一级简码和二级简码选字表。一级简码选字表中只依次列入10个首位拼角码相同(即首位拼音字母相同)的常用汉字,其一般键入方式为(首位拼音码+数字键)结束。如果输入的汉字为一级简码选字表中居首位的常用汉字,也可采用f首位拼音码+空格键)结束的键人方式。二级简码选字表中也只依次列入10个前两位拼角码相同(即首位拼音码和第二位角形码相同)的常用汉字,其一般键入方式为(首位拼音码+第二位角形码+数字键)结束。如输入汉字为二级简码选字表中居首位的常用汉字,则也可采用(首位拼音码+第二位角形码+空格键)结束的键入方式。
3、连拼码的键入
汉语词组的连拼码利用主键盘中的V起始键和23个拼音字母键直接键入。
连拼码也有可能出现重码词组,重码词组可利用选词表和数字键选择键入,其一般键入方式为(V+连拼码+数字键)结束。若输入的词组为选词表中居首位的词组,则无需数字选择。
本发明角码及拼角码计算机汉字输入方法采用的编码有角码,拼角码和连拼码三种,这三种编码均可单独使用并且同键盘兼容,为使用者带来很大的方便。角码完全是一种形码,即使对不认识的汉字也可见字识码;拼角码只采用了首位拼音字母,对汉字读音准确与否并无苛刻要求。因此,角码与拼角码之间具有很强的互补性,使用者相机交替采用角码和拼角码无疑可提高汉字的输入速度。
角码和拼角码的基础是角形码,而角形码又是以汉字四角笔画形状为特征的形码,既直观形象、容易识码,又具有极强的规律性。特别是9个特定的角形码和相应的1-9数字码排列成的方形角形码图型,可以与普通计算器数字键的排列图型完全吻合,很容易掌握和记忆。将这一特点应用于键盘设计时,可使主键盘左右两个角形码键区中和副键盘中角形码键的布置基本一致。键入角形码时,需要寻找的既不是字母键,也不是数字键,而是角形码在角形码图型中的相对位置。因此,键入角形码 时可实现盲打。此外,角形码键的选键范围很小(共10个键),而且拼角码的第二次击键和第三次击键均在同侧角形码键区,因而有利于提高键入速度。
本发明的输入方法中建立了同码字选字表和一、二级简码选字表,录入的首位常用字多达两千余字,这些常用字不需选字即可输入,有效地提高了输入速度。此外,拼角码为三位码,一般字4次击键即可输入,常用字三次击键甚至两次击键即可输入,也有利于提高输入速度。
总之,本发明角码及拼角码计算机汉字输入方法输入汉字速度快,并容易掌握。因此,本发明可广泛适于专业人员和非专业人员利用计算机输入汉字。