本发明属于与键盘或类似器件有关的编码方法,主要用于计算机的汉字编码输入,除此之外还可作为中文信息处理系统和通讯系统等要用到汉字编码的有关领域。 至此,汉字的编码方法已有几百种,大致可分为三类:纯音的,纯形的,音形结合的。当前较为流行的有双拼法(如中国专利CN87100313A)、五笔字型法(中国专利CN85100837A)。拼音编码法简单易学,但重码类太高,不易快速直观地查找汉字。纯形编码法分解汉字繁琐,拆字有多义性(五笔字型法、三根码法、首尾码法)。现有的音形结合码法,如声韵声声码法、拼音首尾码法同样分解繁琐,记忆难,易出错。
本发明的主要目的在于找到一种简单、易学、易掌握,能体现汉字结构特点,不失汉字本色,能减轻操作人员负担,减少错码、误码、降低重码,加快汉字输入速度的汉字编码方法。
根据本发明的目的所提出的实施方案是:根据拼音易掌握,汉字结构习惯分解,笔划熟悉地三大特点,采用本字的拼音、字形结构、首末笔划三大部分编码组合而成。具有记忆少,汉字分解大众化,重码率低等特点。字形结构按上下、左右、内外、杂合(或独立)直观分解。笔划归为点、横、竖、撇、捺、折六类,全按书写习惯确定。
附图1是笔划字母、数字代码表。
附图2是结构字母、数字代码表。
附图3是声母、韵母字母、数字代码表。
附图4是声母、韵母字母、数字代码表。
附图5是键盘形式一。
附图6是键盘形式二。
具体实施方法是:
按标准普通话的汉字拼读习惯(不考虑声调),取其相应的声母字母(sh,zh,ch取其对应的代用字母或数字)或数字作声母代码,声母代码用标准键盘上的对应字母或所在区位的数字代码,详见图3、图4。韵母取其字母或对应的代用字母或数字作韵母代码,代码详见图3、图4。汉字结构分为上下、左右、内外、杂合(或独立)四种形式,它们分别用字母或数字作结构代码,详见图2。笔划按汉字书写的笔划规则将字的首末笔划归为点、横、竖、撇、捺、折六类,它们分别用字母或数字作首末笔划代码,详见图1。这三大类五种代码的组合便构成一汉字的编码。
汉字很多都是由基本字组合而成。象“珏”这样的汉字在结构划分时能一目了然,分解出的是两个基本汉字。而有的情况复杂些,分成的两部分不一定都是汉字,有的一部分是偏旁,另一部分是汉字,也许不是。有的也许是由三部分组成。用本发明的方法来划定这些复杂的汉字同样简单,由于本发明只取字的首笔和末笔,至于应在字的什么部位确定为划定结构的界线,这无关紧要。如“激”字,是从左边“ ”处划分还是从右边“”处划分,这都没关系,只要确定为左右结构即可。在这里值得注意的是:本法仅将汉字分成两部分,这两部分不一定全是基本汉字。故将习惯偏旁列举如下:
宀、疒、艹、刂、阝、纟、钅、冫、牜、犭、亻、饣、礻、氵、扌、、攵、忄、讠、衤、、廴、辶、、彳、彡、卩。
内外结构除“回”“同”等字型外,由以下部首组成的汉字也划为内外结构。它们是:“疒”、“戈”、“辶”、“廴”、“厂”、“广”、“乙”、“尸”、“户”、“门”、“”、“乙”、“几”、“走”。独立的汉字和无法分解的汉字统归杂合或独立结构。
笔划定义“点”和“提”归为点类,另用“X”及对应数字作“忄”的首笔点的代码,“S”及对应数字作“火”的首笔点的代码,“T”及对应数字作“扌”的首笔横的代码。将下列笔划归为折类,它们是:、乛、乙、、ㄋ、、乚、く、ㄥ、、ㄅ、。
将上述图1、图2、图3、图4进行组合贴于标准键盘上便得到两种汉字专用输入键盘,见图5,图6。同样在标准键盘的数字键盘上按图1、图2、图3、图4中的数字输入也可输入汉字,这样标准键盘的数字键盘便成了输入汉字的小键盘。
有了以上各种代码现在能进行汉字编码了。编码有两种组合方式。第一种是:<声母代码>+<韵母代码>+<结构代码>+<首笔划代码>+<末笔划代码>;第二种是:通过对声母代码、韵母代码、首笔代码、末笔代码位置的变化的利用,隐含汉字的结构区别,省去了结构代码部分。具体形式如下。
汉字为左右结构时:
<声母代码>+<韵母代码>+<首笔代码>+<末笔代码>。
汉字为上下结构时:
<首笔代码>+<末笔代码>+<声母代码>+<韵母代码>。
汉字为内外结构时:
<声母代码>+<首笔代码>+<末笔代码>+<韵母代码>。
汉字为杂合或独立结构时:
<首笔代码>+<声母代码>+<韵母代码>+<末笔代码>。
按图5、图6所示两种汉字键盘与上二种汉字编码方式进行组合,可得出四种汉字编码。详见下述汉字编码实例。
采用本编码法如遇汉字只有韵母,则以韵母的第一个字母作为声母代码。如遇只有一笔的汉字则直接用<声母代码>+<韵母代码>组成该字的编码。
重码的处理方法是:在屏幕的正常编辑位置显示频度较高的汉字,若需此字不作任何处理,继续正常操作。其余的码在屏幕的提示行显示。如需选择只要按相应的数字键,提示行中的汉字便自动地与编辑行的汉字交换。
用本发明的汉字编码法将1979年12月修订的“新华字典”上一万余汉字按其分解编码,重码极少,且重码的绝大多数是一些极少使用的冷辟字。因此本发明作为计算机或某些装置、信息传输系统的中文输入方法可提高汉字输入速度,会大大减少错码、误码。非常适合各种不同层次的上机者。