一种微机汉字编码方法 本发明涉及一种机算机应用技术,具体地说是一种微机汉字编码方法。
随着计算机在我国的普及应用,人们对计算机的学习兴趣越来越浓厚,但要学习计算机并在实际工作中得心应手地运用,就必须先掌握计算机的汉字输入方法。本发明的微机汉字编码方法是借鉴了五笔字形汉字编码方法的优点,克服其记忆无规律难以在短时间内掌握的不足,提出一种更为简易、直观和实用的汉字编码方法,能使初学者在较短的时间内轻松地接受和掌握,是一种适合各种层次用户需要的、具有普遍意义的新方法。
本发明的微机汉字编码方法是对从汉字中拆分出的字根以音或形相近的原则,重新进行设置,把字根分为单字根和双字根两类,并规定字根的代码为其本身的声部,双字根的代码为双码,归类后分为26组,分别对应26个英文字母,使之更加简明直观,规律性更强,更便于记忆和运用。引进双字根概念,省去了字形地交叉识别这一手续,不仅简化了编码程序,而且同样能起到减少重码作用。在给含有双字根的单字进行编码时要遵循三个原则:
[1]双字根在首位必须用全码;
[2]必须有末位字根参与编码;
[3]编码最多为四码。
以下对本发明的微机汉字编码方法作以下详细地介绍;
一、字根的设置:
本发明中汉字字根的选取是以简体楷书为标准,同时适当兼顾其他实际中的草写情况,把音或形相近的字根相搭配归类后分成26组,分别对应26个键位字母,并以它为代码。(见附表)
二、字体的拆分:
在发明的方法中,字体的拆分基本原则类同五笔字型编码方法,但在具体拆分方法上有扎不同,本方法更注重拆分的直观性。
拆分的基本原则是:
①按书写习惯,以先左后右,先上后下,先外后内,先主干后两侧的顺序进行拆分。(含“”、“”的字在拆分时,放在前首,这同书写习惯不同)
如:算:、目、廾;楼:木、米、女;
逃:辶、儿、水;建:廴、彐、二、丨;
②按字体结构,“能散不连,能连不交”,“字根取大优先”以保证拆出的字根总数最少。
如:生:丿、;云:二、厶;天:一、大;
夫:二、人;开:一、廾;井:二、
平:一、、丨;其:艹、三、八;
③兼顾直观,把握总体进行拆分。
如:或:戈、口、一;可:丁、口;巫:工、人、人
甫:十、月;曹:艹、曰、日;曲:口、艹;
在具体拆分时,还有以下几种特殊方法:
①变形处理法:(按单笔划的归类进行变形)
如:才:十、丿;长:丿、七、丶;未:二、小;
民:、乙、七;夜:亠、亻、;东:七、小;
②近似处理法:(有时,增减一笔划,以求直观归类)
如:步:止、小、丿; 舞:矢、、一、丨;
岛:鸟、山; 旅:亠、勹、、
惯:忄、母、贝; 越:土、戈;
③反向取法:
如:飞:乙、冫;年:、、丨;虐:上、、七、彐;
④重合(或截断)处理法:
如:成:厂、乙、戈;发:乙、、又;黑:、土、灬
练:纟、七、乙、小;专:二、乙、
出:山、山
三、单字的编码:
根据拆分出的字根(或单个笔划),依序将其所对应的代码组合成串,就可得到单字的编码,多字根者取其第一、二、三、末位字根参与编码,不足四码者以空格结束。单字编码最多为四码。
如:拾:扌人一(AFHK) 编:纟丶尸艹(VDSC)
根:木彐艮(MSE) 伟:亻二乙丨(FDLA)
途:辶人一(ZHFM)
值得注意的是,含“双字根”的单字,因其特殊性,它们的编码也稍有不同。
所谓“双字根”,是音形法中特别引进的概念,即把某些特定的字根看成是“两个字根的重合”,它们的代码为两码,如“禾”为HE,“马”为MA,“足”为ZZ等。引进双字根的原因有两条,一是为了保证同音字根尽量归为同类这一原则;二是为了减少重码。我们规定;“双字根”附属于单字根,它是单字根的一种特殊情形。双字根的首二、末位字根参与编码的情况,而不是通常的第一、二、三末位字根。
四、单字的特殊编码:
1、高频字的编码。从每组字根中,选出含该字根的一个常用字,以字根代码来作为它的编码。这类高频字在音形法中被称为“键位字”(跟“五笔字型”不同)它们各自又有常规编码。(其中,“我”、“的”两字为特意安排,跟字根无关)。
如:把:A 或:B 一:H 的:K
2、字根成字的编码。对于字根本身就是一单字的这类字,我们规定它们的编码为原代码+序号,借以区分。这样处理,不仅简捷且有助于字根的记忆。(个别生僻字的编码为四个重码)手:A1 贝:B1 匕:B2 戈:B3 戈:B4 寸:C1(廿:CCCC)大:D1 犬:Q2 衣:E1 入:F2 工:G1弓:G2 广:G3 火:H1 水:I1 小:I2 巾:J1(臼:JJJJ)口:K1 立:L1 木:M1 毛:M2 母:M3皿:M4 女:N1 鸟:N2 乃:N3 目:01 身:O2片:P1 厂:P2 气:Q1 欠:Q2 丘:Q3 日:R1儿:R2 (日、巳:RRRR) 山:S1 尸:S2 田:T1土:T2 士:T3(幺:VVVV) 王:W1 文:W2 心:X1西:X2 夕:X3 月:Y1 用:Y2 于:Y3 子:Z1之:Z2 止:Z3 (孑:ZZZZ)另外,双字根成字的编码即为它的代码。(石、力除外)如:马:MA 米:ME 车:CH 壬:RN
门:MN 石:SHL 力:LIL(L为补充码)数字字根的编码为原代码+自身数字(-、+除外)
一:H(高频字) 二:D2 三:S3 四:S4
五:W5 六:L6 七:B7 八:F8码音部即为它的原码。它的尾码只起限定的作用,有时要根据情况去掉尾码,只留首码。“双字根”只适用于单字的编码,在词汇编码中恢复为单字根。
给含“双字根”的单字进行编码时,若按常规则会出现编码超过四码的情况,这显然不行。为解决这一问题,我们在给某些字进行编码时,要预先把双字根的尾码去掉,这一过程称之为“去尾”具体方法如下:
①单字中只含一个双字根。
若双字根处于字体首位或第2位,要保持全码;
若双字根处于第三位且又是末位字根,也取全码,若其后还有别的字根,则要“去尾”,只用首码;
若双字根处于多字根字的末位时,一律去尾,以保证最多四个码长。
例如:精:MEWY 神:EERA 医:KOLD
啊:KREK 奥:PUMD 劲:UGLI
和:HEK 都:TPRR 磨:GMMS
渠:IKOM
②单字中含两个或多个双字根。
若单字正好拆成两个双字根,则都取全码(共四码);
若字根数目多,则排在后面的那个双字根要预先去尾,用其首码参与编码。
例如:闻:MNRE 码:SHMA 斩:CHJN
暂:CHJR 磊:SHSS
总之,给含双字根的单字进行编码时,要遵循三条原则:一、双字根在首位必须用全码;二、编码最多四个码长;三、必须有末位字根参与编码。其间,有的字根要预先“去尾”,并会出现只有第一、
九:J9 十:YL(L为补充码)
五、词汇的编码:
1、两字词的编码。
分别取两字的前两位字根,将它们的代码予以组合,即得两字词的缩码。须注意:“双字根”在词汇的编码中恢复为单字根,新代码为其首码。
例如:生活:PWIP 音乐:LRVI 革命:GKFH
精神:MWER 成功:PLGL 新闻:LMMR
含字根成字的词中,成字以重码形式参与编码,双字根同样。
如:伟大:FDDD 汽车:IQCC 力量:LLRH
运输:ZDCF 工人:GGFF 人民:FFKL
2、三字词的编码。
分别取前两字的首位字根及第三字的前两位字根,参与编码。
如:为什么:DFPV 对不起:UHTZ
生产力:PLLL 共产党:CLIG
3、四字词的编码。
四个字分别各取首位字根参与组合编码。
如:科学技术:HIAM 社会主义:EFDD
万众一心:HFHX 我行我素:PFPW
4、多字词的编码。
取第一、二、三末位字根的首码组合编码。
如:中华人民共和国:KFFK 人民代表大会:FKFF
百闻不如一见:HMHU
六、容错码的设置:
为照顾不同人的拆分习惯,减少失误,音形法中同样设置了容错码,供输入时参考。
如:切:七、刀(BDO) 常规码
切:土、刀(TDO) 容错码
行:彳、一、丁(FHDZ) 常码
行:彳、二、丨(FDA) 容码
得:彳、日、一、寸(FRHL) 常码
得:彳、日、于、(FRYD) 容码
养:丷、、丶、(CWDA) 常码
养:丷、王、八、(CWFA) 容码
戕:乙、、丨、戈(LHAB) 常码
戕:乙、厂、丨、戈(LPAB) 容码
七、重码的处理:
音形法中,重码的字数同“五笔字型”接近。
每组重码的字,通常为2-3个。一般把常用字放在提示行的前面,可按数字“1”键或打空格键将它输入;排在后面的按序号敲相应的数字键,使之输入。
若想使要输入的字“一步到位”,可在熟记重码字组的前提下,在原编码的后面加上它在重码组中的序号作为新编码,直接输入,从而省去选择的时间,提高输入速度(四码字可将原编码的末码改为序号)。
如:要输入:“导”字,先敲入编码“RC”,机器显示它为重码字,提示行给出:1时2异3导,再按“3”键,“导”字上屏。那么以后再遇“导”字时,根据记忆,我们就可直接输入“RC3”则可使“导”字直接上屏,从而提高了输入效率。
本发明的微机汉字编码方法和现有其他微机编码方法相比,具有易学易懂易操作,拆字编码简单、直观,适合中文汉字的书写习惯,规律性强,便于记忆和运用并可提高输入速度,具有很好的推广使用价值。
表1:音形法字根总表
续表(1)