本发明涉及的是一种极其简捷的汉字编码方法,特别适合非专职计算机操作人员向计算机及其它需对汉字进行信息处理的类似装置快速输入汉字用。 目前,国内外汉字编码法大致可归结为三类:纯音的、纯形的、音形结合的。从现在使用情况可看出,直接用汉字拼音法,由于重码多,速度低,卷舌音与非卷舌音难以区别而造成误码率高。纯形编码法,其码长长(五笔字形,每字五码),速度低,拆字难,易出错,音形码有的追求无重码而提出规则,其规定繁琐难以记意,不易推广。有的规则虽简单,但不够严格,拆字方法有多义性而难以掌握。上述几种编码法,虽存在一定的缺点,可是在专职计算机操作人员中一般都是可用的。
本发明的目的是为了降低误编率和重码,提高输入速度,其提出的编码方法是完全建立在理解的基础上,並符合汉字的书写习惯,具有规则简单,不用学,不用记,更无需专门训练。掌握快,容易实行。其取码严格,无多义性,重码率和误码率都极低。可直接在标准键盘上使用。本发明已将国标GB 2312-80 Ⅰ、Ⅱ级汉字6763个全部硬化,储存于软盘中。
本发明提供的编码方法为:
1.按照汉字的书写笔划的顺序,取被编码汉字的最初几笔和最末几笔构成的规范偏旁读音的第一个拼音字母为该字的前两码,起笔为第一码,末笔为第二码,再取该汉字本字读音的第一个拼音字母为第三码,即得该汉字的编码。
从习惯取规范偏旁地读音为
宀(宝)-B,疒(病)-B,艹(草)-C,刂(刀)-D,
卩=阝(耳)-E,虍(虎)-H,纟(绞)-J,钅(金)-J,
冫(两)-L,(牛)-N,冖(平)-P,犭(犬)-Q,
亻(人)-R,饣(食)-S,礻(示)-S,氵(水)-S,
扌(提)-T,(王)-W,攵(文)-W,忄(心)-X,
讠(言)-Y,衤(衣)-Y,(竹)-Z,廴=辶(走)-Z,
(足)-Z。
编码举例:
汉字 第一码 第二码 第三码 本字编码
起笔 码元 末笔 码元 本字读音 码元
激 氵 S 攵 W Ji J SWJ
溺 氵 S 冫 L Ni N SLN
节 艹 C 卩 E Jie J CEJ
2.如汉字的起末笔中的任一方或双方並不构成规范偏旁,则取起末笔中的任一方或双方构成的不与其它笔划交叉的最简汉字或独立汉字读音的第一个拼音字母作为被编码汉字的码元。
编码举例:
汉字 第一码 第二码 第三码 本字编码
起笔 码元 末笔 码元 本字读音 码元
拼 扌 T 开 K Pin P TKP
折 扌 T 斤 J Zhc Z TJZ
邮 由 Y 阝 E You Y YEY
殿 尸 S 又 Y Dian D SYD
3.如汉字的起末笔中的任一方或双方,既不构成规范偏旁也不构成最简或独立汉字,则取起笔的第一笔,末笔的最末一笔的笔划,读音的第一个拼音字母为码元。
1)从习惯取笔划的读音为:
一(横)-H,丨(竖)-S,丿(撇)-P,(捺)-N,
丶(点)-D,(钩)-G,(挑)-T。
2)下列笔划一律取作“”(钩),码元为G。
3)下列笔划,起笔时取转笔前的笔划,末笔时取转笔后的笔划。
编码举例:
汉字 第一码 第二码 第三码 本字编码
起笔 码元 末笔 码元 本字读音 码元
大 一 HN Da D HND
旦 日 R 一 H Dan D RED
学 丶 D 子 Z Xue X DZX
旁 丶 D 万 W Pang P DWP
巴 一 H 乚 G Ba B HGB
本发明提供起末笔时常遇十八个冷辟汉字及十四个近似汉字。其读音如下:
十八个常遇冷辟汉字读音如下:
彳(Chi斥)-C,刍(Chu雏)-C,缶(Fou否)-F,
鬲(Ge隔)-G,艮(Gen)-G,衮(Gun滚)-G,
曷(He喝)-H,奂(Huan换)-H,戋(Jian笺)-J,
堇(Jin谨)-J,臼(Jiu舅)-J,佥(Qian签)-Q,豕(Shi史)-S,厶(Si私)-S,忝(Tian添)-T,
幺(Yao吆)-Y,聿(Yu玉)-Y,豸(Zhi制)-Z。
十四个常遇似汉字读音如下:
丷=八-B,上=匕-B,镸=长-C,=东-D,=干-G,
=艮,隹=佳-J,耒=来-L,良=良-L,曰=日-R,
=豕-S,=水-S,士=土-T,=小-X。
按本发明编码时,需注意:
1)汉字“一”在起末笔中读作“横”(H),独立存在时其编码取作“横,横,一”即“HHY”;
2)汉字“乙”在起末笔中读原字音“Yi”(Y),独立存在时其编码取作“横,钩,一”即“HGY”;
3)汉字“国”的编码先外后内,取作“囗,玉,国”即“KYG”其它类似字如“园”,“困”均按此法编码。
4)汉字“匡”的编码亦先外后内,取作“横,土,匡”即“HTK”其它类似字如“区”,“匠”均按此法编码。