汉字起末笔编码法.pdf

摘要
申请专利号：	CN87100210	申请日：	1987.01.13
公开号：	CN87100210A	公开日：	1988.07.27
当前法律状态：	终止	有效性：	无权
法律详情：	\|\|\|授权\|\|\|审定\|\|\|\|\|\|公开
IPC分类号：	G06F3/023	主分类号：	G06F3/023
申请人：	电子工业部第二十一研究所
发明人：	武震声
地址：	上海市4057信箱
优先权：
专利代理机构：	中国科学院上海专利事务所	代理人：	梅钰珍
PDF下载：	PDF下载

内容摘要

一种汉字起末笔编码法，特别适合非专职计算机操作人员向计算机及其它需对汉字进行信息处理的类似装置快速输入汉字用。其编码方法的要点是取起末笔构成的规范偏旁(或最简独立汉字或最初笔划最末笔划)读音的第一个拼音字母为前两码，汉字本字读音的第一个拼音字母为第三码，平均码长小于3码。此法严格，无多义性，重码率和读码率均极低。无繁琐规定，它符合汉字的书写习惯，掌握快，容易实行。

权利要求书

1：一种汉字起末笔编码方法，特别适合于非专职计算机操作人员向计算机及其它需对汉字进行信息处理的类似装置快速输入汉字用。本发明的特征包括按规定的编码方法为取被编码汉字的起笔、末笔和该汉字本字，作为编码的依据。
2：如权利要求1所述的编码方法，其特征在于按照汉字的书写笔划顺序，取汉字最初几笔和最末几笔（简称起末笔）构成的规范偏旁读音的第一个拼音字母为该汉字的前两码，起笔为第一码，末笔为第二码，再取该汉字本字读音的第一个拼音字母为第三码，即得该字的编码。从习惯取规范偏旁读音如下：宀（宝）-B，疒（病）-B，艹（草）-C，刂（刀）-D，卩＝阝（耳）-E，虍（虎）-H，纟（绞）-J，钅（金）-J，冫（两）-L，（牛）-N，冖（平）-P，犭（犬）-Q，亻（人）-R，饣（食）-S，礻（示）-S，氵（水）-S，扌（）-T，（王）-W，攵（文）-W，忄（心）-X，讠（言）-Y，衤（衣）-Y，（竹）-Z，廴＝辶（走）-Z， （足）-Z
3：如权利要求1所述的编码方法，其特征在于按权利要求2所述的方法，如果被编码汉字的起末笔中的任一方或双方并不构成规范偏旁，则取起末笔中的任一方或双方构成的不与其它笔划有交叉的最简汉字或独立汉字读音的第一个拼音字母做为被编码汉字的码元。
4：如权利要求3所述的编码方法，其特征在于： 1）取起末笔时有常遇的十八个冷辟汉字，其读音的第一个拼音字母为彳-C，刍-C，缶-F，鬲-G，艮-G，衮-G，曷-H，奂-H，戋-J，堇-J，臼-J，佥-Q，豕-S，厶-S，忝-T，幺-Y，聿-Y，豸-Z; 2）取起末笔时，有常遇的十四个近似汉字，其读音的第一个字母为丷＝八-B，上＝匕-B，镸＝长-C，＝东-D，＝干-G，＝艮-G，隹＝佳-J，耒＝来-L，良＝良-L，曰＝日-R，＝豕-S，＝水-S，士＝土-T，＝小-X;
5：如权利要求1所述的编码方法，其特征在于按权利要求2和3所述的方法，如果被编码汉字的起末笔中的任一方或双方，既不构成规范偏旁亦不构成最简或独立汉字，则取起笔之第一笔，末笔之最末一笔的笔划读音的第一个拼音字母做码元。从习惯取笔划的读音为一（横）-H，丨（竖）-S，丿（撇）-P，（捺）-N 丶（点）-D，（钩）-G，（挑）-T;
6：如权利要求5所述的编码方法，其特征在于 1）汉字中的下列笔划一律取作“ ”（钩），码元为G， 2）下列笔划，起笔时取转笔前的笔划，末笔时取转笔后的笔划
7：如权利要求1所述的编码方法，其特征在于 1）汉字“一”在起末笔中读作“横”（H），独立存在时其编码取作“横，横，一”，即“HHY”; 2）汉字“乙”在起末笔中读原字音“Yi”（Y），独立存在时其编码取作“横，钩，乙”，即“HGY”; 3）汉字“国”的编码先外后内，取作“囗，玉，国”，即“KYG”，其它类似字如“园”、“困”均按此法编码; 4）汉字“匡”的编码亦先外后内，取作“横，土，匡”，即“HTK”，其它类似字如“区”，“匠”均按此法编码。

说明书

本发明涉及的是一种极其简捷的汉字编码方法，特别适合非专职计算机操作人员向计算机及其它需对汉字进行信息处理的类似装置快速输入汉字用。
    目前，国内外汉字编码法大致可归结为三类：纯音的、纯形的、音形结合的。从现在使用情况可看出，直接用汉字拼音法，由于重码多，速度低，卷舌音与非卷舌音难以区别而造成误码率高。纯形编码法，其码长长（五笔字形，每字五码），速度低，拆字难，易出错，音形码有的追求无重码而提出规则，其规定繁琐难以记意，不易推广。有的规则虽简单，但不够严格，拆字方法有多义性而难以掌握。上述几种编码法，虽存在一定的缺点，可是在专职计算机操作人员中一般都是可用的。

    本发明的目的是为了降低误编率和重码，提高输入速度，其提出的编码方法是完全建立在理解的基础上，並符合汉字的书写习惯，具有规则简单，不用学，不用记，更无需专门训练。掌握快，容易实行。其取码严格，无多义性，重码率和误码率都极低。可直接在标准键盘上使用。本发明已将国标GB    2312-80    Ⅰ、Ⅱ级汉字6763个全部硬化，储存于软盘中。

    本发明提供的编码方法为：

    1.按照汉字的书写笔划的顺序，取被编码汉字的最初几笔和最末几笔构成的规范偏旁读音的第一个拼音字母为该字的前两码，起笔为第一码，末笔为第二码，再取该汉字本字读音的第一个拼音字母为第三码，即得该汉字的编码。

    从习惯取规范偏旁地读音为

    宀（宝）-B，疒（病）-B，艹（草）-C，刂（刀）-D，

    卩＝阝（耳）-E，虍（虎）-H，纟（绞）-J，钅（金）-J，

    冫（两）-L，（牛）-N，冖（平）-P，犭（犬）-Q，

    亻（人）-R，饣（食）-S，礻（示）-S，氵（水）-S，

    扌（提）-T，（王）-W，攵（文）-W，忄（心）-X，

    讠（言）-Y，衤（衣）-Y，（竹）-Z，廴＝辶（走）-Z，

    （足）-Z。

    编码举例：

    汉字    第一码    第二码    第三码    本字编码

    起笔    码元    末笔    码元    本字读音    码元

    激    氵    S    攵    W    Ji    J    SWJ

    溺    氵    S    冫    L    Ni    N    SLN

    节    艹    C    卩    E    Jie    J    CEJ

    2.如汉字的起末笔中的任一方或双方並不构成规范偏旁，则取起末笔中的任一方或双方构成的不与其它笔划交叉的最简汉字或独立汉字读音的第一个拼音字母作为被编码汉字的码元。

    编码举例：

    汉字    第一码    第二码    第三码    本字编码

    起笔    码元    末笔    码元    本字读音    码元

    拼    扌    T    开    K    Pin    P    TKP

    折    扌    T    斤    J    Zhc    Z    TJZ

    邮    由    Y    阝    E    You    Y    YEY

    殿    尸    S    又    Y    Dian    D    SYD

    3.如汉字的起末笔中的任一方或双方，既不构成规范偏旁也不构成最简或独立汉字，则取起笔的第一笔，末笔的最末一笔的笔划，读音的第一个拼音字母为码元。

    1）从习惯取笔划的读音为：

    一（横）-H，丨（竖）-S，丿（撇）-P，（捺）-N，

    丶（点）-D，（钩）-G，（挑）-T。

    2）下列笔划一律取作“”（钩），码元为G。

    3）下列笔划，起笔时取转笔前的笔划，末笔时取转笔后的笔划。

    编码举例：

    汉字    第一码    第二码    第三码    本字编码

    起笔    码元    末笔    码元    本字读音    码元

    大一 HN Da D HND

    旦    日    R    一    H    Dan    D    RED

    学    丶    D    子    Z    Xue    X    DZX

    旁    丶    D    万    W    Pang    P    DWP

    巴    一    H    乚    G    Ba    B    HGB

    本发明提供起末笔时常遇十八个冷辟汉字及十四个近似汉字。其读音如下：

    十八个常遇冷辟汉字读音如下：

    彳（Chi斥）-C，刍（Chu雏）-C，缶（Fou否）-F，

    鬲（Ge隔）-G，艮（Gen）-G，衮（Gun滚）-G，

    曷（He喝）-H，奂（Huan换）-H，戋（Jian笺）-J，

    堇（Jin谨）-J，臼（Jiu舅）-J，佥（Qian签）-Q，豕（Shi史）-S，厶（Si私）-S，忝（Tian添）-T，

    幺（Yao吆）-Y，聿（Yu玉）-Y，豸（Zhi制）-Z。

    十四个常遇似汉字读音如下：

    丷＝八-B，上＝匕-B，镸＝长-C，＝东-D，＝干-G，

    ＝艮，隹＝佳-J，耒＝来-L，良＝良-L，曰＝日-R，

    ＝豕-S，＝水-S，士＝土-T，＝小-X。

    按本发明编码时，需注意：

    1）汉字“一”在起末笔中读作“横”（H），独立存在时其编码取作“横，横，一”即“HHY”;

    2）汉字“乙”在起末笔中读原字音“Yi”（Y），独立存在时其编码取作“横，钩，一”即“HGY”;

    3）汉字“国”的编码先外后内，取作“囗，玉，国”即“KYG”其它类似字如“园”，“困”均按此法编码。

    4）汉字“匡”的编码亦先外后内，取作“横，土，匡”即“HTK”其它类似字如“区”，“匠”均按此法编码。