华码.pdf

摘要
申请专利号：	CN93110796.2	申请日：	1993.05.13
公开号：	CN1078051A	公开日：	1993.11.03
当前法律状态：	撤回	有效性：	无权
法律详情：	\|\|\|公开
IPC分类号：	G06F3/023	主分类号：	G06F3/023
申请人：	赖平华;
发明人：	赖平华
地址：	210002江苏省南京市文昌巷19-5-6号
优先权：
专利代理机构：		代理人：
PDF下载：	PDF下载

内容摘要

本发明涉及一种汉字的编码方法，它不仅是对《音形序码》(本人发明，公开号CN1054841)的优化和简化，而且已经可以简、繁体字输入。《华码》的关键技术在于：一。将五笔形的两两组合(注意，是组合而不是排列)定义为笔序，将规定了两个使用条件的部首定义为字形，以使笔序与字形结合起来定代码；二.根据汉字偏旁部首的特点规定字类部位及取码公式。因此，《华码》适合开发于键盘输入汉字的各种通用型电脑、翻译机、学习机等。

权利要求书

1：《华码》由键盘输入汉字，其特征在于把规定了两个必要条件(一、笔形相同；二、笔顺相连)的部首定义为字形，其代码称为形码；把横、竖、撇、点、折五笔形及其两两组合定义为笔序，其代码称为序码，字形、笔序与键盘字母主要以音似或形似的方式相对应： ①简体字码表 [横(一)、竖(丨)、撇(丿)、点(丶)、折( )的代码分别为：h、i、p、d、z] ②繁体字码表 [横(一)、竖(丨)、撇(丿)、点(丶)、折( )的代码分别为：h、i、p、d、z]。
2：《华码》由字类部位定取码公式，其特征在于首先按汉字的笔顺、部首特点定义出字类部位：①、若一个汉字含有形如的结构，且该结构满足条件：1）、Ⅰ部至少两笔画，2）、Ⅰ部每笔画顺序先于Ⅱ部的，则称这类字为分体字（左、中、右三部分可分离的字，左部属于Ⅰ部，其余属于Ⅱ部），分体字包含左右体字（形如）和上下体字（形如）;②、汉字中的非分体字称为合体字，其中Ⅰ部为首码所对应的笔画，Ⅱ部为其余笔画，然后给出取码公式：音码+首码+前后码（在Ⅱ部取码），这里，音码为汉语拼音的第一个字母。
3：按权利要求书Ⅰ、Ⅱ所述的《华码》，其特征在于规定取码法则：①、优先律-取码时可用字形则不用笔序，可用笔画多的则不用笔画少的;②、完整律-取码时不拆散字形。
4：按权利要求书Ⅰ、Ⅱ、Ⅲ所述的《华码》，其特征在于词的取码公式：①、双字词-u+首码（第一个字）+首尾码（第二个字）;②、多字词-i+首码（前三个字）;③、自定义词-v+……，此外，还规定特殊码：①、代音码-可用o键代替音码;②多音码;③、容错码;④、简码。

说明书

本发明涉及一种汉字编码方法。
    迄今，国内外各种汉字编码输入方案已逾千种之多，其中很多已经走入市场，但我们这里尚未产生出一种海内外华人可以通用的高效易学的汉字输入法。

    目前，海内外华人通用的汉字输入法是拼音法，但其重码高，效率低。还有仓颉码，但短时不容易掌握（不那么容易无师自通，如“肇”字的取码为：竹+大+中+手），效率也不够高（输一个字最多用5码，而且出字不出词）。

    本发明记忆量少，规则简单，加之字形、笔序大多可与键盘英文字母产生联想（一是音似，无论用汉语拼音或英文字母读音都可以，如：口→K、山→S、丿丿→P;二是形似，如：丨丨→I、丨乛→L、乛乛→W），加之重码少（可与任何其它高效码相比），出词量大（输词用2到4码，只用26个英文字母键，可任意装入万余条常用、专用词，字、词不重码、常用词、专用词不重码），所以本发明学起来快，用起来也快。

    本发明所以能高效、易学，关键在于：①.形序码的定义-它将部首和笔画检字法合为一体，可以各取其长的结合使用，既大大压缩了记忆量，也能有助于减少重码;②.字类部位及公式法则的规定-它使取码尽量在字的外围，并将不同字的特征信息完全表达，因而既降低了用户对汉字的书写要求，又提高了用户输出汉字的正确率。

    本发明不仅高效、易学，而且规范，因为它基本上立足于汉字三大检字法（部首、笔画及拼音），因而需要用户重新学习的内容很少。

    正因为本发明有上述的优点，所以对于《华码》来说，无论简、繁体字，在取码难度或使用效率上都大同小异（连重码率也差不多，要选择的的一级汉字均为80余个）。使用同一个码本，会繁体字的用户可以用繁体字写法输入，会简体字的用户可以用简体字写法输入。至此，本发明真正在华人用电脑地领域内推出了一种广泛通用的汉字输入法。

    《辞海》词语分册对五笔形规定为：①、笔形带钩或曲折的作（乛），如“同”的初始两笔作丨乛;②、挑（）作横（乛），如“刁”的初始两笔为乛一，但（）和（丶）相连的作点，如“冷”的初始两笔为丶丶;③、捺（乁）作点（丶），如“分”的初始两笔为丿丶。

    三、说明

    （一）.实例

    1.字类

    ①.分体字

    鸽→g（音）+q（人）+n（鸟）＝gqn

    持→c（音）+t（扌）+g（土）+c（寸）＝ctgc

    谢→x（音）+a（丶一）+o（丿丨）+c（寸）＝xaoc

    督→d（音）+i（丨一）+u（又）+m（目）＝dium

    ②.合体字

    曼→m（音）+r（日）+l（丨一）+u（又）＝mrlu

    虑→l（音）+i（丨一）+p（一丿）+j（心）＝lipj

    管→g（音）+z（）+b（宀）+e（）＝gzbe

    2.词类

    ①.双字词

    工程→u+g（工）+h（禾）+w（王）＝ughw

    ②.多字词

    科学技术→i+h（禾）+v（兴）+t（扌）＝ihvt

    3.法则

    ①.优先律

    殷→y（音）+p（丿丿）+p（丿一）+u（又）＝yppu

    正→z（音）+i（一丨）+i（一丨）+h（一）＝ziih

    ②.完整律

    百→b（音）+h（一）+r（白）＝bhr

    官→g（音）+b（宀）+e（）+e（）＝gbee

    喝→h（音）+k（口）+r（日）+z（一）＝hkrz

    （二）.难点

    1.笔形识别

    ①.注意一笔画写完的，带钩或带弯的笔形都为折（一）。如：电、于、喝……，这些字的最后一笔都是折（一）。

    ②.注意捺作点（丶）。如：文、很……，这些字的最后两笔都是撇点（丿丶）。

    ③.还要注意一些短撇。如：赤、共……，这些字的最后两笔都是撇点（丿丶）。

    2.字类识别

    ①.左、中、右三部分可分离的字，要把中、右部视为Ⅱ部，如：激、辨、班……。

    ②.上下体字是指上部形如口口的字，如：臂、坚、督……。

    3.规范书写（笔形和笔顺）

    非→f（音）+i（丨丨）+h（一一）+h（一一）＝fihh

    弯→w（音）+a（丶一）+i（丨丨）+e（弓）＝wahe

    震→z（音）+a（一丶）+l（乛丨）+t（丿丶）＝zalt

    南→n（音）+i（一丨）+l（丨乛）+i（一丨）＝nili

    4.隐含字形（不要拆散）

    求→q（音）+h（一）+s（水）+d（丶）＝qhsd

    受→s（音）+p（丿）+v（）+u（又）＝spvu

    表→b（音）+h（一）+g（土）+t（丿丶）＝bhgt

    （三）.特殊码

    1.代音码

    轩→x（音）+w（一乛）+h（一一）+i（丨）＝xwhi

    轩→o（代音）+w（一乛）+h（一一）+i（丨）＝owhi

    2.多音码

    朝→c（音）+i（一丨）+y（月）＝ciy

    朝→z（音）+i（一丨）+y（月）＝ziy

    3.容错码

    祭→j（音）+p（丿乛）+d（丶丶）+x（小）＝jpdx

    祭→j（音）+p（丿乛）+a（乛丶）+x（小）＝jpax

    4.简码（详见软盘中的JM＊.TXT文件）

    ①.常用字（一级简码26个）

    音码：的→d、和→h;音码+首码：多→dp、贵→gk;

    音码+首尾码：成→cct、或→hht

    ②.常用词（双字词与多字词的一级简码各26个）

    音码：我们→uw、因为→uy，科学技术→ik、中华民族→iz;

    首码+首码：应该→uca、调查研究→iaf

    ③.备用码（共计80余个，使用它们，便可对3755个一级汉字进行盲打。详见软盘中的BYM.TXT文件。）

    靶→bc、可→k、粱→ldf、马→mma、目→mmb

    第二部分    繁體字版

    一、将第一部分的形序碼表及編碼圖改爲繁體字即爲本版。比如，用繁體字的“貝”、“頁”、“見”、“鳥”、“馬”替代簡體字版的形序碼表中相應的簡體字，即爲繁體字版的形序碼表。

    二、爲便于識别，在繁體字版中，本人對3種字形，即“”、“亞”和“齊”的形序碼给予了特殊規定-根據首尾取碼及相似性。

    [→k（）+l（丨乛）＝kl、

    亞→i（一丨）+i（亅一）＝ii、

    齊→a（丶一）+y（月）＝ay]

    例如：繩→s（音）+u（纟）+kl＝sukl

    龜→g（音）+p（丿一）+kl＝gukl

    惡→e（音）+ii+j（心）＝eiij

    →c（音）+ay＝cay

    三、實例

    1.分體字

    龍→1（音）+a（丶一）+w（一乛）+h（一一）＝lawh（簡碼：音碼→1）

    識→s（音）+a（丶一）+a（丶一）+t（丶丿）＝sat）

    2.（簡碼：音碼+音尾碼→sat）

    合體字

    靈→1（音）+a（一丶）+1（乛）+i（丨一）＝lali

    （簡碼：音碼+首尾碼→lai）

    華→h（音）+c（艹）+h（一）+i（一丨）＝hchi

    （簡碼：音碼+首尾碼→hci）

    四、附注：

    根據本發明的取碼方式，对分體字只在字的外圉取形序碼，而對合體字，由于簡碼是用音碼、音碼+首碼或者碼+首尾碼表示，一般常用字也不必進到字内取碼，所以本碼亦非常適合輸入繁體字。

    發明人：賴平華（電話號碼：025-407237）

    一九九三年    四月