本发明涉及一种汉字编码方法。 迄今,国内外各种汉字编码输入方案已逾千种之多,其中很多已经走入市场,但我们这里尚未产生出一种海内外华人可以通用的高效易学的汉字输入法。
目前,海内外华人通用的汉字输入法是拼音法,但其重码高,效率低。还有仓颉码,但短时不容易掌握(不那么容易无师自通,如“肇”字的取码为:竹+大+中+手),效率也不够高(输一个字最多用5码,而且出字不出词)。
本发明记忆量少,规则简单,加之字形、笔序大多可与键盘英文字母产生联想(一是音似,无论用汉语拼音或英文字母读音都可以,如:口→K、山→S、丿丿→P;二是形似,如:丨丨→I、丨乛→L、乛乛→W),加之重码少(可与任何其它高效码相比),出词量大(输词用2到4码,只用26个英文字母键,可任意装入万余条常用、专用词,字、词不重码、常用词、专用词不重码),所以本发明学起来快,用起来也快。
本发明所以能高效、易学,关键在于:①.形序码的定义-它将部首和笔画检字法合为一体,可以各取其长的结合使用,既大大压缩了记忆量,也能有助于减少重码;②.字类部位及公式法则的规定-它使取码尽量在字的外围,并将不同字的特征信息完全表达,因而既降低了用户对汉字的书写要求,又提高了用户输出汉字的正确率。
本发明不仅高效、易学,而且规范,因为它基本上立足于汉字三大检字法(部首、笔画及拼音),因而需要用户重新学习的内容很少。
正因为本发明有上述的优点,所以对于《华码》来说,无论简、繁体字,在取码难度或使用效率上都大同小异(连重码率也差不多,要选择的的一级汉字均为80余个)。使用同一个码本,会繁体字的用户可以用繁体字写法输入,会简体字的用户可以用简体字写法输入。至此,本发明真正在华人用电脑地领域内推出了一种广泛通用的汉字输入法。
《辞海》词语分册对五笔形规定为:①、笔形带钩或曲折的作(乛),如“同”的初始两笔作丨乛;②、挑()作横(乛),如“刁”的初始两笔为乛一,但()和(丶)相连的作点,如“冷”的初始两笔为丶丶;③、捺(乁)作点(丶),如“分”的初始两笔为丿丶。
三、说明
(一).实例
1.字类
①.分体字
鸽→g(音)+q(人)+n(鸟)=gqn
持→c(音)+t(扌)+g(土)+c(寸)=ctgc
谢→x(音)+a(丶一)+o(丿丨)+c(寸)=xaoc
督→d(音)+i(丨一)+u(又)+m(目)=dium
②.合体字
曼→m(音)+r(日)+l(丨一)+u(又)=mrlu
虑→l(音)+i(丨一)+p(一丿)+j(心)=lipj
管→g(音)+z()+b(宀)+e()=gzbe
2.词类
①.双字词
工程→u+g(工)+h(禾)+w(王)=ughw
②.多字词
科学技术→i+h(禾)+v(兴)+t(扌)=ihvt
3.法则
①.优先律
殷→y(音)+p(丿丿)+p(丿一)+u(又)=yppu
正→z(音)+i(一丨)+i(一丨)+h(一)=ziih
②.完整律
百→b(音)+h(一)+r(白)=bhr
官→g(音)+b(宀)+e()+e()=gbee
喝→h(音)+k(口)+r(日)+z(一)=hkrz
(二).难点
1.笔形识别
①.注意一笔画写完的,带钩或带弯的笔形都为折(一)。如:电、于、喝……,这些字的最后一笔都是折(一)。
②.注意捺作点(丶)。如:文、很……,这些字的最后两笔都是撇点(丿丶)。
③.还要注意一些短撇。如:赤、共……,这些字的最后两笔都是撇点(丿丶)。
2.字类识别
①.左、中、右三部分可分离的字,要把中、右部视为Ⅱ部,如:激、辨、班……。
②.上下体字是指上部形如口口的字,如:臂、坚、督……。
3.规范书写(笔形和笔顺)
非→f(音)+i(丨丨)+h(一一)+h(一一)=fihh
弯→w(音)+a(丶一)+i(丨丨)+e(弓)=wahe
震→z(音)+a(一丶)+l(乛丨)+t(丿丶)=zalt
南→n(音)+i(一丨)+l(丨乛)+i(一丨)=nili
4.隐含字形(不要拆散)
求→q(音)+h(一)+s(水)+d(丶)=qhsd
受→s(音)+p(丿)+v()+u(又)=spvu
表→b(音)+h(一)+g(土)+t(丿丶)=bhgt
(三).特殊码
1.代音码
轩→x(音)+w(一乛)+h(一一)+i(丨)=xwhi
轩→o(代音)+w(一乛)+h(一一)+i(丨)=owhi
2.多音码
朝→c(音)+i(一丨)+y(月)=ciy
朝→z(音)+i(一丨)+y(月)=ziy
3.容错码
祭→j(音)+p(丿乛)+d(丶丶)+x(小)=jpdx
祭→j(音)+p(丿乛)+a(乛丶)+x(小)=jpax
4.简码(详见软盘中的JM*.TXT文件)
①.常用字(一级简码26个)
音码:的→d、和→h;音码+首码:多→dp、贵→gk;
音码+首尾码:成→cct、或→hht
②.常用词(双字词与多字词的一级简码各26个)
音码:我们→uw、因为→uy,科学技术→ik、中华民族→iz;
首码+首码:应该→uca、调查研究→iaf
③.备用码(共计80余个,使用它们,便可对3755个一级汉字进行盲打。详见软盘中的BYM.TXT文件。)
靶→bc、可→k、粱→ldf、马→mma、目→mmb
第二部分 繁體字版
一、将第一部分的形序碼表及編碼圖改爲繁體字即爲本版。比如,用繁體字的“貝”、“頁”、“見”、“鳥”、“馬”替代簡體字版的形序碼表中相應的簡體字,即爲繁體字版的形序碼表。
二、爲便于識别,在繁體字版中,本人對3種字形,即“”、“亞”和“齊”的形序碼给予了特殊規定-根據首尾取碼及相似性。
[→k()+l(丨乛)=kl、
亞→i(一丨)+i(亅一)=ii、
齊→a(丶一)+y(月)=ay]
例如:繩→s(音)+u(纟)+kl=sukl
龜→g(音)+p(丿一)+kl=gukl
惡→e(音)+ii+j(心)=eiij
→c(音)+ay=cay
三、實例
1.分體字
龍→1(音)+a(丶一)+w(一乛)+h(一一)=lawh(簡碼:音碼→1)
識→s(音)+a(丶一)+a(丶一)+t(丶丿)=sat)
2.(簡碼:音碼+音尾碼→sat)
合體字
靈→1(音)+a(一丶)+1(乛)+i(丨一)=lali
(簡碼:音碼+首尾碼→lai)
華→h(音)+c(艹)+h(一)+i(一丨)=hchi
(簡碼:音碼+首尾碼→hci)
四、附注:
根據本發明的取碼方式,对分體字只在字的外圉取形序碼,而對合體字,由于簡碼是用音碼、音碼+首碼或者碼+首尾碼表示,一般常用字也不必進到字内取碼,所以本碼亦非常適合輸入繁體字。
發明人:賴平華(電話號碼:025-407237)
一九九三年 四月