部首声形码 本发明涉及一种计算机汉字编码输入方法。
目前计算机的汉字输入编码方法常见的有“电报码”、“表形码”、“汉字拼音”、“五笔字型”“两笔字”等。这些输入方法有的较难记忆,学会不易;有的码号长,输入速度慢。最为常见的“五笔字型”要使用连带关系不强的130个字根作为组成汉字的材料,不但记忆不易,而且使用四位制编码的码号长,输入速度慢。又以“两笔字”而论,其亦是四位制编码,其记忆量虽少,但生僻难记,每取一个代码要数双重笔划,不够直观,且取舍笔划的规律性不强,不易掌握,且要进行长时间的专门训练方能熟练操作,这就为计算机的汉字输入普及使用带来很大的障碍。在计算机汉字输入领域中,记忆容易简便,码号短,输入速度快,重码率低,不需要长期专门训练即可熟练操作的计算机汉字输入方法一直是人们迫切需求的。
本发明的目的是设计一种部首声形码。以便克服目前使用计算机汉字输入方法记忆难,码号长,输入速度慢,且要长期专门训练才能熟练操作的缺点。
本发明的目的是这样实现地。
一、部首声形码,本发明的特征在于:在汉字的223个部首中,一是按同声母分类,并以20个汉字声母和6个英语符号作为同声母部首的26个代码,命名为部首声码;二是按近似同形、同义的部首分类,并以19个英语字母和7个英语符号作为近似同形、同义部首的26个代码,命名为部首形码。两者均可按一定规则用代码取代相应的汉字部首,则可为每个汉字、词编码。编码方法有二,其为:
方法一
1、字
(1)不带偏旁的字,取其第一、二和倒数第一个部首代码。不足三码且非重码者,保留二级简码;若重码,用该字声母的代码补上。
(2)带偏旁的字,取其偏旁第一和除偏旁以外的第一及其倒数第一个部首代码。不足三码且非重码者,保留二级简码;若重码用该字偏旁倒数第一个部首代码补上。
2、词
(1)两字词:取其第一个字第一、二个部首代码和最末一字的第一个部首代码。
(2)三、四字词:取其第一、二和最末一字的第一个部首代码。
(3)多字词:取其第一、二、三和最末一字的第一个部首代码。
若二、三字词重码,用其最末一字的倒数第一个部首代码补上;若四字及多字词重码,用其倒数第二个字的倒数第一个部首代码补上。
3、一级简码字
一级简码字即一码字,用26个代码分别取代26个高频字。即:
(Q)全(W)我(E)二(R)人(T)同(Y)一(Uy)要(Iz)这(Oc)出(P)品,(As)上(S)是(D)的(F)发(G)国(H)和(J)经(Km)没(L)了,(Z)中(X)小(C)产(Vc)成(B)不(N)能(M)民。
或:
(Q)中(W)国(E)工(R)人(T)是(Y)民(U)主(I)的(O)同(P)和,(A)在(S)大(D)地(F)上(G)以(H)经(J)发(K)产(L)了,(Z)一(X)有(C)这(V)我(B)不(N)为(M)要。
方法二
1、字
取其声母代码及其第一个部首代码。若非重码,保留二级简码;若重码用该字倒数第一个部首代码补上。
2、词
(1)两字词:先取第一个字的声母代码及其第一个部首代码,后取最末一字的声母代码。
(2)三、四字词:取第一、二和最末一字的声母代码。
(3)多字词:取第一、二、三和最末一字的声母代码。
若二、三字词重码,用其最末一字的倒数第一个部首代码补上;若四字及多字词重码,用其倒数第二个字的倒数第一个部首代码补上。
二、部首声形码之一的部首声码,采用20个汉字声母Q、W、E、R、T、Y、P、S、D、F、G、H、J、L、Z、X、C、B、N、M和6个英语符号Uy、Iz、Oc、As、Km、Vc作为同声母部首的26个代码。
三、部首声形码之一的部首声码,采用20个汉字声母和6个英语符号作为同声母部首的26个代码,这26个代码所代表的部首及其声母为:
四、部首声形码之二的部首形码,采用19个汉字声母Q、W、E、R、T、Y、P、S、D、F、G、H、J、K、Z、X、C、B、N、M和7个英语符号Uy、Iz、Oc、Pd、As、Ls、Vw作为近似同形、同义部首的26个代码。
五、部首声形码之二的部首形码,采用19个英语字母和7个英语符号作为近似同形、同义部首的26个代码,这26个代码所代表的部首及其名称为:
采取以上措施的本发明,保留了汉字部首这个基本要素,只要对汉字部首声母略有印象或对部首笔形略有印记,就会举一反三、触类旁通地见字读码,见词编码。编码简便快速,码号短,每个单字最多不超过三码,在国家一、二级标准字6763个和词典数万条词组中,平均每个单字只有一个码号,即一键输入。并且重码率极低,在使用频率百分之九十五以上的汉字中无重码,输入极其方便。本发明用26个功能键就能处理全部汉字的计算机输入,符合国际计算机键盘标准化。
下面再结合附表及附图对本发明作进一步的详述:
附表1是本发明部首声码代码表;
附图2是本发明部首声码计算机键盘位置图;
附表3是本发明部首形码代码表;
附图4是本发明部首形码计算机键盘位置图。
可以说汉字由部首组成。东汉的文字学家许慎在其不朽之作《说文解字》中分析了9300多个汉字后,得出这样一个结论:“独体为文,合体为字”。所谓“文”,即构成汉字的基本单位,由“文”拼合成者谓之“字”。汉字虽有几万个之多,但构成其的基本单位“文”即“部首”也不外乎几百个。据统计一般字典的汉字部首有223个,而部首声母只有24个(没有O、A)。由此可见,二十来个声母拼读两百来个部首,数百个部首构成数万个汉字,从声母、部首到汉字,由小变多,由声见形,反之亦然。本发明就是基于以上所述之特点,把同声母的部首和近似同形、同义的部首进行分类,用26个代码分别取代同声母和近似同形、同义的部首,进而达到为计算机汉字编码输入之目的。用代码取代同声母之部首者,谓之部首声码;用代码取代近似同形、同义之部首者,谓之部首形码。两者各有所长,相互益彰,以便适应不同层次者之需。附表1给出了部首声码编码式的26个代码所代表的汉字部首及其声母;附表3给出了部首形码编码代的26个代码所代表的部首其及部首名称。
采用本发明的汉字编码方法,以附表1和附表3给出的部首为基本单位,按书写顺序对于两笔划及其以上的汉字,逢字必拆,取大舍小,部首相交不算复笔,把方框内涵外延的笔划看作内空方框的末笔部首。用附表给出的代码按上述方法一或方法二取代相应的汉字部首,即可为每个汉字、词编码。例如:
(为了简便起见,把声码的“Uy、Iz、Oc、As、Km、Vc、”和形码的“Uy、Iz、Oc、As、Vw、Ls、Pd”分别简写为“U、I、O、A、K、V”和“U、I、O、A、V、L、P”。)
字例 方法一方法二 解说声码形码 声码入今迪东妙PN RDI FOU OX NXP PN RDI KOW OX NXP RP JRI DFU DO MNP两笔划以上的字逢字必拆取大“人”舍小“撇”把”十“看作“口”的末笔。“二”与“小”相交不算“木”复笔。按书写顺序从左至后,从上到下。
不带偏旁的字,按方法一:取其第一、二和倒数第一个部首代码。不足三码且非重码者,保留二级简码;若重码,用该字声母的代码补上。按方法二;取其声母代码及其第一个部首代码。若非重码,保留二级简码;若重码用该字倒数第一个部首代码补上。例如:
字例 方 法 一 方法二 声 码 形 码 声 码 良 丽 白 春 同 宁 府 国 呈 乙 DG HID PR ONR IHF BHI GRC FWD FW IY DIU HID PKH ONH IHF GHI WRT KVD FV IY LDG LHD BP COR TIF NBI FGC GFD CF YI
带偏旁的字,按方法一:取其偏旁第一和除偏旁以外的第一及其倒数第一个部首代码。不足三码且非重码者,保留二级简码;若重码用该字偏旁倒数第一个部首代码补上。按方法二:取其声母代码及其第一个部首代码。若非重码,保留二级简码;若重码用该字倒数第一个部首代码补上。例如:
字例 方 法 一 方法二 声 码 形 码 声 码 粮 俪 舶 椿 垌 咛 腑 帼 程 钆 MDG RHD ZB KOR TIF FBI YGC JFD HFW JI BDU RHD PP MOH VIF FGI YWT OKD MFV JI LMG LRD BZ CKR DTF NFI FYC GJD CHW YJ
两字词的编码,按方法一:取其第一个字第一、二个部首代码和最末一字的第一个部首代码。按方法二:先取第一个字的声母代码及其第一个部首代码,后取最末一字的声母代码。例如:
词例 方 法 一 方法二 声 码 形 码 声 码 高明 国家 法院 通常 投资 领空 颜面 EFR FWB ATE IDX TJA RYB EYH GFK KVG AVE SYG TIB RYG GYE GEM GFJ FAY TIC TTZ LRK YEM
三、四字词的编码,按方法一:取第一、二和最末一字的第一个部首代码。按方法二:取第一、二和最末一字的声母代码。例如:
字 词 方 法 一 方法二 声 码 形 码 声 码 高 压 电 国 际 歌 法 拉 第 通 讯 社 高谈阔论 国色天香 法律效力 通情达理 ECF FEH ATZ IUU EUU FDH ARI IXW GWK KEH ATG SUU GUU KDM ARI SXV GYD GJG FLD TXS GTL GSX FLL TQL
多字词的编码。按方法一:取其第一、二、三和最末一字的第一个部首代码;按方法二:取第一、二、三和最末一字的声母代码。例如:
词 例 方 法 一 方法二声 码形 码声 码高射机关枪高分子化合物国民经济计划国家垄断资本主义法西斯主义法国唯物主义大国沙文主义大洋洲及太平洋岛屿 ESKK EBIN FIMG FBLD AHQD AFFD HFAD HAAS GLMM GBIT KISO KGOD AHCD AKFD HKAD HAAL GSJQ GFZW GMJH GJLY FXSY FGWY DGSY DYZY
若二、三字词重码,按方法一、二均是用其最末一字倒数第一个部首代码补上;若四字及多字词重码,用其倒数第二个字的倒数第一个部首代码补上。例如:
重码字词例子 方 法 一 方法二 声码 形码 补正声码补 正 工 工程 HSH HSH HSW 工 工业 HSH HSH HSHH万古长青万古长存 HOO HOO HOON一无所长一无是处 YWC YWC YWCR一成不变一成一旅 HDG HDG HDGH天长地久天长日久 HPD HPD HPDH TCJ TCJ TCJH流行性乙型脑炎流行性脑髓膜炎 ARXH ARXH ARXHH LXXY LXXY LXXYD
附图2和附图4分别给出了本发明部首声形码的部首声码和部首形码计算机键盘位置图。附图2的一级简码汉字与部首代码相呼应,既陈述一级简码的位置所在,又启迪代码的发音趋势;附图4的部首名称简单明了,既展示近似同形部首的笔形要素,又表述了代码与部首发音声母的同一性。充分体现了本发明科学合理、简明易学、编码简便快速,并能顾及不同层次者之需。