本发明涉及一种新式的汉字编码方法及其专用的键盘。 自电子计算机普遍应用以来,为了实现汉字能方便地进入计算机进行信息贮存、通讯传输、加工处理及还原输出,从七十年代开始,国内外信息处理专家已陆续推出五百多种汉字编码输入方案。从总体上看这些编码方案可分为形码、音码和音形码(或形音码)三大类。形码直观性强,不论认识与否均能依照一定规则拆分取码。然而由于拆分为笔划时太琐碎、费时,而归并成字元时,其基本字元数一般都在200个上下,例如国内流行的河南王永民“五笔形码”,其字元数有227个;四川的“大众码”的字元数也有172个。字元多,一是归并情况复杂难记忆,二是涉及的概念繁杂,三是在计算机键盘的一个键帽上往往要加记多个字元,这些都给操作和记忆带来诸多不便,也给普及应用带来困难。1987年河北省张国防发明的“五十字元码”(见中国专利CN87100844A)虽已将字元数降低在几十个范围内,大大减少了记忆量,但在几十个字元之间及与汉拼字母之间仍缺乏必要的整体的内在联系,联想的记忆量仍然比较高。音码对“想打”有利,但重码率太高,不实用。而音形码(或形音码)又因概念多,规则复杂而难以掌握,不利于普及和推广使用。
本发明目的在于提供一种新式的能克服上述现有技术不足之处的键位母字编码方法及其键盘,它综合性能好,既能适合社会上不同层次用户需求,又好学易用速度快,便于推广应用。
依照本发明目的,发明人公开的键位母字编码方法是以二十五个
Qiong W(ua) E Ruo Tong Y(u) U I
概括性很强的自然汉字
琼、蛙、俄、蒻、统、愉、诬、宜、O Pao A Sui Die Fan Gou Hai Jiu Kuang Ling Zhen Xian Chun
○、袍、阿、燧、跌、饭、狗、胲、酒、眶、拎、镇、鲜、椿、
V(uai) Bei Niang Miao
、碑、娘、秒
作为构成汉字“声、韵、形、象”基本要素的母字,并根据这些母字与键位字母Q、W、E、R、T、Y、U、I、O、P、A、S、D、F、G、H、J、K、L、Z、X、C、V、B、N、M的内在联系,以键位字母作为构字的基本代码从而构成纯音码、全形码、音形码(形音码)三大类十种电脑文字输入法,以此适应社会上不同层次用户的需求,由于本发明使国际通用键盘汉字化,又促使本发明的编码方法能得以最快普及与推广。与现有技术相比,本发明特点在于:1、综合了现有形码、音码、音形码(形音码)编码方法优点,故本发明综合性能好,便于推广应用;2、选定出的母字包孕了汉字的基本信息(声、韵、全形、象形),将联想记忆量降到最低限度;3、在摘取形码上引进现代程序设计技术-模块思想,使汉字地拆分摘取原则明确简单,无二义;4、编码总则依据键位母字的“声、韵、全形、象形”基本要素和键位字母(代码)的内在联系进行,易学易用易联想不易遗忘,而且不论操作者文化程度高低,只要按照母字击键,即能编码和输入,简单易行;5、根据键位母字编码法可以构成通用型、专业型等十种电脑文字输入法,完全可以满足社会上不同层次用户的选择使用;6、本发明有纯音码、全形码、音形(形音)码三大类编码法,使输入方法达到灵活,多样,准确,快速,理想等积极效果。
下面结合有关附图和实例进一步描述本发明。
图1是本发明母字键位图
图2是本发明键位母字内涵解析表
图3是本发明键位母字象形拓展表
图4是实施本发明纯音码,全形码,音形码,形音码四种编码法的实例表
本发明精选出的25个键位母字琼、蛙、俄、蒻、统、愉、诬、宜、袍、阿、燧、跌、饭、狗、胲、酒、眶、拎、镇、鲜、椿、、碑、娘、秒,它包含了所有汉字先天的音形要素和每一个汉字本身的“声、韵、形、象”基本要素,其在键盘上的排列则依据其读音的第一个拼音字母再加一个O字母与现有国际标准的计算机键盘的键位字母巧妙吻合,即构成了如图1所示的母字键位图,该母字键位图表示了汉字编码和输入成为了统一体,实现了键盘汉字化。
参照图2的母字内涵解析表所示,每个键位母字依据其声母、韵母、全形、象形以及键位字母确定了其内涵内容。表中的声母即为键位母字的读音声母,韵母即为它的读音韵母,全形即为键位母字的左偏旁(或是宜、蒻的上偏旁),象形即为键位母字的右下(或下)的偏旁(或笔划)。例如:阿母字,声母为A(单韵的零声母),则键位字母用A表示,其全形是“阝”,象形是“亅”;碑母字,声母为B,则键位字母用B表示,其全形是“石”,象形是“丨”。
参照附图4所示,本发明所述的键位母字编码方法可分为三大类型:
第一类是纯音码编码法。纯音码是根据反切法原理,并遵循汉语拼音的互补规律合理配伍而成的,即:依据提供的编码汉字读音,采取“前取声(母),后取韵(母)”的双拼法摘取音码的编码方法。例如:“休”字:读音为“xiu”,可取“鲜”母字的声母“X”,“酒”母字的韵母“iu”,即依照键位母字“鲜酒”转换成键位字母代码“XJ”表示,即为纯音码。
为了方便用户使用,使编码方案更具通用性,本发明对如下情况进行特殊规定:1、对带“h”的翘舌声母分别归并入Z、C、S声母中,用同一个键位字母表示。即:Zh→Z(镇),Ch→C(椿),Sh→S(燧);2、对带后“g”的复鼻韵母与相应的带“n”的韵母合并,用同一个键位母字表示。即:ang→an(饭),uang→uan(眶),eng→en(镇),ing→in(拎),ueng→uen(un)(椿);3、将“üe,üan,ün,ia”分别归并入W(蛙),K(眶),C(椿),V()中,由这四个键位母字担任条件变读;4、将翘舌韵母“er”归并入相似韵母E(俄)中;5、对自成音节的韵母,后取韵(母)的同时,前头要补上韵母的首字母作为零声母。例如ai摘取AH;ian摘取IX;ou摘取OG;ua摘取UW;en摘取EZ;ü摘取YY(ü用Y表示)。
第二类是全形码编码法。全形码是依据键位母字的全形、象形及象形拓展来摘取汉字字形的编码法。
上述所称的全形就是每一个键位母字的左偏旁,其中宜、蒻是上偏旁。全形中有“氵、冫”,“亻、彳”,“禾、米”,“衤、礻”,“犭、豸”五对相似形采用合并方式,用同一个键位母字表示。
上述所称的象形就是每一个键位母字的下右脚(或下脚)的偏旁(或者笔划)。象形拓展是指依据键位母字的象形进行联想拓展的,如图3所示。例如:“碑”母字的象形“丨”可以拓展成卜丬屮卜十巾;“娘”母字的象形“”可以拓展成厶长。
全形码的摘取是依照汉字的不同字型结构,沿用统一的“模块”规则取形组合而成,它包括二形码,三形码,四形码,五形码,六形码。
二形码的取码路线是这样:左右型结构字是左下→右下;例如:休(左右型)摘取亻(俄E),木(椿C),其组成的形码为EC。福(左右型)摘取礻(袍P),田(酒J),其组成的形码为PJ。能(左右型)摘取月(胲H),匕(袍P),其组成的形码为HP。树(左右三排体)摘取木(椿C),亅(阿A),其组成的形码为CA。摊(左右四排体)摘取扌(拎L),土(蛙W),其组成的形码为LW。
上下型结构字是上(或上右下)→下(或下右);例如:秃(上下型)摘取禾(秒M),几(统T),其组成的形码为MT。意(上下型)摘取丶(拎L),心(镇Z),其组成的形码为LZ。暂(上下型上排体)摘取(愉Y),日(椿C),其组成的形码为YC。获(上下型下排体)摘取艹(蒻R),大(跌D),其组成的形码为RD。
外里型结构字是外框→里(或里下右);例如:区摘取匚(眶K),乂(饭F),其组成的形码为KF。阔摘取门(V),口(V),其组成的形码为VV。
单体型结构字只取下脚单形码。例如:丰:摘取(鲜X),其组成的形码为X。
三形码的取码路线是这样:左右型结构字是左下→右下→左上(取不到时,则取右上;如遇多排体的左右型结构字则取余体的左下);例如:休(左右型)摘取亻(俄E),木(椿C),其组成的形码为EC。福(左右型)摘取礻(袍P),田(酒J),一(诬U),其组成的形码为PJU。能(左右型)摘取月(胲H),匕(袍P),厶(娘N),其组成的形码为HPN。树(左右三排体)摘取木(椿C),亅(阿A),又(饭F),其组成的形码为CAF。摊(左右四排体)摘取扌(拎L),土(蛙W),又(饭F),其组成的形码为LWF。
上下型结构字是上(或上右下)→下(或下右)→下左(取不到时,顺上再取,上排体不再取。例如:秃(上下型)摘取禾(秒M),几(统T),其组成的形码为MT。意(上下型)摘取丶(拎L),心(镇Z),日(椿C),其组成的形码为LZC。暂(上下型上排体)摘取(愉Y),日(椿C),其组成的形码为YC。获(上下型下排体)摘取艹(蒻R),大(跌D),犭(狗G),其组成的形码为RDG。
外里型结构字是外框→里(或里下右);例如:区摘取匚(眶K),乂(饭F),其组成的形码为KF。阔摘取门(V),口(V),其组成的形码为VV。
单体型结构字只取下脚单形码。例如:丰:摘取(鲜X),其组成的形码为X。
四形码、五形码、六形码的取码路线是在每一个汉字已取了三个形码后,在该汉字剩余的字形中再从后往前继续摘取形码,直至取完或取够指定码长为止。例如:福(左右型)摘取礻(袍P),田(酒J),一(诬U),口(V),其四形码为PJUV。能(左右型)摘取月(胲H),匕(袍P),厶(娘N),匕(袍P),其四形码为HPNP。摊(左右四排体)摘取扌(拎L),土(蛙W),又(饭F),一(诬U),丶(拎L),亻(俄E),其四形码为LWFU,五形码为LWFUL,六形码为LWFULE。
意(上下型)摘取丶(拎L),心(镇Z),日(椿C),一(诬U),八(镇Z),一(诬U),其四形码为LZCU,五形码为LZCUZ,六形码为LZCUZU。
第三类是音形码或是形音码的编码方法。这类型码是依据键位母字的声、韵、全形、象形或象形拓展摘取汉字的音码或形码后,再配伍该汉字的形码或音码即构成音形码或形音码。
上述的音形码包括二音一形码和二音二形码。其中二音一形码的一形是摘取每个汉字右下脚的全形或象形或象形拓展。例如:福,可摘取的二音是声F(饭F)、韵U(诬U),二形是礻(袍P)、田(酒J),其构成二音一形码为FUJ。构成二音二形码为FUPJ。
上述的形音码包括三形一音码和二形二音码。例如:福,可摘取的三形是礻(袍P)、田(酒J),一(诬U),可摘取的二音是声F(饭F)、韵U(诬U),其构成三形一音码为PJUF。构成二形二音码为PJFU。
以下实例是以键位母字编码方法在电子计算机上的应用作为例子加以说明。
键位母字三类编码方法已在IBM PC/XT、286、386等微机及其兼容机上验证运行,形成了包含有如下10种“键位母字”编码法的汉字输入系统,证明本发明具有以词为主的字、词混编功能,同时具有“通用、专用、即用”三类并用词库,并有实时自动记忆及调用功能。
实施例1:这是一种通用型输入法的实例。它具有以下列出的七种编码方法,可供用户选择使用。
提供编码汉字是“能”、“福”、“意”,其编码方法如下:
1、纯音码:(仅对汉字读音进行编码,即二码制)
能→NZ(娘镇) 福→FU(饭诬) 意→II(宜宜)
2、二形码:取每个汉字的二形组成二形码。
能→HP(胲袍) 福→PJ(袍酒) 意→LZ(拎镇)
3、三形码:取每个汉字的三形组成三形码。
能→HPN(胲袍娘) 福→PJU(袍酒诬) 意→LZC(拎镇椿)
4、音形码(1):在取纯音码后再加取该汉字的“右下”(或是“下”)的形码组成3码制(即二音一形码)。
能→NZP(娘镇袍) 福→FUJ(饭诬酒) 意→LZC(拎镇椿)
5、音形码(2):在取纯音码后再加取该汉字的前两个形码组成4码制(即二音二形码)。
能→NZHP(娘镇胲袍) 福→FUPJ(饭诬袍酒) 意→IILZ(宜宜拎镇)
6、形音码(1):在取每个汉字的三形码后,再加取该汉字读音声母(零声母则取韵)组成4码制(即三形一音码)。
能→HPNN(胲袍娘娘) 福→PJUF(袍酒诬饭) 意→LZCI(拎镇椿宜)
7、形音码(2):在取每个汉字的二形码后,再加取该汉字的纯音码,组成4码制(即二形二音码)。
能→HPNZ(胲袍娘娘) 福→PJFU(袍酒饭诬) 意→LZII(拎镇宜宜)
实施例2:这是一种适合于专业用户与特殊要求用户需求的编码方法的实例。提供取码的汉字是“能”、“福”、“意”。
8、全形4码:能→HPNP(胲袍娘袍) 福→PJUV(袍酒诬) 意→LZCU(拎镇椿诬)
9、全形5码:意→LZCUZ(拎镇椿诬镇)
10、全形6码:意→LZCUZU(拎镇椿诬镇诬)
实施例3是词组取码输入法,它非常适合于需要快速输入的情况下使用。词组取码可以采用以下编码法进行。提供汉字词组有二字词:福清、永安,三字词:福清市、大学生,四个字以上的词组:向高电脑、中华人民共和国。
1、音词码(四码制)
二字词:各取两个字的纯音码组成。例如:
福清→FUQL(饭诬琼拎)
永安→IQAF(宜琼阿饭)
三字词:取第一字纯音码和后两字的声母(零声母则取韵)。例:
福清市→FUQS(饭诬琼燧)
大学生→DAXS(跌阿鲜燧)
四字以上词组:取前三字和最后一字的声母(零声母则取韵)例:
向高电脑→XGDN(鲜狗跌娘)
中华人民共和国→ZHRG(镇胲蒻狗)
2、形词码(四码制):
二字词:依顺序摘取二字的前二形,遇单体字则补上“O”组合而成。例:
福清→(礻田、氵月)→(袍酒酒胲)→PJJH
大学→(大○、小亅)→(跌○琼阿)→DOQA
三字词:取首字的前二形(单形补O)和末二字的右下(下)形组合而成。例:
福清市→(礻田、月丨)→(袍酒胲碑)→PJHB
大学生→(大○、亅土)→(跌○阿蛙)→DOAW
四字以上的词组:取前三字和最后一字的右下(下)形组合而成。例:
向高电脑→(冂冂乚、凵)→(袍眶)→VVPK
中华人民共和国→(丨人、口)→(鲜碑胲酒)→XBHJ