音形意汉字编码法 本发明涉及一种用标准英语键盘以“读音”、“形状”、“意象”取码的编码方法。
国内目前已有汉字编码方法700多种,经检索已申请发明专利的有120多种,其中有代表性的是拼音码、五笔字型码、表型码等。尽管我国在汉字编码方法的研究方面一直处于国际领先地位,并取得了举世瞩目的成就,尽管众多的编码方法各有所长,并在一定范围内推广应用,但也存在着不同程度的弱点和缺陷:有的好学不好用,重码太多,如拼音码;有的好用不好学,要求人们去接受一些难以记忆的符号与规则,而且也有较多重码,如五笔字型码。
本发明的目的是充分吸收各种编码方法的优点,克服其不足,提供一种直观简单、易学易用、并具新意的编码方法。
本发明的目的是这样实现的:充分利用计算机的硬件资源和软件智能,充分利用汉字及标准键盘的键符的“读音”、“形状”、“意象”等多维特征,通过联想和模糊处理进行编码,从而组成一种有序的新的码元表,依据该码元表并按一定原则输入单字和词组。
一、编码
1.以音编码
按汉语拼音或英语读音编码,如G:革、几;I:衣、亦;*:辛、心。
2.以形编码
①形状相同或相近,如T:丁;U:凵、匚、冂。
②按洞(周边伸出者)如一个洞,d:夕、攵、廿;二个洞,g:巴、丑、甘;三个洞,3:臣、皿;四个洞,4:电、申、冉;五个洞及其以上者,5:曲。
③按形编码十种基本笔划。
3.以意编码
利用键符的含意编码,这是本发明最具新意之处。如_:金、羊、钅、币;!:高、音、反、了;%:占、百、分、之、多、少;@:商、业、专、用。
通过以上音形意编码的方法,组成了一个有序的普及型码元表(图1)和基本笔划键位表(图2),一共动用了标准键盘上的44个键,除26个英文字母键外,还有数字键和标准符号键。请注意,这里地上位符号键即该位的下位符号键,使用时不要同时按下“Shift”键。如用“%”键,即用“5”键。众所周知,键盘上符号之取舍与位置合理的安排是编码的关键问题之一,它既要符合击键指法规律,又要照顾用户的适应能力。同时,电脑在我国已逐步进入家庭,迫切需要同时解决易学易用和输入速度问题,而这二者又是互相矛盾的。为了提高速度,一般要求码元多,键盘上参与编码的键要多,这样又增加了学习的难度。本发明普及型码元表大胆动用了数字键和标准符号键。尽管使用了44个键,但都是常用键,在指法练习上是要顾及的,所以对击键速度影响不大。由于编码元300多个,显而易见,输入速度极大提高,和王码相比,一般单字快一键。码元多是否意味着记忆更难呢?否!因为本发明定义的码元都直观简单,用不着死记硬背,而且妙趣横生,极易掌握。
另外,对于专职录入人员,本发明设计了专业码。专业型码元表是以普及型码元表为基础,采用键符移位办法得到,即将标准键盘第一行上位键符移至第三行相对应(同格)的键位处,将第一行下位键符移至第二行相对应(同格)的键位处。个别例外,如将“+”移至“,”处,将“=”、“]”移至“Y”处,从而得专业码键盘图(图3)。由于取消了数字键参加编码,因而速度更进一步得到提高。对于专职录入人员来说,键符移位只需短时间适应,就可得心应手。
二、输入方式
汉字的拓朴结构和特征是:
①集木性,汉字由笔划集木成字块,由字块集木成整字。
②集木是有序的。
③集木是分层次的,本发明将汉字分为:
左右型 码、收、讫、……;
上下型 季、努、悲、……;
混合型 年、尺、马、……。
中文是以字为基础,以词为主体,本发明汉字输入方式分单字输入和词组输入,一般人员使用普及码易学易用,专职录入人员使用专业码更快更好。
1.单字输入
一般要求,取码顺序是先左后右,先上后下,先外后内;每个码元要求笔划最多;一字要求所取码元数最少,一字最多取码元四个(前三个及最后一个)。
特殊要求,撇优先取,洞不许拆散,不许断笔,响声提示汉字到位。
高频字编码,一般击二键到位,其方法有:
第一组,先是“/”(斜杆键),再是该字头码,如不到位,则用“/”填空,如图4所示。
第二组,先是该字头码,再用“/”填空,如图5所示。
以上办法不分普及码和专业码。以下不同的是:
①普及码,用普及码元表(图1)和基本笔划键位表(图2)取码。
只有两个码元的字,当击键结束,字不到位时,则用“[”键填空,如该字依然不到位时,继续击该字拼音首母键或首、末笔划等对应的码元键,可使其到位。因本发明具有击键容错功能,可以连击。有三个或者以上码元的字不用“[”键填空外,其它同上办法输入。
②专业码,用专业型码元表,即专业码键盘图(图3)和基本笔划键位表(图2)取码。
这里还设计了专业码首末笔划键位表(图6),其中横、竖、撇、捺、点,字型为左右型时对应标准键盘第二行的1、2、3、4、5位,字型为上下型时对应第三行,字型为混合型时对应第四行;其它钩、折、横折钩、右弯钩、左弯钩,不分字型均对应J、L、Z、C、H键位。
因此,当码元键结束后而字不到位时,依据字型(左右、上下、混合),继续按图6击首、末笔划所对应的码元键,使其到位。
如,左右型:码(stqq) 收(cdlr) 讫(iqtz)
上下型:季(lzda) 努(o.xc) 悲(nkag)
混合型:年(rdcx) 尺(p,hv) 马(hhqh)
2.词组输入
一般要求,两字词组每字取前两码;三字词组头一字取前两码,后两字各取前一码;四字词组每字各取前一码;五字以上(含五字)词组,一、二、三及未字各取前一码。
特殊要求,码元不足者用“/”代替,如父子:普及码(8XZ/),专业码(ixz/)。
本发明提供编码字典和词组库,在词组库中还装入了大量常用的经济词汇和短语,供用户方便查阅。
三、重码是如何消除的
一般认为,重码是不可逾越的鸿沟,本发明采取以下措施,取得了单字重码为零的突破。
1.采用击键容错功能消除,同上述输入方式,出现重码者,普及码用击汉语拼音首母键、首末笔划对应码元键;专业码按专业码首末笔划键位表(图6)击首末笔划对应码元键。当击对时,响声提示,汉字到位,完全实现了盲打。
2.采用简码技术消除(适用普及码)
因为普及码中,重码很少,经测试,四字一组只有一个,三字一组只有两个,而且两字一组的重码也很少,这些需要分类记住。通过拼音消除重码的有64个字(图7),取首笔划消除重码的有62个字(图8),取末笔划消除重码的有36个字(图9),按特殊情况消除重码的有27个字(图10),共189个字。因此,只要按上述各类对号入座击相应键即使该字到位。
本发明具有以下优点:
1.国标一、二级汉字库无重码,单字与词组间无重码,实现了汉字编码方法中重码为零的突破。
2.对国家规定的词组库重码率在2%以下,是一种词组重码率很低的编码方法。
3.速度快。一般击两键出现所需的汉字,三键到位,是目前最快的编码方法之一。其中,有300多汉字按正常编码尚未结束两键已到位。
4.具有容错、一字多码、击键到位以声音提示等功能,因而用户界面友好,操作方便,新老用户均可进行盲打。
【附图说明】
图1:普及型码元表
图2:基本笔划键位表
图3:专业码键盘图
图4:第一组高频字表
图5:第二组高频字表
图6:专业码首末笔划键位表
图7:普及码拼音首母消除重码表
图8:普及码首笔划消除重码表
图9:普及码末笔划消除重码表
图10:普及码特殊消除重码表
下面结合编码举例进一步说明:
如单字“老”,其普码是(a,7),因不到位,再击拼音首母键码1,所以有“老”(a,71)。其专业码是(a’u),因不到位,再加混合型首笔划对应的键码Z,所以有“老”(a’uz)。
如词组“中国共产党”,其普码是(]ok;),专业码是(yok;)。
老 骥 伏 枥,
普 码:(a’71)(5a48)(ru[f)(mjx),
专业码:(a’uz)(tari)(ruet)(mjxq),
志 在 千 里;
普 码:(a8[z)(z///)(’=[q)(u2[l);
专业码:(akag)(z///)(’’cx)(uwxz);
烈 士 暮 年,
普 码:(ld24)(=l[s)(-brb)(rd[),
专业码:(qdwr)(’qzz)([btb)(rdcx),
壮 心 不 已。
普 码:(ka[)(·l2x)(/b//)(ul[y)。
专业码:(katg)(·lwb).(/b//)(ulbl)。
中国共产党 是 领导 社会主义
普 码:(]ok;)(/y//)(3.ex)(iv..)
专业码:(yok;)(/y//)(e.ex)(qa..),
事业 的 核心 力量。
普 码:(lg2/)(/d//)(m28/)(x/bg)。
专业码:(qgs/)(/d//)(mwk/)(x/bg)。