本发明是以声韵双拼为主的,主要由四大类主体编码方法组成的汉字编码总方法叫汉码。及以汉码相关的电脑键盘装置,以及汉字编码和声韵双拼和汉语注音使用的字母符号-汉符。汉码适用于电脑打字,用汉符表示的汉字编码还可以表示汉字,可以用于汉字通讯。 汉码是由主体编码方法和附助编码方法组成。主体编码方法包括:拼音码,音首码,首尾码和声码四大类。附助编码方法包括:键面字(即高频单码字),字符及字符集,词条集,字根及字根集,次字根,音节表,高频部首,词标,不规范信号和选择方式等。
以声韵双拼为主的拼音方法是:规定在一个音节中,当iuü处在最末位置时(包括只有iuü三个单韵母的音节)叫韵母,当没处在最末位置时叫声介母,属于声母类。即当iuü表示一个音节结束时叫韵母,表示末结束时叫声介母。21个普通声母加上3个声介母,再加上一个零声母共计25个声母。规定a o e ai ei ao ou an en ang eng er12个韵母叫零韵母;规定呀耶 腰 忧 烟 因 央 英8个韵母叫i类韵母;规定哇 窝 歪 威 弯 温 汪 翁8个韵母叫u类韵母;规定约冤晕拥4个韵母叫ü类韵母;再加上iuü三个韵母共计35个韵母。规定声韵双拼简称双拼,汉语注音简称注音;规定拼音字母的个数是指双拼字母或注音字母中,声母或韵母的个数。如果用声母、韵母共键的键盘,在以一个韵母做音节时,对于iuü三个韵母,前面分别加iuü声介母;对于零韵母,前面加零声母;对于i类韵母,前面加i声介母;对于u类韵母,前面加u声介母;对于ü类韵母,前面加ü声介母。汉码的分类与排列顺序是bpmf,dtnl,gkh,jqx,zh ch sh r,zcs,零声母,iuü,aoe,ai ei ao ou,an en ang eng,er,呀 耶 腰 忧,烟 因 央 英,哇 窝 歪 威,弯 温 汪 翁,约 冤 晕 拥,共57个。以上是用逗号把各组隔开的。在键盘上,如果想改变上述的排列顺序,尽量不打乱各组内字母的排列顺序,而是整个组地提前或错后,整组地合并或分离。
与汉码相关的电脑键盘装置分中式和西式两大类。键盘上还设有结构键,笔划键,学习键,模糊键,声调键,字词键和词标键等。西式键盘又分标准键盘,改良键盘和改扩键盘三小类。标准键盘又分顺口合并键盘和整组合并键盘两种;改良键盘也分顺口合并键盘和整组合并键盘两种;改扩键盘分单韵母键改扩键盘,大排行改扩键盘和小排行改扩键盘三种。中式键盘分大键盘、中键盘、小键盘三小类。大键盘又分全能键盘,注音键盘和双拼键盘三种;中键盘又分模排与纵排两种;小键盘也分横排与纵排两种。
汉码的标准键盘和标准西文键盘上的西文字母完全相同,有一部分拼音字母与西文字母相对应,见图1。把AWE键分别定为zh,ch,sh健,这是按zh ch sh r整组字母从左到右的顺序安置的。把O键定为零声母键,把lvy键分别定为iuü键,把v键定为字词键。把ai,ei ao ou,an en ang eng两组韵母依次安排在第二排由S到L的8个字母键位中。标准键盘和改良键盘的顺口合并键盘都确定了en与呀同键,u与拥同键,u与哇同键,er可以和任何非零韵母同键。标准键盘类和改良键盘类地顺口合并键盘都规定按顺口易记规律排列的威弯温,汪歪因分别与约冤晕,腰耶因同键。余下的五个韵母按烟 忧 央 英 翁的顺序排列。标准键盘类和改良键盘类的整组合并键盘都规定了:哇窝歪威分别与约冤晕拥同键,弯温汪翁分别与烟因央英同键。呀与en同键,er可以和任何非零韵母同键。
改良键盘是在标准西文键盘原有26个字母键位的范围内,按汉码声韵双拼所规定的排列与分组顺序重新进行排列,见图2。不打乱整组内的顺序,并使同一组的字母都安排在同一行中。声母基本上按自上到下的顺序逐行排列,韵母基本上按从下到上的顺序逐行排列。并使26个西文字母正好每键分配一个。zh ch sh分别与aoe同键,zh ch sh r整组地被移到iuü组后面去。第一行10个字母键分别是:b威约(哇约),p弯冤(窝冤),M温晕(歪晕),f汪腰(威拥),d歪耶(弯烟),t因(温因),n烟(汪央),L忧(翁英),W零央(耶),V字词。第二行9个字母键分别是:g ai,k ei,h ao,j ou,q an,x呀en(呀),z ang,c eng,s英er(腰)。第三行7个字母键分别是:i,u拥,Yü哇,zh a,ch窝o,sh e,r翁(忧)。对于标准键盘和改良键盘去掉上面括号内的韵母以后剩下的内容为顺口合并改良键盘。如果以括号内的韵母取代不带括号的iuü类韵母之后,就变成了整组合并改良键盘。见图1和图2。
改扩键盘是把标准键盘上局限在26个字母键范围内的双拼字母扩大到37个有下标符号的键位中(数字键和屏幕拷贝键除外),即在这37个键位上都可以安排双拼字母,与双拼字母相对应的26个西文字母(包括V和W)的位置安排得比较集中。如果从标准键盘QAZ三键位的左侧,RFV三键位的右侧,ik<键位的右侧和=]~键位的右侧位置分别画四条曲线的话,就将键盘上的键位分成了三大框,这四条曲线叫框线。在同一框内,每行只填一组拼音字母,同框每组的开头字母都在框的同侧,且紧挨着框线从左向右依次排列。使同框内的排头字母对齐,排行第二的字母也对齐。单韵母改扩键盘每键只安排一个韵母。它的第一行12个拼音字母键分别是:b呀,p耶,m腰,f忧,d约,t冤,n晕,L拥;g哇,k窝,h歪,[威。第二行12个拼音字母键分别是:j烟,q因,x央,w零英;zh a,ch o,sh e,R;z弯,c温,s汪,]翁。第三行在三个框内的10个字母键分别是:i,u,Yü,V字词;;ai,"ei,~ao,<ou;>an,?en。以上同大行但不同框的字母用分号隔开。数字键0右侧的两键依次是:-ang,=eng。第三行左框开头i键左侧的键位是er,见图三。如果把拼音字母iuü分别拆分出声介母iuü和韵母iuü来,且三个声介母分别独占一键,就会方便注音的输入。例如对于上述单韵母改扩键盘,如果把iuü拼音字母键改成iuü声介母键,把分离出的iuü韵母键分别安置在dtn三个键位上,再把约冤晕拥四个韵母分别移到gkh[四键中,就得到了一个大排行改扩键盘,见图,框线用双线标出。
如果把zh ch sh r组前移到dtnL组的后面,然后再按顺序先往左框中由上到下安置各组,每组占一小行,后往中框中安置,最后往右框中安置。这就得到了小排行改扩键盘,见图4。前移的目的是使四个一组的三组声母键可齐整地放在同一框中,使三个一组的三组声母键也能齐整地放在同一框中。小排行改扩键盘左框的三小行字母是:b呀,p耶,m腰,f忧;d烟,t因,n央,L英;zh a,ch o,sh e,r。中框的三小行字母是:g哇约,k窝冤,h歪晕,w零威拥;j弯,q温,x汪,?翁;zi,cu,sü,v字词。右框的三小行是i,U,Yü,[;:ai,v ei,~ao,]ou;<an,>en。上面各小行之间用分号隔开。
中式大键盘是在标准西文键盘的基础上,把26个字母键增加到63个,并重新进行排列,包括空格键在内共分成7排,每排安排十个字母键。其它各类型键仍然保留,只是在位置上有些改变。空格键相当于8个键的宽度,其上下各有三行字母键,上部共分成三个矩形框,左框为四个字母一组的声母框,即4×3框,中框为三个字母一组的声母框,即3×3框,右框为3个字母一组的声介母和韵母框。在同一框中,各组同一序号的字母全对齐。右框第三行最末一个键位E的右邻键位是耶。空格键下部也分成三框,这三框的第一行除了最右端为ong以外,其余的都是零韵母。而在第二、三行,左框为i类韵母,中框为u类韵母,右框为u类韵母。空格键的右侧为零声母键,左侧为字词键。字母键的第三排左框的第三个字母键即sh键标上西文字母V,右框第一排的第一键标上W。在字母键上面的一排为十个数字键,字母键的左右侧各为两列符号键,其中相似或对称的符号键放在相邻的位置。以上所述的中式大键盘共分三个层次,第一层次是在空格键以上,是含26个西文字母的键盘。第二个层次是在字母键第五行以上,是为能实现注音方案的拼音字母,叫做注音键盘。第三层次是在下面又增加了两行20个iuu类韵母后,就得到一个能便利全拼、注音、双拼的全能键盘。全能键盘每键只有一个拼音字母,且声母和韵母不同键。如果在注音键盘的上左框的各行中,从上到下依次填入呀耶腰忧,烟因央英,约冤晕拥。在上中框的第一行中依次填入哇窝歪;在第二行左键填弯,右键填威;在第三行依次填入温汪翁。就得到了一个双拼键盘,见图5。
模排中键盘和模排小键盘是:如果只取中式全能键盘空格键上方的左框和中框,在中框下面再增加一个第四排,依次填上iuü声介母。并且使iuü韵母分别与zcs同键,a(o窝)e耶四个韵母分别与zh ch sh r同键,ai ei ao ou分别与dtnL同键,an en ang eng er ong分别与b T m f g k同键。西文字母Y填在u键上。在左框的下面也增加一个第四排,依次填入VW零声母和空格键四个键。这样就得到了一个能键入汉语注音方案且中西兼容的新键盘,叫做横排中键盘。见图8如果把上述键盘右框的第二、三、四排的字母顺次上移一排,并去掉VW两个字母键,并且使在中文上档状态时,汉语注音字母的诸键中分别有V W j q x各西文字母的大小写键和其它一些符号键。这就得到了一个适用于小型电脑的新键盘,叫做横排小键盘,见图9。
纵排中键盘和纵排小键盘是:如果把横排中键盘两框内各组均改为纵向排列,就得到了一个四行七列的新键盘。在第一列的最下边再增加一键,把零声母和er移到此键中,把空格键放到第四列的第四键上,把V放在第五列的第四键上,把W放到第六列的第四键上。这样的新键盘叫做纵排中键盘,见图6。如果把上述键盘右框中的第二、三、四列分别顺次左移一列,并去掉V W两个字母键,并且使在中文上档状态时,注音字母的诸键中分别有j q x v w各字母的大小写键和其它一些符号键,这样又得到了一个新键盘叫做纵排小键盘,见图7。
也就是说,在同矩形框内往各行或各列先填入的各组的字母(一般指声母)个数均相同。若各组均横向排列,则各组同序号的字母均纵向对齐。若各组均纵向排列,则各组同序号的字母均横向对齐。
声调键分别用六个符号键表示。用“-”表示一声,用“=”键表示二声,用“[”键表示三声,用“]”键表示四声,用“;”键表示轻声,用“””键表示用户分不清的声。也就是说,汉码设有用户分不清声调的键。
笔画键是:用数字键1表示汉字是1笔划或零笔画,由2到0共9个数字键分别表示由2到10的9种笔划。符号键-、=、[、]分别表示汉字由11到14的四种笔划。符号键“;”表示15画和15画以上的笔画。符号键“"”表示用户记不清的笔画。也就是说,汉码设有记不清笔画的键。对于音首码和首尾码来讲,笔画数是指一个汉字去掉部首之后所剩下部分的笔画数。对于只由一个字根组成的汉字,它的笔画数为零笔画。对于声码来讲,笔划数是指包括部首即整个汉字的笔画数。
汉码设有六种结构键。凡汉字的外层为横结构,后一部分为纵结构的叫横纵结构,简称横,用“-”键键入。例如“骑”字,它的外层由“马”和“奇”两部分横向组合而成,它的后一部分“奇”是由“大”和“可”两部分纵向组合而成,所以叫横纵结构。凡外层为横结构,后部分为非纵结构的汉字叫横非纵结构,简称非,用“=”键键入。例如“驯”字,它的外层为横向结构,而它的后一部分“川”不是纵向结构,所以叫横非纵结构。凡外层为纵结构的叫纵结构,用“[”键键入。凡外层由“囗”形围成的,或整个字是一个交插在一起结构的,或由单笔画形成的字统称单结构,用“]”键键入。凡外层为非横、非纵、非单结构的叫杂结构,用“;”号键键入。凡用户分不清到底是属于哪种结构的,用“"”号键键入。也就是说,汉码设有用户分不清或记不清到底是属于哪种结构的结构键。
汉码设有学习键。凡用户键入了不规范方法,出现了不规范信号后,或选中了不规范重码字词后,或选中了容错的编码字词以后,或键入了模糊键之后,再键入学习键,系统将发出规范的信号,供用户纠错、学习、提高。例如把连续键入“””和“~”两键当做学习键。
汉码设有模糊键。先对键入汉字编码的未完成态做进一步分类是:把只差在提示行上对重码进行选择时的未完成态叫做选择未完成态,把除去选择未完成态之外的未完成态叫做一般未完成态。在一般未完成态时,键入“?”键表示模糊键。在完成态时,连续键入“””和“?”两键表示一个汉字的第一码为模糊键。也就是说,对于在完成态和一般未完成态,模糊键用不相同的键表示。也就是说,对于由用一键输入容易产生二义性的一个信息,用非常规搭配的两键连续输入来表示键入这一个信息,能避免或减少产生二义性。
除了中式小键盘以外的汉码键盘,都设有数字和字母两种键面字,即高频单码字。一种是十个数字键面字,它们的笔画数分别与十个数字键的数值相对应。它们是:一人大中生地这国就时。有两种键入方式,一种是只用键面字所在的键一键键入,叫数字不加字词键键面字另一种是先按键面字所在的键,再按字词键共用两键键入。叫数字加字词键键面字这两种输入方法可用菜单方式进行选择。字母键面字共25个,它们分别是:不平民发,的他你了,个可和,及起小,主产是日,子次三,二,以我于。其中“二”字是零声母所对应的键面字。它们都用与这个字的声母所对应的键和字词键两键键入。
汉码设有2千字左右,4千字左右,7千字左右,1万2千字左右,2万字左右,共5个固定的字符集。大的字符集包含小的字符集。还设有在某几个字符集的基础上用户可以增减字符而形成几个新字符集的功能。还设有用户可以自定义数个新字符集的功能。还设有用户可以改变高频字词及其排列顺序的功能。对上述的几个字符集,用户可以用菜单的方式进行选择。上面所设立的2千字字符集是专为初小学生和扫盲设立的。
如果键入某个汉字编码之后在本字符集内没有符合本编码的汉字,则汉码软件会自动地扩大字符集,在扩大了的字符集范围内搜寻。如果在键入某个汉字编码之后,虽然显示出了符合本编码的汉字,但不是用户所需要的汉字,这时用户可以按“扩大字符集”键,则电脑将在扩大了的字符集范围内搜寻所需要的那个汉字。即汉码设有自动扩大字符集和人为地扩大字符集两个功能。
汉码设有4万左右,8万左右,15万左右三种固定的词条集,大的词条集包含小的词条集。还设有可以自定义的数个词条集的功能。还设有在以上某种词条集的基础上用户可增减词条的功能。对上述各种词条集,用户可以用菜单方式进行选择。
汉码配备有音节表,用韵母作列标,其顺序是:零韵母,iuü,i类韵母,u类韵母,ü类韵母。用声母作行标,其中零iuü四个声母共占第一格,以下各格依次为b p m f d t n l g k h j q x zh ch sh r z c s。把声母和韵母相拼所成的音节填到相应的格子中去。汉码给每个字根都赋予一个音,再把赋了音的字根填到音节表相应的格子中去。有的音节格子填入的字根多,特别是填入了高频字根时,这种音节叫密音节。有的音节格子填入的字根少,甚至没有字根,这种音节叫疏音节。为了减少重码,给字根赋音时尽量赋予疏音节的音。对有些有习惯音的字根,可以改变它的习惯音,而赋予它疏音节的音。以字根“尸”为例,如果给它赋“shi”的音,填到音节表中“shi”的格子中,因在这一格子中将填入“矢、史、氏、世”等多个高频字根,就会造成了密音节。如果把“尸”的字根音改成“mei”,也就是给字根“尸”赋予“mei”这个音,把字根“尸”填到“mei”这个音节格子中去,就会使音节表中字根的分布比较均匀一些了。为了便于记忆,把同音节中某几个字根组成一组,用括号括起来,叫字根组。有时还在字根的旁边加一个助记的关系字词或符号,并在这个关系符下面划一条横线作标记。例如可以把同在音节“mei”中的两个字根“”和“尸”组成一组,用括号括起来,并在括号外加注一个下面标有横线的关系符“眉”字。
在音节表中,除了有四百多个能拼成音节的格子以外,还闲置着几百个不能拼成音节的格子。如声母为“f”,而韵母分别为呀 耶 腰 忧的四个双音节格子。我们把在一笔画为湾折笔型的诸多字根中,都为顺时针的湾折笔型字根赋予双音节的音为“f呀”,把都为逆时针的湾折笔型字根赋予双音阶的音为“f耶”,把第一个湾为顺时针而第二个湾为逆时针的多湾笔型字根赋予双音阶字根音为“f腰”,把第一个湾为逆时针而第二个湾为顺时针的多湾笔型字根赋予双音节的字根音“f忧”。已经赋予其它字根音的湾折笔型字根除外。见表1。
汉码设有可以动态选择的四个字根集。音首码、首尾码、声码三大类编码方法设有四种字根集。大字根集基本上包含小的字根集,特别是在字根的形状方面。320个左右字根的字根集叫普及字根集,550个左右的字根集叫提高字根集,700个左右的字根集叫做专业字根集,最后一个叫做无重码字根集。它是在专业字根集的基础上再增加少量的字根,把一部分造成重码的字根改变字根音,对少数重码字改变字形,再对某些重码字人为地规定编码,从而达到无重码的目的。无重码字根集分两类,一类是可对4千个左右常用汉字实现无重码,另一类对6千多个汉字实现无重码。对以上数种字根集,用户可用菜单方式进行选择。表1是提高字根集音节表,其中带有“”标记的是普及字根集,带“-”标记的是助记的关系符号。
汉码设有次首根和次尾根两种次字根。它们的定义是:次首根(次尾根)是:假如一个字根是由明显两部件组成,且删去后边(前边)的部件后剩下的部分仍为字根,则剩下的部分为次首根(次尾根)。假如一个字根只由一个部件组成,设法把这个字根拆成两部分,必须使前(后)一部分为字根,这时把后(前)一部分删掉,剩下的前(后)部分为次首根(次尾根)。如果某个字根为一笔画,那么它的次首根、次尾根和这个字根相同。对于不易拆分的字根,其次首根,次尾根将被统一规定出来。如果一个字根有多种拆分法,特规定如下拆分原则:1、在多个拆分法中,能获得大的次字根的方法优先。2、根据公众公认的习惯组合拆分法去拆分的优先。3、拆分出的两部分均为字根的优先。也就是说,汉码按照某种规律把一个字根去掉一笔画或数笔画或一个部件之后所剩下的部分来表示这个字根的某个信息。如按字根的书写顺序去掉前1笔或数笔或前部件,或去掉后一笔或数笔或后部件。
把一个字拆成字根的方法。声码是:基本按书写顺序逐个拆分,如果存在着多种拆分方法时,按顺序能拆分出大的优先。音首码是:首字根拆出大的优先。当一个汉字本身为一个字根时,次首根是它的首字根。首尾码是:首字根拆出大的第一优先,尾字根拆出大的第二优先。当一个汉字本身为一个字根时,这个汉字就是首字根,这个汉字的次尾根是尾字根。
汉码的高频部首是:选出宀氵木扌石土女亻(辶廴)口火钅犭忄竹虫山日足艹纟讠王月阝共25个高频部首,分别安排在其字根音的声母与之对应的b p m f d t n l g k h j q x zh ch sh r z c s i u ü和零声母共25个声母键上。其中,赋予部首“氵”的字根音是po,其对应声母是p,赋予部首“石”的字根音是dan,其对应的声母是d。规定把字根“辶”和“廴”组成一组,合起来当做高频部首,赋予它们的字根音是guò。赋予字根“阝”的字根音是a,它对应的声母是零声母,并且把左耳刀“阝”规定为高频部首,安排在零声母键上,见图5。也就是说,汉码选出若干个高频部首,按照某些规律,分别安排在若干个键上。例如每键安排一个,或每键安排数个,又例如在若干个声母键范围内安排,或在26个字母键范围内安排,或在有下标的若干个键中安排等等。
汉码有两种输入词的办法,一种是用四键输入一个词,不加词标,另一种是加词标。有如下几种加词标的办法:第一种是在第五键时以字词键为词标,即相当于不加词标输入词的各种编码方法再分别在第五键时键入字词键。第二种是在第三键时以字词键为词标,表示键入的词为二字词,即相当于不加词标输入词的诸多方法分别在第三键时键入字词键。第三种是在第三键时键入由1到0共10个数字键为词标。其中数字键1表示二字词第一个字的外层为横结构。数字键2表示二字词第一个字的外层为非横结构。数字键3、4、5分别表示三字词、四字词、五字及五字以上字词。6、7、8、9、0分别表示二字词第一个字为一声、二声、三声、四声和轻声。当要用第三键键入词标时,要把原不加词标时编码方法的第一、第二键键入后,再键入词标键,而原第三键和第四键要顺延到第四键和第五键时键入。当声码用笔画键时,不能用数字键为词标。第四种是前三码和不加词标键入词时相同,第四码键入字词键即结束,共用四码。对上述的几种加词标的办法之间,用户不必增加键数,就可以变换选用各种词标法,即不必切换,也不必用菜单等方式选择。
当用不加词标的方法输入词时,声码是:对于二字词,第一个字部首的声母为第一码,尾根的声母为第二码,取第二字部首的声母为第三码,尾根的声母为第四码。对于三字词,取第一个字首字根的声母为第一码,尾字根的声母为第二码,第二个字和第三个字首字根的声母分别为第三码和第四码。如果其中某一个汉字只由一个字根组成,并且涉及到上述的尾字根的声母时,就以次尾根的声母代替。对于四字词,四个码分别为四个字首字根的声母。对于五字和五字以上的词,前三码分别为前三个字首字根的声母,最后一码为最后一个字首根的声母。
当用不加词标的方法输入词时,音首码是:对于二字词,第一个字的声母为第一码,韵母为第二码,第二个字的声母为第三码,韵母为第四码。对于三字词,第一个字的声母为第一码,韵母为第二码,第二字和第三字的声母分别为第三码和第四码。对于四字和四字以上的词,按先后顺序依次取前三个字和最末一个字的声母为码。上述方法也适用于双拼。
当用不加词标的方法输入词时,首尾码是:对于二字词,第一字首字根的声母为第一码,尾字根的声母为第二码,第二个字首字根的声母为第三码,尾字根的声母为第四码。对于三字词,先分别取第一个字首字根和尾字根的声母为第一、第二码,再分别取第二、第三个字首字根的声母为第三、第四码。当某字只由一个字根组成时,上述的“尾字根的声母”改用“次首字根的声母”代替。对于四字词,按先后顺序分别取四个字的首字根声母为四个码。对于五字和五字以上的词,分别取前三个字和最末一个字首字根的声母为第一、第二、第三和第四码。
拼音码包括:1全拼,2注音,3双拼,4双拼+声调,5双拼+结构,6双拼+声调+结构。音首码包括:1音+首,2音+首(包括高频部首+声调),3音+首(包括高频部首+笔画)。首尾码包括:1首+尾,2首(包括高频部首+笔画)+尾。声码包括:当不足四码时,有下列6种处理方法。1加空格键,2加空格键和次字根,3加结构键,4加结构键和次字根,5加笔画键,6加笔画键和次字根。
音+首的编码方法是:第一码是汉字的声母,第二码是韵母,第三码是部首字根的声母,第四码是部首字根的韵母。音+首(包括高频部首+声调)的编码方法是:如果要输入的汉字的部首不属于高频部首,那么它和音+首的编码方法相同;如属于高频部首,那么它的前三码和音+首的编码方法相同,第四码是这个汉字的声调。音+首(包括高频部首+笔画)的编码方法是:如果不属于高频部首,那么它和音+首的编码方法相同;如果属于高频部首,那么它的前三码和音+首的编码方法相同,第四码是除去部首后剩下的笔画数。对于只由一个字根组成的汉字,上述的首字根用次首根代替。
首+尾的编码方法是:第一码是部首的声母,第二码是部首的韵母,第三码是末尾字根的声母,第四码是尾字根的韵母。首(包括高频部首+笔画)+尾的编码方法是:如果要输入汉字的部首不属于高频部首,它的编码方法和首+尾的编码方法相同;如果属于高频部首,那么它的第一、三、四码和首+尾的编码方法相同,第二码是这个汉字除去部首后剩余部分的笔画数。
对于只由一个字根组成的汉字,上述的尾字根用次尾根代替。
声码的编码方法是:第一码取汉字首字根的声母,第二码取第二个字根的声母,第三码取第三个字根的声母,第四码取尾字尾的声母。如果某个汉字不够四个字根,有如下六种不同的处理方法。1、加空格键的处理方法是:若不足四码时,只加空格键即结束。2、加空格键和次字根的处理方法是:若不足四码时,先加空格键,若连同空格键已够四码了则终止,若不够四码则再键入次尾根,若此时已凑够四码了,则结束,若还不够时,再键入次首根即结束。3、加结构键的处理方法是:若不够四键时,则键入结构键即结束。4、加结构键和次字根的处理方法是:若不够四键时,则键入结构键,若此时已够四键了则结束。若还不够四键时,则键入次尾根,若此时已够四键了则结束。若此时还不够四键,则键入次首根即结束。5、加笔画键的处理方法是:若不够四键时,则键入笔画键后即结束。6、加笔画键和次字根的处理方法是:若不够四键时则键入笔画键,若此时已够四键了则结束,若还不够四键时,则键入次尾根。若此时已够四键了则结束,若还不够四键,则键入次首根即结束。
汉码所设的不规范信号有两个含义。一个是表示用户键入的方法不规范,例如在提示行,把规范的提示显示在“|”号的左侧,把不规范的提示显示在“|”号的右侧,即把“|”号当做不规范信号。另一个是表示容错。例如,当用户在编码中键入了6画后,系统将在提示行把凡是符合本编码6画的汉字显示在“|”号的左侧,把不是6画的显示在右侧,且5画和7画的显示在前,随后显示4画和8画后,再随后显示3画和9画的……。即只有笔画不同的且符合本编码的汉字都能得到显示。只不过放在不规范信号的右侧,且接近规范笔画的容错汉字排在前面,远离规范笔画的容错汉字排在后面。基于上述的容错功能,非专业用户在键入笔画键时只需把估计的笔画数键入即可。结构键或声调键也有类似上述的容错功能。即凡符合精确编码的显示在提示行“|”号的左侧,凡只有结构键或声调键不同的编码其容错汉字显示在“|”号的右侧,且接近结构键或声调键精确编码数值的排在前面,远离的排在后面,所以对于非专业用户只需键入估计的结构键或声调键即可。
在选择方式方面,汉码把要选择的项目按变换选择的频繁程度(即频率)分成三张菜单,第一张为14种键盘菜单,见表4。第二张为辅助编码方法,内分词标、键面字、词条、字根、字符五大类菜单,见表3。每大类分别选出一小类做为当前状态。上述两张菜单均属于不常用菜单,均放到次级菜单中。第三张为常用菜单,放在主菜单中,见表2。内分拼音、音首、首尾、声码四大类编码方法,这四大类连同键盘和辅助编码方法共6大项,用数字编序,相当于主菜单。每大类又分若干小类编码方法,上述四大类共包括17小类编码方法,这17小类用字母排序,相当于次级菜单。汉码是将这两张菜单合放在一张菜单中且显示于一张屏幕上,菜单下面设有“7”选数字键和“R”选字母键。当按R键后,系统就进入了选字母状态,这时可在每大类编码方法中,选一小类作为本大类唯一的候选代表。四大类共可选出四个候选代表。当按数字7以后,系统就进入了选数字状态。这时就可从1-4四个数字中选中一个数字,这个数字对应的大类中那个候选代表就成了当前的编码状态。也可以用复合键切换(或其它切换方式)从四个候选代表中选中一个做为当前编码状态。
汉符的定义是:存在着一个固定的几何图形叫轮廓基型,简称基型。构成基型的n个元素的不同组合可组成C1n+C2n+……+Cnn个图形。设由这些图形组成的集合是全集,如果用其子集的元素表示某类符号,这个子集就叫做某类汉符集,其元素就叫某类汉符。例如存在着一个“”字几何图形叫基型,构成“”字的7条线段的不同组合可组成C17+C27+……+C77=127个图形,设由这些图形组成的集合是全集,如果用其子集{}的元素表示十个数字符号,这个子集就叫做数字汉符集,其元素就叫做数字汉符。也就是说,每个汉符的几何形状必需包含在其基型的图形之中。如果我们从上述的全集中按中国双拼习惯特点选出60个元素作为双拼字母符号,我们把这种符号叫做中式汉符。如果再从余下元素中选21种表示中式键盘中除了60个双拼字母和十个数字之外的其它符号,我们把这种符号叫做键盘汉符。如果按中西兼容的条件从上述的全集中选出60个元素,作为双拼字母符号,我们把这种符号叫做兼容汉符。在兼容汉符中有26个可以表示英文字母,把这26个可以表示英文字母的符号叫做英文汉符。在表5中,26个英文字母横向对应的兼容汉符叫英文汉符。在每个英文汉符的上面再增加一横,就得到了各自对应的大写英文汉符。同样的道理,可以创造出诸如俄文汉符,日文汉符,……。即用汉符可以表示世界上的多种字母和符号,从而可以简化、统一和规范世界文字字母符号和其它类型的符号。组成“”字的7条线段有6个交点,如果以这6个交点组成的几何图形“”为基型,从这6个点元素中每次取若干个点进行组合,而形成C16+C26+……C66=63种图形符号,对应着63种状态,再从这63种符号中选60种表示盲文中的拼音字母,叫做盲文汉符。如果在图形“”的正中间加一点,就得到了一个新的基型,再从这新基型所包含的各种几何图形中选10个表示10个阿拉伯数字,叫做盲人数字汉符。同理,也可以发明出盲人键盘汉符,见表5。
用汉符表示的无重码的或重码极少的汉码,特别是带有汉字音和形义等信息的音首类型汉码,可以表示或代替汉字。这种用汉符表示的汉字可以单独应用,也可以和方块字混合使用。在混合使用时,常用字用汉符表示,不常用字用方块字表示。
用汉符表示的无重码或重码极少的汉字编码可以用在电报和无线寻呼机等的通讯上,可通过三种形式进行寻呼通讯。第一种是寻呼者通过电话用语言把信息传给寻呼台,寻呼台把语言翻译成用汉符表示的汉字编码,或翻译成根据寻呼机的持有者自选定的汉字编码及表示符号后,再把这个信息发给寻呼机的持有者。第二种是寻呼者通过电话配备的能键入汉字编码的键盘,把信息以汉字编码的形式传给寻呼台。寻呼台经过加工,翻译成用汉符表示的无重码或重码极少的汉字编码,或翻译成根据寻呼机携带者自选定的汉字编码及表示符号后,再发给寻呼机的携带者。第三种是寻呼者通过能键入汉字编码的键盘把用汉符表示的无重码或重码极少的汉字编码发给寻呼台,寻呼台把收到的信息不经过任何翻译和加工直接转发给接收者。
建议用易显示易机读的汉符表示的拼音字母取代现行的汉语拼音和注音字母,不提倡汉语拼音,使之逐渐被淘汰。小学以注音为主,用横排中键盘,中学以双拼为主,用双拼键盘或小排行改扩键盘。对普通话不熟悉者,建议先学声码,再学首尾码,后学音首码和拼音码,从而使打字应用的过程也同时成为促进推广普通话的过程,即边应用边学普通话,即汉码有利于统一语音。建议以用汉符表示的音首码和拼音码等逐步代替汉字。这种用汉符表示的汉字可以和方块字混合使用,最适合应用在速成扫盲非重要文件等领域中,有利于提高全民族的文化水平。即汉码有利于汉字改革。如果全世界的文字符号都采用汉符来表示,那将为统一世界文字打下基础。
表2 主菜单
1.拼音 A 全拼
B 注音
C 双拼
D 双拼+声调
E 双拼+结构
F 双拼+声调+结构
2.音首 G 音+首
H 音+首(高频+声调)
I 音+首(高频+笔画)
3.首尾 J 首+尾
K 首(高频+笔画)+尾
4.声码 L 空
M 空+次根
N 结构
O 结构+次根
P 笔画
Q 笔画+次根
5.辅助编码方法
6.键盘
7.选数字 R.选字母 S.退出
两张次级菜单
表3 表4键盘
词标 键面字 标准
A 无词标 L 数字不加 A 顺口合并
B 有词标 字词键 B 整组合并
改良
词条 M 数字加 C 顺口合并
字词键 D 整组合并
C 4万 字符 改扩
D 8万 N 2千 E 单韵母键
E 15万 O 4千 F 大排行
G 小排行
F 增减 P 7千 大
H 全能
G 自定义 Q 1万2千 I 注音
字根 R 2万 J 双拼
H 320 中
I 550 S 增减 K 横排
J 720 T 自定义 L 纵排
小
K 无重码 U 高频字词 M 横排
及顺序 N 纵排
V 退出 O 退出