非国家标准汉字字符编码输入技术 非国家标准汉字字符编码输入技术属于计算机文字处理技术领域。
非国家标准汉字字符如标点符号、图形符号、西文字符、字母及数字上下标、化学方程式、字根及压缩拼音声韵母等在文字处理中和国家标准汉字占有同样重要的位置。然而,在目前几乎所有的输入法中,都只解决了单纯的国标汉字输入的问题,非国标字符只采用区位和换档输入,这给文字处理尤其是数学、物理、化学试卷的输入打印带来很大的不便,比如要打印
这两个化学方程式就要反复换档和设置上下标十多次,真是不胜其烦。如果不经换档能够直接输入这些西文字符和上下标,将会大大加快输入速度,使文字处理变得十分轻松。
非国家标准汉字字符输入技术采用编码的方式解决了这一技术难题,它将国标字符集中所有标准图形符号和自造字根、数字和字母上下标等图形符号纳入编码之中,实现了汉字、词组及各种非标准汉字字符的完全不换档输入,弥补了各种输入法中非汉字字符不能进行编码输入的不足,为使用提供了极大的方便,使各种输入和编辑排版变得十分轻松。
非国家标准汉字字符输入技术的内容如下:
1.以“'”开头,和各字母、符号键配合,可在半角下直接输入全角方式下标点符号和图形符号,半角数字、小数点和中文标点混合输入无须换档;
2.以“,”开头,配合主键盘数字键右下方的字母和符号键可输入粗线、细线和粗细线组成的各种制表符。
3.以“;”开头,加上主键盘数字键右下方对应的第一排字母键即可输入三种1-10的序号;加上主键盘右下方的第二排字母键即可输入两种11-20的序号及I-X的罗马数字。
4.以“\”开头,加上主键盘数字键右下方对应的字母和符号键的组合即可直接输入数字上下标,无须进行任何设置即可直接打印输出,所见即为所得;
5.以“]”开头,和字母键配合可直接输入相应的大小写字母作下标;
6.以“/”开头,和字母键配合即可输入全角方式下的大小写英文字母、由大小写字母组合成的复合元素符号和以词组方式编码的化学分子式;
7.以“[”开头,配合相应的字母键可输入和该字母象形地相应的希腊字母;
8.以“\”开头,按下任一字母键即提示该键上相应的五笔型的所有字根;
9.对于不足四码的汉字在出现提示字后只需加一“;”即可输入相应的叠字。
10.除为了方便小数点的输入未在“.”键上定义其它符号外,其余每个标点符号键上均定义了2-4个标点符号,这些符号和全角下的中文标点大致相同。
非国家标准汉字字符输入技术提供了多项方便实用的新功能,采用编码的方式解决了各种图形符号的输入难题。这些编码可以挂接到任何一种输入法中,和单纯的汉字输入法相互补充,弥补了各种输入法中非汉字字符不能采用编码输入的不足,使文字处理变得轻松愉快。
非国家标准汉字字符输入技术的具体实施方案如下:
一、西文字符、序号、标点符号的输入功能的添加
1.用WPS下的N功能编辑为西文字符、序号、标点符号编码文件bd.wps,格式为UCDDOS5.0经反编译的文本文件格式,即
编码(4个字节)+空格(8个)+图符
标点符号就用该标点所在的键及其重复组合编码,需要按Shift转换的标点可将该键重复一次,如
; ; / 、
;; : // ?
数字键上面的符号可用“'”加上该数字右下方对应的字母键编码,如
′q ! ′e #
′w @ ′r
图形符号可用“'”加上和图符象形的字母键编码,相同符号则将该字母重复一次为相应的实心符号,如
′a △ ′c ℃
′aa ▲ ′cc
1-10的序号用“;”加上相应数字键右下方的第一排字母键编码,11-20和罗马数字I-X用“;”加数字键右下方对应的第二排的字母键编码,如
;q 1. ;a 11.
;qq (1) ;aa (11)
;qqq (-) ;aaa I
全角方式下的英文字母用“/”加上相应的字母作为小写英文字母的编码,将字母键重复一次作为大写字母的编码,如
/a a
/aa A
希腊字母可用“[”加象形的英文字母作为大写字母编码,英文字母重复一次作相应小写字母的编码,如
[w Ω
[ww ω
按这种方法,给所有标点、序号、西文字母及图符编码。
2.调用Foxbase,建立一个数据库文件bd.dbf,该数据库文件含三个字段,
字段名 BM KG BD
字段宽度 4 8 2
将bd.wps转换成数据库文件db.dbf,排序到wbbd.dbf中,再转换成文本文件wbbd.wps。具体命令如下:
APPE FROM BD.WPS SDF 将编码文件添加到数据库DB.DBF
SORT TO WBBD ON BM 将记录按BM字段排序到WBBD.DBF中
USE WBBD 打开已经排序的数据库文件WBBD.DBF
COPY TO WBBD.WPS SDF 将已排序的数据库转换成文本文件
3.利用UCDOS 5.0的万能输入法编码管理器将五笔型的输入模块wb.imd反编译成文本文件wb.wps,即
imdmng wb.imd wb.wps
用wps的N功能编辑该文本文件:先在码元表一项加上“[]\;′,./”,再用读文件命令将已经排序的wbbd.wps文件读到正文中后,存盘退出wps。
4.将以上编辑好的wb.wps文件编译成wb.imd文件,即
imdmng wb.wps wb.imd
退出UCDOS后重新加载,你即可在半角方式下不经任何换档操作输入你所加入的各种标点符号、序号、图形符号和西文字母。
二复合元素符号、化学分子式及数字、字母上下标输入功能的添加
在实际应用中,常常会遇到如Cl、Ca等元素符号及数字、字母、化学方程式中的化合价等的输入,比如要输入以下两个一个化学方程式:
输入时要进行十多次换档操作,编辑时也要反复设置上下标+多次,真是不胜其烦,化学分子式不能作为词组输入的最大障碍就是没有解决数字和字母的上下标输入问题,在此,笔者采用造字的方法圆满的解决了这一难题。这种方法制作起来虽然略嫌麻烦,但可谓一劳永逸。
1.造出所需的字符在UCDOS 5.0中,先用轮廓造字程序MKPS.EXE造出所有的由大小写字母组成的复合元素符号约60个、数字下标0-99共100个、数字上标0—20及-1—-20共41个、化合价+—7+及—7-共14个、大小写字母下标共52个,分别以各种字体存入8770以后的区位码表中,并且生成16点阵的显示字库。由于自动生成的16点阵显示字库往往模糊不清,甚至只能显示出一个墨团,因此还需调用MKHZ.EXE点阵造字功能分别加以修饰后,才能显示得清晰美观。
2.将所造的元素符号、上下标收集到五笔型的编码字典中以“/”加上元素符号的大小写字母作为将所造的元素符号的编码;以“\”加上数字键对应的右下方的字母键的组合作为上标及化合价符号的编码,其中“-”对应“[”,“+”对应“]”,为了不造成重码,上标是正数时可在字母前加上“]”,单个数字的下标可在字母前加上“\”;大写字母下标为相应字母前加“]”,将相应的字母重复一次作小写字母下标的编码。试举例如下:
元素符号: Na /na Cl /cl
数字上标: 3 \]e -3 \[e
数字下标: 3 \\e 33 \ee
字母下标: w ]wx ]x
3.按添加标点符号功能中的2-4的步骤把所收集的字符添加到编码字典WB.IMD中,重新启动UCDOS,你就可按定义的方法输入上下标和元素符号。
4.给化学分子式编码有了上下标和复合元素符号,就可以按给词组编码的方式为化学分子式编码,为了避免和词组重码,编码可以“/”开头,取分子式的大写字母编码,大写字母多于三个的只取第一、二、末字母。试举例如下: NaCl /nc NaHCO3 /nho
5.将编码添加到WB.IMD中。
三五笔字型字根的在线提示功能的添加
在五笔型的130多个字根中,除了几十个本身就是汉字外可以直接编码外,大多数字根都是一些偏旁部首,不能直接编码和显示,这些字根只有通过造字的方法解决,由于使用在线提示,没有必要打印,可直接利用MKHZ.EXE点阵造字程序,只造16点阵的显示字库,不必存入24点阵的打印字库中,或者直接存入16区以前的区位码表内自动生成24点阵打印字库,这样将大大减轻工作量。编码时以“\”开头,加上单个字母,然后将每个字母上的字根放在一起,按汉字重码编码的格式编成文本(即每个字根后面留一个空格,再打第二个字根),其格式如下:
\i 水 氵小
将编码添加到编码字典文件中,经编译后再重新加载,按下“\”和单个字母键即可以重码的形式提示相应键上的字根,其显示方式如下:
半角 【五笔】\i 1:水2:3:4:5:氵6:7:8:小9:
四如何将其它编码词典中的新输入功能加载到自己习惯的输入法中
要完全自己动手制作一套功能全面输入法并非十分容易,至少要花费大量的时间和精力,而现在的某些输入法中已配备了一些特殊的功能,但这些输入法并不是我们都希望学习和习惯使用的,我们往往希望把某种输入法中的特殊功能加载到自己习惯的输入中,这样既避免了大量的重复劳动,又可以不花时间去学习新的输入法,真可谓是“一箭双雕”。笔者就是先自己编创了输入功能完善的“声型码”,然后把这些功能添加到五笔型中的。下面就以此为例说明新功能的添加过程:
1.将具有新功能的编码字典SX.OVL和欲添加功能的编码字典WB.IMD分别反编译成文本文件SX.WPS和WB.WPS;
2.用WPS的N功能调出具有新功能的文件SX.WPS,找到以标点开头的特殊编码,用块写命令^KW将这部分编码写到另一个文件XGN.WPS中,存盘退出;
3.调出欲添加功能的文本文件WB.WPS,用读文件命令^KR将XGN.WPS读到正文末,将光标移到文件开头,将特殊功能编码中用到的“【”、“]”、“\”、“;”、“'”、“,”、“/”等七个符号添加到“码元表”中,存盘退出;
4.将WB.WPS译成WB.IMD文件;
5.将UCDOS.BAT中调用五笔型输入法的命令改为“LIMD WB”。
退出UCDOS后重新加载,即可使用这些新的输入功能。