计算机汉字泛拼音编码输入法 本发明属于计算机汉字信息处理技术领域,涉及汉字拼音编码的优化及其输入方法。
汉字拼音码作为明码,在输入操作应用上优于其他编码。存在的问题是重码太多。究其原因,主要在于只拼音不拼调,音调分离的编码方法。这是一种不符合汉语音调结合固有属性特征的不完全拼音编码。这种编码在用字符键盘输入时,不得不多次多种类操作,从而影响其实用价值。
本发明的目的是改进只拼音不拼调的拼音编码方法,提供一个符合汉语音调结合固有属性的汉字完全拼音编码,操作更为方便,字词兼容实用的计算机汉字输入技术。
本发明根据对汉字形、音、调属性有关理论的研究,认为用于对汉字拼音编码的拼音字母及其组合在赋予拼读音及分类的同时,重要的是也应赋予声调属性,并加以分类。换句话说,应以汉语的声调类为模对拼音字母及其组合再一次分类。那么,在这些具有汉语语音属性的拼音字母及其组合所组成的有限集合上定义相应的抽象代数运算,使其拼音字母及其组合有序地排列,有机地组合,转变为既拼音又“拼”调的汉字完全拼音编码—汉字泛拼音编码。它是一种拼音字母集上有序组编码,由这些以单音节形式与汉字对映的编码,易于编制多音节形式的词码。这是一个抽象代数系统。通过这个系统,具有汉语音、调属性的字母集上有序组集与一定容量地汉字集各元素之间形成一一对映。因些,它是一个汉字编码模型;不同于笛卡尔积集这样的汉字编码模型。
在拼音字母及其组合上赋予汉语音、调类,本发明认为不应该是随意的,应根据汉字形、音、调与汉语音对映演变规律构拟,以拼音字母的汉语音、调构拟为前提进行构拟。其声调宜分为四类,本发明用数字符号0、1、2、3、分别表示阴平、阳平、上声和去声。轻声作为词汇,语法现象处理。这些通过构拟、赋予汉语音、调类属性的拼音字母,辅音字母及其组合以及元音字母及其组合,组成本发明汉字泛拼音编码的码元。后附本发明的码元表。其中,部分字母及其组合被赋以多种音、调类属性,以使其充分发挥编码作用。另外,还规定字母e具有使前置的拼音字母读其字母读音,两个拼音字母按反切拼音的作用,而其本身不参与拼读发音。
本发明在上述拼音字母及其组合有限集或称为本发明的码元集上定义两种抽象代数运算,以确定码元的排序,拼读音与“拼”调类:
1)乘法运算;以辅音字母及其组合在前,元音字母及其组合在后排序,其间拼读成音,按声调类乘法运算表“拼”调类。
2)加法运算;以元音字母及其组合在前,辅音字母及其结合在后排序,按元音字母及其组合读音,而辅音字母及其组合只有音位而不参与拼读,其间按声调类加法运算表“拼”调类。
声调类运算表:
I、声调类乘法运算表 II、声调类加法运算表
× 0 1 2 3 + 0 1 2 3
0 0 0 0 0 0 0 1 2 3
1 0 1 2 3 1 1 2 3 0
2 0 2 0 2 2 2 3 0 1
3 0 3 2 1 3 3 0 1 2
由上述抽象代数系统形成的拼音字母及其组合的有序排列是以元音字母及其组合为主的单音节形式,其排列形式有四类:
1)、单独元音字母及其组合类,
2)、辅音字母及其组合在前而元音字母及其组合在后排序类,
3)、元音字母及其组合在前而辅音字母及其组合的在后排序类
4)、辅音字母及其组合,元音字母及其组合与辅音字母及其组合的复合排序类。
在第二类排序里,允许两个拼音字母与元音字母e排序,规定用反切拼音;拼读时第一个字母用其辅音,而第二个字母用其隐含的元音;元音字母e作为反切拼音符号,不参与拼读,它反映汉字反切拼读的历史,也是本发明的命名为汉字泛拼音编码的第二个重要原因。
本发明编码范圈可随着码元数量的增大而扩大,以适应进一步不同的需要。但是,为了提高汉字输入效率,对于同音同义字(繁体、异体字),部分同音异义字,本发明采用相应的功能键通过变换程序的方法实现以同码输入。
编码实例及其说明:
1)mam(妈);为第四类排序单音节字(词)编码,其读音由m、a拼读,而其声调类据本发明声调类运算表mam=0×3+0=0为阴平调。所以,当读mā·ma
3)ta(它),tye(他),txe(她);参与排序的字母虽然有所不同,但都可拼读为tā。
本发明的优点是:
1)本发明的汉字泛拼音编码,采用全拼形式,属于明码,易学易记,方便实用。
2)由于本汉字泛拼音编码方案所具有的与相应容量的汉字集间的良好对映性,可用于改进汉字排序与检索系统。
汉字泛拼音编码码元表I、拼音字母码元表字母Aa Bb Cc Dd Ee Ff Gg Hh Ii Jj Kk Le Mm读音ei bi xi di yi fu ge he yao ji kei liao mou调类0 1 2 1 1 3 3 1 0 3 0 2 0字母 Nn Oo Pp Qq Rr Ss Tt Uu Vv Ww Xx Yy Zz读音 en wo pi qu er si ti you wei wei cha ya zi调类 2 2 3 3 1 3 0 2 1 0 0 0 2II、辅音字母及其组合码元表III、元音字母及其组合码元表