中文归真输入法.pdf

摘要
申请专利号：	CN94103113.6	申请日：	1994.03.23
公开号：	CN1094171A	公开日：	1994.10.26
当前法律状态：	撤回	有效性：	无权
法律详情：	\|\|\|\|\|\|公开
IPC分类号：	G06F3/023	主分类号：	G06F3/023
申请人：	叶冠卿;
发明人：	叶冠卿
地址：	056031河北省邯郸市滏河大街144号
优先权：
专利代理机构：	河北省邯郸专利事务所	代理人：	郭斌恒
PDF下载：	PDF下载

内容摘要

中文归真输入法，属于一种计算机输入方法，是以词为主，以字为辅，以音定词，以词定字。采用万能提示行和动态改词法等技术，使词组输入简单、快速、扩充方便。单字编码由音、形两部分构成，音码采用改进双拼方案，形码完全回避字中的表音部分，并完全以音代形，使记忆量和重码率均接近最低限度。是一种能用电脑取代书写的输入技术。

权利要求书

1：一种计算机汉字输入方法，以双拼为基础，使用26个英文字母对汉字和词组进行编码，其特征在于：提示行以词组为主，分层提示；动态造词在提示行中进行；单字全码为：全码=音码+形码音码=本字声码+本字韵码形码=义码+补码其中：声码：声码用一个字母表示；全拼方案中的声母y，w，yu分别由i，u，v表示；zh，ch，sh分别由a，w，y表示；字母e作为无声母汉字的虚拟声母；其它声码与全拼的声母相同，韵码：韵码用一个英文字母表示；可采用任何双拼方案的韵母码。义码：将汉字拆分成首尾两个部分，首部按“正向取大”原则拆分，尾部按“逆向取大”原则拆分，(1)若首部不是本字的表音部分，则取首部读音的声码，简称首码，作为义码；(2)若首部是本字的表音部分，则回避首部，不在首部取义码，改取尾部读音的声码，简称尾码，作为义码，补码：(1)若本字中没有表音部分，则取尾码作为补码；(2)若表音部分为合体字，则取该部分中不表音的子部分的声码作为补码；(3)若表音部分为独体字，则改取表义部分中的韵码作为补码。
2：一种中文输入方法，称为“万能提示行法”;适用于所有中文计算机键盘输入系统;其特征是：以词为主导，逐级提示高频词组，提示词组的同时也认为提示了词中单字;用数字键选取词中第一个单字，称为“选字键”;用符号键选取词组，符号键“;′，./[”分别对应于序号为“123456”的词组，“空格”键对应于0号位的词组，称为“选词键”;“Ctrl+选字键”选取词中第二单字，Alt+“选字键”重复选取词中第一字，Alt+“选词键”重复选取词组。
3：一种中文输入方法，称为“动态改词法”;适用于所有中文计算机键盘输入系统;“动态改词法”由“动态造词”和“动态删词”两个部分组成，其特征是：动态造词：先输入词组编码，若该词组不存在，则键入一功能键，进入造词状态;此时，提示行中汉字外码之前的位置空出，作为造词区，再逐个输入词中字或词，自动依次放到造词区中，词组长度超出造词区时，所有的字左移，最前面的字顶出，当前输入的字挤入;输入完毕后，键入造词结束键。该词自动存入词库和内存中，同时提示行返回正常状态，并将该词放置在其它同码词组之后，动态删词：先输入词组编码，再进入造词状态，直接键入所要删除的词组之前的序号，就可以删除该词组，同时提示返回正常状态。
4：一种汉字输入方法，与“权利要求书1”兼容，以全拼为基础，使之与双拼兼容，称为“全拼兼容法”，适合于所有以音为基础的编码;其特征在于：输入任一全拼码时，均提示对应的高频字或词;输入声母之后，若输入的外码不是全拼韵母码，则自动认为该码是双拼韵母码;输入至少一个韵母码之后，若输入的外码不是韵母的一部分时，自动认为韵母码已经输入完毕，并将该码作为形码处理;当韵母已经结束，而输入的形码与原韵母码可以构成另一韵母时，应先输入韵母结束键“空格”，再输入形码;词组输入时，其理亦同。

说明书

本发明属于中文计算机输入技术，是一种以拼音为基础、以词组为主导的中文输入方法。
    目前，中文输入方法多达一千种以上，可以分成：拼音码、拼形码和音形结合码三大类。拼形码不仅记忆量大，而且需要先写出文稿才能输入，只有专业打字员才能熟练掌握，电脑只能作为誊写工具，远远不能满足普及的要求。拼音码极易学习和掌握，并且也能听想式输入，但由于没有解决同音字的重码问题，输入速度很慢，而且不能输入不认识的字，不能满足高速输入的要求。现有音形结合码主要有“自然码”、“音子码”、“栗氏编码”、“萧码”等，遗憾的是，这些编码都在不同程度上表现出古板、牵强、规律性差、肢解汉字、编码不完善等缺陷，并且都不是真正以词组为主的输入方法。申请号为92113155.0的发明“析音码”虽然建立了“取大原则”和“回避原则”，还对难认字和难拆字进行了单独编码，但没有全程回避，也不是以词组提示为主的输入方法，并且还没有解决全拼码和双拼码的兼容问题。

    本发明的目的在于：建立完全以词为主的概念，既能以词定字，又能以字定词，词组动态扩充;全拼与双拼兼容为一体，使拼音不准的人也能自我纠正;形码中完全回避字中的表音部分，使重码率控制在百分之一以内，完全消除单字编码中的废码;完全以音代形，使记忆量达到或接近最低限度。真正达到易学、高速、听想输入之目的，使电脑真正成为中文创作的工具，让所有会说普通话的人都能直接使用电脑书写文字。

    本发明的目的是这样实现的：以改进后的双拼方案为基础，分层提示，采用“万能提示行”实现词组与单字的同时提示和选择;动态改词在提示行中进行;单字编码采用“析音码”的取大原则、回避原则、难字编码等方法，但完全回避表音部分;全拼与双拼兼容。下面结合实例作详细介绍：

    一、本发明中的拼音码

    在本发明中，单字编码和词组编码都是由拼音码构成，拼音码分成双拼码和全拼码两种，其中地全拼码与普通汉语拼音完全相同，双拼码在前人的基础上进行了重大改进，现述说如下：

    1、声码

    为了使声母码（简称声码）自然、规范、重码低、无二义性，本发明的声码按如下规则编码：

    （1）、普通声母码

    汉语拼音的声母bpfmdtnlgkhzcsr与英文字母同形，其声母码即为对应的英文字母。声母zh，ch，sh分别以英文字母a，w，y作为声母码;由于在j，q，x之后的韵母都是复韵母，并且韵元都是i，本编码码中一律将韵元省略：

    zh<＝＝＝＝a    ji<＝＝＝＝j

    ch<＝＝＝＝w    qi<＝＝＝＝q

    sh<＝＝＝＝y    xi<＝＝＝＝x

    （2）、虚拟声母

    虚拟声母专门针对无声母汉字编码。汉语拼音方案中，无声母汉字有单韵母和复韵母两大部分。

    单韵母的无声母汉字共有a，e，o三部，本编码一律以e作为其虚拟声母，虚拟声母不发音，仅作为无声母的标志，加韵母之前。即：

    a-ea    e-ee

    ai-eai    en-een

    an-ean    eng-eeng

    ang-eang    er-eer

    ao-eao    o-eo

    ou-eou

    复韵母的无声母汉字共有i，u，ü三部，汉语拼音方案中分别写成y，u，yu，并将其后的单韵母作相应的调整。本编码分别以i，u，v作为其虚拟声母，其后的单韵母不变。

    i    <==ii    u    <==uu    ü    <==vv

    ia    <==ia    ua    <==ua    üe    <==ve

    ie    <==ie    uo    <==uo    üan    <==van

    iao    <==iao    uai    <==uai    ün    <==ven

    iou    <==iou    uei    <==uei    üeng    <==veng

    ian    <==ian    uan    <==uan    iong    <==veng

    in    <==ien    uen    <==uen

    iang    <==iang    uang    <==uang

    ing    <==ieng    ueng    <==ueng

    这样，所有的汉字都具有了声母码，拼音的规范化、统一化得到了进一步的加强，并排除了拼音输入时声母的二义性和韵母的多种输入。

    2、韵码

    汉语拼音中，韵母共有33个，除a，e，i，o，u，ü外，其它韵母均由两个或两个以上的字母组成，本发明均以一个英文字母代替之，简称韵码。由于英文中仅有26个字母，故一些字母要同时代表几个韵母。无韵母时，统一在声母之后加上i。本发明的韵码可采用任何双拼方案韵母码，但默认的韵码是“析音码”的韵母方案，仅uo和ou的对调。具体安排如下：

    二、万能提示行

    以提示词组为主，以提示单字为辅。同时实现单字与词组的提示和选取。由于现代汉语主要以词组为主，词组的使用频率和词组的数量又远远大于单字，所以以提示词组为主比较科学、比较实用。方法是：

    仅在0号位提示一个单字，1～6号位提示词组。用数字键提取单字，称为“选字键”;使用“空格;，./[”提取词组，称为“选词键”;两者对应关系为：

    选词键    选字键

    空格    0

    ;    1

    '    2

    ,    3

    .    4

    /    5

    [    6

    直接按“选字键”选取词中第一个单字，“Ctrl+选字键”选取词中第二单字;“Alt+选字键”重复选取第一单字，“Alt+选词键”重复选取词组。

    智能提取：输入四码后无重码时，自动选取该字或词组;有重码时，则在输入下一字的编码时，自动提取最前面的词组或单字，词组与单字同码时，词组优先。

    如想输入一个可以的“复”字，我们必须输入“复”字的声母码fu，这时提示行出现：

    半角    析音（叶码）：fu    0复    1负责    2父母    3夫妻    4妇女    5肤浅    6俯视

    数字0123456    分别提取“复    负    父    夫    妇    肤    俯”

    Ctrl+0123456分别提取“复    责    母    妻    女    浅    视”

    符号;'，./[分别提取“负责    父母    夫妻    妇女    肤浅    俯视”

    空格键    选取0号位的词组或汉字

    三、本发明的词组编码

    在本编码中，词组与单字混和输入，以音定词，以词定字，分层提示：

    1、二字词

    ①第一个字的声母（单声简码词组）

    本系统中有大量的简码词组，这些简码词组主要都是二字词，提示行中除了提示一个简码单字外，还提示六个简码词组。这样一级简码词组就有26×6＝156个。

    “我们”二字就可以输入“我”字的声母w，提示行中提示“我们”，只要使用选词键即可输入“我们”。

    ②第一个字的声母和韵母（单音简码词组）

    汉语拼音中声母和韵母的组合共有四百多个，也就是说共有四百多个音，但常用的仅有390个左右，在本系统中，单音简码词组共有2300个左右。

    如“合适”可以输入“合”字的拼音he，提示行中即出现“合适”二字，使用选词键即可输入“合适”。

    ③第一个字的声母和第二个字的声母（双声简码词）

    当双声简码不是一个拼音码时，可以使用两个字的声母作为词组的编码，否则应以单音简码优先。

    ④两个字的声母和韵母（双音词组码-全码）

    二字词全码是双音简码，即第一个字的声母和韵母，再加上第二个字的声母和韵母。

    如“可以”二字词的全码是“可”字的声韵二码ke，再加上“以”字的声韵xw二码，其全码为keyi。

    2、三字词

    ①三个字的声母

    ②三个字的声母加尾字的韵母。

    3、四字以上词

    前三个字的声母加尾字的声母。

    四、动态改词法

    动态改词法是指在输入词组的过程中，用户发现所输入的词组不存在或不必要存在时，可以随意修改的一种方法。用户不仅可以动态造词，还可以动态删词;只要内存允许，可以无限增加词组。

    1、动态造词。

    输入词组的编码后，如果提示行中没有出现所要的词组，则说明词组库文件中没有该词组。此时，使用造词功能键则可进入词组建立状态，提示行中汉字外码之前的位置空出，作为造词区，再逐个输入词中字或词，自动依次放到造词区中，词组长度超出造词区时，所有的字左移，最前面的字顶出，当前输入的字挤入;输入完毕后，应使用造词结束键退出造词状态，该词自动存入词库和内存中，同时提示行返回正常状态，并将该词放置在其它同码词组之后。

    举例：动态建立词组“不入虎穴，焉得虎子”

    首先，输入“不入虎穴”四个字的声母brhx作为“不入虎穴，焉得虎子”的代码，提示行为：

    半角    析音（叶码）：brhx

    提示行中没有任何汉字或词组，表明该代码为空码（不为空码时也同样可以添加词组）。表明“不入虎穴，焉得虎子”词库中和内存中都不存在，此时可以使用动态造词功能将它变成词组。造词前需使用造词功能键将当前的输入状态转换成造词状态。造词功能键是：

    Shift+F2→进入造词状态

    按下Shift+F2后，即进入造词状态：

    造词：    ：brhx

    接着再逐个输入“不入虎穴，焉得虎子”中的每一个汉字和标点，所输入的汉字字符不出现在文本行，而是出现在提示行的造词区。如输入“不”字后，提示行会变成：

    造词：不    ：b    0不    1必须    2并且    3本来    4不但    5不仅    6包括

    造词区仅有五个汉字字符的位置，同时只能提示五个汉字字符，当超过五个汉字字符时，整个造词区左移一个汉字位，第一个汉字字符会被挤出造词区，但实质上被挤出的汉字并没有消失，而只是暂时隐藏起来了，请看本例，输入五个汉字字符时，提示行为：

    造词：不入虎穴，：xwg    0穴

    再输入“焉”字：

    造词：入虎穴，焉：yjvy    0焉

    “不”字被从造词区挤走，其它汉字左移，右边腾出一个位置，“焉”字就挤进造词区了，直至输入词组中的所有汉字：

    造词：，焉得虎子：zi    0子    1自然    2自由    3自信    4资金    5资源    6姿态

    词组中的汉字输入完毕后，计算机并不知道造词完毕，所以此时应告诉计算机，该退出造词状态了，退出造词状态与进入造词状态一样，也是使用功能键Shift+F2

    Shift+F2→退出造词状态

    按下Shift+F2后，提示行返回文本输入状态，出现原来输入的词组代码，所造词组也出现在提示行中。同时，还将该词组送到词组库文件中。请见本例：

    半角    析音（叶码）：brhx    0不入虎穴，焉得虎子

    以后，“不入虎穴，焉得虎子”就可以按词组输入了。

    特别要注意的是，造词时，如果词组代码中已有一个单字和词组，则该单字或词组会自动输入到文本文件中，此时我们仍可以使用造词功能键建立另一个词组，即使同码词组多于六个，也同样可以建立自造词组。

    2、动态删词

    在造词状态下，直接键入数字键，则删除对应的词组。

    举例：删除词组“不入虎穴，焉得虎子”，首先输入brhx，提示行为：

    半角    析音（叶码）：brhx    0不入虎穴，焉得虎子

    此时，按下Shift+F2键进入造词状态：

    造词：    ：brhx    0不入虎穴，焉得虎子

    再键入数字0，提示行变为：

    半角    析音（叶码）：brhx    0

    词组“不入虎穴，焉得虎子”从提示行中消失，同时也删除了词库中的“不入虎穴，焉得虎子”。提示行中保留数字0，是为了表示刚刚删除了一个词组。

    五、归真析音码

    本发明的单字编码是归真析音码，以“析音码”的拆分原则和回避原则为基础，对汉字中的表音部分进行全程回避。

    归真析音码的全码由四码组成，以双拼为基础，使用26个英文字母对单个汉字进行编码，其全码为：

    全码＝音码+形码

    音码＝本字声码+本字韵码

    形码＝义码+补码

    其中：声码和韵码是双拼码，已在一、二部分中介绍。

    1、字根的编码

    在本发明中，汉字拆分成首尾两个部分，首部按正向取大原则拆分，尾部按逆向取大原则拆分。首部的编码称为“首码”，尾部的编码称为“尾码”。拆分后的字根的编码为该字根的声母码。字根共有三大类：子字、偏旁部首、基本笔画。汉字的拆分方法和标准偏旁部首的规定都采用“析音码”的规则，仅标准偏旁部首的代码作一点变动。见下表：

    标准字根编码表

    2、取义码

    义码是单字的第三码，取汉字中的表义部分的声码作为编码，以区分同音汉字，绝大部分汉字可在三码以内唯一确定。

    根据析音码的拆分规则：将汉字拆分成首尾两个部分，首部按“正向取大”原则拆分，尾部按“逆向取大”原则拆分。汉字的首尾两个部分都是给汉字表音或表义的，少量汉字仅有表义部分。由于同音字很多主要原因是：字中含有表音部分，所以表音部分的声码就失去了区分同音字的意义，是废码;因而本发明的义码要对表音部分进行回避。义码的取码方法是：

    （1）若首部不是本字的表音部分，则取首部读音的声码，简称首码，作为义码。

    （2）若首部不是本字的表音部分，则回避首部，不在首部取义码，改取尾部读音的声码，简称尾码，作为义码，

    如：“汉字编码”的首部“氵宀纟石”都不是本字的表音部分，故直接取它们的首码d，g，s，y作为义码。又如：“架裂鸦顶”等字的首部“加列牙丁”都是本字的表音部分，应回避首部，改取尾部“木衣鸟页”的声码m，i，n，i作为义码。

    3、取补码

    补码是单字的第四码，以区分读音相同、义码也相同的汉字。取补码后，国标一、二级字库中的同码汉字仅有60个左右。补码的编码方法如下：

    （1）若本字中没有表音部分，则取尾码作为补码。

    （2）若本字中含有表音部分且表音部分为合体字时，取该部分中不表音的子部分的声码作为补码;首部表音时正向取补码，尾部表音时逆向取补码。

    （3）若本字中含有表音部分并且表音部分为独体字时，取表义部分中的韵码作为补码。

    如：“国务委员”不含表音部分，故直接取它们的尾部“玉力女贝”的声码v，l，n，b作为补码。又如：“想频梅花”的表音部分分别为“相步每化”，故取它们的子部分“木止母匕”作为补码。再如：“诽腓霏鲱”的表音部分“非”为独体字，故取其表义部分的“讠月雨鱼”的韵码j，e，v，v作为补码。

    六、全拼兼容法

    全拼兼容法是一种使全拼和双拼完全兼容的输入方法，适用于所有双拼码、音形结合码，是一种十分实用的全拼码和双拼码的学习方法，使拼音不准确的人员也能在输入过程中自我纠正。

    输入任一全拼码时，均提示对应的高频字或词;输入声母之后，若输入的外码不是全拼韵母码，则自动认为该码是双拼韵母码;输入至少一个韵母码之后，若输入的外码不是韵母的一部分时，自动认为韵母码已经输入完毕，并将该码作为形码处理;当韵母已经结束，而输入的形码与原韵母码可以构成另一韵母时，应先输入韵母结束键“空格”，再输入形码;词组输入时，其理亦同。

    如：输入“晨”字，先输入c，提示行为：

    半角    析音（叶码）：c    0此    1曾经    2此时    3从此    4才能    5错误    6采取

    用户可以发现，“晨”字的声母不与“此”等字相同，应再按h

    半角    析音（叶码）：ch    0出    1充分    2成立    3出现    4彻底    5超过    6常常

    再输入en

    半角    析音（叶码）：chen    0陈    1陈述    2沉浸    3趁机    4衬托    5尘土    6臣民

    可以看出拼音输入正确，应再输入“晨”中“日”的声码r：

    半角    析音（叶码）：wfr    0晨    1趁热

    此时，前面的全拼码自动转化为双拼码。由于字母r不能与chen构成另一拼音，所以自动认为拼音码输入完毕，字母r是形码。如果输入chen后，再输入g，则会认为g是韵母的一部分，构成拼音cheng，如果要输入“宸”字，其全拼是chen，其形码是g，如果在输入chen后，直接输入g，则会认为输入的是拼音cheng，故应在输入chen后输入一个空格键表示拼音输入完毕，再输入g，就不会混淆了。

    词组输入时，可以将第二字的拼音码如形码一样处理。

    七、补充说明

    1、本发明的学习码可以采用“析音码”的基本码

    2、循环翻页键是]，万能学习键是\

    3、难认字和难拆字的编码均与析音码相同。

    本发明的特点：

    1、由于仅使用拼音对汉字和词组编码，且全拼与双拼兼容，使记忆量达到最低限度。

    2、由于词组和单字可以同时提示和选择，使输入速度空前提高，并可以直接在电脑上创作文稿。

    3、单字编码简单易学，完全符合汉字的本义，消除了废码，并使重码率仅为百分之一，完全可以盲打。

    4、词组动态扩充和删除极为简便，并与文本输入完全兼容。

    5、由于采用了“析音码”的难认字和难拆字输入技术，使不认识和难于分解的汉字也极易输入，编码全面完善。