中文归真输入法.pdf

上传人:xia****o6 文档编号:659621 上传时间:2018-03-02 格式:PDF 页数:16 大小:641.24KB
返回 下载 相关 举报
摘要
申请专利号:

CN94103113.6

申请日:

1994.03.23

公开号:

CN1094171A

公开日:

1994.10.26

当前法律状态:

撤回

有效性:

无权

法律详情:

||||||公开

IPC分类号:

G06F3/023

主分类号:

G06F3/023

申请人:

叶冠卿;

发明人:

叶冠卿

地址:

056031河北省邯郸市滏河大街144号

优先权:

专利代理机构:

河北省邯郸专利事务所

代理人:

郭斌恒

PDF下载: PDF下载
内容摘要

中文归真输入法,属于一种计算机输入方法,是以词为主,以字为辅,以音定词,以词定字。采用万能提示行和动态改词法等技术,使词组输入简单、快速、扩充方便。单字编码由音、形两部分构成,音码采用改进双拼方案,形码完全回避字中的表音部分,并完全以音代形,使记忆量和重码率均接近最低限度。是一种能用电脑取代书写的输入技术。

权利要求书

1: 一种计算机汉字输入方法,以双拼为基础,使用26个英文字母对汉字和词组进行编码,其特征在于:提示行以词组为主,分层提示;动态造词在提示行中进行;单字全码为: 全码=音码+形码      音码=本字声码+本字韵码      形码=义码+补码 其中: 声码:声码用一个字母表示;全拼方案中的声母y,w,yu分别由i,u,v表示;zh,ch,sh分别由a,w,y表示;字母e作为无声母汉字的虚拟声母;其它声码与全拼的声母相同, 韵码:韵码用一个英文字母表示;可采用任何双拼方案的韵母码。 义码:将汉字拆分成首尾两个部分,首部按“正向取大”原则拆分,尾部按“逆向取大”原则拆分,(1)若首部不是本字的表音部分,则取首部读音的声码,简称首码,作为义码;(2)若首部是本字的表音部分,则回避首部,不在首部取义码,改取尾部读音的声码,简称尾码,作为义码, 补码:(1)若本字中没有表音部分,则取尾码作为补码;(2)若表音部分为合体字,则取该部分中不表音的子部分的声码作为补码;(3)若表音部分为独体字,则改取表义部分中的韵码作为补码。
2: 一种中文输入方法,称为“万能提示行法”;适用于所有中文计算机键盘输入系统;其特征是: 以词为主导,逐级提示高频词组,提示词组的同时也认为提示了词中单字;用数字键选取词中第一个单字,称为“选字键”;用符号键选取词组,符号键“;′,./[”分别对应于序号为“123456”的词组,“空格”键对应于0号位的词组,称为“选词键”;“Ctrl+选字键”选取词中第二单字,Alt+“选字键”重复选取词中第一字,Alt+“选词键”重复选取词组。
3: 一种中文输入方法,称为“动态改词法”;适用于所有中文计算机键盘输入系统;“动态改词法”由“动态造词”和“动态删词”两个部分组成,其特征是: 动态造词:先输入词组编码,若该词组不存在,则键入一功能键,进入造词状态;此时,提示行中汉字外码之前的位置空出,作为造词区,再逐个输入词中字或词,自动依次放到造词区中,词组长度超出造词区时,所有的字左移,最前面的字顶出,当前输入的字挤入;输入完毕后,键入造词结束键。该词自动存入词库和内存中,同时提示行返回正常状态,并将该词放置在其它同码词组之后, 动态删词:先输入词组编码,再进入造词状态,直接键入所要删除的词组之前的序号,就可以删除该词组,同时提示返回正常状态。
4: 一种汉字输入方法,与“权利要求书1”兼容,以全拼为基础,使之与双拼兼容,称为“全拼兼容法”,适合于所有以音为基础的编码;其特征在于: 输入任一全拼码时,均提示对应的高频字或词;输入声母之后,若输入的外码不是全拼韵母码,则自动认为该码是双拼韵母码;输入至少一个韵母码之后,若输入的外码不是韵母的一部分时,自动认为韵母码已经输入完毕,并将该码作为形码处理;当韵母已经结束,而输入的形码与原韵母码可以构成另一韵母时,应先输入韵母结束键“空格”,再输入形码;词组输入时,其理亦同。

说明书


本发明属于中文计算机输入技术,是一种以拼音为基础、以词组为主导的中文输入方法。

    目前,中文输入方法多达一千种以上,可以分成:拼音码、拼形码和音形结合码三大类。拼形码不仅记忆量大,而且需要先写出文稿才能输入,只有专业打字员才能熟练掌握,电脑只能作为誊写工具,远远不能满足普及的要求。拼音码极易学习和掌握,并且也能听想式输入,但由于没有解决同音字的重码问题,输入速度很慢,而且不能输入不认识的字,不能满足高速输入的要求。现有音形结合码主要有“自然码”、“音子码”、“栗氏编码”、“萧码”等,遗憾的是,这些编码都在不同程度上表现出古板、牵强、规律性差、肢解汉字、编码不完善等缺陷,并且都不是真正以词组为主的输入方法。申请号为92113155.0的发明“析音码”虽然建立了“取大原则”和“回避原则”,还对难认字和难拆字进行了单独编码,但没有全程回避,也不是以词组提示为主的输入方法,并且还没有解决全拼码和双拼码的兼容问题。

    本发明的目的在于:建立完全以词为主的概念,既能以词定字,又能以字定词,词组动态扩充;全拼与双拼兼容为一体,使拼音不准的人也能自我纠正;形码中完全回避字中的表音部分,使重码率控制在百分之一以内,完全消除单字编码中的废码;完全以音代形,使记忆量达到或接近最低限度。真正达到易学、高速、听想输入之目的,使电脑真正成为中文创作的工具,让所有会说普通话的人都能直接使用电脑书写文字。

    本发明的目的是这样实现的:以改进后的双拼方案为基础,分层提示,采用“万能提示行”实现词组与单字的同时提示和选择;动态改词在提示行中进行;单字编码采用“析音码”的取大原则、回避原则、难字编码等方法,但完全回避表音部分;全拼与双拼兼容。下面结合实例作详细介绍:

    一、本发明中的拼音码

    在本发明中,单字编码和词组编码都是由拼音码构成,拼音码分成双拼码和全拼码两种,其中地全拼码与普通汉语拼音完全相同,双拼码在前人的基础上进行了重大改进,现述说如下:

    1、声码

    为了使声母码(简称声码)自然、规范、重码低、无二义性,本发明的声码按如下规则编码:

    (1)、普通声母码

    汉语拼音的声母bpfmdtnlgkhzcsr与英文字母同形,其声母码即为对应的英文字母。声母zh,ch,sh分别以英文字母a,w,y作为声母码;由于在j,q,x之后的韵母都是复韵母,并且韵元都是i,本编码码中一律将韵元省略:

    zh<====a    ji<====j

    ch<====w    qi<====q

    sh<====y    xi<====x

    (2)、虚拟声母

    虚拟声母专门针对无声母汉字编码。汉语拼音方案中,无声母汉字有单韵母和复韵母两大部分。

    单韵母的无声母汉字共有a,e,o三部,本编码一律以e作为其虚拟声母,虚拟声母不发音,仅作为无声母的标志,加韵母之前。即:

    a-ea    e-ee

    ai-eai    en-een

    an-ean    eng-eeng

    ang-eang    er-eer

    ao-eao    o-eo

    ou-eou

    复韵母的无声母汉字共有i,u,ü三部,汉语拼音方案中分别写成y,u,yu,并将其后的单韵母作相应的调整。本编码分别以i,u,v作为其虚拟声母,其后的单韵母不变。

    i    <==ii    u    <==uu    ü    <==vv

    ia    <==ia    ua    <==ua    üe    <==ve

    ie    <==ie    uo    <==uo    üan    <==van

    iao    <==iao    uai    <==uai    ün    <==ven

    iou    <==iou    uei    <==uei    üeng    <==veng

    ian    <==ian    uan    <==uan    iong    <==veng

    in    <==ien    uen    <==uen

    iang    <==iang    uang    <==uang

    ing    <==ieng    ueng    <==ueng

    这样,所有的汉字都具有了声母码,拼音的规范化、统一化得到了进一步的加强,并排除了拼音输入时声母的二义性和韵母的多种输入。

    2、韵码

    汉语拼音中,韵母共有33个,除a,e,i,o,u,ü外,其它韵母均由两个或两个以上的字母组成,本发明均以一个英文字母代替之,简称韵码。由于英文中仅有26个字母,故一些字母要同时代表几个韵母。无韵母时,统一在声母之后加上i。本发明的韵码可采用任何双拼方案韵母码,但默认的韵码是“析音码”的韵母方案,仅uo和ou的对调。具体安排如下:

    二、万能提示行

    以提示词组为主,以提示单字为辅。同时实现单字与词组的提示和选取。由于现代汉语主要以词组为主,词组的使用频率和词组的数量又远远大于单字,所以以提示词组为主比较科学、比较实用。方法是:

    仅在0号位提示一个单字,1~6号位提示词组。用数字键提取单字,称为“选字键”;使用“空格;,./[”提取词组,称为“选词键”;两者对应关系为:

    选词键    选字键

    空格    0

    ;    1

    '    2

    ,    3

    .    4

    /    5

    [    6

    直接按“选字键”选取词中第一个单字,“Ctrl+选字键”选取词中第二单字;“Alt+选字键”重复选取第一单字,“Alt+选词键”重复选取词组。

    智能提取:输入四码后无重码时,自动选取该字或词组;有重码时,则在输入下一字的编码时,自动提取最前面的词组或单字,词组与单字同码时,词组优先。

    如想输入一个可以的“复”字,我们必须输入“复”字的声母码fu,这时提示行出现:

    半角    析音(叶码):fu    0复    1负责    2父母    3夫妻    4妇女    5肤浅    6俯视

    数字0123456    分别提取“复    负    父    夫    妇    肤    俯”

    Ctrl+0123456分别提取“复    责    母    妻    女    浅    视”

    符号;',./[分别提取“负责    父母    夫妻    妇女    肤浅    俯视”

    空格键    选取0号位的词组或汉字

    三、本发明的词组编码

    在本编码中,词组与单字混和输入,以音定词,以词定字,分层提示:

    1、二字词

    ①第一个字的声母(单声简码词组)

    本系统中有大量的简码词组,这些简码词组主要都是二字词,提示行中除了提示一个简码单字外,还提示六个简码词组。这样一级简码词组就有26×6=156个。

    “我们”二字就可以输入“我”字的声母w,提示行中提示“我们”,只要使用选词键即可输入“我们”。

    ②第一个字的声母和韵母(单音简码词组)

    汉语拼音中声母和韵母的组合共有四百多个,也就是说共有四百多个音,但常用的仅有390个左右,在本系统中,单音简码词组共有2300个左右。

    如“合适”可以输入“合”字的拼音he,提示行中即出现“合适”二字,使用选词键即可输入“合适”。

    ③第一个字的声母和第二个字的声母(双声简码词)

    当双声简码不是一个拼音码时,可以使用两个字的声母作为词组的编码,否则应以单音简码优先。

    ④两个字的声母和韵母(双音词组码-全码)

    二字词全码是双音简码,即第一个字的声母和韵母,再加上第二个字的声母和韵母。

    如“可以”二字词的全码是“可”字的声韵二码ke,再加上“以”字的声韵xw二码,其全码为keyi。

    2、三字词

    ①三个字的声母

    ②三个字的声母加尾字的韵母。

    3、四字以上词

    前三个字的声母加尾字的声母。

    四、动态改词法

    动态改词法是指在输入词组的过程中,用户发现所输入的词组不存在或不必要存在时,可以随意修改的一种方法。用户不仅可以动态造词,还可以动态删词;只要内存允许,可以无限增加词组。

    1、动态造词。

    输入词组的编码后,如果提示行中没有出现所要的词组,则说明词组库文件中没有该词组。此时,使用造词功能键则可进入词组建立状态,提示行中汉字外码之前的位置空出,作为造词区,再逐个输入词中字或词,自动依次放到造词区中,词组长度超出造词区时,所有的字左移,最前面的字顶出,当前输入的字挤入;输入完毕后,应使用造词结束键退出造词状态,该词自动存入词库和内存中,同时提示行返回正常状态,并将该词放置在其它同码词组之后。

    举例:动态建立词组“不入虎穴,焉得虎子”

    首先,输入“不入虎穴”四个字的声母brhx作为“不入虎穴,焉得虎子”的代码,提示行为:

    半角    析音(叶码):brhx

    提示行中没有任何汉字或词组,表明该代码为空码(不为空码时也同样可以添加词组)。表明“不入虎穴,焉得虎子”词库中和内存中都不存在,此时可以使用动态造词功能将它变成词组。造词前需使用造词功能键将当前的输入状态转换成造词状态。造词功能键是:

    Shift+F2→进入造词状态

    按下Shift+F2后,即进入造词状态:

    造词:    :brhx

    接着再逐个输入“不入虎穴,焉得虎子”中的每一个汉字和标点,所输入的汉字字符不出现在文本行,而是出现在提示行的造词区。如输入“不”字后,提示行会变成:

    造词:不    :b    0不    1必须    2并且    3本来    4不但    5不仅    6包括

    造词区仅有五个汉字字符的位置,同时只能提示五个汉字字符,当超过五个汉字字符时,整个造词区左移一个汉字位,第一个汉字字符会被挤出造词区,但实质上被挤出的汉字并没有消失,而只是暂时隐藏起来了,请看本例,输入五个汉字字符时,提示行为:

    造词:不入虎穴,:xwg    0穴

    再输入“焉”字:

    造词:入虎穴,焉:yjvy    0焉

    “不”字被从造词区挤走,其它汉字左移,右边腾出一个位置,“焉”字就挤进造词区了,直至输入词组中的所有汉字:

    造词:,焉得虎子:zi    0子    1自然    2自由    3自信    4资金    5资源    6姿态

    词组中的汉字输入完毕后,计算机并不知道造词完毕,所以此时应告诉计算机,该退出造词状态了,退出造词状态与进入造词状态一样,也是使用功能键Shift+F2

    Shift+F2→退出造词状态

    按下Shift+F2后,提示行返回文本输入状态,出现原来输入的词组代码,所造词组也出现在提示行中。同时,还将该词组送到词组库文件中。请见本例:

    半角    析音(叶码):brhx    0不入虎穴,焉得虎子

    以后,“不入虎穴,焉得虎子”就可以按词组输入了。

    特别要注意的是,造词时,如果词组代码中已有一个单字和词组,则该单字或词组会自动输入到文本文件中,此时我们仍可以使用造词功能键建立另一个词组,即使同码词组多于六个,也同样可以建立自造词组。

    2、动态删词

    在造词状态下,直接键入数字键,则删除对应的词组。

    举例:删除词组“不入虎穴,焉得虎子”,首先输入brhx,提示行为:

    半角    析音(叶码):brhx    0不入虎穴,焉得虎子

    此时,按下Shift+F2键进入造词状态:

    造词:    :brhx    0不入虎穴,焉得虎子

    再键入数字0,提示行变为:

    半角    析音(叶码):brhx    0

    词组“不入虎穴,焉得虎子”从提示行中消失,同时也删除了词库中的“不入虎穴,焉得虎子”。提示行中保留数字0,是为了表示刚刚删除了一个词组。

    五、归真析音码

    本发明的单字编码是归真析音码,以“析音码”的拆分原则和回避原则为基础,对汉字中的表音部分进行全程回避。

    归真析音码的全码由四码组成,以双拼为基础,使用26个英文字母对单个汉字进行编码,其全码为:

    全码=音码+形码

    音码=本字声码+本字韵码

    形码=义码+补码

    其中:声码和韵码是双拼码,已在一、二部分中介绍。

    1、字根的编码

    在本发明中,汉字拆分成首尾两个部分,首部按正向取大原则拆分,尾部按逆向取大原则拆分。首部的编码称为“首码”,尾部的编码称为“尾码”。拆分后的字根的编码为该字根的声母码。字根共有三大类:子字、偏旁部首、基本笔画。汉字的拆分方法和标准偏旁部首的规定都采用“析音码”的规则,仅标准偏旁部首的代码作一点变动。见下表:

    标准字根编码表

    2、取义码

    义码是单字的第三码,取汉字中的表义部分的声码作为编码,以区分同音汉字,绝大部分汉字可在三码以内唯一确定。

    根据析音码的拆分规则:将汉字拆分成首尾两个部分,首部按“正向取大”原则拆分,尾部按“逆向取大”原则拆分。汉字的首尾两个部分都是给汉字表音或表义的,少量汉字仅有表义部分。由于同音字很多主要原因是:字中含有表音部分,所以表音部分的声码就失去了区分同音字的意义,是废码;因而本发明的义码要对表音部分进行回避。义码的取码方法是:

    (1)若首部不是本字的表音部分,则取首部读音的声码,简称首码,作为义码。

    (2)若首部不是本字的表音部分,则回避首部,不在首部取义码,改取尾部读音的声码,简称尾码,作为义码,

    如:“汉字编码”的首部“氵宀纟石”都不是本字的表音部分,故直接取它们的首码d,g,s,y作为义码。又如:“架裂鸦顶”等字的首部“加列牙丁”都是本字的表音部分,应回避首部,改取尾部“木衣鸟页”的声码m,i,n,i作为义码。

    3、取补码

    补码是单字的第四码,以区分读音相同、义码也相同的汉字。取补码后,国标一、二级字库中的同码汉字仅有60个左右。补码的编码方法如下:

    (1)若本字中没有表音部分,则取尾码作为补码。

    (2)若本字中含有表音部分且表音部分为合体字时,取该部分中不表音的子部分的声码作为补码;首部表音时正向取补码,尾部表音时逆向取补码。

    (3)若本字中含有表音部分并且表音部分为独体字时,取表义部分中的韵码作为补码。

    如:“国务委员”不含表音部分,故直接取它们的尾部“玉力女贝”的声码v,l,n,b作为补码。又如:“想频梅花”的表音部分分别为“相步每化”,故取它们的子部分“木止母匕”作为补码。再如:“诽腓霏鲱”的表音部分“非”为独体字,故取其表义部分的“讠月雨鱼”的韵码j,e,v,v作为补码。

    六、全拼兼容法

    全拼兼容法是一种使全拼和双拼完全兼容的输入方法,适用于所有双拼码、音形结合码,是一种十分实用的全拼码和双拼码的学习方法,使拼音不准确的人员也能在输入过程中自我纠正。

    输入任一全拼码时,均提示对应的高频字或词;输入声母之后,若输入的外码不是全拼韵母码,则自动认为该码是双拼韵母码;输入至少一个韵母码之后,若输入的外码不是韵母的一部分时,自动认为韵母码已经输入完毕,并将该码作为形码处理;当韵母已经结束,而输入的形码与原韵母码可以构成另一韵母时,应先输入韵母结束键“空格”,再输入形码;词组输入时,其理亦同。

    如:输入“晨”字,先输入c,提示行为:

    半角    析音(叶码):c    0此    1曾经    2此时    3从此    4才能    5错误    6采取

    用户可以发现,“晨”字的声母不与“此”等字相同,应再按h

    半角    析音(叶码):ch    0出    1充分    2成立    3出现    4彻底    5超过    6常常

    再输入en

    半角    析音(叶码):chen    0陈    1陈述    2沉浸    3趁机    4衬托    5尘土    6臣民

    可以看出拼音输入正确,应再输入“晨”中“日”的声码r:

    半角    析音(叶码):wfr    0晨    1趁热

    此时,前面的全拼码自动转化为双拼码。由于字母r不能与chen构成另一拼音,所以自动认为拼音码输入完毕,字母r是形码。如果输入chen后,再输入g,则会认为g是韵母的一部分,构成拼音cheng,如果要输入“宸”字,其全拼是chen,其形码是g,如果在输入chen后,直接输入g,则会认为输入的是拼音cheng,故应在输入chen后输入一个空格键表示拼音输入完毕,再输入g,就不会混淆了。

    词组输入时,可以将第二字的拼音码如形码一样处理。

    七、补充说明

    1、本发明的学习码可以采用“析音码”的基本码

    2、循环翻页键是],万能学习键是\

    3、难认字和难拆字的编码均与析音码相同。

    本发明的特点:

    1、由于仅使用拼音对汉字和词组编码,且全拼与双拼兼容,使记忆量达到最低限度。

    2、由于词组和单字可以同时提示和选择,使输入速度空前提高,并可以直接在电脑上创作文稿。

    3、单字编码简单易学,完全符合汉字的本义,消除了废码,并使重码率仅为百分之一,完全可以盲打。

    4、词组动态扩充和删除极为简便,并与文本输入完全兼容。

    5、由于采用了“析音码”的难认字和难拆字输入技术,使不认识和难于分解的汉字也极易输入,编码全面完善。

中文归真输入法.pdf_第1页
第1页 / 共16页
中文归真输入法.pdf_第2页
第2页 / 共16页
中文归真输入法.pdf_第3页
第3页 / 共16页
点击查看更多>>
资源描述

《中文归真输入法.pdf》由会员分享,可在线阅读,更多相关《中文归真输入法.pdf(16页珍藏版)》请在专利查询网上搜索。

中文归真输入法,属于一种计算机输入方法,是以词为主,以字为辅,以音定词,以词定字。采用万能提示行和动态改词法等技术,使词组输入简单、快速、扩充方便。单字编码由音、形两部分构成,音码采用改进双拼方案,形码完全回避字中的表音部分,并完全以音代形,使记忆量和重码率均接近最低限度。是一种能用电脑取代书写的输入技术。。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1