快三码无重码兼容拼音输入的汉字字词编码方法及键盘.pdf

上传人:54 文档编号:713093 上传时间:2018-03-07 格式:PDF 页数:11 大小:333.31KB
返回 下载 相关 举报
摘要
申请专利号:

CN93107947.0

申请日:

1993.07.07

公开号:

CN1082216A

公开日:

1994.02.16

当前法律状态:

撤回

有效性:

无权

法律详情:

|||公开|||

IPC分类号:

G06F3/023

主分类号:

G06F3/023

申请人:

卢小林;

发明人:

卢小林

地址:

310027浙江省杭州市玉泉浙江大学175信箱

优先权:

专利代理机构:

浙江大学专利代理事务所

代理人:

林怀禹

PDF下载: PDF下载
内容摘要

一种快三码无重码兼容拼音输入的汉字字词编码方法及键盘,是一种以形码为主的汉字编码,其规则为三位等长码,选取组字能力强的160个部首,安排在通用的计算机键盘上,汉字的单字和词组均采用三编码输入,少量汉字追加第四码以消除重码,同时兼容汉语拼音方案加部首输入,实现对国标区位6763个汉字的无重码编码。本发明比四位等长码的输入效率提高76%,输入操作与书写汉字相似,且规则统一简明,拆字和输入好学易记。

权利要求书

1: 1、一种快三码无重码兼容拼音输入的汉字字词编码方法及键盘,它包括一个通用的具有西文键盘的计算机、打字机、电传机等的汉字字词输入系统,本发明的特征是:汉字的单字和词组均用三编码输入,少量汉字追加第四码以消除重码,同时兼容汉语拼音方案加部首输入,汉字部首代码在键盘上的对应关系如下: A:艹、之、 、廾、辶、廴; B:匕、羊、 、犭、宀、冖; C:厂、文、攵、夊、火、灬、佳、友、、 ; D:刀、白、、衣、页、豕、臼、石、、 、衤; E:用、月、甫、虍、刂、 、、田; F:口; G:革、豆、一、彳、贝、食、饣; H:禾、广、大、西、酉、卜、内、毛、上; I:1、矢、力、金、长、七、钅; J:几、手、二、羽、天、扌、夭; K:心、干、六、亠、亦、业、夕、歹、见、 ; L:丁、水、九、也、巴、乂、 ; M:巾、山、亡、十、弓、鸟、乌; N:冂、门、骨、鱼、示、又、礻; O:母、今、雨、阝、方、尸、牛、卩、 ; P:丿、舟、氏、壬、耒、工、王、丰、 ; Q: 、儿、气、足、、缶、 、小; R:人、巳、寸、已、己、コ; S:日、早、耳、立、辛; T:士、耂、爫、采、豸、米、车、匚; U:凵、囗、弋、木、瓦、戈; V:页、 、勹、丶、免、纟、马、么; W:八、目、竹、皿、自、黑、乃、巛; X: 、女、古、冫、丬、疒、斤、; Y:厶、矛、止、齿、讠、彐、戊、亏、言; Z:子、乙、电、虫、束、五、了; ?:学习键; ;:交换键; 汉字字词的具体输入步骤包括: 一、单字
2: 成字字根=字根码+汉字拼音声母;
3: (A)两字根字(正常码)=字根码1+字根码2+汉字拼音声母;   (B)两字根字(简码)=字根码1+字根码2;
4: 三字根字=字根码1+字根码2+字根码3;
5: 三字根以上的字=字根码1+字根码2+字根码末;
6: 少部分字追加第四码=字根码1+字根码2+字根码3+汉字拼音声母; 二、词语 1.二字词组=第一字第一字根码+第二字第一字根码+第二字第二字根码; 2.三字或三字以上的词组=第一、二、和末字的第一部首码; 三、汉语拼音方案兼容输入 在同一键盘上无需换档,直接输入汉字拼音,而再加第一部首选 字,第一部首选字有重码时加第二部首,实现拼音加部首的无重码输入。 2、根据权利要求1所述的汉字字词编码方法及键盘,其特征是:学习键?可以代替不清楚的字根。 3、根据权利要求1所述的汉字字词编码方法及键盘,其特征是:交换键;起到一种交换智能选字、选词作用,使第一级高频字、二级简码字的数量提高一倍。

说明书


本发明涉及将另散信息项目转换为代码形式的装置,具体地说是一种汉字输入方法及所用的键盘。

    世界已进入电脑的时代,电脑不仅用来进行数值运算,而且越来越多地用于信息处理,大量的汉字信息要用电脑来处理,首先必须解决如何向电脑输入汉字的问题。迄今为止,国内外提出的汉字输入编码已达四百余种,在常用的电脑汉字输入方法中,其编码方式大致分为按拼音编码方式、整字编码方式和字形分解方式三大类。目前流行的几种输入法大致有代表性的如双拼输入法、王永民的五笔字型输入法等。

    五笔字型输入法是一种较好的输入方法,它用130个字根进行拆码,字词兼容,重码少,基本不用选写,每分钟可以输入120~160个汉字,但是它同任何一种编码方法一样,也有许多不尽人意的地方,第一是五笔字型中的交叉识别项,是五笔字型中最影响人们输入速度的硬性规定,它不仅要求人们去判别末笔字画,而且要判断字的结构组合类型,规则极为复杂,极大地加重了人们的思维负担,阻碍了汉字输入速度的进一步提高;第二是部分词根分解过细,不符合人们的习惯;第三是部分键码安排不够合理,大量的击键集中在部分键码上;第四是仍有200多组重码。

    本发明的目的是:它采用一种以形码为主的汉字编码方案,其规则码为三位等长码。它是选取组字能力强的160个部首,合理地安排在英文键盘的26个字母键盘上,部分字则采用形码加拼音声母表示,实现了对国标区位6763个汉字的无重编码。

    汉字编码方案地设计要求是:直观、简易、快速、没有重码。目前一般采用的四码编码法,没有达到最短、快速的极限。以英文键盘26个小写字母进行三码制编码,可编出汉字为:

    三码编码汉字总数=26×26×26=17,576个。

    而一般常用汉字在3000个左右,国际标准区所收的汉字为6763个,这些汉字已经基本满足一般专业和行业的文字需要。而且英文26个小写字母对6763个汉字进行编码,每个汉字平均有17576/6763=2.599个码,所以用三码编码能达到无重码或少重编码。对于减少重码或是消灭重码是采用形、音结合的办法,因为形、音结合是汉音本身的特点所决定的。对于形码,它的优点在于,只要能写出汉字,而不必知道其拼音即可输入;对于拼音码,则由于南方及地方音的影响而错误率较大,且对于一些生避汉字,拼音码也无能为力。

    本发明具体采用以下的方法:

    1.以三码为规则编码,并取二码简码及部分字后追加识别第四码;

    2.以形码为主,即大部分字以形码来拆分,据统计,汉字约有78%为三部首汉字,11%为两部首汉字,11%为三部首以上汉字,平均码长为3.1码;

    3.部分汉字追加汉字拼音声母进行识别和处理重码。

    下面对本发明作进一步的描述。

    汉字偏旁部首及键盘设计:汉字偏旁部首选字法,是按基本笔划组成不变的结构划出来的,如“张”字是由“弓”和“长”所组成。汉字的基本部首有很多,对编码来说,部首太少易产生重码,而太多又增加了人们的记忆负担,快三码输入法决定选取160个常用部首作为基本部首,分布于具有西文键盘的计算机上,具体的分布见表所示的汉字部首代码。

    汉字拼音的声母:汉字分解成基本字根之后,有时并不能完全唯一地确定一个汉字,因为汉字可以由相同的部首而有不同的字形结构,如左右、上下等来组成不同的汉字。

    例如:呗、员

    作为文字书写时,人们一目了然,不会有二重性,但作为编码以后,则会产生重码,所以可采用汉字拼音声母,用一个码来确定二义性。但拼音时,由于南方和北方及地方音不同,如z与zh,c与ch,on与ong,an与ang及en与eng等不能区分开来,但对汉字拼音的声母的第一个字母的错误率却是很低的,所以采用汉字声母首字作为编码的识别码。

    如:“张”分解为“弓”、“长”、“z”

    又解决了由于结构不同而引起的二义性。

    如:员分解为“口”、“贝”、“Y”

    呗分解为“口”、“贝”、“B”

    同时,对于部分三码的重码,采取追加第四码的方法,基本上消除重码。

    本发明的汉字字词的具体输入步骤:它包括一个通用的具有西文键盘的计算机、打字机、电传机等的汉字字词输入系统,汉字的单字和词组均用三编码输入,少量字追加第四码以消除重码,同时兼容汉语拼音方案加部首输入。其输入编码规则为:

    一、单字

    1.成字字根字=字根码+汉字拼音声母

    例:口=F〔字根码〕+K〔声母〕

    五、交换键(;)的设置:

    交换键;位于L键的右侧。交流键起到一种交换智能选字、选词作用。它使第一级高频字二级简码字的数量提高一倍。

    (1)例:高频字E加空格=有

    高频字E加交换键;=用

    (2)代替第四码拼音选字

    例:器=FFFQ,用交换键则为:器=FFF;

    (3)当词组与字的码重码时,加交换键为字词交换;

    (4)当拼音码与字码重时,加交换键为音码交换。

    交换键总结为:

    (1)一、二级简码字交换;

    (2)与第四码追加码交换;

    (3)字与词组交换;

    (4)拼音输入与正常形码输入交换。

    本发明与背景技术相比,具有的有益的效果是:

    1.快:充分发挥了电脑键盘的性能,以三码输入汉字字词,极大地提高了汉字输入效率,比四位等长码的输入效率提高75%;

    2.易:160个常用部首作为字根,输入操作与书写汉字相似,且规则统一简明,拆字和输入好学易记;

    3.无重码:对国际标准区位的6763个汉字进行编码达到基本无重码编码;

    4.兼容汉语拼音方案输入:进行拼音输入时无需换档,并且还设计有拼音加部首的无重码拼音选字方案,极大地方便了使用拼音输入的用户。

    2.(A)两字根字(正常码)=字根码1+字根码2+汉字拼音声母

    例:吕=F〔字根码1〕+F〔字根码2〕+L〔声母〕

    (B)两字根字(简码)=字根码1+字根码2

    例:吕=F〔字根码1〕+F〔字根码2〕

    3.三字根字=字根码1+字根码2+字根码3

    例:品=F〔字根码1〕+F〔字根码2〕+F〔字根码3〕

    4.三字根以上的字=字根码1+字根码2+字根码末

    例:输=T〔车〕+R〔人〕+E〔刂〕

    5.少部分字追加第四码=字根码1+字根码2+字根码3+声母

    例:器=F〔口〕+F〔口〕+F〔口〕+Q〔器的声母

    二、词语

    1.二字词组:第一字第一字根+第二字第一字根+第二字第二字根

    例:中国=F〔口〕U〔囗〕P〔王〕

    2.三字或三字以上的词组,第一、二、和末字的第一部首

    例:杭州市=U〔木〕E〔〕K〔亠〕

    例:中国人民=F〔口〕U〔囗〕R〔〕

    三、汉语拼音方案兼容输入:

    在同一键盘上无需换档直接输入拼音而后再加第一部首选字,第一部首选字有重码时加第二部首,实现拼音加部首的无重码输入。

    例:中=zhong+F〔键码〕

    (拼音)

    四、学习键(?)的设置:

    学习键?可以代替不清楚的字根,起到帮助人们学习和熟悉过程。

    汉字部首代码表

    A:艹、之、、廾、辶、廴;

    B:匕、羊、、犭、宀、冖;

    C:厂、文、攵、夂、火、灬、佳、友、、;

    D:刀、白、、衣、页、豕、臼、石、、、衤;

    E:用、月、甫、虍、刂、、田;

    F:口;

    G:革、豆、一、彳、贝、食、饣;

    H:禾、广、大、西、酉、卜、内、毛、上;

    I:1、矢、力、金、长、七、钅;

    J:几、手、二、羽、天、扌、夭;

    K:心、干、六、亠、亦、业、夕、歹、见、;

    L:丁、水、九、也、巴、乂、;

    M:巾、山、亡、十、弓、鸟、乌;

    N:冂、门、骨、鱼、示、又、礻;

    O:母、今、雨、阝、方、尸、牛、卩、;

    P:丿、舟、氏、壬、耒、工、王、丰、

    Q:、儿、气、足、、缶、、小;

    R:人、巳、寸、已、己、;

    S:日、早、耳、立、辛;

    T:士、耂、爫、采、豸、米、车、匚;

    U:凵、口、弋、木、瓦、戈;

    V:页、、勹、、免、纟、马、么;

    W:八、目、竹、皿、自、黑、乃、巛;

    汉字部首代码表(续)

    X:、女、古、冫、丬、疒、斤、;

    Y:厶、矛、止、齿、讠、彐、戊、亏、言;

    Z:子、乙、电、虫、束、五、了;

    ?:学习键;

    ;:交换键;

快三码无重码兼容拼音输入的汉字字词编码方法及键盘.pdf_第1页
第1页 / 共11页
快三码无重码兼容拼音输入的汉字字词编码方法及键盘.pdf_第2页
第2页 / 共11页
快三码无重码兼容拼音输入的汉字字词编码方法及键盘.pdf_第3页
第3页 / 共11页
点击查看更多>>
资源描述

《快三码无重码兼容拼音输入的汉字字词编码方法及键盘.pdf》由会员分享,可在线阅读,更多相关《快三码无重码兼容拼音输入的汉字字词编码方法及键盘.pdf(11页珍藏版)》请在专利查询网上搜索。

一种快三码无重码兼容拼音输入的汉字字词编码方法及键盘,是一种以形码为主的汉字编码,其规则为三位等长码,选取组字能力强的160个部首,安排在通用的计算机键盘上,汉字的单字和词组均采用三编码输入,少量汉字追加第四码以消除重码,同时兼容汉语拼音方案加部首输入,实现对国标区位6763个汉字的无重码编码。本发明比四位等长码的输入效率提高76,输入操作与书写汉字相似,且规则统一简明,拆字和输入好学易记。。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1