立交码汉字输入法.pdf

上传人:1*** 文档编号:995941 上传时间:2018-03-24 格式:PDF 页数:13 大小:583.83KB
返回 下载 相关 举报
摘要
申请专利号:

CN200810170938.2

申请日:

2008.10.14

公开号:

CN101727192A

公开日:

2010.06.09

当前法律状态:

撤回

有效性:

无权

法律详情:

发明专利申请公布后的视为撤回IPC(主分类):G06F 3/023公开日:20100609|||公开

IPC分类号:

G06F3/023

主分类号:

G06F3/023

申请人:

周志宏

发明人:

周志宏

地址:

116601 辽宁省大连市经济技术开发区大孤山街道小孤山西里1-2-3-4号

优先权:

专利代理机构:

代理人:

PDF下载: PDF下载
内容摘要

立交码汉字输入法是一种以音为主、以形为辅、带有声调的分区编码汉字输入法,属计算机汉字输入领域。其主要特征是:立交码没有在定义声调的四键位上定义声母,从而使该四键位在编码时,如同四个逻辑开关,将整个编码空间自然的分为多个相对独立的编码区,各编码区之间互不干扰,不会造成重码。立交码设有多种辅助输字、输词功能,所带的词库大而完整,是一种真正具有规范性强、易学性好、重码率低、性能完备、能实现高速输入的汉字输入法。

权利要求书

1: 立交码其特征在于:立交码通过巧妙的键位布置及科学的编码方法,使只定义了声调而没有定义声母的四个键位在编码时,如同四个逻辑开关,将整个编码空间自然的分为多个相对独立的编码区,各编码区之间、特别是字与词之间互不干扰,不会造成重码。
2: 立交码其特征在于:确立39种偏旁(冖宀厂广疒、艹、阝卩 刂、扌、禾火、钅、口、鸟鱼虫犭龙、木目、女、山石、亻彳日、土士、心 忄、讠月、足走辶、冫氵)和10种头两笔笔画组(点-[横]、点-其它、撇-[横]、撇-其它、横-横、横-竖、横-其它、竖-忽略、[横折]-忽略、其它折-忽略)为立交码的形码,取码简洁,易记好用。
3: 根据权利要求1所述,立交码其特征在于: 编码规则为:形码辅助字区、数字区、专用词区、自造词区的第一码分别为V.U.I.O,而其它编码区的第一码均为声母,不包含V.U.I.O四个字母,所以他们都是独立的编码区,不会与其它编码区造成任何重码。又因为主字区的第三位编码是声调,由V.U.I.O四个字母组成,而词区的第三位编码均为声母,不包含V.U.I.O四个字母,所以主字区与词区是严格区分的,字、词之间不会产生重码。同理,利用V在第二码和第四码出现的特定性,又可将人名区、地名区与其它编码区区分开来。
4: 根据权利要求1、2所述,立交码其特征在于:科学合理的键位布置,立交码的声母、韵母、声调及形码的键位对应关系如“图4”所示。
5: 根据权利要求1、3、4所述,立交码其特征在于:采用将活跃的韵母定义在不活跃的声母上,可以科学有效的解决二、四字词重码的问题,仅由于没有在I、U两键位上定义声母,就可使37%的二字词不会与四字词造成重码。

说明书


立交码汉字输入法

    立交码属计算机汉字输入领域。目前,我国流行的汉字输入编码方案很多,从大体上看,可以归纳为三类,即拼音码、拼形码和音形结合码。它们各有所长,但又都存在着各自的不足。拼音码的优点是规范性强和易学性好,不足是单字重码率高,输入速度慢,对不认识的字无法输入,拼形码的优点是单字重码率低,熟练掌握后,能达到较高的输入速度,不足是(1)字根太多,难以记忆;(2)拆字方法十分复杂,难以掌握;(3)词库较小;(4)对不会写的字、词无法输入。现有的音形结合码虽对上述两类编码方案有所改进,但还是没有解决根本问题。

    立交码,顾名思义她是一种立体交叉式的汉字编码方案,她能够像立交桥解决交通堵塞问题那样解决汉字输入中的重码问题。立交码虽然也是一种音形结合编码方案,但她与以往的音形结合码有了很大改进,她通过巧妙的键位布置及科学的编码方法,使各编码元素之间达到完美结合,实现了分区编码,将整个编码空间自然、合理的分为若干个相对独立的编码小区,各区之间互不干扰,不会造成重码,不须任何功能开关就能实现各区之间的字、词无重码混合输入。因为字、词之间无重码,词汇量再大也不会影响单字的重码率,所以立交码可带词汇量很大,并具有多种辅助输字、输词功能,对不知读音的字和不知字形的词均能做到快速输入,能够满足各种特殊情况下的汉字输入需要,具有极强的完备性。

    立交码中的形码部分仅由39个常用偏旁部首和十种笔画组(头两笔单笔画)构成,所需记忆量很小,避免了以往形码中存在的部件多难以记忆、不规范等问题,消除了二义性,既易学又好用。是一种真正具有规范性强、易学性好、词汇量大、重码率低、完备性极强、能够实现高速输入的编码方案。

    立交码还有一个优点就是:她有利于巩固学习汉语正确发音及正确书写,非常适合在中小学中推广使用。

    (一)立交码的键位图,如“图4”所示。

    (二)立交码的编码规则:如“图1”所示。

    (1)主字区:每个汉字均由四码组成,第一码为字的声母;第二码为字的韵母;第三码为字的声调;第四码为字的形码(偏旁或头两笔笔画组)。

    说明:1.如果某个汉字无声母,则第一码为该字的韵母;第二码补“J”;三、四码同上。

    2.在取形码时,如遇到“阝、卩、刂、辶、心、鸟、鱼、虫”这八种偏旁(称作特殊偏旁)时,则特殊偏旁要优先于“笔画”取码,不必按笔顺的先后取码。

    (2)二字词区:取第一个字的声母、韵母作为一、二码;

                 取第二个字的声母、韵母作为三、四码。

    (3)三字词区:取前两个字的声母分别作为一、二码;

                 取第三个字的声母、韵母分别作为三、四码。

    (4)四字及四字以上词(包括名言、警句、俗语):取前三个字的声母分别作为一、二、三码,最后一字的声母作为第四码。

    (5)形码辅助字区:(收录了GBK大字符集中的所有单字,国标2312--80中的字优先)取码规则为:

    1.第一码为字母“V”。

    2.如“图3”所示,采用特殊偏旁优先的原则,按层次(字的间架结构)先将单字进行分解,然后按下列三种情况进行取码。

    (1).如有的字已分解为三部分,则不再往下细分,取每部分所对应的形码分别作为二、三、四码。(如“堡”已拆成了“亻”“呆”“土”三部分,则不再将“呆”再细分为“口”“木”,取码应为VRKT。)

    (2).如有的字只能分解为两部分,则把第一部分对应的形码作为第二码,把第二部分的一二笔和三四笔笔画所对应的形码分别作为三、四码。

    (3).如果该字为独体字不能分解,则取该字的一二笔、三四笔和五六笔笔画所对应的形码分别作为二、三、四码。

    3.不够四码的补“J”。

    说明:(1)、这里的特殊偏旁优先原则是指:在取第一位形码时,如果该字有立交码所指的特殊偏旁,则特殊偏旁优先于“笔画”取码,在取第二、三位型码时,特殊偏旁不再优先,而应按笔顺的先后取码。如“到”字的第一位形码应为“刂”;“随”字的第一位形码应为“阝”,第二位形码应为“有”所对应的形码,第三位应为“辶”。

    (2)、按层次分解是指:如“图3”所示,首先将字按间架结构分解为上下、左右或外内两部分,然后看“上”、“左”或“外”能否再分,如不能,则再看“下”、“右”或“内”能否再分,如还不能分,再把“下”、“右”或“内”分解为一二笔和三四笔笔画。

    (3)、在取笔画时,若只剩下了单笔画(笔画不成对),则单笔画为“横”时,取码为“O”[横、其它];单笔画为“点”时,取码为“Q”[点、其它];单笔画为“撇”时,取码为“A”[撇、其它]。如:“上”字取码应为“VVOJ”;“术”字取码应为“VIAQ”;“才”字取码应为“VOAJ”。

    (4)、对于极个别拆分界线难以确定的字,采用为其定义“容错码”的方法,来减轻用户的学习难度,使用户怎样取码都对,凡是拆分界线难以确定地字均可按笔画组进行输入。

    (5)、在形码辅助字区设学习功能:即在利用形码辅助字区输字时,提示行上要显示出该字的主字区编码。

    (6)人名区:(常用的古今中外名人的名字)

    取码规则为:

    1.二字人名:姓(声)+V+名(声+韵)如:[李鹏]的编码为[LVPT]

    2.三字及多字人名:姓(声)+V+名(声+声)如:[邓小平]的编码为[DVXP]

                                            [爱因思坦]的编码为[HVYS]

    (7)地名区:(收录了国家名、民族名、名山大川名及区县级以上地名)取码规则为:

    1.二字地名:声+韵+声+V(第一字的声韵+第二字的声母)

    2.二字以上地名:声+声+声+V(前三个字的声母)

    注:在输入市、县、区地名时要将其行政级别名单独输入,其它地名可直接输入。

    如:在输入“牡丹江市”时,先输入MDJV(牡丹江),再输入;I(市)。

    “中华人民共和国”可直接输入AHRV,“黄河”可直接输入HNHV。

    (8)数字区:(为输入数字、钱数、日期、数量词提供方便)

    数字区的简码键盘对照表,如“图5”所示。

    数字区的取码规则为:

    1.U+[]+“空”(简码单字)

    如:“UA空”对应着“一”;“UN空”对应着“年”。

    2.U+数+U+声(双数字、日期、及钱数)。

    如:九八、五百、三月、六元、八分等。

    3.U+数+数+[年、月或日]

    如:[ULGN]代表“九五年”;[U;SY]代表十二月”;

    [USHR](在这里“十”略去)代表“二十六日”。

    4.U+数+声+韵(数量词)

    如:一斤、九点、六辆等。

    5.U+U+[](有:大写数字“零壹贰叁...拾”及佰、仟、圆等)

    如:“UUA空”对应“壹”;“UUB空”对应“佰”“UUV空”对应“零”.

    6.U+U+数+[拾、佰、仟、万、亿、圆、角、分]

    如:“UUAB”对应着“壹佰”;“UUGC”对应着“伍圆”。

    (9)专用词区:(收录上市公司名称、地理、化工等专业词库,可同时装入,混合输入。)

    取码规则为:第一码为字母“I”;后三码的取码规则与词区的规则相同。

                (如“邯郸钢铁”可输入IHDG;“干冰”可输入IGFB。)

    (10)自造词区:(将自己造的词可通过此区输入)

    取码规则为:第一码为字母“O”;后三码的取码规则与词区的规则相同。

                (如“邯钢”为自造词,则可通过输入OHFG得到“邯钢”一词。)

    (11)符号区:

    取码规则为:第一、二码为“FH”用于与其它编码区区分;

                第三、四码为符号类型名的拼音。

    说明:在输入时,打入“FH”两字符后,提示行中将出现符号的类型名(有:希腊、俄文、注音、拼音、平、片、标点、数字、数学、制表、特殊11种),接着打入对应类型名的声母,就可得到这一类型的所有符号,然后通过数字键选择,即可得到所需要的符号。符号区的重码较多,但它提供了一种输入各种符号的手段,如有经常需要使用的符号,可为其规定自造词码。如:可利用上表的编码来输入中文标点符号。

    (12)一级简码:高频字的“声母”+“空格键”(共34个高频字)。

    一级简码的键盘对照表,如“图6”所示。

    一级简码的口决:(供参考)

    1.[的地得]同[着了过]从“发牌所”出来,不会[在再]进去。

    2.[他她它]没有向你我看,是为到工人中。

    (13)二级简码取码规则为:字的“声”+“韵”+“空格键”。

    常用的二级简码有:

    1.常用地名及门牌号码用字:国省市县区乡镇村屯庄路桥门委街栋社岛等;

    2.常用行政机构用字:司厅局处科站社团连排班组长等;

    3.颜色:红黄蓝绿灰白黑

    4.常用连词、程度副词:而与和或及且如并以最很更太比较共之第含跟等

    (14)三级简码取码规则为:单字:声+韵+声调+空格

                            二字以上词:前三字的声母+空格

    常用三级简码有:1.人的姓氏(包含全部姓氏,个别的姓氏有重码)

                    2.有重码的二字以上词(着重解决三字词)

    (三)立交码的分区编码原理:

    由于立交码没有在定义声调的四键位(V、U、I、O)上定义声母,V键位上连韵母也未定义,从而使V、U、I、O四键在编码时,如同四个逻辑开关,将整个编码空间自然、科学、合理的分为多个相对独立的编码区,各编码区之间互不干扰,不会造成重码。各编码小区之间又是统一的,不须任何功能开关就能实现各区之间的字、词混合输入。如“图1”所示:因为形码辅助字区、数字区、专用词区、自造词区的第一码分别为V、U、I、O,而其它编码区的第一码均为声母,所以他们都是独立的编码区,不会与其它编码区造成任何重码。又因为主字区的第三位编码是声调,而词区的第三位编码均为声母,所以主字区与词区是严格区分的,字、词之间不会产生重码。同理,利用V在第二码和第四码出现的特定性,又可将人名区、地名区与其它编码区区分开来。

    (四)立交码的特性及其优点

    (1)规范性:因为立交码的音码部分与我们拼读习惯相一致,形码部分是由常用偏旁部首和笔画组构成,不存在自造的字根,且与我们的书写习惯相一致,编码规则统一,取码非常直观,无二义性,所以规范性很强。

    (2)易学性:立交码是以拼音为主的编码方案,词的编码完全由音码组成(不包括形码部分);主字区的编码也是以音码为主(前三码均为音码),只是在最后加了一位形码来降低单字的重码率,立交码中的这位形码是由39个常用偏旁和十种笔画组(头两笔单笔画)构成,取码非常简单,不需要拆字;为了便于记忆,立交码还在音码、形码的键位布置上进行了精心设计,使绝大多数的偏旁都对应着其自身的声母,很多键位的声韵双拼还跟其形码有着某种非常便于记忆的对应关系。如“图4”所示:[R]、[Y]、[J]、[K]键位的声韵双拼正是其形码的音;偏旁[心、忄]对应的声韵双拼为“小”,可记为“小心”;同理[木、目]可记为“面目”;[扌]可记为“车手”;[山、石]可记为“撇山石”等等。立交码中的“笔画组”可通过位置来加强记忆。如:[竖]象“1”,对应着代表1声的V键位;(横、横)、(横、竖)、(横、其它)对应着代表二、三、四声的U、I、O三键位(三键相连,便于记忆和使用);(点、[横])(点、其它)对应着上排最左面的两个键位;(撇、[横])(撇、其它)对应着中排最左面的两个键位;[横折][其它折]对应的两键位也是相连的。记忆量很小,一般在十分钟内便可记住,易学性很好。

    (3)完备性:

    1.运用音码输字的人都知道,如遇到不认识的字就毫无办法,只好借助查字典,这将大大影响输入速度,而立交码提供了一种形码辅助输字手段,从而解决了这一难题。利用“形码辅助字区”还可以输入GBK大字符集中的所有单字。

    2.拼形码也遇到了类似问题,若在“听打”或“想打”时,遇到要打的词中有不会写的字(如:在写作时想输入“囫囵吞枣”这一成语,而“囫囵”两字忘记如何写了),也毫无办法,只好借助拼音码来输入,影响输入速度。因为在立交码中,词的编码完全是由音码组成,所以对于只知读音不知字型的词是很容易输入的。

    3.立交码的词库非常全,达12万条之多(不象有一些输入法,为了保证单字重码率,而将与单字重码的词去掉,造成词库不完整),用户可尽管运用词汇码来进行输入,而不必担忧是否有该词的问题。

    综上所述,因立交码既可输入“不认识的字”及GBK大字符集中的所有单字,又可输入只知读音不知字形的词,且词库大而完整,所以具有极强的完备性。

    (4)、重码率:

    由于立交码实现了分区编码,字与词之间互不干扰,不会造成重码,使整体的重码率都得到大幅度降低。下面就字、词的重码率进一步说明一下:

    立交码中字的重码率:立交码在声韵双拼的基础上加上了一位声调和一位形码,从而使单字的重码率得到了大幅度降低,且立交码还设有多而实用的一、二、三级简码,进一步降低了单字的重码率。

    对人名输入的问题:对人名的输入,一直是最令音码方案“头痛”的事,再智能的输入法也无法正确判断人名用字,绝大部分人名用字需要以单字的形式输入,因为音码的单字重码率高,所以输入人名非常困难。立交码设有人名区,凡是明人的名字,均可通过此区的编码规则直接输入;立交码还着重对人名用字进行了统计及处理,人名中的姓氏全部设有三级简码,使95%以上的人名用字可直接输入,不需选重,从而解决了输入人名难的问题。

    立交码中词的重码率:在立交码中,词的编码完全由音码组成,取码非常简单易行,重码率也很低,这一点与紫光拼音、自然码等双拼编码方案类似,与之有较大改进的是:

    ①.通过键位布置来降低词的重码率:立交码发现,采用将活跃的韵母定义在不活跃的声母上,可以科学有效的解决二、四字词重码的问题。如i、u是两个非常活跃的韵母,二字词中含有韵母i、u的词约占总数的37%,仅由于没有在I、U键位上定义声母,就可使37%的二字词不会与四字词造成重码。立交码中的“;YFROK”键位上的声、韵组合都非常成功,使二、四字词之间发生重码的机会大为降低。这是以往的含声韵双拼的编码方案所没有考虑到的,尤其是将ch、sh规定在I、U两键位上是非常不合适的。

    ②.通过分流词汇来降低词的重码率:立交码设有多个辅助输词功能,包括对数字、日期、数量词、钱数的输入;对人名、地名的输入等等;分流了大量词汇,有效降低了词的重码率。

    ③.通过特殊处理来降低词的重码率:因为二字词中第二字发ji zhi shi yi四个音的词很多,重码非常严重,其中有94%存在着重码,约占重码总数的7%,约占多重(六词以上重码)的38%,所以,立交码将这类词增加了一个经过特别处理的编码,即:将这类词的最后一码“i”改打其第二字所对应的形码,从而使这类词的重码率得到大幅度降低。这类词的原编码保持不变,可以按照原编码正常输入。

    ④.通过三级简码来降低词的重码率:立交码为三字及三字以上词设有多而实用的三级简码,有效降低了三字及三字以上词的重码率。

    (5)、平均码长:

    由于立交码中,字与词的码长最长只有四码,且设有大量而实用的一、二、三级简码,词汇量又非常大,在输入时可尽管运用简码和词汇码进行输入;立交码的重码率很低,完备性极强,在字、词混合输入时不须击切换键,选字键和翻页键也极少用,所以立交码在实际输入时的平均码长很低,约为2键左右。

    (6)、输入速度:

    由于立交码的规范性强、易学性好、性能极完备、重码率低、平均码长又短,所以她可达到很高的输入速度。

    附图说明:图1是立交码编码规则一览表;图2是形码键盘对照表及其例字;

              图3是形码辅助字区按层次拆字示意图;图4是立交码键位图;

              图5是数字区的简码键盘对照表;图6是一级简码的键盘对照表。

    图3中的说明:

    1.在取码时,如不够四码,则用“J”补足四码。

    2.这里的“特殊偏旁”是指立交码中列到“阝.卩.刂.辶.心.鸟.鱼.虫”8种偏旁。

    图4中的说明:

    1.轻声按1声处理。

    2.每个键位第二行中的汉字为该键位所对应的声、韵双拼助记符;第三、四行中的偏旁或汉字是该键位所对应的形码。

    3.在立交码中,“捺”按“点”处理,“提”按“横”处理。

    4.W、S两键位中的“[横]”是泛指以横起笔的笔画(包括:横、横折、横折勾等);F键位中的“[横折]”泛指以横起笔的折(包括:横折、横折勾等)。如”图2”所示。

立交码汉字输入法.pdf_第1页
第1页 / 共13页
立交码汉字输入法.pdf_第2页
第2页 / 共13页
立交码汉字输入法.pdf_第3页
第3页 / 共13页
点击查看更多>>
资源描述

《立交码汉字输入法.pdf》由会员分享,可在线阅读,更多相关《立交码汉字输入法.pdf(13页珍藏版)》请在专利查询网上搜索。

立交码汉字输入法是一种以音为主、以形为辅、带有声调的分区编码汉字输入法,属计算机汉字输入领域。其主要特征是:立交码没有在定义声调的四键位上定义声母,从而使该四键位在编码时,如同四个逻辑开关,将整个编码空间自然的分为多个相对独立的编码区,各编码区之间互不干扰,不会造成重码。立交码设有多种辅助输字、输词功能,所带的词库大而完整,是一种真正具有规范性强、易学性好、重码率低、性能完备、能实现高速输入的汉字。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1