方言输入法.pdf

上传人:a**** 文档编号:1027761 上传时间:2018-03-26 格式:PDF 页数:17 大小:372.08KB
返回 下载 相关 举报
摘要
申请专利号:

CN200910070553.3

申请日:

2009.09.23

公开号:

CN102023711A

公开日:

2011.04.20

当前法律状态:

撤回

有效性:

无权

法律详情:

发明专利申请公布后的视为撤回IPC(主分类):G06F 3/023申请公布日:20110420|||公开

IPC分类号:

G06F3/023; G06F17/30

主分类号:

G06F3/023

申请人:

王雅弟

发明人:

王雅弟

地址:

300250 天津市河北区革新道颂光里2-8-105室

优先权:

专利代理机构:

代理人:

PDF下载: PDF下载
内容摘要

本发明属于计算机汉字输入法领域,特别涉及带有形码辅助码的拼音输入法。当用户输入编码后,“输入编码分析器”将编码为拼音编码的候选字存储到“拼音候选字列表”中,将编码为拼音编码和形码编码的候选字存储到“形码候选字列表”中;“拼音序值分析器”根据“码元编码频度”为候选字排序;当用户选择候选字后,“输入编码处理器”将输入编码中的声母编码、韵母编码做为“声母码元”、“韵母码元”的“码元编码”存储到“码元数据库”中,将输入编码做为“已输入编码”存储到“汉字数据库”该汉字的“已输入编码”中。发明解决了拼音输入法无法输入方音口语的技术难题,具有显著的技术进步。

权利要求书

1: 一种计算机汉字输入法,其特征在于 : (a) 本发明包括以下装置 : 用于存储汉字的 “声母码元”、“韵母码元”、“拼音字频”、“形码编码”、“已 输入编码” 和 “已输入编码频度” 的 “汉字数据库” ; 用于存储 “声母码元”、 “韵母码元” 的 “码元编码” 和 “码元编码频度” 的 “码 元数据库” ; 用于存储编码为拼音编码的候选字的 “拼音候选字列表” ; 用于存储编码为拼音编码和形码编码的候选字的 “形码候选字列表” ; 当用户输入编码后,用于切分输入编码,将编码为拼音编码的候选字存储到 “拼音 候选字列表” 中,将编码为拼音编码和形码编码的候选字存储到 “形码候选字列表” 中 的 “输入编码分析器” ; 用于根据 “码元编码频度” 为候选字排序的 “拼音序值分析器” ; 当用户选择候选字后,用于将输入编码中的声母编码、韵母编码做为 “声母码 元”、 “韵母码元” 的 “码元编码” 存储到 “码元数据库” 中,将输入编码做为 “已输 入编码” 存储到 “汉字数据库” 该汉字的 “已输入编码” 中的 “输入编码处理器” ; (b) “输入编码分析器”将编码为拼音编码的候选字存储到 “拼音候选字列表”中, 其特征在于包含以下步骤 : 在 “汉字数据库” 中查找, “已输入编码” 等于输入编码的汉字 ;将该 “已输入 编码” 的 “已输入编码频度” 设置为该候选字的 “序度” ;将所有符合条件的汉字,按 “序度” 由大到小的顺序排序,添加到 “拼音候选字列表” 中 ; 在其余未添加到 “拼音候选字列表” 的汉字中查找, “已输入编码” 中的拼音编码 等于输入编码中的拼音编码的汉字 ;将相应 “已输入编码” 的 “已输入编码频度” 总和 的值设置为该候选字的 “序度” ;将所有符合条件的汉字,按 “序度” 由大到小的顺序 排序,添加到 “拼音候选字列表” 中 ; 在其余未添加到 “拼音候选字列表” 的汉字中查找,汉字发音的 “声母码元” 在 “码元数据库” 中的 “码元编码” 等于输入编码中的声母编码并且该发音的 “韵母码 元” 在 “码元数据库” 中的 “码元编码” 等于输入编码中的韵母编码,并且没有 “已输 入编码” 的汉字 ;将所有符合条件的汉字,使用 “拼音序值分析器” 排序,添加到 “拼 音候选字列表” 中 ; 在其余未添加到 “拼音候选字列表” 的汉字中查找,汉字发音的 “声母码元” 在 “码元数据库” 中的 “码元编码” 等于输入编码中的声母编码并且该发音的 “韵母码 元” 在 “码元数据库” 中的 “码元编码” 等于输入编码中的韵母编码的汉字 ;将所有符 合条件的汉字,使用 “拼音序值分析器” 排序,添加到 “拼音候选字列表” 中 ; (c) “输入编码分析器” 将编码为拼音编码和形码编码的候选字存储到 “形码候选 字列表” 中,其特征在于包含以下步骤 : 在 “汉字数据库” 中查找, “已输入编码” 等于输入编码的汉字 ;将该 “已输入 编码” 的 “已输入编码频度” 设置为该候选字的 “序度” ;将所有符合条件的汉字,按 “序度” 由大到小的顺序排序,添加到 “形码候选字列表” 中 ; 在其余未添加到 “形码候选字列表” 的汉字中查找, “已输入编码” 中的拼音编码 2 等于输入编码中的拼音编码,并且 “形码编码” 等于输入编码中的形码编码的汉字 ;将 相应 “已输入编码” 的 “已输入编码频度” 总和的值设置为该候选字的 “序度” ;将所 有符合条件的汉字,按 “序度” 由大到小的顺序排序,添加到 “形码候选字列表” 中 ; 在其余未添加到 “形码候选字列表” 的汉字中查找, “已输入编码” 中的拼音编码 等于输入编码中的拼音编码,并且 “形码编码” 的前几个代码等于输入编码中的形码编 码的汉字 ;将相应 “已输入编码” 的 “已输入编码频度” 总和的值设置为该候选字的 “序度” ;将所有符合条件的汉字,按 “序度” 由大到小的顺序排序,添加到 “形码候 选字列表” 中 ; 在其余未添加到 “形码候选字列表” 的汉字中查找,汉字发音的 “声母码元” 在 “码元数据库” 中的 “码元编码” 等于输入编码中的声母编码并且该发音的 “韵母码 元” 在 “码元数据库” 中的 “码元编码” 等于输入编码中的韵母编码,并且 “形码编 码” 等于输入编码中的形码编码的汉字 ;将所有符合条件的汉字,使用 “拼音序值分析 器” 排序,添加到 “形码候选字列表” 中 ; 在其余未添加到 “形码候选字列表” 的汉字中查找,汉字发音的 “声母码元” 在 “码元数据库” 中的 “码元编码” 等于输入编码中的声母编码并且该发音的 “韵母码 元” 在 “码元数据库” 中的 “码元编码” 等于输入编码中的韵母编码,并且 “形码编 码” 的前几个代码等于输入编码中的形码编码的汉字 ;将所有符合条件的汉字,使用 “拼音序值分析器” 排序,添加到 “形码候选字列表” 中 ; 在其余未添加到 “形码候选字列表” 的汉字中查找,汉字发音的 “声母码元” 在 “码元数据库” 中的 “码元编码” 等于输入编码中的声母编码或者该发音的 “韵母码 元” 在 “码元数据库” 中的 “码元编码” 等于输入编码中的韵母编码,并且 “形码编 码” 等于输入编码中的形码编码的汉字 ;将所有符合条件的汉字,使用 “拼音序值分析 器” 排序,添加到 “形码候选字列表” 中 ; 在其余未添加到 “形码候选字列表” 的汉字中查找, “形码编码” 等于输入编码 中的形码编码的汉字 ;将该汉字的 “拼音字频” 总和的值设置为该候选字的 “序度” ; 将所有符合条件的汉字,按 “序度” 由大到小的顺序排序,添加到 “形码候选字列表” 中; (d) “拼音序值分析器” 根据 “码元编码频度” 为候选字排序,其特征在于包含以 下步骤 : 当汉字发音的 “声母码元” 在 “码元数据库” 中的 “码元编码” 等于输入编码中的 声母编码时,将该 “码元编码” 的 “码元编码频度” 除以该 “声母码元” 的所有 “码 元编码频度” 总和的商设置为 “声母系数” ; 当该汉字该发音的 “韵母码元” 在 “码元数据库” 中的 “码元编码” 等于输入编 码中的韵母编码时,将该 “码元编码” 的 “码元编码频度” 除以该 “韵母码元” 的所有 “码元编码频度” 总和的商设置为 “韵母系数” ; 将该汉字该发音的 “声母系数” 乘以该发音的 “韵母系数” 再乘以该发音的 “拼音 字频” 设置为该发音的 “拼音序值” ;将该汉字所有发音的 “拼音序值” 的最大值设置 为该汉字的 “序度” ;将所有符合条件的汉字按 “序度” 由大到小的顺序排序 ; (e) 当用户选择候选字后, “输入编码处理器” 将输入编码中的声母编码、韵母编码 3 做为 “声母码元”、 “韵母码元” 的 “码元编码” 存储到 “码元数据库” 中,其特征在 于包含以下步骤 : 如果用户选择的候选字没有 “已输入编码” 或者 “已输入编码” 中的拼音编码均不 等于该输入编码中的拼音编码,那么 “输入编码处理器” 将该输入编码中的声母编码做 为该 “声母码元” 的 “码元编码” 存储到 “码元数据库” 中,将该输入编码中的韵母编 码做为该 “韵母码元” 的 “码元编码” 存储到 “码元数据库” 中 ;具体过程为 : 如果该汉字的 “声母码元” 在 “码元数据库” 中已经存储了等于该输入编码中的声 母编码的 “码元编码”,那么将该 “码元编码” 的 “码元编码频度” 加 1 ;如果该汉 字的 “声母码元” 在 “码元数据库” 中没有等于该输入编码中的声母编码的 “码元编 码”,那么将该输入编码中的声母编码存储为该 “声母码元” 的 “码元编码”,并将该 “码元编码” 的 “码元编码频度” 设置为 1 ; 如果该汉字的 “韵母码元” 在 “码元数据库” 中已经存储了等于该输入编码中的韵 母编码的 “码元编码”,那么将该 “码元编码” 的 “码元编码频度” 加 1 ;如果该汉 字的 “韵母码元” 在 “码元数据库” 中没有等于该输入编码中的韵母编码的 “码元编 码”,那么将该输入编码中的韵母编码存储为该 “韵母码元” 的 “码元编码”,并将该 “码元编码” 的 “码元编码频度” 设置为 1 ; (f) 当用户选择候选字后, “输入编码处理器” 将输入编码做为 “已输入编码” 存储 到 “汉字数据库” 该汉字的 “已输入编码” 中,其特征在于包含以下步骤 : 如果该汉字在 “汉字数据库” 中已经存储了等于该输入编码的 “已输入编码”,那 么将该 “已输入编码” 的 “已输入编码频度” 加 1 ;如果该汉字在 “汉字数据库” 中没 有 “已输入编码” 或者 “已输入编码” 均不等于该输入编码,那么将该输入编码存储为 该汉字的 “已输入编码”,并将该汉字相应的 “拼音字频” 加 1 的值设置为该 “已输入 编码” 的 “已输入编码频度”。
2: 根据权利要求 1 所述的汉字输入法,其特征在于 : 将汉字的每一个发音的声母音位、韵母音位做为汉字拼音编码的编码码元 ;将汉字 的每一个发音的 “声母码元”、 “韵母码元” 和该发音的 “拼音字频” 设置为一组,存 储在 “汉字数据库” 中 ; 在 “汉字数据库中” 为每一个汉字记录设置多组 “声母码元”、 “韵母码元”、 “拼音字频” 字段,设置一个 “形码编码” 字段,设置多组 “已输入编码”、 “已输入 编码频度” 字段,可以如下结构 : { 声母码元 1 ;韵母码元 1 ;拼音字频 1 ; 声母码元 2 ;韵母码元 2 ;拼音字频 2 ; ...... 形码编码 ; 已输入编码 1 ;已输入编码频度 1 ; 已输入编码 2 ;已输入编码频度 2 ; ...... } 4
3: 根据权利要求 1 所述的汉字输入法,其特征在于 : 在 “码元数据库” 中,为每一个 “声母码元”、 “韵母码元” 记录设置多组 “码元 编码”、 “码元编码频度” 字段,可以如下结构 : { 码元编码 1 ;码元编码频度 1 ;码元编码 2 ;码元编码频度 2 ; …… } 在 “码元数据库” 中,为每一个 “声母码元”、 “韵母码元” 预设一个 “码元编 码”。
4: 根据权利要求 1 所述的汉字输入法,其特征在于 : 选取 150 个常用偏旁部首做为对汉字字形编码的编码码元 ;将 150 个编码码元,按其 汉语拼音首字母分成 21 组,指定到计算机通用键盘的 21 个字母键上,具体为 : b :卜、八、匕、勹、冫、贝、白、貝 ; c :厂、艹、寸、彳、辶、车、 虫、車 ; d :丶、刂、刀、大、歹 ; e :儿、耳 ; f : 、匚、阝、 方; g :广、弓、戈、革 ; h :一、丷、火、灬、户、禾、虍 ; j :冂、几、卩、巾、彐、己、孑、见、斤、钅、臼、見、角、釒、金 ; k :凵、口 ; l :力、 立 ; m :冖、门、宀、马、木、目、皿、米、門、 馬; n :女、牛、牜、鸟、疒、鳥 ; p :丿、攵 ; q :犭、犬、气 ; r :亻、人、日 ; s :亅、丨、十、厶、士、扌、山、彡、饣、氵、尸、巳、纟、水、礻、石、罒、 糹、身 ; t :亠、土、田 ; w :囗、王、文 ; x: 小、夕、忄、心、穴、 、讠、又、廴、弋、已、曰、月、衤、页、羊、 雨、鱼、頁、魚 ; ; 、乙、乛、乚、夂、丬、子、止、爫、自、舟、走、足、 y : 、 z : 、 依笔顺取汉字字形的第一、第二、最末一个编码码元的代码进行编码 ;当汉字的字 形由两个编码码元组成时,依笔顺依次取其字形的第一、第二个编码码元的代码进行编 码 ;当汉字的字形由一个编码码元组成时,取这个编码码元的代码进行编码 ; 单字输入 : 输入汉字的拼音编码 ; 先输入汉字的拼音编码,再输入汉字的形码编码 ; 5 词组输入 : 依次输入构成词组的汉字的拼音编码 ; 先依次输入构成词组的汉字的拼音编码,再依次输入汉字的形码编码。
5: 根据权利要求 1 所述的汉字输入法,其特征在于 : 输入法候选字词窗口,分为拼音候选栏和形码候选栏 ;拼音候选栏用于显示 “拼音 候选字列表” 中的候选字词 ;形码候选栏用于显示 “形码候选字列表” 中的候选字词 ; 1、2、3、4、5 五个数字键定义为拼音候选字词选择键,用于选择拼音候选栏中的候 选字词 ;7、8、9、0 四个数字键定义为形码候选字词选择键,用于选择形码候选栏中的 候选字词。

说明书


方言输入法

    【技术领域】
     本发明属于计算机汉字输入法领域,特别涉及带有形码辅助码的拼音输入法。技术背景 目前拼音输入法占有 90%以上的计算机汉字输入法市场,这些拼音输入法均是 以 《汉语拼音方案》 对汉字编码将汉字输入计算机设备。 然而以普通话做为母语的人群 只有几千万,不足汉语总人口的 10%。 即使在最接近普通话的官话方言区内,用户的发 音也总是带有方音口语,从而形成了一种方言普通话现象。
     针对普通话拼音输入法无法满足用户使用方音口语输入汉字的需要,出现了一 些方言输入法。 然而在方言与方言之间并没有清晰的界限,而且在方言内部还可以分化 出次级方言。 具体到每一个特定用户的方音口语更是千差万别。 所以这些方言输入法无 法做到通用性,只能局限于区域土语。
     发明内容 针对拼音输入法无法满足每一个特定用户使用方音口语输入汉字的需要的技术 问题,本发明的目的在于提供一种可以学习用户方音口语的汉字输入法。
     本发明的目的是通过以下技术方案实现的 :
     (a) 本发明包括以下装置 :
     用于存储汉字的 “声母码元”、“韵母码元”、“拼音字频”、“形码编码”、 “已输入编码” 和 “已输入编码频度” 的 “汉字数据库” ;
     用于存储 “声母码元”、 “韵母码元” 的 “码元编码” 和 “码元编码频度” 的 “码元数据库” ;
     用于存储编码为拼音编码的候选字的 “拼音候选字列表” ;
     用于存储编码为拼音编码和形码编码的候选字的 “形码候选字列表” ;
     当用户输入编码后,用于切分输入编码,将编码为拼音编码的候选字存储到 “拼音候选字列表” 中,将编码为拼音编码和形码编码的候选字存储到 “形码候选字列 表” 中的 “输入编码分析器” ;
     用于根据 “码元编码频度” 为候选字排序的 “拼音序值分析器” ;
     当用户选择候选字后,用于将输入编码中的声母编码、韵母编码做为 “声母码 元”、 “韵母码元” 的 “码元编码” 存储到 “码元数据库” 中,将输入编码做为 “已输 入编码” 存储到 “汉字数据库” 该汉字的 “已输入编码” 中的 “输入编码处理器” ;
     (b) “输入编码分析器”将编码为拼音编码的候选字存储到 “拼音候选字列表” 中,其特征在于包含以下步骤 :
     在 “汉字数据库” 中查找, “已输入编码” 等于输入编码的汉字 ;将该 “已输 入编码” 的 “已输入编码频度” 设置为该候选字的 “序度” ;将所有符合条件的汉字, 按 “序度” 由大到小的顺序排序,添加到 “拼音候选字列表” 中 ;
     在其余未添加到 “拼音候选字列表” 的汉字中查找, “已输入编码” 中的拼音 编码等于输入编码中的拼音编码的汉字 ;将相应 “已输入编码” 的 “已输入编码频度” 总和的值设置为该候选字的 “序度” ;将所有符合条件的汉字,按 “序度” 由大到小的 顺序排序,添加到 “拼音候选字列表” 中 ;
     在其余未添加到 “拼音候选字列表” 的汉字中查找,汉字发音的 “声母码元” 在 “码元数据库” 中的 “码元编码” 等于输入编码中的声母编码并且该发音的 “韵母码 元” 在 “码元数据库” 中的 “码元编码” 等于输入编码中的韵母编码,并且没有 “已输 入编码” 的汉字 ;将所有符合条件的汉字,使用 “拼音序值分析器” 排序,添加到 “拼 音候选字列表” 中 ;
     在其余未添加到 “拼音候选字列表” 的汉字中查找,汉字发音的 “声母码元” 在 “码元数据库” 中的 “码元编码” 等于输入编码中的声母编码并且该发音的 “韵母码 元” 在 “码元数据库” 中的 “码元编码” 等于输入编码中的韵母编码的汉字 ;将所有符 合条件的汉字,使用 “拼音序值分析器” 排序,添加到 “拼音候选字列表” 中 ;
     (c) “输入编码分析器” 将编码为拼音编码和形码编码的候选字存储到 “形码 候选字列表” 中,其特征在于包含以下步骤 : 在 “汉字数据库” 中查找, “已输入编码” 等于输入编码的汉字 ;将该 “已输 入编码” 的 “已输入编码频度” 设置为该候选字的 “序度” ;将所有符合条件的汉字, 按 “序度” 由大到小的顺序排序,添加到 “形码候选字列表” 中 ;
     在其余未添加到 “形码候选字列表” 的汉字中查找, “已输入编码” 中的拼 音编码等于输入编码中的拼音编码,并且 “形码编码” 等于输入编码中的形码编码的 汉字 ;将相应 “已输入编码” 的 “已输入编码频度” 总和的值设置为该候选字的 “序 度” ;将所有符合条件的汉字,按 “序度” 由大到小的顺序排序,添加到 “形码候选字 列表” 中 ;
     在其余未添加到 “形码候选字列表” 的汉字中查找, “已输入编码” 中的拼音 编码等于输入编码中的拼音编码,并且 “形码编码” 的前几个代码等于输入编码中的形 码编码的汉字 ;将相应 “已输入编码” 的 “已输入编码频度” 总和的值设置为该候选字 的 “序度” ;将所有符合条件的汉字,按 “序度” 由大到小的顺序排序,添加到 “形码 候选字列表” 中 ;
     在其余未添加到 “形码候选字列表” 的汉字中查找,汉字发音的 “声母码元” 在 “码元数据库” 中的 “码元编码” 等于输入编码中的声母编码并且该发音的 “韵母码 元” 在 “码元数据库” 中的 “码元编码” 等于输入编码中的韵母编码,并且 “形码编 码” 等于输入编码中的形码编码的汉字 ;将所有符合条件的汉字,使用 “拼音序值分析 器” 排序,添加到 “形码候选字列表” 中 ;
     在其余未添加到 “形码候选字列表” 的汉字中查找,汉字发音的 “声母码元” 在 “码元数据库” 中的 “码元编码” 等于输入编码中的声母编码并且该发音的 “韵母 码元” 在 “码元数据库” 中的 “码元编码” 等于输入编码中的韵母编码,并且 “形码 编码” 的前几个代码等于输入编码中的形码编码的汉字 ;将所有符合条件的汉字,使用 “拼音序值分析器” 排序,添加到 “形码候选字列表” 中 ;
     在其余未添加到 “形码候选字列表” 的汉字中查找,汉字发音的 “声母码元”
     在 “码元数据库” 中的 “码元编码” 等于输入编码中的声母编码或者该发音的 “韵母码 元” 在 “码元数据库” 中的 “码元编码” 等于输入编码中的韵母编码,并且 “形码编 码” 等于输入编码中的形码编码的汉字 ;将所有符合条件的汉字,使用 “拼音序值分析 器” 排序,添加到 “形码候选字列表” 中 ;
     在其余未添加到 “形码候选字列表” 的汉字中查找, “形码编码” 等于输入 编码中的形码编码的汉字 ;将该汉字的 “拼音字频” 总和的值设置为该候选字的 “序 度” ;将所有符合条件的汉字,按 “序度” 由大到小的顺序排序,添加到 “形码候选字 列表” 中 ;
     (d) “拼音序值分析器” 根据 “码元编码频度” 为候选字排序,其特征在于包 含以下步骤 :
     当汉字发音的 “声母码元” 在 “码元数据库” 中的 “码元编码” 等于输入编码 中的声母编码时,将该 “码元编码” 的 “码元编码频度” 除以该 “声母码元” 的所有 “码元编码频度” 总和的商设置为 “声母系数” ;
     如果汉字发音的 “声母码元” 在 “码元数据库” 中的 “码元编码” 均不等于输 入编码中的声母编码,那么将该汉字该拼音的 “声母系数” 设置为一个小于 “汉字数据 库” 中,最大的 “拼音字频” 除以不为零的最小的 “拼音字频” 的商的倒数的正小数 ;
     当该汉字该发音的 “韵母码元” 在 “码元数据库” 中的 “码元编码” 等于输入 编码中的韵母编码时,将该 “码元编码” 的 “码元编码频度” 除以该 “韵母码元” 的所 有 “码元编码频度” 总和的商设置为 “韵母系数” ;
     如果汉字发音的 “韵母码元” 在 “码元数据库” 中的 “码元编码” 均不等于输 入编码中的韵母编码,那么将该汉字该拼音的 “韵母系数” 设置为一个小于 “汉字数据 库” 中,最大的 “拼音字频” 除以不为零的最小的 “拼音字频” 的商的倒数的正小数 ;
     将该汉字该发音的 “声母系数” 乘以该发音的 “韵母系数” 再乘以该发音的 “拼音字频” 设置为该发音的 “拼音序值” ;将该汉字所有发音的 “拼音序值” 的最大 值设置为该汉字的 “序度” ;将所有符合条件的汉字按 “序度” 由大到小的顺序排序 ;
     (e) 当用户选择候选字后, “输入编码处理器” 将输入编码中的声母编码、韵母 编码做为 “声母码元”、 “韵母码元” 的 “码元编码” 存储到 “码元数据库” 中,其特 征在于包含以下步骤 :
     如果用户选择的候选字没有 “已输入编码” 或者 “已输入编码” 中的拼音编码 均不等于该输入编码中的拼音编码,那么 “输入编码处理器” 将该输入编码中的声母编 码做为该 “声母码元” 的 “码元编码” 存储到 “码元数据库” 中,将该输入编码中的韵 母编码做为该 “韵母码元” 的 “码元编码” 存储到 “码元数据库” 中 ;具体过程为 :
     如果该汉字的 “声母码元” 在 “码元数据库” 中已经存储了等于该输入编码中 的声母编码的 “码元编码”,那么将该 “码元编码” 的 “码元编码频度” 加 1 ;如果该 汉字的 “声母码元” 在 “码元数据库” 中没有等于该输入编码中的声母编码的 “码元编 码”,那么将该输入编码中的声母编码存储为该 “声母码元” 的 “码元编码”,并将该 “码元编码” 的 “码元编码频度” 设置为 1 ;
     如果该汉字的 “韵母码元” 在 “码元数据库” 中已经存储了等于该输入编码中 的韵母编码的 “码元编码”,那么将该 “码元编码” 的 “码元编码频度” 加 1 ;如果该汉字的 “韵母码元” 在 “码元数据库” 中没有等于该输入编码中的韵母编码的 “码元编 码”,那么将该输入编码中的韵母编码存储为该 “韵母码元” 的 “码元编码”,并将该 “码元编码” 的 “码元编码频度” 设置为 1 ;
     如果 “声母码元”、 “韵母码元” 在 “码元数据库” 中预设的 “码元编码” 不等于用户输入的拼音编码,那么可以判断出用户该汉字的发音不等于该汉字的典型发 音;
     (f) 当用户选择候选字后, “输入编码处理器” 将输入编码做为 “已输入编码” 存储到 “汉字数据库” 该汉字的 “已输入编码” 中,其特征在于包含以下步骤 :
     如果该汉字在 “汉字数据库” 中已经存储了等于该输入编码的 “已输入编 码”,那么将该 “已输入编码” 的 “已输入编码频度” 加 1 ;如果该汉字在 “汉字数据 库” 中没有 “已输入编码” 或者 “已输入编码” 均不等于该输入编码,那么将该输入编 码存储为该汉字的 “已输入编码”,并将该汉字相应的 “拼音字频” 加 1 的值设置为该 “已输入编码” 的 “已输入编码频度”。
     (g) 将汉字的每一个发音的声母音位、韵母音位做为汉字拼音编码的编码码元 ; 将汉字的每一个发音的 “声母码元”、 “韵母码元” 和该发音的 “拼音字频” 设置为一 组,存储在 “汉字数据库” 中 ; 在 “汉字数据库中” 为每一个汉字记录设置多组 “声母码元”、 “韵母码 元”、 “拼音字频” 字段,设置一个 “形码编码” 字段,设置多组 “已输入编码”、 “已输入编码频度” 字段,可以如下结构 :
     {
     声母码元 1 ;韵母码元 1 ;拼音字频 1 ;
     声母码元 2 ;韵母码元 2 ;拼音字频 2 ;
     ......
     形码编码 ;
     已输入编码 1 ;已输入编码频度 1 ;
     已输入编码 2 ;已输入编码频度 2 ;
     ......
     }
     (h) 在 “码元数据库” 中,为每一个 “声母码元”、 “韵母码元” 记录设置多 组 “码元编码”、 “码元编码频度” 字段,可以如下结构 :
     {
     码元编码 1 ;码元编码频度 1 ;码元编码 2 ;码元编码频度 2 ; ……
     }
     在 “码元数据库” 中,为每一个 “声母码元”、 “韵母码元” 预设一个 “码元 编码”。
     (i) 选取 150 个常用偏旁部首做为对汉字字形编码的编码码元 ;将 150 个编码 码元,按其汉语拼音首字母分成 21 组,指定到计算机通用键盘的 21 个字母键上,具体 为:
     b :卜、八、匕、勹、冫、贝、白、貝 ;
     c :厂、艹、寸、彳、辶、车、 虫、車 ;
     d :丶、刂、刀、大、歹 ;
     e :儿、耳 ;
     f : 、匚、阝、 方;
     g :广、弓、戈、革 ;
     h :一、丷、火、灬、户、禾、虍 ;
     j :冂、几、卩、巾、彐、己、孑、见、斤、钅、臼、見、角、釒、金 ;
     k :凵、口 ;
     l :力、 立 ;
     m :冖、门、宀、马、木、目、皿、米、門、 馬;
     n :女、牛、牜、鸟、疒、鳥 ;
     p :丿、攵 ;
     q :犭、犬、气 ;
     r :亻、人、日 ;
     s :亅、丨、十、厶、士、扌、山、彡、饣、氵、尸、巳、纟、水、礻、石、 罒、糹、身 ;
     t :亠、土、田 ; w :囗、王、文 ; x: 小、夕、忄、心、穴、 、 讠、 又、 廴、 弋、 已、 曰、 月、 衤、 页、 羊、 雨、 鱼、 頁、 ; y : 、  z : 、魚;
     、乙、乛、乚、夂、丬、子、止、爫、自、舟、走、足、依笔顺取汉字字形的第一、第二、最末一个编码码元的代码进行编码 ;当汉字 的字形由两个编码码元组成时,依笔顺依次取其字形的第一、第二个编码码元的代码进 行编码 ;当汉字的字形由一个编码码元组成时,取这个编码码元的代码进行编码 ;
     单字输入 :
     输入汉字的拼音编码 ;
     先输入汉字的拼音编码,再输入汉字的形码编码 ;
     词组输入 : 依次输入构成词组的汉字的拼音编码 ;
     先依次输入构成词组的汉字的拼音编码,再依次输入汉字的形码编码。
     (j) 输入法候选字词窗口,分为拼音候选栏和形码候选栏 ;拼音候选栏用于显示 “拼音候选字列表” 中的候选字词 ;形码候选栏用于显示 “形码候选字列表” 中的候选 字词 ;
     1、2、3、4、5 五个数字键定义为拼音候选字词选择键,用于选择拼音候选栏中 的候选字词 ;7、8、9、0 四个数字键定义为形码候选字词选择键,用于选择形码候选栏 中的候选字词。
     本发明分栏显示候选字词,有效地解决了输入编码切分冲突的问题。
     本发明克服拼音输入法必须要有拼音编码的技术偏见,在 “汉字数据库” 中没
     有预设汉字的拼音编码,将汉字发音的 “声母码元”、 “韵母码元” 做为拼音编码的编 码码元具有实质性特点。 本发明提供了一种不同构思的解决方案,输入法通过学习 “声 母码元”、 “韵母码元” 的 “码元编码”,可以动态生成汉字的拼音编码。 本发明不是 让用户按照汉字的典型发音输入汉字,而是让输入法学习用户的方音口语,能够让用户 使用自己的方音口语输入不等于典型发音的汉字,取得了预料不到的技术效果。 本发明 解决了拼音输入法无法输入方音口语的技术难题,具有显著的技术进步。 附图说明
     图 1 是本发明拼音编码和形码全码输入单字的一个实施例 ;
     图 2 是本发明拼音编码和形码简码输入单字的一个实施例 ;
     图 3 是本发明拼音编码输入单字的一个实施例 ;
     图 4 是本发明拼音编码输入词组的一个实施例。 具体实施方式
     本发明可以使用任意一种音标系统标记汉字的发音。 例如可以使用 《汉语拼音 方案》 标记汉字的发音 ;在 “音标数据库” 中,为每一个 《汉语拼音方案》 标记的 “声 母码元”、 “韵母码元” 预设一个 《汉语拼音方案》 编码的 “码元编码”。 还可以使 用国际音标标记汉字的发音 ;在 “音标数据库” 中,为每一个国际音标标记的 “声母码 元”、 “韵母码元” 预设一个方言拼音方案编码的 “码元编码”。
     下面举例说明本发明使用 《汉语拼音方案》 标记汉字的发音时,输入汉字的具体过程。
     在 “汉字数据库” 中使用 《汉语拼音方案》 标记汉字的发音。 其中 /y/、 /w/ 是虚音标,不表示实际发音。在 “码元数据库” 中,为每一个 《汉语拼音方案》 标记的 “声母码元”、 “韵 母码元” 预设一个 《汉语拼音方案》 编码的 “码元编码”。
     音标 p y x音标编码 1 p y x音标编码频度 1 音标编码 2 1 1 1音标编码频度 2 ......12CN 102023711 A CN 102023725 A说1明书7/10 页in ......in1 输入第一个单字 :
     用户输入编码
     输入编码 被切分为拼音编码 和形码编码 ;输入编码 中的声母编码为

,韵母编码为
     此时,“屏”、“洴”、“硑”、“拼”等字均没有 “已输入编码”,并且 “形 码编码” 等于输入编码中的形码编码
     “拼” 字 发 音 /pin/ 的 “声 母 码 元” /p/ 在 “码 元 数 据 库” 中 的 “码 元 编 码”

等于输入编码中的声母编码

, “码元编码”

的 “码元编码频度” 1 除以 “声母码元” /p/ 的所有 “码元编码频度” 总和 1 的商是 1,所以 “拼” 字该发音 /pin/ 的 “声母系数” 是 1 ;“拼” 字该发音 /pin/ 的 “韵母码元” /in/ 在 “码元数据库” 中 的 “码元编码” 均不等于输入编码中的韵母编码 ,所以 “拼” 字该发音 /pin/ 的
     “韵母系数” 是 0.00001 ;将 “拼” 字该发音 /pin/ 的 “声母系数” 1 乘以该发音 /pin/ 的 “韵母系数” 0.00001 再乘以 “拼” 字该发音 /pin/ 的 “拼音字频” 0.00009622858 设 置为该发音 /pin/ 的 “拼音序值” 0.00000000096 ;将 “拼” 字所有发音的 “拼音序值” 的最大值 0.00000000096 设置为 “拼” 字的 “序度”;将所有符合条件的汉字按 “序度” 由大到小的顺序排序,添加到 “形码候选字列表” 中。
     如图 1 所示,编码为拼音编码 的候选字显示在拼音候选栏中 ;编码为 拼音编码 和形码编码 的候选字显示在形码候选栏中。
     用户在候选窗口中选择 “拼” 字。
     此时, “拼” 字没有 “已输入编码”,并且 “拼” 字只有一组 “声母码元” / p/、 “韵母码元” /in/。
     “拼” 字的 “声母码元” /p/ 在 “码元数据库” 中已经存储了等于该输入编码 中的声母编码

的 “码元编码”

,所以将 “声母码元” /p/ 的 “码元编码”

的 “码元编码频度” 加 1 ;
     “拼” 字的 “韵母码元” /in/ 在 “码元数据库” 中没有等于该输入编码中的韵 母编码 的 “码元编码”,所以将该输入编码中的韵母编码 存储为该 “韵母码 元” /in/ 的 “码元编码” ,并将该 “码元编码” 的 “码元编码频度” 设置 为 1。
     “拼” 字没有 “已输入编码”,所以将输入编码 存储为 “拼” 字 的 “已 输 入 编 码”, 并 将 “拼” 字 该 发 音 /pin/ 的 “拼 音 字 频” 0.00009622858 加 1 的值 1.00009622858 设置为 “拼” 字该 “已输入编码” 的 “已输入编码频 度” 1.00009622858。
     2 输入第二个单字 :
     用户输入编码 。输入编码 被切分为拼音编码 和形码编码 ;输入编码 中的声母编码为 ,韵母编码为
     此时, “韺”、 “韹”、 “音” 等字均没有 “已输入编码”,并且 “形码编 码” 的第一个代码 等于输入编码中的形码编码
     “音” 字 发 音 /yin/ 的 “声 母 码 元” /y/ 在 “码 元 数 据 库” 中 的 “码 元 编 码” 等于输入编码中的声母编码 , “码元编码” 的 “码元编码频度” 1 除 以 “声母码元” /y/ 的所有 “码元编码频度” 总和 1 的商是 1,所以 “音” 字该发音 / yin/ 的 “声母系数” 是 1 ;“音” 字该发音 /yin/ 的 “韵母码元” /in/ 在 “码元数据 库” 中的 “码元编码” 等于输入编码中的韵母编码 , “码元编码” 的 “码元编码频度” 1 除以 “韵母码元” /in/ 的所有 “码元编码频度” 总和 2 的商是 0.5, 所以 “音” 字该发音 /yin/ 的 “韵母系数” 是 0.5 ;将 “音” 字该发音 /yin/ 的 “声母 系数” 1 乘以该发音 /yin/ 的 “韵母系数” 0.5 再乘以 “音” 字该发音 /yin/ 的 “拼音字 频” 0.00056008620 设置为该发音 /yin/ 的 “拼音序值” 0.00028004310 ;将 “音” 字所 有发音的 “拼音序值” 的最大值 0.00028004310 设置为 “音” 字的 “序度” ;将所有符 合条件的汉字按 “序度” 由大到小的顺序排序,添加到 “形码候选字列表” 中。
     如图 2 所示,编码为拼音编码 的候选字显示在拼音候选栏中 ;编码为拼 音编码 和形码编码 的候选字显示在形码候选栏中。
     用户在候选窗口中选择 “音” 字。
     此时, “音” 字没有 “已输入编码”,并且 “音” 字只有一组 “声母码元” / y/、 “韵母码元” /in/。
     “音” 字的 “声母码元” /y/ 在 “码元数据库” 中已经存储了等于该输入编码 中的声母编码 的 “码元编码” ,所以将 “声母码元” /y/ 的 “码元编码” 的 “码元编码频度” 加 1 ;
     “音” 字的 “韵母码元” /in/ 在 “码元数据库” 中已经存储了等于该输入编 码中的韵母编码 的 “码元编码” ,所以将 “韵母码元” /in/ 的 “码元编 码” 的 “码元编码频度” 加 1。
     “音” 字 没 有 “已 输 入 编 码”, 所 以 将 输 入 编 码 存 储 为 “音” 字 的 “已 输 入 编 码”, 并 将 “音” 字 该 发 音 /yin/ 的 “拼 音 字 频” 0.00056008620 加 1 的 值 1.00056008620 设 置 为 “音” 字 该 “已 输 入 编 码” 的 “已 输 入 编 码 频 度” 1.00056008620。
     3 输入第三个单字 :
     用户输入编码
     输入编码 被切分为拼音编码 ;输入编码 中的声母编码为 ,韵母编码为
     此时, “行”、 “性”、 “形”、 “心”、 “信”、 “新” 等字均没有已输入 编码。
     “新” 字 发 音 /xin/ 的 “声 母 码 元” /x/ 在 “码 元 数 据 库” 中 的 “码 元 编 码” 等于输入编码中的声母编码 , “码元编码” 的 “码元编码频度” 1 除以 “声母码元” /x/ 的所有 “码元编码频度” 总和 1 的商是 1,所以 “新” 字该发音 /xin/的 “声母系数” 是 1 ;“新” 字该发音 /xin/ 的 “韵母码元” /in/ 在 “码元数据库” 中 的 “码元编码” 等于输入编码中的韵母编码 , “码元编码” 的 “码元 编码频度” 2 除以 “韵母码元” /in/ 的所有 “码元编码频度” 总和 3 的商是 0.66667,所 以 “新” 字该发音 /xin/ 的 “韵母系数” 是 0.66667 ;将 “新” 字该发音 /xin/ 的 “声母 系数” 1 乘以该发音 /xin/ 的 “韵母系数” 0.66667 再乘以 “新” 字该发音 /xin/ 的 “拼 音字频” 0.00100885101 设置为该发音 /xin/ 的 “拼音序值” 0.00067257070 ;将 “新” 字所有发音的 “拼音序值” 的最大值 0.00067257070 设置为 “新” 字的 “序度” ;将所 有符合条件的汉字按 “序度” 由大到小的顺序排序,添加到 “拼音候选字列表” 中。
     如图 3 所示,编码为拼音编码 的候选字显示在拼音候选栏中 ;编码为拼 音编码 和形码编码 的候选字显示在形码候选栏中 ;编码为拼音编码 和形 码编码 的候选字显示在形码候选栏中。
     用户在候选窗口中选择 “新” 字。
     此时, “新” 字没有 “已输入编码”,并且 “新” 字只有一组 “声母码元” / x/、 “韵母音标” /in/。
     “新” 字的 “声母码元” /x/ 在 “码元数据库” 中已经存储了等于该输入编码 中的声母编码 的 “码元编码” ,所以将 “声母码元” /x/ 的 “码元编码” 的 “码元编码频度” 加 1 ; “新” 字的 “韵母码元” /in/ 在 “码元数据库” 中已经存储了等于该输入编 码中的韵母编码 的 “码元编码” ,所以将 “韵母码元” /in/ 的 “码元编 码” 的 “码元编码频度” 加 1。
     “新” 字 没 有 “已 输 入 编 码”, 所 以 将 输 入 编 码 存 储 为 “新” 字 的 “已 输 入 编 码”, 并 将 “新” 字 该 发 音 /xin/ 的 “拼 音 字 频” 0.00100885101 加 1 的 值 1.00100885101 设 置 为 “新” 字 该 “已 输 入 编 码” 的 “已 输 入 编 码 频 度” 1.00100885101。
     4 输入词组 :
     用户输入编码 “xingpingying”。
     此时, “新” 字所对应的输入编码为 , “拼” 字所对应的输入编码为 , “音” 字所对应的输入编码为
     如图 4 所示,编码为拼音编码 的候选字词显示在拼音候选栏中 ; 编码为拼音编码 和形码编码 的候选字词显示在形码候选栏中 ;编码为 拼音编码 和形码编码 的候选字词显示在形码候选栏中。
     用户在候选窗口中选择词组 “新拼音”。
     通过以上实施例可以得出 :当用户发音的某个 “声母码元” 或 “韵母码元” 偶 尔混淆为其他码元时,该码元的拼音系数接近于 0,输入法可以通过 “已输入编码”记住 这些混淆字的拼音编码 ;当用户发音的某个 “声母码元” 或 “韵母码元” 总是混淆为其 他码元时,该码元的拼音系数接近于 1,输入法可以通过 “码元编码” 动态生成这些混 淆字的拼音编码 ;当用户发音的某个 “声母码元” 或 “韵母码元” 部分混淆为其他码元 时,该码元的拼音系数介于 0 与 1 之间,输入法可以通过 “拼音字频” 优先显示这些混 淆字中的高频字。
     本发明解决了拼音输入法无法输入方音口语的技术难题,开创了面向用户设计 输入法的技术潮流,具有显著的技术进步。

方言输入法.pdf_第1页
第1页 / 共17页
方言输入法.pdf_第2页
第2页 / 共17页
方言输入法.pdf_第3页
第3页 / 共17页
点击查看更多>>
资源描述

《方言输入法.pdf》由会员分享,可在线阅读,更多相关《方言输入法.pdf(17页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN102023711A43申请公布日20110420CN102023711ACN102023711A21申请号200910070553322申请日20090923G06F3/023200601G06F17/3020060171申请人王雅弟地址300250天津市河北区革新道颂光里28105室72发明人王雅弟54发明名称方言输入法57摘要本发明属于计算机汉字输入法领域,特别涉及带有形码辅助码的拼音输入法。当用户输入编码后,“输入编码分析器”将编码为拼音编码的候选字存储到“拼音候选字列表”中,将编码为拼音编码和形码编码的候选字存储到“形码候选字列表”中;“拼音序值分析器”根据“码元编。

2、码频度”为候选字排序;当用户选择候选字后,“输入编码处理器”将输入编码中的声母编码、韵母编码做为“声母码元”、“韵母码元”的“码元编码”存储到“码元数据库”中,将输入编码做为“已输入编码”存储到“汉字数据库”该汉字的“已输入编码”中。发明解决了拼音输入法无法输入方音口语的技术难题,具有显著的技术进步。51INTCL19中华人民共和国国家知识产权局12发明专利申请权利要求书5页说明书10页附图1页CN102023725A1/5页21一种计算机汉字输入法,其特征在于A本发明包括以下装置用于存储汉字的“声母码元”、“韵母码元”、“拼音字频”、“形码编码”、“已输入编码”和“已输入编码频度”的“汉字数。

3、据库”;用于存储“声母码元”、“韵母码元”的“码元编码”和“码元编码频度”的“码元数据库”;用于存储编码为拼音编码的候选字的“拼音候选字列表”;用于存储编码为拼音编码和形码编码的候选字的“形码候选字列表”;当用户输入编码后,用于切分输入编码,将编码为拼音编码的候选字存储到“拼音候选字列表”中,将编码为拼音编码和形码编码的候选字存储到“形码候选字列表”中的“输入编码分析器”;用于根据“码元编码频度”为候选字排序的“拼音序值分析器”;当用户选择候选字后,用于将输入编码中的声母编码、韵母编码做为“声母码元”、“韵母码元”的“码元编码”存储到“码元数据库”中,将输入编码做为“已输入编码”存储到“汉字数。

4、据库”该汉字的“已输入编码”中的“输入编码处理器”;B“输入编码分析器”将编码为拼音编码的候选字存储到“拼音候选字列表”中,其特征在于包含以下步骤在“汉字数据库”中查找,“已输入编码”等于输入编码的汉字;将该“已输入编码”的“已输入编码频度”设置为该候选字的“序度”;将所有符合条件的汉字,按“序度”由大到小的顺序排序,添加到“拼音候选字列表”中;在其余未添加到“拼音候选字列表”的汉字中查找,“已输入编码”中的拼音编码等于输入编码中的拼音编码的汉字;将相应“已输入编码”的“已输入编码频度”总和的值设置为该候选字的“序度”;将所有符合条件的汉字,按“序度”由大到小的顺序排序,添加到“拼音候选字列表。

5、”中;在其余未添加到“拼音候选字列表”的汉字中查找,汉字发音的“声母码元”在“码元数据库”中的“码元编码”等于输入编码中的声母编码并且该发音的“韵母码元”在“码元数据库”中的“码元编码”等于输入编码中的韵母编码,并且没有“已输入编码”的汉字;将所有符合条件的汉字,使用“拼音序值分析器”排序,添加到“拼音候选字列表”中;在其余未添加到“拼音候选字列表”的汉字中查找,汉字发音的“声母码元”在“码元数据库”中的“码元编码”等于输入编码中的声母编码并且该发音的“韵母码元”在“码元数据库”中的“码元编码”等于输入编码中的韵母编码的汉字;将所有符合条件的汉字,使用“拼音序值分析器”排序,添加到“拼音候选字。

6、列表”中;C“输入编码分析器”将编码为拼音编码和形码编码的候选字存储到“形码候选字列表”中,其特征在于包含以下步骤在“汉字数据库”中查找,“已输入编码”等于输入编码的汉字;将该“已输入编码”的“已输入编码频度”设置为该候选字的“序度”;将所有符合条件的汉字,按“序度”由大到小的顺序排序,添加到“形码候选字列表”中;在其余未添加到“形码候选字列表”的汉字中查找,“已输入编码”中的拼音编码权利要求书CN102023711ACN102023725A2/5页3等于输入编码中的拼音编码,并且“形码编码”等于输入编码中的形码编码的汉字;将相应“已输入编码”的“已输入编码频度”总和的值设置为该候选字的“序度。

7、”;将所有符合条件的汉字,按“序度”由大到小的顺序排序,添加到“形码候选字列表”中;在其余未添加到“形码候选字列表”的汉字中查找,“已输入编码”中的拼音编码等于输入编码中的拼音编码,并且“形码编码”的前几个代码等于输入编码中的形码编码的汉字;将相应“已输入编码”的“已输入编码频度”总和的值设置为该候选字的“序度”;将所有符合条件的汉字,按“序度”由大到小的顺序排序,添加到“形码候选字列表”中;在其余未添加到“形码候选字列表”的汉字中查找,汉字发音的“声母码元”在“码元数据库”中的“码元编码”等于输入编码中的声母编码并且该发音的“韵母码元”在“码元数据库”中的“码元编码”等于输入编码中的韵母编码。

8、,并且“形码编码”等于输入编码中的形码编码的汉字;将所有符合条件的汉字,使用“拼音序值分析器”排序,添加到“形码候选字列表”中;在其余未添加到“形码候选字列表”的汉字中查找,汉字发音的“声母码元”在“码元数据库”中的“码元编码”等于输入编码中的声母编码并且该发音的“韵母码元”在“码元数据库”中的“码元编码”等于输入编码中的韵母编码,并且“形码编码”的前几个代码等于输入编码中的形码编码的汉字;将所有符合条件的汉字,使用“拼音序值分析器”排序,添加到“形码候选字列表”中;在其余未添加到“形码候选字列表”的汉字中查找,汉字发音的“声母码元”在“码元数据库”中的“码元编码”等于输入编码中的声母编码或者。

9、该发音的“韵母码元”在“码元数据库”中的“码元编码”等于输入编码中的韵母编码,并且“形码编码”等于输入编码中的形码编码的汉字;将所有符合条件的汉字,使用“拼音序值分析器”排序,添加到“形码候选字列表”中;在其余未添加到“形码候选字列表”的汉字中查找,“形码编码”等于输入编码中的形码编码的汉字;将该汉字的“拼音字频”总和的值设置为该候选字的“序度”;将所有符合条件的汉字,按“序度”由大到小的顺序排序,添加到“形码候选字列表”中;D“拼音序值分析器”根据“码元编码频度”为候选字排序,其特征在于包含以下步骤当汉字发音的“声母码元”在“码元数据库”中的“码元编码”等于输入编码中的声母编码时,将该“码元。

10、编码”的“码元编码频度”除以该“声母码元”的所有“码元编码频度”总和的商设置为“声母系数”;当该汉字该发音的“韵母码元”在“码元数据库”中的“码元编码”等于输入编码中的韵母编码时,将该“码元编码”的“码元编码频度”除以该“韵母码元”的所有“码元编码频度”总和的商设置为“韵母系数”;将该汉字该发音的“声母系数”乘以该发音的“韵母系数”再乘以该发音的“拼音字频”设置为该发音的“拼音序值”;将该汉字所有发音的“拼音序值”的最大值设置为该汉字的“序度”;将所有符合条件的汉字按“序度”由大到小的顺序排序;E当用户选择候选字后,“输入编码处理器”将输入编码中的声母编码、韵母编码权利要求书CN1020237。

11、11ACN102023725A3/5页4做为“声母码元”、“韵母码元”的“码元编码”存储到“码元数据库”中,其特征在于包含以下步骤如果用户选择的候选字没有“已输入编码”或者“已输入编码”中的拼音编码均不等于该输入编码中的拼音编码,那么“输入编码处理器”将该输入编码中的声母编码做为该“声母码元”的“码元编码”存储到“码元数据库”中,将该输入编码中的韵母编码做为该“韵母码元”的“码元编码”存储到“码元数据库”中;具体过程为如果该汉字的“声母码元”在“码元数据库”中已经存储了等于该输入编码中的声母编码的“码元编码”,那么将该“码元编码”的“码元编码频度”加1;如果该汉字的“声母码元”在“码元数据库”。

12、中没有等于该输入编码中的声母编码的“码元编码”,那么将该输入编码中的声母编码存储为该“声母码元”的“码元编码”,并将该“码元编码”的“码元编码频度”设置为1;如果该汉字的“韵母码元”在“码元数据库”中已经存储了等于该输入编码中的韵母编码的“码元编码”,那么将该“码元编码”的“码元编码频度”加1;如果该汉字的“韵母码元”在“码元数据库”中没有等于该输入编码中的韵母编码的“码元编码”,那么将该输入编码中的韵母编码存储为该“韵母码元”的“码元编码”,并将该“码元编码”的“码元编码频度”设置为1;F当用户选择候选字后,“输入编码处理器”将输入编码做为“已输入编码”存储到“汉字数据库”该汉字的“已输入编。

13、码”中,其特征在于包含以下步骤如果该汉字在“汉字数据库”中已经存储了等于该输入编码的“已输入编码”,那么将该“已输入编码”的“已输入编码频度”加1;如果该汉字在“汉字数据库”中没有“已输入编码”或者“已输入编码”均不等于该输入编码,那么将该输入编码存储为该汉字的“已输入编码”,并将该汉字相应的“拼音字频”加1的值设置为该“已输入编码”的“已输入编码频度”。2根据权利要求1所述的汉字输入法,其特征在于将汉字的每一个发音的声母音位、韵母音位做为汉字拼音编码的编码码元;将汉字的每一个发音的“声母码元”、“韵母码元”和该发音的“拼音字频”设置为一组,存储在“汉字数据库”中;在“汉字数据库中”为每一个汉。

14、字记录设置多组“声母码元”、“韵母码元”、“拼音字频”字段,设置一个“形码编码”字段,设置多组“已输入编码”、“已输入编码频度”字段,可以如下结构声母码元1;韵母码元1;拼音字频1;声母码元2;韵母码元2;拼音字频2;形码编码;已输入编码1;已输入编码频度1;已输入编码2;已输入编码频度2;权利要求书CN102023711ACN102023725A4/5页53根据权利要求1所述的汉字输入法,其特征在于在“码元数据库”中,为每一个“声母码元”、“韵母码元”记录设置多组“码元编码”、“码元编码频度”字段,可以如下结构码元编码1;码元编码频度1;码元编码2;码元编码频度2;在“码元数据库”中,为每一。

15、个“声母码元”、“韵母码元”预设一个“码元编码”。4根据权利要求1所述的汉字输入法,其特征在于选取150个常用偏旁部首做为对汉字字形编码的编码码元;将150个编码码元,按其汉语拼音首字母分成21组,指定到计算机通用键盘的21个字母键上,具体为B卜、八、匕、勹、冫、贝、白、貝;C厂、艹、寸、彳、辶、车、虫、車;D丶、刂、刀、大、歹;E儿、耳;F、匚、阝、方;G广、弓、戈、革;H一、丷、火、灬、户、禾、虍;J冂、几、卩、巾、彐、己、孑、见、斤、钅、臼、見、角、釒、金;K凵、口;L力、立;M冖、门、宀、马、木、目、皿、米、門、馬;N女、牛、牜、鸟、疒、鳥;P丿、攵;Q犭、犬、气;R亻、人、日;S亅、。

16、丨、十、厶、士、扌、山、彡、饣、氵、尸、巳、纟、水、礻、石、罒、糹、身;T亠、土、田;W囗、王、文;X小、夕、忄、心、穴、Y、讠、又、廴、弋、已、曰、月、衤、页、羊、雨、鱼、頁、魚;Z、乙、乛、乚、夂、丬、子、止、爫、自、舟、走、足、;依笔顺取汉字字形的第一、第二、最末一个编码码元的代码进行编码;当汉字的字形由两个编码码元组成时,依笔顺依次取其字形的第一、第二个编码码元的代码进行编码;当汉字的字形由一个编码码元组成时,取这个编码码元的代码进行编码;单字输入输入汉字的拼音编码;先输入汉字的拼音编码,再输入汉字的形码编码;权利要求书CN102023711ACN102023725A5/5页6词组输入。

17、依次输入构成词组的汉字的拼音编码;先依次输入构成词组的汉字的拼音编码,再依次输入汉字的形码编码。5根据权利要求1所述的汉字输入法,其特征在于输入法候选字词窗口,分为拼音候选栏和形码候选栏;拼音候选栏用于显示“拼音候选字列表”中的候选字词;形码候选栏用于显示“形码候选字列表”中的候选字词;1、2、3、4、5五个数字键定义为拼音候选字词选择键,用于选择拼音候选栏中的候选字词;7、8、9、0四个数字键定义为形码候选字词选择键,用于选择形码候选栏中的候选字词。权利要求书CN102023711ACN102023725A1/10页7方言输入法技术领域0001本发明属于计算机汉字输入法领域,特别涉及带有形码。

18、辅助码的拼音输入法。技术背景0002目前拼音输入法占有90以上的计算机汉字输入法市场,这些拼音输入法均是以汉语拼音方案对汉字编码将汉字输入计算机设备。然而以普通话做为母语的人群只有几千万,不足汉语总人口的10。即使在最接近普通话的官话方言区内,用户的发音也总是带有方音口语,从而形成了一种方言普通话现象。0003针对普通话拼音输入法无法满足用户使用方音口语输入汉字的需要,出现了一些方言输入法。然而在方言与方言之间并没有清晰的界限,而且在方言内部还可以分化出次级方言。具体到每一个特定用户的方音口语更是千差万别。所以这些方言输入法无法做到通用性,只能局限于区域土语。发明内容0004针对拼音输入法无法。

19、满足每一个特定用户使用方音口语输入汉字的需要的技术问题,本发明的目的在于提供一种可以学习用户方音口语的汉字输入法。0005本发明的目的是通过以下技术方案实现的0006A本发明包括以下装置0007用于存储汉字的“声母码元”、“韵母码元”、“拼音字频”、“形码编码”、“已输入编码”和“已输入编码频度”的“汉字数据库”;0008用于存储“声母码元”、“韵母码元”的“码元编码”和“码元编码频度”的“码元数据库”;0009用于存储编码为拼音编码的候选字的“拼音候选字列表”;0010用于存储编码为拼音编码和形码编码的候选字的“形码候选字列表”;0011当用户输入编码后,用于切分输入编码,将编码为拼音编码的。

20、候选字存储到“拼音候选字列表”中,将编码为拼音编码和形码编码的候选字存储到“形码候选字列表”中的“输入编码分析器”;0012用于根据“码元编码频度”为候选字排序的“拼音序值分析器”;0013当用户选择候选字后,用于将输入编码中的声母编码、韵母编码做为“声母码元”、“韵母码元”的“码元编码”存储到“码元数据库”中,将输入编码做为“已输入编码”存储到“汉字数据库”该汉字的“已输入编码”中的“输入编码处理器”;0014B“输入编码分析器”将编码为拼音编码的候选字存储到“拼音候选字列表”中,其特征在于包含以下步骤0015在“汉字数据库”中查找,“已输入编码”等于输入编码的汉字;将该“已输入编码”的“已。

21、输入编码频度”设置为该候选字的“序度”;将所有符合条件的汉字,按“序度”由大到小的顺序排序,添加到“拼音候选字列表”中;说明书CN102023711ACN102023725A2/10页80016在其余未添加到“拼音候选字列表”的汉字中查找,“已输入编码”中的拼音编码等于输入编码中的拼音编码的汉字;将相应“已输入编码”的“已输入编码频度”总和的值设置为该候选字的“序度”;将所有符合条件的汉字,按“序度”由大到小的顺序排序,添加到“拼音候选字列表”中;0017在其余未添加到“拼音候选字列表”的汉字中查找,汉字发音的“声母码元”在“码元数据库”中的“码元编码”等于输入编码中的声母编码并且该发音的“韵。

22、母码元”在“码元数据库”中的“码元编码”等于输入编码中的韵母编码,并且没有“已输入编码”的汉字;将所有符合条件的汉字,使用“拼音序值分析器”排序,添加到“拼音候选字列表”中;0018在其余未添加到“拼音候选字列表”的汉字中查找,汉字发音的“声母码元”在“码元数据库”中的“码元编码”等于输入编码中的声母编码并且该发音的“韵母码元”在“码元数据库”中的“码元编码”等于输入编码中的韵母编码的汉字;将所有符合条件的汉字,使用“拼音序值分析器”排序,添加到“拼音候选字列表”中;0019C“输入编码分析器”将编码为拼音编码和形码编码的候选字存储到“形码候选字列表”中,其特征在于包含以下步骤0020在“汉字。

23、数据库”中查找,“已输入编码”等于输入编码的汉字;将该“已输入编码”的“已输入编码频度”设置为该候选字的“序度”;将所有符合条件的汉字,按“序度”由大到小的顺序排序,添加到“形码候选字列表”中;0021在其余未添加到“形码候选字列表”的汉字中查找,“已输入编码”中的拼音编码等于输入编码中的拼音编码,并且“形码编码”等于输入编码中的形码编码的汉字;将相应“已输入编码”的“已输入编码频度”总和的值设置为该候选字的“序度”;将所有符合条件的汉字,按“序度”由大到小的顺序排序,添加到“形码候选字列表”中;0022在其余未添加到“形码候选字列表”的汉字中查找,“已输入编码”中的拼音编码等于输入编码中的拼。

24、音编码,并且“形码编码”的前几个代码等于输入编码中的形码编码的汉字;将相应“已输入编码”的“已输入编码频度”总和的值设置为该候选字的“序度”;将所有符合条件的汉字,按“序度”由大到小的顺序排序,添加到“形码候选字列表”中;0023在其余未添加到“形码候选字列表”的汉字中查找,汉字发音的“声母码元”在“码元数据库”中的“码元编码”等于输入编码中的声母编码并且该发音的“韵母码元”在“码元数据库”中的“码元编码”等于输入编码中的韵母编码,并且“形码编码”等于输入编码中的形码编码的汉字;将所有符合条件的汉字,使用“拼音序值分析器”排序,添加到“形码候选字列表”中;0024在其余未添加到“形码候选字列表。

25、”的汉字中查找,汉字发音的“声母码元”在“码元数据库”中的“码元编码”等于输入编码中的声母编码并且该发音的“韵母码元”在“码元数据库”中的“码元编码”等于输入编码中的韵母编码,并且“形码编码”的前几个代码等于输入编码中的形码编码的汉字;将所有符合条件的汉字,使用“拼音序值分析器”排序,添加到“形码候选字列表”中;0025在其余未添加到“形码候选字列表”的汉字中查找,汉字发音的“声母码元”说明书CN102023711ACN102023725A3/10页9在“码元数据库”中的“码元编码”等于输入编码中的声母编码或者该发音的“韵母码元”在“码元数据库”中的“码元编码”等于输入编码中的韵母编码,并且“。

26、形码编码”等于输入编码中的形码编码的汉字;将所有符合条件的汉字,使用“拼音序值分析器”排序,添加到“形码候选字列表”中;0026在其余未添加到“形码候选字列表”的汉字中查找,“形码编码”等于输入编码中的形码编码的汉字;将该汉字的“拼音字频”总和的值设置为该候选字的“序度”;将所有符合条件的汉字,按“序度”由大到小的顺序排序,添加到“形码候选字列表”中;0027D“拼音序值分析器”根据“码元编码频度”为候选字排序,其特征在于包含以下步骤0028当汉字发音的“声母码元”在“码元数据库”中的“码元编码”等于输入编码中的声母编码时,将该“码元编码”的“码元编码频度”除以该“声母码元”的所有“码元编码频。

27、度”总和的商设置为“声母系数”;0029如果汉字发音的“声母码元”在“码元数据库”中的“码元编码”均不等于输入编码中的声母编码,那么将该汉字该拼音的“声母系数”设置为一个小于“汉字数据库”中,最大的“拼音字频”除以不为零的最小的“拼音字频”的商的倒数的正小数;0030当该汉字该发音的“韵母码元”在“码元数据库”中的“码元编码”等于输入编码中的韵母编码时,将该“码元编码”的“码元编码频度”除以该“韵母码元”的所有“码元编码频度”总和的商设置为“韵母系数”;0031如果汉字发音的“韵母码元”在“码元数据库”中的“码元编码”均不等于输入编码中的韵母编码,那么将该汉字该拼音的“韵母系数”设置为一个小于。

28、“汉字数据库”中,最大的“拼音字频”除以不为零的最小的“拼音字频”的商的倒数的正小数;0032将该汉字该发音的“声母系数”乘以该发音的“韵母系数”再乘以该发音的“拼音字频”设置为该发音的“拼音序值”;将该汉字所有发音的“拼音序值”的最大值设置为该汉字的“序度”;将所有符合条件的汉字按“序度”由大到小的顺序排序;0033E当用户选择候选字后,“输入编码处理器”将输入编码中的声母编码、韵母编码做为“声母码元”、“韵母码元”的“码元编码”存储到“码元数据库”中,其特征在于包含以下步骤0034如果用户选择的候选字没有“已输入编码”或者“已输入编码”中的拼音编码均不等于该输入编码中的拼音编码,那么“输入。

29、编码处理器”将该输入编码中的声母编码做为该“声母码元”的“码元编码”存储到“码元数据库”中,将该输入编码中的韵母编码做为该“韵母码元”的“码元编码”存储到“码元数据库”中;具体过程为0035如果该汉字的“声母码元”在“码元数据库”中已经存储了等于该输入编码中的声母编码的“码元编码”,那么将该“码元编码”的“码元编码频度”加1;如果该汉字的“声母码元”在“码元数据库”中没有等于该输入编码中的声母编码的“码元编码”,那么将该输入编码中的声母编码存储为该“声母码元”的“码元编码”,并将该“码元编码”的“码元编码频度”设置为1;0036如果该汉字的“韵母码元”在“码元数据库”中已经存储了等于该输入编码。

30、中的韵母编码的“码元编码”,那么将该“码元编码”的“码元编码频度”加1;如果该说明书CN102023711ACN102023725A4/10页10汉字的“韵母码元”在“码元数据库”中没有等于该输入编码中的韵母编码的“码元编码”,那么将该输入编码中的韵母编码存储为该“韵母码元”的“码元编码”,并将该“码元编码”的“码元编码频度”设置为1;0037如果“声母码元”、“韵母码元”在“码元数据库”中预设的“码元编码”不等于用户输入的拼音编码,那么可以判断出用户该汉字的发音不等于该汉字的典型发音;0038F当用户选择候选字后,“输入编码处理器”将输入编码做为“已输入编码”存储到“汉字数据库”该汉字的“已。

31、输入编码”中,其特征在于包含以下步骤0039如果该汉字在“汉字数据库”中已经存储了等于该输入编码的“已输入编码”,那么将该“已输入编码”的“已输入编码频度”加1;如果该汉字在“汉字数据库”中没有“已输入编码”或者“已输入编码”均不等于该输入编码,那么将该输入编码存储为该汉字的“已输入编码”,并将该汉字相应的“拼音字频”加1的值设置为该“已输入编码”的“已输入编码频度”。0040G将汉字的每一个发音的声母音位、韵母音位做为汉字拼音编码的编码码元;将汉字的每一个发音的“声母码元”、“韵母码元”和该发音的“拼音字频”设置为一组,存储在“汉字数据库”中;0041在“汉字数据库中”为每一个汉字记录设置多。

32、组“声母码元”、“韵母码元”、“拼音字频”字段,设置一个“形码编码”字段,设置多组“已输入编码”、“已输入编码频度”字段,可以如下结构00420043声母码元1;韵母码元1;拼音字频1;0044声母码元2;韵母码元2;拼音字频2;00450046形码编码;0047已输入编码1;已输入编码频度1;0048已输入编码2;已输入编码频度2;004900500051H在“码元数据库”中,为每一个“声母码元”、“韵母码元”记录设置多组“码元编码”、“码元编码频度”字段,可以如下结构00520053码元编码1;码元编码频度1;码元编码2;码元编码频度2;00540055在“码元数据库”中,为每一个“声母码。

33、元”、“韵母码元”预设一个“码元编码”。0056I选取150个常用偏旁部首做为对汉字字形编码的编码码元;将150个编码码元,按其汉语拼音首字母分成21组,指定到计算机通用键盘的21个字母键上,具体为0057B卜、八、匕、勹、冫、贝、白、貝;说明书CN102023711ACN102023725A5/10页110058C厂、艹、寸、彳、辶、车、虫、車;0059D丶、刂、刀、大、歹;0060E儿、耳;0061F、匚、阝、方;0062G广、弓、戈、革;0063H一、丷、火、灬、户、禾、虍;0064J冂、几、卩、巾、彐、己、孑、见、斤、钅、臼、見、角、釒、金;0065K凵、口;0066L力、立;0067。

34、M冖、门、宀、马、木、目、皿、米、門、馬;0068N女、牛、牜、鸟、疒、鳥;0069P丿、攵;0070Q犭、犬、气;0071R亻、人、日;0072S亅、丨、十、厶、士、扌、山、彡、饣、氵、尸、巳、纟、水、礻、石、罒、糹、身;0073T亠、土、田;0074W囗、王、文;0075X小、夕、忄、心、穴、0076Y、讠、又、廴、弋、已、曰、月、衤、页、羊、雨、鱼、頁、魚;0077Z、乙、乛、乚、夂、丬、子、止、爫、自、舟、走、足、;0078依笔顺取汉字字形的第一、第二、最末一个编码码元的代码进行编码;当汉字的字形由两个编码码元组成时,依笔顺依次取其字形的第一、第二个编码码元的代码进行编码;当汉字的字形。

35、由一个编码码元组成时,取这个编码码元的代码进行编码;0079单字输入0080输入汉字的拼音编码;0081先输入汉字的拼音编码,再输入汉字的形码编码;0082词组输入0083依次输入构成词组的汉字的拼音编码;0084先依次输入构成词组的汉字的拼音编码,再依次输入汉字的形码编码。0085J输入法候选字词窗口,分为拼音候选栏和形码候选栏;拼音候选栏用于显示“拼音候选字列表”中的候选字词;形码候选栏用于显示“形码候选字列表”中的候选字词;00861、2、3、4、5五个数字键定义为拼音候选字词选择键,用于选择拼音候选栏中的候选字词;7、8、9、0四个数字键定义为形码候选字词选择键,用于选择形码候选栏中的。

36、候选字词。0087本发明分栏显示候选字词,有效地解决了输入编码切分冲突的问题。0088本发明克服拼音输入法必须要有拼音编码的技术偏见,在“汉字数据库”中没说明书CN102023711ACN102023725A6/10页12有预设汉字的拼音编码,将汉字发音的“声母码元”、“韵母码元”做为拼音编码的编码码元具有实质性特点。本发明提供了一种不同构思的解决方案,输入法通过学习“声母码元”、“韵母码元”的“码元编码”,可以动态生成汉字的拼音编码。本发明不是让用户按照汉字的典型发音输入汉字,而是让输入法学习用户的方音口语,能够让用户使用自己的方音口语输入不等于典型发音的汉字,取得了预料不到的技术效果。本发。

37、明解决了拼音输入法无法输入方音口语的技术难题,具有显著的技术进步。附图说明0089图1是本发明拼音编码和形码全码输入单字的一个实施例;0090图2是本发明拼音编码和形码简码输入单字的一个实施例;0091图3是本发明拼音编码输入单字的一个实施例;0092图4是本发明拼音编码输入词组的一个实施例。具体实施方式0093本发明可以使用任意一种音标系统标记汉字的发音。例如可以使用汉语拼音方案标记汉字的发音;在“音标数据库”中,为每一个汉语拼音方案标记的“声母码元”、“韵母码元”预设一个汉语拼音方案编码的“码元编码”。还可以使用国际音标标记汉字的发音;在“音标数据库”中,为每一个国际音标标记的“声母码元”。

38、、“韵母码元”预设一个方言拼音方案编码的“码元编码”。0094下面举例说明本发明使用汉语拼音方案标记汉字的发音时,输入汉字的具体过程。0095在“汉字数据库”中使用汉语拼音方案标记汉字的发音。其中/Y/、/W/是虚音标,不表示实际发音。00960097在“码元数据库”中,为每一个汉语拼音方案标记的“声母码元”、“韵母码元”预设一个汉语拼音方案编码的“码元编码”。0098音标音标编码1音标编码频度1音标编码2音标编码频度2PP1YY1XX1说明书CN102023711ACN102023725A7/10页13ININ100991输入第一个单字0100用户输入编码。0101输入编码被切分为拼音编码和。

39、形码编码;输入编码中的声母编码为,韵母编码为。0102此时,“屏”、“洴”、“硑”、“拼”等字均没有“已输入编码”,并且“形码编码”等于输入编码中的形码编码。0103“拼”字发音/PIN/的“声母码元”/P/在“码元数据库”中的“码元编码”等于输入编码中的声母编码,“码元编码”的“码元编码频度”1除以“声母码元”/P/的所有“码元编码频度”总和1的商是1,所以“拼”字该发音/PIN/的“声母系数”是1;“拼”字该发音/PIN/的“韵母码元”/IN/在“码元数据库”中的“码元编码”均不等于输入编码中的韵母编码,所以“拼”字该发音/PIN/的“韵母系数”是000001;将“拼”字该发音/PIN/的。

40、“声母系数”1乘以该发音/PIN/的“韵母系数”000001再乘以“拼”字该发音/PIN/的“拼音字频”000009622858设置为该发音/PIN/的“拼音序值”000000000096;将“拼”字所有发音的“拼音序值”的最大值000000000096设置为“拼”字的“序度”;将所有符合条件的汉字按“序度”由大到小的顺序排序,添加到“形码候选字列表”中。0104如图1所示,编码为拼音编码的候选字显示在拼音候选栏中;编码为拼音编码和形码编码的候选字显示在形码候选栏中。0105用户在候选窗口中选择“拼”字。0106此时,“拼”字没有“已输入编码”,并且“拼”字只有一组“声母码元”/P/、“韵母码。

41、元”/IN/。0107“拼”字的“声母码元”/P/在“码元数据库”中已经存储了等于该输入编码中的声母编码的“码元编码”,所以将“声母码元”/P/的“码元编码”的“码元编码频度”加1;0108“拼”字的“韵母码元”/IN/在“码元数据库”中没有等于该输入编码中的韵母编码的“码元编码”,所以将该输入编码中的韵母编码存储为该“韵母码元”/IN/的“码元编码”,并将该“码元编码”的“码元编码频度”设置为1。0109“拼”字没有“已输入编码”,所以将输入编码存储为“拼”字的“已输入编码”,并将“拼”字该发音/PIN/的“拼音字频”000009622858加1的值100009622858设置为“拼”字该“。

42、已输入编码”的“已输入编码频度”100009622858。01102输入第二个单字0111用户输入编码。说明书CN102023711ACN102023725A8/10页140112输入编码被切分为拼音编码和形码编码;输入编码中的声母编码为,韵母编码为。0113此时,“韺”、“韹”、“音”等字均没有“已输入编码”,并且“形码编码”的第一个代码等于输入编码中的形码编码。0114“音”字发音/YIN/的“声母码元”/Y/在“码元数据库”中的“码元编码”等于输入编码中的声母编码,“码元编码”的“码元编码频度”1除以“声母码元”/Y/的所有“码元编码频度”总和1的商是1,所以“音”字该发音/YIN/的“。

43、声母系数”是1;“音”字该发音/YIN/的“韵母码元”/IN/在“码元数据库”中的“码元编码”等于输入编码中的韵母编码,“码元编码”的“码元编码频度”1除以“韵母码元”/IN/的所有“码元编码频度”总和2的商是05,所以“音”字该发音/YIN/的“韵母系数”是05;将“音”字该发音/YIN/的“声母系数”1乘以该发音/YIN/的“韵母系数”05再乘以“音”字该发音/YIN/的“拼音字频”000056008620设置为该发音/YIN/的“拼音序值”000028004310;将“音”字所有发音的“拼音序值”的最大值000028004310设置为“音”字的“序度”;将所有符合条件的汉字按“序度”由大。

44、到小的顺序排序,添加到“形码候选字列表”中。0115如图2所示,编码为拼音编码的候选字显示在拼音候选栏中;编码为拼音编码和形码编码的候选字显示在形码候选栏中。0116用户在候选窗口中选择“音”字。0117此时,“音”字没有“已输入编码”,并且“音”字只有一组“声母码元”/Y/、“韵母码元”/IN/。0118“音”字的“声母码元”/Y/在“码元数据库”中已经存储了等于该输入编码中的声母编码的“码元编码”,所以将“声母码元”/Y/的“码元编码”的“码元编码频度”加1;0119“音”字的“韵母码元”/IN/在“码元数据库”中已经存储了等于该输入编码中的韵母编码的“码元编码”,所以将“韵母码元”/IN。

45、/的“码元编码”的“码元编码频度”加1。0120“音”字没有“已输入编码”,所以将输入编码存储为“音”字的“已输入编码”,并将“音”字该发音/YIN/的“拼音字频”000056008620加1的值100056008620设置为“音”字该“已输入编码”的“已输入编码频度”100056008620。01213输入第三个单字0122用户输入编码。0123输入编码被切分为拼音编码;输入编码中的声母编码为,韵母编码为。0124此时,“行”、“性”、“形”、“心”、“信”、“新”等字均没有已输入编码。0125“新”字发音/XIN/的“声母码元”/X/在“码元数据库”中的“码元编码”等于输入编码中的声母编码。

46、,“码元编码”的“码元编码频度”1除以“声母码元”/X/的所有“码元编码频度”总和1的商是1,所以“新”字该发音/XIN/说明书CN102023711ACN102023725A9/10页15的“声母系数”是1;“新”字该发音/XIN/的“韵母码元”/IN/在“码元数据库”中的“码元编码”等于输入编码中的韵母编码,“码元编码”的“码元编码频度”2除以“韵母码元”/IN/的所有“码元编码频度”总和3的商是066667,所以“新”字该发音/XIN/的“韵母系数”是066667;将“新”字该发音/XIN/的“声母系数”1乘以该发音/XIN/的“韵母系数”066667再乘以“新”字该发音/XIN/的“拼。

47、音字频”000100885101设置为该发音/XIN/的“拼音序值”000067257070;将“新”字所有发音的“拼音序值”的最大值000067257070设置为“新”字的“序度”;将所有符合条件的汉字按“序度”由大到小的顺序排序,添加到“拼音候选字列表”中。0126如图3所示,编码为拼音编码的候选字显示在拼音候选栏中;编码为拼音编码和形码编码的候选字显示在形码候选栏中;编码为拼音编码和形码编码的候选字显示在形码候选栏中。0127用户在候选窗口中选择“新”字。0128此时,“新”字没有“已输入编码”,并且“新”字只有一组“声母码元”/X/、“韵母音标”/IN/。0129“新”字的“声母码元”。

48、/X/在“码元数据库”中已经存储了等于该输入编码中的声母编码的“码元编码”,所以将“声母码元”/X/的“码元编码”的“码元编码频度”加1;0130“新”字的“韵母码元”/IN/在“码元数据库”中已经存储了等于该输入编码中的韵母编码的“码元编码”,所以将“韵母码元”/IN/的“码元编码”的“码元编码频度”加1。0131“新”字没有“已输入编码”,所以将输入编码存储为“新”字的“已输入编码”,并将“新”字该发音/XIN/的“拼音字频”000100885101加1的值100100885101设置为“新”字该“已输入编码”的“已输入编码频度”100100885101。01324输入词组0133用户输入。

49、编码“XINGPINGYING”。0134此时,“新”字所对应的输入编码为,“拼”字所对应的输入编码为,“音”字所对应的输入编码为。0135如图4所示,编码为拼音编码的候选字词显示在拼音候选栏中;编码为拼音编码和形码编码的候选字词显示在形码候选栏中;编码为拼音编码和形码编码的候选字词显示在形码候选栏中。0136用户在候选窗口中选择词组“新拼音”。0137通过以上实施例可以得出当用户发音的某个“声母码元”或“韵母码元”偶尔混淆为其他码元时,该码元的拼音系数接近于0,输入法可以通过“已输入编码”记住这些混淆字的拼音编码;当用户发音的某个“声母码元”或“韵母码元”总是混淆为其他码元时,该码元的拼音系数接近于1,输入法可以通过“码元编码”动态生成这些混淆字的拼音编码;当用户发音的某个“声母码元”或“韵母码元”部分混淆为其他码元时,该码元的拼音系数介于0与1之间,输入法可以通过“拼音字频”优先显示这些混淆字中的高频字。说明书CN102023711ACN102023725A10/10页160138本发明解决了拼音输入法无法输入方音口语的技术难题,开创了面向用户设计输入法的技术潮流,具有显著的技术进步。说明书CN102023711ACN102023725A1/1页17图1图2图3图4说明书附图CN102023711A。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1