《方言输入法.pdf》由会员分享,可在线阅读,更多相关《方言输入法.pdf(17页珍藏版)》请在专利查询网上搜索。
1、10申请公布号CN102023711A43申请公布日20110420CN102023711ACN102023711A21申请号200910070553322申请日20090923G06F3/023200601G06F17/3020060171申请人王雅弟地址300250天津市河北区革新道颂光里28105室72发明人王雅弟54发明名称方言输入法57摘要本发明属于计算机汉字输入法领域,特别涉及带有形码辅助码的拼音输入法。当用户输入编码后,“输入编码分析器”将编码为拼音编码的候选字存储到“拼音候选字列表”中,将编码为拼音编码和形码编码的候选字存储到“形码候选字列表”中;“拼音序值分析器”根据“码元编。
2、码频度”为候选字排序;当用户选择候选字后,“输入编码处理器”将输入编码中的声母编码、韵母编码做为“声母码元”、“韵母码元”的“码元编码”存储到“码元数据库”中,将输入编码做为“已输入编码”存储到“汉字数据库”该汉字的“已输入编码”中。发明解决了拼音输入法无法输入方音口语的技术难题,具有显著的技术进步。51INTCL19中华人民共和国国家知识产权局12发明专利申请权利要求书5页说明书10页附图1页CN102023725A1/5页21一种计算机汉字输入法,其特征在于A本发明包括以下装置用于存储汉字的“声母码元”、“韵母码元”、“拼音字频”、“形码编码”、“已输入编码”和“已输入编码频度”的“汉字数。
3、据库”;用于存储“声母码元”、“韵母码元”的“码元编码”和“码元编码频度”的“码元数据库”;用于存储编码为拼音编码的候选字的“拼音候选字列表”;用于存储编码为拼音编码和形码编码的候选字的“形码候选字列表”;当用户输入编码后,用于切分输入编码,将编码为拼音编码的候选字存储到“拼音候选字列表”中,将编码为拼音编码和形码编码的候选字存储到“形码候选字列表”中的“输入编码分析器”;用于根据“码元编码频度”为候选字排序的“拼音序值分析器”;当用户选择候选字后,用于将输入编码中的声母编码、韵母编码做为“声母码元”、“韵母码元”的“码元编码”存储到“码元数据库”中,将输入编码做为“已输入编码”存储到“汉字数。
4、据库”该汉字的“已输入编码”中的“输入编码处理器”;B“输入编码分析器”将编码为拼音编码的候选字存储到“拼音候选字列表”中,其特征在于包含以下步骤在“汉字数据库”中查找,“已输入编码”等于输入编码的汉字;将该“已输入编码”的“已输入编码频度”设置为该候选字的“序度”;将所有符合条件的汉字,按“序度”由大到小的顺序排序,添加到“拼音候选字列表”中;在其余未添加到“拼音候选字列表”的汉字中查找,“已输入编码”中的拼音编码等于输入编码中的拼音编码的汉字;将相应“已输入编码”的“已输入编码频度”总和的值设置为该候选字的“序度”;将所有符合条件的汉字,按“序度”由大到小的顺序排序,添加到“拼音候选字列表。
5、”中;在其余未添加到“拼音候选字列表”的汉字中查找,汉字发音的“声母码元”在“码元数据库”中的“码元编码”等于输入编码中的声母编码并且该发音的“韵母码元”在“码元数据库”中的“码元编码”等于输入编码中的韵母编码,并且没有“已输入编码”的汉字;将所有符合条件的汉字,使用“拼音序值分析器”排序,添加到“拼音候选字列表”中;在其余未添加到“拼音候选字列表”的汉字中查找,汉字发音的“声母码元”在“码元数据库”中的“码元编码”等于输入编码中的声母编码并且该发音的“韵母码元”在“码元数据库”中的“码元编码”等于输入编码中的韵母编码的汉字;将所有符合条件的汉字,使用“拼音序值分析器”排序,添加到“拼音候选字。
6、列表”中;C“输入编码分析器”将编码为拼音编码和形码编码的候选字存储到“形码候选字列表”中,其特征在于包含以下步骤在“汉字数据库”中查找,“已输入编码”等于输入编码的汉字;将该“已输入编码”的“已输入编码频度”设置为该候选字的“序度”;将所有符合条件的汉字,按“序度”由大到小的顺序排序,添加到“形码候选字列表”中;在其余未添加到“形码候选字列表”的汉字中查找,“已输入编码”中的拼音编码权利要求书CN102023711ACN102023725A2/5页3等于输入编码中的拼音编码,并且“形码编码”等于输入编码中的形码编码的汉字;将相应“已输入编码”的“已输入编码频度”总和的值设置为该候选字的“序度。
7、”;将所有符合条件的汉字,按“序度”由大到小的顺序排序,添加到“形码候选字列表”中;在其余未添加到“形码候选字列表”的汉字中查找,“已输入编码”中的拼音编码等于输入编码中的拼音编码,并且“形码编码”的前几个代码等于输入编码中的形码编码的汉字;将相应“已输入编码”的“已输入编码频度”总和的值设置为该候选字的“序度”;将所有符合条件的汉字,按“序度”由大到小的顺序排序,添加到“形码候选字列表”中;在其余未添加到“形码候选字列表”的汉字中查找,汉字发音的“声母码元”在“码元数据库”中的“码元编码”等于输入编码中的声母编码并且该发音的“韵母码元”在“码元数据库”中的“码元编码”等于输入编码中的韵母编码。
8、,并且“形码编码”等于输入编码中的形码编码的汉字;将所有符合条件的汉字,使用“拼音序值分析器”排序,添加到“形码候选字列表”中;在其余未添加到“形码候选字列表”的汉字中查找,汉字发音的“声母码元”在“码元数据库”中的“码元编码”等于输入编码中的声母编码并且该发音的“韵母码元”在“码元数据库”中的“码元编码”等于输入编码中的韵母编码,并且“形码编码”的前几个代码等于输入编码中的形码编码的汉字;将所有符合条件的汉字,使用“拼音序值分析器”排序,添加到“形码候选字列表”中;在其余未添加到“形码候选字列表”的汉字中查找,汉字发音的“声母码元”在“码元数据库”中的“码元编码”等于输入编码中的声母编码或者。
9、该发音的“韵母码元”在“码元数据库”中的“码元编码”等于输入编码中的韵母编码,并且“形码编码”等于输入编码中的形码编码的汉字;将所有符合条件的汉字,使用“拼音序值分析器”排序,添加到“形码候选字列表”中;在其余未添加到“形码候选字列表”的汉字中查找,“形码编码”等于输入编码中的形码编码的汉字;将该汉字的“拼音字频”总和的值设置为该候选字的“序度”;将所有符合条件的汉字,按“序度”由大到小的顺序排序,添加到“形码候选字列表”中;D“拼音序值分析器”根据“码元编码频度”为候选字排序,其特征在于包含以下步骤当汉字发音的“声母码元”在“码元数据库”中的“码元编码”等于输入编码中的声母编码时,将该“码元。
10、编码”的“码元编码频度”除以该“声母码元”的所有“码元编码频度”总和的商设置为“声母系数”;当该汉字该发音的“韵母码元”在“码元数据库”中的“码元编码”等于输入编码中的韵母编码时,将该“码元编码”的“码元编码频度”除以该“韵母码元”的所有“码元编码频度”总和的商设置为“韵母系数”;将该汉字该发音的“声母系数”乘以该发音的“韵母系数”再乘以该发音的“拼音字频”设置为该发音的“拼音序值”;将该汉字所有发音的“拼音序值”的最大值设置为该汉字的“序度”;将所有符合条件的汉字按“序度”由大到小的顺序排序;E当用户选择候选字后,“输入编码处理器”将输入编码中的声母编码、韵母编码权利要求书CN1020237。
11、11ACN102023725A3/5页4做为“声母码元”、“韵母码元”的“码元编码”存储到“码元数据库”中,其特征在于包含以下步骤如果用户选择的候选字没有“已输入编码”或者“已输入编码”中的拼音编码均不等于该输入编码中的拼音编码,那么“输入编码处理器”将该输入编码中的声母编码做为该“声母码元”的“码元编码”存储到“码元数据库”中,将该输入编码中的韵母编码做为该“韵母码元”的“码元编码”存储到“码元数据库”中;具体过程为如果该汉字的“声母码元”在“码元数据库”中已经存储了等于该输入编码中的声母编码的“码元编码”,那么将该“码元编码”的“码元编码频度”加1;如果该汉字的“声母码元”在“码元数据库”。
12、中没有等于该输入编码中的声母编码的“码元编码”,那么将该输入编码中的声母编码存储为该“声母码元”的“码元编码”,并将该“码元编码”的“码元编码频度”设置为1;如果该汉字的“韵母码元”在“码元数据库”中已经存储了等于该输入编码中的韵母编码的“码元编码”,那么将该“码元编码”的“码元编码频度”加1;如果该汉字的“韵母码元”在“码元数据库”中没有等于该输入编码中的韵母编码的“码元编码”,那么将该输入编码中的韵母编码存储为该“韵母码元”的“码元编码”,并将该“码元编码”的“码元编码频度”设置为1;F当用户选择候选字后,“输入编码处理器”将输入编码做为“已输入编码”存储到“汉字数据库”该汉字的“已输入编。
13、码”中,其特征在于包含以下步骤如果该汉字在“汉字数据库”中已经存储了等于该输入编码的“已输入编码”,那么将该“已输入编码”的“已输入编码频度”加1;如果该汉字在“汉字数据库”中没有“已输入编码”或者“已输入编码”均不等于该输入编码,那么将该输入编码存储为该汉字的“已输入编码”,并将该汉字相应的“拼音字频”加1的值设置为该“已输入编码”的“已输入编码频度”。2根据权利要求1所述的汉字输入法,其特征在于将汉字的每一个发音的声母音位、韵母音位做为汉字拼音编码的编码码元;将汉字的每一个发音的“声母码元”、“韵母码元”和该发音的“拼音字频”设置为一组,存储在“汉字数据库”中;在“汉字数据库中”为每一个汉。
14、字记录设置多组“声母码元”、“韵母码元”、“拼音字频”字段,设置一个“形码编码”字段,设置多组“已输入编码”、“已输入编码频度”字段,可以如下结构声母码元1;韵母码元1;拼音字频1;声母码元2;韵母码元2;拼音字频2;形码编码;已输入编码1;已输入编码频度1;已输入编码2;已输入编码频度2;权利要求书CN102023711ACN102023725A4/5页53根据权利要求1所述的汉字输入法,其特征在于在“码元数据库”中,为每一个“声母码元”、“韵母码元”记录设置多组“码元编码”、“码元编码频度”字段,可以如下结构码元编码1;码元编码频度1;码元编码2;码元编码频度2;在“码元数据库”中,为每一。
15、个“声母码元”、“韵母码元”预设一个“码元编码”。4根据权利要求1所述的汉字输入法,其特征在于选取150个常用偏旁部首做为对汉字字形编码的编码码元;将150个编码码元,按其汉语拼音首字母分成21组,指定到计算机通用键盘的21个字母键上,具体为B卜、八、匕、勹、冫、贝、白、貝;C厂、艹、寸、彳、辶、车、虫、車;D丶、刂、刀、大、歹;E儿、耳;F、匚、阝、方;G广、弓、戈、革;H一、丷、火、灬、户、禾、虍;J冂、几、卩、巾、彐、己、孑、见、斤、钅、臼、見、角、釒、金;K凵、口;L力、立;M冖、门、宀、马、木、目、皿、米、門、馬;N女、牛、牜、鸟、疒、鳥;P丿、攵;Q犭、犬、气;R亻、人、日;S亅、。
16、丨、十、厶、士、扌、山、彡、饣、氵、尸、巳、纟、水、礻、石、罒、糹、身;T亠、土、田;W囗、王、文;X小、夕、忄、心、穴、Y、讠、又、廴、弋、已、曰、月、衤、页、羊、雨、鱼、頁、魚;Z、乙、乛、乚、夂、丬、子、止、爫、自、舟、走、足、;依笔顺取汉字字形的第一、第二、最末一个编码码元的代码进行编码;当汉字的字形由两个编码码元组成时,依笔顺依次取其字形的第一、第二个编码码元的代码进行编码;当汉字的字形由一个编码码元组成时,取这个编码码元的代码进行编码;单字输入输入汉字的拼音编码;先输入汉字的拼音编码,再输入汉字的形码编码;权利要求书CN102023711ACN102023725A5/5页6词组输入。
17、依次输入构成词组的汉字的拼音编码;先依次输入构成词组的汉字的拼音编码,再依次输入汉字的形码编码。5根据权利要求1所述的汉字输入法,其特征在于输入法候选字词窗口,分为拼音候选栏和形码候选栏;拼音候选栏用于显示“拼音候选字列表”中的候选字词;形码候选栏用于显示“形码候选字列表”中的候选字词;1、2、3、4、5五个数字键定义为拼音候选字词选择键,用于选择拼音候选栏中的候选字词;7、8、9、0四个数字键定义为形码候选字词选择键,用于选择形码候选栏中的候选字词。权利要求书CN102023711ACN102023725A1/10页7方言输入法技术领域0001本发明属于计算机汉字输入法领域,特别涉及带有形码。
18、辅助码的拼音输入法。技术背景0002目前拼音输入法占有90以上的计算机汉字输入法市场,这些拼音输入法均是以汉语拼音方案对汉字编码将汉字输入计算机设备。然而以普通话做为母语的人群只有几千万,不足汉语总人口的10。即使在最接近普通话的官话方言区内,用户的发音也总是带有方音口语,从而形成了一种方言普通话现象。0003针对普通话拼音输入法无法满足用户使用方音口语输入汉字的需要,出现了一些方言输入法。然而在方言与方言之间并没有清晰的界限,而且在方言内部还可以分化出次级方言。具体到每一个特定用户的方音口语更是千差万别。所以这些方言输入法无法做到通用性,只能局限于区域土语。发明内容0004针对拼音输入法无法。
19、满足每一个特定用户使用方音口语输入汉字的需要的技术问题,本发明的目的在于提供一种可以学习用户方音口语的汉字输入法。0005本发明的目的是通过以下技术方案实现的0006A本发明包括以下装置0007用于存储汉字的“声母码元”、“韵母码元”、“拼音字频”、“形码编码”、“已输入编码”和“已输入编码频度”的“汉字数据库”;0008用于存储“声母码元”、“韵母码元”的“码元编码”和“码元编码频度”的“码元数据库”;0009用于存储编码为拼音编码的候选字的“拼音候选字列表”;0010用于存储编码为拼音编码和形码编码的候选字的“形码候选字列表”;0011当用户输入编码后,用于切分输入编码,将编码为拼音编码的。
20、候选字存储到“拼音候选字列表”中,将编码为拼音编码和形码编码的候选字存储到“形码候选字列表”中的“输入编码分析器”;0012用于根据“码元编码频度”为候选字排序的“拼音序值分析器”;0013当用户选择候选字后,用于将输入编码中的声母编码、韵母编码做为“声母码元”、“韵母码元”的“码元编码”存储到“码元数据库”中,将输入编码做为“已输入编码”存储到“汉字数据库”该汉字的“已输入编码”中的“输入编码处理器”;0014B“输入编码分析器”将编码为拼音编码的候选字存储到“拼音候选字列表”中,其特征在于包含以下步骤0015在“汉字数据库”中查找,“已输入编码”等于输入编码的汉字;将该“已输入编码”的“已。
21、输入编码频度”设置为该候选字的“序度”;将所有符合条件的汉字,按“序度”由大到小的顺序排序,添加到“拼音候选字列表”中;说明书CN102023711ACN102023725A2/10页80016在其余未添加到“拼音候选字列表”的汉字中查找,“已输入编码”中的拼音编码等于输入编码中的拼音编码的汉字;将相应“已输入编码”的“已输入编码频度”总和的值设置为该候选字的“序度”;将所有符合条件的汉字,按“序度”由大到小的顺序排序,添加到“拼音候选字列表”中;0017在其余未添加到“拼音候选字列表”的汉字中查找,汉字发音的“声母码元”在“码元数据库”中的“码元编码”等于输入编码中的声母编码并且该发音的“韵。
22、母码元”在“码元数据库”中的“码元编码”等于输入编码中的韵母编码,并且没有“已输入编码”的汉字;将所有符合条件的汉字,使用“拼音序值分析器”排序,添加到“拼音候选字列表”中;0018在其余未添加到“拼音候选字列表”的汉字中查找,汉字发音的“声母码元”在“码元数据库”中的“码元编码”等于输入编码中的声母编码并且该发音的“韵母码元”在“码元数据库”中的“码元编码”等于输入编码中的韵母编码的汉字;将所有符合条件的汉字,使用“拼音序值分析器”排序,添加到“拼音候选字列表”中;0019C“输入编码分析器”将编码为拼音编码和形码编码的候选字存储到“形码候选字列表”中,其特征在于包含以下步骤0020在“汉字。
23、数据库”中查找,“已输入编码”等于输入编码的汉字;将该“已输入编码”的“已输入编码频度”设置为该候选字的“序度”;将所有符合条件的汉字,按“序度”由大到小的顺序排序,添加到“形码候选字列表”中;0021在其余未添加到“形码候选字列表”的汉字中查找,“已输入编码”中的拼音编码等于输入编码中的拼音编码,并且“形码编码”等于输入编码中的形码编码的汉字;将相应“已输入编码”的“已输入编码频度”总和的值设置为该候选字的“序度”;将所有符合条件的汉字,按“序度”由大到小的顺序排序,添加到“形码候选字列表”中;0022在其余未添加到“形码候选字列表”的汉字中查找,“已输入编码”中的拼音编码等于输入编码中的拼。
24、音编码,并且“形码编码”的前几个代码等于输入编码中的形码编码的汉字;将相应“已输入编码”的“已输入编码频度”总和的值设置为该候选字的“序度”;将所有符合条件的汉字,按“序度”由大到小的顺序排序,添加到“形码候选字列表”中;0023在其余未添加到“形码候选字列表”的汉字中查找,汉字发音的“声母码元”在“码元数据库”中的“码元编码”等于输入编码中的声母编码并且该发音的“韵母码元”在“码元数据库”中的“码元编码”等于输入编码中的韵母编码,并且“形码编码”等于输入编码中的形码编码的汉字;将所有符合条件的汉字,使用“拼音序值分析器”排序,添加到“形码候选字列表”中;0024在其余未添加到“形码候选字列表。
25、”的汉字中查找,汉字发音的“声母码元”在“码元数据库”中的“码元编码”等于输入编码中的声母编码并且该发音的“韵母码元”在“码元数据库”中的“码元编码”等于输入编码中的韵母编码,并且“形码编码”的前几个代码等于输入编码中的形码编码的汉字;将所有符合条件的汉字,使用“拼音序值分析器”排序,添加到“形码候选字列表”中;0025在其余未添加到“形码候选字列表”的汉字中查找,汉字发音的“声母码元”说明书CN102023711ACN102023725A3/10页9在“码元数据库”中的“码元编码”等于输入编码中的声母编码或者该发音的“韵母码元”在“码元数据库”中的“码元编码”等于输入编码中的韵母编码,并且“。
26、形码编码”等于输入编码中的形码编码的汉字;将所有符合条件的汉字,使用“拼音序值分析器”排序,添加到“形码候选字列表”中;0026在其余未添加到“形码候选字列表”的汉字中查找,“形码编码”等于输入编码中的形码编码的汉字;将该汉字的“拼音字频”总和的值设置为该候选字的“序度”;将所有符合条件的汉字,按“序度”由大到小的顺序排序,添加到“形码候选字列表”中;0027D“拼音序值分析器”根据“码元编码频度”为候选字排序,其特征在于包含以下步骤0028当汉字发音的“声母码元”在“码元数据库”中的“码元编码”等于输入编码中的声母编码时,将该“码元编码”的“码元编码频度”除以该“声母码元”的所有“码元编码频。
27、度”总和的商设置为“声母系数”;0029如果汉字发音的“声母码元”在“码元数据库”中的“码元编码”均不等于输入编码中的声母编码,那么将该汉字该拼音的“声母系数”设置为一个小于“汉字数据库”中,最大的“拼音字频”除以不为零的最小的“拼音字频”的商的倒数的正小数;0030当该汉字该发音的“韵母码元”在“码元数据库”中的“码元编码”等于输入编码中的韵母编码时,将该“码元编码”的“码元编码频度”除以该“韵母码元”的所有“码元编码频度”总和的商设置为“韵母系数”;0031如果汉字发音的“韵母码元”在“码元数据库”中的“码元编码”均不等于输入编码中的韵母编码,那么将该汉字该拼音的“韵母系数”设置为一个小于。
28、“汉字数据库”中,最大的“拼音字频”除以不为零的最小的“拼音字频”的商的倒数的正小数;0032将该汉字该发音的“声母系数”乘以该发音的“韵母系数”再乘以该发音的“拼音字频”设置为该发音的“拼音序值”;将该汉字所有发音的“拼音序值”的最大值设置为该汉字的“序度”;将所有符合条件的汉字按“序度”由大到小的顺序排序;0033E当用户选择候选字后,“输入编码处理器”将输入编码中的声母编码、韵母编码做为“声母码元”、“韵母码元”的“码元编码”存储到“码元数据库”中,其特征在于包含以下步骤0034如果用户选择的候选字没有“已输入编码”或者“已输入编码”中的拼音编码均不等于该输入编码中的拼音编码,那么“输入。
29、编码处理器”将该输入编码中的声母编码做为该“声母码元”的“码元编码”存储到“码元数据库”中,将该输入编码中的韵母编码做为该“韵母码元”的“码元编码”存储到“码元数据库”中;具体过程为0035如果该汉字的“声母码元”在“码元数据库”中已经存储了等于该输入编码中的声母编码的“码元编码”,那么将该“码元编码”的“码元编码频度”加1;如果该汉字的“声母码元”在“码元数据库”中没有等于该输入编码中的声母编码的“码元编码”,那么将该输入编码中的声母编码存储为该“声母码元”的“码元编码”,并将该“码元编码”的“码元编码频度”设置为1;0036如果该汉字的“韵母码元”在“码元数据库”中已经存储了等于该输入编码。
30、中的韵母编码的“码元编码”,那么将该“码元编码”的“码元编码频度”加1;如果该说明书CN102023711ACN102023725A4/10页10汉字的“韵母码元”在“码元数据库”中没有等于该输入编码中的韵母编码的“码元编码”,那么将该输入编码中的韵母编码存储为该“韵母码元”的“码元编码”,并将该“码元编码”的“码元编码频度”设置为1;0037如果“声母码元”、“韵母码元”在“码元数据库”中预设的“码元编码”不等于用户输入的拼音编码,那么可以判断出用户该汉字的发音不等于该汉字的典型发音;0038F当用户选择候选字后,“输入编码处理器”将输入编码做为“已输入编码”存储到“汉字数据库”该汉字的“已。
31、输入编码”中,其特征在于包含以下步骤0039如果该汉字在“汉字数据库”中已经存储了等于该输入编码的“已输入编码”,那么将该“已输入编码”的“已输入编码频度”加1;如果该汉字在“汉字数据库”中没有“已输入编码”或者“已输入编码”均不等于该输入编码,那么将该输入编码存储为该汉字的“已输入编码”,并将该汉字相应的“拼音字频”加1的值设置为该“已输入编码”的“已输入编码频度”。0040G将汉字的每一个发音的声母音位、韵母音位做为汉字拼音编码的编码码元;将汉字的每一个发音的“声母码元”、“韵母码元”和该发音的“拼音字频”设置为一组,存储在“汉字数据库”中;0041在“汉字数据库中”为每一个汉字记录设置多。
32、组“声母码元”、“韵母码元”、“拼音字频”字段,设置一个“形码编码”字段,设置多组“已输入编码”、“已输入编码频度”字段,可以如下结构00420043声母码元1;韵母码元1;拼音字频1;0044声母码元2;韵母码元2;拼音字频2;00450046形码编码;0047已输入编码1;已输入编码频度1;0048已输入编码2;已输入编码频度2;004900500051H在“码元数据库”中,为每一个“声母码元”、“韵母码元”记录设置多组“码元编码”、“码元编码频度”字段,可以如下结构00520053码元编码1;码元编码频度1;码元编码2;码元编码频度2;00540055在“码元数据库”中,为每一个“声母码。
33、元”、“韵母码元”预设一个“码元编码”。0056I选取150个常用偏旁部首做为对汉字字形编码的编码码元;将150个编码码元,按其汉语拼音首字母分成21组,指定到计算机通用键盘的21个字母键上,具体为0057B卜、八、匕、勹、冫、贝、白、貝;说明书CN102023711ACN102023725A5/10页110058C厂、艹、寸、彳、辶、车、虫、車;0059D丶、刂、刀、大、歹;0060E儿、耳;0061F、匚、阝、方;0062G广、弓、戈、革;0063H一、丷、火、灬、户、禾、虍;0064J冂、几、卩、巾、彐、己、孑、见、斤、钅、臼、見、角、釒、金;0065K凵、口;0066L力、立;0067。
34、M冖、门、宀、马、木、目、皿、米、門、馬;0068N女、牛、牜、鸟、疒、鳥;0069P丿、攵;0070Q犭、犬、气;0071R亻、人、日;0072S亅、丨、十、厶、士、扌、山、彡、饣、氵、尸、巳、纟、水、礻、石、罒、糹、身;0073T亠、土、田;0074W囗、王、文;0075X小、夕、忄、心、穴、0076Y、讠、又、廴、弋、已、曰、月、衤、页、羊、雨、鱼、頁、魚;0077Z、乙、乛、乚、夂、丬、子、止、爫、自、舟、走、足、;0078依笔顺取汉字字形的第一、第二、最末一个编码码元的代码进行编码;当汉字的字形由两个编码码元组成时,依笔顺依次取其字形的第一、第二个编码码元的代码进行编码;当汉字的字形。
35、由一个编码码元组成时,取这个编码码元的代码进行编码;0079单字输入0080输入汉字的拼音编码;0081先输入汉字的拼音编码,再输入汉字的形码编码;0082词组输入0083依次输入构成词组的汉字的拼音编码;0084先依次输入构成词组的汉字的拼音编码,再依次输入汉字的形码编码。0085J输入法候选字词窗口,分为拼音候选栏和形码候选栏;拼音候选栏用于显示“拼音候选字列表”中的候选字词;形码候选栏用于显示“形码候选字列表”中的候选字词;00861、2、3、4、5五个数字键定义为拼音候选字词选择键,用于选择拼音候选栏中的候选字词;7、8、9、0四个数字键定义为形码候选字词选择键,用于选择形码候选栏中的。
36、候选字词。0087本发明分栏显示候选字词,有效地解决了输入编码切分冲突的问题。0088本发明克服拼音输入法必须要有拼音编码的技术偏见,在“汉字数据库”中没说明书CN102023711ACN102023725A6/10页12有预设汉字的拼音编码,将汉字发音的“声母码元”、“韵母码元”做为拼音编码的编码码元具有实质性特点。本发明提供了一种不同构思的解决方案,输入法通过学习“声母码元”、“韵母码元”的“码元编码”,可以动态生成汉字的拼音编码。本发明不是让用户按照汉字的典型发音输入汉字,而是让输入法学习用户的方音口语,能够让用户使用自己的方音口语输入不等于典型发音的汉字,取得了预料不到的技术效果。本发。
37、明解决了拼音输入法无法输入方音口语的技术难题,具有显著的技术进步。附图说明0089图1是本发明拼音编码和形码全码输入单字的一个实施例;0090图2是本发明拼音编码和形码简码输入单字的一个实施例;0091图3是本发明拼音编码输入单字的一个实施例;0092图4是本发明拼音编码输入词组的一个实施例。具体实施方式0093本发明可以使用任意一种音标系统标记汉字的发音。例如可以使用汉语拼音方案标记汉字的发音;在“音标数据库”中,为每一个汉语拼音方案标记的“声母码元”、“韵母码元”预设一个汉语拼音方案编码的“码元编码”。还可以使用国际音标标记汉字的发音;在“音标数据库”中,为每一个国际音标标记的“声母码元”。
38、、“韵母码元”预设一个方言拼音方案编码的“码元编码”。0094下面举例说明本发明使用汉语拼音方案标记汉字的发音时,输入汉字的具体过程。0095在“汉字数据库”中使用汉语拼音方案标记汉字的发音。其中/Y/、/W/是虚音标,不表示实际发音。00960097在“码元数据库”中,为每一个汉语拼音方案标记的“声母码元”、“韵母码元”预设一个汉语拼音方案编码的“码元编码”。0098音标音标编码1音标编码频度1音标编码2音标编码频度2PP1YY1XX1说明书CN102023711ACN102023725A7/10页13ININ100991输入第一个单字0100用户输入编码。0101输入编码被切分为拼音编码和。
39、形码编码;输入编码中的声母编码为,韵母编码为。0102此时,“屏”、“洴”、“硑”、“拼”等字均没有“已输入编码”,并且“形码编码”等于输入编码中的形码编码。0103“拼”字发音/PIN/的“声母码元”/P/在“码元数据库”中的“码元编码”等于输入编码中的声母编码,“码元编码”的“码元编码频度”1除以“声母码元”/P/的所有“码元编码频度”总和1的商是1,所以“拼”字该发音/PIN/的“声母系数”是1;“拼”字该发音/PIN/的“韵母码元”/IN/在“码元数据库”中的“码元编码”均不等于输入编码中的韵母编码,所以“拼”字该发音/PIN/的“韵母系数”是000001;将“拼”字该发音/PIN/的。
40、“声母系数”1乘以该发音/PIN/的“韵母系数”000001再乘以“拼”字该发音/PIN/的“拼音字频”000009622858设置为该发音/PIN/的“拼音序值”000000000096;将“拼”字所有发音的“拼音序值”的最大值000000000096设置为“拼”字的“序度”;将所有符合条件的汉字按“序度”由大到小的顺序排序,添加到“形码候选字列表”中。0104如图1所示,编码为拼音编码的候选字显示在拼音候选栏中;编码为拼音编码和形码编码的候选字显示在形码候选栏中。0105用户在候选窗口中选择“拼”字。0106此时,“拼”字没有“已输入编码”,并且“拼”字只有一组“声母码元”/P/、“韵母码。
41、元”/IN/。0107“拼”字的“声母码元”/P/在“码元数据库”中已经存储了等于该输入编码中的声母编码的“码元编码”,所以将“声母码元”/P/的“码元编码”的“码元编码频度”加1;0108“拼”字的“韵母码元”/IN/在“码元数据库”中没有等于该输入编码中的韵母编码的“码元编码”,所以将该输入编码中的韵母编码存储为该“韵母码元”/IN/的“码元编码”,并将该“码元编码”的“码元编码频度”设置为1。0109“拼”字没有“已输入编码”,所以将输入编码存储为“拼”字的“已输入编码”,并将“拼”字该发音/PIN/的“拼音字频”000009622858加1的值100009622858设置为“拼”字该“。
42、已输入编码”的“已输入编码频度”100009622858。01102输入第二个单字0111用户输入编码。说明书CN102023711ACN102023725A8/10页140112输入编码被切分为拼音编码和形码编码;输入编码中的声母编码为,韵母编码为。0113此时,“韺”、“韹”、“音”等字均没有“已输入编码”,并且“形码编码”的第一个代码等于输入编码中的形码编码。0114“音”字发音/YIN/的“声母码元”/Y/在“码元数据库”中的“码元编码”等于输入编码中的声母编码,“码元编码”的“码元编码频度”1除以“声母码元”/Y/的所有“码元编码频度”总和1的商是1,所以“音”字该发音/YIN/的“。
43、声母系数”是1;“音”字该发音/YIN/的“韵母码元”/IN/在“码元数据库”中的“码元编码”等于输入编码中的韵母编码,“码元编码”的“码元编码频度”1除以“韵母码元”/IN/的所有“码元编码频度”总和2的商是05,所以“音”字该发音/YIN/的“韵母系数”是05;将“音”字该发音/YIN/的“声母系数”1乘以该发音/YIN/的“韵母系数”05再乘以“音”字该发音/YIN/的“拼音字频”000056008620设置为该发音/YIN/的“拼音序值”000028004310;将“音”字所有发音的“拼音序值”的最大值000028004310设置为“音”字的“序度”;将所有符合条件的汉字按“序度”由大。
44、到小的顺序排序,添加到“形码候选字列表”中。0115如图2所示,编码为拼音编码的候选字显示在拼音候选栏中;编码为拼音编码和形码编码的候选字显示在形码候选栏中。0116用户在候选窗口中选择“音”字。0117此时,“音”字没有“已输入编码”,并且“音”字只有一组“声母码元”/Y/、“韵母码元”/IN/。0118“音”字的“声母码元”/Y/在“码元数据库”中已经存储了等于该输入编码中的声母编码的“码元编码”,所以将“声母码元”/Y/的“码元编码”的“码元编码频度”加1;0119“音”字的“韵母码元”/IN/在“码元数据库”中已经存储了等于该输入编码中的韵母编码的“码元编码”,所以将“韵母码元”/IN。
45、/的“码元编码”的“码元编码频度”加1。0120“音”字没有“已输入编码”,所以将输入编码存储为“音”字的“已输入编码”,并将“音”字该发音/YIN/的“拼音字频”000056008620加1的值100056008620设置为“音”字该“已输入编码”的“已输入编码频度”100056008620。01213输入第三个单字0122用户输入编码。0123输入编码被切分为拼音编码;输入编码中的声母编码为,韵母编码为。0124此时,“行”、“性”、“形”、“心”、“信”、“新”等字均没有已输入编码。0125“新”字发音/XIN/的“声母码元”/X/在“码元数据库”中的“码元编码”等于输入编码中的声母编码。
46、,“码元编码”的“码元编码频度”1除以“声母码元”/X/的所有“码元编码频度”总和1的商是1,所以“新”字该发音/XIN/说明书CN102023711ACN102023725A9/10页15的“声母系数”是1;“新”字该发音/XIN/的“韵母码元”/IN/在“码元数据库”中的“码元编码”等于输入编码中的韵母编码,“码元编码”的“码元编码频度”2除以“韵母码元”/IN/的所有“码元编码频度”总和3的商是066667,所以“新”字该发音/XIN/的“韵母系数”是066667;将“新”字该发音/XIN/的“声母系数”1乘以该发音/XIN/的“韵母系数”066667再乘以“新”字该发音/XIN/的“拼。
47、音字频”000100885101设置为该发音/XIN/的“拼音序值”000067257070;将“新”字所有发音的“拼音序值”的最大值000067257070设置为“新”字的“序度”;将所有符合条件的汉字按“序度”由大到小的顺序排序,添加到“拼音候选字列表”中。0126如图3所示,编码为拼音编码的候选字显示在拼音候选栏中;编码为拼音编码和形码编码的候选字显示在形码候选栏中;编码为拼音编码和形码编码的候选字显示在形码候选栏中。0127用户在候选窗口中选择“新”字。0128此时,“新”字没有“已输入编码”,并且“新”字只有一组“声母码元”/X/、“韵母音标”/IN/。0129“新”字的“声母码元”。
48、/X/在“码元数据库”中已经存储了等于该输入编码中的声母编码的“码元编码”,所以将“声母码元”/X/的“码元编码”的“码元编码频度”加1;0130“新”字的“韵母码元”/IN/在“码元数据库”中已经存储了等于该输入编码中的韵母编码的“码元编码”,所以将“韵母码元”/IN/的“码元编码”的“码元编码频度”加1。0131“新”字没有“已输入编码”,所以将输入编码存储为“新”字的“已输入编码”,并将“新”字该发音/XIN/的“拼音字频”000100885101加1的值100100885101设置为“新”字该“已输入编码”的“已输入编码频度”100100885101。01324输入词组0133用户输入。
49、编码“XINGPINGYING”。0134此时,“新”字所对应的输入编码为,“拼”字所对应的输入编码为,“音”字所对应的输入编码为。0135如图4所示,编码为拼音编码的候选字词显示在拼音候选栏中;编码为拼音编码和形码编码的候选字词显示在形码候选栏中;编码为拼音编码和形码编码的候选字词显示在形码候选栏中。0136用户在候选窗口中选择词组“新拼音”。0137通过以上实施例可以得出当用户发音的某个“声母码元”或“韵母码元”偶尔混淆为其他码元时,该码元的拼音系数接近于0,输入法可以通过“已输入编码”记住这些混淆字的拼音编码;当用户发音的某个“声母码元”或“韵母码元”总是混淆为其他码元时,该码元的拼音系数接近于1,输入法可以通过“码元编码”动态生成这些混淆字的拼音编码;当用户发音的某个“声母码元”或“韵母码元”部分混淆为其他码元时,该码元的拼音系数介于0与1之间,输入法可以通过“拼音字频”优先显示这些混淆字中的高频字。说明书CN102023711ACN102023725A10/10页160138本发明解决了拼音输入法无法输入方音口语的技术难题,开创了面向用户设计输入法的技术潮流,具有显著的技术进步。说明书CN102023711ACN102023725A1/1页17图1图2图3图4说明书附图CN102023711A。