《输入法的词库数据矫正方法和装置.pdf》由会员分享,可在线阅读,更多相关《输入法的词库数据矫正方法和装置.pdf(15页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103365905 A (43)申请公布日 2013.10.23 CN 103365905 A *CN103365905A* (21)申请号 201210098791.7 (22)申请日 2012.04.06 G06F 17/30(2006.01) G06F 3/023(2006.01) (71)申请人 腾讯科技 (深圳) 有限公司 地址 518044 广东省深圳市福田区振兴路赛 格科技园 2 栋东 403 室 (72)发明人 查文 (74)专利代理机构 北京德琦知识产权代理有限 公司 11018 代理人 张晓峰 宋志强 (54) 发明名称 输入法的词库数据矫正方法和。
2、装置 (57) 摘要 本发明公开了一种文字输入法的词库数据矫 正方法和装置, 包括 : 将每次输入上屏的上屏文 字记录到记录区, 在该记录区内相互区分每次上 屏的上屏文字, 同时在该记录区同步屏幕上的光 标位置和修改操作 ; 将每次上屏的上屏文字作为 学词计入词库 ; 根据所述记录区内同步的光标位 置和修改操作, 判断是否修改了该记录区中已经 记录的上屏文字, 如果是则确定所修改的上屏文 字的修改前后的内容, 从词库中撤销修改前的该 上屏文字对应的学词, 将修改后的该上屏文字作 为学词计入词库。 利用本发明, 可以提高词库数据 矫正的正确率。 (51)Int.Cl. 权利要求书 2 页 说明书。
3、 8 页 附图 4 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书2页 说明书8页 附图4页 (10)申请公布号 CN 103365905 A CN 103365905 A *CN103365905A* 1/2 页 2 1. 一种文字输入法的词库数据矫正方法, 其特征在于, 包括 : 将每次输入上屏的上屏文字记录到记录区, 在该记录区内相互区分每次上屏的上屏文 字, 同时在该记录区同步屏幕上的光标位置和修改操作 ; 将每次上屏的上屏文字作为学词计入词库 ; 根据所述记录区内同步的光标位置和修改操作, 判断是否修改了该记录区中已经记录 的上屏文字, 如果是则确定所修改。
4、的上屏文字的修改前后的内容, 从词库中撤销修改前的 该上屏文字对应的学词, 将修改后的该上屏文字作为学词计入词库。 2. 根据权利要求 1 所述的方法, 其特征在于, 所述在所述记录区内相互区分每次上屏的上屏文字具体为 : 利用指定的分隔符号分隔 每一次上屏的上屏文字 ; 在所述记录区同步用户光标位置时忽略所述分隔符号。 3. 根据权利要求 1 所述的方法, 其特征在于, 所述确定所修改的上屏文字的修改前后 的内容具体为 : 追踪复制当前光标位置的上屏文字, 在对当前光标位置的上屏文字进行修 改操作后, 将修改前追踪复制的上屏文字作为修改前的上屏文字, 将改后的上屏文字的整 体作为修改后的上屏。
5、文字。 4. 根据权利要求 1 所述的方法, 其特征在于, 在所述判断是否修改了该记录区中已经 记录的上屏文字时, 如果判定所述修改操作是向记录区中已经记录的上屏文字的前端插入 文字的操作, 则不进行所述后续的处理, 而是将该插入文字作为新学词计入词库。 5. 根据权利要求 1 所述的方法, 其特征在于, 该方法在确定所修改的上屏文字的修改 前后的内容之后, 进一步判断修改后的上屏文字的字数是否和修改前的该上屏文字的字数 相同, 只有在字数相同时才从词库中撤销修改前的该上屏文字对应的学词, 并将修改后的 该上屏文字作为学词计入词库。 6. 根据权利要求 5 所述的方法, 其特征在于, 在修改后。
6、的上屏文字的字数和修改前的 该上屏文字的字数不相同时, 在所述词库中不撤销修改前的该上屏文字对应的学词, 而是 将修改后的该上屏文字作为新学词计入词库。 7. 根据权利要求 1 所述的方法, 其特征在于, 该方法在确定所修改的上屏文字的修改 前后的内容之后, 进一步判断修改后的上屏文字的编码是否和修改前的该上屏文字的编码 相同, 只有在编码相同时才从词库中撤销修改前的该上屏文字对应的学词, 并将修改后的 该上屏文字作为学词计入词库。 8. 根据权利要求 1 所述的方法, 其特征在于, 设置所述记录区的容量, 当记录的内容在 达到该记录区的容量上限后, 删除最早的上屏文字, 记录最新的上屏文字。。
7、 9. 根据权利要求 1 至 8 任一项所述的方法, 其特征在于, 所述记录区具体为 : 缓存区、 或日志、 或文件。 10. 一种文字输入法的词库数据矫正装置, 其特征在于, 包括 : 记录模块, 用于提供记录区, 将每次输入上屏的上屏文字记录到该记录区, 在该记录区 内相互区分每次上屏的上屏文字 ; 监视模块, 用于监视屏幕上的光标位置和修改操作, 在所述记录区同步用户光标位置 和修改操作 ; 学词模块, 用于将每次上屏的上屏文字和判断处理模块指定的上屏文字作为学词计入 权 利 要 求 书 CN 103365905 A 2 2/2 页 3 词库 ; 判断处理模块, 用于根据所述记录区内同步。
8、的光标位置和修改操作, 判断是否修改了 该记录区中已经记录的上屏文字, 如果是则确定所修改的上屏文字的修改前后的内容, 触 发撤销模块从词库中撤销修改前的该上屏文字对应的学词, 并触发学词模块将修改后的该 上屏文字作为学词计入词库 ; 撤销模块, 用于从词库中撤销所述判断处理模块指定的学词。 11. 根据权利要求 10 所述的装置, 其特征在于, 所述记录区具体为 : 缓存区、 或日志、 或 文件。 权 利 要 求 书 CN 103365905 A 3 1/8 页 4 输入法的词库数据矫正方法和装置 技术领域 0001 本发明涉及数据处理设备的文字输入技术, 尤其涉及一种文字输入法的词语数据 。
9、库 ( 简称词库 ) 数据的矫正方法和装置。 背景技术 0002 数据处理设备如计算机、 智能手机等已经大量应用在人们的生产和生活中。数据 处理设备的一种重要的功能是对文字的处理。因此各种文字输入法运用而生。 0003 所述文字输入法通常被制作成文字输入法软件, 文字输入法软件通常的文字输 入过程是 : (1) 用户启动输入法软件 ; (2) 用户通过键盘操作向输入法软件输入编码, 所述 编码如汉字输入中的拼音编码、 字根编码, 英文输入中的字符编码等 ; (3) 输入法软件将输 入的编码转换为候选文字显示在候选框内 ; (4) 用户选择候选框内的文字, 触发上屏键, 通 常的上屏键如空格键、。
10、 回车键、 数字选择键等 ; (5) 输入法软件将用户选择的文字输入显示 到数据处理设备屏幕上的光标位置, 这一将选中的文字输入显示到屏幕的操作也叫做 “上 屏” , 每次通过所述步骤 (2) 至步骤 (5) 的操作输入到屏幕上的文字被称为一次 “上屏文 字” 。 0004 在输入法中, 通常使用词库来记录用户通过输入法软件输入的上屏文字。通常每 一次上屏操作的上屏文字都要作为一个学词计入词库。 词库中包括每一上屏文字对应的学 词及其计入次数, 业界通常形象地将一个上屏文字作为一个学词计入词库的过程叫做 “学 习入库” 过程。输入法软件根据词库中学词的计入次数决定后续在相同条件下优先选择计 入。
11、次数多的学词, 并优先展示在候选区。 0005 在输入文字的过程中, 往往由于输入错误需要对输入过的文字进行修改, 并对词 库中的学词进行相应的矫正。现有文字输入法的词库数据矫正方法通常有两种。 0006 图1为现有技术一的文字输入法的词库数据矫正方法的一种流程图。 参见图1, 该 方法包括 : 每输入一次上屏文字后, 将本次上屏文字存入一临时缓存中, 之后判断是否继续 输入了下一上屏文字, 如果输入了, 则判定确认了该临时缓存中的该上屏文字为学词, 将该 临时缓存中的该上屏文字作为学词计入词库 ; 如果没有继续输入下一上屏文字, 而是进行 了其他的修改操作, 则清除所述临时缓存中的上屏文字。。
12、 0007 图 2 为现有技术二的文字输入法软件的词库数据矫正方法的一种流程图。参见图 2, 该方法不需要临时缓存, 而是每输入一次上屏文字后, 就将该上屏文字作为学词计入词 库, 例如输入一次上屏文字 “刘远方” , 就将 “刘远方” 作为学词计入词库, 之后再判断用户是 否退格修改, 如果是则回滚上次学词, 所谓回滚就是撤销最近计入词库的学词, 所述撤销就 是说如果该上屏文字第一次计入词库则从词库中删除, 如果不是第一次计入词库则降低该 学词的计入次数 ; 如果用户没有退格修改, 则继续输入下一上屏文字。 0008 上述现有技术尽管可以在一定程度上避免学习错误的词, 但有如下缺点 : 00。
13、09 1) 在用户利用输入法软件输入文字过程中, 经常会有输入错误的情况, 比如上屏 文字 “刘远方” , 如果用户发现出错了, 这个人其实叫 “刘元芳” , 此时, 用户按退格键删除 “远 说 明 书 CN 103365905 A 4 2/8 页 5 方” 重新输入 “元芳” 。按照现有技术一的方式则清除临时缓存中的 “刘远方” , 在上屏 “元 芳” 并确认后将 “元芳” 作为学词计入词库。按照现有技术二的方法则撤销已经计入词库的 学词 “刘远方” , 重新将 “元芳” 作为学词计入词库。但是, 上述现有技术虽然没有向词库计 入错误的学词 “刘远方” , 但是也没有向词库计入正确的学词 “。
14、刘元芳” , 而是又向词库计入 了错误的学词 “元芳” 。 因此, 导致词库数据矫正的正确率较低, 往往不能向词库计入正确的 学词。 0010 2) 如果用户已经持续输入了一段时间, 比如输入 “刘远方 | 见义勇为 | 的 | 故 事” ( 其中 | 代表分次上屏操作的过程 ) 后, 此时才发现 “远方” 的错误, 此时用户进行退回 操作, 并将 “远方” 改为 “元芳” , 但是, 按照上述现有技术的方案却无法在词库中矫正撤销 “刘远方” 这个错误的学词, 因为后续最近一次输入的 “见义勇为” 确认了前面上屏的 “刘远 方” , 已经将这个上屏文字作为学词计入了词库。 而真正撤销的是最近一。
15、次上屏的上屏文字 “故事” , 这显然是错误的, 而且又向词库计入了错误的学词 “元芳” 。因此, 在用户更改前文 输入的文字时, 词库数据矫正会出现错误, 词库数据矫正的正确率较低。 发明内容 0011 有鉴于此, 本发明的主要目的在于提供一种文字输入法的词库数据矫正方法和装 置, 以提高词库数据矫正的正确率。 0012 本发明的技术方案是这样实现的 : 0013 一种文字输入法的词库数据矫正方法, 包括 : 0014 将每次输入上屏的上屏文字记录到记录区, 在该记录区内相互区分每次上屏的上 屏文字, 同时在该记录区同步屏幕上的光标位置和修改操作 ; 0015 将每次上屏的上屏文字作为学词计。
16、入词库 ; 0016 根据所述记录区内同步的光标位置和修改操作, 判断是否修改了该记录区中已经 记录的上屏文字, 如果是则确定所修改的上屏文字的修改前后的内容, 从词库中撤销修改 前的该上屏文字对应的学词, 将修改后的该上屏文字作为学词计入词库。 0017 一种文字输入法的词库数据矫正装置, 包括 : 0018 记录模块, 用于提供记录区, 将每次输入上屏的上屏文字记录到该记录区, 在该记 录区内相互区分每次上屏的上屏文字 ; 0019 监视模块, 用于监视屏幕上的光标位置和修改操作, 在所述记录区同步用户光标 位置和修改操作 ; 0020 学词模块, 用于将每次上屏的上屏文字和判断处理模块指。
17、定的上屏文字作为学词 计入词库 ; 0021 判断处理模块, 用于根据所述记录区内同步的光标位置和修改操作, 判断是否修 改了该记录区中已经记录的上屏文字, 如果是则确定所修改的上屏文字的修改前后的内 容, 触发撤销模块从词库中撤销修改前的该上屏文字对应的学词, 并触发学词模块将修改 后的该上屏文字作为学词计入词库 ; 0022 撤销模块, 用于从词库中撤销所述判断处理模块指定的学词。 0023 与现有技术相比, 首先, 由于本发明在所述记录区内相互区分每次上屏的上屏文 字, 并以一个上屏文字的整体作为一个操作单元进行撤销学词和重新计入修改后的学词的 说 明 书 CN 103365905 A 。
18、5 3/8 页 6 操作, 即使用户只修改了一个上屏文字的部分内容, 也是将该上屏文字整体撤销并计入修 改后的该上屏文字的全部内容, 因此避免了现有技术中由于修改了部分内容导致词库数据 矫正错误的问题, 提高了词库数据矫正的正确率。其次, 如果用户已经持续输入了一段时 间, 不论用户修改之前输入的哪一个上屏文字, 则都会根据在所述记录区内同步的光标位 置和修改操作确定所修改的上屏文字的位置和内容, 从词库中撤销修改前的该上屏文字对 应的学词, 将修改后的该上屏文字作为学词计入词库, 因此克服了现有技术在用户更改前 文输入的文字时, 词库数据矫正会出现错误的问题, 提高了词库数据矫正的正确率。 。
19、附图说明 0024 图 1 为现有技术一的文字输入法的词库数据矫正方法的一种流程图 ; 0025 图 2 为现有技术二的文字输入法软件的词库数据矫正方法的一种流程图 ; 0026 图 3 为本发明所述文字输入法的词库数据矫正装置的一种组成示意图 ; 0027 图 4 为本发明所述文字输入法的词库数据矫正方法的一种具体流程图 ; 0028 图 5a 为在屏幕上显示的上屏文字和所述缓存区所同步记录的上屏文字的一种对 照示意图 ; 0029 图 5b 为在所述屏幕中和缓存区同步用户光标位置的一种对照示意图 ; 0030 图 5c 为在缓存区中确定所修改的上屏文字的修改前后的内容的一种示意图。 具体实。
20、施方式 0031 下面结合附图及具体实施例对本发明再作进一步详细的说明。 0032 本发明的核心技术方案是一种文字输入法的词库数据矫正方法, 包括 : 将每次输 入上屏的上屏文字记录到记录区, 在该记录区内相互区分每次上屏的上屏文字, 同时在该 记录区同步屏幕上的光标位置和修改操作 ; 将每次上屏的上屏文字作为学词计入词库 ; 根 据所述记录区内同步的光标位置和修改操作, 判断是否修改了该记录区中已经记录的上屏 文字, 如果是则确定所修改的上屏文字的修改前后的内容, 从词库中撤销修改前的该上屏 文字对应的学词, 将修改后的该上屏文字作为学词计入词库。 0033 图 3 为本发明所述文字输入法的。
21、词库数据矫正装置的一种组成示意图。该词库数 据矫正装置用于执行本发明的所述方法。该装置具体包括 : 0034 记录模块 301, 用于提供记录区, 将每次输入上屏的上屏文字记录到该记录区, 在 该记录区内相互区分每次上屏的上屏文字。 0035 监视模块 302, 用于监视屏幕上的光标位置和修改操作, 在所述记录区同步用户光 标位置和修改操作。 0036 学词模块 303, 用于将每次上屏的上屏文字计入词库 ; 并且将后续的判断处理模 块 304 指定的上屏文字作为学词计入词库, 即将修改后的上屏文字作为学词计入词库。 0037 判断处理模块 304, 用于根据所述记录区内同步的光标位置和修改操。
22、作, 判断是否 修改了该记录区中已经记录的上屏文字, 如果是则确定所修改的上屏文字的修改前后的内 容, 触发后续的撤销模块 305 从词库中撤销修改前的该上屏文字对应的学词, 并触发学词 模块 303 将修改后的该上屏文字作为学词计入词库。 0038 撤销模块 305, 用于从词库中撤销所述判断处理模块 304 指定的学词, 即修改前的 说 明 书 CN 103365905 A 6 4/8 页 7 该上屏文字对应的学词。 0039 本发明中, 所述记录区具体可以为 : 缓存区、 或日志、 或文件 ( 如记事本等 )。在下 面实施例中一缓存区作为记录区为例进行说明。 0040 图4为本发明所述文。
23、字输入法的词库数据矫正方法的一种具体流程图。 参见图4, 该处理流程包括 : 0041 步骤 401、 接收用户的输入指令, 并通过上屏操作向屏幕上输入上屏文字。 0042 具体过程是 : 接收用户输入的编码, 所述编码如汉字输入中的拼音编码、 字根编 码, 英文输入中的字符编码等 ; 将输入的编码转换为候选文字显示在候选框内 ; 用户选择 候选框内的文字, 触发上屏键, 通常的上屏键如空格键、 回车键、 数字选择键等 ; 输入法软 件将用户选择的文字输入显示到屏幕上的光标位置, 这一将选中的文字输入显示到屏幕的 操作也叫做 “上屏操作” , 每次通过所述上屏操作输入到屏幕上的文字被称为一次 。
24、“上屏文 字” 。 0043 步骤 402、 将每次输入上屏的上屏文字记录到缓存区, 在该缓存区内相互区分每次 上屏的上屏文字, 同时在该缓存区同步用户在屏幕中的光标位置和修改操作。 0044 本步骤中, 所述在所述记录区内相互区分每次上屏的上屏文字的具体方法可以 为 : 利用指定的分隔符号分隔每一次上屏的上屏文字。 例如所述分隔符可以指定为换行符, 当然也可以用逗号、 分号等其它符号作为分隔符。图 5a 为在屏幕上显示的上屏文字和所述 缓存区所同步记录的上屏文字的一种对照示意图。 参见图5, 例如当用户分别输入了四个上 屏文字 :“刘远方” ,“见义勇为” ,“的” ,“故事” , 虽然在屏。
25、幕 501 上显示的是 “刘远方见义勇 为的故事” , 但在所述缓存区 502 中记录的内容是 : 0045 刘远方 0046 见义勇为 0047 的 0048 故事 0049 其中各个上屏文字用换行符进行了分隔, 用于在后续处理中能够确切找到某一上 屏文字的整体内容。即每两个分隔符之间的内容就是一个完整的上屏文字, 在某个上屏文 字的内容修改后, 需要将修改前的完整的上屏文字在词库中对应的学词进行撤销, 而将修 改后的完整的上屏文字作为学词再计入词库。 0050 由于在所述缓存区中使用了分隔符来分隔各次上屏的上屏文字, 因此在所述缓存 区同步用户光标位置时需忽略所述分隔符号。图 5b 为在所。
26、述屏幕中和缓存区同步用户光 标位置的一种对照示意图。参见图 5b, 其中竖直箭头表示光标位置, 例如假设用户光标最 初在所述屏幕 501 上显示的文字 “刘远方见义勇为的故事” 的位置 511 处, 则在缓存区 502 中, 光标位置最初在所述位置 521 处 ; 当用户按 4 次返回键, 屏幕上的光标返回到位置 512 处, 那么相应地在缓存区 502 中, 光标需要同步 4 次返回键, 但是在同步时忽略掉所述分隔 符的存在, 通过同步 4 次返回键, 光标同步到了位置 522 处, 因此可以保证在缓存区中的光 标位置和在屏幕中的光标位置的一致性。 0051 本步骤中, 所述在所述缓存区同步。
27、用户在屏幕上的光标位置和修改操作的具体方 法可以采用数据处理设备操作系统中相应的应用程序编程接口(API接口)来实现, 例如在 windows 操作系统中, 具有可以追踪键盘操作和鼠标操作的 API 接口, 通过这些 API 接口可 说 明 书 CN 103365905 A 7 5/8 页 8 以监视到键盘和鼠标在屏幕上的操作命令, 例如光标移动命令, 以及删除、 插入、 修改等修 改命令等, 通过这些 API 接口将这些操作命令同步实施给所述缓存区即可。 0052 步骤 403、 将每次上屏的上屏文字作为学词计入词库。当然所述步骤 402 和步骤 403 没有严格的前后顺序, 也可以是先执行。
28、步骤 403 后执行步骤 402, 或同时执行。 0053 步骤 404、 根据在所述缓存区内同步的光标位置和修改操作, 判断是否修改了该缓 存区中已经记录的上屏文字, 如果是则视同用户修改了前文输入的内容, 执行步骤 405 及 后续步骤对词库数据进行矫正 ; 否则不对词库数据进行矫正, 并在当前输入文字的结尾处 新输入文字后, 返回步骤 402。 0054 步骤 405、 确定所修改的上屏文字的修改前后的内容。 0055 本步骤中所述确定所修改的上屏文字的修改前后的内容的具体方法可以为 : 在同 步所述缓存区中的光标位置时, 追踪复制当前光标位置的完整的上屏文字, 例如图 5c 所示 为,。
29、 在缓存区 502 中各次上屏文字被换行号进行了分隔, 每一上屏文字都视为一个整体单 元, 假设光标被同步到位置 523 处, 则追踪复制该位置处的完整的上屏文字即 “刘远方” , 当 用户将 “远方” 修改为 “元芳” 后, 一旦同步光标离开该当前的上屏文字, 则确认对该上屏文 字修改完毕, 此时将追踪复制的所述完整单元 “刘远方” 作为修改前的上屏文字, 将该上屏 文字的当前的完整内容 “刘元芳” 作为修改后的上屏文字, 并执行步骤 405 进行词库数据的 矫正。 0056 在一种特殊情况中, 如果光标被同步到位置 524 处, 由于此处为两个上屏文字之 间的位置, 不知下一步会修改前一个。
30、还是后一个, 此时的一种处理方法是会将该光标处前 后两个上屏文字即 “刘远方” 和 “见义勇为” 都复制, 如果用户修改了 “刘远方” 则将所复制 的 “刘远方” 作为修改前的上屏文字, 如果用户修改了 “见义勇为” , 则将所复制的 “见义勇 为” 作为修改前的上屏文字。 0057 步骤 406、 从词库中撤销修改前的该上屏文字对应的学词, 并将修改后的该上屏文 字作为学词计入词库。例如图 5c 中所述如果将 “远方” 改为 “元芳” , 则撤销上屏文字 “刘远 方” 对应的学词, 将 “刘元芳” 作为学词计入词库。 0058 此处所谓的撤销学词不等同于删除, 而是指如果该学词 “刘远方” 。
31、只计入词库一次 则从词库中删除 ( 即其计入次数为 0), 如果计入词库不止一次则降低该学词 “刘远方” 的计 入次数。 0059 此处所谓计入学词也不等同于简单的增加, 而是如果词库中没有该学词 “刘元 芳” , 则增加该学词, 并计一次 ; 如果词库中已经有该学词 “刘元芳” , 则增加该学词的计入次 数。 0060 如上述步骤 404 和 405 所述, 本发明以一个上屏文字的整体作为一个操作单元进 行撤销学词和重新计入修改后的学词的操作, 即使用户只修改了一个上屏文字的部分内 容, 也是将该上屏文字整体撤销并计入修改后的该上屏文字的全部内容, 因此避免了现有 技术中由于修改了部分内容导。
32、致词库数据矫正错误的问题, 提高了词库数据矫正的正确 率。 0061 并且, 如果用户已经持续输入了一段时间, 不论用户修改之前输入的哪一个上屏 文字, 则本发明都会根据在所述记录区内同步的光标位置和修改操作确定所修改的上屏文 字的位置和内容, 从词库中撤销修改前的该上屏文字对应的学词, 将修改后的该上屏文字 说 明 书 CN 103365905 A 8 6/8 页 9 作为学词计入词库, 因此克服了现有技术在用户更改前文输入的文字时, 词库数据矫正会 出现错误的问题, 提高了词库数据矫正的正确率。 0062 本发明中, 能被判定为修改了缓存区中已经记录的上屏文字并需要进行对应的词 库数据矫正。
33、的修改操作可以有多种, 例如以下各表为典型的几种修改操作, 为方便阅读, 其 中修改的地方用下划线标出 : 0063 1) 修改某个上屏文字的末尾部分。 0064 0065 2) 修改某个上屏文字的中间部分。 0066 0067 0068 3) 在某个上屏文字的中间部分修改原内容及插入新内容。 0069 说 明 书 CN 103365905 A 9 7/8 页 10 0070 4) 在除最后一个上屏文字的其他上屏文字的结尾插入新内容。 0071 0072 但是, 并不是所有的修改操作都可以被能被判定为修改了缓存区中已经记录的上 屏文字并需要进行对应的词库数据矫正。 0073 例如如果是对缓存区。
34、中最后一个上屏文字的结尾插入新内容, 则视同为增加了新 的上屏文字, 而不是对缓存区中已经记录的上屏文字进行修改, 因此不需要对词库数据进 行矫正, 而是将新增的上屏文字作为学词计入词库。 0074 再例如在某一上屏文字之前插入新的文字的操作, 虽然可以判定为修改了缓存区 中已经记录的上屏文字, 但是在上屏文字前端插入的文字与该上屏文字的内容关系不大, 因此不需要进行对应的词库数据矫正, 而是将插入的文字作为新学词计入词库。如下表所 示 : 说 明 书 CN 103365905 A 10 8/8 页 11 0075 0076 另外, 本发明中, 如果发生了上述的需要进行词库数据矫正的修改操作,。
35、 可以对词 库数据进行矫正, 这种处理方法比较宽松 ; 如果希望对词库的学词进行更为严格的矫正操 作, 也可以在发生了上述的需要进行词库数据矫正的修改操作, 并确定了所修改的上屏文 字的修改前后的内容之后, 进一步设定更为细化的判断策略, 比如字数相等、 编码一致等策 略, 如果达到这些判断策略的要求, 再进一步矫正对应的词库数据, 这样可以更为精确地对 词库数据进行矫正。例如 : 0077 在一种实施例中, 在确定所修改的上屏文字的修改前后的内容之后, 进一步判断 修改后的上屏文字的字数是否和修改前的该上屏文字的字数相同, 只有在字数相同时才 从词库中撤销修改前的该上屏文字对应的学词, 并将。
36、修改后的该上屏文字作为学词计入词 库。 否则, 不从词库中撤销修改前的该上屏文字对应的学词, 而是将修改后的该上屏文字作 为新学词计入词库。 0078 在另一种实施例中, 在确定所修改的上屏文字的修改前后的内容之后, 进一步判 断修改后的上屏文字的编码(如拼音编码、 字根编码、 字符编码等)是否和修改前的该上屏 文字的编码相同, 只有在编码相同时才从词库中撤销修改前的该上屏文字对应的学词, 并 将修改后的该上屏文字作为学词计入词库。在这种情况下, 需要在用户输入上屏文字时同 步记录对应的编码。 0079 本发明中, 所述记录区的容量不能无限大, 因此可以设置所述记录区的容量, 当在 该记录区记。
37、录的上屏文字的内容达到该记录区的容量上限后, 则需要删除最早的上屏文 字, 记录最新的上屏文字, 以将记录区记录的内容维护在一个合理的容量内。 0080 以上所述仅为本发明的较佳实施例而已, 并不用以限制本发明, 凡在本发明的精 神和原则之内, 所做的任何修改、 等同替换、 改进等, 均应包含在本发明保护的范围之内。 说 明 书 CN 103365905 A 11 1/4 页 12 图 1 图 2 说 明 书 附 图 CN 103365905 A 12 2/4 页 13 图 3 说 明 书 附 图 CN 103365905 A 13 3/4 页 14 图 4 说 明 书 附 图 CN 103365905 A 14 4/4 页 15 图 5a 图 5b 图 5c 说 明 书 附 图 CN 103365905 A 15 。