一种具有辅助翻译功能的输入方法.pdf

上传人:00****42 文档编号:4060150 上传时间:2018-08-13 格式:PDF 页数:9 大小:551KB
返回 下载 相关 举报
摘要
申请专利号:

CN201210099289.8

申请日:

2012.04.08

公开号:

CN102662490A

公开日:

2012.09.12

当前法律状态:

撤回

有效性:

无权

法律详情:

发明专利申请公布后的视为撤回IPC(主分类):G06F 3/023申请公布日:20120912|||实质审查的生效IPC(主分类):G06F 3/023申请日:20120408|||公开

IPC分类号:

G06F3/023; G06F17/28; G06F17/30

主分类号:

G06F3/023

申请人:

北京语智云帆科技有限公司

发明人:

胡日勒; 魏勇鹏; 万鑫; 田尊崇

地址:

100083 北京市海淀区五道口东升园华清嘉园13号楼1A、1B、1C华清园招待所024室

优先权:

专利代理机构:

代理人:

PDF下载: PDF下载
内容摘要

一种具有辅助翻译功能的输入方法,用来在进行翻译的时候给予用户相关内容提示,其特征在于该方法包括以下步骤:读取待翻译句子;识别待翻译句子中所有可能的术语;从该句子所对应的领域字典中获取术语的翻译,从普通的双语电子字典中获取所有待译非术语词汇的翻译,建立一个高优先级树,将这些翻译结果及词汇对应的概率放入这个高优先级树中;当用户输入文字时,同时匹配输入法当中的一般词汇树和高优先级树,并根据其概率进行对匹配的结果进行综合排序;在一句话输入结束后,清除本句的高优先级树词汇列表;重复上述的过程,直至所有待翻译句子输入完毕。本发明将专业领域词库集成于输入法当中,有效提高了翻译过程中文本的输入效率。

权利要求书

1.一种具有辅助翻译功能的输入方法,用来在进行翻译的时候给予用户相关内容提示,其特征在于该方法包括以下步骤:读取待翻译句子;识别待翻译句子中所有可能的术语;从该句子所对应的领域字典中获取术语的翻译,从普通的双语电子字典中获取所有待译非术语词汇的翻译,建立一个高优先级树,将这些翻译结果及词汇对应的概率放入这个高优先级树中;当用户输入文字时,同时匹配输入法当中的一般词汇树和高优先级树,并根据其概率进行对匹配的结果进行综合排序;在一句话输入结束后,清除本句的高优先级树词汇列表;重复上述的过程,直至所有待翻译句子输入完毕。2. 根据权利要求1的输入方法,其特征在于:一般词汇树和高优先级树都是以TRIE树的模式进行组织的。3. 根据权利要求1的输入方法,其特征在于:对于待翻译句子中的词语根据词语的性质分别进行处理;即对于待翻译句子中的术语,根据用户指定的领域信息,查询相应的领域相关的术语词典,这个术语词典是人工编纂或者从相应领域大规模文本语料当中自动提取出来的,对于术语之外的词汇,查询普通的双语电子词典,并将查询到的词汇及其概率存入高优先级树当中。4. 根据权利要求1的输入方法,其特征在于:词汇的概率是从大规模文本语料当中统计而来,并根据用户的使用进行调整。5. 根据权利要求1的输入方法,其特征在于:综合排序的方法是将每一个词汇对应一个整形数据,这个数据中包含是否为用户自定义词汇,对应输入单元的长度,是否是高优先级树中的数据,是否为整句最优路径上的节点,得分,其中得分包含术语概率,语言模型概率,用户自定义权重,所有的数据按照这个整形数的大小进行排序。

说明书

一种具有辅助翻译功能的输入方法

技术领域

本发明涉及语言文字的输入方法技术领域,尤其是涉及到在语言翻译中提供计算机辅助翻译功能的语言文字快速输入方法。

背景技术

随着社会科技与经济的高速发展,不同语种之间的信息交流已经成为信息交往中的重要组成部分,随之而来的对各种语言服务,尤其是翻译服务的需求也越来越广泛。

目前翻译行业普遍存在的问题是:翻译需求与日俱增、但翻译力量尤其是高端翻译人员严重紧缺,翻译工作效率低、成本高。翻译人员主要有以下障碍:1)需要花费大量的时间来查询和翻译专业词汇;2)需要通过长期学习来提高个人技能,很难利用同业积累的知识和数据;3)缺少实用且易操作的工具来减少翻译过程中的大量重复和简单的劳动;4)缺少将人工决策和机器智能有效结合的、能处理复杂翻译任务的工具。

由于上述障碍的存在,面对各种领域的翻译需求,大量的专业词汇的存在经常会导致译者需要进行大量的界面切换,通过各种电子词典或者词典网站获得相应专业词汇的翻译,然后再切换回翻译界面,浪费了大量的时间,同时也容易打断译者的思路。

语言输入法是翻译工作中所必需的工具,对目标语言的输入完全依赖于输入法,但是目前常用的输入法除了具有一定的历史记忆功能(例如,能记住用户输入过的词或者句子,在用户再次进行相同词或者句子输入时,快速的给出提示),并不能给译者的翻译工作提供更多的帮助。译者经常会遇到利用输入法不能有针对性的快速输入的问题,需要输入的字词在输入法对应的词库中并不存在,或者由于使用频率的关系,排在比较靠后的位置,仍旧需要译者在字词选择栏中加以多次翻页才能找到需要输入的字词,这无疑对译者翻译效率的提高产生了较大的瓶颈。 

授权公告号为CN100524313C的中国发明专利公开了一种翻译过程中基于场景词库的快速输入法,在用户进行输入的过程中,读取并识别待翻译句中的待翻译词汇,然后从场景词库中取得与所述待翻译词汇对应的词条,将该词条注入到用户所使用的输入法自带的词库中,并将该词条在输入法输入框中的显示顺序优先级调到可以被首次选取输入的位置,加快用户的输入速度。其中,在将从场景词库中取得对应的词条注入到用户所使用的输入法词库的过程中,需要首先检测输入法,根据不同的输入法采取不同的方式将取得的词条注入到用户所使用的输入法自带的词库中。此发明解决了现有的输入方法中不能对特定文本尤其是翻译文本进行有针对性的快速输入的不足,在不改变用户输入法习惯的情况下,采用词库与词汇注入的方案,在现有输入法的基础上,通过在翻译输入的过程中暂时的、有针对性地修改字词的显示顺序(词频),有效提高的翻译过程中文本的输入效率,实现了翻译过程中的快速输入。

但是由于上述的发明是游离于输入法之外的,致使在其应用的过程当中,场景词库当中的词汇和输入法中的词汇不能有机的结合,场景词库中的词汇不论其出现的概率大小,一律出现在输入框的最前面部分(即使其出现概率极低),在一定程度上影响了用户的输入。而且该发明需要将场景词库中的相关词条注入到输入法词库当中,需要进行与输入法的交互,应用的难度相对较大。

发明内容

本发明正是为了解决上述问题而提出的,其目的在于,提供一种具有辅助翻译功能的快速输入方法,其可在翻译过程中不改变用户的关注焦点的情况下,将专业领域词库集成于输入法当中,根据待翻译句子和用户的输入给出各种翻译提示,使用户能够快速的选取他们需要输入的词汇或者句子,有效提高的翻译过程中文本的输入效率,实现了翻译过程中的快速输入。

    本发明的具有辅助翻译功能的快速输入方法,包括如下步骤:读取待翻译句子;识别待翻译句子中所有可能的术语;从该句子所对应的领域字典中获取术语的翻译,从普通的双语电子字典中获取所有待译非术语词汇的翻译,建立一个高优先级树,将这些翻译结果及词汇对应的概率放入这个高优先级树中;当用户输入文字时,同时匹配输入法当中的一般词汇树和高优先级树,并根据其概率进行对匹配的结果进行综合排序;在一句话输入结束后,清除本句的高优先级树词汇列表;重复上述的过程,直至所有待翻译句子输入完毕。

其中,在进行待译非术语词汇翻译的时候,所利用的资源是普通的双语电子字典;在进行待译术语翻译的时候,利用的资源是与当前待译句子领域相对应的领域术语字典,这样,所获取的术语翻译就是该领域所对应的术语翻译,而不会取得该术语在其他领域内的翻译(相同的术语在不同的领域中经常有不同的翻译方式)。

根据本发明,解决了现有的输入法以及各种计算机辅助翻译软件不能直观快捷的对翻译过程中的待翻译文本中的词汇已经专业术语进行提示的不足,在翻译过程中不改变用户的关注焦点的情况下,将专业领域词库集成于输入法当中,根据待翻译句子和用户的输入给出各种翻译提示,使用户能够快速的选取他们需要输入的词汇或者句子,有效提高的翻译过程中文本的输入效率,实现了翻译过程中的快速输入。

附图说明

图1为本发明所提的具有辅助翻译功能的输入法的系统结构图。

图2为本发明所提的具有辅助翻译功能的输入法的方法流程图。

图3为本发明实施例所显示的术语提示功能示意图。

图4为本发明实施例所提的输入视窗示意图。

图5为本发明实施例所提的输入视窗示意图。

图6为本发明实施例所提的输入视窗示意图。

具体实施方式

以下,通过参考附图来详细地说明本发明的特征、优点,本发明就会变得更加清楚了。

图1是本发明所提的具有辅助翻译功能的输入法的系统结构图,利用该图来说明本发明的系统运作。如图1所示,本发明的输入系统100含有输入获取模块101、原文读取模块102、术语识别模块103、词典查询模块104、候选生成模块105及显示输出模块106。

输入获取模块101获取用户的输入,并将其传送到候选生成模块105。

原文读取模块102读取用户需要翻译的原文,并将其传送到术语识别模块103。

术语识别模块103对待译原文中的术语进行识别,并将结果传送到词典查询模块104。

词典查询模块104对传送来的待译原文中的词汇在词典中找到相应的译文,并且记录下来。对于原文中的术语,根据用户指定的领域信息,查询相应的领域相关的术语词典,这个术语词典可以是人工编纂或者从本领域大规模文本语料当中提取出来的,对于其他词汇,查询普通的双语电子词典,并将查询到的词汇及其概率(词汇的概率是从大规模文本语料当中统计而来,并根据用户的使用进行调整)存入高优先级树当中。

候选生成模块105对由用户的输入所生成的词汇树和高优先级树(词汇树和高优先级树都是以TRIE树的模式进行组织的)合并,两个树中的词汇进行综合排序。综合排序的方法是将每一个词汇对应一个整形数据,这个数据中包含是否为用户自定义词汇,对应输入单元的长度,是否是高优先级树中的数据,是否为整句最优路径上的节点,得分;其中得分包含术语概率,语言模型概率,用户自定义权重。所有的数据按照这个整形数的大小进行排序。

排序的结果由显示输出模块106进行输出,供用户进行选择。

根据本发明的上述结构,由于引入了待翻译句子的信息,将术语词典引入输入法当中,减少了用户在翻译过程中查询词典的工作;在用户的输入过程当中,将用户的输入与术语词典信息相结合,可以减少用户的在进行翻译工作时的击键次数,从而加快翻译的速度。

接着,结合图1本发明所提的具有辅助翻译功能的输入法的系统架构图以及图2本发明所提的具有辅助翻译功能的输入法的方法流程图,以一个实施例来解说本发明的运作系统与方法。

下面的实施例仅用于说明本发明,显然本发明并不限于此。

假设使用者欲使用本发明所述的输入方法来翻译“both the adsorption rate and the desorption rate of gold could reach over 98 % under suitable conditions”这句话。根据用户的操作,原文读取模块102就会在用户翻译的文本中定位他要翻译的句子,并将这句话传给术语识别模块103(步骤S01);术语识别模块103识别其中的术语,比如:“adsorption rate”、“desorption rate”、“conditions”等等(步骤S02);然后把这些术语和句中其他所有的词汇传送给词典查询模块104,词典查询模块104将术语部分查询领域相关的术语词典,将普通词汇部分查询普通的双语词典,将查询得到的译词,如“吸附速度”、“吸附效率”、“脱附速度”、“适宜”、“工况”等分别相应地以纵向排列的方式显示在系统界面上的相应被译词的下方,如图3所示,系统将所有的这些译词存储于一个高优先级词汇候选列表中(步骤S03);当用户键入字母时,输入获取模块获取用户的输入,送到候选生成模块中;候选生成模块105根据用户的输入生成一个普通词汇候选列表,并将用户的输入与高优先级词汇候选列表中的词汇进行匹配,如果在其中能找到相应的匹配,就将高优先级词汇列表中匹配的词汇和普通词汇候选列表中的词汇根据长度、概率等参数进行综合排序,生成一个新的词汇列表(步骤S04);并将这个词汇列表送给显示输出模块106显示出来(步骤S05)。在本例中,例如当用户输入“x”时,候选生成模块105在高优先级词汇列表中匹配了“吸附速度”和“吸附性能”两个词,并将这些词汇与普通词汇候选列表中的词汇“下”、“型”、“性”等词汇进行综合排序,将排序的结果显示给用户,如图4所示。如果用户希望输入“吸附速度”这个词汇,只要键入“2”就可以将该所希望的“吸附速度”的整个词汇打出,即,仅需敲击两键即可输入该词,大大的节省了输入的时间。同样的,如果用户希望输入“热解吸”这个词汇,只需要键入“r”后,再键入“1”或者空格键,就可以完成整个词汇的输入,如图5所示。在用户完成一句话的输入之后,准备翻译下一句的时候,系统将高优先级树中的数据清空,再根据下一句重新建立其对应的优先级树,这样就可以保证在进行各个句子的翻译的时候,没有相互的影响,保证翻译的效率。如图6所示,用户在翻译第二个句子:“Study on Removing Flue Gas Entrained by Regenerated Catalyst”的时候,再键入“r”的时候,“热解吸”就不出现在列表当中,而与本句相关的“燃气”出现在列表当中。经初步测试,该功能比目前市场占有率较高的搜狗输入法可节省至少1/3以上的按键操作次数,尤其是可以减少组词、翻页等在输入过程中最耗时的操作约80%。

虽然如上所述地说明了本发明的实施方式,但是所述的内容并非用以直接限定本发明的专利保护范围。很显然对于本领域技术人员来说,在不脱离本发明所揭示的精神和范围之内,在实施的形式上及细节上所为的更动或变形,均属本发明的专利保护范围。因此本发明的专利保护范围仍须以本说明书所附的权利要求书所界定者为准。

一种具有辅助翻译功能的输入方法.pdf_第1页
第1页 / 共9页
一种具有辅助翻译功能的输入方法.pdf_第2页
第2页 / 共9页
一种具有辅助翻译功能的输入方法.pdf_第3页
第3页 / 共9页
点击查看更多>>
资源描述

《一种具有辅助翻译功能的输入方法.pdf》由会员分享,可在线阅读,更多相关《一种具有辅助翻译功能的输入方法.pdf(9页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 102662490 A(43)申请公布日 2012.09.12CN102662490A*CN102662490A*(21)申请号 201210099289.8(22)申请日 2012.04.08G06F 3/023(2006.01)G06F 17/28(2006.01)G06F 17/30(2006.01)(71)申请人北京语智云帆科技有限公司地址 100083 北京市海淀区五道口东升园华清嘉园13号楼1A、1B、1C华清园招待所024室(72)发明人胡日勒 魏勇鹏 万鑫 田尊崇(54) 发明名称一种具有辅助翻译功能的输入方法(57) 摘要一种具有辅助翻译功能的输入方。

2、法,用来在进行翻译的时候给予用户相关内容提示,其特征在于该方法包括以下步骤:读取待翻译句子;识别待翻译句子中所有可能的术语;从该句子所对应的领域字典中获取术语的翻译,从普通的双语电子字典中获取所有待译非术语词汇的翻译,建立一个高优先级树,将这些翻译结果及词汇对应的概率放入这个高优先级树中;当用户输入文字时,同时匹配输入法当中的一般词汇树和高优先级树,并根据其概率进行对匹配的结果进行综合排序;在一句话输入结束后,清除本句的高优先级树词汇列表;重复上述的过程,直至所有待翻译句子输入完毕。本发明将专业领域词库集成于输入法当中,有效提高了翻译过程中文本的输入效率。(51)Int.Cl.权利要求书1页 。

3、说明书4页 附图3页(19)中华人民共和国国家知识产权局(12)发明专利申请权利要求书 1 页 说明书 4 页 附图 3 页1/1页21.一种具有辅助翻译功能的输入方法,用来在进行翻译的时候给予用户相关内容提示,其特征在于该方法包括以下步骤:读取待翻译句子;识别待翻译句子中所有可能的术语;从该句子所对应的领域字典中获取术语的翻译,从普通的双语电子字典中获取所有待译非术语词汇的翻译,建立一个高优先级树,将这些翻译结果及词汇对应的概率放入这个高优先级树中;当用户输入文字时,同时匹配输入法当中的一般词汇树和高优先级树,并根据其概率进行对匹配的结果进行综合排序;在一句话输入结束后,清除本句的高优先级树。

4、词汇列表;重复上述的过程,直至所有待翻译句子输入完毕。2. 根据权利要求1的输入方法,其特征在于:一般词汇树和高优先级树都是以TRIE树的模式进行组织的。3. 根据权利要求1的输入方法,其特征在于:对于待翻译句子中的词语根据词语的性质分别进行处理;即对于待翻译句子中的术语,根据用户指定的领域信息,查询相应的领域相关的术语词典,这个术语词典是人工编纂或者从相应领域大规模文本语料当中自动提取出来的,对于术语之外的词汇,查询普通的双语电子词典,并将查询到的词汇及其概率存入高优先级树当中。4. 根据权利要求1的输入方法,其特征在于:词汇的概率是从大规模文本语料当中统计而来,并根据用户的使用进行调整。5。

5、. 根据权利要求1的输入方法,其特征在于:综合排序的方法是将每一个词汇对应一个整形数据,这个数据中包含是否为用户自定义词汇,对应输入单元的长度,是否是高优先级树中的数据,是否为整句最优路径上的节点,得分,其中得分包含术语概率,语言模型概率,用户自定义权重,所有的数据按照这个整形数的大小进行排序。权 利 要 求 书CN 102662490 A1/4页3一种具有辅助翻译功能的输入方法技术领域0001 本发明涉及语言文字的输入方法技术领域,尤其是涉及到在语言翻译中提供计算机辅助翻译功能的语言文字快速输入方法。背景技术0002 随着社会科技与经济的高速发展,不同语种之间的信息交流已经成为信息交往中的重。

6、要组成部分,随之而来的对各种语言服务,尤其是翻译服务的需求也越来越广泛。0003 目前翻译行业普遍存在的问题是:翻译需求与日俱增、但翻译力量尤其是高端翻译人员严重紧缺,翻译工作效率低、成本高。翻译人员主要有以下障碍:1)需要花费大量的时间来查询和翻译专业词汇;2)需要通过长期学习来提高个人技能,很难利用同业积累的知识和数据;3)缺少实用且易操作的工具来减少翻译过程中的大量重复和简单的劳动;4)缺少将人工决策和机器智能有效结合的、能处理复杂翻译任务的工具。0004 由于上述障碍的存在,面对各种领域的翻译需求,大量的专业词汇的存在经常会导致译者需要进行大量的界面切换,通过各种电子词典或者词典网站获。

7、得相应专业词汇的翻译,然后再切换回翻译界面,浪费了大量的时间,同时也容易打断译者的思路。0005 语言输入法是翻译工作中所必需的工具,对目标语言的输入完全依赖于输入法,但是目前常用的输入法除了具有一定的历史记忆功能(例如,能记住用户输入过的词或者句子,在用户再次进行相同词或者句子输入时,快速的给出提示),并不能给译者的翻译工作提供更多的帮助。译者经常会遇到利用输入法不能有针对性的快速输入的问题,需要输入的字词在输入法对应的词库中并不存在,或者由于使用频率的关系,排在比较靠后的位置,仍旧需要译者在字词选择栏中加以多次翻页才能找到需要输入的字词,这无疑对译者翻译效率的提高产生了较大的瓶颈。 000。

8、6 授权公告号为CN100524313C的中国发明专利公开了一种翻译过程中基于场景词库的快速输入法,在用户进行输入的过程中,读取并识别待翻译句中的待翻译词汇,然后从场景词库中取得与所述待翻译词汇对应的词条,将该词条注入到用户所使用的输入法自带的词库中,并将该词条在输入法输入框中的显示顺序优先级调到可以被首次选取输入的位置,加快用户的输入速度。其中,在将从场景词库中取得对应的词条注入到用户所使用的输入法词库的过程中,需要首先检测输入法,根据不同的输入法采取不同的方式将取得的词条注入到用户所使用的输入法自带的词库中。此发明解决了现有的输入方法中不能对特定文本尤其是翻译文本进行有针对性的快速输入的不。

9、足,在不改变用户输入法习惯的情况下,采用词库与词汇注入的方案,在现有输入法的基础上,通过在翻译输入的过程中暂时的、有针对性地修改字词的显示顺序(词频),有效提高的翻译过程中文本的输入效率,实现了翻译过程中的快速输入。0007 但是由于上述的发明是游离于输入法之外的,致使在其应用的过程当中,场景词库当中的词汇和输入法中的词汇不能有机的结合,场景词库中的词汇不论其出现的概率大小,一律出现在输入框的最前面部分(即使其出现概率极低),在一定程度上影响了用户的说 明 书CN 102662490 A2/4页4输入。而且该发明需要将场景词库中的相关词条注入到输入法词库当中,需要进行与输入法的交互,应用的难度。

10、相对较大。发明内容0008 本发明正是为了解决上述问题而提出的,其目的在于,提供一种具有辅助翻译功能的快速输入方法,其可在翻译过程中不改变用户的关注焦点的情况下,将专业领域词库集成于输入法当中,根据待翻译句子和用户的输入给出各种翻译提示,使用户能够快速的选取他们需要输入的词汇或者句子,有效提高的翻译过程中文本的输入效率,实现了翻译过程中的快速输入。0009 本发明的具有辅助翻译功能的快速输入方法,包括如下步骤:读取待翻译句子;识别待翻译句子中所有可能的术语;从该句子所对应的领域字典中获取术语的翻译,从普通的双语电子字典中获取所有待译非术语词汇的翻译,建立一个高优先级树,将这些翻译结果及词汇对应。

11、的概率放入这个高优先级树中;当用户输入文字时,同时匹配输入法当中的一般词汇树和高优先级树,并根据其概率进行对匹配的结果进行综合排序;在一句话输入结束后,清除本句的高优先级树词汇列表;重复上述的过程,直至所有待翻译句子输入完毕。0010 其中,在进行待译非术语词汇翻译的时候,所利用的资源是普通的双语电子字典;在进行待译术语翻译的时候,利用的资源是与当前待译句子领域相对应的领域术语字典,这样,所获取的术语翻译就是该领域所对应的术语翻译,而不会取得该术语在其他领域内的翻译(相同的术语在不同的领域中经常有不同的翻译方式)。0011 根据本发明,解决了现有的输入法以及各种计算机辅助翻译软件不能直观快捷的。

12、对翻译过程中的待翻译文本中的词汇已经专业术语进行提示的不足,在翻译过程中不改变用户的关注焦点的情况下,将专业领域词库集成于输入法当中,根据待翻译句子和用户的输入给出各种翻译提示,使用户能够快速的选取他们需要输入的词汇或者句子,有效提高的翻译过程中文本的输入效率,实现了翻译过程中的快速输入。附图说明0012 图1为本发明所提的具有辅助翻译功能的输入法的系统结构图。0013 图2为本发明所提的具有辅助翻译功能的输入法的方法流程图。0014 图3为本发明实施例所显示的术语提示功能示意图。0015 图4为本发明实施例所提的输入视窗示意图。0016 图5为本发明实施例所提的输入视窗示意图。0017 图6。

13、为本发明实施例所提的输入视窗示意图。具体实施方式0018 以下,通过参考附图来详细地说明本发明的特征、优点,本发明就会变得更加清楚了。0019 图1是本发明所提的具有辅助翻译功能的输入法的系统结构图,利用该图来说明本发明的系统运作。如图1所示,本发明的输入系统100含有输入获取模块101、原文读取说 明 书CN 102662490 A3/4页5模块102、术语识别模块103、词典查询模块104、候选生成模块105及显示输出模块106。0020 输入获取模块101获取用户的输入,并将其传送到候选生成模块105。0021 原文读取模块102读取用户需要翻译的原文,并将其传送到术语识别模块103。0。

14、022 术语识别模块103对待译原文中的术语进行识别,并将结果传送到词典查询模块104。0023 词典查询模块104对传送来的待译原文中的词汇在词典中找到相应的译文,并且记录下来。对于原文中的术语,根据用户指定的领域信息,查询相应的领域相关的术语词典,这个术语词典可以是人工编纂或者从本领域大规模文本语料当中提取出来的,对于其他词汇,查询普通的双语电子词典,并将查询到的词汇及其概率(词汇的概率是从大规模文本语料当中统计而来,并根据用户的使用进行调整)存入高优先级树当中。0024 候选生成模块105对由用户的输入所生成的词汇树和高优先级树(词汇树和高优先级树都是以TRIE树的模式进行组织的)合并,。

15、两个树中的词汇进行综合排序。综合排序的方法是将每一个词汇对应一个整形数据,这个数据中包含是否为用户自定义词汇,对应输入单元的长度,是否是高优先级树中的数据,是否为整句最优路径上的节点,得分;其中得分包含术语概率,语言模型概率,用户自定义权重。所有的数据按照这个整形数的大小进行排序。0025 排序的结果由显示输出模块106进行输出,供用户进行选择。0026 根据本发明的上述结构,由于引入了待翻译句子的信息,将术语词典引入输入法当中,减少了用户在翻译过程中查询词典的工作;在用户的输入过程当中,将用户的输入与术语词典信息相结合,可以减少用户的在进行翻译工作时的击键次数,从而加快翻译的速度。0027 。

16、接着,结合图1本发明所提的具有辅助翻译功能的输入法的系统架构图以及图2本发明所提的具有辅助翻译功能的输入法的方法流程图,以一个实施例来解说本发明的运作系统与方法。0028 下面的实施例仅用于说明本发明,显然本发明并不限于此。0029 假设使用者欲使用本发明所述的输入方法来翻译“both the adsorption rate and the desorption rate of gold could reach over 98 % under suitable conditions”这句话。根据用户的操作,原文读取模块102就会在用户翻译的文本中定位他要翻译的句子,并将这句话传给术语识别模块1。

17、03(步骤S01);术语识别模块103识别其中的术语,比如:“adsorption rate”、“desorption rate”、“conditions”等等(步骤S02);然后把这些术语和句中其他所有的词汇传送给词典查询模块104,词典查询模块104将术语部分查询领域相关的术语词典,将普通词汇部分查询普通的双语词典,将查询得到的译词,如“吸附速度”、“吸附效率”、“脱附速度”、“适宜”、“工况”等分别相应地以纵向排列的方式显示在系统界面上的相应被译词的下方,如图3所示,系统将所有的这些译词存储于一个高优先级词汇候选列表中(步骤S03);当用户键入字母时,输入获取模块获取用户的输入,送到候选。

18、生成模块中;候选生成模块105根据用户的输入生成一个普通词汇候选列表,并将用户的输入与高优先级词汇候选列表中的词汇进行匹配,如果在其中能找到相应的匹配,就将高优先级词汇列表中匹配的词汇和普通词汇候选列表中的词汇根据长度、概率等参数进行综合排序,生成一个新的词汇列表(步骤S04);并将这个词汇列表送给显示输出模说 明 书CN 102662490 A4/4页6块106显示出来(步骤S05)。在本例中,例如当用户输入“x”时,候选生成模块105在高优先级词汇列表中匹配了“吸附速度”和“吸附性能”两个词,并将这些词汇与普通词汇候选列表中的词汇“下”、“型”、“性”等词汇进行综合排序,将排序的结果显示给。

19、用户,如图4所示。如果用户希望输入“吸附速度”这个词汇,只要键入“2”就可以将该所希望的“吸附速度”的整个词汇打出,即,仅需敲击两键即可输入该词,大大的节省了输入的时间。同样的,如果用户希望输入“热解吸”这个词汇,只需要键入“r”后,再键入“1”或者空格键,就可以完成整个词汇的输入,如图5所示。在用户完成一句话的输入之后,准备翻译下一句的时候,系统将高优先级树中的数据清空,再根据下一句重新建立其对应的优先级树,这样就可以保证在进行各个句子的翻译的时候,没有相互的影响,保证翻译的效率。如图6所示,用户在翻译第二个句子:“Study on Removing Flue Gas Entrained b。

20、y Regenerated Catalyst”的时候,再键入“r”的时候,“热解吸”就不出现在列表当中,而与本句相关的“燃气”出现在列表当中。经初步测试,该功能比目前市场占有率较高的搜狗输入法可节省至少1/3以上的按键操作次数,尤其是可以减少组词、翻页等在输入过程中最耗时的操作约80%。0030 虽然如上所述地说明了本发明的实施方式,但是所述的内容并非用以直接限定本发明的专利保护范围。很显然对于本领域技术人员来说,在不脱离本发明所揭示的精神和范围之内,在实施的形式上及细节上所为的更动或变形,均属本发明的专利保护范围。因此本发明的专利保护范围仍须以本说明书所附的权利要求书所界定者为准。说 明 书CN 102662490 A1/3页7图1说 明 书 附 图CN 102662490 A2/3页8图2图3图4说 明 书 附 图CN 102662490 A3/3页9图5图6说 明 书 附 图CN 102662490 A。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1