《一种交互式的机器翻译方法和机器翻译系统.pdf》由会员分享,可在线阅读,更多相关《一种交互式的机器翻译方法和机器翻译系统.pdf(7页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 102662935 A(43)申请公布日 2012.09.12CN102662935A*CN102662935A*(21)申请号 201210099298.7(22)申请日 2012.04.08G06F 17/28(2006.01)G06F 17/30(2006.01)(71)申请人北京语智云帆科技有限公司地址 100083 北京市海淀区五道口东升园华清嘉园13号楼1A、1B、1C华清园招待所024室(72)发明人胡日勒 魏勇鹏 万鑫 田尊崇(54) 发明名称一种交互式的机器翻译方法和机器翻译系统(57) 摘要一种交互式的机器翻译方法和机器翻译系统,用来将输入到计算机。
2、的源语言的文本翻译成为目标语言的文本,包括以下步骤:根据用户对翻译领域的选择,读取相应领域的预先存储的机器翻译模型;读取待翻译的文本,并将文本切分成一系列的句子;对读取的待翻译的句子和机器翻译模型进行运算,生成待翻译句子的搜索网络;当接收到用户输入的文字时,以输入的文字为搜索条件,在搜索网络上利用解码算法进行搜索,得到与输入的文字相匹配的翻译结果,不同的用户输入对应不同的翻译结果;如果接收到来自用户的结果选取动作,则读取的待翻译的句子的翻译过程结束;如果未接收到来自用户的结果选取动作,则继续接收用户的文字输入直到用户进行选取。(51)Int.Cl.权利要求书1页 说明书3页 附图2页(19)中。
3、华人民共和国国家知识产权局(12)发明专利申请权利要求书 1 页 说明书 3 页 附图 2 页1/1页21. 一种交互式的机器翻译方法,用来将输入到计算机的源语言的文本翻译成为目标语言的文本,其特征在于该方法包括以下步骤:根据用户对翻译领域的选择,读取相应领域的预先存储的机器翻译模型;读取待翻译的文本,并将文本切分成一系列的句子以方便后续模块的处理;对所述读取的待翻译的句子和所述读取的机器翻译模型进行运算,生成所述读取的待翻译句子的搜索网络;当接收到用户输入的文字时,以所述输入的文字为搜索条件,在所述搜索网络上利用解码算法进行搜索,得到与所述输入的文字相匹配的翻译结果,不同的用户输入对应不同的。
4、翻译结果;如果接收到来自用户的结果选取动作,则所述读取的待翻译的句子的翻译过程结束;如果未接收到来自用户的结果选取动作,则继续接收用户的文字输入直到用户进行选取。2.根据权利要求1的翻译方法,其特征在于:预先存储的机器翻译模型包括基于词汇的模型,基于短语的模型,基于句法的模型。3.根据权利要求1的翻译方法,其特征在于:在搜索网络上进行利用解码算法进行搜索时,解码算法包括柱搜索,基于堆栈的解码算法,A*搜索算法,贪心爬山解码算法,双向搜索算法。4.一种交互式的机器翻译系统,其特征在于该系统包括以下模块:翻译模型载入模块,根据用户所选的翻译领域,载入相应领域的机器翻译模型;待译句子获取模块,读取待。
5、译句子;搜索网络生成模块,根据由翻译模型载入模块载入的机器翻译模型和由待译句子获取模块读取的待译句子,生成针对本句原文的搜索网络;用户输入获取模块,获取用户输入的字符;搜索模块,在由搜索网络生成模块生成的搜索网络中,根据由用户输入获取模块获取的用户输入字符,搜索出以用户输入字符起始的搜索路径,并找到这些路径中的最优解;翻译结果生成模块,根据由搜索模块产生的搜索结果的最优路径,生成翻译结果;显示输出模块,将最终结果显示输出。5.根据权利要求4的翻译系统,其特征在于:用户输入获取模块接受来自包括拼音输入,笔画输入,手写输入,语音输入的输入方法的数据。权 利 要 求 书CN 102662935 A1。
6、/3页3一种交互式的机器翻译方法和机器翻译系统技术领域0001 本发明涉及机器翻译的技术领域,尤其是涉及到在语言翻译中提供人机交互方式的机器翻译功能的一种新的机器翻译方法和机器翻译系统。背景技术0002 随着社会科技与经济的高速发展,不同语种之间的信息交流已经成为信息交往中的重要组成部分,随之而来的对各种语言服务,尤其是翻译服务的需求也越来越广泛。0003 目前翻译行业普遍存在的问题是:翻译需求与日俱增、但翻译力量尤其是高端翻译人员严重紧缺,翻译工作效率低、成本高。翻译人员主要有以下障碍:1)需要花费大量的时间来查询和翻译专业词汇;2)需要通过长期学习来提高个人技能,很难利用同业积累的知识和数。
7、据;3)缺少实用且易操作的工具来减少翻译过程中的大量重复和简单的劳动;4)缺少将人工决策和机器智能有效结合的、能处理复杂翻译任务的工具。0004 其中,将人的智能决策能力与计算机的高速计算能力相结合是解决上述问题的关键技术之一。目前现有的各种在线的机器翻译系统,如谷歌翻译( 本发明正是为了解决上述问题而提出的,其目的在于,提供一种具有人机交互功能的机器翻译方法,其可提高翻译结果的准确率,并且可缩短从用户开始输入到获取正确翻译结果输出所花费的时间。0006 本发明的具有人机交互功能的机器翻译方法,包括如下步骤:根据用户对翻译领域的选择,读取相应领域的预先存储的机器翻译模型;读取待翻译的文本,并将。
8、文本切分成一系列的句子以方便后续模块的处理;对所述读取的待翻译的句子和所述读取的机器翻译模型进行运算,生成所述读取的待翻译句子的搜索网络;当接收到用户输入的文字时,以所述输入的文字为搜索条件,在所述搜索网络上利用解码算法进行搜索,得到与所述输入的文字相匹配的翻译结果,不同的用户输入对应不同的翻译结果;如果接收到来自用户的结果选取动作,则所述读取的待翻译的句子的翻译过程结束;如果未接收到来自用户的结果选取动作,则继续接收用户的文字输入直到用户进行选取。0007 在本发明的系统当中,预先存储了各种领域的大量的翻译模型,在系统运行的过说 明 书CN 102662935 A2/3页4程当中,可以根据用。
9、户的选择载入相应的翻译模型,翻译模型的领域与用户所翻译的文章的领域的匹配程度越高,本发明所实施的效果越好。0008 本发明所采取的方法解决了当前主流的机器翻译系统只能给出完全依靠机器的翻译结果,充分结合了人的智能决策能力和计算机的高速运算搜索能力,使得人在机器翻译系统当中起到了主导的作用,让用户更有可能得到他所需要的翻译结果。根据用户输入的几个字符,就有可能给出整句的翻译结果,而且这种结果也是匹配用户要求的结果,大大加快了用户在进行翻译时的输入速度。附图说明0009 图1为本发明所提的具有交互功能的机器翻译方法的系统结构图。0010 图2为本发明所提的具有交互功能的机器翻译方法的流程图。001。
10、1 图3为本发明实施例所提的输入视窗示意图。0012 图4本发明实施例所提的输入视窗示意图。具体实施方式0013 以下,通过参考附图来详细地说明本发明的特征、优点,本发明就会变得更加清楚了。0014 图1是本发明所提的具有交互功能的机器翻译方法的系统结构图,利用该图来说明本发明的系统运作。如图1所示,本发明的系统100含有翻译模型载入模块101、待译句子获取模块102、搜索网络生成模块103、用户输入获取模块104、搜索模块105、翻译结果生成模块106及显示输出模块107。0015 翻译模型载入模块101根据用户所选的翻译领域,载入相应领域的机器翻译模型,具体模型的形式可以有多种表达方式,比。
11、如基于词汇的模型(The mathematics of statistical machine translation: parameter estimation,Peter F. Brown et al. 1993),基于短语的模型(Modeling with structures in statistical machine translation,Ye-Yi Wang and Alex Waibel,1998),基于句法的模型(A syntax-based statistical translation model,Kenji Yamada and Kevin Knight,2001)等。
12、等,以供后续的搜索网络生成模块103进行调用。0016 待译句子获取模块102获取用户需要翻译的原文,并将其传送到搜索网络生成模块103。0017 搜索网络生成模块103根据翻译模型载入模块101载入的机器翻译模型和用户需要翻译的原文,生成针对本句原文的搜索网络。0018 用户输入模块104获取用户已经输入的字符,并将这些字符传送到搜索模块105。0019 搜索模块105根据用户输入的字符和搜索网络生成模块103生成的搜索网络,搜索出以用户输入字符起始的搜索路径,并将这些路径中的最优解,传送给翻译结果生成模块106,这部分被称为统计机器翻译中的解码过程,根据所选用模型的不同,会有不同的解码方法。
13、,比如柱搜索(Pharaoh: A Beam Search Decoder for Phrase-Based Statistical Machine Translation Models,Philipp Koehn,2004),基于堆栈的解码算法(Decoding Algorithm in Statistical Machine Translation, Y. Wang and A. Waibel, 1997.),A*说 明 书CN 102662935 A3/3页5搜索算法(An Efficient A* Search Algorithm for Statistical Machine Tra。
14、nslation, Franz Josef Och, Nicola Ueffing, Hermann Ney,2001),贪心爬山解码算法(Greedy Decoding for Statistical Machine Translation in Almost Linear Time,Ulrich Germann,2003),双向搜索算法(Bidirectional decoding for statistical machine translation, Taro Watanabe and Eiichiro Sumita,2002)等等。0020 翻译结果生成模块106根据搜索模块105生。
15、成的最优解生成这个最优解对应的整句翻译结果,并将这个结果传送给显示输出模块107。0021 最终的整句翻译结果由显示输出模块107进行输出,供用户进行选择,如果用户选择了系统的翻译提示作为结果,翻译过程结束,如果用户没有选择,则可继续输入字符,系统重新进行搜索,直到选择系统的翻译提示。0022 根据本发明的上述结构,可以根据用户的输入快速的提示出翻译结果,节省了用户组词,选词,组织句子的时间,大大的提高了翻译的效率。0023 接着,结合图1本发明所提的具有交互功能的机器翻译方法的系统架构图以及图2本发明所提的具有交互功能的机器翻译方法的流程图,以一个实施例来解说本发明的运作系统与方法。0024。
16、 下面的实施例仅用于说明本发明,显然本发明并不限于此。0025 如果用户需要进行化工领域的翻译,首先,用户需要选择文章所对应的领域“化工”,翻译模型载入模块101就将化工这个领域的机器翻译模型载入到其内部具有的存储器当中供后续的模块进行调用(步骤S01);假设用户待翻译的句子是“Study on Preparation of Unsupported Metallocene Catalyst Microparticles Using Supercritical Fluid Technology”,待译句子获取模块102会将这个句子记录下来,并传送给搜索网络生成模块103(步骤S02);搜索网络生。
17、成模块103会将这个句子与翻译模型进行结合,生成这个句子所对应的搜索网络(步骤S03);在用户进行输入时,如果用户输入的是“超临界流体”这个词,用户输入获取模块104就会获取这个词汇,并传送给搜索模块105,搜索模块105在本句对应的搜索网络上,查找以“超临界流体”这个词汇为起始的各种路径,并找到这些路径里的最优解,传送给翻译结果生成模块106,这个最优解对应一条完整覆盖整个句子翻译的路径,这个路径的每条边由词汇或者短语组成,由翻译结果生成模块106将这条路径组织连接起来,生成成为翻译结果的句子:“超临界流体技术制备无载体茂金属催化剂微粒的研究”(步骤S04);并由显示输出模块107显示给用户。
18、供用户进行选择,如图3所示(步骤S05);如果用户首先输入的是“使用”这个词,系统就会生成:“使用超临界流体技术制备无载体茂金属催化剂微粒的研究”这个句子供用户进行选用,如图4示。由上述的例子可以看出,本发明是根据用户的输入在搜索网络中进行搜索的,不同的用户输入对应不同的翻译结果,使得翻译结果能够匹配用户的输入,达到用户的翻译要求,用户通过简短的输入就能快速得到他所需要的翻译结果,明显的提高了翻译速度。0026 虽然如上所述地说明了本发明的实施方式,但是所述的内容并非用以直接限定本发明的专利保护范围。很显然对于本领域技术人员来说,在不脱离本发明所揭示的精神和范围之内,在实施的形式上及细节上所为的更动或变形,均属本发明的专利保护范围。因此本发明的专利保护范围仍须以本说明书所附的权利要求书所界定者为准。说 明 书CN 102662935 A1/2页6图1说 明 书 附 图CN 102662935 A2/2页7图2图3图4说 明 书 附 图CN 102662935 A。