《机器翻译系统及机器翻译方法.pdf》由会员分享,可在线阅读,更多相关《机器翻译系统及机器翻译方法.pdf(39页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 102959537 A(43)申请公布日 2013.03.06CN102959537A*CN102959537A*(21)申请号 201080067673.9(22)申请日 2010.06.25G06F 17/28(2006.01)(71)申请人乐天株式会社地址日本国东京都(72)发明人益子宗(74)专利代理机构北京律盟知识产权代理有限责任公司 11287代理人章蕾(54) 发明名称机器翻译系统及机器翻译方法(57) 摘要一种机器翻译系统,预先将至少包含一组含有文字且经可视化的图像的参照数据(URL)、在与该图像重叠的区域设定着显示位置、不含文字且非可视化的背景图像的。
2、参照数据(URL)、及在与该背景图像重叠的区域设定着显示位置、且非可视化的文本数据的HTML数据存储在WebDB中,在翻译处理时使该非可视化的背景图像数据及文本数据可视化,并且使该经可视化的图像数据非可视化。(85)PCT申请进入国家阶段日2012.12.24(86)PCT申请的申请数据PCT/JP2010/060882 2010.06.25(87)PCT申请的公布数据WO2011/161825 JA 2011.12.29(51)Int.Cl.权利要求书2页 说明书13页 附图23页(19)中华人民共和国国家知识产权局(12)发明专利申请权利要求书 2 页 说明书 13 页 附图 23 页1/。
3、2页21.一种机器翻译系统,其特征在于:将以特定语言表现的翻译对象的Web页面翻译成其他语言,并提供所翻译的所述Web页面,可连接于存储描述翻译对象的所述Web页面的构造的HTML数据及由该HTML数据参照的图像数据的Web数据存储机构、及存储用于文本的翻译处理的词典数据的翻译数据存储机构,所述HTML数据以组的形式包含含有文字且经可视化的图像相关的描述、在与该图像的显示位置相对应的特定位置设定着显示位置、不含文字且非可视化的背景图像相关的描述、及在与该背景图像重叠的特定位置的前面设定着显示位置且非可视化的特定语言的文本相关的描述,该机器翻译系统包括:翻译请求接收机构,从浏览所述Web页面的用。
4、户终端接收包含与翻译对象的所述Web页面相对应的URL及指定翻译目标语言的指定数据的翻译请求;HTML数据取得机构,从所述Web数据存储机构取得与所述翻译请求中所包含的所述URL相对应的描述所述Web页面的构造的所述HTML数据;翻译机构,参照由所述翻译数据存储机构所存储的所述词典数据,将由所述HTML数据取得机构所取得的所述HTML数据中所包含的文本翻译成与所述翻译请求中所包含的所述指定数据相对应的翻译目标语言;可视化要素切换机构,使由所述HTML数据取得机构所取得的所述HTML数据中所包含的非可视化的文本及所述背景图像可视化,并且使该HTML数据中所包含的经可视化的所述图像非可视化;已翻译。
5、的HTML数据发送机构,使用由所述翻译机构所翻译的文本重组由所述HTML数据取得机构所取得的所述HTML数据,并将其发送至所述终端;及图像数据发送机构,根据来自所述终端的指定所述图像数据的发送请求,从所述Web数据存储机构读出所指定的所述图像数据并将其发送至该终端。2.根据权利要求1所述的机器翻译系统,其中所述可视化要素切换机构将文本的文字色属性自透明变更为有色,将含有文本的区域的显示属性自隐藏变更为显示或删除插入含有文本的区域的标签的注释标签,由此使非可视化的文本可视化。3.根据权利要求1或2所述的机器翻译系统,其中所述可视化要素切换机构将所述背景图像的显示属性自隐藏变更为显示,将含有所述背。
6、景图像的区域的显示属性自隐藏变更为显示,删除插入与所述背景图像相对应的标签的注释标签,由此使非可视化的所述背景图像可视化。4.根据权利要求1至3中任一权利要求所述的机器翻译系统,其中所述可视化要素切换机构将所述图像的显示属性自显示变更为隐藏,删除与所述图像相对应的标签,以注释标签插入与所述图像相对应的标签,将含有所述图像的区域的显示属性自显示变更为隐藏或以注释标签插入与含有所述图像的区域相对应的标签,由此使经可视化的所述图像非可视化。5.根据权利要求1至4中任一权利要求所述的机器翻译系统,其中所述已翻译的HTML数据发送机构将由所述HTML数据取得机构所取得的所述HTML数据的基准URL,变更。
7、为所述翻译请求中所包含的翻译对象的所述Web页面的所述URL。权 利 要 求 书CN 102959537 A2/2页36.根据权利要求1至5中任一权利要求所述的机器翻译系统,其中所述已翻译的HTML数据发送机构于由所述翻译机构所翻译的文本长度、与由所述HTML数据取得机构所取得的所述HTML数据中所包含的特定的文本长度相比为长于一定值以上的情况下,修正由所述翻译机构所翻译的文本的长度而使其变短。7.一种机器翻译方法,其特征在于由将以特定语言表现的翻译对象的Web页面的文本翻译成其他语言,并提供所翻译的所述Web页面的机器翻译系统执行,所述机器翻译系统可连接于存储描述翻译对象的所述Web页面的构。
8、造的HTML数据及由该HTML数据参照的图像数据的Web数据存储机构、及存储用于文本的翻译处理的词典数据的翻译数据存储机构,所述HTML数据以组的形式包含含有文字且经可视化的图像相关的描述、在与该图像的显示位置相对应的特定位置设定着显示位置、不含文字且非可视化的背景图像相关的描述、及在与该背景图像重叠的特定位置的前面设定着显示位置且非可视化的特定语言的文本相关的描述,所述机器翻译系统执行如下的步骤:翻译请求接收步骤,从浏览所述Web页面的用户终端接收包含与翻译对象的所述Web页面相对应的URL及指定翻译目标语言的指定数据的翻译请求;HTML数据取得步骤,从所述Web数据存储机构取得与所述翻译请。
9、求中所包含的所述URL相对应的描述所述Web页面的构造的所述HTML数据;翻译步骤,参照由所述翻译数据存储机构所存储的所述词典数据,将通过所述HTML数据取得步骤所取得的所述HTML数据中所包含的文本翻译成与所述翻译请求中所包含的所述指定数据相对应的翻译目标语言;可视化要素切换步骤,使通过所述HTML数据取得步骤所取得的所述HTML数据中所包含的非可视化的文本及所述背景图像可视化,并且使该HTML数据中所包含的经可视化的所述图像非可视化;已翻译的HTML数据发送步骤,使用通过所述翻译步骤所翻译的文本重组通过所述HTML数据取得步骤所取得的所述HTML数据,并将其发送至所述终端;及图像数据发送步。
10、骤,根据来自所述终端的指定所述图像数据的发送请求,从所述Web数据存储机构读出所指定的所述图像数据并将其发送至该终端。8.一种机器翻译程序,用于使1个或多个计算机实现权利要求1至6中任一权利要求所述的机器翻译系统具备的各机构作为功能。9.一种计算机可读取的记录介质,记录如下程序,该程序用于使1个或多个计算机实现权利要求1至6中任一权利要求所述的机器翻译系统具备的各机构作为功能。权 利 要 求 书CN 102959537 A1/13页4机器翻译系统及机器翻译方法技术领域0001 本发明涉及一种机器翻译文书的构造,尤其涉及一种即时翻译显示在Web页面内的文本的系统等。背景技术0002 作为机器翻译。
11、Web页面中的文本的装置,已知一种翻译图像内的文字部分的装置(例如参照专利文献1)。专利文献1所记载的装置是按照以下的次序作成仅翻译图像与文字混在一起的图像数据中的文字部分的图像。首先,确定图像与文字混在一起的图像数据中存在文字数据的部分(文字区域)。接着,从文字区域提取文字数据,将所提取的文字数据转换成文本数据。然后,翻译文本数据,调整翻译数据后将其贴附至文字区域。最后,将贴附着翻译数据的文字区域与原先的图像数据进行合成(参照同文献图2的流程图、图3图10的说明图等)。0003 背景技术文献0004 专利文献0005 专利文献1:日本专利特开2003-122751号公报发明内容0006 发明。
12、所要解决的问题0007 对于利用者来说,当利用因特网上的服务时,若Web页面是以该利用者的使用语言显示则较为便利。但是,对所有Web页面预先准备各国语言的模式不仅费事而且不现实。0008 相对于此,考虑事先以特定的语言作成Web页面,使用例如可机器翻译的装置,即时地将Web页面中的文本翻译成利用者的使用语言进行提供。0009 但是,多数情况下在提供服务的Web页面中配置着图像,该图像中经常含有文字(图1(a)的110a,此处为日语)。因此,若仅对文本数据进行机器翻译,则图像中的文字不会被翻译(图1(b)的110b,此处译成英文)。这种情况下,通过使用例如专利文献1记载的装置,也可翻译图像内的文。
13、字,从而可无损Web页面的美观及布局而进行机器翻译。0010 但是,在专利文献1所记载的装置中,由于是适当提取图像内的文字进行翻译,因此处理需花费时间。由此,对于以即时处理为前提的翻译服务,无法采用专利文献1所记载的装置。0011 本发明是为了解决所述问题研究而成,目的在于提供一种可以在翻译处理前后保持翻译对象页面的视觉格局,并且可实现图像内所包含的文字的翻译处理的高速化的机器翻译系统、机器翻译方法、机器翻译程序及记录着该机器翻译程序的记录介质。0012 解决问题的技术手段0013 即,本发明的机器翻译系统的特征在于:将以特定语言表现的翻译对象的Web页面翻译成其他语言,并提供所翻译的所述We。
14、b页面,可连接于存储描述翻译对象的所述Web页面的构造的HTML(Hyper Text Markup Language,超文本标记语言)数据及由该HTML说 明 书CN 102959537 A2/13页5数据参照的图像数据的Web数据存储机构、及存储用于文本的翻译处理的词典数据的翻译数据存储机构,所述HTML数据是以组的形式包含含有文字且经可视化的图像相关的描述、在与该图像的显示位置相对应的特定位置设定着显示位置、不含文字且非可视化的背景图像相关的描述、以及在与该背景图像重叠的特定位置的前面设定着显示位置且非可视化的特定语言的文本相关的描述,该机器翻译系统包括:翻译请求接收机构,从浏览所述We。
15、b页面的用户终端接收包含与翻译对象的所述Web页面相对应的URL(Uniform Resource Locator,统一资源定位符)及指定翻译目标语言的指定数据的翻译请求;HTML数据取得机构,从所述Web数据存储机构取得与所述翻译请求中所包含的所述URL相对应的描述所述Web页面的构造的所述HTML数据;翻译机构,参照由所述翻译数据存储机构所存储的所述词典数据,将由所述HTML数据取得机构所取得的所述HTML数据中所包含的文本翻译成与所述翻译请求中所包含的所述指定数据相对应的翻译目标语言;可视化要素切换机构,使由所述HTML数据取得机构所取得的所述HTML数据中所包含的非可视化的文本及所述背。
16、景图像可视化,并且使该HTML数据中所包含的经可视化的所述图像非可视化;已翻译的HTML数据发送机构,使用由所述翻译机构所翻译的文本重组由所述HTML数据取得机构所取得的所述HTML数据,并将其发送至所述终端;及图像数据发送机构,根据来自所述终端的指定所述图像数据的发送请求,从所述Web数据存储机构读出所指定的所述图像数据并将其发送至该终端。0014 所述可视化要素切换机构优选为将文本的文字色属性自透明变更为有色,将包含文本的区域的显示属性自隐藏变更为显示或删除插入包含文本的区域的标签的注释标签,由此使非可视化的文本可视化。0015 所述可视化要素切换机构优选为将所述背景图像的显示属性自隐藏变。
17、更为显示,将包含所述背景图像的区域的显示属性自隐藏变更为显示,删除插入与所述背景图像相对应的标签的注释标签,由此使非可视化的所述背景图像可视化。0016 所述可视化要素切换机构优选为将所述图像的显示属性自显示变更为隐藏,删除与所述图像相对应的标签,以注释标签插入与所述图像相对应的标签,将包含所述图像的区域的显示属性自显示变更为隐藏或以注释标签插入与包含所述图像的区域相对应的标签,由此使经可视化的所述图像非可视化。0017 所述已翻译的HTML数据发送机构也可将由所述HTML数据取得机构所取得的所述HTML数据的基准URL变更为所述翻译请求中所包含的翻译对象的所述Web页面的所述URL。0018。
18、 所述已翻译的HTML数据发送机构也可以在由所述翻译机构所翻译的文本长度、与由所述HTML数据取得机构所取得的所述HTML数据中所包含的特定的文本长度相比为长于一定值以上的情况下,修正由所述翻译机构所翻译的文本的长度使其变短。0019 而且,本发明的机器翻译方法的特征在于:利用将以特定语言表现的翻译对象的Web页面中的文本翻译成其他语言,并提供所翻译的所述Web页面的机器翻译系统,所述机器翻译系统可连接于存储描述翻译对象的所述Web页面的构造的HTML数据及由该HTML数据参照的图像数据的Web数据存储机构、及存储用于文本的翻译处理的词典数据的翻译数据存储机构,所述HTML数据以组的形式包含含。
19、有文字且经可视化的图像相关的描述、在与该图像的显示位置相对应的特定位置设定着显示位置、不含文字且非可视化的背景图像说 明 书CN 102959537 A3/13页6相关的描述、及在与该背景图像重叠的特定位置的前面设定着显示位置且非可视化的特定语言的文本相关的描述,所述机器翻译系统执行如下步骤:翻译请求接收步骤,从浏览所述Web页面的用户终端接收包含与翻译对象的所述Web页面相对应的URL及指定翻译目标语言的指定数据的翻译请求;HTML数据取得步骤,从所述Web数据存储机构取得与所述翻译请求中所包含的所述URL相对应的描述所述Web页面的构造的所述HTML数据;翻译步骤,参照由所述翻译数据存储机。
20、构所存储的所述词典数据,将通过所述HTML数据取得步骤所取得的所述HTML数据中所包含的文本翻译成与所述翻译请求中所包含的所述指定数据相对应的翻译目标语言;可视化要素切换步骤,使通过所述HTML数据取得步骤所取得的所述HTML数据中所包含的非可视化的文本及所述背景图像可视化,并且使该HTML数据中所包含的经可视化的所述图像非可视化;已翻译的HTML数据发送步骤,利用由所述翻译步骤所翻译的文本重组由所述HTML数据取得步骤所取得的所述HTML数据,并将其发送至所述终端;及图像数据发送步骤,根据来自所述终端的指定所述图像数据的发送请求,从所述Web数据存储机构读出所指定的所述图像数据并将其发送至该。
21、终端。0020 而且,本发明的机器翻译程序构成为,用于使1个或多个计算机实现所述任一机器翻译系统具备的各机构作为功能。0021 此外,本发明的记录介质构成为,可由计算机读取,且记录如下程序,该程序用于使1个或多个计算机实现所述任一机器翻译系统具备的各机构作为功能。0022 发明的效果0023 本发明的机器翻译系统预先将至少包含一组的含有文字且经可视化的图像的参照数据(URL)、在与该图像的显示位置相对应的区域设定着显示位置、不含文字且非可视化的背景图像的参照数据(URL)及文本数据的HTML数据存储在Web数据存储机构中,在翻译处理时以文本数据的显示位置较背景图像的显示位置更靠近前的方式使该非。
22、可视化的背景图像的图像数据及文本数据可视化,并且使该经可视化的图像的图像数据非可视化。0024 如上所述,通过预先将Web页面局部地作成3层构成(经可视化且含有文字的图像层、非可视化且不含文字的图像层及非可视化的文本层),可以在翻译前显示含有文字的图像,因此不仅美观且显示速度快。而且,通过切换翻译处理时所显示的要素,在对该Web页面(HTML数据)进行机器翻译时,于显示有含有文字的图像的区域显示背景图像及翻译后的文本。由此,可消除图像内的文字未被翻译而直接显示的状况,并且可以在翻译处理前后保持翻译对象页面的视觉格局。附图说明0025 图1(以往例)(a)是表示翻译前的Web页面的一部分的图,(。
23、b)是表示翻译后的Web页面的一部分的图。0026 图2是表示实施方式的系统的构成例的图。0027 图3(a-1)是表示翻译前的Web页面的一部分的图,(a-2)是表示翻译前的Web页面具有的非可视化的图像数据的图,(a-3)是表示翻译前的Web页面具有的非可视化的文本数据,(b)是表示翻译后的Web页面的一部分的图。0028 图4是表示图2所示的系统的机器翻译次序的序列图。0029 图5是表示翻译请求的主要项目的图。说 明 书CN 102959537 A4/13页70030 图6(a)是表示翻译前的HTML源的一部分的图,(b)是表示翻译后的HTML源的一部分的图。0031 图7是表示翻译处。
24、理的流程的流程图。0032 图8(变形例1)(a)是表示翻译前的Web页面的一部分的图,(b)是表示翻译后的Web页面的一部分的图。0033 图9(变形例2)(a-1)是表示翻译前的Web页面的一部分的图,(a-2)是表示翻译前的Web页面具有的非可视化的数据,(b)是表示翻译后的Web页面的一部分的图。0034 图10(变形例1)(a)是表示翻译前的HTML源的一部分的图,(b)是表示翻译后的HTML源的一部分的图。0035 图11(变形例1)是表示翻译处理的流程的流程图。0036 图12(变形例2)(a)是表示翻译前的HTML源的一部分的图,(b)是表示翻译后的HTML源的一部分的图。00。
25、37 图13(变形例2)是表示翻译处理的流程的流程图。0038 图14(其他实施方式)是表示系统构成的变形例的图。0039 图15(其他实施方式)是表示系统构成的变形例的图。0040 图16(其他实施方式)是表示HTML数据的源的记载例。0041 图17(其他实施方式)是表示样图的源的记载例。0042 图18(其他实施方式)是表示日语Web页面的显示例。0043 图19(其他实施方式)是表示非可视化的背景图像的一例。0044 图20(其他实施方式)是表示非可视化的日语文本的一例。0045 图21(其他实施方式)是表示英语Web页面的显示例。0046 图22(其他实施方式)是表示汉语Web页面的。
26、显示例。0047 图23(其他实施方式)是表示韩语Web页面的显示例。0048 符号的说明0049 10机器翻译系统0050 11Web服务器0051 12翻译服务器0052 13WebDB0053 14翻译DB0054 20用户终端0055 30因特网0056 40路由器具体实施方式0057 0058 以下的说明中所使用的用语的意义分别设为如下所述的定义。0059 机器翻译利用计算机等不透过人手而自动地进行的翻译。0060 可视化包含可使用户进行视认的处理的概念。0061 非可视化包含使用户无法视认的处理的概念。例如可考虑设定为隐藏,设定为说 明 书CN 102959537 A5/13页8透。
27、明,删除要素,对要素进行注解排除等处理形态。0062 0063 1实施方式的概要0064 参照图2图7说明本实施方式的概要。本实施方式的系统对浏览Web页面的用户提供将Web页面内以第1语言(特定语言)显示的部分翻译成各用户所指定(选择)的第2语言(其他语言)的服务(机器翻译服务)者。此外,在以下的说明中,使用将Web页面内的日语部分翻译成英语的例。0065 1-1.系统的构成0066 如图2所示,本实施方式的系统整体而言是由提供Web页面的Web服务器11、进行翻译处理的翻译服务器12及包含Web浏览器的用户终端20构成。Web服务器11可连接于至少存储描述Web页面的构造的HTML数据及该。
28、HTML数据参照的数据(例如图像数据)的WebDB(Web数据存储机构)13。另一方面,翻译服务器12可连接于至少存储进行Web页面的机器翻译处理时所参照的词典数据的翻译DB(翻译数据存储机构)14。0067 Web服务器11及翻译服务器12作为包含CPU(central processing unit,中央处理器)、ROM(read only memory,只读存储器)、RAM(random access memory,随机存取存储器)、硬盘及通讯装置等的普通计算机而构成,用户终端20构成为除了具备所述构成要素以外还具备接收来自用户的操作的操作部及可显示Web页面的显示部。0068 此外,存。
29、储在翻译DB 14中的词典数据包括定义有词汇及语法的数据、及通过统计学习方法而构筑的模型。而且,也可存储对特定语句规定特定译词的数据。在本实施方式中,将WebDB 13、翻译DB 14构筑于分别连接于Web服务器11、翻译服务器12的外部的存储装置中,但只要读出所存储的信息则也可构筑于内置于Web服务器11或翻译服务器12的存储装置中。0069 Web服务器11与翻译服务器12通过通讯网络(本实施方式中为LAN(local areanetwork,区域网络)等专用网络)而相互连接,形成机器翻译系统10。而且,用户终端20可透过通讯网络(于本实施方式中为因特网30)分别与Web服务器11及翻译服。
30、务器12连接。此外,Web服务器11、翻译服务器12、用户终端20之间的通讯通过路由器40而控制。0070 1-2.实施方式的主要特征0071 实施方式的主要特征在于:预先将至少包含一组的含有文字且经可视化的图像的参照数据(URL)、在与该图像的显示位置相对应的区域设定着显示位置、不含文字且非可视化的图像(背景图像)及文本数据的HTML数据存储在WebDB 13中,在进行翻译处理时以文本数据的显示位置较背景图像的显示位置更靠近前的方式使该非可视化的背景图像数据及文本数据可视化,并且使该经可视化的图像数据非可视化。0072 如此,通过预先将Web页面局部地作成3层构成(经可视化且含有文字的图像层。
31、、非可视化且不含文字的背景图像层及非可视化的文本层),可以在翻译前显示含有文字的图像,因此不仅美观且显示速度快。而且,通过切换翻译处理时所显示的要素,在对该Web页面(HTML数据)进行机器翻译时,于显示有含有文字的图像的区域显示背景图像及翻译后的文本。由此,可消除图像内的文字未被翻译而直接显示的状况,并且可以在翻译处理前后保持翻译对象页面的视觉格局。说 明 书CN 102959537 A6/13页90073 图3表示实施方式中的翻译前后的Web页面的一部分。在翻译前的Web页面中,显示有通常的文本510a与含有日语文字的图像520(图3(a-1)。而且,翻译前的Web页面中,包含在与图像52。
32、0的显示位置相对应的区域(或与图像520重叠的区域)设定着显示位置、不含文字且非可视化的图像540(图3(a-2)。另外,包含在与图像540重叠的区域设定着显示位置且非可视化的日语的文本数据530a(图3(a-3)。0074 另一方面,在翻译后的Web页面中,显示有将文本510a翻译成英语而成的文本510b、图像540及将文本530a翻译成英语而成的文本530b(图3(b)。此外,由于图像520为非可视化,因此于翻译后的Web页面内无法视认。0075 2.机器翻译的次序0076 2-1.机器翻译次序的概要0077 参照图4的序列图简单说明使用本实施方式的系统的机器翻译处理的流程及数据的流程。如。
33、图4所示,构成机器翻译系统10的Web服务器11及翻译服务器12根据下述次序1次序4而于用户终端20显示翻译后的Web页面。此外,在图4的序列图中,附注有所参照的其他图式的编号。而且,执行次序1之前,通过Web服务器11,将描述Web页面的构造的HTML数据及由该HTML数据参照的数据存储在WebDB 13中,通过翻译服务器12将进行Web页面的机器翻译处理时所参照的词典数据存储在翻译DB14中。0078 次序10079 前提为用户终端20显示有自Web服务器11所提供的Web页面(S505a),并将该Web页面设为翻译对象的Web页面(图3(a-1)。而且,在翻译对象的Web页面中,显示有用。
34、以选择翻译后的语言并请求进行翻译的要素(例如,下拉菜单,选项按钮,下拉菜单或选项按钮与按钮图像或链接的组合)。在翻译对象的Web页面中若用户进行指定(选择)翻译后的语言,并请求进行翻译的特定操作,则用户终端20向翻译服务器12请求进行Web页面的翻译(S510a)。0080 于图5中,例示翻译请求的主要项目。翻译请求包括“翻译处理程序的URL”,“翻译对象Web页面的URL”,“第1语言(翻译对象Web页面的语言)的指定数据”,“第2语言(翻译目标语言)的指定数据”及“文本数据的字元码”。在本实施方式中,将以下设URL参数为“翻译对象Web页面的URL”的HTTP(Hyper Text Tra。
35、nsfer Protocol,超文本传送协定)请求作为翻译请求。此外,也可以其他形式发送图5所示的各项目。0081 次序20082 若翻译服务器12自用户终端20收到翻译请求(S510b,翻译请求接收步骤),则向Web服务器11请求进行与所接收的“翻译对象Web页面的URL”相对应的HTML数据的发送(S515b)。若Web服务器11自翻译服务器12收到HTML数据的发送请求(S515c),则自WebDB 13读出或生成与所接收的“翻译对象Web页面的URL”相对应的HTML数据(翻译前的HTML数据),并将其发送至翻译服务器12(S520c,HTML数据取得步骤)。0083 次序30084 。
36、若翻译服务器12自Web服务器11收到翻译前的HTML数据(S520b),则将所接收的翻译前的HTML数据作为对象而执行机器翻译处理,并将翻译后的HTML数据即重组的HTML数据发送至用户终端20(S525b,已翻译的HTML数据发送步骤)。此外,关于机器翻译处理的流程及翻译前后的HTML数据,另设项目进行详细说明(参照下述的图6、7)。说 明 书CN 102959537 A7/13页100085 次序40086 若用户终端20自翻译服务器12收到翻译后的HTML数据(S525a),则对所接收的HTML数据进行解释并显示无图像的Web页面(S530a),并且向Web服务器11请求进行该HTML。
37、数据参照的图像数据的发送(S535a)。若Web服务器11收到图像数据的发送请求(S535c),则自WebDB 13读出所指定的图像数据,并将其发送至用户终端20(S540c,图像数据发送步骤)。若用户终端20自Web服务器11收到图像数据(S540a),则于已显示的Web页面内的特定位置上追加显示图像(S545a)。显示结束后的Web页面如上所示(图3(b)。0087 如上所述,在本实施方式中,翻译服务器12作为翻译请求接收机构及已翻译的HTML数据发送机构而发挥功能,Web服务器11作为HTML数据取得机构及图像数据发送机构而发挥功能。0088 2-2.实施方式的机器翻译处理次序等0089。
38、 (a)翻译前的HTML数据0090 于图6(a)中,例示实施方式中的翻译前的HTML数据的一部分。在翻译前的HTML数据中,除包含日语的文本数据915a以外,还包含图像的参照数据925a、955a与日语的文本数据935a。而且,在若干标签中,根据样图(CSS形式)而设定式样。文本数据915a、图像的参照数据925a分别与翻译前的Web页面(图3(a-1)的文本510a、图像520相对应。而且,图像的参照数据955a、文本数据935a与翻译前的Web页面具有的非可视化的图像数据540(图3(a-2)、文本数据530a(图3(a-3)相对应。0091 图像的参照数据925a所参照的图像设定为于距。
39、离特定区域(宽度为840像素,高度为120像素)的上方0像素,距离左边0像素的位置上对准左上的顶点,且以宽度840像素,高度120像素进行显示。0092 另一方面,图像的参照数据955a所参照的图像设定为于距离所述特定区域(宽度为840像素,高度为120像素)的上方0像素,距离左边0像素的位置上对准左上的顶点,且以宽度840像素,高度120像素进行显示。即,该图像的显示位置设定在与参照数据925a所参照的图像相同的位置上。但是,由在与参照数据955a相对应的图像为非可视化(将显示属性的值设定为隐藏(hidden),因此无法于Web浏览器的窗口内进行视认。并且,与文本数据935a相对应的文本设定。
40、为显示在距离所述特定区域(宽度为840像素,高度为120像素)的上方30像素的位置上(此处为中心对准等)。即该文本的显示位置设定在与参照数据955a所参照的图像相同的位置上。但是,由在与文本数据935a相对应的文本非可视化(将文字色属性的值设定为透明(transparent),因此无法于Web浏览器的窗口内进行视认。0093 此外,由于Web页面内的要素按照HTML的描述顺序重叠(将后描述的要素显示在前面),因此于图6(a)的例中并未特别设定,但也可明确地设定重叠的顺序。重叠顺序可根据例如“z-index”属性的值(数值)的大小而设定。0094 (b)翻译处理0095 参照图7的流程图详细说明实施方式中的翻译处理的流程。如图7所示,翻译服务器12根据下述次序31次序34翻译HTML数据。0096 次序310097 变更HTML数据的基准URL(S810)。具体而言,以绝对URL形式描述以相对URL形说 明 书CN 102959537 A10。