词典更新系统、更新处理服务器、 终端、控制方法、程序、记录媒体 【技术领域】
本发明涉及词典更新系统、更新处理服务器、终端、控制方法、程序和记录媒体。特别是,本发明涉及根据用户的利用状况更新词典的词典更新系统、更新处理服务器、终端、控制方法、程序和记录媒体。
背景技术
以往,在机械(自动)翻译系统中,用户为了提高翻译的精度可以向词典中追加新的语句。但是,用户向词典中追加新的语句的作业是很烦杂的,特别是在词典分为多个领域的情况下,选择合适的领域是很困难的事情。因此,例如专利文献1提案的机械翻译系统,通过根据用户指定的应追加的语句选择追加目的地词典的种类,提高了用户的便利性。
【专利文献1】
特开平10-269220号公报
但是,上述系统是以用户自己将新的语句向用户词典中登录时的辅助为目的的,不是根据用户的使用历史等自动地向用户词典中追加新的语句。另外,在一般的机械翻译系统中,可以追加安装领域词典,但是,这时用户也必须明确地指示是安装哪个领域词典,不是自动地选择应安装的词典。因此,本发明目的旨在提供可以解决上述问题的词典更新系统、更新处理服务器、终端、控制方法、程序和记录媒体。通过权利要求范围的独立项所述的特征的组合,可以实现该目的。另外,从属项规定本发明的更有利的具体例。
【发明内容】
即,按照本发明的实施例1,是一种包括具有将输入的变换原始信息变换为变换目的信息的第一词典的终端和通过网络更新终端的第一词典的更新处理服务器的词典更新系统,所提供的词典更新系统、更新处理服务器、终端、控制该词典更新系统的控制方法、实现该词典更新系统的程序和记录媒体的特征在于:终端具有存储第一词典的第一词典存储部、存储在根据第一词典将变换原始信息变换为变换目的信息的处理中得到的变换处理信息的变换处理信息存储部和将变换处理信息向更新处理服务器传输的变换处理信息传输部,更新处理服务器具有根据变换处理信息生成更新第一词典的词典更新信息的词典更新信息生成部和将词典更新信息向终端传输的词典更新信息传输部。
上述发明的概要不是列举本发明的必要的特征的全部,这些特征群的子组合也可以成为发明。
【附图说明】
图1是词典更新系统10的功能框图。
图2是表示第一词典存储部110和第二词典存储部210的一例的图。
图3是表示变换处理信息存储部130的一例的图。
图4是词典更新系统10的动作流程图。
图5是表示S120的详细情况的流程图。
图6是表示计算确信度的一例的图。
图7是表示图4所示的S220的详细情况的流程图。
图8是表示图4所示的S230的详细情况的一例的流程图。
图9是本实施例的变形例的词典更新系统10的功能框图。
图10是变形例的词典更新系统10的动作流程图。
图11是表示本实施例和变形例的更新处理服务器200的硬件结构的一例的图。
图12是表示本实施例和变形例的终端100的硬件结构的一例的图。
【具体实施方式】
下面,通过发明的实施例说明本发明。以下的实施例不限定权利要求范围的发明,另外,在实施例中说明的特征的组合不一定都是发明的解决方案所必须的。
图1表示词典更新系统10的功能框图。词典更新系统10包括具有将输入的变换原始信息变换为变换目的信息的第一词典的终端100和通过网络20更新终端100的第一词典的更新处理服务器200。终端100是例如PDA等便携式通信终端,通过包含无线通信网和因特网的网络20与更新处理服务器200连接。终端100可以根据HTTP或FTP等协议与更新处理服务器200进行通信,也可以利用电子邮件等方式与更新处理服务器200进行通信。对于网络20,终端100也可以通过USB等I/O端口连接而与更新处理服务器200连接。
终端100具有在以机械翻译等为代表的语句的变换处理中使用的第一词典。并且,终端100根据用户的指示使用第一词典进行翻译,存储表示翻译的结果的变换处理信息例如翻译失败时的翻译对象的语句等。更新处理服务器200可以根据变换处理信息更新第一词典,从而可以提高以后的翻译精度。
终端100具有第一词典存储部110、翻译部120、变换处理信息存储部130和变换处理信息传输部140。第一词典存储部110存储将用第一语言表述的变换原始信息翻译为用第二语言表述的变换目的信息的第一词典。可替代地,作为第一词典,第一词典存储部110也可以存储将用假名表述的变换原始信息变换为包含汉字的变换目的信息的假名汉字变换的词典。第一语言是例如英语,第二语言是例如日语。这时,第一词典存储部110存储进行英日翻译的第一词典。可替代地,第一词典可以是日英词典,也可以是用于进行除此之外的多个语言间的翻译的词典。
并且,第一词典存储部110从词典更新信息传输部240接收更新第一词典的词典更新信息,根据该词典更新信息更新第一词典。词典更新信息是例如新追加到第一词典中的变换原始信息和变换目的信息的组合。
翻译部120根据第一词典将变换原始信息翻译为变换目的信息。翻译部120可以根据第一词典将变换原始信息进行假名汉字变换,生成变换目的信息。并且,翻译部120将在翻译的处理中得到的变换处理信息向变换处理信息存储部130传输。所谓变换处理信息,就是翻译的结果生成的日志(ログ)信息,代表性的就是由于第一词典未登录而不能翻译的变换原始信息。变换处理信息存储部130从翻译部120接收变换处理信息,向变换处理信息传输部140传输。变换处理信息传输部140通过网络20将接收的变换处理信息向词典更新信息生成部230传输。
作为传输变换处理信息的定时,变换处理信息传输部140在例如接收到来自用户的指示时传输变换处理信息。可替代地,变换处理信息传输部140可以在每次更新变换处理信息存储部130内的变换处理信息时传输变换处理信息,也可以每隔预先决定的时间定期地传输变换处理信息,可以在终端100内设置的电池开始充电时传输变换处理信息,也可以在与用于与外部进行通信的连接装置(基座等)连接时传输变换处理信息。
更新处理服务器200具有第二词典存储部210、翻译部220、容量管理部225、词典更新信息生成部230和词典更新信息传输部240。第二词典存储部210存储由变换原始信息生成变换目的信息的第二词典。翻译部220使用从第二词典存储部210取得的第二词典翻译从词典更新信息生成部230接收的变换原始信息,使表示翻译的正确性的确信度与该变换原始信息对应,并向词典更新信息生成部230输出。
容量管理部225管理表示在终端100中设置的存储装置的空容量的空容量信息,并向词典更新信息生成部230传输。容量管理部225可以例如定期地从终端100接收空容量信息,也可以将根据从更新处理服务器200向终端100传输的数据的尺寸而推算的空容量作为空容量信息来计算。
词典更新信息生成部230根据从变换处理信息传输部140接收的变换处理信息,通过从第二词典存储部210中选择更新第一词典的词典更新信息而生成。例如,词典更新信息生成部230使翻译部220翻译包含在变换处理信息中的变换原始信息,并从第二词典存储部210中选择翻译部220在翻译中使用的数据,从而生成向第一词典追加的词典更新信息。此外,词典更新信息生成部230也可以根据从容量管理部225接收的空容量信息,作为词典更新信息而生成表示删除第一词典的一部分的删除指示。并且,词典更新信息生成部230将生成的词典更新信息向词典更新信息传输部240传输。词典更新信息传输部240通过网络20将接收的词典更新信息向第一词典存储部110传输。
词典更新信息除了向第一词典中追加的信息外,也可以包含第一词典存储部110已存储的第一词典。这时,词典更新信息生成部230将向第一词典追加的信息和第一词典存储部110已存储的第一词典作为更新第一词典的词典更新信息而生成。即,第一词典存储部110通过只是将接收的词典更新信息与第一词典置换,就可以更新第一词典,所以,可以将终端100侧的处理简化。
图2表示第一词典存储部110和第二词典存储部210的一例,图2(a)表示第一词典存储部110存储的第一词典。第一词典存储部110作为第一词典存储了多个第一部分词典,例如基本词典118、计算机部分词典112、烹饪部分词典114和宠物部分词典116。另外,图2(b)表示第二词典存储部210存储的第二词典。第二词典存储部210作为第二词典存储了与多个第一部分词典的各个对应的多个第二部分词典,例如基本词典218、计算机部分词典212、烹饪部分词典214和宠物部分词典216。基本词典118和基本词典218分别存储了例如代名词、基本的动词、及基本的单词、复合词、语法规则。
基本词典218、计算机部分词典212、烹饪部分词典214和宠物部分词典216可以存储分别与基本词典118、计算机部分词典112、烹饪部分词典114和宠物部分词典116相同的领域的语句,也可以与相同的识别信息对应。例如,计算机部分词典212和计算机部分词典112都是存储计算机领域的语句的计算机领域词典。另外,作为识别信息的例子,计算机部分词典212和计算机部分词典112可以与称为「计算机」的领域名称对应地进行存储,也可以与表示是计算机领域词典的识别号码例如「0001」对应地进行存储。即,词典更新信息生成部230通过检索领域名称或识别号码,就可以很容易地识别第二部分词典和第一部分词典的对应。
另外,第二词典包含第一词典,基本词典218、计算机部分词典212、烹饪部分词典214和宠物部分词典216可以分别包含基本词典118、计算机部分词典112、烹饪部分词典114和宠物部分词典116。例如,计算机部分词典112通过仅选择计算机部分词典212存储的计算机领域的语句中使用频率(频度)高的基本的语句而作成。
这样,第二词典存储部210中存储的第二部分词典就与第一词典存储部110中存储的第一部分词典对应。因此,后面所述的词典更新信息生成部230可以适当地选择与第一部分词典对应的第二部分词典。例如,词典更新信息生成部230如在图3(c)的说明中后面所述的那样,当一的第一部分词典的使用频率比规定频率高时,可以适当地选择与该一的第一部分词典对应的第二部分词典而追加到第一词典中。
将词典分类为多个部分词典的形式,并不限于本图所示的形式。例如,第一词典存储部110也可以存储根据使用频率的高低而分类的多个第一部分词典。
图3表示变换处理信息存储部130的一例。在图3(a)中,变换处理信息存储部130不能将根据第一词典变换的变换原始信息即未知词作为变换处理信息而存储。翻译部120在翻译处理的过程中检测到未知词时,如本图所示的那样,作为变换处理信息,将未知词存储到变换处理信息存储部130中。这时,词典更新信息生成部230,作为词典更新信息,从第二词典中选择并发送与未知词对应的变换目的信息。因此,因为第一词典存储部110向第一词典追加与未知词对应的变换目的信息,所以在以后的翻译处理中就可以确切地翻译作为未知词而检测的语句。
在图3(b)中,变换处理信息存储部130将作为变换原始信息的翻译对象的文章与翻译结果的确信度对应地存储。所谓翻译的确信度,就是表示翻译的准确性的标准的数值,后面用图6说明计算方法的一例。翻译部120在每次翻译翻译对象的文章时都将翻译对象的文章与翻译的确信度对应地依次存储到变换处理信息存储部130中。并且,翻译部220使用第二词典翻译接收的翻译对象的文章,并将翻译的确信度向词典更新信息生成部230输出。词典更新信息生成部230在与翻译对象的文章对应地从变换处理信息传输部140接收的确信度低于由翻译部220进行翻译时的确信度时,就从第二词典中选择翻译部220进行的翻译中使用的信息,并作为词典更新信息向第一词典存储部110传输。接收到该词典更新信息后,第一词典存储部110就可以将用于进行确信度更高的翻译的信息追加到第一词典中。
在图3(c)中,变换处理信息存储部130与识别多个第一部分词典的第一部分词典识别信息对应地存储表示该第一部分词典的领域的领域识别信息和该第一部分词典的使用频率。所谓使用频率,就是例如以前更新第一部分词典后到现在为止的使用次数。可替代地,使用频率也可以是在预先决定的期间内使用的次数。所谓第一部分词典的使用次数,可以是例如在翻译中使用第一部分词典中存储的语句的次数,也可以是使用第一部分词典进行翻译的文章的数量。
另外,翻译部120在翻译中使用分别与使用优先顺序对应的多个第一部分词典的方式中,可以将如下计算的次数作为使用频率。翻译部120在根据使用优先顺序分开使用多个第一部分词典时,例如使用优先顺序高的一的第一部分词典和使用优先顺序低的其他第一部分词典都登录了同一变换原始信息时,就将基于使用优先顺序高的一的第一部分词典的变换目的信息作为翻译结果。这里,翻译部120为了提高翻译的精度根据翻译结果和用户的指示等对每个翻译对象的文章变更使用优先顺序。这时,翻译部120将一的第一部分词典的使用优先顺序在所有的第一部分词典中为最高时翻译的文章的数作为该一的第一部分词典的使用频率存储到变换处理信息存储部130中。
图4表示词典更新系统10的动作流程。翻译部120使用第一词典将输入的变换原始信息翻译为变换目的信息(S100)。并且,变换处理信息存储部130根据翻译部120的翻译结果将作为不能利用第一词典进行变换的变换原始信息的一例的未知词作为变换处理信息进行存储(S110)。变换处理信息存储部130在翻译的确信度比预先决定的基准确信度低时,就使与该确信度对应的该变换原始信息例如翻译对象的文章与确信度对应并作为变换处理信息进行存储(S120)。变换处理信息存储部130可以按确信度低的顺序选择并存储预先决定的数量的变换原始信息,也可以在变换处理信息存储部130的容量有空域时存储所有的变换原始信息。
然后,变换处理信息存储部130使多个第一部分词典的使用频率分别与识别各个第一部分词典的信息对应,并作为变换处理信息进行存储(S130)。
变换处理信息传输部140在未从用户接收到表示开始进行第一词典的更新处理的更新指示时(S140:NO),将处理返回到S100。另一方面,变换处理信息传输部140在从用户接收到更新指示时(S140:YES)取得变换处理信息存储部130内存储的所有的变换处理信息,并向词典更新信息生成部230传输(S150)。
词典更新信息生成部230从变换处理信息传输部140接收变换处理信息(S200)。并且,词典更新信息生成部230在作为变换处理信息接收到未知词时,通过从第二词典中选择与未知词对应的变换原始信息而生成词典更新信息(S210)。例如,词典更新信息生成部230在作为变换处理信息而接收到未知词的英语单词「resentence」时,作为与未知词对应的变换原始信息,就生成「进行再判断」这样的动词和「再判断」这样的名词而作为词典更新信息。此外,词典更新信息生成部230通过从第二词典中选择包含未知词的复合词的变换原始信息,生成词典更新信息。例如,英语单词「toxicity」为未知词时,词典更新信息生成部230就生成「acutetoxicity」和「toxicity equivalency factor」等复合词的变换原始信息而作为词典更新信息。
另外,词典更新信息生成部230在作为变换处理信息接收到确信度比基准确信度小的变换原始信息时,就根据该变换原始信息生成词典更新信息(S220)。另外,词典更新信息生成部230在作为变换处理信息而接收到与识别第一部分词典的识别信息对应的使用频率时,就根据该使用频率生成词典更新信息(S230)并且,词典更新信息传输部240将生成的词典更新信息向第一词典存储部110传输(S240)。更新处理服务器200每次接收变换处理信息时都反复进行上述一连串的处理。
第一词典存储部110在从更新处理服务器200接收到更新第一词典的词典更新信息时,根据该词典更新信息更新第一词典(S160)。例如,第一词典存储部110在接收到与未知词对应的变换原始信息时,就将该变换原始信息追加到第一词典中。另外,第一词典存储部110在从更新处理服务器200接收到与在S120生成的确信度对应的词典更新信息时,就将包含在该词典更新信息中的语句追加到第一词典中。另外,第一词典存储部110在从更新处理服务器200接收到与具有比预先决定的第一频率高的使用频率的第一部分词典对应的第二部分词典时,就将该第二部分词典追加到第一词典中。
并且,变换处理信息传输部140在将变换处理信息向更新处理服务器200传输时,就删除变换处理信息存储部130存储的变换处理信息(S170)。变换处理信息传输部140也可以在发送变换处理信息(S150)之后并且在更新第一词典(S160)之前删除变换处理信息。但是,变换处理信息传输部140为了在确认已适当地进行了词典的更新之前保持变换处理信息,最好在更新第一词典之后删除变换处理信息。
图5表示图4所示的S120的详细情况。翻译部120计算变换原始信息中的翻译的确信度(S1210)。例如,翻译部120用从表示确信度最高的的100%到表示确信度最低的0%的数值计算翻译的确信度。并且,变换处理信息存储部130在变换原始信息中的翻译的确信度比预先决定的基准确信度低时(S1220:YES),与确信度对应地存储该变换原始信息(S1230)。
图6表示计算确信度的一例即图5的S1210的详细情况。翻译部120在英日翻译中将英语600「I can play」翻译为日语610「私は遊ぶことができる」(我会玩)时,就将翻译的确信度计算为100%。另一方面,翻译部120将英语600「I can play」翻译为日语620「私は遊ぶを缶詰にする」(我把玩关起来)时,就将翻译的确信度计算为10%。以下,表示确信度的计算过程。翻译部220输出确信度的处理与用本图说明的处理大致相同,所以,省略其说明。
首先,与各英语单词对应地对该英语单词被使用的每个词类预先决定表示使用频率低的成本。例如,英语单词「can」作为助动词使用时的成本为5,作为动词使用时的成本为400。在本图中,将上述成本表示在各词类名之后的括弧内。同样,对于构成各句的规则也预先与成本对应。例如,将助动词和动词归纳为动词句的规则的成本为18。
翻译部120如果接收到翻译对象的英语600,则根据可以分解的所有的组合将英语600进行词类分解。并且,对于分解的多个词类,根据文法规则,利用所有可能的组合生成句子。翻译部120对这样分析的所有句子分别计算总的成本。例如,将英语600翻译为日语610时的成本,根据公式「5+5+5+18+18+18」,计算为69。另一方面,将英语600翻译为日语620时的成本,根据公式「5+400+5+18+80+18+18」,计算为544。并且,翻译部120利用从所有的句子中这选择具有最小的成本的句子等方法生成变换目的信息。
翻译部120根据以下的条件,从变换目的信息的生成中使用的成本计算翻译的确信度。
条件1:成本小于等于150时,确信度为100%。
条件2:不能分析(句子结构分析失败等)时,确信度为0%
条件3:上述两者以外的情况时,确信度为从100%中减去(成本÷单词数)的值。但是,以10%为最低。
因此,翻译部120分别将日语610的确信度计算为终端100%、将日语620的确信度计算为10%。以上说明的成本附加和确信度的计算方法是一例,也可以置换为从多个翻译结果中选择最正确的结果的其他处理方法。
图7表示S220的详细情况。词典更新信息生成部230作为变换处理信息从变换处理信息传输部140接收到确信度比基准确信度小的变换原始信息时,将作为变换原始信息的一例的翻译对象的句子向翻译部220传输。接收到该翻译对象的句子后,翻译部220使用第二词典翻译句子(S2210)。并且,翻译部220利用根据图6说明的方法计算并输出翻译的确信度(S2220)。词典更新信息生成部230在与变换原始信息对应地从终端100接收的确信度低于由翻译部220翻译时的确信度时(S2230:YES),就从第二词典中选择翻译部220在变换原始信息的翻译中使用的信息(S2240),作为词典更新信息而生成(S2250)。例如,词典更新信息生成部230从第二部分词典中选择在翻译部220进行的变换原始信息的翻译中使用的信息中包含翻译所使用的语句的复合词的数据或归纳在句子结构分析中使用的语句的规则的数据,作为词典更新信息而生成。
图8表示图4所示的S230的详细情况的一例。词典更新信息生成部230判断一的第一部分词典的使用频率是否比预先决定的第一频率高(S2320)。一的第一部分词典的使用频率比第一频率高时(S2320:YES),词典更新信息生成部230作为词典更新信息生成与一的第一部分词典对应的第二部分词典(S2330)。作为其他的例子,词典更新信息生成部230也可以判断空容量信息表示的空容量是否小于预先决定的容量。这时,空容量小于预先决定的容量时,词典更新信息生成部230也可以不生成词典更新信息。并且,词典更新信息生成部230对所有的第一部分词典检查完使用频率时(S2335:YES),处理即告结束。对所有的第一部分词典还未检查完使用频率时(S2335:NO),词典更新信息生成部230就将处理返回到S2335对其它第一部分词典进行同样的处理。
另一方面,一的第一部分词典的使用频率不比第一频率高时(S2320:NO),词典更新信息生成部230判断该一的第一部分词典的使用频率是否低于预先决定的第二频率(S2340)。一的第一部分词典的使用频率不低于第二频率时(S2340:NO),词典更新信息生成部230将处理转移到S2335。一的第一部分词典的使用频率低于第二频率时(S2340:YES),词典更新信息生成部230判断空容量信息表示的空容量是否小于预先决定的容量(S2350)。空容量大于等于预先决定的容量时(S2350:NO),词典更新信息生成部230将处理转移到S2335。以空容量小于预先决定的容量为条件(S2350:YES),词典更新信息生成部230将删除该一的第一部分词典的删除指示作为词典更新信息而生成,并将处理转移到S2335。
图9表示本实施例的变形例的词典更新系统10的功能框图。本实施例的终端100除了图1所示的终端100外,还具有电子邮件发送部150。对于词典更新系统10具有的其他结构,与图1的词典更新系统10大致相同,所以,仅说明不同的地方。
电子邮件发送部150从翻译部120接收将变换原始信息翻译后的变换目的信息,根据用户等的指示将变换目的信息作为电子邮件向外部的终端发送。电子邮件发送部150进而将该电子邮件向变换处理信息存储部130传输,同时通知变换处理信息传输部140已经发送了电子邮件。变换处理信息存储部130将电子邮件作为变换处理信息进行存储。
并且,变换处理信息传输部140每次接收到已发送了电子邮件的通知时即每次由电子邮件发送部150发送电子邮件时从变换处理信息存储部130获得包含电子邮件的变换处理信息,并作为电子邮件向词典更新信息生成部230传输。例如,变换处理信息传输部140作为电子邮件的接收地址(TO栏)指定从用户输入的电子邮件的接收人,作为电子邮件的抄送的接收地址(CC栏),指定与更新处理服务器200对应的邮件地址。并且,词典更新信息生成部230根据接收的电子邮件作成词典更新信息,并向第一词典存储部110传输。
变换处理信息传输部140最好是通过切换电子邮件中的文章的多个语句间的语序来生成变换处理信息。即使网络20是不特定多数共用的开放网络时或更新处理服务器200是不特定多数利用的ASP服务器时,也可以防止窃听电子邮件的内容。此外,更新处理服务器200接收到切换了语序的电子邮件的文章时也可以适当地识别语句的出现频率等。即,更新处理服务器200可以不进行密码的译码处理等的追加处理,接收变换处理信息时可以在一定的程序上保持内容的隐蔽性。
这样,终端100在用户每次发送通过翻译而作成的电子邮件时,将该电子邮件向更新处理服务器200传输。因此,终端100的用户,不用进行烦杂的操作就可以更新第一词典。
图10表示变形例的词典更新系统10的动作流程。本变形例的动作流程中没有图4所示的动作流程的S140,取而代之的是S180。对于其他结构,与图3所示的动作流程大致相同,所以,仅说明不同的地方。
电子邮件发送部150判断是否从用户接收到邮件发送指示(S180)。接收到了邮件发送指示时(S180:YES),变换处理信息传输部140将通过翻译而生成的电子邮件向更新处理服务器200传输(S150)。变换处理信息传输部140也可以进而将变换处理信息存储部130存储的变换处理信息向更新处理服务器200传输。
图11表示本实施例及变形例的更新处理服务器200的硬件结构的一例。本实施例的更新处理服务器200具有包括通过主控制器1082相互连接的CPU1000、RAM1020、图形控制器1075和显示装置1080的CPU周边部,包括通过输入输出控制器1084与主控制器1082连接的通信接口1030、硬盘驱动器1040和CD-ROM驱动器1060的输入输出部,包括与输入输出控制器1084连接的ROM1010、软盘驱动器1050和输入输出芯片1070的遗留输入输出部。
主控制器1082将RAM1020与以高的传输速率访问RAM1020的CPU1000和图形控制器1075连接。CPU1000根据ROM1010和RAM1020存储的程序而动作,进行各部分的控制。图形控制器1075获得CPU1000等在RAM1020内设置的帧缓冲器上生成的图像数据,并在显示装置1080上进行显示。图形控制器1075也可以在内部包含存储CPU1000等生成的图像数据的帧缓冲器。
输入输出控制器1084将主控制器1082与作为比较高速的输入输出装置的通信接口1030、硬盘驱动器1040和CD-ROM驱动器1060连接。通信接口1030通过网络与其他装置进行通信。硬盘驱动器1040存储更新处理服务器200使用的程序和数据。CD-ROM驱动器1060从CD-ROM1095中读取程序或数据,通过输入输出控制器1084供给RAM1020。
另外,输入输出控制器1084将ROM1010与软盘驱动器1050和输入输出芯片1070等比较低速的输入输出装置连接。ROM1010存储更新处理服务器200起动时CPU1000执行的引导程序和依赖更新处理服务器200的硬件的程序等。软盘驱动器1050从软盘1090中读取程序或数据,通过输入输出控制器1084供给RAM1020。输入输出芯片1070通过软盘1090或者例如并行端口、串行端口、键盘端口、鼠标端口等连接各种输入输出装置。
供给更新处理服务器200的程序存储在软盘1090、CD-ROM1095或IC卡等记录媒体中,由用户提供。程序从记录媒体中读出,通过输入输出控制器1084安装到更新处理服务器200中,在更新处理服务器200中执行。
安装到更新处理服务器200中执行的程序包含第一词典存储模块、翻译模块、变换处理信息存储模块、变换处理信息传输模块和电子硬件发送模块。各模块在更新处理服务器200中进行的动作与在图1~图10中说明的更新处理服务器200中对应的部件的动作相同,所以,省略其说明。
以上所述的程序或模块也可以存储到外部的记录媒体上。作为记录媒体,除了软盘1090、CD-ROM1095外,可以使用DVD或PD等光学记录媒体、MD等光磁记录媒体、磁带媒体、IC卡等半导体存储器等。另外,也可以将在与专用通信网络或因特网连接的服务器系统中设置的硬盘或RAM等存储装置作为记录媒体使用,并通过网络向更新处理服务器200提供程序。
图12表示本实施例和变形例的终端100的硬件结构的一例。终端100具有的部件与图11中相同符号的各部件大致相同,所以,仅说明不同的地方。终端100也可以不具有硬盘驱动器1040、CD-ROM驱动器1060和软盘驱动器1050。终端100除了图11所示的结构外,可以进而具有IC卡槽1055。终端100进而也可以具有与通信接口1030连接的无线通信部。实现终端100的程序可以存储在记录媒体上,供给终端100,也可以从更新处理服务器200通过网络进行安装。安装到终端100中执行的程序包含第二词典存储模块、翻译模块、容量管理模块、词典更新信息生成模块和词典更新信息传输模块。各模块在终端100中进行的动作与在图1~图10中说明的终端100中对应的部件的动作相同,所以,省略其说明。
以上所述的程序或模块也可以存储到外部的记录媒体上。作为记录媒体,除了软盘和CD-ROM外,可以使用DVD或PD等光学记录媒体、MD等光磁记录媒体、磁带媒体、IC卡1092等半导体存储器等。另外,也可以将在与专用通信网络或因特网连接的服务器系统中设置的硬盘或RAM等存储装置作为记录媒体使用,并通过网络将程序向终端100提供。
如上所述,词典更新系统10可以根据表示翻译的处理结果的变换处理信息自动地更新终端100内的第一词典。例如,即使用户仅进行翻译处理或邮件发送处理时,词典更新系统10也可以使用更新处理服务器200内的第二词典更新终端100内的第一词典,从而可以提高以后的翻译精度。
另外,词典更新系统10可以根据终端的100用户适当地定制第一词典。特别是词典更新系统10在每次用户进行翻译时通过生成变换处理信息就更新了第一词典,所以,每次用户重复进行使用第一词典的翻译时可以提高翻译精度。
因此,即使终端100是PDA等便携式通信终端等、将第一词典存储在比较小的存储区域时,词典更新系统10通过随时更新第一词典,也可以提高翻译的精度。即,可以不降低翻译的精度而减小终端100的存储区域,所以,可以实现终端100的小型化和低功耗化。
按照以上说明的实施例,可以实现以下所示的词典更新系统、更新处理服务器、终端、控制方法、程序和记录媒体。
(项目1)一种包括具有将输入的变换原始信息变换为变换目的信息的第一词典的终端和通过网络更新上述终端的第一词典的更新处理服务器的词典更新系统,其特征在于:上述终端具有存储第一词典的第一词典存储部、存储在根据第一词典将上述变换原始信息变换为上述变换目的信息的处理中得到的变换处理信息的变换处理信息存储部和将上述变换处理信息向上述更新处理服务器传输的变换处理信息传输部,上述更新处理服务器具有根据上述变换处理信息生成更新第一词典的词典更新信息的词典更新信息生成部和将上述词典更新信息向上述终端传输的词典更新信息传输部。
(项目2)按项目1所述的词典更新系统,其特征在于:上述更新处理服务器进而具有存储将变换原始信息变换为变换目的信息的第二词典的第二词典存储部,上述词典更新信息生成部根据上述变换处理信息从上述第二词典中选择应向上述第一词典中追加的信息,作为上述词典更新信息而生成。
(项目3)按项目2所述的词典更新系统,其特征在于:上述第一词典存储部存储将用第一语言表述的上述变换原始信息翻译为用第二语言表述的上述变换目的信息的上述第一词典,上述变换处理信息存储部作为上述变换处理信息而存储使上述变换原始信息与翻译结果的确信度对应的信息,上述更新处理服务器进而具有使用上述第二词典翻译接收的上述变换原始信息并输出翻译的确信度的翻译部,上述词典更新信息生成部在与上述变换原始信息对应地接收的上述确信度低于由上述翻译部翻译时的确信度时,就从上述第二词典中选择上述翻译部进行上述变换原始信息的翻译时使用的信息,作为上述词典更新信息而生成。
(项目4)按项目3所述的词典更新系统,其特征在于:上述变换处理信息存储部在上述变换原始信息的翻译的上述确信度比预先决定的基准确信度低时存储该变换原始信息。
(项目5)按项目2所述的词典更新系统,其特征在于:上述变换处理信息存储部将不能由上述第一词典进行变换的上述变换原始信息作为上述变换处理信息进行存储,上述词典更新信息生成部从上述第二词典中选择与上述变换处理信息对应的变换目的信息,作为上述词典更新信息。
(项目6)按项目5所述的词典更新系统,其特征在于:上述词典更新信息生成部进而从上述第二词典中选择包含上述变换处理信息的复合词的变换目的的信息。
(项目7)按项目2所述的词典更新系统,其特征在于:上述第一词典存储部作为上述第一词典存储多个第一部分词典,上述变换处理信息存储部作为上述变换处理信息存储上述多个第一部分词典的各个使用频率,上述变换处理信息传输部将上述多个第一部分词典的各个使用频率作为上述变换处理信息向上述更新处理服务器传输,上述第二词典存储部作为上述第二词典存储与上述多个第一部分词典的各个对应的多个第二部分词典,上述词典更新信息生成部在一的第一部分词典的上述使用频率比预先决定的第一频率高时,将与上述一的第一部分词典对应的一的上述第二部分词典作为上述词典更新信息而生成。
(项目8)按项目7所述的词典更新系统,其特征在于:上述第二词典包含上述第一词典,上述词典更新信息生成部在其他上述第一部分词典的上述使用频率比预先决定的第二频率低时,将删除上述其他第一部分词典的删除指示作为上述词典更新信息而生成。
(项目9)按项目8所述的词典更新系统,其特征在于:上述更新处理服务器进而具有管理表示上述终端设置的存储装置的空容量的容量信息的容量管理部,上述词典更新信息生成部进而以上述空容量信息表示的空容量比预先决定的容量小为条件,生成上述删除指示。
(项目10)按项目1所述的词典更新系统,其特征在于:上述终端进而具有通过电子邮件将把上述变换原始信息变换后的上述变换目的信息向外部的终端发送的电子邮件发送部,上述变换处理信息传输部在每次发送上述电子邮件时进而将该电子邮件作为上述变换处理信息向上述更新处理服务器传输,上述词典更新信息传输部根据上述电子邮件作成上述词典更新信息,向上述终端传输。
(项目11)按项目10所述的词典更新系统,其特征在于:上述变换处理信息传输部通过切换上述电子邮件中的文章中多个语句间的语序,生成上述变换处理信息。
(项目12)按项目1所述的词典更新系统,其特征在于:上述变换处理信息传输部在将上述变换处理信息向上述更新处理服务器传输时删除上述变换处理信息存储部存储的上述变换处理信息。
(项目13)一种具有将输入的变换原始信息变换为变换目的信息的第一词典并使外部设置的更新处理服务器更新该第一词典的终端,其特征在于:具有存储在根据上述第一词典将上述变换原始信息变换为上述变换目的信息的处理中得到的变换处理信息的变换处理信息存储部、将上述变换处理信息向上述更新处理服务器传输的变换处理信息传输部和存储上述第一词典并在从上述更新处理服务器接收到更新上述第一词典的词典更新信息时更新该第一词典的第一词典存储部。
(项目14)按项目13所述的终端,其特征在于:进而具有使用上述第一词典将用第一语言表述的上述变换原始信息翻译为用第二语言表述的上述变换目的信息的翻译部,上述变换处理信息传输部将使上述变换原始信息与翻译结果的确信度对应的信息作为上述变换处理信息向上述更新处理服务器传输,上述第一词典存储部根据从上述更新处理服务器依据上述确信度返送来的上述词典更新信息更新上述第一词典。
(项目15)按项目13所述的终端,其特征在于:上述变换处理信息存储部将不能由上述第一词典进行变换的上述变换原始信息作为上述变换处理信息进行存储,上述第一词典存储部作为上述词典更新信息从上述更新处理服务器接收与上述变换处理信息对应的变换目的信息,通过追加该变换目的信息而更新上述第一词典。
(项目16)按项目13所述的终端,其特征在于:上述第一词典存储部作为上述第一词典存储多个第一部分词典,上述变换处理信息存储部作为上述变换处理信息存储上述多个第一部分词典的各个使用频率,上述变换处理信息传输部将上述多个第一部分词典的各个使用频率作为上述变换处理信息向上述更新处理服务器传输,上述第一词典存储部从上述更新处理服务器接收与具有使用频率比预先决定的第一频率高的一的上述第一部分词典对应的其他部分词典,通过追加该其他部分词典而更新上述第一词典。
(项目17)一种向具有将输入的变换原始信息变换为变换目的信息的第一词典的终端传输用于更新该第一词典的词典更新信息的更新处理服务器,其特征在于:具有从上述终端接收在根据上述第一词典将上述变换原始信息变换为上述变换目的信息的处理中得到的变换处理信息并根据该变换处理信息生成更新上述第一词典的词典更新信息的词典更新信息生成部和通过向上述终端传输上述词典更新信息而更新上述第一词典的词典更新信息传输部。
(项目18)一种控制具有将输入的变换原始信息变换为变换目的信息的第一词典的终端和通过网络更新上述终端的上述第一词典的更新处理服务器的控制方法,其特征在于:包括使上述终端存储上述第一词典的阶段、使上述终端存储在根据上述第一词典将上述变换原始信息变换为上述变换目的信息的处理中得到的变换处理信息的阶段、使上述终端向上述更新处理服务器传输上述变换处理信息的阶段、使上述更新处理服务器根据上述变换处理信息生成更新上述第一词典的词典更新信息的阶段和使上述更新处理服务器向上述终端传输上述词典更新信息的阶段。
(项目19)一种使计算机起向具有将输入的变换原始信息变换为变换目的信息的第一词典的终端传输用于更新该第一词典的词典更新信息的更新处理服务器的功能的程序,其特征在于:使上述计算机起从上述终端接收在根据上述第一词典将上述变换原始信息变换为上述变换目的信息的处理中得到的变换处理信息并根据该变换处理信息生成更新上述第一词典的词典更新信息的词典更新信息生成部和通过向上述终端传输上述词典更新信息而更新上述第一词典的词典更新信息传输部的功能。
(项目20)一种使计算机起具有将输入的变换原始信息变换为变换目的信息的第一词典并使外部设置的更新处理服务器更新该第一词典的终端的功能的程序,其特征在于:使上述计算机起存储在根据上述第一词典将上述变换原始信息变换为上述变换目的信息的处理中得到的变换处理信息的变换处理信息存储部、将上述变换处理信息向上述更新处理服务器传输的变换处理信息传输部和存储上述第一词典并在从上述更新处理服务器接收到更新上述第一词典的词典更新信息时更新该第一词典的第一词典存储部的功能。
(项目21)记录项目19或项目20所述的程序的记录媒体。
以上,使用实施例说明了本发明,但是,本发明的技术范围不限于上述实施例所述的范围。上述实施例可以进行各种变更或改良。这样的变更或改良的形式也包含在本发明的技术范围内,这从利权要求范围的表述即可明白。例如,终端100也可以不具有翻译部120。这时的终端100,例如是向其他终端作为附加功能提供翻译的词典的终端。即,第一词典存储部110可以存储由其他终端设置的翻译部使用的第一词典。
根据上述说明可知,按照本发明,可以适当地更新设置在终端中的词典。