本发明是关于使用数据库文件,将中文译成日文或将日文译成中文的翻译方法。 过去,还未曾有过从日文到中文的翻译系统提案。另外,先有的从中文到日文的翻译系统存在着对每次输入的中文都要逐个翻译成日文的缺点,因此不能实现翻译的高速化;并且因为被翻译的日文只使用一次,而在使用后全部放弃掉,故也存在使用效率不高等缺点。
本发明的目的,在于使用数据库文件,力求把一度翻译过的日文或中文再次加以利用,从而提供进行日文和中文间高速翻译的翻译方法。
本发明的第一度翻译方法包括下列手段:为了输入中文拼音符号和声调的键盘手段;存放上述中文拼音符号和声调对及与中文相对应的日语单词的字模组,以及按照上述中文发音符号和声调对的顺序,存放中文原文和一度被翻译了的日文组的数据库文件手段;为把由上述键盘手段得到的拼音符号和声调与由上述数据库文件手段得到的拼音符号和声调进行比较地比较手段;响应由该比较手段得到的比较结果,检索上述数据库文件手段中中文原文是否存在的检索手段;响应用该检索手段检索出的中文原文,并把翻译了的日文由上述数据库文件手段输出并显示的手段;利用上述检索手段,当中文原文不存在时,由上述数据库文件手段读出上述日文单词字模并根据日语文法重排日文单词的重排手段;以及给经过该重排手段重排了的单词群添加日文助词的助词添加手段。
本发明的第二翻译方法包含以下手段:
基于平假名、片假名或罗马字生成的日文字模的日文生成手段;存放中文拼音符号和声调对和中文汉字字模以及与这个中文汉字字模相对应的日文字模的数据库文件手段;
比较由上述日文生成手段得到的日文字模和由上述数据库文件手段得到的日文字模的比较手段;当由该比较手段得到的比较结果不一致时,对此作出响应,并显示出错信息的显示手段;当由上述比较手段得到的比较结果一致时,对此作出响应,并打印从上述数据库文件手段输出的中文汉字字模的打印手段。
根据本发明的翻译方法,由于数据库文件的使用,一度被翻译了的日文(或中文)立即可以整个地翻译成中文(或日文),因此具有能实现翻译高速化的功效。另外,因为被翻译的日文(或中文)全部被存贮起来,从而容易实现日文(或中文)的再翻译。
图1为本发明的第一个实施例。
图2为本发明的第二个实施例。
图3为图2的日文生成手段15的详细处理过程。
图4为当图2处理过程显示有错误信息时的翻译处理系统。
以下就本发明参照图表加以说明。
参照图1,根据本发明的一个实施例,由以下部分构成:日文处理终端4,它又由下述部分构成:显示器(CRT)1,用以显示拼音符号、声调及中文单词和中文句子,键盘(KB)2,用以输入拼音符号、声调及用于选择由显示器(CRT)1显示的中文单词序号,以及能将信息处理系统翻译出来的日文输出的汉字行式打印机(KLP)3;信息处理系统5,它由下列手段构成:能对拼音符号及声调作比较的比较手段7,中文原文检索手段8,它根据比较手段7所得到的结果,检索在数据库文件6中是否存在中文原文,日文单词重排手段11,助词添加手段12,从书面语到口语的变换手段13,向数据库文件6写入数据的写入手段14;此外,还包括按拼音符号和声调顺序保存中文原文和一度被翻译了的日文的数据库文件6和工作文件9和语法文件10。
表1是存放于数据库文件6内的中文原文和被译成日语的句子的对应部分。
表1
下面,运用本发明的数据库文件,具体地说明从中文到日文翻译方法的一个例子。
例如:中文句子
wèi lè zhù dà jiā shēn tjiàng
为 了 祝 大 家 身 体 健
kāng gān bēi
康 , 干 杯 。
从KB2输入为
WEI4△LE4△ZHU4△DA4△JIA1△SHEN1△TI3△JIANG4△KANG1,GANG△BEI1△。
这时,由比较手段7,根据拼音符号与声调的比较,确定数据库文件6中是否存在与输入的拼音符号、声调一致的内容。用比较手段7所作比较完成后,由中文原文检索手段8检索上述数据库文件6中是否存在中文语句。在检索存在中文原文时,将中文原文从数据库文件6取出,在CRT1上显示“为了祝大家身体健康,干杯。”并在KLP3上打印翻译后的日文“皆さんの健康を祝して乾杯。”
若比较手段7所得结果不一致时,用下面的方法将中文变换成日文。下面的表2列出了一部分存放在数据库文件6中的汉语拼音符号、声调、单词字模及与中文单词字模相对应的日文单词字模,以及词类的信息。
表2
《词类略号》
名=名詞,副=副詞,代名=代名詞,自動=自動詞,形動=形容動詞,他動=他動詞,接=接続詞
下面具体说明一下使用本发明的词典文件将中文译成日文的翻译方法。
假如:在翻译如下中文句子时,
wèi lè zhù dà jiā shēn tjiàng kāng
为 了 祝 大 家 身 体 健 康
gān bēi
干 杯
从键盘(KB)2,以单词为单位输入拼音符号和声调符号,在此要说明一下声调符号的输入方法。声调有以下四种,但不能直接从键盘(KB)2输入声调符号,因此将其转换为数字后输入。例如使-=1,/=2,v=3,\=4。
首先从键盘(KB)2输入“WEI4△LE4,”通过比较手段9将其与词典文件6中的拼音符号和声调符号内容比较后,将一致的内容取出。该词典文件6的结构例如下表所示,与“WEI4△LE4,”一致的成分乃是与中文单词的“为了”对应的日文单词“のために”和词类“接続词”,而后,中文单词“为了”在显示器(CRT)1上显示,日文单词及词类的“のために(接)”则在工作文件7中保存起来。
当显示器(CRT)1显示的中文单词有多个具有同一拼音符号和同一声调时,则将它们分别显示,并借助键盘(KB)2上来进行选择。
例如输入“WEI4△LE4,”时,显示器(CRT)1显示出“1.为了”,如果从键盘(KB)2输入“1”,就选择了“为了”。
而后如表3所示进行输入。
如果完成了上述输入操作,在显示器(CRT)1上显示出“为了祝大家身体健康,干杯。”,在工作文件9中存贮了“のために(接)祝す(他動)皆さん(代名)体(名)健康(名·自動)乾杯(名·自動)”。
在工作文件9内存贮的以单词为单位直译出的日语,由重排手段11依靠使用日文语法文件中的语法而重排成:“皆さん体 健康のため に祝す,乾杯。”,这句话再由助词添加手法12按照语法文件的规则,追加语法文件表中(未图出)的助词,变成:“皆さんの体の健康のために祝す,乾杯。”。不过,这句话还是书面语言,要把它变成口语,通过变换手段13,运用语法文件将其变换成:“皆さんの健康を祝し,乾杯。”,在汉字打印机(KLP)3上打印此语句的同时,由写入手段14将此语句写入数据库文件6。如此进行,运用此信息处理系统便可将汉语文章翻译成日语文章。
有关运用日文语法文件进行日语正规化的方法,请参照日本信息处理学会1985年10月发行的刊物《情报处理》VOL,26 No.10
下面再参照图2、图3及图4,详细说明使用在第一个实施例作成的数据库文件6,实现从日文到中文的翻译技术的本发明的第二个实施例。
参照图2,本发明的第二个实施例作如下配置:为输入构成日文的片假名、平假名及罗马字的键盘(KB)2;基于键盘2输入的平假名、片假名和罗马字,为了生成日文句子的日文单词变换文件18;使用日文单词变换文件18,基于上述键盘2输入的平假名、片假名及罗马字,生成日文句子,并输出日文字模的日语单词生成手段15;以表1所示的形式存放中文拼音符号及声调组合、中文字模及日文字模的数据库文件6;把从该数据库文件6顺次输出的日文字模与由上述日语单词生成手段15得到的日文字模相比较的日语原文比较手段16;当用日语原文比较手段16得到的比较结果不一致时,用以显示错误信息以及用于显示通过上述日语单词生成手段15生成的日文句子的显示器(CRT)1;当上述日语原文比较手段16的比较结果一致时,对此作出响应,并打印从上述数据库文件6输出的中文句子的汉字打印机(KLP)3。
下面具体说明一个利用本发明的数据库文件6,将日文译成中文的翻译方法的例子。
参照图2,例如把日文语句
みなさんのけんこぅをしゅくしてかんぽぃ
皆さんの健康を祝して乾杯。
响应键盘(KB)2的输入
“みなさんのけんこぅをしゅくしてかんぱぃ。”
由日语单词生成手段15使用日语变换文件8,生成日文字模“皆さんの健康を祝して乾杯”。同时在显示器(CRT)2上显示。
关于日文单词生成手段15中日文语句的生成,参照图2和图3加以详细说明。
参照图2及图3,首先在第21步,由于作为变换对象的平假名尚未输入,在下面第22步从键盘2输入平假名。变换对象“みなさん…”的“み”被输入。由第23步判定“み”这一个字是不是可进行汉字转换的单位。在23步判定“み”这一个字不是可变换的汉字单位,在第21步可判定变换对象的平假名并没有全部输入。因此,第22步使变换对象“みなさん…”中位于“み”下一个位置的“な”输入。结果,由于在第23步确定“みな”是可变换汉字单位,第24步要判定该单词单位是否能进行假名-汉字变换。由于判定“みな”是可变换的,则在第25步进行“みな”的假名-汉字变换,将“みな”变换为代替它的汉字“皆”。在此变换过程中,假如显示有“1皆,2水”,则从键盘2输入“1”来选择“皆”。接下来在26步由CRT1显示“皆”。当然,也可以在显示“皆”之前显示出平假名“みな”。显示的时间可以放在22到26步的任一期间。
接下来,变换对象“みなさんのけんこぅ……”中紧接着“みな”的“さ”、“ん”和“の”在第22步从键盘2顺次输入。在第24步判断以“さんの”为单位是否可进行假名-汉字变换。由于判定“さんの”不能变换,第27步不进行汉字变换,而由28步输出平假名。以同样方法,将“みなさんのけんこぅをしゅくしてかんぱぃ”变换为“皆さんの健康を祝して乾杯”,并在显示器(CRT)1上显示。
该变换后的句子输出到日文原文比较手段16。
日文原文比较手段16从数据库文件6中顺序读出日文字模并加以比较,当比较结果表示为一致时,读出与该日文字模相对应并已被翻译了的汉字字模,并在汉字打印机(KLP)3上打印“为了祝大家身体健康,乾杯。”
另外,当不一致时,在显示器(CRT)1上显示错误信息。
当在显示器(CRT)1上显示错误信息时,实施下面的翻译方法。
参照图4,进行该翻译的系统,由以下各部分构成:日语处理终端4,它又由下列3部分构成:为输入拼音符号和为选择在显示器(CRT)1上显示的中文单词序号的键盘2,显示与从键盘2输入的拼音符号和声调符号相匹配的中文单词的显示器(CRT)1,以及输出通过信息处理系统翻译了的日文的汉字打印机(KLP)3;此外,还包括进行翻译工作的信息处理系统25;将中文变换成日文的数据库文件6;工作文件9和为形成日文的语法文件10。
下面,运用本发明的数据库文件,具体地说明将中文译成日文翻译方法的一个例子。例如翻译
wèi lè zhù dà jiā shēn tjiàng kāng
为 了 祝 大 家 身 体 健 康
gān bēi
干 杯
这个中文语句时,以单词为单位从键盘(KB)2输入拼音符号和声调符号。这里说明一下声调符号的输入方法。声调有以下四种,由于声调符号本身不能直接从键盘(KB)2输入,故变换成数字后再输入。例如-=1,/=2,V=3,\=4。
首先,从键盘(KB)2输入“WEI4△LE4,”通过比较手段7,与数据库文件6的拼音符号和声调符号的内容相比较后,取出相一致的部分。该数据库文件6的构造例示于上列表2中。和“WEI4△LE4,”相一致的乃是中文单词的“为了”与日文单词的“のために”和词类的“接続词”,而后在显示器(CRT)1上显示中文单词的“为了”,而把日文单词和词类的“のために(接)”写入工作文件9中。
在显示器(CRT)1上显示的中文单词,若有多个具有同一发音符号和同一声调符号,将它们分别显示,而后在键盘(KB)2上选择。例如“WEI4△LE4,”的场合,在显示器(CRT)1上显示有“1.为了”,如果从键盘(KB)2输入“1”,则选择了“为了”。
以后的输入如表3所示。
如果完成了以上的输入操作,则在显示器(CRT)1上显示“为了祝大家身体健康,干杯。”在工作文件9中存入“のために(接)祝す(他動)皆さん(代名)体(名)健康(名·自動)乾杯(名·自動)”
若以工作文件9中存放的单词为单位直译成的日文,依靠使用日文语法文件的语法,通过重排手段11重排成“皆さん体健康のために祝す,乾杯。”根据语法文件的规则,应用助词添加手段12,把语法文件表(没有图示)中的助词,追加到上述日文句子中后成为“皆さんの体の健康のために祝す,乾杯。”但是这个语句是书面语,要变换成口语,需使用语法文件并通过变换手段13变换成“皆さんの健康を祝し、乾杯。”,然后将这个句子在汉字打印机(KLP)3上输出。这样,依靠信息处理系统的使用,便可将汉语文章翻译成日语文章。