表达转换装置和表达转换方法.pdf

上传人:大师****2 文档编号:6168632 上传时间:2019-05-16 格式:PDF 页数:26 大小:5.44MB
返回 下载 相关 举报
摘要
申请专利号:

CN201310371209.4

申请日:

2013.08.23

公开号:

CN103714052A

公开日:

2014.04.09

当前法律状态:

撤回

有效性:

无权

法律详情:

发明专利申请公布后的视为撤回IPC(主分类):G06F 17/28申请公布日:20140409|||实质审查的生效IPC(主分类):G06F 17/28申请日:20130823|||公开

IPC分类号:

G06F17/28

主分类号:

G06F17/28

申请人:

株式会社 东芝

发明人:

坂本明子; 釜谷聪史

地址:

日本东京都

优先权:

2012.09.28 JP 218784/2012

专利代理机构:

北京市中咨律师事务所 11247

代理人:

刘薇;杨晓光

PDF下载: PDF下载
内容摘要

根据一个实施例,一种表达转换装置(110)包括:处理器;输入单元(101),其被配置为输入说话者的语句作为源表达;检测单元(102),其被配置为检测表示说话者的特征的说话者属性;标准化单元(103),其被配置为将源表达转换为标准化表达,所述标准化表达包括条目和表示所述条目的语法功能的特征向量;调整单元(104),其被配置为根据另一个说话者的另一个说话者属性,将说话者属性调整为说话者与另一个说话者之间的相对说话者关系;转换单元(105),其被配置为根据相对说话者关系,转换标准化表达。

权利要求书

权利要求书
1.  一种表达转换装置,包括:
处理器,其可通信地连接到存储计算机可执行指令的存储器,并执行或帮助执行计算机可执行组件,包括:
输入单元,其被配置为输入第一说话者的语句作为源表达;
检测单元,其被配置为检测表示所述第一说话者的特征的说话者属性;
标准化单元,其被配置为将所述源表达转换为标准化表达,所述标准化表达包括条目和表示所述条目的语法功能的特征向量;
调整单元,其被配置为根据第二说话者的另一个说话者属性,将所述说话者属性调整为所述第一说话者与所述第二说话者之间的相对说话者关系;以及
转换单元,其被配置为根据所述相对说话者关系,转换所述标准化表达。

2.  如权利要求1所述的装置,其中,
所述检测单元检测表示其中所述源表达被输入的场景的场景属性;
所述调整单元根据所述场景属性,将所述说话者属性调整为所述相对说话者关系。

3.  如权利要求1所述的装置,还包括:
存储单元,其被配置为存储根据所述说话者属性而转换所述源表达的模型。

4.  如权利要求3所述的装置,其中,
所述存储单元存储根据表示其中所述源表达被输入的场景的场景属性而转换所述源表达的模型。

5.  如权利要求1所述的装置,还包括:
避免单元,其被配置为当所述第一说话者与所述第二说话者之间的属性特征语重叠时,避免所述属性特征语重叠。

6.  一种表达转换方法,包括:
输入第一说话者的语句作为源表达;
检测表示所述第一说话者的特征的说话者属性;
将所述源表达转换为标准化表达,所述标准化表达包括条目和表示所述条目的语法功能的特征向量;
根据第二说话者的另一个说话者属性,将所述说话者属性调整为所述第一说话者与所述第二说话者之间的相对说话者关系;以及
根据所述相对说话者关系,转换所述标准化表达。

说明书

说明书表达转换装置和表达转换方法
技术领域
在此描述的实施例通常涉及对于出现多个说话者的对话,根据对话的其它说话者和场景来转换对话的风格。
背景技术
语音对话装置输入由用户说出的问题语句,并对用户产生回答语句。该装置从问题语句中提取日期表达类型,选择相同类型的日期表达用于回答语句,并根据相同类型的日期表达输出回答语句。
在语音翻译机器中,如果说话者是男性,则机器根据男性声音,翻译成男性表达,并输出男性表达。如果说话者是女性,则机器根据女性声音,翻译成女性表达并输出女性表达。
在社交网络服务(SNS)中,如果语音对话装置和语音翻译机器以相同的语言和相同的表达风格输出,则对话和语音翻译在相同的表达上变得一致,因为并不反映出说话者性别。因此,听者很难区别哪个说话者在说话。
在传统的技术中,可根据说话者的属性调整说话者的表达,但不能根据说话者与听者之间的关系调整表达。听者包括正在对说话者说话的人。
例如,假设描述采用非正式的说话方式的学生与采用正式得说话方式的教授之间的对话,则传统的技术不能根据说话者和对话场景来调整他们的词和语句的特征。因此,学生的非正式表达不能被转换为与作为上级听者的教授相配的敬语表达。
发明内容
实施例提供了一种装置和方法,其能够根据说话者之间的相对关系调整说话者的属性,将说话者的输入语句转换为合适于另一个说话者的适当表达,并获取反映说话者之间的相对关系的表达。
根据一个实施例,表达转换装置包括:处理器;输入单元,其被配置为输入说话者的语句作为源表达;检测单元,其被配置为检测表示说话者的特征的说话者属性;标准化单元,其被配置为将源表达转换为标准化表达,所述标准化表达包括条目和表示条目的语法功能的特征向量;调整单元,其被配置为根据另一个说话者的另一个说话者属性,将说话者属性调整为说话者与该另一个说话者之间的相对说话者关系;以及转换单元,其被配置为根据相对说话者关系,转换标准化表达。
根据实施例,可以提供一种装置和方法,其能够根据说话者之间的相对关系调整说话者的属性,将说话者的输入语句转换为用于另一个说话者的适当表达,并获取反映说话者之间的相对关系的表达。
附图说明
图1示出一个实施例的表达转换装置和属性表达模型构成装置;
图2示出用于根据说话者概略信息检测说话者属性和属性特征语的说话者属性表;
图3示出用于根据对话场景信息检测场景属性的场景属性表;
图4示出将源表达转换为标准化表达和它的特征向量的例子;
图5示出形素字典和语法信息的例子;
图6示出在属性表达模型存储单元中存储的标准化字典的例子;
图7示出用于根据说话者属性决定每个说话者的地位的规则;
图8示出用于根据说话者之间的关系决定属性特征语的优先级的决策树;
图9表示用于当说话者的每个属性特征语相同时避免属性特征语之间的重叠的流程图;
图10表示应用表达转换装置的属性表达模型的流程图;
图11-图13示出应用属性表达模型的例子;
图14示出其中说话者的每个属性特征语相同并应用图9中的S906的情形;
图15表示属性表达模型构成装置的操作的流程图;
图16示出属性表达模型构成装置的例子;
图17示出属性表达模型和扩展属性表达模型的例子。
具体实施方式
一个实施例
一个实施例的表达转换装置在日语表达之间进行转换。但是目标语言并不限于日语。该装置可以在相同或不同语言/方言的任何语言表达之间进行转换。例如,通常的目标语言可包括阿拉伯语、汉语(普通话、粤语)、英语、波斯语、法语、德语、印地语、印尼语、意大利语、韩语、葡萄牙语、俄语和西班牙语中的一种或多种。更多的语言可以被列出,但为了简化而不列出。
图1示出一个实施例的表达转换装置110。该装置110包括输入单元101、属性检测单元102、表达标准化单元103、属性调整单元104、表达转换单元105、属性表达模型存储单元106、输出单元107、属性表达模型检测单元108和属性重叠避免单元109。
单元101输入由说话者说出的表达,作为源表达。单元101可以是输入自然语言、手语和盲文的各种输入设备,例如麦克风、键盘,光学字符识别(OCR)、由例如感应笔等的定点设备手写的字符和轨迹的识别、由照相机检测的姿势的识别等。
单元101获取由说话者说出的表达,作为文本串,并接收该表达作为源表达。例如,单元101可以输入由说话者说出的表达“メール読んでくれた?(你读了我的电子邮件吗?)”。
单元102检测说话者的属性(或用户属性)和对话场景的属性。
检测说话者属性的方法
该方法通过使用检测属性的规则来根据预定的说话者概略信息检查说话者信息(姓名、性别、年龄、位置、职业、兴趣、语言等),并检测描述说话者的一个或多个属性。
图2示出用于根据说话者概略信息检测说话者属性和属性特征语的说话者属性表。行201示出说话者属性“青年、学生、孩子”和属性特征语“口语”通过概略信息“大学生”检测。属性特征语是对说话者分配的最适当的文字风格和说话风格的关键词。
在该实施例中,说话者属性和属性特征语通过从上到下地使用图2所示的表来获取,并在获取快速时设置为高优先级。
检测场景属性的方法
图3示出用于根据对话场景信息检测场景属性的场景属性表。当单元102输入例如“在家里”的场景信息作为预定对话场景时,单元102根据行301检测场景属性“非正式”。
单元103通过使用形态分析、语法分析、参照解析等来对由单元101输入的源表达执行自然语言分析,并将源语言语句转换为标准化表达(或条目)和它的特征向量。标准化表达表示客观事物。特征向量表示针对命题的说话者主观认知和话语行为。在该实施例中,特征向量被提取为时态、体态、语气、声音等,单元103根据源语言语句划分特征向量,并产生标准化表达。
当日语源表达401“文が解析された(语句被分析了)”被输入时,如图4所示,单元103产生标准化表达405“解析する(分析)”和行403所示的特征向量406“被动,过去时”。
在该实施例中,特征向量根据图5所示的形素字典和语法信息来提取。例如,参照图5所示的字典,源表达404“解析された(被分析了)”被分析为“解析する(分析)、られる(被动语态)、た(过去时)”,并被转换成标准化表达405“解析する(分析)”和特征向量406“被动,过去时”。
分析和转换技术可以使用形素分析、语法分析等。形素分析可应用于 传统的基于连接成本、统计语言模式等的分析方法。语法分析可应用于传统的基于CYK方法(Cocke-Younger-Kasami)、通用LR方法(从左到右和最右解析)等的分析方法。
另外,单元103将源表达划分成预定的短语单元。在该日语例子中,短语单元被设为从句,其包括最多一个内容字和零个或多个功能字。在日语中,内容字表示可以独立组成从句的字,例如名词、动词、形容词等。在日语中,功能字是与内容字不同且通常与之相对的概念,表示不能独立组成从句的字,例如,助词、助动词等。
在图4的情形中,源表达401“文が解析された”被输出为两个短语,包括402“文が”和403“解析された”。
当单元106应用条目(标准化表达)、特征向量和属性特征语时,单元106存储所生成的有关条目的表达(或衍生)的规则,作为属性表达模型。
当图6所示的行608包括条目“見る”、特征向量“现在时”、“兔子特征语(以兔子的方式说话)”时,行608表示衍生“見るぴょん”的产生规则。日语表达“ぴょん”意味着当日本年轻女孩想要用日语像兔子一样说话时所说出的字。规则被存储在单元106的标准化字典中。
单元104比较多个说话者的属性,并根据对话场景和说话者之间的相对说话者关系,选择优先属性。在该实施例中,单元104包括图7所示的规则和图8所示的决策树,并调整说话者的属性。图7示出用于根据说话者属性决定每个说话者的地位的规则。图8示出用于根据说话者之间的相对说话者关系决定属性特征语的优先级的决策树。
在图7中,行706表示当具有属性“孩子”的说话者1和具有属性“父母”的说话者2在场景“在家里”中进行对话时,说话者1和说话者2的地位是“平等”的。
例如,当“大学生”与他/她的父母“在家里”进行对话时,参照图8所示的决策树,说明决定属性特征语的优先级的过程。单元102根据图2所示的行201检测与概略信息“大学生”对应的说话者属性“青年、学生、 孩子”,并根据图3所示的行301检测与场景信息“在家里”对应的场景属性“非正式”。因此,当“大学生”与他/她的父母“在家里”进行对话时,选择相对关系“平等”(S801),选择场景属性“非正式”(S803),并选择“属性特征语”(S807)。“属性特征语”用于转换由“大学生”在场景“在家里”中所说的源表达。源表达通过使用图2的行2中的属性特征语“口语”来转换。
当对话中的说话者的说话者属性相同时,单元104调用单元109。单元109通过在说话者属性之间制造不同来避免说话者属性之间的重叠。
图9示出当说话者的每个属性特征语相同时避免属性特征语之间的重叠的流程图。单元109从具有相同属性特征语的对话参与者中选择两个说话者,并从单元104接收这两个说话者的概略信息。单元109估计除了与相同的说话者属性特征语对应的说话者属性外,这两个说话者是否被给予了另一个说话者属性。
当这两个说话者被给予了另一个说话者属性时(S902的“是”),单元109用与相同的属性特征语不同的新的属性特征语代替该相同的属性特征语(S903)。单元109向单元104发送替换后的属性特征语,并结束该过程(S904)。
另一方面,当这两个说话者没有被给予另一个说话者属性时(S902的“否”),估计除了与相同的属性特征语对应的说话者属性之外,这两个说话者中的任意一个是否被给予了另一个说话者属性(S905)。当这两个说话者中的任意一个被给予了另一个说话者属性时(S905的“是”),该另一个说话者属性被设置成属性特征语,该过程进行到S904。
当该过程进行到S905的“否”时,这两个说话者之一被给予具有相同属性的另一组的新属性(S906),该过程进行到S904。
单元105根据由单元104调整的说话者属性并参照由单元106存储的标准化字典,转换说话者的源表达。
例如,当由属性特征语是“口语”的说话者说出的源表达“メールはもうみましたか?”通过属性特征语“口语”转换时,“は”通过图6的 行613转换为“って”。在行604中的条目“見る”、特征向量“过去时”和属性特征语“口语”被转换为“見てくれた”。
单元107输出被单元105转换后的表达。该单元可以是显示器单元的图像输出、打印机单元的打印输出、语音合成单元的语音输出等。
单元108接收由单元101输入的源表达、由单元102检测的特征向量和属性特征语以及源表达被单元103处理而得到的标准化表达的条目,并匹配源表达、特征向量、属性特征语和条目。接着,单元108提取源表达、特征向量、属性特征语和条目作为新的属性表达模型,并将新模型登记到单元106。
另外,在新的属性表达模型被登记到单元106之前,单元108包括具有相同词性的其它内容字条目,以扩展单元108自身。
同时,当单元106已经存储了相同的条目和衍生作为新的扩展属性表达模型时,如果新的扩展属性表达模型是展开属性表达模式,则它被重写,或者如果它不是,则不被登记。因此,聚集用于真实情形的属性表达模型。
在该实施例中,说明了单个条目及其转换。尽管并不限于此,但属性表达模型可通过转换语法和语义结构来扩展,例如修饰结构、语法结构等。例如,通常在单一语言环境中用于机器翻译的执行转换方法可以将单个条目的处理扩展成依赖结构的转换。
在该实施例中,由单元106存储的属性表达模型没有被给予优先级,单元108中的提取频率和单元105中的应用频率可转换优先级,并删除低使用频率的属性特征模型。
图10表示应用表达转换装置的属性表达模型的流程图。单元101输入源表达和说话者概略信息(S1001)。单元102根据概略信息检测说话者属性,并根据对话的场景信息检测场景属性(S1002)。单元103根据所输入的源表达获取标准化表达(S1003)。单元104根据说话者概略信息调整多个说话者属性(S1004)。单元105通过使用说话者属性和由单元104调整的标准化表达来转换源表达(S1005)。单元107输出由单元转换后的表达(S1006)。
第一例子
图11示出应用属性表达模型的第一例子。该例子参照图10说明。
第一例子是说话者1“大学生”和说话者2“大学教师”在场景“上课中”中进行对话的例子。
单元101接收说话者1的对话“メールって見て下さいましたか?(参见图11(c)的1101)”和说话者2的对话“見ました(参见图11(c)的1102)”(S1001)。
单元102根据图2所示的说话者属性表,检测“大学生”和“大学教师”的说话者属性(S1002)。
在该例子中,从图2的规则201中获取与概略信息“大学生”对应的说话者属性“青年,学生,孩子”。另一方面,从规则202中获取与概略信息“大学教师”对应的说话者属性“成人,教师”。
另外,从图3的规则302中检测与场景信息“上课中”对应的场景属性“正式”。
单元103对由单元101输入的说话者1的源表达“メールって見て下さいましたか?(参见图11(c)的1101)”进行标准化。在源表达1101中,单元103用“は”代替“って”,并用“見る”代替“見て下さいました”。结果,获得表示条目“メールは見る”和特征向量“授受+过去时+疑问”的标准化表达1103。同样,单元103根据说话者2的对话“みました”,获取表示条目“見る”和特征向量“过去时”的标准化表达1104。
单元104根据图7所示的规则,检测说话者的地位。当说话者的概略信息是“大学生”和“大学教师”时,应用图7的规则702。因此,“大学生”的地位是“下级”(1116),“大学教师”的地位是“上级”(1117)。
然后,单元104根据图8所示的决策树,确定在每个说话者的表达被转换时使用的属性特征语的优先级。
下面的例子示出了图8所示的决策树对于图11所示说话者1使用的情形。图11中所示的1116和1117表示说话者1与说话者2不平等(图8所示的S801的“否”),过程进行到S802。然后,说话者1的地位是“下 级”(图11所示的1116),过程进行到S805。S805在转换说话者1的表达的情况下给出优先级“敬语,谦语”(图11所示的1118)。同样,S808在转换说话者2的表达的情况下给出优先级“礼貌”(图11所示的1119)。
单元105根据由单元104设置的属性特征语,转换说话者的源表达(S1005)。在图11所示的例子中,单元105参考图6所示的标准化字典,根据图6所示的规则607,将标准化表达1103“メールは見る+授受+过去时+疑问”的一部分“見る”转换成“見て下さいましたか”,并获取表达1107“メールは見て下さいましたか?”。
如果单元104不存在,则表达根据图2的规则201所示的“大学生”的属性特征语“口语”来转换。然后,在转换标准化表达1103时,应用规则604和613。这种情况转换成表达转换而无需属性调整1105“メールって見てくれた?”。这种情况对于在场景“上课中”中“大学生”对“大学教师”的对话中“大学生”的表达是不适当的。
单元107输出具有属性调整1107的表达转换“メールは見て下さいましたか?”(S1006)。
在第一例子中,单元104根据说话者属性和场景属性调整属性。
然而,场景属性并不是主要的,单元104可仅根据说话者属性调整属性。
以下说明不仅根据说话者属性而且根据场景属性调整属性的有效情形。当熟悉的教授之间的对话在例如座谈会的公共场景中进行时,出现在“正式”的场景属性下转换成“口语”的问题。但有效情形可以避免这个问题,因为不仅控制说话者属性,例如“上级,下级”,而且控制场景属性“正式”。
第二例子
图12示出应用属性表达模型的第二例子。该例子参照图10说明。
第二例子是说话者1“大学生”和说话者2“父母”在场景“在家里”中进行对话的例子。单元101输入如图12所示的源表达1201和1202(图10所示的S1001)。
单元102根据图2所示的说话者属性表,检测“大学生”和“父母”的说话者属性。该例子根据图2所示的规则201和203,将属性“青年,学生,孩子”给予“大学生”,并将属性“成人,父母,礼貌”给予“父母”。
接着,单元102根据图3所示的规则301,根据场景信息“在家里”检测场景属性“非正式”。
单元103对输入1201“メールって見てくれた~?”进行标准化。输入1201被单元103从“って”替换为“は”,并从“見てくれた”替换为“見る”。因此,单元103获取标准化表达1203““メールは見る+授受+过去时+疑问”。同样,单元103将输入1202“見たぞ”标准化为标准化表达1204“見る+过去时”。
单元104根据图7所示的规则、检测每个说话者的地位。图12所示的“大学生”和“父母”被应用于图7所示的规则706。“大学生”的地位是“平等”(1216)。“父母”的地位是“平等”(1217)。
然后,单元104根据图8所示的决策树,确定在每个说话者的表达被转换时使用的属性特征语的优先级。下面的例子示出图8所示的决策树用于图12所示的说话者1的情形。说话者1的地位是“平等”(1216),图8所示的S801去往S803。场景属性是“非正式”(1211),S803去往S807。因此,转换说话者1“大学生”的源表达的优先级属性是属性特征语,即,图2的规则201所示的“口语”。同样,说话者2“父母”的优先级属性是“礼貌”。
单元105根据由单元104设置的优先级属性来转换说话者的源表达。在图12所示的例子中,单元105参考图6所示的标准化字典,根据图6的规则613,将标准化表达1203“メールは見る+授受+过去时+疑问”的一部分“は”转换为“って”,并根据规则604,将另一部分“見る”转换为“見てくれた?”。因此,单元105获取表达1207“メールって見てくれた?”。
单元107输出被单元105转换的表达1207“メールって見てくれた?”。
在图11和图12中,同一个标准化表达“メールは見る+授受+过去时+疑问”被转换对应于对话的另一个人。在图11中,1107“メールは見て下さいましたか?”根据另一个说话者“大学教师”来转换。在图12中,1207“メールって見てくれた?”根据另一个说话者“父母”来转换。这样,该实施例的一个优点是根据另一个说话者和场景,将具有相同属性的说话者的对话转换为适当的表达。
第三例子
图13示出应用属性表达模型的第三例子。该例子参照图9说明。
第三例子是说话者1“兔子”和说话者2“兔子,擅长数学”在场景“在家里”中进行对话的例子。
在这种情形中,说话者1和说话者2具有相同的说话者属性“兔子”,相同的说话者属性“兔子”重叠。说话者1或说话者2放弃说话者属性“兔子”,选择另一个说话者属性,并根据与所选择的说话者属性对应的属性特征语转换源表达。
当说话者的一个说话者属性相同时,单元104调用单元109。单元109在具有相同属性的说话者之间制造不同。单元109的处理已经根据图9进行了说明。
以下说明图9所示的当说话者的每个属性特征语相同时(例如图13)避免属性特征语之间的重叠的流程图。
在图13中,说话者1和说话者2具有相同的属性“兔子”(1318,1319),如果继续,则说话者1和说话者2的表达被转换为“兔子特征语”。
当说话者1和说话者2具有相同的属性特征语时,单元104将说话者1和说话者2的所有属性提供给单元109。单元109根据图9,避免说话者1和说话者2的属性特征语之间的重叠。
单元109从单元104接收具有相同的属性特征语的说话者1和说话者2的所有概略信息(S901)。说话者1的概略信息是“兔子”,说话者2的概率信息是“兔子,擅长数学”。S902确定除了与所重叠的属性特征语对应的概略信息外,说话者是否被给予了另一个概略信息。
在该例子中,说话者2除了所重叠的说话者概略信息“兔子”外还具有另一个说话者概略信息“擅长数学”,过程进行到S903。S903参考图2的行205,根据概略信息“擅长数学”获取说话者属性和属性特征语“聪明的”,并进行到S904。S904将说话者2的属性特征语替换为“聪明的”(图13的1321),将“聪明的”发送到单元104,过程结束。
图14示出说话者的每个属性特征语是相同的情形,并应用图9中的S906。当说话者属性表示抽象属性时,例如“兔子”、“乐观的”、“热情的”和“聪明的”,出现说话者1和说话者2的属性特征语的重叠。例如,假定(1)组1,其中许多说话者具有属性“兔子”,(2)组2,其中许多说话者具有属性“乐观的”,(3)组3,其中许多说话者具有属性“悲观的”,(4)组4,其中许多说话者具有属性“聪明的”,当说话者1“兔子和乐观的”和说话者2“兔子和聪明的”在(1)组1中靠近时,出现重叠。因此,第三例子的方法是有效的。
当说话者1和说话者2在社交网络服务(SNS)中不认识各自的ID时,第三例子是有效的。另外,该例子在说话者包括三个或多个人时更有效。
属性表达模型构成装置111
图15表示属性表达模型构成装置的操作的流程图。
单元101获取源表达“S”(S1501)。单元102检测属性特征语“T”(S1502)。单元103分析源表达“S”,并获取标准化表达“Sn”和属性向量“Vp”(S1503)。
单元108标准化表达“Sn”设置成条目,使“Sn”对应于说话者属性“C”、源表达“S”和属性向量“Vp”,并提取属性表达模型“M”(S1504)。然后,单元108将与“M”中的“Sn”和“S”中的另一个“Sn”对应的字替换为具有相同词性的条目“S11…S1n”,并构建扩展属性表达模型“M1…Mn”(S1505)。
单元108从“M”和“M1…Mn”中选择不具有相同条目和相同属性的“M”(S1506)。
以下说明一个例子。假定单元101输入“食べたんだよ”作为源表达 “S”(S1501)。假定单元102获取“口语”作为属性特征语“T”(S1502)。单元103分析源表达“S”,并获取标准化表达“Sn”“食べる”1604和属性向量“Vp”“过去时和口语”1605,如图16所示(S1503)。
单元108将Sn“食べる”设置为条目,将S“食べたんだよ”设置为衍生,使得这些对应于T“口语”和Vp“过去时和口语”,并提取“M”(S1504)。因此,新输入的源表达和标准化表达可对应于属性向量和属性特征语,与新属性和输入表达对应的属性表达模型可以不断增加地构建。
如果Sn“食べる”的词性是“动词”,则S1505通过替换“M”的关于具有词性“动词”的字的条目来构建扩展属性表达模型“M1…Mn”。
例如,如果“見る”的词性是“动词”,则Sn“見る”被设置为条目。用“見る”替换了与源表达的条目对应的字的“見たんだよ”被设置为衍生。扩展属性表达模式M0通过将这些对应于T“口语”和Vp“被动,过去时”来提取。
对于“走る”,以类似的方式,Sn“走る”被设置为条目。用“走る”替换了与源表达的方向字对应的字的“走ったんだよ”被设置为衍生。扩展属性表达模式M1通过将这些对应于T“口语”和Vp“被动,过去时”来提取。M1后的模型可以同样的方式重复地提取。
S1506从“M”和“M1…Mn”中选择不具有相同条目和相同属性的“M”,并将其存储在单元106中。
如果有三个动词,即,图17所示的属性表达模型和扩展属性表达模型,为了简化说明,单元106的状态与图6类似,属性表达模型1701至1703都被登记,因为单元106不存储具有相同条目和相同属性的属性表达模型。因此,根据真实情形的属性转换模型可以被存储。
上述的过程增加并更新由单元106存储的属性表达模型。因此,能够根据各种属性来转换表达。也就是说,表达转换装置110日益增加地存储各种表达的输入与属性及其标准化表达之间的不同,并可对新的输入表达转换各种表达。
根据上述的至少一个实施例的表达转换装置,该装置能够根据说话者 之间的相对关系调整说话者的属性,将说话者的输入语句转换成用于另一个说话者的适当表达,并获取反映了说话者之间的相对关系的表达。
尽管已经描述了某些实施例,但这些实施例仅作为例子提出,并不意味着限定本发明的范围。
例如,装置110的输出结果可被应用于现有的对话装置。现有的对话装置可以是语音对话装置和文本类型的对话装置。此外,对话装置可以被应用于现有的机器翻译装置。
实际上,在此描述的新颖的实施例可以体现为各种其它形式;另外,在不脱离本发明的精神的情况下,可以在形式上对在此描述的实施例进行各种省略、替换和修改。后附的权利要求及其等同意在覆盖这些形式或修改,其将落入本发明的范围和精神内。
实施例的流程图表示根据实施例的方法和系统。应当理解,流程图的每个模块和流程图中模块的组合可以通过计算机程序指令实现。这些计算机程序指令可以被加载到计算机或其它可编程装置上以产生一种机器,以使得在计算机或其它可编程装置上执行的指令创建用于实现流程图模块所规定的功能的装置。这些计算机程序指令还可存储在非瞬态计算机可读存储器中,其可以指导计算机或其它可编程装置以特定的方式工作,以使得在非瞬态计算机可读存储器中存储的指令产生一种产品,其包括实现流程图模块所规定的功能。计算机程序指令还可以被加载到计算机或其它可编程装置/设备上,以使得操作步骤/动作序列在计算机或其它可编程装置上执行,以产生计算机可编程装置/设备,其提供用于实现流程图模块所规定的功能的步骤/动作。
尽管已经描述了某些实施例,但这些实施例仅作为例子提出,并不意味着限定本发明的范围。实际上,在此描述的新颖的实施例可以体现为各种其它形式;另外,在不脱离本发明的精神的情况下,可以在形式上对在此描述的实施例进行各种省略、替换和修改。后附的权利要求及其等同意在覆盖这些形式或修改,其将落入本发明的范围和精神内。

表达转换装置和表达转换方法.pdf_第1页
第1页 / 共26页
表达转换装置和表达转换方法.pdf_第2页
第2页 / 共26页
表达转换装置和表达转换方法.pdf_第3页
第3页 / 共26页
点击查看更多>>
资源描述

《表达转换装置和表达转换方法.pdf》由会员分享,可在线阅读,更多相关《表达转换装置和表达转换方法.pdf(26页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 103714052 A (43)申请公布日 2014.04.09 CN 103714052 A (21)申请号 201310371209.4 (22)申请日 2013.08.23 218784/2012 2012.09.28 JP G06F 17/28(2006.01) (71)申请人 株式会社 东芝 地址 日本东京都 (72)发明人 坂本明子 釜谷聪史 (74)专利代理机构 北京市中咨律师事务所 11247 代理人 刘薇 杨晓光 (54) 发明名称 表达转换装置和表达转换方法 (57) 摘要 根据一个实施例, 一种表达转换装置 (110) 包 括 : 处理器 ; 输。

2、入单元 (101) , 其被配置为输入说 话者的语句作为源表达 ; 检测单元 (102) , 其被配 置为检测表示说话者的特征的说话者属性 ; 标准 化单元 (103) , 其被配置为将源表达转换为标准 化表达, 所述标准化表达包括条目和表示所述条 目的语法功能的特征向量 ; 调整单元 (104) , 其被 配置为根据另一个说话者的另一个说话者属性, 将说话者属性调整为说话者与另一个说话者之间 的相对说话者关系 ; 转换单元 (105) , 其被配置为 根据相对说话者关系, 转换标准化表达。 (30)优先权数据 (51)Int.Cl. 权利要求书 1 页 说明书 9 页 附图 15 页 (19。

3、)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书1页 说明书9页 附图15页 (10)申请公布号 CN 103714052 A CN 103714052 A 1/1 页 2 1. 一种表达转换装置, 包括 : 处理器, 其可通信地连接到存储计算机可执行指令的存储器, 并执行或帮助执行计算 机可执行组件, 包括 : 输入单元, 其被配置为输入第一说话者的语句作为源表达 ; 检测单元, 其被配置为检测表示所述第一说话者的特征的说话者属性 ; 标准化单元, 其被配置为将所述源表达转换为标准化表达, 所述标准化表达包括条目 和表示所述条目的语法功能的特征向量 ; 调整单元, 其被配置为。

4、根据第二说话者的另一个说话者属性, 将所述说话者属性调整 为所述第一说话者与所述第二说话者之间的相对说话者关系 ; 以及 转换单元, 其被配置为根据所述相对说话者关系, 转换所述标准化表达。 2. 如权利要求 1 所述的装置, 其中, 所述检测单元检测表示其中所述源表达被输入的场景的场景属性 ; 所述调整单元根据所述场景属性, 将所述说话者属性调整为所述相对说话者关系。 3. 如权利要求 1 所述的装置, 还包括 : 存储单元, 其被配置为存储根据所述说话者属性而转换所述源表达的模型。 4. 如权利要求 3 所述的装置, 其中, 所述存储单元存储根据表示其中所述源表达被输入的场景的场景属性而转。

5、换所述源 表达的模型。 5. 如权利要求 1 所述的装置, 还包括 : 避免单元, 其被配置为当所述第一说话者与所述第二说话者之间的属性特征语重叠 时, 避免所述属性特征语重叠。 6. 一种表达转换方法, 包括 : 输入第一说话者的语句作为源表达 ; 检测表示所述第一说话者的特征的说话者属性 ; 将所述源表达转换为标准化表达, 所述标准化表达包括条目和表示所述条目的语法功 能的特征向量 ; 根据第二说话者的另一个说话者属性, 将所述说话者属性调整为所述第一说话者与所 述第二说话者之间的相对说话者关系 ; 以及 根据所述相对说话者关系, 转换所述标准化表达。 权 利 要 求 书 CN 10371。

6、4052 A 2 1/9 页 3 表达转换装置和表达转换方法 技术领域 0001 在此描述的实施例通常涉及对于出现多个说话者的对话, 根据对话的其它说话者 和场景来转换对话的风格。 背景技术 0002 语音对话装置输入由用户说出的问题语句, 并对用户产生回答语句。该装置从问 题语句中提取日期表达类型, 选择相同类型的日期表达用于回答语句, 并根据相同类型的 日期表达输出回答语句。 0003 在语音翻译机器中, 如果说话者是男性, 则机器根据男性声音, 翻译成男性表达, 并输出男性表达。 如果说话者是女性, 则机器根据女性声音, 翻译成女性表达并输出女性表 达。 0004 在社交网络服务 (SN。

7、S) 中, 如果语音对话装置和语音翻译机器以相同的语言和相 同的表达风格输出, 则对话和语音翻译在相同的表达上变得一致, 因为并不反映出说话者 性别。因此, 听者很难区别哪个说话者在说话。 0005 在传统的技术中, 可根据说话者的属性调整说话者的表达, 但不能根据说话者与 听者之间的关系调整表达。听者包括正在对说话者说话的人。 0006 例如, 假设描述采用非正式的说话方式的学生与采用正式得说话方式的教授之间 的对话, 则传统的技术不能根据说话者和对话场景来调整他们的词和语句的特征。 因此, 学 生的非正式表达不能被转换为与作为上级听者的教授相配的敬语表达。 发明内容 0007 实施例提供了。

8、一种装置和方法, 其能够根据说话者之间的相对关系调整说话者的 属性, 将说话者的输入语句转换为合适于另一个说话者的适当表达, 并获取反映说话者之 间的相对关系的表达。 0008 根据一个实施例, 表达转换装置包括 : 处理器 ; 输入单元, 其被配置为输入说话者 的语句作为源表达 ; 检测单元, 其被配置为检测表示说话者的特征的说话者属性 ; 标准化 单元, 其被配置为将源表达转换为标准化表达, 所述标准化表达包括条目和表示条目的语 法功能的特征向量 ; 调整单元, 其被配置为根据另一个说话者的另一个说话者属性, 将说话 者属性调整为说话者与该另一个说话者之间的相对说话者关系 ; 以及转换单元。

9、, 其被配置 为根据相对说话者关系, 转换标准化表达。 0009 根据实施例, 可以提供一种装置和方法, 其能够根据说话者之间的相对关系调整 说话者的属性, 将说话者的输入语句转换为用于另一个说话者的适当表达, 并获取反映说 话者之间的相对关系的表达。 附图说明 0010 图 1 示出一个实施例的表达转换装置和属性表达模型构成装置 ; 说 明 书 CN 103714052 A 3 2/9 页 4 0011 图 2 示出用于根据说话者概略信息检测说话者属性和属性特征语的说话者属性 表 ; 0012 图 3 示出用于根据对话场景信息检测场景属性的场景属性表 ; 0013 图 4 示出将源表达转换为。

10、标准化表达和它的特征向量的例子 ; 0014 图 5 示出形素字典和语法信息的例子 ; 0015 图 6 示出在属性表达模型存储单元中存储的标准化字典的例子 ; 0016 图 7 示出用于根据说话者属性决定每个说话者的地位的规则 ; 0017 图 8 示出用于根据说话者之间的关系决定属性特征语的优先级的决策树 ; 0018 图 9 表示用于当说话者的每个属性特征语相同时避免属性特征语之间的重叠的 流程图 ; 0019 图 10 表示应用表达转换装置的属性表达模型的流程图 ; 0020 图 11- 图 13 示出应用属性表达模型的例子 ; 0021 图 14 示出其中说话者的每个属性特征语相同并。

11、应用图 9 中的 S906 的情形 ; 0022 图 15 表示属性表达模型构成装置的操作的流程图 ; 0023 图 16 示出属性表达模型构成装置的例子 ; 0024 图 17 示出属性表达模型和扩展属性表达模型的例子。 具体实施方式 0025 一个实施例 0026 一个实施例的表达转换装置在日语表达之间进行转换。 但是目标语言并不限于日 语。该装置可以在相同或不同语言 / 方言的任何语言表达之间进行转换。例如, 通常的目 标语言可包括阿拉伯语、 汉语 (普通话、 粤语) 、 英语、 波斯语、 法语、 德语、 印地语、 印尼语、 意 大利语、 韩语、 葡萄牙语、 俄语和西班牙语中的一种或多种。

12、。 更多的语言可以被列出, 但为了 简化而不列出。 0027 图 1 示出一个实施例的表达转换装置 110。该装置 110 包括输入单元 101、 属性检 测单元102、 表达标准化单元103、 属性调整单元104、 表达转换单元105、 属性表达模型存储 单元 106、 输出单元 107、 属性表达模型检测单元 108 和属性重叠避免单元 109。 0028 单元 101 输入由说话者说出的表达, 作为源表达。单元 101 可以是输入自然语言、 手语和盲文的各种输入设备, 例如麦克风、 键盘, 光学字符识别 (OCR) 、 由例如感应笔等的定 点设备手写的字符和轨迹的识别、 由照相机检测的姿。

13、势的识别等。 0029 单元 101 获取由说话者说出的表达, 作为文本串, 并接收该表达作为源表达。例 如, 单元 101 可以输入由说话者说出的表达 “読? (你读了我的电子邮件 吗? ) ” 。 0030 单元 102 检测说话者的属性 (或用户属性) 和对话场景的属性。 0031 检测说话者属性的方法 0032 该方法通过使用检测属性的规则来根据预定的说话者概略信息检查说话者信息 (姓名、 性别、 年龄、 位置、 职业、 兴趣、 语言等) , 并检测描述说话者的一个或多个属性。 0033 图 2 示出用于根据说话者概略信息检测说话者属性和属性特征语的说话者属性 表。行 201 示出说话。

14、者属性 “青年、 学生、 孩子” 和属性特征语 “口语” 通过概略信息 “大学 说 明 书 CN 103714052 A 4 3/9 页 5 生” 检测。属性特征语是对说话者分配的最适当的文字风格和说话风格的关键词。 0034 在该实施例中, 说话者属性和属性特征语通过从上到下地使用图 2 所示的表来获 取, 并在获取快速时设置为高优先级。 0035 检测场景属性的方法 0036 图 3 示出用于根据对话场景信息检测场景属性的场景属性表。当单元 102 输入例 如 “在家里” 的场景信息作为预定对话场景时, 单元102根据行301检测场景属性 “非正式” 。 0037 单元103通过使用形态分。

15、析、 语法分析、 参照解析等来对由单元101输入的源表达 执行自然语言分析, 并将源语言语句转换为标准化表达 (或条目) 和它的特征向量。标准化 表达表示客观事物。 特征向量表示针对命题的说话者主观认知和话语行为。 在该实施例中, 特征向量被提取为时态、 体态、 语气、 声音等, 单元 103 根据源语言语句划分特征向量, 并产 生标准化表达。 0038 当日语源表达 401“文解析 (语句被分析了) ” 被输入时, 如图 4 所示, 单 元 103 产生标准化表达 405“解析 (分析) ” 和行 403 所示的特征向量 406“被动, 过去 时” 。 0039 在该实施例中, 特征向量根据。

16、图 5 所示的形素字典和语法信息来提取。例如, 参照 图 5 所示的字典, 源表达 404“解析 (被分析了) ” 被分析为 “解析 (分析) 、 (被动语态) 、 (过去时) ” , 并被转换成标准化表达 405“解析 (分析) ” 和特征向量 406“被动, 过去时” 。 0040 分析和转换技术可以使用形素分析、 语法分析等。形素分析可应用于传统的 基于连接成本、 统计语言模式等的分析方法。语法分析可应用于传统的基于 CYK 方法 (Cocke-Younger-Kasami) 、 通用 LR 方法 (从左到右和最右解析) 等的分析方法。 0041 另外, 单元 103 将源表达划分成预定。

17、的短语单元。在该日语例子中, 短语单元被设 为从句, 其包括最多一个内容字和零个或多个功能字。 在日语中, 内容字表示可以独立组成 从句的字, 例如名词、 动词、 形容词等。 在日语中, 功能字是与内容字不同且通常与之相对的 概念, 表示不能独立组成从句的字, 例如, 助词、 助动词等。 0042 在图 4 的情形中, 源表达 401“文解析” 被输出为两个短语, 包括 402“文 ” 和 403“解析” 。 0043 当单元 106 应用条目 (标准化表达) 、 特征向量和属性特征语时, 单元 106 存储所生 成的有关条目的表达 (或衍生) 的规则, 作为属性表达模型。 0044 当图 6。

18、 所示的行 608 包括条目 “見” 、 特征向量 “现在时” 、“兔子特征语 (以兔子 的方式说话) ” 时, 行 608 表示衍生 “見” 的产生规则。日语表达 “” 意味着 当日本年轻女孩想要用日语像兔子一样说话时所说出的字。规则被存储在单元 106 的标准 化字典中。 0045 单元 104 比较多个说话者的属性, 并根据对话场景和说话者之间的相对说话者关 系, 选择优先属性。在该实施例中, 单元 104 包括图 7 所示的规则和图 8 所示的决策树, 并 调整说话者的属性。图 7 示出用于根据说话者属性决定每个说话者的地位的规则。图 8 示 出用于根据说话者之间的相对说话者关系决定属。

19、性特征语的优先级的决策树。 0046 在图 7 中, 行 706 表示当具有属性 “孩子” 的说话者 1 和具有属性 “父母” 的说话 者 2 在场景 “在家里” 中进行对话时, 说话者 1 和说话者 2 的地位是 “平等” 的。 说 明 书 CN 103714052 A 5 4/9 页 6 0047 例如, 当 “大学生” 与他 / 她的父母 “在家里” 进行对话时, 参照图 8 所示的决策树, 说明决定属性特征语的优先级的过程。单元 102 根据图 2 所示的行 201 检测与概略信息 “大学生” 对应的说话者属性 “青年、 学生、 孩子” , 并根据图 3 所示的行 301 检测与场景信。

20、息 “在家里” 对应的场景属性 “非正式” 。因此, 当 “大学生” 与他 / 她的父母 “在家里” 进行对 话时, 选择相对关系 “平等” (S801) , 选择场景属性 “非正式” (S803) , 并选择 “属性特征语” (S807) 。 “属性特征语” 用于转换由 “大学生” 在场景 “在家里” 中所说的源表达。源表达通 过使用图 2 的行 2 中的属性特征语 “口语” 来转换。 0048 当对话中的说话者的说话者属性相同时, 单元104调用单元109。 单元109通过在 说话者属性之间制造不同来避免说话者属性之间的重叠。 0049 图 9 示出当说话者的每个属性特征语相同时避免属性特。

21、征语之间的重叠的流程 图。单元 109 从具有相同属性特征语的对话参与者中选择两个说话者, 并从单元 104 接收 这两个说话者的概略信息。单元 109 估计除了与相同的说话者属性特征语对应的说话者属 性外, 这两个说话者是否被给予了另一个说话者属性。 0050 当这两个说话者被给予了另一个说话者属性时 (S902的 “是” ) , 单元109用与相同 的属性特征语不同的新的属性特征语代替该相同的属性特征语 (S903) 。单元 109 向单元 104 发送替换后的属性特征语, 并结束该过程 (S904) 。 0051 另一方面, 当这两个说话者没有被给予另一个说话者属性时 (S902 的 “。

22、否” ) , 估计 除了与相同的属性特征语对应的说话者属性之外, 这两个说话者中的任意一个是否被给予 了另一个说话者属性 (S905) 。 当这两个说话者中的任意一个被给予了另一个说话者属性时 (S905 的 “是” ) , 该另一个说话者属性被设置成属性特征语, 该过程进行到 S904。 0052 当该过程进行到 S905 的 “否” 时, 这两个说话者之一被给予具有相同属性的另一 组的新属性 (S906) , 该过程进行到 S904。 0053 单元 105 根据由单元 104 调整的说话者属性并参照由单元 106 存储的标准化字 典, 转换说话者的源表达。 0054 例如, 当由属性特征。

23、语是 “口语” 的说话者说出的源表达 “ ? ” 通过属性特征语 “口语” 转换时,“” 通过图 6 的行 613 转换为 “” 。在行 604 中 的条目 “見” 、 特征向量 “过去时” 和属性特征语 “口语” 被转换为 “見” 。 0055 单元 107 输出被单元 105 转换后的表达。该单元可以是显示器单元的图像输出、 打印机单元的打印输出、 语音合成单元的语音输出等。 0056 单元 108 接收由单元 101 输入的源表达、 由单元 102 检测的特征向量和属性特征 语以及源表达被单元 103 处理而得到的标准化表达的条目, 并匹配源表达、 特征向量、 属性 特征语和条目。接着,。

24、 单元 108 提取源表达、 特征向量、 属性特征语和条目作为新的属性表 达模型, 并将新模型登记到单元 106。 0057 另外, 在新的属性表达模型被登记到单元106之前, 单元108包括具有相同词性的 其它内容字条目, 以扩展单元 108 自身。 0058 同时, 当单元 106 已经存储了相同的条目和衍生作为新的扩展属性表达模型时, 如果新的扩展属性表达模型是展开属性表达模式, 则它被重写, 或者如果它不是, 则不被登 记。因此, 聚集用于真实情形的属性表达模型。 0059 在该实施例中, 说明了单个条目及其转换。 尽管并不限于此, 但属性表达模型可通 说 明 书 CN 1037140。

25、52 A 6 5/9 页 7 过转换语法和语义结构来扩展, 例如修饰结构、 语法结构等。例如, 通常在单一语言环境中 用于机器翻译的执行转换方法可以将单个条目的处理扩展成依赖结构的转换。 0060 在该实施例中, 由单元106存储的属性表达模型没有被给予优先级, 单元108中的 提取频率和单元 105 中的应用频率可转换优先级, 并删除低使用频率的属性特征模型。 0061 图 10 表示应用表达转换装置的属性表达模型的流程图。单元 101 输入源表达和 说话者概略信息 (S1001) 。单元 102 根据概略信息检测说话者属性, 并根据对话的场景信 息检测场景属性 (S1002) 。单元 10。

26、3 根据所输入的源表达获取标准化表达 (S1003) 。单元 104 根据说话者概略信息调整多个说话者属性 (S1004) 。单元 105 通过使用说话者属性和 由单元 104 调整的标准化表达来转换源表达 (S1005) 。单元 107 输出由单元转换后的表达 (S1006) 。 0062 第一例子 0063 图 11 示出应用属性表达模型的第一例子。该例子参照图 10 说明。 0064 第一例子是说话者 1“大学生” 和说话者 2“大学教师” 在场景 “上课中” 中进行对 话的例子。 0065 单元 101 接收说话者 1 的对话 “見下? (参见图 11 (c) 的 1101) ” 和说。

27、话者 2 的对话 “見 (参见图 11(c) 的 1102) ” (S1001) 。 0066 单元 102 根据图 2 所示的说话者属性表, 检测 “大学生” 和 “大学教师” 的说话者 属性 (S1002) 。 0067 在该例子中, 从图2的规则201中获取与概略信息 “大学生” 对应的说话者属性 “青 年, 学生, 孩子” 。另一方面, 从规则 202 中获取与概略信息 “大学教师” 对应的说话者属性 “成人, 教师” 。 0068 另外, 从图 3 的规则 302 中检测与场景信息 “上课中” 对应的场景属性 “正式” 。 0069 单元 103 对由单元 101 输入的说话者 1 。

28、的源表达 “見下 ?(参见图 11(c) 的 1101) ” 进行标准化。在源表达 1101 中, 单元 103 用 “” 代替 “ ” , 并用 “見” 代替 “見下” 。结果, 获得表示条目 “見” 和特征 向量 “授受 + 过去时 + 疑问” 的标准化表达 1103。同样, 单元 103 根据说话者 2 的对话 “ ” , 获取表示条目 “見” 和特征向量 “过去时” 的标准化表达 1104。 0070 单元 104 根据图 7 所示的规则, 检测说话者的地位。当说话者的概略信息是 “大学 生” 和 “大学教师” 时, 应用图 7 的规则 702。因此,“大学生” 的地位是 “下级” (。

29、1116) ,“大 学教师” 的地位是 “上级” (1117) 。 0071 然后, 单元104根据图8所示的决策树, 确定在每个说话者的表达被转换时使用的 属性特征语的优先级。 0072 下面的例子示出了图 8 所示的决策树对于图 11 所示说话者 1 使用的情形。图 11 中所示的 1116 和 1117 表示说话者 1 与说话者 2 不平等 (图 8 所示的 S801 的 “否” ) , 过程进 行到 S802。然后, 说话者 1 的地位是 “下级” (图 11 所示的 1116) , 过程进行到 S805。S805 在转换说话者 1 的表达的情况下给出优先级 “敬语, 谦语”(图 11。

30、 所示的 1118) 。同样, S808 在转换说话者 2 的表达的情况下给出优先级 “礼貌” (图 11 所示的 1119) 。 0073 单元 105 根据由单元 104 设置的属性特征语, 转换说话者的源表达 (S1005) 。在图 11 所示的例子中, 单元 105 参考图 6 所示的标准化字典, 根据图 6 所示的规则 607, 将标准 说 明 书 CN 103714052 A 7 6/9 页 8 化表达 1103“見 + 授受 + 过去时 + 疑问” 的一部分 “見” 转换成 “見下 ” , 并获取表达 1107“見下? ” 。 0074 如果单元 104 不存在, 则表达根据图 。

31、2 的规则 201 所示的 “大学生” 的属性特征语 “口语” 来转换。然后, 在转换标准化表达 1103 时, 应用规则 604 和 613。这种情况转换成表 达转换而无需属性调整 1105“見? ” 。这种情况对于在场景 “上课中” 中 “大学生” 对 “大学教师” 的对话中 “大学生” 的表达是不适当的。 0075 单元 107 输出具有属性调整 1107 的表达转换 “見下? ” (S1006) 。 0076 在第一例子中, 单元 104 根据说话者属性和场景属性调整属性。 0077 然而, 场景属性并不是主要的, 单元 104 可仅根据说话者属性调整属性。 0078 以下说明不仅根据。

32、说话者属性而且根据场景属性调整属性的有效情形。当熟悉 的教授之间的对话在例如座谈会的公共场景中进行时, 出现在 “正式” 的场景属性下转换成 “口语” 的问题。但有效情形可以避免这个问题, 因为不仅控制说话者属性, 例如 “上级, 下 级” , 而且控制场景属性 “正式” 。 0079 第二例子 0080 图 12 示出应用属性表达模型的第二例子。该例子参照图 10 说明。 0081 第二例子是说话者 1“大学生” 和说话者 2“父母” 在场景 “在家里” 中进行对话的 例子。单元 101 输入如图 12 所示的源表达 1201 和 1202(图 10 所示的 S1001) 。 0082 单元。

33、 102 根据图 2 所示的说话者属性表, 检测 “大学生” 和 “父母” 的说话者属性。 该例子根据图 2 所示的规则 201 和 203, 将属性 “青年, 学生, 孩子” 给予 “大学生” , 并将属 性 “成人, 父母, 礼貌” 给予 “父母” 。 0083 接着, 单元 102 根据图 3 所示的规则 301, 根据场景信息 “在家里” 检测场景属性 “非正式” 。 0084 单元 103 对输入 1201 “見? ” 进行标准化。输入 1201 被单 元 103 从 “” 替换为 “” , 并从 “見” 替换为 “見” 。因此, 单元 103 获取标准 化表达 1203“ “見 +。

34、 授受 + 过去时 + 疑问” 。同样, 单元 103 将输入 1202“見 ” 标准化为标准化表达 1204“見 + 过去时” 。 0085 单元 104 根据图 7 所示的规则、 检测每个说话者的地位。图 12 所示的 “大学生” 和 “父母” 被应用于图 7 所示的规则 706。 “大学生” 的地位是 “平等” (1216) 。 “父母” 的地位 是 “平等” (1217) 。 0086 然后, 单元104根据图8所示的决策树, 确定在每个说话者的表达被转换时使用的 属性特征语的优先级。下面的例子示出图 8 所示的决策树用于图 12 所示的说话者 1 的情 形。说话者 1 的地位是 “平。

35、等” (1216) , 图 8 所示的 S801 去往 S803。场景属性是 “非正式” (1211) , S803 去往 S807。因此, 转换说话者 1“大学生” 的源表达的优先级属性是属性特征 语, 即, 图 2 的规则 201 所示的 “口语” 。同样, 说话者 2“父母” 的优先级属性是 “礼貌” 。 0087 单元 105 根据由单元 104 设置的优先级属性来转换说话者的源表达。在图 12 所 示的例子中, 单元 105 参考图 6 所示的标准化字典, 根据图 6 的规则 613, 将标准化表达 1203 “見 + 授受 + 过去时 + 疑问” 的一部分 “” 转换为 “” , 。

36、并根据规则 604, 将另一部分 “見” 转换为 “見? ” 。因此, 单元 105 获取表达 1207“見 说 明 书 CN 103714052 A 8 7/9 页 9 ? ” 。 0088 单元 107 输出被单元 105 转换的表达 1207“見? ” 。 0089 在图 11 和图 12 中, 同一个标准化表达 “見 + 授受 + 过去时 + 疑问” 被 转换对应于对话的另一个人。在图 11 中, 1107“見下? ” 根据另 一个说话者 “大学教师” 来转换。在图 12 中, 1207“見? ” 根据另一个 说话者 “父母” 来转换。这样, 该实施例的一个优点是根据另一个说话者和场景。

37、, 将具有相 同属性的说话者的对话转换为适当的表达。 0090 第三例子 0091 图 13 示出应用属性表达模型的第三例子。该例子参照图 9 说明。 0092 第三例子是说话者 1“兔子” 和说话者 2“兔子, 擅长数学” 在场景 “在家里” 中进 行对话的例子。 0093 在这种情形中, 说话者1和说话者2具有相同的说话者属性 “兔子” , 相同的说话者 属性 “兔子” 重叠。说话者 1 或说话者 2 放弃说话者属性 “兔子” , 选择另一个说话者属性, 并根据与所选择的说话者属性对应的属性特征语转换源表达。 0094 当说话者的一个说话者属性相同时, 单元104调用单元109。 单元10。

38、9在具有相同 属性的说话者之间制造不同。单元 109 的处理已经根据图 9 进行了说明。 0095 以下说明图 9 所示的当说话者的每个属性特征语相同时 (例如图 13) 避免属性特 征语之间的重叠的流程图。 0096 在图 13 中, 说话者 1 和说话者 2 具有相同的属性 “兔子” (1318, 1319) , 如果继续, 则说话者 1 和说话者 2 的表达被转换为 “兔子特征语” 。 0097 当说话者 1 和说话者 2 具有相同的属性特征语时, 单元 104 将说话者 1 和说话者 2 的所有属性提供给单元 109。单元 109 根据图 9, 避免说话者 1 和说话者 2 的属性特征。

39、语 之间的重叠。 0098 单元 109 从单元 104 接收具有相同的属性特征语的说话者 1 和说话者 2 的所有概 略信息 (S901) 。说话者 1 的概略信息是 “兔子” , 说话者 2 的概率信息是 “兔子, 擅长数学” 。 S902 确定除了与所重叠的属性特征语对应的概略信息外, 说话者是否被给予了另一个概略 信息。 0099 在该例子中, 说话者 2 除了所重叠的说话者概略信息 “兔子” 外还具有另一个说话 者概略信息 “擅长数学” , 过程进行到 S903。S903 参考图 2 的行 205, 根据概略信息 “擅长数 学” 获取说话者属性和属性特征语 “聪明的” , 并进行到 。

40、S904。S904 将说话者 2 的属性特征 语替换为 “聪明的” (图 13 的 1321) , 将 “聪明的” 发送到单元 104, 过程结束。 0100 图14示出说话者的每个属性特征语是相同的情形, 并应用图9中的S906。 当说话 者属性表示抽象属性时, 例如 “兔子” 、“乐观的” 、“热情的” 和 “聪明的” , 出现说话者 1 和说 话者 2 的属性特征语的重叠。例如, 假定 (1) 组 1, 其中许多说话者具有属性 “兔子” ,(2) 组 2, 其中许多说话者具有属性 “乐观的” ,(3) 组 3, 其中许多说话者具有属性 “悲观的” ,(4) 组 4, 其中许多说话者具有属。

41、性 “聪明的” , 当说话者 1“兔子和乐观的” 和说话者 2“兔子和聪 明的” 在 (1) 组 1 中靠近时, 出现重叠。因此, 第三例子的方法是有效的。 0101 当说话者 1 和说话者 2 在社交网络服务 (SNS) 中不认识各自的 ID 时, 第三例子是 有效的。另外, 该例子在说话者包括三个或多个人时更有效。 说 明 书 CN 103714052 A 9 8/9 页 10 0102 属性表达模型构成装置 111 0103 图 15 表示属性表达模型构成装置的操作的流程图。 0104 单元 101 获取源表达 “S” (S1501) 。单元 102 检测属性特征语 “T” (S1502。

42、) 。单 元 103 分析源表达 “S” , 并获取标准化表达 “Sn” 和属性向量 “Vp” (S1503) 。 0105 单元 108 标准化表达 “Sn” 设置成条目, 使 “Sn” 对应于说话者属性 “C” 、 源表达 “S” 和属性向量 “Vp” , 并提取属性表达模型 “M” (S1504) 。然后, 单元 108 将与 “M” 中的 “Sn” 和 “S” 中的另一个 “Sn” 对应的字替换为具有相同词性的条目 “S11S1n” , 并构建扩展属 性表达模型 “M1Mn” (S1505) 。 0106 单元 108 从 “M” 和 “M1Mn” 中选择不具有相同条目和相同属性的 “。

43、M” (S1506) 。 0107 以下说明一个例子。假定单元 101 输入 “食” 作为源表达 “S”(S1501) 。 假定单元 102 获取 “口语” 作为属性特征语 “T” (S1502) 。单元 103 分析源表达 “S” , 并获 取标准化表达 “Sn” “食” 1604 和属性向量 “Vp” “过去时和口语” 1605, 如图 16 所示 (S1503) 。 0108 单元 108 将 Sn“食” 设置为条目, 将 S“食” 设置为衍生, 使得这 些对应于 T“口语” 和 Vp“过去时和口语” , 并提取 “M” (S1504) 。因此, 新输入的源表达和 标准化表达可对应于属性。

44、向量和属性特征语, 与新属性和输入表达对应的属性表达模型可 以不断增加地构建。 0109 如果 Sn“食” 的词性是 “动词” , 则 S1505 通过替换 “M” 的关于具有词性 “动 词” 的字的条目来构建扩展属性表达模型 “M1Mn” 。 0110 例如, 如果 “見” 的词性是 “动词” , 则 Sn“見” 被设置为条目。用 “見” 替换 了与源表达的条目对应的字的 “見” 被设置为衍生。扩展属性表达模式 M0 通过将 这些对应于 T“口语” 和 Vp“被动, 过去时” 来提取。 0111 对于 “走” , 以类似的方式, Sn“走” 被设置为条目。用 “走” 替换了与源表 达的方向字。

45、对应的字的 “走” 被设置为衍生。扩展属性表达模式 M1 通过将这些 对应于 T“口语” 和 Vp“被动, 过去时” 来提取。M1 后的模型可以同样的方式重复地提取。 0112 S1506 从 “M” 和 “M1Mn” 中选择不具有相同条目和相同属性的 “M” , 并将其存储 在单元 106 中。 0113 如果有三个动词, 即, 图 17 所示的属性表达模型和扩展属性表达模型, 为了简化 说明, 单元 106 的状态与图 6 类似, 属性表达模型 1701 至 1703 都被登记, 因为单元 106 不 存储具有相同条目和相同属性的属性表达模型。因此, 根据真实情形的属性转换模型可以 被存储。

46、。 0114 上述的过程增加并更新由单元 106 存储的属性表达模型。因此, 能够根据各种属 性来转换表达。也就是说, 表达转换装置 110 日益增加地存储各种表达的输入与属性及其 标准化表达之间的不同, 并可对新的输入表达转换各种表达。 0115 根据上述的至少一个实施例的表达转换装置, 该装置能够根据说话者之间的相对 关系调整说话者的属性, 将说话者的输入语句转换成用于另一个说话者的适当表达, 并获 取反映了说话者之间的相对关系的表达。 0116 尽管已经描述了某些实施例, 但这些实施例仅作为例子提出, 并不意味着限定本 发明的范围。 说 明 书 CN 103714052 A 10 9/9。

47、 页 11 0117 例如, 装置 110 的输出结果可被应用于现有的对话装置。现有的对话装置可以是 语音对话装置和文本类型的对话装置。 此外, 对话装置可以被应用于现有的机器翻译装置。 0118 实际上, 在此描述的新颖的实施例可以体现为各种其它形式 ; 另外, 在不脱离本发 明的精神的情况下, 可以在形式上对在此描述的实施例进行各种省略、 替换和修改。 后附的 权利要求及其等同意在覆盖这些形式或修改, 其将落入本发明的范围和精神内。 0119 实施例的流程图表示根据实施例的方法和系统。应当理解, 流程图的每个模块和 流程图中模块的组合可以通过计算机程序指令实现。 这些计算机程序指令可以被加。

48、载到计 算机或其它可编程装置上以产生一种机器, 以使得在计算机或其它可编程装置上执行的指 令创建用于实现流程图模块所规定的功能的装置。 这些计算机程序指令还可存储在非瞬态 计算机可读存储器中, 其可以指导计算机或其它可编程装置以特定的方式工作, 以使得在 非瞬态计算机可读存储器中存储的指令产生一种产品, 其包括实现流程图模块所规定的功 能。计算机程序指令还可以被加载到计算机或其它可编程装置 / 设备上, 以使得操作步骤 / 动作序列在计算机或其它可编程装置上执行, 以产生计算机可编程装置 / 设备, 其提供用 于实现流程图模块所规定的功能的步骤 / 动作。 0120 尽管已经描述了某些实施例, 但这些实施例仅作为例子提出, 并不意味着限定本 发明的范围。实际上, 在此描述的新颖的实施例可以体现为各种其它形式 ; 另外, 在不脱离 本发明的精神的情况下, 可以在形式上。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1