一种智能交互方法、装置及服务器.pdf

摘要
申请专利号：	CN201610979693.2	申请日：	2016.11.08
公开号：	CN106503242A	公开日：	2017.03.15
当前法律状态：	实审	有效性：	审中
法律详情：	实质审查的生效IPC(主分类):G06F 17/30申请日:20161108\|\|\|公开
IPC分类号：	G06F17/30; G06F17/27	主分类号：	G06F17/30
申请人：	上海智臻智能网络科技股份有限公司
发明人：	张泓卿; 朱频频
地址：	201803 上海市嘉定区金沙江西路1555弄398号7层
优先权：
专利代理机构：	北京集佳知识产权代理有限公司 11227	代理人：	张振军;吴敏
PDF下载：	PDF下载

内容摘要

本发明提供一种智能交互方法、装置及服务器，所述方法包括：获取一个或多个会话场景，每个会话场景的界定条件包括两个以上语义信息；在与用户的交互过程中获取问答数据，所述问答数据包括所述用户的请求信息；当所述问答数据包括所述会话场景的界定条件时，确定所述用户所处的会话场景；向所述用户发送与其所处的会话场景对应的反馈信息。所述方法、装置及服务器可以提升反馈的准确性。

权利要求书

1.一种智能交互方法，其特征在于，包括：
获取一个或多个会话场景，每个会话场景的界定条件包括两个以上语义信息；
在与用户的交互过程中获取问答数据，所述问答数据包括所述用户的请求信息；
当所述问答数据包括所述会话场景的界定条件时，确定所述用户所处的会话场景；
向所述用户发送与其所处的会话场景对应的反馈信息。
2.根据权利要求1所述的智能交互方法，其特征在于，还包括：预先设定一个或多个会
话场景，确定每个会话场景的界定条件，每个所述语义信息包括多条语义相同但表述不同
的语句；当所述问答数据包括的一语句与所述语义信息的语义相似度大于预设值时，则判
断所述问答数据包括所述语义信息。
3.根据权利要求1所述的智能交互方法，其特征在于，所述反馈信息包括以下一种或多
种：业务推荐信息、产品推荐信息、广告推荐信息和品牌价值引导信息。
4.根据权利要求1所述的智能交互方法，其特征在于，当根据用户的当前请求信息确定
所述用户所处的会话场景之后，在向所述用户发送与所述当前请求信息对应的答案信息之
后且在获取用户的下一请求信息之前，发送所述反馈信息。
5.根据权利要求1所述的智能交互方法，其特征在于，当确定所述用户所处的会话场景
时，在结束与用户的当前交互过程之后，向所述用户单独发送所述反馈信息。
6.根据权利要求1所述的智能交互方法，其特征在于，还包括：获取所述用户的个人信
息，结合所述个人信息和所述会话场景确定所述反馈信息。
7.根据权利要求1所述的智能交互方法，其特征在于，所述会话场景的界定条件还包
括：地址和/或时间；所述问答数据还包括用户发送所述请求信息的地址和/或时间。
8.根据权利要求1所述的智能交互方法，其特征在于，所述会话场景通过以下方式获
取：
获取多个待处理的会话数据，每个所述待处理的会话数据包含若干个按时间排列的问
句；
对每个所述待处理的会话数据的第一个问句进行语义聚类处理，得到一个或多个第一
分组；分别对属于同一第一分组的每个所述待处理的会话数据的第二个问句进行语义聚类
处理，得到一个或多个第二分组；不断重复上述语义聚类处理的过程，分别对属于同一第i
分组的每个所述待处理的会话数据的第i+1个问句进行语义聚类处理，得到一个或多个第i
+1分组，直至获得满足预设条件的一个或多个叶子分组，其中，i为正整数；
基于语义聚类处理的结果，根据所述叶子分组及对应的所有上级分组按照时间顺序排
列建立所述会话场景，所述会话场景中每个分组为一个语义信息。
9.根据权利要求8所述的智能交互方法，其特征在于，所述预设条件包括：
所述叶子分组及对应的所有上级分组中每个分组所包括的问句的数目大于或等于第
二阈值；
所述叶子分组为第j分组，j大于或等于第三阈值。
10.根据权利要求8或9所述的智能交互方法，其特征在于，所述待处理的会话数据是在
问答日志或/和开放数据中爬取到的。
11.一种智能交互装置，其特征在于，包括：
会话场景获取单元，适于获取一个或多个会话场景，每个会话场景的界定条件包括两
个以上语义信息；
问答数据获取单元，适于在与用户的交互过程中获取问答数据，所述问答数据包括所
述用户的请求信息；
用户会话场景确定单元，适于当所述问答数据包括所述会话场景的界定条件时，确定
所述用户所处的会话场景；
反馈信息发送单元，适于向所述用户发送与其所处的会话场景对应的反馈信息。
12.根据权利要求11所述的智能交互装置，其特征在于，还包括：
会话场景设定单元，适于预先设定一个或多个会话场景，确定每个会话场景的界定条
件，每个所述语义信息包括多条语义相同但表述不同的语句；
所述用户会话场景确定单元还包括：语义判断单元，适于在所述问答数据包括的一语
句与所述语义信息的语义相似度大于预设值时，判断所述问答数据包括所述语义信息。
13.根据权利要求11所述的智能交互装置，其特征在于，所述反馈信息包括以下一种或
多种：业务推荐信息、产品推荐信息、广告推荐信息和品牌价值引导信息。
14.根据权利要求11所述的智能交互装置，其特征在于，所述反馈信息发送单元，适于
在根据用户的当前请求信息确定所述用户所处的会话场景之后，在向所述用户发送与所述
当前请求信息对应的答案信息之后且在获取用户的下一请求信息之前，发送所述反馈信
息。
15.根据权利要求11所述的智能交互装置，其特征在于，所述反馈信息发送单元，适于
当确定所述用户所处的会话场景时，在结束与用户的当前交互过程之后，向所述用户单独
发送所述反馈信息。
16.根据权利要求11所述的智能交互装置，其特征在于，还包括：用户信息获取单元，适
于获取所述用户的个人信息，结合所述个人信息和所述会话场景确定所述反馈信息。
17.根据权利要求11所述的智能交互装置，其特征在于，所述会话场景的界定条件还包
括：地址和/或时间；所述问答数据还包括用户发送所述请求信息的地址和/或时间。
18.根据权利要求11所述的智能交互装置，其特征在于，所述会话场景获取单元，包括：
会话数据获取单元，适于获取多个待处理的会话数据，每个所述待处理的会话数据包
含若干个按时间排列的问句；
叶子分组生成单元，适于对每个所述待处理的会话数据的第一个问句进行语义聚类处
理，得到一个或多个第一分组；分别对属于同一第一分组的每个所述待处理的会话数据的
第二个问句进行语义聚类处理，得到一个或多个第二分组；不断重复上述语义聚类处理的
过程，分别对属于同一第i分组的每个所述待处理的会话数据的第i+1个问句进行语义聚类
处理，得到一个或多个第i+1分组，直至获得满足预设条件的一个或多个叶子分组，其中，i
为正整数；
会话场景建立单元，适于基于语义聚类处理的结果，根据所述叶子分组及对应的所有
上级分组按照时间顺序排列建立所述会话场景，所述会话场景中每个分组为一个语义信
息。
19.根据权利要求18所述的智能交互装置，其特征在于，所述预设条件包括：
所述叶子分组及对应的所有上级分组中每个分组所包括的问句的数目大于或等于第
二阈值；
所述叶子分组为第j分组，j大于或等于第三阈值。
20.根据权利要求18或19所述的智能交互装置，其特征在于，所述待处理的会话数据是
在问答日志或/和开放数据中爬取到的。
21.一种服务器，其特征在于，配置有如权利要求11至19任一项所述的智能交互装置。
22.根据权利要求21所述的服务器，其特征在于，所述待处理的会话数据是在问答日志
或/和开放数据中爬取到的。

说明书

一种智能交互方法、装置及服务器

技术领域

本发明涉及数据处理领域，尤其涉及一种智能交互方法、装置及服务器。

背景技术

随着计算机技术的普及，人们的生活已经逐渐走入智能时代。不仅仅是电脑、手
机、PAD等终端设备，人们的衣食住行等方方面面都开始应用智能交互技术，例如，智能电
视，智能导航，智能家居等。也就是说，智能交互技术将为人们生活的各个方面提供方便、快
捷的服务。

现有的交互系统通常在在接收到用户的输入后，做出与输入对应的反馈，难以精
确发掘用户需求，反馈的准确性较差。

发明内容

本发明解决的技术问题是提升智能交互方法的反馈的准确性。

为解决上述技术问题，本发明实施例提供一种智能交互方法，包括：获取一个或多
个会话场景，每个会话场景的界定条件包括两个以上语义信息；在与用户的交互过程中获
取问答数据，所述问答数据包括所述用户的请求信息；

当所述问答数据包括所述会话场景的界定条件时，确定所述用户所处的会话场
景；向所述用户发送与其所处的会话场景对应的反馈信息。

可选的，所述智能交互方法还包括：预先设定一个或多个会话场景，确定每个会话
场景的界定条件，每个所述语义信息包括多条语义相同但表述不同的语句；当所述问答数
据包括的一语句与所述语义信息的语义相似度大于预设值时，则判断所述问答数据包括所
述语义信息。

可选的，所述反馈信息包括以下一种或多种：业务推荐信息、产品推荐信息、广告
推荐信息和品牌价值引导信息。

可选的，当根据用户的当前请求信息确定所述用户所处的会话场景之后，在向所
述用户发送与所述当前请求信息对应的答案信息之后且在获取用户的下一请求信息之前，
发送所述反馈信息。

可选的，当确定所述用户所处的会话场景时，在结束与用户的当前交互过程之后，
向所述用户单独发送所述反馈信息。

可选的，所述智能交互方法还包括：获取所述用户的个人信息，结合所述个人信息
和所述会话场景确定所述反馈信息。

可选的，所述会话场景的界定条件还包括：地址和/或时间；所述问答数据还包括
用户发送所述请求信息的地址和/或时间。

可选的，所述会话场景通过以下方式获取：获取多个待处理的会话数据，每个所述
待处理的会话数据包含若干个按时间排列的问句；对每个所述待处理的会话数据的第一个
问句进行语义聚类处理，得到一个或多个第一分组；分别对属于同一第一分组的每个所述
待处理的会话数据的第二个问句进行语义聚类处理，得到一个或多个第二分组；不断重复
上述语义聚类处理的过程，分别对属于同一第i分组的每个所述待处理的会话数据的第i+1
个问句进行语义聚类处理，得到一个或多个第i+1分组，直至获得满足预设条件的一个或多
个叶子分组，其中，i为正整数；基于语义聚类处理的结果，根据所述叶子分组及对应的所有
上级分组按照时间顺序排列建立所述会话场景，所述会话场景中每个分组为一个语义信
息。

可选的，所述预设条件包括：所述叶子分组及对应的所有上级分组中每个分组所
包括的问句的数目大于或等于第二阈值；所述叶子分组为第j分组，j大于或等于第三阈值。

可选的，所述待处理的会话数据是在问答日志或/和开放数据中爬取到的。

本发明实施例还提供一种智能交互装置，包括：会话场景获取单元，适于获取一个
或多个会话场景，每个会话场景的界定条件包括两个以上语义信息；问答数据获取单元，适
于在与用户的交互过程中获取问答数据，所述问答数据包括所述用户的请求信息；用户会
话场景确定单元，适于当所述问答数据包括所述会话场景的界定条件时，确定所述用户所
处的会话场景；反馈信息发送单元，适于向所述用户发送与其所处的会话场景对应的反馈
信息。

可选的，所述智能交互装置，还包括：会话场景设定单元，适于预先设定一个或多
个会话场景，确定每个会话场景的界定条件，每个所述语义信息包括多条语义相同但表述
不同的语句；所述用户会话场景确定单元还包括：语义判断单元，适于在所述问答数据包括
的一语句与所述语义信息的语义相似度大于预设值时，判断所述问答数据包括所述语义信
息。

可选的，所述反馈信息包括以下一种或多种：业务推荐信息、产品推荐信息、广告
推荐信息和品牌价值引导信息。

可选的，所述反馈信息发送单元，适于在根据用户的当前请求信息确定所述用户
所处的会话场景之后，在向所述用户发送与所述当前请求信息对应的答案信息之后且在获
取用户的下一请求信息之前，发送所述反馈信息。

可选的，所述反馈信息发送单元，适于当确定所述用户所处的会话场景时，在结束
与用户的当前交互过程之后，向所述用户单独发送所述反馈信息。

可选的，所述智能交互装置还包括：用户信息获取单元，适于获取所述用户的个人
信息，结合所述个人信息和所述会话场景确定所述反馈信息。

可选的，所述会话场景的界定条件还包括：地址和/或时间；所述问答数据还包括
用户发送所述请求信息的地址和/或时间。

可选的，所述会话场景获取单元，包括：会话数据获取单元，适于获取多个待处理
的会话数据，每个所述待处理的会话数据包含若干个按时间排列的问句；叶子分组生成单
元，适于对每个所述待处理的会话数据的第一个问句进行语义聚类处理，得到一个或多个
第一分组；分别对属于同一第一分组的每个所述待处理的会话数据的第二个问句进行语义
聚类处理，得到一个或多个第二分组；不断重复上述语义聚类处理的过程，分别对属于同一
第i分组的每个所述待处理的会话数据的第i+1个问句进行语义聚类处理，得到一个或多个
第i+1分组，直至获得满足预设条件的一个或多个叶子分组，其中，i为正整数；会话场景建
立单元，适于基于语义聚类处理的结果，根据所述叶子分组及对应的所有上级分组按照时
间顺序排列建立所述会话场景，所述会话场景中每个分组为一个语义信息。

可选的，所述待处理的会话数据是在问答日志或/和开放数据中爬取到的。

本发明实施例还提供一种服务器，配置有如权利要求11至19任一项所述的智能交
互装置。

可选的，所述待处理的会话数据是在问答日志或/和开放数据中爬取到的。

与现有技术相比，本发明实施例的技术方案具有以下有益效果：

在本发明实施例中，通过获取一个或多个会话场景，当与用户交互过程中的问答
数据是否包括述会话场景的界定条件时，确定所述用户所处的会话场景，并向所述用户发
送与其所处的会话场景对应的反馈信息。由于每个会话场景的界定条件包括两个以上语义
信息，当所述问答数据包括所述会话场景的界定条件时，可以确定用户所处的会话场景为
相应的会话场景，从而可以更为精确地发掘用户的需求，进而可以做出更符合用户需求的
反馈。

附图说明

图1是本发明实施例中一种智能交互方法的流程图；

图2是本发明实施例中一种获取会话场景的方法的流程图；

图3是本发明实施例中一种语义聚类过程对应的树结构的示意图；

图4是本发明实施例中一种智能交互装置的结构示意图；

图5是图4中会话场景获取单元的一种具体实现的结构示意图。

具体实施方式

如前所述，现有的交互系统通常在在接收到用户的输入后，做出与输入对应的反
馈，难以精确发掘用户需求，反馈的准确性较差。

在智能交互领域中，针对用户需求在做出与用户输入的回答之外，向用户进行反
馈，以发送针对性的信息的需求越来越多。这通常需要发掘用户需求，仅仅根据用户的某次
输入进行反馈的精确性较差。

在本发明实施例中，通过获取一个或多个会话场景，在与用户的交互过程中获取
问答数据，并判断问答数据是否包括会话场景的界定条件，当所述问答数据包括所述会话
场景的界定条件时，确定所述用户所处的会话场景。由于会话场景中的界定条件包括两个
以上语义信息，故会话场景相比用户的单条问句可以更准确的反应用户需求，从而可以通
过判断问答数据是否包含会话场景的界定条件，对用户需求进行区分，进而可以根据会话
场景，对用户进行更加准确的进行反馈。

为使本发明的上述目的、特征和有益效果能够更为明显易懂，下面结合附图对本
发明的具体实施例做详细的说明。

图1是本发明实施例中一种智能交互方法的流程图。

在步骤S11中，获取一个或多个会话场景，每个会话场景的界定条件包括两个以上
语义信息。

会话场景可以是反应用户实际需求的场景，获取一个或多个会话场景可以是从实
际的会话中获取。实际的会话可以来源于智能交互系统的已有数据，或者相应领域的电商、
垂直网站(例如京东，汽车之家，苏宁)以及贴吧等开放数据中爬取的。会话场景中包含的两
个以上的语义信息可以是通过对多个实际的会话进行语义聚类处理得到。

通过聚类处理得到的会话场景中，语义信息可以是有时间顺序的，也可以是无时
间顺序的。

获取一个或多个会话场景也可以是获取预先设定的一个或多个会话场景，预先设
定的会话场景中包含所述界定条件。

在步骤S12中，在与用户的交互过程中获取问答数据，所述问答数据包括所述用户
的请求信息。

问答数据可以是用户与智能系统进行交互时的数据，其中来自用户的请求信息通
常被称为问句，来自智能系统的语句通常被称为答句。本发明实施例中的问答数据与用户
具有对应关系，例如可以是对应于某个ID的问答数据，也可以是在同一交互过程中的问答
数据，或者利用页面进行交互时，可以是同一页面的问答数据。

在步骤S13中，当所述问答数据包括所述会话场景的界定条件时，确定所述用户所
处的会话场景。

可以在每次接收到新的请求信息后，将问答数据中的请求信息与所述语义信息进
行比较，直至确定问答数据中包括一个或多个会话场景中任一个会话场景的界定条件。

当确定问答数据包括会话场景界定条件中一语义信息后，对后续的请求信息，可
以仅判断是否包括该语义信息以外的其他界定条件，直至确定问答数据中包括一个或多个
会话场景中任一个会话场景的界定条件，以确定所述用户所处的会话场景。

确定所述用户所处的会话场景可以是从获取到的一个或多个会话场景中确定。

在步骤S14中，向所述用户发送与其所处的会话场景对应的反馈信息。

在具体实施中，所述反馈信息包括以下一种或多种：业务推荐信息、产品推荐信
息、广告推荐信息和品牌价值引导信息。

在一具体实现中，每个所述语义信息可以包括多条语义相同但表述不同的语句，
例如一条语义信息可以包括：“XX品牌好不好”、“XX品牌怎么样”、“XX品牌值得购买吗”等语
句。

当所述问答数据包括的一语句与所述语义信息的语义相似度大于或等于预设值
时，则判断所述问答数据包括所述语义信息。

沿用上例，当问答数据包括语句“XX品牌好吗”时，若经判断，该语句与所述语义信
息的语义相似度大于或等于预设值，则可以确定问答数据包括所述语义信息。

在另一具体实现中，也可以对会话场景中界定条件包括的每个语义信息进行相似
语句拓展，比较用户问答数据中的语句与语义信息包含的语句与拓展后的语句，当所述问
答数据中语句和语义信息包含的语句与拓展后的语句中任一语句相似度大于或等于预设
值，则判定当所述问答数据包括所述语义信息。

当会话场景的界定条件仅包含两个以上的语义信息时，若用户的问答数据中包含
界定条件中的每个语义信息，则可以确定问答数据包括所述会话场景的界定条件，进而可
以确定用户处于该会话场景，并向所述用户发送与其所处的会话场景对应的反馈信息。

例如，一个会话场景的界定条件中的语义信息包括如下语句：“XX品牌手机怎么
样”“屏幕碎了怎么办”，与会话场景对应的反馈信息为XX手机屏幕保险的内容。

可以对“XX品牌手机怎么样”以及“屏幕碎了怎么办”分别进行语义扩展，以使得语
义信息包括更多的同义语句。

当每次接收到用户的请求信息后，可以判断请求信息与语义信息中的语句的相似
度是否大于预设值。

假设交互过程中用户的问答数据依次为：“XX品牌手机好吗”“屏幕碎了”“XX手机
能换新吗”。

在经判断，问答数据中请求信息“XX品牌手机好吗”包含“XX品牌手机怎么样”对应
的语义信息，则对后续接收到的请求信息，可以仅判断请求信息是否包括另一语义信息，也
即“屏幕碎了怎么办”对应的语义信息。

当接收到“屏幕碎了”时，经判断认为所述问答数据包括该会话场景的界定条件，
则可以向用户发送XX手机屏幕保险的内容。

具体地，可以在对用户的请求信息“屏幕碎了”进行回应后，例如，向用户发送XX手
机售后途径后，向用户发送XX手机屏幕保险的内容；也可以在与用户当前的交互过程结束
后，也即在对“XX手机能换新吗”进行回应后，向用户发送XX手机屏幕保险的内容。

可以看出，在具体实施中，当根据用户的当前请求信息确定所述用户所处的会话
场景之后，可以在向所述用户发送与所述当前请求信息对应的答案信息之后且在获取用户
的下一请求信息之前，发送所述反馈信息。

确定所述用户所处的会话场景时，也可以在结束与用户的当前交互过程之后，向
所述用户单独发送所述反馈信息。

在具体实施中，还可以获取所述用户的个人信息，结合所述个人信息和所述会话
场景确定所述反馈信息。

相应地，一个会话场景可以对应多种反馈信息中，不同的反馈信息可以对应于不
同的个人信息，例如，在一个会话场景的对应反馈信息中，可以有根据性别进行划分的反馈
信息、根据年龄段进行划分的反馈信息、和/或根据兴趣偏好进行划分的反馈信息等。

在一具体实现中，所述会话场景的界定条件还包括：地址和/或时间；所述问答数
据还包括用户发送所述请求信息的地址和/或时间。如：会话场景的界定条件包括两个，一
个为地址，另一个为“屏幕碎了怎么办”的语义信息，此时的地址也作为一个语义信息。

由于对应不同地址的用户，其需求可能差异较大，另外，反馈信息可以是有时效性
的信息，故可以结合地址和/或时间界定会话场景，以更加精确的定位用户需求并进行反馈
信息的发送。

参见图2，在一具体实现中，会话场景可以通过步骤S21至S23获取。

在步骤S21中，获取多个待处理的会话数据，每个所述待处理的会话数据包含若干
个按时间排列的问句。

在具体实施中，按照目标领域，可以采用多种方式获取所述待处理的会话数据。比
如，可以从领域日志中爬取所述待处理的会话数据，还可以从相应领域的电商、垂直网站
(例如京东，汽车之家，苏宁)以及贴吧等开放数据中爬取所述待处理的会话数据。

需要说明的是，在具体实施中，所获取的每个待处理的会话数据中，问句的数目可
以相同，也可以不同，具体不受限制。在从领域日志及开放数据中获取所述待处理的会话数
据时，可以先对爬取的会话数据进行筛选，将筛选出的会话数据作为所述待处理的会话数
据。比如，可以将爬取的会话数据中问句的数目大于或等于第一阈值的会话数据作为所述
待处理的会话数据，其中，所述第一阈值可以根据实际情况进行设置。

例如，待处理的会话数据可以包括如下四个问句：

Q1:什么是安吉星

Q2:好用么

Q3:多少钱

Q4:跟安捷星比有什么优点

在步骤S22中，对每个所述待处理的会话数据进行聚类处理，以得到叶子分组及对
应的所有上级分组。

具体地，对每个所述待处理的会话数据的第一个问句进行语义聚类处理，得到一
个或多个第一分组；分别对属于同一第一分组的每个所述待处理的会话数据的第二个问句
进行语义聚类处理，得到一个或多个第二分组；不断重复上述语义聚类处理的过程，分别对
属于同一第i分组的每个所述待处理的会话数据的第i+1个问句进行语义聚类处理，得到一
个或多个第i+1分组，直至获得满足预设条件的一个或多个叶子分组，其中，i为正整数。

在具体实施中，可以采用多种方式对各个问句进行语义聚类处理。比如，可以通过
计算各个问句之间的语义相似度，并在语义相似度的值大于一定阈值时，将相应问句作为
一个聚类。

上述语义聚类过程可以形成一树结构，每个分组表示一个聚类结果并作为该树结
构的一个结点。其中，第一分组为该树结构的第一个层次中的结点，第二分组为该树结构的
第二个层次中的结点，第i分组为该树结构的第i个层次中的结点，第i+1分组为该树结构的
第i+1个层次中的结点。每一层次所包含的分组的数目可以相同，也可以不同。所述叶子分
组为该树结构的叶子结点，也叫终端结点。除叶子分组外，每个分组都有子结点。所述叶子
分组所在分支的其它结点，也就是与所述叶子分组位于同一分支的所有上级分组为所述叶
子分组的祖先分组。

在本发明的一实施例中，所述预设条件可以包括：所述叶子分组及对应的所有上
级分组中每个分组所包括的问句的数目大于或等于第二阈值；所述叶子分组位于第j分组，
j大于或等于第三阈值。

在具体实施中，所述第二阈值及第三阈值可以根据实际情况进行设置，比如，所述
第二阈值可以为2，所述第三阈值为3。在所述语义聚类处理的过程中，通过所述预设条件可
以获得所述叶子分组。

为了描述方便，以第i分组表示语义聚类过程中获得的任一分组为例，在具体实施
中，既可以在对各待处理的会话数据的全部问句进行语义聚类处理，获得对应树结构的全
部终端结点后，再从所述全部终端结点中筛选出符合预设条件的终端结点；也可以在每获
得一第i分组后，即通过所述预设条件对所获得的第i分组进行判断，并在满足所述预设条
件后继续后续流程，否则删除该第i分组。

比如，当所述第i分组非终端结点时，若第i分组中问句的数目大于第二阈值，则对
属于同一第i分组的每个所述待处理的会话数据的第i+1个问句进行语义聚类处理，得到一
个或多个第i+1分组。当所述第i分组为终端结点时，若i大于或等于第三阈值，则所述第i分
组为满足所述预设条件的叶子分组，否则删除该第i分组。由此，语义聚类处理结束后，所获
得的终端结点均为满足所述预设条件的叶子分组。

参照图3，下面以获取5个待处理的会话数据s1，s2，s3，s4及s5，所述第二阈值为2，
所述第三阈值为4为例，对上述语义聚类处理过程进行详细说明。其中，每个待处理的会话
数据包括的问句如下：

s1＝{Q11，Q12，Q13，Q14}，

s2＝{Q21，Q22，Q23，Q24}，

s3＝{Q31，Q32，Q33，Q34，Q35}，

s4＝{Q41，Q42，Q43，Q44，Q45}，

s5＝{Q51，Q52，Q53，Q54，Q55}。

首先，对s1～s5中的第一个问句{Q11，Q21，Q31，Q41，Q51}进行聚类，得到一个第一
分组Z1＝{Q11，Q21，Q31，Q41，Q51}。第一分组Z1位于对应树结构的第一个层次L1。

接着，对s1～s5中的第二个问句{Q12，Q22，Q32，Q42，Q52}进行聚类，得到两个第二
分组Z21＝{Q12，Q32，Q42，Q52}，Z22＝{Q22}。第二分组Z21及Z22位于对应树结构的第二个
层次L2。此时，由于第二分组Z22中仅存在Q22这一个问句(即该分组中包括的问句的数目小
于第二阈值)，故删除第二分组Z22。

然后，对s1、s3、s4及s5中的第三个问句进行聚类，得到两个第三分组Z31＝{Q13，
Q33}，Z32＝{Q43，Q53}。第三分组Z31及Z32位于对应树结构的第三个层次L3。

接着，对s1及s3中的第四个问句进行聚类，得到一个第四分组Z41＝{Q14，Q34}。对
s4及s5的第四个问句进行聚类，得到两个第四分组Z42及Z43，其中，Z42＝{Q44}，Z43＝
{Q54}。第四分组Z41、Z42及Z43位于对应树结构的第四个层次L4。

其中：由于待处理的会话数据s1仅存在4个问句，第四分组Z41所在的分组数等于
第三阈值，并且第四分组Z41中问句的数目等于第二阈值，第四分组Z41的各上级分组中包
括的问句数目均大于或等于第二阈值，因此，所述第四分组Z41为满足所述预设条件的叶子
分组。而Z42及Z43中仅存在一个问句，即Z42及Z43中问句的数目小于第二阈值，故删除Z42
及Z43。另外，由于Z32所在的分组数小于第三阈值，故删除第三分组Z32。

最后，将s3中的第五个问句Q35单独聚为一类，得到第五分组Z5＝{Q35}。第五分组
Z5位于对应树结构的第五个层次L5。由于与第五分组Z5位数目中所包含的问句数目小于第
二阈值，故删除第五分组Z5。

最终得到的满足所述预设条件的叶子分组为Z41。

继续参见图2，在步骤S23中，基于语义聚类处理的结果，根据所述叶子分组及对应
的所有上级分组按照时间顺序排列建立所述会话场景，所述会话场景中每个分组为一个语
义信息。

在具体实施中，根据每个所述叶子分组及对应的所有上级分组，也就是根据所述
叶子分组及其祖先分组(后续将所有的上级分组称为祖先分组)，可以采用多种方式建立相
应的场景会话序列。

在本发明的一实施例中，可以直接从所述叶子分组及对应的所有上级分组中分别
选取一问句，将所选取的问句按照时间顺序排列作为对应的场景会话序列。其中，从每个分
组中选取问句可以为该分组中的任意问句，由于该分组中各问句之间的语义相似，因此，无
论从该分组中选取问句的结果如何，均不会对该场景序列对应的知识点产生较大的影响。

例如，对于叶子分组Z41及其祖先分组Z31、Z21及Z1，对应的场景会话序列可以为
{Q11，Q12，Q13，Q14}，也可以为{Q11，Q21，Q33，Q34}。

在本发明的另一实施例中，所述场景会话序列可以包括：标准问句及扩展问句。其
中，所述标准问句即按照常用形式表现的问句，所述扩展问句即与标准问句相同语义但形
式不同的问句。比如，标准问句为“这支笔多少钱”时，对应的扩展问句可以包括“这支笔的
价格是多少”、“这支笔的价格怎么样”及“这支笔的市场价是多少”。

根据每个所述叶子分组及对应的所有上级分组，也就是根据所述叶子分组及其祖
先分组建立相应的场景会话序列时，可以分别将所述叶子分组的语义及所述叶子分组对应
的所有上级分组的语义按照时间顺序排列作为对应的场景会话序列的标准问句，而将所述
叶子分组及对应的所有上级分组中不同于所述语义的问句作为对应标准问句的扩展问句。

比如，对于叶子分组Z41及其祖先分组Z31、Z21及Z1，建立对应的场景会话序列时，
可以分别将Z41、Z31、Z21及Z1的语义作为该场景会话序列的标准问句，而将Q14及Q34作为
Z41对应的标准问句的扩展问句，将Q13及Q33作为Z31对应的标准问句的扩展问句，将Q12、
Q32、Q42及Q52作为Z21对应的标准问句的扩展问句，将Q11、Q21、Q31、Q41及Q51作为Z1对应
的标准问句的扩展问句。

可以理解的是，如图2所示的获取会话场景的方法，得到的会话场景的界定条件中
包含的各个语义信息之间可以是有时间顺序的。对应的，在判断答数据是否包括所述会话
场景的界定条件时，应当是按照语义的顺序依次进行判断。

如前所述，会话场景的界定条件中包含的各个语义信息之间也可以是无时间顺序
的，若会话场景的界定条件中包含的各个语义信息之间无时间顺序，则在判断答数据是否
包括所述会话场景的界定条件时，问答数据中的请求信息可以以任意的顺序与界定条件中
的语义信息进行匹配，直至确定所述用户所处的会话场景。

故会话场景中语义信息之间的顺序可以在判断答数据是否包括所述会话场景的
界定条件的过程中体现，如图2所示的获取会话场景的方法得到的会话场景也可以作为语
义信息之间无时间顺序的会话场景应用。

本发明实施例还提供一种智能交互装置，其结构示意图参见图4，具体可以包括：

会话场景获取单元41，适于获取一个或多个会话场景，每个会话场景的界定条件
包括两个以上语义信息；

问答数据获取单元42，适于在与用户的交互过程中获取问答数据，所述问答数据
包括所述用户的请求信息；

用户会话场景确定单元43，适于当所述问答数据包括所述会话场景的界定条件
时，确定所述用户所处的会话场景；

反馈信息发送单元44，适于向所述用户发送与其所处的会话场景对应的反馈信
息。

在具体实施中，智能交互装置还可以包括会话场景设定单元45，适于预先设定一
个或多个会话场景，确定每个会话场景的界定条件，每个所述语义信息包括多条语义相同
但表述不同的语句；

所述用户会话场景确定单元43还包括：语义判断单元(图未示)，适于在所述问答
数据包括的一语句与所述语义信息的语义相似度大于预设值时，判断所述问答数据包括所
述语义信息。

在具体实施中，所述反馈信息包括以下一种或多种：业务推荐信息、产品推荐信
息、广告推荐信息和品牌价值引导信息。

在一具体实现中，所述反馈信息发送单元44，适于在根据用户的当前请求信息确
定所述用户所处的会话场景之后，在向所述用户发送与所述当前请求信息对应的答案信息
之后且在获取用户的下一请求信息之前，发送所述反馈信息。

在另一具体实现中，所述反馈信息发送单元44，适于当确定所述用户所处的会话
场景时，在结束与用户的当前交互过程之后，向所述用户单独发送所述反馈信息。

在具体实施中，所述智能交互装置还可以包括：用户信息获取单元46，适于获取所
述用户的个人信息，结合所述个人信息和所述会话场景确定所述反馈信息。

在具体实施中，所述会话场景的界定条件还包括：地址和/或时间；所述问答数据
还包括用户发送所述请求信息的地址和/或时间。

参见图5，在具体实施中，所述会话场景获取单元41可以包括：

会话数据获取单元51，适于获取多个待处理的会话数据，每个所述待处理的会话
数据包含若干个按时间排列的问句；

叶子分组生成单元52，适于对每个所述待处理的会话数据的第一个问句进行语义
聚类处理，得到一个或多个第一分组；分别对属于同一第一分组的每个所述待处理的会话
数据的第二个问句进行语义聚类处理，得到一个或多个第二分组；不断重复上述语义聚类
处理的过程，分别对属于同一第i分组的每个所述待处理的会话数据的第i+1个问句进行语
义聚类处理，得到一个或多个第i+1分组，直至获得满足预设条件的一个或多个叶子分组，
其中，i为正整数；

会话场景建立单元53，适于基于语义聚类处理的结果，根据所述叶子分组及对应
的所有上级分组按照时间顺序排列建立所述会话场景，所述会话场景中每个分组为一个语
义信息。

在具体实施中，所述预设条件可以包括：

所述叶子分组及对应的所有上级分组中每个分组所包括的问句的数目大于或等
于第二阈值；

所述叶子分组为第j分组，j大于或等于第三阈值。

在具体实施中，所述待处理的会话数据可以是在问答日志或/和开放数据中爬取
到的。

本发明实施例中智能交互装置涉及的名词及各个单元的工作原理可以参照智能
交互方法，在此不再赘述。

具体地，所述智能交互装置可以是问答机器人、手机等电子设备。

本发明实施例中智能交互装置可以利用通用处理器、数字信号处理器(DSP)、专用
集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立的门或晶体管逻
辑、分立的硬件组件、或其设计成执行本文所描述功能的任何组合来实现或执行。

通用处理器可以是微处理器，但在替换方案中，该处理器可以是任何常规的处理
器、控制器、微控制器、或状态机。处理器还可以被实现为计算设备的组合，例如DSP与微处
理器的组合、多个微处理器、与DSP核心协作的一个或多个微处理器、或任何其他此类配置。

本发明实施例还提供一种服务器，配置有所述智能交互装置。服务器可以是单台
服务器或服务器集群。

与现有业务推荐技术比较而言，语义的理解和用户场景的判断信息与内容更加符
合用户自发意愿，更能体现交互时用户真实的需求内容。当前的关键词对业务需求准确率
匹配极低，用户属性分类固定但忽略特定场景下的具体需求，用户使用行为有更多随机性、
非关联性和信息干扰。

因本发明对用户需求判定的精准度较高，除去单独建立对话系统外，本发明可以
完全并行于现有的电商客服、人机交互、对话咨询系统。也可以仅应用于业务推荐。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可
以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储
介质可以包括：ROM、RAM、磁盘或光盘等。

虽然本发明披露如上，但本发明并非限定于此。任何本领域技术人员，在不脱离本
发明的精神和范围内，均可作各种更动与修改，因此本发明的保护范围应当以权利要求所
限定的范围为准。