用于在消息交互环境中跟踪消息话题的方法和设备.pdf

上传人:GAME****980 文档编号:4288512 上传时间:2018-09-13 格式:PDF 页数:24 大小:752.36KB
返回 下载 相关 举报
摘要
申请专利号:

CN201110047636.8

申请日:

2011.02.28

公开号:

CN102651719A

公开日:

2012.08.29

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):H04L 12/58申请日:20110228|||公开

IPC分类号:

H04L12/58; H04L29/08

主分类号:

H04L12/58

申请人:

国际商业机器公司

发明人:

蔡柯柯; 郭宏蕾; 祝慧佳; 苏中

地址:

美国纽约

优先权:

专利代理机构:

中国国际贸易促进委员会专利商标事务所 11038

代理人:

邹姗姗

PDF下载: PDF下载
内容摘要

本发明提供了一种用于在包括多条消息的消息交互环境下通过结合与一消息相关联的关联消息而对该消息所涉及的话题进行跟踪的方法和设备。该方法包含:从所述消息交互环境所包括的多条消息中选取消息;从所述消息交互环境所包括的多条消息中,识别与所选取的消息相关联的关联消息;以及基于所识别的关联消息,将所选取的消息划归一个或多个话题组。本发明的话题跟踪方法和设备能够在诸如微博客的消息交互环境中准确地确定消息之间的相似度,由此进行话题跟踪。

权利要求书

1.一种用于在消息交互环境中跟踪消息话题的方法,所述消息交互环境中包括多条消息,所述方法包含:从所述消息交互环境所包括的多条消息中选取消息;从所述消息交互环境所包括的多条消息中,识别与所选取的消息相关联的关联消息;以及基于所识别的关联消息,将所选取的消息划归一个或多个话题组。2.根据权利要求1所述的方法,所述基于所识别的关联消息将所选取的消息划归一个或多个话题组包含:从所识别的关联消息中提取一个或多个背景话题关键字;通过处理所提取的背景话题关键字,生成一个或多个话题关键字;以及将所选取的消息划归与所生成的一个或多个话题关键字分别对应的一个或多个话题组。3.根据权利要求2所述的方法,其中所述识别与所选取的消息相关联的关联消息包含:将与所选取的消息具有回复或转发关系的消息,识别为与所选取的消息相关联的关联消息。4.根据权利要求3所述的方法,所述通过处理所提取的背景话题关键字,生成一个或多个话题关键字包含:从所选取的消息中提取一个或多个核心话题关键字;以及通过组合所提取的核心话题关键字和所提取的背景话题关键字,生成一个或多个话题关键字。5.根据权利要求2所述的方法,其中所述识别与所选取的消息相关联的关联消息包含:识别与所选取的消息相关联的交互操作用户;和从与所述交互操作用户相对应的消息中,识别与所选取的消息具有回复或转发关系的消息,作为与所选取的消息相关联的关联消息。6.根据权利要求5所述的方法,所述通过处理所提取的背景话题关键字,生成一个或多个话题关键字包含:确定所提取的背景话题关键字与交互操作用户的对应关系;以及利用所确定的对应关系,生成一个或多个话题关键字。7.根据权利要求3或5所述的方法,其中,所述与所选取的消息具有回复或转发关系的消息包括以下中的至少一种:对所选取的消息进行回复或转发的消息;所选取的消息对其进行回复或转发的消息;以及对经所选取的消息回复或转发的消息进行回复或转发的消息。8.根据权利要求5所述的方法,其中所述识别与所述选取的消息相关联的交互操作用户进一步包含:确定用户级别;将所确定的用户级别与预先设定的级别阈值进行比较;以及将级别高于该预先设定的级别阈值的用户识别为与所选取的消息相关联的交互操作用户。9.根据权利要求5所述的方法,其中所述识别与所选取的消息相关联的交互操作用户进一步包含:确定所要追踪的话题的预定话题领域;获取用户的话题偏好;将所获取的用户的话题偏好与所确定的预定话题领域进行比较;以及将话题偏好与所述预定话题领域匹配的用户识别为与所选取的消息相关联的交互操作用户。10.根据权利要求1所述的方法,其中所述识别与所选取的消息相关联的关联消息进一步包含:将与所选取的消息具有回复或转发关系的消息,识别为与所选取的消息相关联的第一关联消息;和识别与所选取的消息相关联的交互操作用户,以及从与所述交互操作用户相对应的消息中,识别与所选取的消息具有回复或转发关系的消息,作为与所选取的消息相关联的第二关联消息,并且,所述基于所识别的关联消息将所选取的消息划归一个或多个话题组进一步包含:从所选取的消息中提取一个或多个第一核心话题关键字,以及从所识别的第一关联消息中提取一个或多个第一背景话题关键字;通过组合所提取的第一核心话题关键字和所提取的第一背景话题关键字,生成一个或多个第一话题关键字;基于所生成的第一话题关键字,获得对所选取的消息的第一话题分类结果;通过参考所识别的第二关联消息与交互操作用户的对应关系,从所识别的第二关联消息中提取一个或多个第二背景话题关键字;基于所提取的第二背景话题关键字,获得对所选取的消息的第二话题分类结果;以及组合并分析所述第一话题分类结果和所述第二话题分类结果,以生成经整合的话题分类结果。11.一种用于在消息交互环境中跟踪消息话题的设备,所述消息交互环境中包括多条消息,所述设备包含:消息选取装置,用于从所述消息交互环境所包括的多条消息中选取消息;关联消息识别装置,用于从所述消息交互环境所包括的多条消息中,识别与所述消息选取装置选取的消息相关联的关联消息;以及划分装置,用于基于所述关联消息识别装置识别出的关联消息,将所述消息选取装置选取的消息划归一个或多个话题组。12.根据权利要求11所述的设备,所述划分装置包含:用于从所识别的关联消息中提取一个或多个背景话题关键字的装置;用于通过处理所提取的背景话题关键字,生成一个或多个话题关键字的装置;以及用于将所选取的消息划归与所生成的一个或多个话题关键字分别对应的一个或多个话题组的装置。13.根据权利要求12所述的设备,其中,所述关联消息识别装置包含:用于将与所选取的消息具有回复或转发关系的消息,识别为与所选取的消息相关联的关联消息的装置。14.根据权利要求13所述的设备,所述用于通过处理所提取的背景话题关键字,生成一个或多个话题关键字的装置包含:用于从所选取的消息中提取一个或多个核心话题关键字的装置;以及用于通过组合所提取的核心话题关键字和所提取的背景话题关键字,生成一个或多个话题关键字的装置。15.根据权利要求12所述的设备,其中,所述关联消息识别装置包含:用于识别与所选取的消息相关联的交互操作用户的装置;和用于从与所述交互操作用户相对应的消息中,识别与所选取的消息具有回复或转发关系的消息作为与所选取的消息相关联的关联消息的装置。16.根据权利要求15所述的设备,所述用于通过处理所提取的背景话题关键字,生成一个或多个话题关键字的装置包含:用于确定所提取的背景话题关键字与交互操作用户的对应关系的装置;以及用于利用所确定的对应关系,生成一个或多个话题关键字的装置。17.根据权利要求13或15所述的设备,其中,所述与所选取的消息具有回复或转发关系的消息包括以下中的至少一种:对所选取的消息进行回复或转发的消息;所选取的消息对其进行回复或转发的消息;以及对经所选取的消息回复或转发的消息进行回复或转发的消息。18.根据权利要求15所述的设备,其中所述用于识别与所选取的消息相关联的交互操作用户的装置进一步包含:用于确定用户级别的装置;用于将所确定的用户级别与预先设定的级别阈值进行比较的装置;以及用于将级别高于该预先设定的级别阈值的用户识别为与所选取的消息相关联的交互操作用户的装置。19.根据权利要求15所述的设备,其中所述用于识别与所选取的消息相关联的交互操作用户的装置进一步包含:用于确定所要追踪的话题的预定话题领域的装置;用于获取用户的话题偏好的装置;用于将所获取的用户的话题偏好与所确定的预定话题领域进行比较的装置;以及用于将话题偏好与所述预定话题领域匹配的用户识别为与所选取的消息相关联的交互操作用户的装置。20.根据权利要求11所述的设备,其中,所述关联消息识别装置进一步包含:用于将与所选取的消息具有回复或转发关系的消息,识别为与所选取的消息相关联的第一关联消息的装置;以及用于识别与所选取的消息相关联的交互操作用户,以及从与所述交互操作用户相对应的消息中,识别与所选取的消息具有回复或转发关系的消息作为与所选取的消息相关联的第二关联消息的装置,并且,所述划分装置进一步包含:用于从所选取的消息中提取一个或多个第一核心话题关键字,以及从所识别的第一关联消息中提取一个或多个第一背景话题关键字的装置;用于通过组合所提取的第一核心话题关键字和所提取的第一背景话题关键字,生成一个或多个第一话题关键字的装置;用于基于所生成的第一话题关键字,获得对所选取的消息的第一话题分类结果的装置;用于通过参考所识别的第二关联消息与交互操作用户的对应关系,从所识别的第二关联消息中提取一个或多个第二背景话题关键字的装置;用于基于所提取的第二背景话题关键字,获得对所选取的消息的第二话题分类结果的装置;以及用于组合并分析所述第一话题分类结果和所述第二话题分类结果,以生成经整合的话题分类结果的装置。21.一种包含如权利要求11-20所述的设备的服务器。

说明书

用于在消息交互环境中跟踪消息话题的方法和设备

技术领域

本发明总体上涉及消息交互环境中的信息处理,特别地,本发明
涉及用于消息交互环境的话题跟踪方法及设备。

背景技术

近年来,诸如微博客的基于网络的微社交应用平台,作为一种全
新的消息交互环境,以其便捷性、草根性以及简单易用的特点实现了
令人惊讶的超高速发展。据统计,截止2010年,twitter在全球的注
册用户已达7500万。

图10中给出了一个微博客的交互实例。用户可以作为博主在自
己的微博客上自由地发布任意话题消息,也可以作为粉丝在其他用户
的微博客上对其他用户发布的消息进行评论。

不同于传统的web 2.0应用,在微博客中发布的消息长度是受限
的,例如twitter限定最多140字符。因此,在微博客中,人们通常采
用简洁的消息来表达核心内容,而省略了一些背景信息。因此,为了
更好地理解所关注的话题的含义,粉丝们不得不一条条地追溯消息历
史。

然而,要在成百上千条信息中找出所有希望的消息并不是一件容
易的事情。这是因为:一方面,话题随时间具有某种连续性;另一方
面,人们在网络上的操作行为是不连续的。而在微博客上分散的话题
相关消息使得粉丝们难以跟踪某个话题的历史。人们希望能提供有效
的话题跟踪方法来克服这个困难。

传统的话题跟踪方法主要依赖于内容相似度,即,直接将消息的
内容进行比较,以识别消息的话题。然而,这种传统方法不能很好地
应用于诸如微博客的消息长度受限的消息交互环境。如图10A所示,
博主“wakenheart”首先发了一条微博消息A:“澳大利亚真是太美了,
简直人间天堂”,相隔一段时间后又发了另一条消息B:“今天抱了一
只小考拉,一动不动的,好乖哟”。如果按照传统方法,直接将这两条
消息进行内容比较,由于这两条消息的内容看起来没有重复之处,相
似度很低,因此难以将这两个消息关联起来。

发明内容

本发明的一个实施例的一个目的在于,能够在消息交互环境中更
准确地进行话题跟踪。

根据本发明的第一方面,提供了一种用于在消息交互环境中跟踪
消息话题的方法,所述消息交互环境中包括多条消息,所述方法包含:
从所述消息交互环境所包括的多条消息中选取消息;从所述消息交互
环境所包括的多条消息中,识别与所选取的消息相关联的关联消息;
以及基于所识别的关联消息,将所选取的消息划归一个或多个话题组。

根据本发明的第二方面,提供了一种用于在消息交互环境中跟踪
消息话题的设备,所述消息交互环境中包括多条消息,所述设备包含:
消息选取装置,用于从所述消息交互环境所包括的多条消息中选取消
息;关联消息识别装置,用于从所述消息交互环境所包括的多条消息
中,识别与所述消息选取装置选取的消息相关联的关联消息;以及划
分装置,用于基于所述关联消息识别装置识别出的关联消息,将所述
消息选取装置选取的消息划归一个或多个话题组。

与现有技术相比,本发明的话题跟踪方法和设备在诸如微博客的
消息长度受限的消息交互环境下,也能够准确地识别多个消息之间的
相似度。

在微博客中,博主发布的微博消息,可能有一条或多条跟帖。例
如,粉丝们可以对微博消息进行回复、转发等交互操作。通常而言,
跟帖者在回复或转发微博消息时会作出评论,这些评论为微博消息提
供了有用的背景信息。

按照本发明实施例的话题跟踪方法和设备,可以利用跟帖者在回
复或转发微博消息时作出的评论,构建与该微博消息相关联的背景
(context);用从该背景提取的背景话题关键字,对从相关联的微博
消息本身提取的核心话题关键字进行扩展,获得扩展的话题关键字;
然后以扩展的话题关键字来比较微博消息之间的相似度,由此能够更
加准确地在微博消息之间进行话题跟踪。

在图10A所示的示例中,单独分析微博消息A和微博消息B是
难以将两者关联起来的。如果如图10B所示,粉丝“大侠znjidx”对
第一条微博消息A的回复消息A1中提到:“没错,澳洲自然环境太好
了,正因此那里的动物都比较懒,据说考拉一天只动弹一小时不到”,
按照本发明实施例,可以将回复消息A1中的“考拉”作为背景话题关
键字提取出来,由此建立消息A与消息B之间的关联。

利用本发明的话题跟踪方法和设备,在基于网络的消息交互环境
中对消息的话题跟踪能够动态、自动、实时地进行。

附图说明

本申请说明书中所参考的附图,只用于例示本发明的典型实施
例,不应该认为是对本发明范围的限制。

图1是例示了根据本发明实施例的用于消息交互环境的话题跟踪
方法的流程图;

图2是例示了根据本发明一实施例的用于消息交互环境的话题跟
踪处理的流程图;

图3是例示了根据本发明一实施例的话题关键字提取处理的流程
图;

图4是例示了根据本发明另一实施例的用于消息交互环境的话题
跟踪处理的流程图;

图5是例示了根据本发明一实施例的识别交互操作用户的处理的
流程图;

图6是例示了根据本发明另一实施例的识别交互操作用户的处理
的流程图;

图7是例示了根据本发明又一实施例的用于消息交互环境的话题
跟踪处理的流程图;

图8是例示了根据本发明一实施例的用于消息交互环境的话题跟
踪设备的框图;

图9是示出了可以应用本发明的基于网络的消息交互环境的示例
的示意图;以及

图10A和图10B是示出了微博客的交互示例的示意图。

具体实施方式

下列讨论中,提供大量具体的细节以帮助彻底了解本发明。然而,
很显然对于本领域技术人员来说,即使没有这些具体细节,并不影响
对本发明的理解。并且应该认识到,使用如下的任何具体术语仅仅是
为了方便描述,因此,本发明不应当局限于只用在这样的术语所表示
和/或暗示的任何特定应用中。

本文中所称的“消息交互环境”是指基于网络的信息分享、传播
及获取平台。在消息交互环境中,用户之间通过发布消息或者发表评
论来交互。

消息交互环境的一个例子是微博客。下文中将以微博客的消息交
互环境为例,详细说明本发明的实施例。然而,应当认识到,下面的
实施例仅仅是出于例示的目的给出的,而非旨在仅将本发明限于对微
博客的应用。除了微博客,本发明完全可以应用到其他消息交互环境,
尤其适用于消息长度受限的消息交互环境。

消息交互环境中包括多条消息。本文中所称的“消息”概指在消
息交互环境中发布的、用户可以与之进行交互的任意信息,例如,微
博客中的一条消息。“关联消息”概指消息交互环境中与某一选定消
息具有关联关系的任意信息,例如,微博客中针对某一微博消息的回
复消息或转发信息。本文中所称的“话题组”是指具有匹配的话题关
键字的一组消息。

图1例示了根据本发明实施例的话题跟踪方法100的流程图。如
图所示,话题跟踪方法100从步骤S102开始。在步骤S102,从该方
法所应用的消息交互环境所包括的多条消息中选取消息。所选取的消
息例如是博主发布的一条或多条微博消息。步骤S102可以响应于用户
的话题跟踪请求而启动,也可以按照消息交互环境的设定自动地执行。

应当指出,在步骤S102选取的消息可以是所应用的消息交互环
境中的所有消息、可以是选定时间段期间发布的消息、也可以是针对
某一话题领域的消息。

如上所述,由于微博客对消息长度的限制,可能针对同一话题,
博主会在连续的一段时间内陆续发布多条消息。例如,对于新关注某
一微博客的粉丝用户而言,为了全面了解该微博客,用户可以针对该
微博客中的所有微博消息按话题分类。而对于之前已关注到某一话题
且希望把握其最新动态的用户而言,可以选定某一时间段并对该选定
时间段内发布的微博消息进行话题跟踪。另外,在微博客提供话题领
域分类标识的情况下,用户还可以限定跟踪所关注话题领域内的微博
消息。

接下来,在步骤S104,从消息交互环境所包括的多条消息中识
别与在步骤S102中所选取的消息相关联的关联消息。如下文中结合图
2和图4将详细描述的,在步骤S104识别的关联消息可以是与所选取
的消息具有回复或转发关系的消息,也可以是与特定交互操作用户相
对应的消息。

然后,话题跟踪方法100进行到步骤S106。在步骤S106,基于
在步骤S104所识别的关联消息,将在步骤S102选取的消息划归到话
题组。需要注意的是,有可能一个消息涉及两个或以上的话题,那么
该消息将被划归到两个或以上的对应话题组中。

在本发明的一些实施例中,步骤S106可以这样来执行:从所识
别的关联消息中提取一个或多个背景话题关键字;通过处理所提取的
背景话题关键字,生成一个或多个话题关键字;以及将所选取的消息
划归与所生成的一个或多个话题关键字分别对应的一个或多个话题
组。

对应于步骤S104中识别的关联消息,可以采用不同的方法来处
理所提取的背景话题关键字。如下文将参照图2和4所详细描述的,
可以通过组合所提取的背景话题关键字与从选取消息本身提取的核心
话题关键字来生成话题关键字;也可以通过利用所提取的背景话题关
键字与交互操作用户的对应关系,来生成话题关键字。

下面将参照图2和图4,通过示例的形式来说明如何结合并利用
关联消息来实现对选取消息的话题分类。图2中所给出的实施例是以
选取消息为基础来识别关联消息;而图4中的实施例是以交互操作用
户为基础来识别关联消息。

图2所示的根据本发明一个实施例的话题跟踪处理200从步骤
S202开始。与图1中的步骤S102类似,在步骤S202中选取待分析的
消息。接下来,在步骤S204,将与步骤S202中所选取的消息具有回
复或转发关系的信息,识别为与所选取的消息相关联的关联消息。例
如,在所选取的消息是一条微博消息的情况下,这里识别的关联消息
可以是针对该微博消息的回复消息和/或转发消息。

然而,需要指出的是,本发明中关联消息与所选取消息之间的关
联性不仅仅限于关联消息对所选取消息的直接回复或转发,也可以包
括其他回复或转发关系,例如所选取消息是对关联消息的回复或转发
消息的情形,以及关联消息是对经选取消息回复或转发的消息进行回
复或转发的其他消息的情形,等等。例如,所选取的消息可以是回复
或转发消息本身,而关联消息可以该回复或转发消息所针对的原帖消
息,或者是该原帖消息的其他回复或转发消息。

然后,在步骤S206,从在步骤S204识别出的关联消息中提取一
个或多个背景话题关键字;类似地,在步骤S208从步骤S202所选取
的消息,提取一个或多个核心话题关键字。图3例示了根据本发明一
个实施例的针对待提取关键字的消息的话题关键字提取处理300。

针对待提取关键字的消息,可以应用浅层句法分析,以提取关键
位置上的词作为候选关键字,例如主语、谓语和/或宾语(步骤S302)。
另外地或者另选地,可以同时应用词性标记,例如用以提取通常代表
重要含义的名词和/或动词,作为候选关键字(步骤S304)。需要指
出,上述步骤S302和S304可以采用本领域目前已知的、正在开发的
或者未来将开发的句法分析和词性标记技术来实现。接着,在步骤
S306,组合步骤S302的句法分析和步骤S304的词性标记所给出的候
选关键字,来确定待提取的消息的话题关键字。

按照本发明实施例,图3中的话题关键字提取处理300所涉及的
待提取关键字的消息,可以是所选取的消息,也可以是关联消息。需
要指出的是,在有些实施例中,例如在回复消息或转发消息数量较多
的情况下,还可以通过进一步限定候选关键字的分布程度或重复次数,
来确定关联消息的背景话题关键字。例如,可选地,在步骤S306之后,
可以添加步骤S308和S310。在步骤S308,记录每一个候选关键字的
重复次数或分布程度。然后,在步骤S310,设定重复次数或分布程度
阈值,将高于所设定阈值的候选关键字确定为所提取的话题关键字。

我们回到图2。在提取了选取消息的核心话题关键字和关联消息
的背景话题关键字之后,在步骤S210,对所提取的背景话题关键字和
核心话题关键字进行组合,以确定与选取消息相关联的话题关键字。

下面以一个示例来详细说明这一关键字提取和组合处理。例如,
微博消息M:“暗夜勇士给孩子带来了负面影响”。共有10条回复消
息:

R1:“这个动画片给孩子的视力带来了坏处”;

R2:“最主要的是怕影响视力”;

R3:“孩子学会很多暴力行为”;

R4:“真是毒害孩子”;;

R5:“我老公说太垃圾了”;

R6:“确实很垃圾的动画片”;

R7:“这个动画片很有教育意义的”;

R8:“我也觉得给孩子有些负面影响了”;

R9:“负面影响很大”;

R10:“坚决抵制恶心的垃圾动画片”。

首先,对回复消息进行句法和/或词性分析,并且确定对候选关
键字的重复次数的统计,即,“孩子”,4次;“动画片”,4次;“垃圾”,
3次;“视力”,2次;“负面影响”,2次;“暴力”,1次;“行为”,1
次;“教育”,1次;“意义”;1次;“毒害”,1次;“坏处”,1次;“抵
制”,1次。

如果将背景话题关键字的重复次数阈值设置为3的话,则从上述
10条回复消息中提取出的关键字为{“孩子”,“动画片”,“垃圾”}。

接下来,对微博消息M进行浅层句法分析,我们得到:主语--
暗夜勇士;谓语--带来;宾语1--孩子,宾语2--负面影响。只提取其中
的主语和宾语,获得微博消息的第一组候选关键字{“暗夜勇士”,“孩
子”,“负面影响”}。

然后,对微博消息M进行词性标注,我们得到:名词1--暗夜勇
士,名词2--孩子,名词3-负面影响;动词--带来;介词--给。只提取
其中的名词,获得微博消息的第二组候选关键字{“暗夜勇士”,“孩子”,
“负面影响”}。

最终确定微博消息M中的核心话题关键词是{“暗夜勇士”,“孩
子”,“负面影响”}。结合对回复消息所提取的背景话题关键词,最终
构造的话题关键字可以是{“暗夜勇士”,“孩子”,“负面影响”,“垃圾”,
“动画片”}。

我们再回到图2,在步骤S210组合所提取的核心关键字和背景
关键字并生成最终的话题关键字后,流程进行到步骤S212。在步骤
S212,基于在步骤S210中生成的话题关键字,确定该消息所属的话
题组。

在图2的实施例中,采用的是针对某一消息的所有关联消息进行
话题扩展。然而,在实际应用中,由于个人语言习惯不同而且网络语
言非常自由和丰富,不同的跟帖者针对同一事物的描述可能是多种多
样的。在这种情况下,可能难以确定某一消息的关联消息的背景话题
关键字。然而,通常同一跟帖者的语言习惯和跟帖风格是具有连续性
和一致性的。

基于这种考虑,下面将参照图4描述根据本发明另一实施例的话
题跟踪处理400。话题跟踪处理400的核心思想在于,首先分析同一
跟帖者的回复消息或转发消息的话题关键字,以对同一跟帖者发表的
所有消息或者一段时间内发表的消息进行话题分类;然后,综合多个
跟帖者各自的消息话题分类,生成总的跟帖消息话题分类;最后,利
用跟帖消息与微博消息的映射关系,实现对微博消息的话题分类。

话题跟踪处理400从选取交互环境中的消息的步骤S402开始。
步骤S402与图1中的步骤S102和图2中的步骤S202相同,在此不
再累述。

在步骤S404,识别与在步骤S402中选取的消息相关联的一个或
多个交互操作用户。图5和图6中分别例示了识别交互操作用户的两
个不同实施例。图5中的识别处理500是基于用户的级别,而图6中
的识别处理600是基于用户的话题偏好。

在图5的交互操作用户识别处理500中,首先确定交互操作用户
的用户级别(步骤S502)。例如,根据用户关注某一微博的时间和程
度,可以将其设定为“菜鸟级粉丝”、“大虾级粉丝”、“老鸟级粉丝”以
及“骨灰级粉丝”。通常而言,级别越高的粉丝对该微博的关注程度越
高,了解的相关信息也越多,他们的评论通常非常具有参考价值。因
此,为了提高用户识别处理的效率,可以只考察一定级别以上的粉丝
的评论。为此,可以预先设定需要考察的交互操作用户的级别阈值,
并将每个用户的级别与该预定级别阈值进行比较(步骤S504)。然后,
只将级别高于该预定级别阈值的用户识别为需要进一步考察的交互操
作用户(步骤S506)。

图6例示了根据本发明另一个实施例的交互操作用户识别处理
600。在有些实施例中,可以设定用户的身份或者记录用户的话题偏好。
例如,对于作为驴友的用户来说,他更多关注(例如,回复或转发)
的领域可能是旅游;而对于作为球友的用户来所,体育方面的话题将
是更为感兴趣的。通过对一定时期内用户的交互操作的分析,交互系
统可以确定并记录每个用户的话题偏好。当然,在其他实施例中,也
可以由博主对重要的用户的话题偏好进行设定。

那么,在设定有话题偏好的消息交互环境下,可以首先确定所要
追踪的话题的预定话题领域(步骤S602)。接着,在步骤S604中,
获取交互操作用户的话题偏好。然后,将所获取的交互操作用户的话
题偏好与在步骤S602中所确定的预定话题领域进行比较(步骤S606)。
如果用户的话题偏好与预定话题领域匹配,则将该用户识别为需要进
一步考察的交互操作用户(步骤S608)。

我们再返回到图4。在步骤404中识别出交互操作用户之后,针
对所识别的交互操作用户中的每一个执行步骤S406和S408。在步骤
S406,从由所识别出的交互操作用户在消息交互环境下所发表的消息
中,识别与在步骤S402所选取的消息具有回复或转发关系的消息,作
为与所选取的消息相关联的关联消息,例如用户在一段时间内对所选
取的消息的回复消息和/或转发消息。接下来,在步骤S408,针对该
交互操作用户,从所识别出的关联消息中提取一个或多个背景话题关
键字。这里,同样可以应用图3中的关键字提取处理300。

针对步骤S404中识别出的所有交互操作用户,重复上述步骤
S406和S408,直到对所有交互操作用户各自对应的关联消息提取了
背景话题关键字(步骤S410)。

接下来,在步骤S412,组合所识别出的交互操作用户各自对应
的背景话题关键字,生成总的话题关键字。最后,在步骤S414,将选
取的消息划归到与步骤S412中生成的话题关键字分别对应的一个或
多个话题分组。

图2和图4中的实施例分别是以所选取的消息为基础来识别关联
消息和以交互操作用户为基础来识别关联消息的。按照本发明的实施
例,可以相结合地应用这两个实施例的话题跟踪处理,以进一步提高
对话题跟踪的准确性。例如,图7所例示的实施例,组合并分析利用
图2和图4的话题跟踪处理所得的消息分组结果,而生成最终的分组
结果。

如图7所示,在步骤S702选取了用以分析的消息之后,同时执
行基于消息的处理S705和基于交互操作用户的处理S710。这里,基
于消息的处理S705和基于交互操作用户的处理710分别对应于图2
和图4中的话题跟踪处理200和400,对其细节不再累述。在步骤S715,
组合并分析由基于消息的处理S705和由基于交互操作用户的处理
S710给出的消息分组结果,按照预定的算法,生成经整合的分组结果。

以上结合附图,说明了用于在消息交互环境中跟踪消息话题的方
法的各种实施方式。按照相同的发明构思,本发明还提供一种用于在
消息交互环境中跟踪消息话题的设备。

图8例示了根据本发明一实施例的用于包括多条消息的消息交互
环境的话题跟踪设备800。如图8所示,话题跟踪设备800包含消息
选取装置802、关联消息识别装置804和划分装置806。

消息选取装置802用于选取消息交互环境中的消息。关联消息识
别装置804从消息交互环境所包括的多条消息中,识别与消息选取装
置802选取的消息相关联的关联消息。划分装置806基于关联消息识
别装置804识别出的关联消息,将消息选取装置802选取的消息划归
到一个或多个话题组。

按照本发明一个实施例,所述划分装置包含:用于从所识别的关
联消息中提取一个或多个背景话题关键字的装置;用于通过处理所提
取的背景话题关键字,生成一个或多个话题关键字的装置;以及用于
将所选取的消息划归与所生成的一个或多个话题关键字分别对应的一
个或多个话题组的装置。

按照本发明一个实施例,所述关联消息识别装置包含:用于将与
所选取的消息具有回复或转发关系的消息,识别为与所选取的消息相
关联的关联消息的装置。

按照本发明一个实施例,所述用于通过处理所提取的背景话题关
键字,生成一个或多个话题关键字的装置包含:用于从所选取的消息
中提取一个或多个核心话题关键字的装置;以及用于通过组合所提取
的核心话题关键字和所提取的背景话题关键字,生成一个或多个话题
关键字的装置。

按照本发明一个实施例,所述关联消息识别装置包含:用于识别
与所选取的消息相关联的交互操作用户的装置;用于从与所述交互操
作用户相对应的消息中,识别与所选取的消息具有回复或转发关系的
消息作为与所选取的消息相关联的关联消息的装置。

按照本发明一个实施例,所述用于通过处理所提取的背景话题关
键字生成一个或多个话题关键字的装置包含:用于确定所提取的背景
话题关键字与交互操作用户的对应关系的装置;用于利用所确定的对
应关系,生成一个或多个话题关键字的装置。

按照本发明一个实施例,所述与所选取的消息具有回复或转发关
系的消息包括以下中的至少一种:对所选取的消息进行回复或转发的
消息;所选取的消息对其进行回复或转发的消息;以及对经所选取的
消息回复或转发的消息进行回复或转发的消息。

按照本发明一个实施例,所述用于识别与所选取的消息相关联的
交互操作用户的装置进一步包含:用于确定用户级别的装置;用于将
所确定的用户级别与预先设定的级别阈值进行比较的装置;以及用于
将级别高于该预先设定的级别阈值的用户识别为与所选取的消息相关
联的交互操作用户的装置。

按照本发明一个实施例,所述用于识别与所选取的消息相关联的
交互操作用户的装置进一步包含:用于确定所要追踪的话题的预定话
题领域的装置;用于获取用户的话题偏好的装置;用于将所获取的用
户的话题偏好与所确定的预定话题领域进行比较的装置;以及用于将
话题偏好与所述预定话题领域匹配的用户识别为与所选取的消息相关
联的交互操作用户的装置。

按照本发明一个实施例,所述关联消息识别装置进一步包含:用
于将与所选取的消息具有回复或转发关系的消息,识别为与所选取的
消息相关联的第一关联消息的装置;以及用于识别与所选取的消息相
关联的交互操作用户,以及从与所述交互操作用户相对应的消息中,
识别与所选取的消息具有回复或转发关系的消息作为与所选取的消息
相关联的第二关联消息的装置,并且,所述划分装置进一步包含:用
于从所选取的消息中提取一个或多个第一核心话题关键字,以及从所
识别的第一关联消息中提取一个或多个第一背景话题关键字的装置;
用于通过组合所提取的第一核心话题关键字和所提取的第一背景话题
关键字,生成一个或多个第一话题关键字的装置;用于基于所生成的
第一话题关键字,获得对所选取的消息的第一话题分类结果的装置;
用于通过参考所识别的第二关联消息与交互操作用户的对应关系,从
所识别的第二关联消息中提取一个或多个第二背景话题关键字的装
置;用于基于所提取的第二背景话题关键字,获得对所选取的消息的
第二话题分类结果的装置;以及用于组合并分析所述第一话题分类结
果和所述第二话题分类结果,以生成经整合的话题分类结果的装置。

需要指出的是,图8中所示的话题跟踪设备800还可以结合到交
互系统服务器中,或者与交互系统服务器远程地通信。在允许获得交
互系统服务器中的交互数据的情况下,话题跟踪设备800还可以结合
到交互系统的代理服务器中。

图9中给出了可以应用本发明的基于网络的消息交互环境的一个
示例。多个终端设备902-1、902-2...902-n经由网络900与交互系统服
务器901通信地耦连。交互系统服务器901可以执行上文所述的本发
明的用于在消息交互环境中跟踪消息话题的方法的各种实施例,如图
1所示的方法100;可以包含或体现上文所述的本发明的用于在消息交
互环境中跟踪消息话题的设备的各种实施例,如图8所示的设备800,
由此处理发自多个终端设备902-1、902-2...902-n的消息。网络900
可以是因特网、内联网、局域网(LAN)和/或城域网(MAN),可
以是无线或有线网络。终端设备902可以包括能够连接到网络900的
任何类型的计算设备,例如台式计算机、膝上型计算机、平板式计算
机、蜂窝式电话或者个人数字助理。

所属技术领域的技术人员知道,本发明可以体现为系统、方法或
计算机程序产品。因此,本发明可以具体实现为以下形式,即,可以
是完全的硬件、完全的软件(包括固件、驻留软件、微代码等)、或
者本文一般称为“电路”、“模块”或“系统”的软件部分与硬件部分的组
合。此外,本发明还可以采取体现在任何有形的表达介质(medium of
expression)中的计算机程序产品的形式,该介质中包含计算机可用的
程序码。

可以使用一个或多个计算机可用的或计算机可读的介质的任何
组合。计算机可用的或计算机可读的介质例如可以是——但不限于
——电的、磁的、光的、电磁的、红外线的、或半导体的系统、装置、
器件或传播介质。计算机可读介质的更具体的例子(非穷举的列表)
包括以下:有一个或多个导线的电连接、便携式计算机磁盘、硬盘、
随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存
储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、
光存储器件、诸如支持因特网或内部网的传输介质、或者磁存储器件。
注意计算机可用的或计算机可读的介质甚至可以是上面印有程序的纸
张或者其它合适的介质,这是因为,例如可以通过电扫描这种纸张或
其它介质,以电子方式获得程序,然后以适当的方式加以编译、解释
或处理,并且必要的话在计算机存储器中存储。在本文件的语境中,
计算机可用的或计算机可读的介质可以是任何含有、存储、传达、传
播、或传输供指令执行系统、装置或器件使用的或与指令执行系统、
装置或器件相联系的程序的介质。计算机可用的介质可包括在基带中
或者作为载波一部分传播的、由其体现计算机可用的程序码的数据信
号。计算机可用的程序码可以用任何适当的介质传输,包括-但不限
于-无线、电线、光缆、RF等等。

用于执行本发明的操作的计算机程序码,可以以一种或多种程序
设计语言的任何组合来编写,所述程序设计语言包括面向对象的程序
设计语言-诸如Java、Smalltalk、C++之类,还包括常规的过程式程
序设计语言-诸如”C”程序设计语言或类似的程序设计语言。程序码
可以完全地在用户的计算上执行、部分地在用户的计算机上执行、作
为一个独立的软件包执行、部分在用户的计算机上部分在远程计算机
上执行、或者完全在远程计算机或服务器上执行。在后一种情形中,
远程计算机可以通过任何种类的网络——包括局域网(LAN)或广域网
(WAN)-连接到用户的计算机,或者,可以(例如利用因特网服务提
供商来通过因特网)连接到外部计算机。

以下参照按照本发明实施例的方法、装置(系统)和计算机程序
产品的流程图和/或框图描述本发明。要明白的是,流程图和/或框图
的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程
序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算
机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得
通过计算机或其它可编程数据处理装置执行的这些指令,产生实现流
程图和/或框图中的方框中规定的功能/操作的装置。

也可以把这些计算机程序指令存储在能指令计算机或其它可编
程数据处理装置以特定方式工作的计算机可读介质中,这样,存储在
计算机可读介质中的指令产生一个包括实现流程图和/或框图中的方
框中规定的功能/操作的指令装置(instruction means)的制造品。

也可以把计算机程序指令加载到计算机或其它可编程数据处理
装置上,使得在计算机或其它可编程数据处理装置上执行一系列操作
步骤,以产生计算机实现的过程,从而在计算机或其它可编程装置上
执行的指令就提供实现流程图和/或框图中的方框中规定的功能/操作
的过程。

附图中的流程图和框图,图示了按照本发明各种实施例的系统、
方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点
上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码
的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于
实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的
实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发
生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们
有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的
是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框
的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实
现,或者可以用专用硬件与计算机指令的组合来实现。

本文中所用的术语,仅仅是为了描述特定的实施例,而不意图限
定本发明。本文中所用的单数形式的“一”和“该”,旨在也包括复数形
式,除非上下文中明确地另外指出。还要知道,“包含”一词在本说明
书中使用时,说明存在所指出的特征、整体、步骤、操作、单元和/
或组件,但是并不排除存在或增加一个或多个其它特征、整体、步骤、
操作、单元和/或组件,以及/或者它们的组合。

权利要求中的对应结构、材料、操作以及所有功能性限定的装置
(means)或步骤的等同替换,旨在包括任何用于与在权利要求中具体指
出的其它单元相组合地执行该功能的结构、材料或操作。所给出的对
本发明的描述其目的在于示意和描述,并非是穷尽性的,也并非是要
把本发明限定到所表述的形式。对于所属技术领域的普通技术人员来
说,在不偏离本发明范围和精神的情况下,显然可以作出许多修改和
变型。对实施例的选择和说明,是为了最好地解释本发明的原理和实
际应用,使所属技术领域的普通技术人员能够明了,本发明可以有适
合所要的特定用途的具有各种改变的各种实施方式。

用于在消息交互环境中跟踪消息话题的方法和设备.pdf_第1页
第1页 / 共24页
用于在消息交互环境中跟踪消息话题的方法和设备.pdf_第2页
第2页 / 共24页
用于在消息交互环境中跟踪消息话题的方法和设备.pdf_第3页
第3页 / 共24页
点击查看更多>>
资源描述

《用于在消息交互环境中跟踪消息话题的方法和设备.pdf》由会员分享,可在线阅读,更多相关《用于在消息交互环境中跟踪消息话题的方法和设备.pdf(24页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 102651719 A (43)申请公布日 2012.08.29 C N 1 0 2 6 5 1 7 1 9 A *CN102651719A* (21)申请号 201110047636.8 (22)申请日 2011.02.28 H04L 12/58(2006.01) H04L 29/08(2006.01) (71)申请人国际商业机器公司 地址美国纽约 (72)发明人蔡柯柯 郭宏蕾 祝慧佳 苏中 (74)专利代理机构中国国际贸易促进委员会专 利商标事务所 11038 代理人邹姗姗 (54) 发明名称 用于在消息交互环境中跟踪消息话题的方法 和设备 (57) 摘要 本发明。

2、提供了一种用于在包括多条消息的消 息交互环境下通过结合与一消息相关联的关联消 息而对该消息所涉及的话题进行跟踪的方法和设 备。该方法包含:从所述消息交互环境所包括的 多条消息中选取消息;从所述消息交互环境所包 括的多条消息中,识别与所选取的消息相关联的 关联消息;以及基于所识别的关联消息,将所选 取的消息划归一个或多个话题组。本发明的话题 跟踪方法和设备能够在诸如微博客的消息交互环 境中准确地确定消息之间的相似度,由此进行话 题跟踪。 (51)Int.Cl. 权利要求书4页 说明书10页 附图9页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 4 页 说明书 10 页。

3、 附图 9 页 1/4页 2 1.一种用于在消息交互环境中跟踪消息话题的方法,所述消息交互环境中包括多条消 息,所述方法包含: 从所述消息交互环境所包括的多条消息中选取消息; 从所述消息交互环境所包括的多条消息中,识别与所选取的消息相关联的关联消息; 以及 基于所识别的关联消息,将所选取的消息划归一个或多个话题组。 2.根据权利要求1所述的方法,所述基于所识别的关联消息将所选取的消息划归一个 或多个话题组包含: 从所识别的关联消息中提取一个或多个背景话题关键字; 通过处理所提取的背景话题关键字,生成一个或多个话题关键字;以及 将所选取的消息划归与所生成的一个或多个话题关键字分别对应的一个或多个。

4、话题 组。 3.根据权利要求2所述的方法,其中所述识别与所选取的消息相关联的关联消息包 含: 将与所选取的消息具有回复或转发关系的消息,识别为与所选取的消息相关联的关联 消息。 4.根据权利要求3所述的方法,所述通过处理所提取的背景话题关键字,生成一个或 多个话题关键字包含: 从所选取的消息中提取一个或多个核心话题关键字;以及 通过组合所提取的核心话题关键字和所提取的背景话题关键字,生成一个或多个话题 关键字。 5.根据权利要求2所述的方法,其中所述识别与所选取的消息相关联的关联消息包 含: 识别与所选取的消息相关联的交互操作用户;和 从与所述交互操作用户相对应的消息中,识别与所选取的消息具有。

5、回复或转发关系的 消息,作为与所选取的消息相关联的关联消息。 6.根据权利要求5所述的方法,所述通过处理所提取的背景话题关键字,生成一个或 多个话题关键字包含: 确定所提取的背景话题关键字与交互操作用户的对应关系;以及 利用所确定的对应关系,生成一个或多个话题关键字。 7.根据权利要求3或5所述的方法,其中,所述与所选取的消息具有回复或转发关系 的消息包括以下中的至少一种:对所选取的消息进行回复或转发的消息;所选取的消息对 其进行回复或转发的消息;以及对经所选取的消息回复或转发的消息进行回复或转发的消 息。 8.根据权利要求5所述的方法,其中所述识别与所述选取的消息相关联的交互操作用 户进一步。

6、包含: 确定用户级别; 将所确定的用户级别与预先设定的级别阈值进行比较;以及 将级别高于该预先设定的级别阈值的用户识别为与所选取的消息相关联的交互操作 权 利 要 求 书CN 102651719 A 2/4页 3 用户。 9.根据权利要求5所述的方法,其中所述识别与所选取的消息相关联的交互操作用户 进一步包含: 确定所要追踪的话题的预定话题领域; 获取用户的话题偏好; 将所获取的用户的话题偏好与所确定的预定话题领域进行比较;以及 将话题偏好与所述预定话题领域匹配的用户识别为与所选取的消息相关联的交互操 作用户。 10.根据权利要求1所述的方法,其中所述识别与所选取的消息相关联的关联消息进 一步。

7、包含: 将与所选取的消息具有回复或转发关系的消息,识别为与所选取的消息相关联的第一 关联消息;和 识别与所选取的消息相关联的交互操作用户,以及从与所述交互操作用户相对应的消 息中,识别与所选取的消息具有回复或转发关系的消息,作为与所选取的消息相关联的第 二关联消息, 并且,所述基于所识别的关联消息将所选取的消息划归一个或多个话题组进一步包 含: 从所选取的消息中提取一个或多个第一核心话题关键字,以及从所识别的第一关联消 息中提取一个或多个第一背景话题关键字; 通过组合所提取的第一核心话题关键字和所提取的第一背景话题关键字,生成一个或 多个第一话题关键字; 基于所生成的第一话题关键字,获得对所选。

8、取的消息的第一话题分类结果; 通过参考所识别的第二关联消息与交互操作用户的对应关系,从所识别的第二关联消 息中提取一个或多个第二背景话题关键字; 基于所提取的第二背景话题关键字,获得对所选取的消息的第二话题分类结果;以及 组合并分析所述第一话题分类结果和所述第二话题分类结果,以生成经整合的话题分 类结果。 11.一种用于在消息交互环境中跟踪消息话题的设备,所述消息交互环境中包括多条 消息,所述设备包含: 消息选取装置,用于从所述消息交互环境所包括的多条消息中选取消息; 关联消息识别装置,用于从所述消息交互环境所包括的多条消息中,识别与所述消息 选取装置选取的消息相关联的关联消息;以及 划分装置。

9、,用于基于所述关联消息识别装置识别出的关联消息,将所述消息选取装置 选取的消息划归一个或多个话题组。 12.根据权利要求11所述的设备,所述划分装置包含: 用于从所识别的关联消息中提取一个或多个背景话题关键字的装置; 用于通过处理所提取的背景话题关键字,生成一个或多个话题关键字的装置;以及 用于将所选取的消息划归与所生成的一个或多个话题关键字分别对应的一个或多个 话题组的装置。 权 利 要 求 书CN 102651719 A 3/4页 4 13.根据权利要求12所述的设备,其中,所述关联消息识别装置包含: 用于将与所选取的消息具有回复或转发关系的消息,识别为与所选取的消息相关联的 关联消息的装。

10、置。 14.根据权利要求13所述的设备,所述用于通过处理所提取的背景话题关键字,生成 一个或多个话题关键字的装置包含: 用于从所选取的消息中提取一个或多个核心话题关键字的装置;以及 用于通过组合所提取的核心话题关键字和所提取的背景话题关键字,生成一个或多个 话题关键字的装置。 15.根据权利要求12所述的设备,其中,所述关联消息识别装置包含: 用于识别与所选取的消息相关联的交互操作用户的装置;和 用于从与所述交互操作用户相对应的消息中,识别与所选取的消息具有回复或转发关 系的消息作为与所选取的消息相关联的关联消息的装置。 16.根据权利要求15所述的设备,所述用于通过处理所提取的背景话题关键字。

11、,生成 一个或多个话题关键字的装置包含: 用于确定所提取的背景话题关键字与交互操作用户的对应关系的装置;以及 用于利用所确定的对应关系,生成一个或多个话题关键字的装置。 17.根据权利要求13或15所述的设备,其中,所述与所选取的消息具有回复或转发关 系的消息包括以下中的至少一种:对所选取的消息进行回复或转发的消息;所选取的消息 对其进行回复或转发的消息;以及对经所选取的消息回复或转发的消息进行回复或转发的 消息。 18.根据权利要求15所述的设备,其中所述用于识别与所选取的消息相关联的交互操 作用户的装置进一步包含: 用于确定用户级别的装置; 用于将所确定的用户级别与预先设定的级别阈值进行比。

12、较的装置;以及 用于将级别高于该预先设定的级别阈值的用户识别为与所选取的消息相关联的交互 操作用户的装置。 19.根据权利要求15所述的设备,其中所述用于识别与所选取的消息相关联的交互操 作用户的装置进一步包含: 用于确定所要追踪的话题的预定话题领域的装置; 用于获取用户的话题偏好的装置; 用于将所获取的用户的话题偏好与所确定的预定话题领域进行比较的装置;以及 用于将话题偏好与所述预定话题领域匹配的用户识别为与所选取的消息相关联的交 互操作用户的装置。 20.根据权利要求11所述的设备,其中, 所述关联消息识别装置进一步包含: 用于将与所选取的消息具有回复或转发关系的消息,识别为与所选取的消息。

13、相关联的 第一关联消息的装置;以及 用于识别与所选取的消息相关联的交互操作用户,以及从与所述交互操作用户相对应 的消息中,识别与所选取的消息具有回复或转发关系的消息作为与所选取的消息相关联的 权 利 要 求 书CN 102651719 A 4/4页 5 第二关联消息的装置, 并且,所述划分装置进一步包含: 用于从所选取的消息中提取一个或多个第一核心话题关键字,以及从所识别的第一关 联消息中提取一个或多个第一背景话题关键字的装置; 用于通过组合所提取的第一核心话题关键字和所提取的第一背景话题关键字,生成一 个或多个第一话题关键字的装置; 用于基于所生成的第一话题关键字,获得对所选取的消息的第一话。

14、题分类结果的装 置; 用于通过参考所识别的第二关联消息与交互操作用户的对应关系,从所识别的第二关 联消息中提取一个或多个第二背景话题关键字的装置; 用于基于所提取的第二背景话题关键字,获得对所选取的消息的第二话题分类结果的 装置;以及 用于组合并分析所述第一话题分类结果和所述第二话题分类结果,以生成经整合的话 题分类结果的装置。 21.一种包含如权利要求11-20所述的设备的服务器。 权 利 要 求 书CN 102651719 A 1/10页 6 用于在消息交互环境中跟踪消息话题的方法和设备 技术领域 0001 本发明总体上涉及消息交互环境中的信息处理,特别地,本发明涉及用于消息交 互环境的话。

15、题跟踪方法及设备。 背景技术 0002 近年来,诸如微博客的基于网络的微社交应用平台,作为一种全新的消息交互环 境,以其便捷性、草根性以及简单易用的特点实现了令人惊讶的超高速发展。据统计,截止 2010年,twitter在全球的注册用户已达7500万。 0003 图10中给出了一个微博客的交互实例。用户可以作为博主在自己的微博客上自 由地发布任意话题消息,也可以作为粉丝在其他用户的微博客上对其他用户发布的消息进 行评论。 0004 不同于传统的web 2.0应用,在微博客中发布的消息长度是受限的,例如twitter 限定最多140字符。因此,在微博客中,人们通常采用简洁的消息来表达核心内容,而。

16、省略 了一些背景信息。因此,为了更好地理解所关注的话题的含义,粉丝们不得不一条条地追溯 消息历史。 0005 然而,要在成百上千条信息中找出所有希望的消息并不是一件容易的事情。这是 因为:一方面,话题随时间具有某种连续性;另一方面,人们在网络上的操作行为是不连续 的。而在微博客上分散的话题相关消息使得粉丝们难以跟踪某个话题的历史。人们希望能 提供有效的话题跟踪方法来克服这个困难。 0006 传统的话题跟踪方法主要依赖于内容相似度,即,直接将消息的内容进行比较,以 识别消息的话题。然而,这种传统方法不能很好地应用于诸如微博客的消息长度受限的消 息交互环境。如图10A所示,博主“wakenhear。

17、t”首先发了一条微博消息A:“澳大利亚真是 太美了,简直人间天堂”,相隔一段时间后又发了另一条消息B:“今天抱了一只小考拉,一 动不动的,好乖哟”。如果按照传统方法,直接将这两条消息进行内容比较,由于这两条消息 的内容看起来没有重复之处,相似度很低,因此难以将这两个消息关联起来。 发明内容 0007 本发明的一个实施例的一个目的在于,能够在消息交互环境中更准确地进行话题 跟踪。 0008 根据本发明的第一方面,提供了一种用于在消息交互环境中跟踪消息话题的方 法,所述消息交互环境中包括多条消息,所述方法包含:从所述消息交互环境所包括的多条 消息中选取消息;从所述消息交互环境所包括的多条消息中,识。

18、别与所选取的消息相关联 的关联消息;以及基于所识别的关联消息,将所选取的消息划归一个或多个话题组。 0009 根据本发明的第二方面,提供了一种用于在消息交互环境中跟踪消息话题的设 备,所述消息交互环境中包括多条消息,所述设备包含:消息选取装置,用于从所述消息交 互环境所包括的多条消息中选取消息;关联消息识别装置,用于从所述消息交互环境所包 说 明 书CN 102651719 A 2/10页 7 括的多条消息中,识别与所述消息选取装置选取的消息相关联的关联消息;以及划分装置, 用于基于所述关联消息识别装置识别出的关联消息,将所述消息选取装置选取的消息划归 一个或多个话题组。 0010 与现有技术。

19、相比,本发明的话题跟踪方法和设备在诸如微博客的消息长度受限的 消息交互环境下,也能够准确地识别多个消息之间的相似度。 0011 在微博客中,博主发布的微博消息,可能有一条或多条跟帖。例如,粉丝们可以对 微博消息进行回复、转发等交互操作。通常而言,跟帖者在回复或转发微博消息时会作出评 论,这些评论为微博消息提供了有用的背景信息。 0012 按照本发明实施例的话题跟踪方法和设备,可以利用跟帖者在回复或转发微博消 息时作出的评论,构建与该微博消息相关联的背景(context);用从该背景提取的背景话 题关键字,对从相关联的微博消息本身提取的核心话题关键字进行扩展,获得扩展的话题 关键字;然后以扩展的。

20、话题关键字来比较微博消息之间的相似度,由此能够更加准确地在 微博消息之间进行话题跟踪。 0013 在图10A所示的示例中,单独分析微博消息A和微博消息B是难以将两者关联起 来的。如果如图10B所示,粉丝“大侠znjidx”对第一条微博消息A的回复消息A1中提到: “没错,澳洲自然环境太好了,正因此那里的动物都比较懒,据说考拉一天只动弹一小时不 到”,按照本发明实施例,可以将回复消息A1中的“考拉”作为背景话题关键字提取出来,由 此建立消息A与消息B之间的关联。 0014 利用本发明的话题跟踪方法和设备,在基于网络的消息交互环境中对消息的话题 跟踪能够动态、自动、实时地进行。 附图说明 0015。

21、 本申请说明书中所参考的附图,只用于例示本发明的典型实施例,不应该认为是 对本发明范围的限制。 0016 图1是例示了根据本发明实施例的用于消息交互环境的话题跟踪方法的流程图; 0017 图2是例示了根据本发明一实施例的用于消息交互环境的话题跟踪处理的流程 图; 0018 图3是例示了根据本发明一实施例的话题关键字提取处理的流程图; 0019 图4是例示了根据本发明另一实施例的用于消息交互环境的话题跟踪处理的流 程图; 0020 图5是例示了根据本发明一实施例的识别交互操作用户的处理的流程图; 0021 图6是例示了根据本发明另一实施例的识别交互操作用户的处理的流程图; 0022 图7是例示了。

22、根据本发明又一实施例的用于消息交互环境的话题跟踪处理的流 程图; 0023 图8是例示了根据本发明一实施例的用于消息交互环境的话题跟踪设备的框图; 0024 图9是示出了可以应用本发明的基于网络的消息交互环境的示例的示意图;以及 0025 图10A和图10B是示出了微博客的交互示例的示意图。 具体实施方式 说 明 书CN 102651719 A 3/10页 8 0026 下列讨论中,提供大量具体的细节以帮助彻底了解本发明。然而,很显然对于本领 域技术人员来说,即使没有这些具体细节,并不影响对本发明的理解。并且应该认识到,使 用如下的任何具体术语仅仅是为了方便描述,因此,本发明不应当局限于只用在。

23、这样的术 语所表示和/或暗示的任何特定应用中。 0027 本文中所称的“消息交互环境”是指基于网络的信息分享、传播及获取平台。在消 息交互环境中,用户之间通过发布消息或者发表评论来交互。 0028 消息交互环境的一个例子是微博客。下文中将以微博客的消息交互环境为例,详 细说明本发明的实施例。然而,应当认识到,下面的实施例仅仅是出于例示的目的给出的, 而非旨在仅将本发明限于对微博客的应用。除了微博客,本发明完全可以应用到其他消息 交互环境,尤其适用于消息长度受限的消息交互环境。 0029 消息交互环境中包括多条消息。本文中所称的“消息”概指在消息交互环境中发 布的、用户可以与之进行交互的任意信息。

24、,例如,微博客中的一条消息。“关联消息”概指消 息交互环境中与某一选定消息具有关联关系的任意信息,例如,微博客中针对某一微博消 息的回复消息或转发信息。本文中所称的“话题组”是指具有匹配的话题关键字的一组消 息。 0030 图1例示了根据本发明实施例的话题跟踪方法100的流程图。如图所示,话题跟 踪方法100从步骤S102开始。在步骤S102,从该方法所应用的消息交互环境所包括的多条 消息中选取消息。所选取的消息例如是博主发布的一条或多条微博消息。步骤S102可以 响应于用户的话题跟踪请求而启动,也可以按照消息交互环境的设定自动地执行。 0031 应当指出,在步骤S102选取的消息可以是所应用。

25、的消息交互环境中的所有消息、 可以是选定时间段期间发布的消息、也可以是针对某一话题领域的消息。 0032 如上所述,由于微博客对消息长度的限制,可能针对同一话题,博主会在连续的一 段时间内陆续发布多条消息。例如,对于新关注某一微博客的粉丝用户而言,为了全面了解 该微博客,用户可以针对该微博客中的所有微博消息按话题分类。而对于之前已关注到某 一话题且希望把握其最新动态的用户而言,可以选定某一时间段并对该选定时间段内发布 的微博消息进行话题跟踪。另外,在微博客提供话题领域分类标识的情况下,用户还可以限 定跟踪所关注话题领域内的微博消息。 0033 接下来,在步骤S104,从消息交互环境所包括的多条。

26、消息中识别与在步骤S102中 所选取的消息相关联的关联消息。如下文中结合图2和图4将详细描述的,在步骤S104识 别的关联消息可以是与所选取的消息具有回复或转发关系的消息,也可以是与特定交互操 作用户相对应的消息。 0034 然后,话题跟踪方法100进行到步骤S106。在步骤S106,基于在步骤S104所识别 的关联消息,将在步骤S102选取的消息划归到话题组。需要注意的是,有可能一个消息涉 及两个或以上的话题,那么该消息将被划归到两个或以上的对应话题组中。 0035 在本发明的一些实施例中,步骤S106可以这样来执行:从所识别的关联消息中提 取一个或多个背景话题关键字;通过处理所提取的背景话。

27、题关键字,生成一个或多个话题 关键字;以及将所选取的消息划归与所生成的一个或多个话题关键字分别对应的一个或多 个话题组。 0036 对应于步骤S104中识别的关联消息,可以采用不同的方法来处理所提取的背景 说 明 书CN 102651719 A 4/10页 9 话题关键字。如下文将参照图2和4所详细描述的,可以通过组合所提取的背景话题关键 字与从选取消息本身提取的核心话题关键字来生成话题关键字;也可以通过利用所提取的 背景话题关键字与交互操作用户的对应关系,来生成话题关键字。 0037 下面将参照图2和图4,通过示例的形式来说明如何结合并利用关联消息来实现 对选取消息的话题分类。图2中所给出的。

28、实施例是以选取消息为基础来识别关联消息;而 图4中的实施例是以交互操作用户为基础来识别关联消息。 0038 图2所示的根据本发明一个实施例的话题跟踪处理200从步骤S202开始。与图 1中的步骤S102类似,在步骤S202中选取待分析的消息。接下来,在步骤S204,将与步骤 S202中所选取的消息具有回复或转发关系的信息,识别为与所选取的消息相关联的关联消 息。例如,在所选取的消息是一条微博消息的情况下,这里识别的关联消息可以是针对该微 博消息的回复消息和/或转发消息。 0039 然而,需要指出的是,本发明中关联消息与所选取消息之间的关联性不仅仅限于 关联消息对所选取消息的直接回复或转发,也可。

29、以包括其他回复或转发关系,例如所选取 消息是对关联消息的回复或转发消息的情形,以及关联消息是对经选取消息回复或转发的 消息进行回复或转发的其他消息的情形,等等。例如,所选取的消息可以是回复或转发消息 本身,而关联消息可以该回复或转发消息所针对的原帖消息,或者是该原帖消息的其他回 复或转发消息。 0040 然后,在步骤S206,从在步骤S204识别出的关联消息中提取一个或多个背景话 题关键字;类似地,在步骤S208从步骤S202所选取的消息,提取一个或多个核心话题关键 字。图3例示了根据本发明一个实施例的针对待提取关键字的消息的话题关键字提取处理 300。 0041 针对待提取关键字的消息,可以。

30、应用浅层句法分析,以提取关键位置上的词作为 候选关键字,例如主语、谓语和/或宾语(步骤S302)。另外地或者另选地,可以同时应用词 性标记,例如用以提取通常代表重要含义的名词和/或动词,作为候选关键字(步骤S304)。 需要指出,上述步骤S302和S304可以采用本领域目前已知的、正在开发的或者未来将开发 的句法分析和词性标记技术来实现。接着,在步骤S306,组合步骤S302的句法分析和步骤 S304的词性标记所给出的候选关键字,来确定待提取的消息的话题关键字。 0042 按照本发明实施例,图3中的话题关键字提取处理300所涉及的待提取关键字的 消息,可以是所选取的消息,也可以是关联消息。需要。

31、指出的是,在有些实施例中,例如在回 复消息或转发消息数量较多的情况下,还可以通过进一步限定候选关键字的分布程度或重 复次数,来确定关联消息的背景话题关键字。例如,可选地,在步骤S306之后,可以添加步 骤S308和S310。在步骤S308,记录每一个候选关键字的重复次数或分布程度。然后,在步 骤S310,设定重复次数或分布程度阈值,将高于所设定阈值的候选关键字确定为所提取的 话题关键字。 0043 我们回到图2。在提取了选取消息的核心话题关键字和关联消息的背景话题关键 字之后,在步骤S210,对所提取的背景话题关键字和核心话题关键字进行组合,以确定与选 取消息相关联的话题关键字。 0044 下。

32、面以一个示例来详细说明这一关键字提取和组合处理。例如,微博消息M:“暗 夜勇士给孩子带来了负面影响”。共有10条回复消息: 说 明 书CN 102651719 A 5/10页 10 0045 R1:“这个动画片给孩子的视力带来了坏处”; 0046 R2:“最主要的是怕影响视力”; 0047 R3:“孩子学会很多暴力行为”; 0048 R4:“真是毒害孩子”; 0049 R5:“我老公说太垃圾了”; 0050 R6:“确实很垃圾的动画片”; 0051 R7:“这个动画片很有教育意义的”; 0052 R8:“我也觉得给孩子有些负面影响了”; 0053 R9:“负面影响很大”; 0054 R10:“。

33、坚决抵制恶心的垃圾动画片”。 0055 首先,对回复消息进行句法和/或词性分析,并且确定对候选关键字的重复次数 的统计,即,“孩子”,4次;“动画片”,4次;“垃圾”,3次;“视力”,2次;“负面影响”,2次;“暴 力”,1次;“行为”,1次;“教育”,1次;“意义”;1次;“毒害”,1次;“坏处”,1次;“抵制”,1 次。 0056 如果将背景话题关键字的重复次数阈值设置为3的话,则从上述10条回复消息中 提取出的关键字为“孩子”,“动画片”,“垃圾”。 0057 接下来,对微博消息M进行浅层句法分析,我们得到:主语-暗夜勇士;谓语-带 来;宾语1-孩子,宾语2-负面影响。只提取其中的主语和。

34、宾语,获得微博消息的第一组 候选关键字“暗夜勇士”,“孩子”,“负面影响”。 0058 然后,对微博消息M进行词性标注,我们得到:名词1-暗夜勇士,名词2-孩子, 名词3-负面影响;动词-带来;介词-给。只提取其中的名词,获得微博消息的第二组候 选关键字“暗夜勇士”,“孩子”,“负面影响”。 0059 最终确定微博消息M中的核心话题关键词是“暗夜勇士”,“孩子”,“负面影响”。 结合对回复消息所提取的背景话题关键词,最终构造的话题关键字可以是“暗夜勇士”, “孩子”,“负面影响”,“垃圾”,“动画片”。 0060 我们再回到图2,在步骤S210组合所提取的核心关键字和背景关键字并生成最终 的话。

35、题关键字后,流程进行到步骤S212。在步骤S212,基于在步骤S210中生成的话题关键 字,确定该消息所属的话题组。 0061 在图2的实施例中,采用的是针对某一消息的所有关联消息进行话题扩展。然而, 在实际应用中,由于个人语言习惯不同而且网络语言非常自由和丰富,不同的跟帖者针对 同一事物的描述可能是多种多样的。在这种情况下,可能难以确定某一消息的关联消息的 背景话题关键字。然而,通常同一跟帖者的语言习惯和跟帖风格是具有连续性和一致性的。 0062 基于这种考虑,下面将参照图4描述根据本发明另一实施例的话题跟踪处理400。 话题跟踪处理400的核心思想在于,首先分析同一跟帖者的回复消息或转发消。

36、息的话题关 键字,以对同一跟帖者发表的所有消息或者一段时间内发表的消息进行话题分类;然后,综 合多个跟帖者各自的消息话题分类,生成总的跟帖消息话题分类;最后,利用跟帖消息与微 博消息的映射关系,实现对微博消息的话题分类。 0063 话题跟踪处理400从选取交互环境中的消息的步骤S402开始。步骤S402与图1 中的步骤S102和图2中的步骤S202相同,在此不再累述。 说 明 书CN 102651719 A 10 6/10页 11 0064 在步骤S404,识别与在步骤S402中选取的消息相关联的一个或多个交互操作用 户。图5和图6中分别例示了识别交互操作用户的两个不同实施例。图5中的识别处理。

37、 500是基于用户的级别,而图6中的识别处理600是基于用户的话题偏好。 0065 在图5的交互操作用户识别处理500中,首先确定交互操作用户的用户级别(步 骤S502)。例如,根据用户关注某一微博的时间和程度,可以将其设定为“菜鸟级粉丝”、“大 虾级粉丝”、“老鸟级粉丝”以及“骨灰级粉丝”。通常而言,级别越高的粉丝对该微博的关 注程度越高,了解的相关信息也越多,他们的评论通常非常具有参考价值。因此,为了提高 用户识别处理的效率,可以只考察一定级别以上的粉丝的评论。为此,可以预先设定需要 考察的交互操作用户的级别阈值,并将每个用户的级别与该预定级别阈值进行比较(步骤 S504)。然后,只将级别。

38、高于该预定级别阈值的用户识别为需要进一步考察的交互操作用户 (步骤S506)。 0066 图6例示了根据本发明另一个实施例的交互操作用户识别处理600。在有些实施 例中,可以设定用户的身份或者记录用户的话题偏好。例如,对于作为驴友的用户来说,他 更多关注(例如,回复或转发)的领域可能是旅游;而对于作为球友的用户来所,体育方面 的话题将是更为感兴趣的。通过对一定时期内用户的交互操作的分析,交互系统可以确定 并记录每个用户的话题偏好。当然,在其他实施例中,也可以由博主对重要的用户的话题偏 好进行设定。 0067 那么,在设定有话题偏好的消息交互环境下,可以首先确定所要追踪的话题的预 定话题领域(步。

39、骤S602)。接着,在步骤S604中,获取交互操作用户的话题偏好。然后,将 所获取的交互操作用户的话题偏好与在步骤S602中所确定的预定话题领域进行比较(步 骤S606)。如果用户的话题偏好与预定话题领域匹配,则将该用户识别为需要进一步考察的 交互操作用户(步骤S608)。 0068 我们再返回到图4。在步骤404中识别出交互操作用户之后,针对所识别的交互操 作用户中的每一个执行步骤S406和S408。在步骤S406,从由所识别出的交互操作用户在 消息交互环境下所发表的消息中,识别与在步骤S402所选取的消息具有回复或转发关系 的消息,作为与所选取的消息相关联的关联消息,例如用户在一段时间内对。

40、所选取的消息 的回复消息和/或转发消息。接下来,在步骤S408,针对该交互操作用户,从所识别出的关 联消息中提取一个或多个背景话题关键字。这里,同样可以应用图3中的关键字提取处理 300。 0069 针对步骤S404中识别出的所有交互操作用户,重复上述步骤S406和S408,直到对 所有交互操作用户各自对应的关联消息提取了背景话题关键字(步骤S410)。 0070 接下来,在步骤S412,组合所识别出的交互操作用户各自对应的背景话题关键字, 生成总的话题关键字。最后,在步骤S414,将选取的消息划归到与步骤S412中生成的话题 关键字分别对应的一个或多个话题分组。 0071 图2和图4中的实施。

41、例分别是以所选取的消息为基础来识别关联消息和以交互操 作用户为基础来识别关联消息的。按照本发明的实施例,可以相结合地应用这两个实施例 的话题跟踪处理,以进一步提高对话题跟踪的准确性。例如,图7所例示的实施例,组合并 分析利用图2和图4的话题跟踪处理所得的消息分组结果,而生成最终的分组结果。 0072 如图7所示,在步骤S702选取了用以分析的消息之后,同时执行基于消息的处理 说 明 书CN 102651719 A 11 7/10页 12 S705和基于交互操作用户的处理S710。这里,基于消息的处理S705和基于交互操作用户 的处理710分别对应于图2和图4中的话题跟踪处理200和400,对其。

42、细节不再累述。在步 骤S715,组合并分析由基于消息的处理S705和由基于交互操作用户的处理S710给出的消 息分组结果,按照预定的算法,生成经整合的分组结果。 0073 以上结合附图,说明了用于在消息交互环境中跟踪消息话题的方法的各种实施方 式。按照相同的发明构思,本发明还提供一种用于在消息交互环境中跟踪消息话题的设备。 0074 图8例示了根据本发明一实施例的用于包括多条消息的消息交互环境的话题跟 踪设备800。如图8所示,话题跟踪设备800包含消息选取装置802、关联消息识别装置804 和划分装置806。 0075 消息选取装置802用于选取消息交互环境中的消息。关联消息识别装置804从。

43、 消息交互环境所包括的多条消息中,识别与消息选取装置802选取的消息相关联的关联消 息。划分装置806基于关联消息识别装置804识别出的关联消息,将消息选取装置802选 取的消息划归到一个或多个话题组。 0076 按照本发明一个实施例,所述划分装置包含:用于从所识别的关联消息中提取一 个或多个背景话题关键字的装置;用于通过处理所提取的背景话题关键字,生成一个或多 个话题关键字的装置;以及用于将所选取的消息划归与所生成的一个或多个话题关键字分 别对应的一个或多个话题组的装置。 0077 按照本发明一个实施例,所述关联消息识别装置包含:用于将与所选取的消息具 有回复或转发关系的消息,识别为与所选取。

44、的消息相关联的关联消息的装置。 0078 按照本发明一个实施例,所述用于通过处理所提取的背景话题关键字,生成一个 或多个话题关键字的装置包含:用于从所选取的消息中提取一个或多个核心话题关键字的 装置;以及用于通过组合所提取的核心话题关键字和所提取的背景话题关键字,生成一个 或多个话题关键字的装置。 0079 按照本发明一个实施例,所述关联消息识别装置包含:用于识别与所选取的消息 相关联的交互操作用户的装置;用于从与所述交互操作用户相对应的消息中,识别与所选 取的消息具有回复或转发关系的消息作为与所选取的消息相关联的关联消息的装置。 0080 按照本发明一个实施例,所述用于通过处理所提取的背景话。

45、题关键字生成一个或 多个话题关键字的装置包含:用于确定所提取的背景话题关键字与交互操作用户的对应关 系的装置;用于利用所确定的对应关系,生成一个或多个话题关键字的装置。 0081 按照本发明一个实施例,所述与所选取的消息具有回复或转发关系的消息包括以 下中的至少一种:对所选取的消息进行回复或转发的消息;所选取的消息对其进行回复或 转发的消息;以及对经所选取的消息回复或转发的消息进行回复或转发的消息。 0082 按照本发明一个实施例,所述用于识别与所选取的消息相关联的交互操作用户的 装置进一步包含:用于确定用户级别的装置;用于将所确定的用户级别与预先设定的级别 阈值进行比较的装置;以及用于将级别。

46、高于该预先设定的级别阈值的用户识别为与所选取 的消息相关联的交互操作用户的装置。 0083 按照本发明一个实施例,所述用于识别与所选取的消息相关联的交互操作用户的 装置进一步包含:用于确定所要追踪的话题的预定话题领域的装置;用于获取用户的话题 偏好的装置;用于将所获取的用户的话题偏好与所确定的预定话题领域进行比较的装置; 说 明 书CN 102651719 A 12 8/10页 13 以及用于将话题偏好与所述预定话题领域匹配的用户识别为与所选取的消息相关联的交 互操作用户的装置。 0084 按照本发明一个实施例,所述关联消息识别装置进一步包含:用于将与所选取的 消息具有回复或转发关系的消息,识。

47、别为与所选取的消息相关联的第一关联消息的装置; 以及用于识别与所选取的消息相关联的交互操作用户,以及从与所述交互操作用户相对应 的消息中,识别与所选取的消息具有回复或转发关系的消息作为与所选取的消息相关联的 第二关联消息的装置,并且,所述划分装置进一步包含:用于从所选取的消息中提取一个或 多个第一核心话题关键字,以及从所识别的第一关联消息中提取一个或多个第一背景话题 关键字的装置;用于通过组合所提取的第一核心话题关键字和所提取的第一背景话题关键 字,生成一个或多个第一话题关键字的装置;用于基于所生成的第一话题关键字,获得对所 选取的消息的第一话题分类结果的装置;用于通过参考所识别的第二关联消息。

48、与交互操 作用户的对应关系,从所识别的第二关联消息中提取一个或多个第二背景话题关键字的装 置;用于基于所提取的第二背景话题关键字,获得对所选取的消息的第二话题分类结果的 装置;以及用于组合并分析所述第一话题分类结果和所述第二话题分类结果,以生成经整 合的话题分类结果的装置。 0085 需要指出的是,图8中所示的话题跟踪设备800还可以结合到交互系统服务器中, 或者与交互系统服务器远程地通信。在允许获得交互系统服务器中的交互数据的情况下, 话题跟踪设备800还可以结合到交互系统的代理服务器中。 0086 图9中给出了可以应用本发明的基于网络的消息交互环境的一个示例。多个终端 设备902-1、90。

49、2-2.902-n经由网络900与交互系统服务器901通信地耦连。交互系统服 务器901可以执行上文所述的本发明的用于在消息交互环境中跟踪消息话题的方法的各 种实施例,如图1所示的方法100;可以包含或体现上文所述的本发明的用于在消息交互环 境中跟踪消息话题的设备的各种实施例,如图8所示的设备800,由此处理发自多个终端设 备902-1、902-2.902-n的消息。网络900可以是因特网、内联网、局域网(LAN)和/或城 域网(MAN),可以是无线或有线网络。终端设备902可以包括能够连接到网络900的任何类 型的计算设备,例如台式计算机、膝上型计算机、平板式计算机、蜂窝式电话或者个人数字 助理。 0087 所属技术领域的技术人员知道,本发明可以体现为系统、方法或计算机程序产品。 因此,本发明可以具体实现为以下形式,即,可以是完全的硬件、完全的软件(包括固件、驻 留软件、微代码等)、或者本文一般称为“。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 电学 > 电通信技术


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1