社交网络用户影响数值的评估方法和装置.pdf

上传人:111****112 文档编号:4564030 上传时间:2018-10-20 格式:PDF 页数:14 大小:1.91MB
返回 下载 相关 举报
摘要
申请专利号:

CN201410508554.2

申请日:

2014.09.28

公开号:

CN104281669A

公开日:

2015.01.14

当前法律状态:

实审

有效性:

审中

法律详情:

授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20140928|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

西安电子科技大学

发明人:

鲍亮; 王焱楠

地址:

710071 陕西省西安市雁塔区太白南路2号

优先权:

专利代理机构:

北京同立钧成知识产权代理有限公司 11205

代理人:

刘芳

PDF下载: PDF下载
内容摘要

本发明涉及一种社交网络用户影响数值的评估方法和装置,其中方法包括:获取社交网络中待识别的用户以及每个待识别的用户所发布的社交消息;根据待识别的用户所发布的社交消息中每个字或词,查询字或词与兴趣主题的对应关系,确定社交消息所属的兴趣主题以及社交消息属于对应兴趣主题的概率;根据待识别的用户所发布的社交消息属于对应兴趣主题的概率,确定待识别的用户对待识别兴趣主题的关注度,构建用户网络;根据每个用户对待识别兴趣主题的关注度,以及用户网络中各个用户之间的关注关系,计算每个用户在待识别兴趣主题下的影响数值,从而根据用户在待识别兴趣主题下的影响数值,对待识别兴趣主题的社交消息的传播进行有效的控制。

权利要求书

权利要求书
1.  一种社交网络用户影响数值的评估方法,其特征在于,包括:
获取社交网络中待识别的用户以及每个待识别的用户所发布的社交消息;
对于每个待识别的用户,根据所述待识别的用户所发布的社交消息中每个字或词,查询字或词与兴趣主题的对应关系,确定所述社交消息所属的兴趣主题以及所述社交消息属于对应兴趣主题的概率;
对于每个待识别的用户,根据所述待识别的用户所发布的社交消息属于对应兴趣主题的概率,确定所述待识别的用户对待识别兴趣主题的关注度;
根据每个所述待识别的用户对所述待识别兴趣主题的关注度,构建用户网络,所述用户网络对应一个待识别兴趣主题,且所述用户网络中包括的每个用户对所述用户网络所对应的待识别兴趣主题的关注度大于预设阈值;
针对所述用户网络中的每个用户,根据每个所述用户对所述待识别兴趣主题的关注度,以及所述用户网络中各个用户之间的关注关系,计算每个所述用户在所述待识别兴趣主题下的影响数值。

2.  根据权利要求1所述的方法,其特征在于,所述针对所述用户网络中的每个用户,根据每个所述用户对所述待识别兴趣主题的关注度,以及所述用户网络中各个用户之间的关注关系,计算每个所述用户在所述待识别兴趣主题下的影响数值,包括:
针对所述用户网络中的每个用户,根据每个所述用户对所述待识别兴趣主题的关注度,以及所述用户网络中各个用户之间的关注关系,计算每个所述用户在所述待识别兴趣主题下的有效粉丝数;
针对所述用户网络中的每个用户,获取每个所述用户所发布的社交消息中属于所述待识别兴趣主题的待识别社交消息,根据每个所述用户的有效粉丝数以及发布所述待识别社交消息的各个用户之间的距离,计算每个所述用户在所述待识别兴趣主题下的影响数值。

3.  根据权利要求2所述的方法,其特征在于,采用
计算每个所述用户在所述待识别兴趣主题下的有效粉丝数;
其中,EFi表示用户i在所述待识别兴趣主题下的有效粉丝数,集合APi表示在所述用户网络中,与用户i存在关注路径的用户集合,集合Pij表示用户i到用户j的关注路径上的所有用户集合,Ak表示用户k对所述待识别兴趣主题的关注度,Fj表示用户j的绝对粉丝数。

4.  根据权利要求2或3所述的方法,其特征在于,所述每个待识别的用户所发布的社交消息包括:所述每个待识别的用户原创发布的社交消息,以及所述每个待识别的用户转发的社交消息;
采用
infui,d=[Σtwj∈Ti,d(Σux∈Ret(twj)EFx|dist(ux,start(twj))||Ret(twj)|)]|Ti,d|,]]>计算每个所述用户在所述待识别兴趣主题下的影响数值;
其中,表示用户i在待识别兴趣主题d下的影响数值,Ti,d表示用户i所发布的社交信息中属于所述待识别兴趣主题d的待识别社交消息,twj表示待识别社交消息j,Ret(twj)表示转发所述待识别社交消息j的用户集合,ux表示用户x,|Ret(twj)|表示转发所述待识别社交消息j的用户的个数,EFx表示用户x的有效粉丝数,start(twj)表示所述待识别社交消息j的原创用户,dist(ux,start(twj))表示用户x与所述待识别社交消息j的原创用户的距离,|Ti,d|表示用户i所发布的社交消息中属于所述待识别兴趣主题d的待识别社交消息的总数。

5.  根据权利要求1所述的方法,其特征在于,所述对于每个待识别的用户,根据所述待识别的用户所发布的社交消息属于对应兴趣主题的概率,确定所述待识别的用户对待识别兴趣主题的关注度,包括:
对于每个待识别的用户,根据所述待识别的用户所发布的所述社交消息属于对应兴趣主题的概率,获取所述待识别的用户所发布的社交消息属于待识别兴趣主题的概率的和;
根据所述待识别的用户所发布的社交消息属于待识别兴趣主题的概率的和,以及所述待识别的用户所发布的社交消息的数量,确定所述待识别的用 户对待识别兴趣主题的关注度。

6.  一种社交网络用户影响数值的评估装置,其特征在于,包括:
获取模块,用于获取社交网络中待识别的用户以及每个待识别的用户所发布的社交消息;
确定模块,用于对于每个待识别的用户,根据所述待识别的用户所发布的社交消息中每个字或词,查询字或词与兴趣主题的对应关系,确定所述社交消息所属的兴趣主题以及所述社交消息属于对应兴趣主题的概率;
所述确定模块,还用于对于每个待识别的用户,根据所述待识别的用户所发布的社交消息属于对应兴趣主题的概率,确定所述待识别的用户对待识别兴趣主题的关注度;
构建模块,用于根据每个所述待识别的用户对所述待识别兴趣主题的关注度,构建用户网络,所述用户网络对应一个待识别兴趣主题,且所述用户网络中包括的每个用户对所述用户网络所对应的待识别兴趣主题的关注度大于预设阈值;
计算模块,用于针对所述用户网络中的每个用户,根据每个所述用户对所述待识别兴趣主题的关注度,以及所述用户网络中各个用户之间的关注关系,计算每个所述用户在所述待识别兴趣主题下的影响数值。

7.  根据权利要求6所述的装置,其特征在于,所述计算模块具体用于,
针对所述用户网络中的每个用户,根据每个所述用户对所述待识别兴趣主题的关注度,以及所述用户网络中各个用户之间的关注关系,计算每个所述用户在所述待识别兴趣主题下的有效粉丝数;
针对所述用户网络中的每个用户,获取每个所述用户所发布的社交消息中属于所述待识别兴趣主题的待识别社交消息,根据每个所述用户的有效粉丝数以及发布所述待识别社交消息的各个用户之间的距离,计算每个所述用户在所述待识别兴趣主题下的影响数值。

8.  根据权利要求7所述的装置,其特征在于,所述计算模块具体用于,采用
计算每个所述用户在所述待识别兴趣主题下的有效粉丝数;
其中,EFi表示用户i在所述待识别兴趣主题下的有效粉丝数,集合APi表示在所述用户网络中,与用户i存在关注路径的用户集合,集合Pij表示用户i到用户j的关注路径上的所有用户集合,Ak表示用户k对所述待识别兴趣主题的关注度,Fj表示用户j的绝对粉丝数。

9.  根据权利要求7或8所述的装置,其特征在于,所述每个待识别的用户所发布的社交消息包括:所述每个待识别的用户原创发布的社交消息,以及所述每个待识别的用户转发的社交消息;
所述计算模块具体用于,采用
infui,d=[Σtwj∈Ti,d(Σux∈Ret(twj)EFx|dist(ux,start(twj))||Ret(twj)|)]|Ti,d|,]]>计算每个所述用户在所述待识别兴趣主题下的影响数值;
其中,表示用户i在待识别兴趣主题d下的影响数值,Ti,d表示用户i所发布的社交信息中属于所述待识别兴趣主题d的待识别社交消息,twj表示待识别社交消息j,Ret(twj)表示转发所述待识别社交消息j的用户集合,ux表示用户x,|Ret(twj)|表示转发所述待识别社交消息j的用户的个数,EFx表示用户x的有效粉丝数,start(twj)表示所述待识别社交消息j的原创用户,dist(ux,start(twj))表示用户x与所述待识别社交消息j的原创用户的距离,|Ti,d|表示用户i所发布的社交消息中属于所述待识别兴趣主题d的待识别社交消息的总数。

10.  根据权利要求6所述的装置,其特征在于,所述确定模块具体用于,
对于每个待识别的用户,根据所述待识别的用户所发布的所述社交消息属于对应兴趣主题的概率,获取所述待识别的用户所发布的社交消息属于待识别兴趣主题的概率的和;
根据所述待识别的用户所发布的社交消息属于待识别兴趣主题的概率的和,以及所述待识别的用户所发布的社交消息的数量,确定所述待识别的用户对待识别兴趣主题的关注度。

说明书

说明书社交网络用户影响数值的评估方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种社交网络用户影响数值的评估方法和装置。
背景技术
目前,随着网络技术的发展,微博成为当前十分流行的一种社交网络交互系统,微博的注册用户数量已经达到亿万级别。微博用户往往通过短小精悍的文本来描述新闻、事件及表达自己的观点。其中,微博用户影响数值是评估发布消息的用户的影响数值或其权威性或受关注程度等的关键参数,用户的影响数值越大,用户所受到的关注程度越高,对网络的干涉和影响作用也就越大。
现有技术中,微博用户影响数值的评估方法主要包括:对微博用户的多个操作行为进行统计分析,得到多个操作行为的数量,操作行为指的是微博消息的发布、关注和转发等,为多个操作行为设置相对应的权值,根据评估公式,计算微博用户的影响数值。然而,根据上述方法难以获取微博用户在特定主题下的影响数值,难以对特定主题的微博消息的传播进行有效的控制。
发明内容
本发明提供一种社交网络用户影响数值的评估方法和装置,用于解决现有技术中难以获取微博用户在特定主题下的影响数值的问题。
本发明的第一个方面是提供一种社交网络用户影响数值的评估方法,包括:
获取社交网络中待识别的用户以及每个待识别的用户所发布的社交消息;
对于每个待识别的用户,根据所述待识别的用户所发布的社交消息中每 个字或词,查询字或词与兴趣主题的对应关系,确定所述社交消息所属的兴趣主题以及所述社交消息属于对应兴趣主题的概率;
对于每个待识别的用户,根据所述待识别的用户所发布的社交消息属于对应兴趣主题的概率,确定所述待识别的用户对待识别兴趣主题的关注度;
根据每个所述待识别的用户对所述待识别兴趣主题的关注度,构建用户网络,所述用户网络对应一个待识别兴趣主题,且所述用户网络中包括的每个用户对所述用户网络所对应的待识别兴趣主题的关注度大于预设阈值;
针对所述用户网络中的每个用户,根据每个所述用户对所述待识别兴趣主题的关注度,以及所述用户网络中各个用户之间的关注关系,计算每个所述用户在所述待识别兴趣主题下的影响数值。
本发明的另一个方面提供一种社交网络用户影响数值的评估装置,包括:
获取模块,用于获取社交网络中待识别的用户以及每个待识别的用户所发布的社交消息;
确定模块,用于对于每个待识别的用户,根据所述待识别的用户所发布的社交消息中每个字或词,查询字或词与兴趣主题的对应关系,确定所述社交消息所属的兴趣主题以及所述社交消息属于对应兴趣主题的概率;
所述确定模块,还用于对于每个待识别的用户,根据所述待识别的用户所发布的社交消息属于对应兴趣主题的概率,确定所述待识别的用户对待识别兴趣主题的关注度;
构建模块,用于根据每个所述待识别的用户对所述待识别兴趣主题的关注度,构建用户网络,所述用户网络对应一个待识别兴趣主题,且所述用户网络中包括的每个用户对所述用户网络所对应的待识别兴趣主题的关注度大于预设阈值;
计算模块,用于针对所述用户网络中的每个用户,根据每个所述用户对所述待识别兴趣主题的关注度,以及所述用户网络中各个用户之间的关注关系,计算每个所述用户在所述待识别兴趣主题下的影响数值。
本发明中,通过获取社交网络中待识别的用户以及每个待识别的用户所发布的社交消息;根据待识别的用户所发布的社交消息中每个字或词,查询字或词与兴趣主题的对应关系,确定社交消息所属的兴趣主题以及社交消息属于对应兴趣主题的概率;根据待识别的用户所发布的社交消息属于对应兴 趣主题的概率,确定待识别的用户对待识别兴趣主题的关注度;根据每个待识别的用户对所述待识别兴趣主题的关注度,构建用户网络,用户网络对应一个待识别兴趣主题,且用户网络中包括的每个用户对用户网络所对应的待识别兴趣主题的关注度大于预设阈值;根据每个用户对待识别兴趣主题的关注度,以及用户网络中各个用户之间的关注关系,计算每个用户在待识别兴趣主题下的影响数值,从而能够根据用户在待识别兴趣主题下的影响数值,对待识别兴趣主题的社交消息的传播进行有效的控制。
附图说明
图1为本发明提供的社交网络用户影响数值的评估方法一个实施例的流程图;
图2为用户网络的示意图;
图3为本发明提供的社交网络用户影响数值的评估装置一个实施例的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明提供的社交网络用户影响数值的评估方法一个实施例的流程图,如图1所示,包括:
101、获取社交网络中待识别的用户以及每个待识别的用户所发布的社交消息。
本发明提供的社交网络用户影响数值的评估方法的执行主体可以为社交网络用户影响数值的评估装置,社交网络用户影响数值的评估装置具体为位于社交网络中服务器上的软件工具。
由于社交网络中的用户数量极大,用户消息的数量也极大,社交网络用户影响数值的评估装置难以获取社交网络中所有用户所发布的社交消息,而 社交网络中影响数值较大的用户一般为粉丝数、被关注数或社交消息发送次数较多的用户。因此,社交网络用户影响数值的评估装置可以根据用户的粉丝数、被关注数或者社交消息发送次数等来选择待识别的用户。例如,社交网络用户影响数值的评估装置可以选择粉丝数大于预设粉丝数的用户作为待识别的用户,或者,选择被关注数大于预设被关注数的用户作为待识别的用户。
其中,每个待识别的用户所发布的社交消息包括:每个待识别的用户原创发布的社交消息,以及每个待识别的用户转发的社交消息。社交消息具体可以为微博消息、微信消息、QQ消息等通过社交软件所发表的消息中的任意一种或多种。
102、对于每个待识别的用户,根据待识别的用户所发布的社交消息中每个字或词,查询字或词与兴趣主题的对应关系,确定社交消息所属的兴趣主题以及社交消息属于对应兴趣主题的概率。
其中,预设的兴趣主题可以有多个,例如:财经、政治、体育、科学或地理等等,与预设的兴趣主题对应的字或词也可以有多个,例如,与财经对应的字或词可以为:金融、经济、价格、成本或收益等等。
具体地,对于每个待识别的用户,社交网络用户影响数值的评估装置可以采用潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)的吉布斯采样(Gibbs Sampler)方法,确定社交消息所属的兴趣主题以及社交消息属于对应兴趣主题的概率。
此处以微博消息为例进行说明,采用LDA Gibbs Sampler方法确定微博消息所属的兴趣主题以及微博消息属于对应兴趣主题的概率的过程具体可以为:
第1步,设置迭代参数iteration=100,α=0.5,β=0.1。
第2步,统计待识别用户的所有微博消息中出现的不同字的个数,记个数为V,对所有的字建立索引docs,docs[t]表示索引中数字t对应的字。
第3步,设置全局变量nm和nk为零;表示第m条微博中与第k个兴趣主题对应的不同字的个数;表示t对应的字在微博消息中出现的次数;nm表示第m条微博的总字数;nk表示对应第k个兴趣主题的各个字在微博消息中出现的总次数。
第4步,对第m条微博消息中的第n个字,随机选取第n个字的兴趣主题zm,n=k,对相应的(t为第n个字对应的索引数字)、nm、nk分别加1。
第5步,进行100次的主题采样,一次主题采样是对待识别用户的所有微博消息中的每个字进行采样,对第m条微博消息中第n个字的采样如下:t为第n个字对应的索引数字,相应的nm、nk分别减1;初始化每个主题k对应的pk(主题k的采样值)
pk=nkt+β(nk+V*β)*(nmk+α)/(nm+k*α);]]>累计计算pk,pk=Σi=1kpi,]]>
记所有pk的总和为p;记u等于[0,1]之间的随机数乘以p;从第一个兴趣主题开始遍历兴趣主题k对应的pk是否大于u,若大于,则第m条微博的第n个字的采样兴趣主题为k,记新的采样兴趣主题k%=k,并且对分别加1。
第6步,对待识别用户的所有微博消息和所有兴趣主题,根据以下公式
vm,k=nmk+αnm+α,]]>
得到每个微博消息属于每个兴趣主题的概率分布vm,k。
103、对于每个待识别的用户,根据待识别的用户所发布的社交消息属于对应兴趣主题的概率,确定待识别的用户对待识别兴趣主题的关注度。
具体地,步骤103具体可以包括:对于每个待识别的用户,根据待识别的用户所发布的社交消息属于对应兴趣主题的概率,获取待识别的用户所发布的社交消息属于待识别兴趣主题的概率的和;根据待识别的用户所发布的社交消息属于待识别兴趣主题的概率的和,以及待识别的用户所发布的社交消息的数量,确定待识别的用户对待识别兴趣主题的关注度。待识别的用户对待识别兴趣主题的关注度,也就是待识别的用户关注待识别兴趣主题的概率。
104、根据每个待识别的用户对待识别兴趣主题的关注度,构建用户网络,用户网络对应一个待识别兴趣主题,且用户网络中包括的每个用户对用户网络所对应的待识别兴趣主题的关注度大于预设阈值。
具体地,社交网络用户影响数值的评估装置具体可以根据待识别的用户对待识别兴趣主题的关注度,确定关注待识别兴趣主题的用户,根据关注待 识别兴趣主题的用户构建待识别兴趣主题对应的用户网络。例如,用户网络具体可以如图2所示,图2中用户之间的连接关系指的是用户之间的关注关系。
105、针对用户网络中的每个用户,根据每个用户对待识别兴趣主题的关注度,以及用户网络中各个用户之间的关注关系,计算每个用户在待识别兴趣主题下的影响数值。
其中,步骤105具体可以包括:针对用户网络中的每个用户,根据每个用户对待识别兴趣主题的关注度,以及用户网络中各个用户之间的关注关系,计算每个用户在待识别兴趣主题下的有效粉丝数;针对用户网络中的每个用户,获取每个用户所发布的社交消息中属于待识别兴趣主题的待识别社交消息,根据每个用户的有效粉丝数以及发布待识别社交消息的各个用户之间的距离,计算每个用户在待识别兴趣主题下的影响数值。
具体地,可以采用
计算每个用户在待识别兴趣主题下的有效粉丝数;
其中,EFi表示用户i在待识别兴趣主题下的有效粉丝数,集合APi表示在用户网络中,与用户i存在关注路径的用户集合,集合Pij表示用户i到用户j的关注路径上的所有用户集合,Ak表示用户k对待识别兴趣主题的关注度,Fj表示用户j的绝对粉丝数。
与用户i存在关注路径的用户集合,指的是关注过用户i、关注过用户i的粉丝、或者通过多个用户间接关注过用户i的用户集合。例如,若用户j关注了用户A、用户A关注了用户B、用户B关注了用户C、用户C关注了用户i,则用户j、用户A和用户B为间接关注过用户i的用户,用户j、用户A和用户B为与用户i存在关注路径的用户;用户j、用户A、用户B、用户C和用户i组成的集合为用户i到用户j的关注路径上的所有用户集合。用户j的绝对粉丝数指的是微博主页等上看到的用户j的粉丝数。
具体地,每个待识别的用户所发布的社交消息包括:每个待识别的用户原创发布的社交消息,以及每个待识别的用户转发的社交消息;
对应的,可以采用
infui,d=[Σtwj∈Ti,d(Σux∈Ret(twj)EFx|dist(ux,start(twj))||Ret(twj)|)]|Ti,d|,]]>计算每个用户在待识别兴趣主题下的影响数值;
其中,表示用户i在待识别兴趣主题d下的影响数值,Ti,d表示用户i所发布的社交信息中属于待识别兴趣主题d的待识别社交消息,twj表示待识别社交消息j,Ret(twj)表示转发待识别社交消息j的用户集合,ux表示用户x,|Ret(twj)|表示转发待识别社交消息j的用户的个数,EFx表示用户x的有效粉丝数,start(twj)表示待识别社交消息j的原创用户,dist(ux,start(twj))表示用户x与待识别社交消息j的原创用户的距离,|Ti,d|表示用户i所发布的社交消息中属于待识别兴趣主题d的待识别社交消息的总数。
本实施例中,通过获取社交网络中待识别的用户以及每个待识别的用户所发布的社交消息;根据待识别的用户所发布的社交消息中每个字或词,查询字或词与兴趣主题的对应关系,确定社交消息所属的兴趣主题以及社交消息属于对应兴趣主题的概率;根据待识别的用户所发布的社交消息属于对应兴趣主题的概率,确定待识别的用户对待识别兴趣主题的关注度;根据每个待识别的用户对所述待识别兴趣主题的关注度,构建用户网络,用户网络对应一个待识别兴趣主题,且用户网络中包括的每个用户对用户网络所对应的待识别兴趣主题的关注度大于预设阈值;根据每个用户对待识别兴趣主题的关注度,以及用户网络中各个用户之间的关注关系,计算每个用户在待识别兴趣主题下的影响数值,从而能够根据用户在待识别兴趣主题下的影响数值,对待识别兴趣主题的社交消息的传播进行有效的控制。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
图3为本发明提供的社交网络用户影响数值的评估装置一个实施例的结构示意图,如图3所示,包括:
获取模块31,用于获取社交网络中待识别的用户以及每个待识别的用户所发布的社交消息。
其中,每个待识别的用户所发布的社交消息包括:每个待识别的用户原创发布的社交消息,以及每个待识别的用户转发的社交消息。社交消息具体可以为微博消息、微信消息、QQ消息等通过社交软件所发表的消息中的任意一种或多种。
确定模块32,用于对于每个待识别的用户,根据待识别的用户所发布的社交消息中每个字或词,查询字或词与兴趣主题的对应关系,确定社交消息所属的兴趣主题以及社交消息属于对应兴趣主题的概率。
具体地,对于每个待识别的用户,确定模块32具体可以根据待识别的用户所发布的社交消息中每个字或词,查询字或词与兴趣主题的对应关系,确定社交消息所属的兴趣主题;根据社交消息中与各个兴趣主题对应的不同字的个数以及字的出现次数,确定社交消息所属的兴趣主题以及社交消息属于对应兴趣主题的概率。
确定模块32,还用于对于每个待识别的用户,根据待识别的用户所发布的社交消息属于对应兴趣主题的概率,确定待识别的用户对待识别兴趣主题的关注度。
其中,确定模块32具体用于,对于每个待识别的用户,根据待识别的用户所发布的社交消息属于对应兴趣主题的概率,获取待识别的用户所发布的社交消息属于待识别兴趣主题的概率的和;根据待识别的用户所发布的社交消息属于待识别兴趣主题的概率的和,以及待识别的用户所发布的社交消息的数量,确定待识别的用户对待识别兴趣主题的关注度。
构建模块33,用于每个根据待识别的用户对待识别兴趣主题的关注度,构建用户网络,用户网络对应一个待识别兴趣主题,且用户网络中包括的每个用户对用户网络所对应的待识别兴趣主题的关注度大于预设阈值。
计算模块34,用于针对用户网络中的每个用户,根据每个用户对待识别兴趣主题的关注度,以及用户网络中各个用户之间的关注关系,计算每个用 户在待识别兴趣主题下的影响数值。
进一步地,计算模块34具体用于,针对用户网络中的每个用户,根据每个用户对待识别兴趣主题的关注度,以及用户网络中各个用户之间的关注关系,计算每个用户在待识别兴趣主题下的有效粉丝数;针对用户网络中的每个用户,获取每个用户所发布的社交消息中属于待识别兴趣主题的待识别社交消息,根据每个用户的有效粉丝数以及发布待识别社交消息的各个用户之间的距离,计算每个用户在待识别兴趣主题下的影响数值。
更进一步地,计算模块34具体用于,采用
计算每个用户在待识别兴趣主题下的有效粉丝数;
其中,EFi表示用户i在待识别兴趣主题下的有效粉丝数,集合APi表示在用户网络中,与用户i存在关注路径的用户集合,集合Pij表示用户i到用户j的关注路径上的所有用户集合,Ak表示用户k对待识别兴趣主题的关注度,Fj表示用户j的绝对粉丝数。
再进一步地,每个待识别的用户所发布的社交消息包括:每个待识别的用户原创发布的社交消息,以及每个待识别的用户转发的社交消息;
对应的,计算模块34具体用于,采用
infui,d=[Σtwj∈Ti,d(Σux∈Ret(twj)EFx|dist(ux,start(twj))||Ret(twj)|)]|Ti,d|,]]>计算每个用户在待识别兴趣主题下的影响数值;
其中,表示用户i在待识别兴趣主题d下的影响数值,Ti,d表示用户i所发布的社交信息中属于待识别兴趣主题d的待识别社交消息,twj表示待识别社交消息j,Ret(twj)表示转发待识别社交消息j的用户集合,ux表示用户x,|Ret(twj)|表示转发待识别社交消息j的用户的个数,EFx表示用户x的有效粉丝数,start(twj)表示待识别社交消息j的原创用户,dist(ux,start(twj))表示用户x与待识别社交消息j的原创用户的距离,|Ti,d|表 示用户i所发布的社交消息中属于待识别兴趣主题d的待识别社交消息的总数。
本实施例中,通过获取社交网络中待识别的用户以及每个待识别的用户所发布的社交消息;根据待识别的用户所发布的社交消息中每个字或词,查询字或词与兴趣主题的对应关系,确定社交消息所属的兴趣主题以及社交消息属于对应兴趣主题的概率;根据待识别的用户所发布的社交消息属于对应兴趣主题的概率,确定待识别的用户对待识别兴趣主题的关注度;根据每个待识别的用户对所述待识别兴趣主题的关注度,构建用户网络,用户网络对应一个待识别兴趣主题,且用户网络中包括的每个用户对用户网络所对应的待识别兴趣主题的关注度大于预设阈值;根据每个用户对待识别兴趣主题的关注度,以及用户网络中各个用户之间的关注关系,计算每个用户在待识别兴趣主题下的影响数值,从而能够根据用户在待识别兴趣主题下的影响数值,对待识别兴趣主题的社交消息的传播进行有效的控制。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

社交网络用户影响数值的评估方法和装置.pdf_第1页
第1页 / 共14页
社交网络用户影响数值的评估方法和装置.pdf_第2页
第2页 / 共14页
社交网络用户影响数值的评估方法和装置.pdf_第3页
第3页 / 共14页
点击查看更多>>
资源描述

《社交网络用户影响数值的评估方法和装置.pdf》由会员分享,可在线阅读,更多相关《社交网络用户影响数值的评估方法和装置.pdf(14页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 104281669 A (43)申请公布日 2015.01.14 CN 104281669 A (21)申请号 201410508554.2 (22)申请日 2014.09.28 G06F 17/30(2006.01) (71)申请人 西安电子科技大学 地址 710071 陕西省西安市雁塔区太白南路 2 号 (72)发明人 鲍亮 王焱楠 (74)专利代理机构 北京同立钧成知识产权代理 有限公司 11205 代理人 刘芳 (54) 发明名称 社交网络用户影响数值的评估方法和装置 (57) 摘要 本发明涉及一种社交网络用户影响数值的评 估方法和装置, 其中方法包括 : 获。

2、取社交网络中 待识别的用户以及每个待识别的用户所发布的社 交消息 ; 根据待识别的用户所发布的社交消息中 每个字或词, 查询字或词与兴趣主题的对应关系, 确定社交消息所属的兴趣主题以及社交消息属 于对应兴趣主题的概率 ; 根据待识别的用户所发 布的社交消息属于对应兴趣主题的概率, 确定待 识别的用户对待识别兴趣主题的关注度, 构建用 户网络 ; 根据每个用户对待识别兴趣主题的关注 度, 以及用户网络中各个用户之间的关注关系, 计 算每个用户在待识别兴趣主题下的影响数值, 从 而根据用户在待识别兴趣主题下的影响数值, 对 待识别兴趣主题的社交消息的传播进行有效的控 制。 (51)Int.Cl. 。

3、权利要求书 4 页 说明书 7 页 附图 2 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书4页 说明书7页 附图2页 (10)申请公布号 CN 104281669 A CN 104281669 A 1/4 页 2 1. 一种社交网络用户影响数值的评估方法, 其特征在于, 包括 : 获取社交网络中待识别的用户以及每个待识别的用户所发布的社交消息 ; 对于每个待识别的用户, 根据所述待识别的用户所发布的社交消息中每个字或词, 查 询字或词与兴趣主题的对应关系, 确定所述社交消息所属的兴趣主题以及所述社交消息属 于对应兴趣主题的概率 ; 对于每个待识别的用户, 根据所述。

4、待识别的用户所发布的社交消息属于对应兴趣主题 的概率, 确定所述待识别的用户对待识别兴趣主题的关注度 ; 根据每个所述待识别的用户对所述待识别兴趣主题的关注度, 构建用户网络, 所述用 户网络对应一个待识别兴趣主题, 且所述用户网络中包括的每个用户对所述用户网络所对 应的待识别兴趣主题的关注度大于预设阈值 ; 针对所述用户网络中的每个用户, 根据每个所述用户对所述待识别兴趣主题的关注 度, 以及所述用户网络中各个用户之间的关注关系, 计算每个所述用户在所述待识别兴趣 主题下的影响数值。 2. 根据权利要求 1 所述的方法, 其特征在于, 所述针对所述用户网络中的每个用户, 根 据每个所述用户对。

5、所述待识别兴趣主题的关注度, 以及所述用户网络中各个用户之间的关 注关系, 计算每个所述用户在所述待识别兴趣主题下的影响数值, 包括 : 针对所述用户网络中的每个用户, 根据每个所述用户对所述待识别兴趣主题的关注 度, 以及所述用户网络中各个用户之间的关注关系, 计算每个所述用户在所述待识别兴趣 主题下的有效粉丝数 ; 针对所述用户网络中的每个用户, 获取每个所述用户所发布的社交消息中属于所述待 识别兴趣主题的待识别社交消息, 根据每个所述用户的有效粉丝数以及发布所述待识别社 交消息的各个用户之间的距离, 计算每个所述用户在所述待识别兴趣主题下的影响数值。 3. 根据权利要求 2 所述的方法,。

6、 其特征在于, 采用 计算每个所述用户在所述待识别兴趣主题下的有效 粉丝数 ; 其中, EFi表示用户 i 在所述待识别兴趣主题下的有效粉丝数, 集合 APi表示在所述用 户网络中, 与用户 i 存在关注路径的用户集合, 集合 Pij表示用户 i 到用户 j 的关注路径上 的所有用户集合, Ak表示用户 k 对所述待识别兴趣主题的关注度, Fj表示用户 j 的绝对粉 丝数。 4.根据权利要求2或3所述的方法, 其特征在于, 所述每个待识别的用户所发布的社交 消息包括 : 所述每个待识别的用户原创发布的社交消息, 以及所述每个待识别的用户转发 的社交消息 ; 采用 权 利 要 求 书 CN 10。

7、4281669 A 2 2/4 页 3 计算每个所述用户在 所述待识别兴趣主题下的影响数值 ; 其中,表示用户 i 在待识别兴趣主题 d 下的影响数值, Ti,d表示用户 i 所发布的 社交信息中属于所述待识别兴趣主题 d 的待识别社交消息, twj表示待识别社交消息 j, Ret(twj) 表示转发所述待识别社交消息 j 的用户集合, ux表示用户 x, |Ret(twj)| 表示转发 所述待识别社交消息 j 的用户的个数, EFx表示用户 x 的有效粉丝数, start(twj) 表示所述 待识别社交消息 j 的原创用户, dist(ux,start(twj) 表示用户 x 与所述待识别社。

8、交消息 j 的原创用户的距离, |Ti,d|表示用户i所发布的社交消息中属于所述待识别兴趣主题d的待 识别社交消息的总数。 5. 根据权利要求 1 所述的方法, 其特征在于, 所述对于每个待识别的用户, 根据所述待 识别的用户所发布的社交消息属于对应兴趣主题的概率, 确定所述待识别的用户对待识别 兴趣主题的关注度, 包括 : 对于每个待识别的用户, 根据所述待识别的用户所发布的所述社交消息属于对应兴趣 主题的概率, 获取所述待识别的用户所发布的社交消息属于待识别兴趣主题的概率的和 ; 根据所述待识别的用户所发布的社交消息属于待识别兴趣主题的概率的和, 以及所述 待识别的用户所发布的社交消息的数。

9、量, 确定所述待识别的用户对待识别兴趣主题的关注 度。 6. 一种社交网络用户影响数值的评估装置, 其特征在于, 包括 : 获取模块, 用于获取社交网络中待识别的用户以及每个待识别的用户所发布的社交消 息 ; 确定模块, 用于对于每个待识别的用户, 根据所述待识别的用户所发布的社交消息中 每个字或词, 查询字或词与兴趣主题的对应关系, 确定所述社交消息所属的兴趣主题以及 所述社交消息属于对应兴趣主题的概率 ; 所述确定模块, 还用于对于每个待识别的用户, 根据所述待识别的用户所发布的社交 消息属于对应兴趣主题的概率, 确定所述待识别的用户对待识别兴趣主题的关注度 ; 构建模块, 用于根据每个所。

10、述待识别的用户对所述待识别兴趣主题的关注度, 构建用 户网络, 所述用户网络对应一个待识别兴趣主题, 且所述用户网络中包括的每个用户对所 述用户网络所对应的待识别兴趣主题的关注度大于预设阈值 ; 计算模块, 用于针对所述用户网络中的每个用户, 根据每个所述用户对所述待识别兴 趣主题的关注度, 以及所述用户网络中各个用户之间的关注关系, 计算每个所述用户在所 述待识别兴趣主题下的影响数值。 7. 根据权利要求 6 所述的装置, 其特征在于, 所述计算模块具体用于, 权 利 要 求 书 CN 104281669 A 3 3/4 页 4 针对所述用户网络中的每个用户, 根据每个所述用户对所述待识别兴。

11、趣主题的关注 度, 以及所述用户网络中各个用户之间的关注关系, 计算每个所述用户在所述待识别兴趣 主题下的有效粉丝数 ; 针对所述用户网络中的每个用户, 获取每个所述用户所发布的社交消息中属于所述待 识别兴趣主题的待识别社交消息, 根据每个所述用户的有效粉丝数以及发布所述待识别社 交消息的各个用户之间的距离, 计算每个所述用户在所述待识别兴趣主题下的影响数值。 8. 根据权利要求 7 所述的装置, 其特征在于, 所述计算模块具体用于, 采用 计算每个所述用户在所述待识别兴趣主题下的有效 粉丝数 ; 其中, EFi表示用户 i 在所述待识别兴趣主题下的有效粉丝数, 集合 APi表示在所述用 户网。

12、络中, 与用户 i 存在关注路径的用户集合, 集合 Pij表示用户 i 到用户 j 的关注路径上 的所有用户集合, Ak表示用户 k 对所述待识别兴趣主题的关注度, Fj表示用户 j 的绝对粉 丝数。 9.根据权利要求7或8所述的装置, 其特征在于, 所述每个待识别的用户所发布的社交 消息包括 : 所述每个待识别的用户原创发布的社交消息, 以及所述每个待识别的用户转发 的社交消息 ; 所述计算模块具体用于, 采用 计算每个所述用户在 所述待识别兴趣主题下的影响数值 ; 其中,表示用户 i 在待识别兴趣主题 d 下的影响数值, Ti,d表示用户 i 所发布的 社交信息中属于所述待识别兴趣主题 d。

13、 的待识别社交消息, twj表示待识别社交消息 j, Ret(twj) 表示转发所述待识别社交消息 j 的用户集合, ux表示用户 x, |Ret(twj)| 表示转发 所述待识别社交消息 j 的用户的个数, EFx表示用户 x 的有效粉丝数, start(twj) 表示所述 待识别社交消息 j 的原创用户, dist(ux,start(twj) 表示用户 x 与所述待识别社交消息 j 的原创用户的距离, |Ti,d|表示用户i所发布的社交消息中属于所述待识别兴趣主题d的待 识别社交消息的总数。 10. 根据权利要求 6 所述的装置, 其特征在于, 所述确定模块具体用于, 对于每个待识别的用户。

14、, 根据所述待识别的用户所发布的所述社交消息属于对应兴趣 主题的概率, 获取所述待识别的用户所发布的社交消息属于待识别兴趣主题的概率的和 ; 根据所述待识别的用户所发布的社交消息属于待识别兴趣主题的概率的和, 以及所述 权 利 要 求 书 CN 104281669 A 4 4/4 页 5 待识别的用户所发布的社交消息的数量, 确定所述待识别的用户对待识别兴趣主题的关注 度。 权 利 要 求 书 CN 104281669 A 5 1/7 页 6 社交网络用户影响数值的评估方法和装置 技术领域 0001 本发明涉及计算机技术领域, 尤其涉及一种社交网络用户影响数值的评估方法和 装置。 背景技术 0。

15、002 目前, 随着网络技术的发展, 微博成为当前十分流行的一种社交网络交互系统, 微 博的注册用户数量已经达到亿万级别。微博用户往往通过短小精悍的文本来描述新闻、 事 件及表达自己的观点。其中, 微博用户影响数值是评估发布消息的用户的影响数值或其权 威性或受关注程度等的关键参数, 用户的影响数值越大, 用户所受到的关注程度越高, 对网 络的干涉和影响作用也就越大。 0003 现有技术中, 微博用户影响数值的评估方法主要包括 : 对微博用户的多个操作行 为进行统计分析, 得到多个操作行为的数量, 操作行为指的是微博消息的发布、 关注和转发 等, 为多个操作行为设置相对应的权值, 根据评估公式,。

16、 计算微博用户的影响数值。 然而, 根 据上述方法难以获取微博用户在特定主题下的影响数值, 难以对特定主题的微博消息的传 播进行有效的控制。 发明内容 0004 本发明提供一种社交网络用户影响数值的评估方法和装置, 用于解决现有技术中 难以获取微博用户在特定主题下的影响数值的问题。 0005 本发明的第一个方面是提供一种社交网络用户影响数值的评估方法, 包括 : 0006 获取社交网络中待识别的用户以及每个待识别的用户所发布的社交消息 ; 0007 对于每个待识别的用户, 根据所述待识别的用户所发布的社交消息中每个字或 词, 查询字或词与兴趣主题的对应关系, 确定所述社交消息所属的兴趣主题以及。

17、所述社交 消息属于对应兴趣主题的概率 ; 0008 对于每个待识别的用户, 根据所述待识别的用户所发布的社交消息属于对应兴趣 主题的概率, 确定所述待识别的用户对待识别兴趣主题的关注度 ; 0009 根据每个所述待识别的用户对所述待识别兴趣主题的关注度, 构建用户网络, 所 述用户网络对应一个待识别兴趣主题, 且所述用户网络中包括的每个用户对所述用户网络 所对应的待识别兴趣主题的关注度大于预设阈值 ; 0010 针对所述用户网络中的每个用户, 根据每个所述用户对所述待识别兴趣主题的关 注度, 以及所述用户网络中各个用户之间的关注关系, 计算每个所述用户在所述待识别兴 趣主题下的影响数值。 00。

18、11 本发明的另一个方面提供一种社交网络用户影响数值的评估装置, 包括 : 0012 获取模块, 用于获取社交网络中待识别的用户以及每个待识别的用户所发布的社 交消息 ; 0013 确定模块, 用于对于每个待识别的用户, 根据所述待识别的用户所发布的社交消 说 明 书 CN 104281669 A 6 2/7 页 7 息中每个字或词, 查询字或词与兴趣主题的对应关系, 确定所述社交消息所属的兴趣主题 以及所述社交消息属于对应兴趣主题的概率 ; 0014 所述确定模块, 还用于对于每个待识别的用户, 根据所述待识别的用户所发布的 社交消息属于对应兴趣主题的概率, 确定所述待识别的用户对待识别兴趣。

19、主题的关注度 ; 0015 构建模块, 用于根据每个所述待识别的用户对所述待识别兴趣主题的关注度, 构 建用户网络, 所述用户网络对应一个待识别兴趣主题, 且所述用户网络中包括的每个用户 对所述用户网络所对应的待识别兴趣主题的关注度大于预设阈值 ; 0016 计算模块, 用于针对所述用户网络中的每个用户, 根据每个所述用户对所述待识 别兴趣主题的关注度, 以及所述用户网络中各个用户之间的关注关系, 计算每个所述用户 在所述待识别兴趣主题下的影响数值。 0017 本发明中, 通过获取社交网络中待识别的用户以及每个待识别的用户所发布的社 交消息 ; 根据待识别的用户所发布的社交消息中每个字或词, 。

20、查询字或词与兴趣主题的对 应关系, 确定社交消息所属的兴趣主题以及社交消息属于对应兴趣主题的概率 ; 根据待识 别的用户所发布的社交消息属于对应兴趣主题的概率, 确定待识别的用户对待识别兴趣主 题的关注度 ; 根据每个待识别的用户对所述待识别兴趣主题的关注度, 构建用户网络, 用户 网络对应一个待识别兴趣主题, 且用户网络中包括的每个用户对用户网络所对应的待识别 兴趣主题的关注度大于预设阈值 ; 根据每个用户对待识别兴趣主题的关注度, 以及用户网 络中各个用户之间的关注关系, 计算每个用户在待识别兴趣主题下的影响数值, 从而能够 根据用户在待识别兴趣主题下的影响数值, 对待识别兴趣主题的社交消。

21、息的传播进行有效 的控制。 附图说明 0018 图 1 为本发明提供的社交网络用户影响数值的评估方法一个实施例的流程图 ; 0019 图 2 为用户网络的示意图 ; 0020 图 3 为本发明提供的社交网络用户影响数值的评估装置一个实施例的结构示意 图。 具体实施方式 0021 为使本发明实施例的目的、 技术方案和优点更加清楚, 下面将结合本发明实施例 中的附图, 对本发明实施例中的技术方案进行清楚、 完整地描述, 显然, 所描述的实施例是 本发明一部分实施例, 而不是全部的实施例。 基于本发明中的实施例, 本领域普通技术人员 在没有做出创造性劳动前提下所获得的所有其他实施例, 都属于本发明保。

22、护的范围。 0022 图 1 为本发明提供的社交网络用户影响数值的评估方法一个实施例的流程图, 如 图 1 所示, 包括 : 0023 101、 获取社交网络中待识别的用户以及每个待识别的用户所发布的社交消息。 0024 本发明提供的社交网络用户影响数值的评估方法的执行主体可以为社交网络用 户影响数值的评估装置, 社交网络用户影响数值的评估装置具体为位于社交网络中服务器 上的软件工具。 0025 由于社交网络中的用户数量极大, 用户消息的数量也极大, 社交网络用户影响数 说 明 书 CN 104281669 A 7 3/7 页 8 值的评估装置难以获取社交网络中所有用户所发布的社交消息, 而社。

23、交网络中影响数值较 大的用户一般为粉丝数、 被关注数或社交消息发送次数较多的用户。 因此, 社交网络用户影 响数值的评估装置可以根据用户的粉丝数、 被关注数或者社交消息发送次数等来选择待识 别的用户。例如, 社交网络用户影响数值的评估装置可以选择粉丝数大于预设粉丝数的用 户作为待识别的用户, 或者, 选择被关注数大于预设被关注数的用户作为待识别的用户。 0026 其中, 每个待识别的用户所发布的社交消息包括 : 每个待识别的用户原创发布的 社交消息, 以及每个待识别的用户转发的社交消息。 社交消息具体可以为微博消息、 微信消 息、 QQ 消息等通过社交软件所发表的消息中的任意一种或多种。 00。

24、27 102、 对于每个待识别的用户, 根据待识别的用户所发布的社交消息中每个字或 词, 查询字或词与兴趣主题的对应关系, 确定社交消息所属的兴趣主题以及社交消息属于 对应兴趣主题的概率。 0028 其中, 预设的兴趣主题可以有多个, 例如 : 财经、 政治、 体育、 科学或地理等等, 与预 设的兴趣主题对应的字或词也可以有多个, 例如, 与财经对应的字或词可以为 : 金融、 经济、 价格、 成本或收益等等。 0029 具体地, 对于每个待识别的用户, 社交网络用户影响数值的评估装置可以采用潜 在狄利克雷分布(Latent Dirichlet Allocation, LDA)的吉布斯采样(Gi。

25、bbs Sampler)方 法, 确定社交消息所属的兴趣主题以及社交消息属于对应兴趣主题的概率。 0030 此处以微博消息为例进行说明, 采用 LDA Gibbs Sampler 方法确定微博消息所属 的兴趣主题以及微博消息属于对应兴趣主题的概率的过程具体可以为 : 0031 第 1 步, 设置迭代参数 iteration 100, 0.5, 0.1。 0032 第 2 步, 统计待识别用户的所有微博消息中出现的不同字的个数, 记个数为 V, 对 所有的字建立索引 docs, docst 表示索引中数字 t 对应的字。 0033 第 3 步, 设置全局变量nm和 nk为零 ; 表示第 m 条微。

26、博中与第 k 个兴 趣主题对应的不同字的个数 ; 表示 t 对应的字在微博消息中出现的次数 ; nm表示第 m 条 微博的总字数 ; nk表示对应第 k 个兴趣主题的各个字在微博消息中出现的总次数。 0034 第 4 步, 对第 m 条微博消息中的第 n 个字, 随机选取第 n 个字的兴趣主题 zm,n k, 对相应的(t 为第 n 个字对应的索引数字 )、 nm、 nk分别加 1。 0035 第5步, 进行100次的主题采样, 一次主题采样是对待识别用户的所有微博消息中 的每个字进行采样, 对第 m 条微博消息中第 n 个字的采样如下 : t 为第 n 个字对应的索引数 字, 相应的nm、 。

27、nk分别减 1 ; 初始化每个主题 k 对应的 pk( 主题 k 的采样值 ) 0036 累计计算 pk, 0037 记所有 pk的总和为 p ; 记 u 等于 0,1 之间的随机数乘以 p ; 从第一个兴趣主题开 始遍历兴趣主题 k 对应的 pk是否大于 u, 若大于, 则第 m 条微博的第 n 个字的采样兴趣主题 为 k, 记新的采样兴趣主题 k k, 并且对分别加 1。 说 明 书 CN 104281669 A 8 4/7 页 9 0038 第 6 步, 对待识别用户的所有微博消息和所有兴趣主题, 根据以下公式 0039 0040 得到每个微博消息属于每个兴趣主题的概率分布 vm,k。 。

28、0041 103、 对于每个待识别的用户, 根据待识别的用户所发布的社交消息属于对应兴趣 主题的概率, 确定待识别的用户对待识别兴趣主题的关注度。 0042 具体地, 步骤 103 具体可以包括 : 对于每个待识别的用户, 根据待识别的用户所发 布的社交消息属于对应兴趣主题的概率, 获取待识别的用户所发布的社交消息属于待识别 兴趣主题的概率的和 ; 根据待识别的用户所发布的社交消息属于待识别兴趣主题的概率的 和, 以及待识别的用户所发布的社交消息的数量, 确定待识别的用户对待识别兴趣主题的 关注度。待识别的用户对待识别兴趣主题的关注度, 也就是待识别的用户关注待识别兴趣 主题的概率。 0043。

29、 104、 根据每个待识别的用户对待识别兴趣主题的关注度, 构建用户网络, 用户网 络对应一个待识别兴趣主题, 且用户网络中包括的每个用户对用户网络所对应的待识别兴 趣主题的关注度大于预设阈值。 0044 具体地, 社交网络用户影响数值的评估装置具体可以根据待识别的用户对待识别 兴趣主题的关注度, 确定关注待识别兴趣主题的用户, 根据关注待识别兴趣主题的用户构 建待识别兴趣主题对应的用户网络。例如, 用户网络具体可以如图 2 所示, 图 2 中用户之间 的连接关系指的是用户之间的关注关系。 0045 105、 针对用户网络中的每个用户, 根据每个用户对待识别兴趣主题的关注度, 以 及用户网络中。

30、各个用户之间的关注关系, 计算每个用户在待识别兴趣主题下的影响数值。 0046 其中, 步骤 105 具体可以包括 : 针对用户网络中的每个用户, 根据每个用户对待识 别兴趣主题的关注度, 以及用户网络中各个用户之间的关注关系, 计算每个用户在待识别 兴趣主题下的有效粉丝数 ; 针对用户网络中的每个用户, 获取每个用户所发布的社交消息 中属于待识别兴趣主题的待识别社交消息, 根据每个用户的有效粉丝数以及发布待识别社 交消息的各个用户之间的距离, 计算每个用户在待识别兴趣主题下的影响数值。 0047 具体地, 可以采用 0048 计算每个用户在待识别兴趣主题下的有效粉丝 数 ; 0049 其中,。

31、 EFi表示用户 i 在待识别兴趣主题下的有效粉丝数, 集合 APi表示在用户网 络中, 与用户 i 存在关注路径的用户集合, 集合 Pij表示用户 i 到用户 j 的关注路径上的所 有用户集合, Ak表示用户 k 对待识别兴趣主题的关注度, Fj表示用户 j 的绝对粉丝数。 0050 与用户i存在关注路径的用户集合, 指的是关注过用户i、 关注过用户i的粉丝、 或 者通过多个用户间接关注过用户 i 的用户集合。例如, 若用户 j 关注了用户 A、 用户 A 关注 了用户 B、 用户 B 关注了用户 C、 用户 C 关注了用户 i, 则用户 j、 用户 A 和用户 B 为间接关注 过用户 i 。

32、的用户, 用户 j、 用户 A 和用户 B 为与用户 i 存在关注路径的用户 ; 用户 j、 用户 A、 说 明 书 CN 104281669 A 9 5/7 页 10 用户 B、 用户 C 和用户 i 组成的集合为用户 i 到用户 j 的关注路径上的所有用户集合。用户 j 的绝对粉丝数指的是微博主页等上看到的用户 j 的粉丝数。 0051 具体地, 每个待识别的用户所发布的社交消息包括 : 每个待识别的用户原创发布 的社交消息, 以及每个待识别的用户转发的社交消息 ; 0052 对应的, 可以采用 0053 计算每个用户在 待识别兴趣主题下的影响数值 ; 0054 其中,表示用户 i 在待识。

33、别兴趣主题 d 下的影响数值, Ti,d表示用户 i 所发 布的社交信息中属于待识别兴趣主题 d 的待识别社交消息, twj表示待识别社交消息 j, Ret(twj) 表示转发待识别社交消息 j 的用户集合, ux表示用户 x, |Ret(twj)| 表示转发待识 别社交消息 j 的用户的个数, EFx表示用户 x 的有效粉丝数, start(twj) 表示待识别社交消 息j的原创用户, dist(ux,start(twj)表示用户x与待识别社交消息j的原创用户的距离, |Ti,d| 表示用户 i 所发布的社交消息中属于待识别兴趣主题 d 的待识别社交消息的总数。 0055 本实施例中, 通过。

34、获取社交网络中待识别的用户以及每个待识别的用户所发布的 社交消息 ; 根据待识别的用户所发布的社交消息中每个字或词, 查询字或词与兴趣主题的 对应关系, 确定社交消息所属的兴趣主题以及社交消息属于对应兴趣主题的概率 ; 根据待 识别的用户所发布的社交消息属于对应兴趣主题的概率, 确定待识别的用户对待识别兴趣 主题的关注度 ; 根据每个待识别的用户对所述待识别兴趣主题的关注度, 构建用户网络, 用 户网络对应一个待识别兴趣主题, 且用户网络中包括的每个用户对用户网络所对应的待识 别兴趣主题的关注度大于预设阈值 ; 根据每个用户对待识别兴趣主题的关注度, 以及用户 网络中各个用户之间的关注关系, 。

35、计算每个用户在待识别兴趣主题下的影响数值, 从而能 够根据用户在待识别兴趣主题下的影响数值, 对待识别兴趣主题的社交消息的传播进行有 效的控制。 0056 本领域普通技术人员可以理解 : 实现上述各方法实施例的全部或部分步骤可以通 过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程 序在执行时, 执行包括上述各方法实施例的步骤 ; 而前述的存储介质包括 : ROM、 RAM、 磁碟 或者光盘等各种可以存储程序代码的介质。 0057 图 3 为本发明提供的社交网络用户影响数值的评估装置一个实施例的结构示意 图, 如图 3 所示, 包括 : 0058 获取模块 31, 。

36、用于获取社交网络中待识别的用户以及每个待识别的用户所发布的 社交消息。 0059 其中, 每个待识别的用户所发布的社交消息包括 : 每个待识别的用户原创发布的 说 明 书 CN 104281669 A 10 6/7 页 11 社交消息, 以及每个待识别的用户转发的社交消息。 社交消息具体可以为微博消息、 微信消 息、 QQ 消息等通过社交软件所发表的消息中的任意一种或多种。 0060 确定模块 32, 用于对于每个待识别的用户, 根据待识别的用户所发布的社交消息 中每个字或词, 查询字或词与兴趣主题的对应关系, 确定社交消息所属的兴趣主题以及社 交消息属于对应兴趣主题的概率。 0061 具体地。

37、, 对于每个待识别的用户, 确定模块 32 具体可以根据待识别的用户所发布 的社交消息中每个字或词, 查询字或词与兴趣主题的对应关系, 确定社交消息所属的兴趣 主题 ; 根据社交消息中与各个兴趣主题对应的不同字的个数以及字的出现次数, 确定社交 消息所属的兴趣主题以及社交消息属于对应兴趣主题的概率。 0062 确定模块 32, 还用于对于每个待识别的用户, 根据待识别的用户所发布的社交消 息属于对应兴趣主题的概率, 确定待识别的用户对待识别兴趣主题的关注度。 0063 其中, 确定模块 32 具体用于, 对于每个待识别的用户, 根据待识别的用户所发布 的社交消息属于对应兴趣主题的概率, 获取待。

38、识别的用户所发布的社交消息属于待识别兴 趣主题的概率的和 ; 根据待识别的用户所发布的社交消息属于待识别兴趣主题的概率的 和, 以及待识别的用户所发布的社交消息的数量, 确定待识别的用户对待识别兴趣主题的 关注度。 0064 构建模块 33, 用于每个根据待识别的用户对待识别兴趣主题的关注度, 构建用户 网络, 用户网络对应一个待识别兴趣主题, 且用户网络中包括的每个用户对用户网络所对 应的待识别兴趣主题的关注度大于预设阈值。 0065 计算模块 34, 用于针对用户网络中的每个用户, 根据每个用户对待识别兴趣主题 的关注度, 以及用户网络中各个用户之间的关注关系, 计算每个用户在待识别兴趣主。

39、题下 的影响数值。 0066 进一步地, 计算模块 34 具体用于, 针对用户网络中的每个用户, 根据每个用户对 待识别兴趣主题的关注度, 以及用户网络中各个用户之间的关注关系, 计算每个用户在待 识别兴趣主题下的有效粉丝数 ; 针对用户网络中的每个用户, 获取每个用户所发布的社交 消息中属于待识别兴趣主题的待识别社交消息, 根据每个用户的有效粉丝数以及发布待识 别社交消息的各个用户之间的距离, 计算每个用户在待识别兴趣主题下的影响数值。 0067 更进一步地, 计算模块 34 具体用于, 采用 0068 计算每个用户在待识别兴趣主题下的有效粉丝 数 ; 0069 其中, EFi表示用户 i 。

40、在待识别兴趣主题下的有效粉丝数, 集合 APi表示在用户网 络中, 与用户 i 存在关注路径的用户集合, 集合 Pij表示用户 i 到用户 j 的关注路径上的所 有用户集合, Ak表示用户 k 对待识别兴趣主题的关注度, Fj表示用户 j 的绝对粉丝数。 0070 再进一步地, 每个待识别的用户所发布的社交消息包括 : 每个待识别的用户原创 发布的社交消息, 以及每个待识别的用户转发的社交消息 ; 0071 对应的, 计算模块 34 具体用于, 采用 说 明 书 CN 104281669 A 11 7/7 页 12 0072 计算每个用户在 待识别兴趣主题下的影响数值 ; 0073 其中,表示。

41、用户 i 在待识别兴趣主题 d 下的影响数值, Ti,d表示用户 i 所发 布的社交信息中属于待识别兴趣主题 d 的待识别社交消息, twj表示待识别社交消息 j, Ret(twj) 表示转发待识别社交消息 j 的用户集合, ux表示用户 x, |Ret(twj)| 表示转发待识 别社交消息 j 的用户的个数, EFx表示用户 x 的有效粉丝数, start(twj) 表示待识别社交消 息j的原创用户, dist(ux,start(twj)表示用户x与待识别社交消息j的原创用户的距离, |Ti,d| 表示用户 i 所发布的社交消息中属于待识别兴趣主题 d 的待识别社交消息的总数。 0074 本。

42、实施例中, 通过获取社交网络中待识别的用户以及每个待识别的用户所发布的 社交消息 ; 根据待识别的用户所发布的社交消息中每个字或词, 查询字或词与兴趣主题的 对应关系, 确定社交消息所属的兴趣主题以及社交消息属于对应兴趣主题的概率 ; 根据待 识别的用户所发布的社交消息属于对应兴趣主题的概率, 确定待识别的用户对待识别兴趣 主题的关注度 ; 根据每个待识别的用户对所述待识别兴趣主题的关注度, 构建用户网络, 用 户网络对应一个待识别兴趣主题, 且用户网络中包括的每个用户对用户网络所对应的待识 别兴趣主题的关注度大于预设阈值 ; 根据每个用户对待识别兴趣主题的关注度, 以及用户 网络中各个用户之。

43、间的关注关系, 计算每个用户在待识别兴趣主题下的影响数值, 从而能 够根据用户在待识别兴趣主题下的影响数值, 对待识别兴趣主题的社交消息的传播进行有 效的控制。 0075 最后应说明的是 : 以上各实施例仅用以说明本发明的技术方案, 而非对其限制 ; 尽管参照前述各实施例对本发明进行了详细的说明, 本领域的普通技术人员应当理解 : 其 依然可以对前述各实施例所记载的技术方案进行修改, 或者对其中部分或者全部技术特征 进行等同替换 ; 而这些修改或者替换, 并不使相应技术方案的本质脱离本发明各实施例技 术方案的范围。 说 明 书 CN 104281669 A 12 1/2 页 13 图 1 说 明 书 附 图 CN 104281669 A 13 2/2 页 14 图 2 图 3 说 明 书 附 图 CN 104281669 A 14 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1