一种社交网络中的用户影响力评估方法.pdf

上传人:r5 文档编号:4028519 上传时间:2018-08-12 格式:PDF 页数:14 大小:1,015.85KB
返回 下载 相关 举报
摘要
申请专利号:

CN201510046398.7

申请日:

2015.01.30

公开号:

CN104598605A

公开日:

2015.05.06

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20150130|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

福州大学

发明人:

牛玉贞; 陈羽中; 郭文忠; 罗宇敏

地址:

350108福建省福州市闽侯县上街镇大学城学园路2号福州大学新区

优先权:

专利代理机构:

福州元创专利商标代理有限公司35100

代理人:

蔡学俊

PDF下载: PDF下载
内容摘要

本发明涉及一种社交网络中的用户影响力评估方法,该方法包括如下步骤:步骤A:读取社交网络数据,构造以社交网络用户为节点,用户关系为边的社交网络图G;步骤B:根据社交网络图,遍历社交网络图中的所有节点,根据节点的度初始化每个节点的影响力标签,结束遍历;步骤C:根据社交网络图,遍历社交网络图中的所有节点,根据所遍历节点的邻居节点的影响力等级,计算所遍历节点的影响力等级;步骤D:重复步骤C,直到每个节点的影响力等级均收敛。该方法具有接近线性的线性时间复杂度,可有效地分析大规模社交网络中的用户影响力分布情况,挖掘高影响力用户,可应用于网络营销等领域。

权利要求书

权利要求书
1.  一种社交网络中的用户影响力评估方法,其特征在于,包括如下步骤:
步骤A:读取社交网络数据,构造以社交网络用户为节点,用户关系为边的社交网络图G
步骤B:根据社交网络图,遍历社交网络图中的所有节点,根据节点的度初始化每个节点的影响力标签,结束遍历;
步骤C:根据社交网络图,遍历社交网络图中的所有节点,根据所遍历节点的邻居节点的影响力等级,计算所遍历节点的影响力等级;
步骤D:重复步骤C,直到每个节点的影响力等级均收敛。

2.  根据权利要求1所述的一种社交网络中的用户影响力评估方法,其特征在于,所述步骤B中,根据节点的度初始化节点的影响力标签的方法为:
定义节点i的影响力标签Ii为:

节点i的影响力标签Ii包含两个属性,其中li表示节点i的影响力等级,di表示节点i的度数;

在一个给定的静态网络中,每个节点的度数都是固定的,因此对节点的影响力标签初始化,等价于对节点的影响力等级初始化。

3.  根据权利要求2所述的一种社交网络中的用户影响力评估方法,其特征在于,所述步骤C中,计算所遍历节点的影响力等级,包括以下步骤:
C1:对于所遍历的节点i,通过对比其邻居节点的影响力等级,计算节点i的优质邻居数;
C2:根据计算得到的节点i的优质邻居数,计算并更新节点i的影响力等级;
C3:对节点i的影响力等级进行增益处理;
C4:重复步骤C1~C3,直到所有节点均已遍历。

4.  根据权利要求3所述的一种社交网络中的用户影响力评估方法,其特征在于,所述步骤C1中,计算节点i的优质邻居数,包括以下步骤:
C11:初始化节点i的优质邻居数;
C12:遍历节点i的邻居集合,对于所遍历的邻居节点j,根据节点j的影响力等级,更新节点i的优质邻居数;
C13:重复步骤C12,直到节点i的邻居集合的所有节点均已遍历。

5.  根据权利要求4所述的一种社交网络中的用户影响力评估方法,其特征在于,所述步骤C11中,节点i的优质邻居数为节点i的优质邻居集合的大小,定义为:

其中MAXL表示给定的影响力等级最大值,表示节点i的邻居节点中影响力等级不小于x的优质邻居集合,即节点i的邻居节点中影响力等级不小于x的节点构成的集合,定义为:

其中NB(i)表示节点i的邻居节点集合,即由与节点i有边相连的所有节点构成的集合,定义为:

其中VE分别为社交网络图G的节点集合与边集合;
初始化节点i的优质邻居数的方法为:根据给定的影响力等级最大值MAXL,将节点i的优质邻居数均初始化为0。

6.  根据权利要求5所述的一种社交网络中的用户影响力评估方法,其特征在于,所述步骤C12中,对于所遍历的邻居节点j,根据节点j的影响力等级,更新节点i的优质邻居数,具体方法为:若节点j的影响力等级lj大于节点i的影响力等级li,则对的值加1。

7.  根据权利要求6所述的一种社交网络中的用户影响力评估方法,其特征在于,所述步骤C2中,根据计算得到的节点i的优质邻居数,计算并更新节点i的影响力等级,具体方法为:

其中lj表示节点i的邻居节点j的影响力等级,Max(lj)表示节点i的邻居节点集合中的影响力等级最大值,假设函数,,,由于fi(x)是一个单调不增函数,gi(x)是一个单调递增函数,因此hi(x)在区间[liMax(lj)]上存在一个唯一的最大值,该最大值即为节点i的最终影响力等级。

8.  根据权利要求7所述的一种社交网络中的用户影响力评估方法,其特征在于,所述步骤C3中,对节点的影响力等级进行增益处理,具体公式为:

其中,为步骤C2更新后的节点i的影响力等级,为增益处理后的节点i的影响力等级, 表示向下取整函数,δ为增益函数,增益函数δ的作用是控制节点影响力等级的增益量,定义为:

其中α>0为增益参数,u为对数函数的底,λ为增益因子,定义为:

即将优质邻居数和节点自身影响力等级的乘积作为一个影响力基数,并根据邻居影响力等级总和以及所述影响力基数来设定增益因子λ
只对增益因子较大的节点的影响力等级作所述增益处理,即当增益因子满足λ>β时,才进行所述增益处理,β为设定的增益阈值。

9.  根据权利要求8所述的一种社交网络中的用户影响力评估方法,其特征在于,所述步骤D中,重复步骤C,直到每个节点的影响力等级收敛,具体的迭代终止条件为:前后两次迭代的影响力等级相差值Δ小于阈值ε;Δ为所有节点前后两次迭代影响力等级差值的最大值,定义为:

其中li(t+1)为第t+1次迭代时节点i的影响力等级,li(t)为第t次迭代时节点i的影响力等级,N为节点数。

说明书

说明书一种社交网络中的用户影响力评估方法
技术领域
本发明涉及社交网络分析技术领域,特别是一种社交网络中的用户影响力评估方法。
背景技术
社会影响力是指由于用户、组织或者社区与其他用户、组织或者社区等具有社交关系,导致自身行为随其他用户、组织或者社区的变化而变化的一种现象。社会影响力是社交网络中常见的一种现象。在社交网络中,各种各样的因素都可能对影响力产生影响。通过对社交网络中节点的影响力进行分析,可以发现社交网络中的具有重要影响力的核心节点,可用于企业商业营销、广告定向投放、言论渠道推荐、舆情监控等诸多领域。
目前对节点的影响力分析方法主要包括两大类,一类方法是基于节点的度数、介数和K-shell等中心化指标。利用度数来评估节点影响力,适用于符合幂律的非均匀网络中,但是其忽略了网络丰富的拓扑结构特征;介数则是以经过某个节点的最短路径的数目来刻画节点的重要性,虽然将网络的拓扑结构列入考量,但是其复杂度过高不适于大型的真实网络;通过K-shell分解得到的结果存在大量具有相同大小的k-核节点,与社交网络中节点的多样性不相符。基于K-shell分解的思想,在分解的过程中,通过将已删除的边和仍存在的边的数量考虑在内,Zeng等提出了MDD (Mixed Degree Decomposition)方法用于区分具有相同k-核值的节点影响力,但是该方法的参数λ在不同网络中的最优取值难以确定;另一类方法是基于链接分析的网页排名算法,如经典的PageRank和HITS方法以及其改进方法等;如朱天等基于社交网络的社区结构,提出InnerPageRank和OutterPageRank两种评估方法,分别用于计算节点在社区内部和外部的影响力。此类方法需要多次重复的迭代,时间复杂度较高,普遍适用性较弱。
综上,现有的针对社交网络中用户个体的影响力评估方法,面对大规模社交网络的场景,无论是在分析效果和效率上都难以满足要求。
发明内容
本发明的目的在于克服现有技术的不足,提供一种社交网络中的用户影响力评估方法,该方法具有接近线性的时间复杂度,有利于提高用户影响力评估的效果和效率。
为实现上述目的,本发明的技术方案是:一种社交网络中的用户影响力评估方法,包括如下步骤:
步骤A:读取社交网络数据,构造以社交网络用户为节点,用户关系为边的社交网络图G
步骤B:根据社交网络图,遍历社交网络图中的所有节点,根据节点的度初始化每个节点的影响力标签,结束遍历;
步骤C:根据社交网络图,遍历社交网络图中的所有节点,根据所遍历节点的邻居节点的影响力等级,计算所遍历节点的影响力等级;
步骤D:重复步骤C,直到每个节点的影响力等级均收敛。
进一步地,所述步骤B中,根据节点的度初始化节点的影响力标签的方法为:
定义节点i的影响力标签Ii为:

节点i的影响力标签Ii包含两个属性,其中li表示节点i的影响力等级,di表示节点i的度数;

在一个给定的静态网络中,每个节点的度数都是固定的,因此对节点的影响力标签初始化,等价于对节点的影响力等级初始化。
进一步地,所述步骤C中,计算所遍历节点的影响力等级,包括以下步骤:
C1:对于所遍历的节点i,通过对比其邻居节点的影响力等级,计算节点i的优质邻居数;
C2:根据计算得到的节点i的优质邻居数,计算并更新节点i的影响力等级;
C3:对节点i的影响力等级进行增益处理;
C4:重复步骤C1~C3,直到所有节点均已遍历。
进一步地,所述步骤C1中,计算节点i的优质邻居数,包括以下步骤:
C11:初始化节点i的优质邻居数;
C12:遍历节点i的邻居集合,对于所遍历的邻居节点j,根据节点j的影响力等级,更新节点i的优质邻居数;
C13:重复步骤C12,直到节点i的邻居集合的所有节点均已遍历。
进一步地,所述步骤C11中,节点i的优质邻居数为节点i的优质邻居集合的大小,定义为:

其中MAXL表示给定的影响力等级最大值,表示节点i的邻居节点中影响力等级不小于x的优质邻居集合,即节点i的邻居节点中影响力等级不小于x的节点构成的集合,定义为:

其中NB(i)表示节点i的邻居节点集合,即由与节点i有边相连的所有节点构成的集合,定义为:

其中VE分别为社交网络图G的节点集合与边集合;
初始化节点i的优质邻居数的方法为:根据给定的影响力等级最大值MAXL,将节点i的优质邻居数均初始化为0。
进一步地,所述步骤C12中,对于所遍历的邻居节点j,根据节点j的影响力等级,更新节点i的优质邻居数,具体方法为:若节点j的影响力等级lj大于节点i的影响力等级li,则对的值加1。
进一步地,所述步骤C2中,根据计算得到的节点i的优质邻居数,计算并更新节点i的影响力等级,具体方法为:

其中lj表示节点i的邻居节点j的影响力等级,Max(lj)表示节点i的邻居节点集合中的影响力等级最大值,假设函数,,,由于fi(x)是一个单调不增函数,gi(x)是一个单调递增函数,因此hi(x)在区间[liMax(lj)]上存在一个唯一的最大值,该最大值即为节点i的最终影响力等级。
进一步地,所述步骤C3中,对节点的影响力等级进行增益处理,具体公式为:

其中,为步骤C2更新后的节点i的影响力等级,为增益处理后的节点i的影响力等级, 表示向下取整函数,δ为增益函数,增益函数δ的作用是控制节点影响力等级的增益量,定义为:

其中α>0为增益参数,u为对数函数的底,λ为增益因子,定义为:

即将优质邻居数和节点自身影响力等级的乘积作为一个影响力基数,并根据邻居影响力等级总和以及所述影响力基数来设定增益因子λ
只对增益因子较大的节点的影响力等级作所述增益处理,即当增益因子满足λ>β时,才进行所述增益处理,β为设定的增益阈值。
进一步地,所述步骤D中,重复步骤C,直到每个节点的影响力等级收敛,具体的迭代终止条件为:前后两次迭代的影响力等级相差值Δ小于阈值ε;Δ为所有节点前后两次迭代影响力等级差值的最大值,定义为:

其中li(t+1)为第t+1次迭代时节点i的影响力等级,li(t)为第t次迭代时节点i的影响力等级,N为节点数。
相较于现有技术,本发明的有益效果是:通过影响力等级和节点度量化节点的影响力;进而基于标签传播的思想,提出了一种新颖的影响力模型,通过节点的邻居质量和邻居数迭代更新节点的影响力标签,同时引入符合幂率分布的增益函数进一步优化用户影响力评估的准确性和时间效率,构造了一种用户影响力评估的迭代方法,该方法具有接近线性的时间复杂度。综上,本发明的方法能够更好的评估节点影响力,且在时间效率上具有明显优势。
附图说明
图1是本发明方法的实现流程图。
图2是本发明方法中步骤C的实现流程图。
图3是本发明方法中步骤C1的实现流程图。
具体实施方式
下面结合附图及具体实施例对本发明作进一步的详细说明。
图1是本发明的社交网络中的用户影响力评估方法的实现流程图。如图1所示,该方法包括如下步骤:
步骤A:读取社交网络数据,构造以社交网络用户为节点,用户关系为边的社交网络图G
如针对微博网络,将每个微博注册用户作为社交网络中的一个节点,以用户间的相互关注、评论关系作为社交网络中的一条边;如针对协作网络,将每个作者作为网络中的一个节点,以两个作者至少共同发表过一篇文章的协作关系作为社交网络中的一条边。并采用稀疏矩阵的数据结构存储社交网络图的邻接矩阵。
步骤B:根据社交网络图,遍历社交网络图中的所有节点,根据节点的度初始化每个节点的影响力标签,结束遍历。
具体的,根据节点的度初始化节点的影响力标签的方法为:
定义节点i的影响力标签Ii为:

节点i的影响力标签Ii包含两个属性,其中li表示节点i的影响力等级,di表示节点i的度数;

即如果节点i的度数di > 1,节点i的影响力等级初始化为2,否则初始化为1;
在一个给定的静态网络中,每个节点的度数都是固定的,因此对节点的影响力标签初始化,等价于对节点的影响力等级初始化。
由于采用稀疏矩阵的数据结构存储社交网络图的邻接矩阵,初始化节点影响力等级只需要一次遍历网络中的所有节点,时间复杂度为O(n),其中n表示节点数。
步骤C:根据社交网络图,遍历社交网络图中的所有节点,根据所遍历节点的邻居节点的影响力等级,计算所遍历节点的影响力等级。
图2是本发明方法中步骤C的实现流程图。如图2所示,步骤C包括以下步骤:
C1:对于所遍历的节点i,通过对比其邻居节点的影响力等级,计算节点i的优质邻居数。
图3是本发明方法中步骤C1的实现流程图,如图3所示,步骤C1包括以下步骤:
C11:初始化节点i的优质邻居数;
所述步骤C11中,节点i的优质邻居数为节点i的优质邻居集合的大小,定义为:

其中MAXL表示给定的影响力等级最大值,表示节点i的邻居节点中影响力等级不小于x的优质邻居集合,即节点i的邻居节点中影响力等级不小于x的节点构成的集合,定义为:

其中NB(i)表示节点i的邻居节点集合,即由与节点i有边相连的所有节点构成的集合,定义为:

其中VE分别为社交网络图G的节点集合与边集合;
初始化节点i的优质邻居数的方法为:根据给定的影响力等级最大值MAXL,将节点i的优质邻居数均初始化为0。
C12:遍历节点i的邻居集合,对于所遍历的邻居节点j,根据节点j的影响力等级,更新节点i的优质邻居数。
所述步骤C12中,对于所遍历的邻居节点j,根据节点j的影响力等级,更新节点i的优质邻居数,具体方法为:若节点j的影响力等级lj大于节点i的影响力等级li,则对的值加1。
C13:重复步骤C12,直到节点i的邻居集合的所有节点均已遍历。
C2:根据计算得到的节点i的优质邻居数,计算并更新节点i的影响力等级。
所述步骤C2中,根据计算得到的节点i的优质邻居数,计算并更新节点i的影响力等级,具体方法为:

其中lj表示节点i的邻居节点j的影响力等级,Max(lj)表示节点i的邻居节点集合中的影响力等级最大值,假设函数,,,由于fi(x)是一个单调不增函数,gi(x)是一个单调递增函数,因此hi(x)在区间[liMax(lj)]上存在一个唯一的最大值,该最大值即为节点i的最终影响力等级。
C3:对节点i的影响力等级进行增益处理。
所述步骤C3中,对节点的影响力等级进行增益处理,具体公式为:

其中,为步骤C2更新后的节点i的影响力等级,为增益处理后的节点i的影响力等级, 表示向下取整函数,δ为增益函数,增益函数δ的作用是控制节点影响力等级的增益量,定义为:

其中α>0为增益参数,u为对数函数的底,默认设置为10,λ为增益因子,定义为:

如果将节点i的邻居节点集合NB(i)看作一个全集,则优质邻居集合和非优质邻居集合是NB(i)的两个互补子集。综合考虑非优质邻居和优质邻居的作用,可以将所有邻居节点的影响力等级总和作为增益的依据。由于节点影响力等级越高,升级难度越大,因此增益函数除了考虑所有邻居节点的影响力等级之外,还须考虑节点自身影响力等级,节点影响力等级越高,其增益比例也应越小。由于节点影响力是以优质邻居的数量作为升级依据,因此,将优质邻居数和节点自身影响力等级的乘积作为一个影响力基数,并根据邻居影响力等级总和与影响力基数之比设定增益因子λ
由于只需要对增益因子较大的节点的影响力等级作步骤C3的增益处理,并非所有的节点都需要进行增益处理,因此只当增益因子满足λ>β时,才进行增益处理,β为设定的增益阈值。
C4:重复步骤C1~C3,直到所有节点均已遍历。
步骤D:重复步骤C,直到每个节点的影响力等级均收敛。
具体的,重复步骤C,直到每个节点的影响力等级收敛,具体的迭代终止条件为:前后两次迭代的影响力等级相差值Δ小于阈值ε;Δ为所有节点前后两次迭代影响力等级差值的最大值,定义为:

其中li(t+1)为第t+1次迭代时节点i的影响力等级,li(t)为第t次迭代时节点i的影响力等级,N为节点数。
本发明的社交网络中的用户影响力评估方法,通过影响力等级和节点度量化节点的影响力;进而基于标签传播的思想,提出了一种新颖的影响力模型,通过节点的邻居质量和邻居数迭代更新节点的影响力标签,同时引入符合幂率分布的增益函数进一步优化用户影响力评估的准确性和时间效率,构造了一种用户影响力评估的迭代方法。综上,本发明的方法能够更好的评估节点影响力,且在时间效率上具有明显优势。
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。

一种社交网络中的用户影响力评估方法.pdf_第1页
第1页 / 共14页
一种社交网络中的用户影响力评估方法.pdf_第2页
第2页 / 共14页
一种社交网络中的用户影响力评估方法.pdf_第3页
第3页 / 共14页
点击查看更多>>
资源描述

《一种社交网络中的用户影响力评估方法.pdf》由会员分享,可在线阅读,更多相关《一种社交网络中的用户影响力评估方法.pdf(14页珍藏版)》请在专利查询网上搜索。

本发明涉及一种社交网络中的用户影响力评估方法,该方法包括如下步骤:步骤A:读取社交网络数据,构造以社交网络用户为节点,用户关系为边的社交网络图G;步骤B:根据社交网络图,遍历社交网络图中的所有节点,根据节点的度初始化每个节点的影响力标签,结束遍历;步骤C:根据社交网络图,遍历社交网络图中的所有节点,根据所遍历节点的邻居节点的影响力等级,计算所遍历节点的影响力等级;步骤D:重复步骤C,直到每个节点的。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1