消息传播预测方法及装置.pdf

上传人:Y94****206 文档编号:6169657 上传时间:2019-05-16 格式:PDF 页数:16 大小:1.86MB
返回 下载 相关 举报
摘要
申请专利号:

CN201310733040.2

申请日:

2013.12.26

公开号:

CN103699650A

公开日:

2014.04.02

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20131226|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

清华大学

发明人:

薛一波; 鲍媛媛

地址:

100084 北京市海淀区清华园100084-82信箱

优先权:

专利代理机构:

北京路浩知识产权代理有限公司 11002

代理人:

李迪

PDF下载: PDF下载
内容摘要

本发明公开了一种消息传播预测方法及装置,能够预测消息在网络中的传输情况。该方法包括:获取社交网络中消息的转发信息;根据所述转发信息确定非线性预测模型;确定所述非线性预测模型的系数;根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播预测。本发明实施例获取社交网络中消息的转发信息,根据所述转发信息确定非线性预测模型,确定所述非线性预测模型的系数,根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播预测,从而预测消息在网络中的传输情况。

权利要求书

权利要求书
1.  一种消息传播预测方法,其特征在于,包括:
获取社交网络中消息的转发信息;
根据所述转发信息确定非线性预测模型;
确定所述非线性预测模型的系数;
根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播预测。

2.  根据权利要求1所述的方法,其特征在于,所述根据所述转发信息确定非线性预测模型包括:
根据所述转发信息得到广度变化时间序列、深度变化时间序列、受众增加时间序列;
确定所述消息传播过程中的关联维数;
根据所述关联维数确定消息转发过程中广度自变量、深度自变量及受众自变量;
将所述广度自变量与所述广度变化时间序列整合、将所述深度自变量与所述深度变化时间序列整合、将所述受众自变量与所述受众增加时间序列整合,得到所述非线性预测模型。

3.  根据权利要求2所述的方法,其特征在于,所述转发信息包括所述消息的转发时间,所述根据所述转发信息得到广度变化时间序列、深度变化时间序列、受众增加时间序列包括:
根据所述消息的转发时间得到消息的转发时间序列;
在所述转发时间序列每一个时间步增加消息转发数,得到所述广度变化时间序列;
在所述转发时间序列每一个时间步增加的消息转发数所在的最深层次,得 到所述深度变化时间序列;
在所述转发时间序列每一个时间步增加的消息转发数对应的消息转发用户ID所具有的粉丝数之和,得到所述受众增加时间序列。

4.  根据权利要求2所述的方法,其特征在于,所述确定所述消息传播过程中的关联维数包括:
应用GP算法确定所述消息传播过程中的关联维数。

5.  根据权利要求2所述的方法,其特征在于,应用偏微分方程将所述广度自变量与所述广度变化时间序列整合,应用偏微分方程将所述深度自变量与所述深度变化时间序列整合,应用偏微分方程将所述受众自变量与所述受众增加时间序列整合;
所述偏微分方程为:
dxdt=a1x+a2y+a3z+a4x2+a5y2+a6z2+a7xy+a8xz+a9yzdydt=b1x+b2y+b3z+b4x2+b5y2+b6z2+b7xy+b8xz+b9yzdzdt=c1x+c2y+c3z+c4x2+c5y2+c6z2+c7xy+c8xz+c9yz]]>
其中,x为广度,y为深度,z为受众,t为时间,a1,a2,…,a8,b1,b2,…,b8,c1,c2,…,c8分别为偏微分方程组的参数,偏微分方程组中每一偏微分方程都被写成差分方程的形式,例如dxdt=a1x+a2y+a3z+a4x2+a5y2+a6z2+a7xy+a8xz+a9yz]]>可以记为D=GP,其中
D=x3Δt-xΔt2Δtx4Δt-x2Δt2Δt···xmΔt-x(m-2)Δt2Δt,G=x2Δty2Δt...(yz)2Δtx3Δty3Δt...(yz)3Δt············x(m-1)Δty(m-1)Δt...(yz)(m-1)Δt,P=a1a2···a9]]>
m为观测的转发时间序列的长度,D根据观测的转发时间序列确定,G根据观测的转发时间序列确定,P为所述非线性预测模型的参数矩阵。

6.  根据权利要求1所述的方法,其特征在于,所述确定所述非线性预测模型的系数包括:
根据使残差平方和S取最小值确定P,其中残差平方和S=(D-GP)T(D-GP),P为所述非线性预测模型的系数,D根据所述观测的转发时间序列得到,G根据所述观测的转发时间序列得到,P则可根据令上式残差平方和取最小确定。

7.  根据权利要求6所述的方法,其特征在于,P的确定方法为:
按照最小二乘原则得到如下正则方程:
GTGP=GTD
其中,D由观测的转发时间序列确定,G由观测的转发时间序列确定,P为非线性预测模型的参数,具体如下所示:
D=x3Δt-xΔt2Δtx4Δt-x2Δt2Δt···xmΔt-x(m-2)Δt2Δt,G=x2Δty2Δt...(yz)2Δtx3Δty3Δt...(yz)3Δt············x(m-1)Δty(m-1)Δt...(yz)(m-1)Δt,P=a1a2···a9]]>
如果GTG为非奇异矩阵,那么得到P=(GTG)-1GTD;
如果G为奇异矩阵,那么根据反演理论,首先计算GTG,GTG是一个实对称矩阵,有K个线性无关的而且正交的特征向量,对应的特征值如下:
|λ1|≥|λ2|≥…≥|λK|
存在L个不为零的特征值λ1≥λ2≥…≥λL,而K-L个特征值为零,得到对应于L个不为零的特征值的特征向量组成一个矩阵UL:
UL=U11...U1L······UK1...UKL]]>
其中Ui=(U1i,U2i,…UKi)T(i=1,2,…L)是对应于λi的特征向量,从而得到Vi=GUi/λi=(V1i,V2i,…VMi)T:
VL=V11...V1L······VM1...VML]]>
由特征值组成的对角阵记为下式:
ΛL=λ10...00λ2...0·········00...λL]]>
从而得到P=HD,其中H=ULΛ-1VLT,从而实现对非线性预测模型参数P的求取。

8.  根据权利要求2所述的方法,其特征在于,所述根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播预测包括:将所述广度变化时间序列、深度变化时间序列、受众增加时间序列代入所述非线性预测模型,对所述消息进行传播预测。

9.  根据权利要求1或2或4至8中任一项所述的方法,其特征在于,所述转发信息包括以下至少一种:
所述消息的转发时间、转发所述消息的用户帐号、转发所述消息的用户ID、转发述消息的用户账号的粉丝数量、所述转发所述消息的用户帐号所处的转发层。

10.  一种消息传播预测装置,其特征在于,包括:
获取单元,用于获取社交网络中消息的转发信息;
第一确定单元,用于根据所述转发信息确定非线性预测模型;
第二确定单元,用于确定所述非线性预测模型的系数;
预测单元,用于根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播预测。

说明书

说明书消息传播预测方法及装置
技术领域
本发明涉及计算机领域,尤其涉及一种消息传播预测方法及装置。
背景技术
近几年,社交网络成为人们交流沟通以及消息传播的全新工具,对于正面的信息,社交网络的参与扩大了消息的传播受众面,并提高了消息传播的速度,具有积极作用;对于负面信息,社交网络中信息发布的便捷性使得负面消息迅速传播污染了社交网络环境。
因此,如何预测消息在网络中的传输情况是当前需要解决的问题。
发明内容
本发明实施例提供一种消息传播预测方法及装置,能够预测消息在网络中的传输情况。
本发明实施例采用如下技术方案:
一种消息传播预测方法,包括:
获取社交网络中消息的转发信息;
根据所述转发信息确定非线性预测模型;
确定所述非线性预测模型的系数;
根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播预测。
可选的,所述根据所述转发信息确定非线性预测模型包括:
根据所述转发信息得到广度变化时间序列、深度变化时间序列、受众增加时间序列;
确定所述消息传播过程中的关联维数;
根据所述关联维数确定消息转发过程中广度自变量、深度自变量及受众自变量;
将所述广度自变量与所述广度变化时间序列整合、将所述深度自变量与所述深度变化时间序列整合、将所述受众自变量与所述受众增加时间序列整合,得到所述非线性预测模型。
可选的,所述转发信息包括所述消息的转发时间,所述根据所述转发信息得到广度变化时间序列、深度变化时间序列、受众增加时间序列包括:
根据所述消息的转发时间得到消息的转发时间序列;
在所述转发时间序列每一个时间步增加消息转发数,得到所述广度变化时间序列;
在所述转发时间序列每一个时间步增加的消息转发数所在的最深层次,得到所述深度变化时间序列;
在所述转发时间序列每一个时间步增加的消息转发数对应的消息转发用户ID所具有的粉丝数之和,得到所述受众增加时间序列。
可选的,所述确定所述消息传播过程中的关联维数包括:
应用GP算法确定所述消息传播过程中的关联维数。
可选的,应用偏微分方程将所述广度自变量与所述广度变化时间序列整合,应用偏微分方程将所述深度自变量与所述深度变化时间序列整合,应用偏微分方程将所述受众自变量与所述受众增加时间序列整合;
所述偏微分方程为:
dxdt=a1x+a2y+a3z+a4x2+a5y2+a6z2+a7xy+a8xz+a9yzdydt=b1x+b2y+b3z+b4x2+b5y2+b6z2+b7xy+b8xz+b9yzdzdt=c1x+c2y+c3z+c4x2+c5y2+c6z2+c7xy+c8xz+c9yz]]>
其中,x为广度,y为深度,z为受众,t为时间,a1,a2,…,a8,b1,b2,…,b8,c1,c2,…,c8分别为偏微分方程组的参数,偏微分方程组中每一偏微分方程都被 写成差分方程的形式,例如dxdt=a1x+a2y+a3z+a4x2+a5y2+a6z2+a7xy+a8xz+a9yz]]>可以记为D=GP,其中
D=x3Δt-xΔt2Δtx4Δt-x2Δt2Δt···xmΔt-x(m-2)Δt2Δt,G=x2Δty2Δt...(yz)2Δtx3Δty3Δt...(yz)3Δt············x(m-1)Δty(m-1)Δt...(yz)(m-1)Δt,P=a1a2···a9]]>
m为观测的转发时间序列的长度,D根据观测的转发时间序列确定,G根据观测的转发时间序列确定,P为所述非线性预测模型的参数矩阵。
可选的,所述确定所述非线性预测模型的系数包括:
根据使残差平方和S取最小值确定P,其中残差平方和S=(D-GP)T(D-GP),P为所述非线性预测模型的系数,D根据所述观测的转发时间序列得到,G根据所述观测的转发时间序列得到,P则可根据令上式残差平方和取最小确定。
可选的,P的确定方法为:
按照最小二乘原则得到如下正则方程:
GTGP=GTD
其中,D由观测的转发时间序列确定,G由观测的转发时间序列确定,P为非线性预测模型的参数,具体如下所示:
D=x3Δt-xΔt2Δtx4Δt-x2Δt2Δt···xmΔt-x(m-2)Δt2Δt,G=x2Δty2Δt...(yz)2Δtx3Δty3Δt...(yz)3Δt············x(m-1)Δty(m-1)Δt...(yz)(m-1)Δt,P=a1a2···a9]]>
则会遇到两种情况,如下所述:
如果GTG为非奇异矩阵,那么得到P=(GTG)-1GTD;
如果G为奇异矩阵,那么根据反演理论,首先计算GTG,GTG是一个实对称矩阵,有K个线性无关的而且正交的特征向量,对应的特征值如下:
|λ1|≥|λ2|≥…≥|λK|
存在有L个不为零的特征值λ1≥λ2≥…≥λL,而K-L个特征值为零,得到对应于L个不为零的特征值的特征向量组成一个矩阵UL:
UL=U11...U1L······UK1...UKL]]>
其中Ui=(U1i,U2i,…UKi)T(i=1,2,…L)是对应于λi的特征向量,从而得到Vi=GUi/λi=(V1i,V2i,…VMi)T:
VL=V11...V1L······VM1...VML]]>
由特征值组成的对角阵记为下式:
ΛL=λ10...00λ2...0·········00...λL]]>
从而得到P=HD,其中H=ULΛ-1VLT,从而实现对非线性预测模型参数P的求取。
可选的,所述根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播预测包括:将所述广度变化时间序列、深度变化时间序列、受众增加时间序列代入所述非线性预测模型,对所述消息进行传播预测。
可选的,所述转发信息包括以下至少一种:
所述消息的转发时间、转发所述消息的用户帐号、转发所述消息的用户ID、转发述消息的用户账号的粉丝数量、所述转发所述消息的用户帐号所处的转发层。
一种消息传播预测装置,包括:
获取单元,用于获取社交网络中消息的转发信息;
第一确定单元,用于根据所述转发信息确定非线性预测模型;
第二确定单元,用于确定所述非线性预测模型的系数;
预测单元,用于根据所述非线性预测模型及所述非线性预测模型的系数对 所述消息进行传播预测。
基于上述方案,本发明实施例的消息传播预测方法及装置,获取社交网络中消息的转发信息,根据所述转发信息确定非线性预测模型,确定所述非线性预测模型的系数,根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播预测,从而预测消息在网络中的传输情况。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1提供的一种消息传播预测方法的流程图;
图2为本发明实施例2提供的另一种消息传播预测方法的流程图;
图3为本发明实施例3提供的一种消息传播预测装置的结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
如图1所示,本实施例提供一种消息传播预测方法,包括:
11、获取社交网络中消息的转发信息;
12、根据所述转发信息确定非线性预测模型;
13、确定所述非线性预测模型的系数;
14、根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播预测。
可选的,所述根据所述转发信息确定非线性预测模型包括:
根据所述转发信息得到广度变化时间序列、深度变化时间序列、受众增加时间序列;
确定所述消息传播过程中的关联维数;
根据所述关联维数确定消息转发过程中广度自变量、深度自变量及受众自变量;
将所述广度自变量与所述广度变化时间序列整合、将所述深度自变量与所述深度变化时间序列整合、将所述受众自变量与所述受众增加时间序列整合,得到所述非线性预测模型。
可选的,所述转发信息包括所述消息的转发时间,所述根据所述转发信息得到广度变化时间序列、深度变化时间序列、受众增加时间序列包括:
根据所述消息的转发时间得到消息的转发时间序列;
在所述转发时间序列每一个时间步增加消息转发数,得到所述广度变化时间序列;
在所述转发时间序列每一个时间步增加的消息转发数所在的最深层次,得到所述深度变化时间序列;
在所述转发时间序列每一个时间步增加的消息转发数对应的消息转发用户ID所具有的粉丝数之和,得到所述受众增加时间序列。
可选的,所述确定所述消息传播过程中的关联维数包括:
应用GP算法确定所述消息传播过程中的关联维数。
可选的,应用偏微分方程将所述广度自变量与所述广度变化时间序列整合,应用偏微分方程将所述深度自变量与所述深度变化时间序列整合,应用偏微分方程将所述受众自变量与所述受众增加时间序列整合;
所述偏微分方程为:
dxdt=a1x+a2y+a3z+a4x2+a5y2+a6z2+a7xy+a8xz+a9yzdydt=b1x+b2y+b3z+b4x2+b5y2+b6z2+b7xy+b8xz+b9yzdzdt=c1x+c2y+c3z+c4x2+c5y2+c6z2+c7xy+c8xz+c9yz]]>
其中,x为广度,y为深度,z为受众,t为时间,a1,a2,…,a8,b1,b2,…,b8,c1,c2,…,c8分别为偏微分方程组的参数,偏微分方程组中每一偏微分方程都被写成差分方程的形式,例如dxdt=a1x+a2y+a3z+a4x2+a5y2+a6z2+a7xy+a8xz+a9yz]]>可以记为D=GP,其中
D=x3Δt-xΔt2Δtx4Δt-x2Δt2Δt···xmΔt-x(m-2)Δt2Δt,G=x2Δty2Δt...(yz)2Δtx3Δty3Δt...(yz)3Δt············x(m-1)Δty(m-1)Δt...(yz)(m-1)Δt,P=a1a2···a9]]>
m为观测的转发时间序列的长度,D和G都可以根据观测的转发时间序列求得,P为所述非线性预测模型的参数矩阵。
可选的,所述确定所述非线性预测模型的系数包括:
根据使残差平方和S取最小值求得P,其中残差平方和S=(D-GP)T(D-GP),P为所述非线性预测模型的系数,D和G根据所述观测的转发时间序列得到,P则可根据令上式残差平方和取最小确定。
可选的,P的确定方法为:
按照最小二乘原则得到如下正则方程:
GTGP=GTD
其中,D和G可由观测的转发时间序列求得,P为非线性预测模型的参数,具体如下所示:
D=x3Δt-xΔt2Δtx4Δt-x2Δt2Δt···xmΔt-x(m-2)Δt2Δt,G=x2Δty2Δt...(yz)2Δtx3Δty3Δt...(yz)3Δt············x(m-1)Δty(m-1)Δt...(yz)(m-1)Δt,P=a1a2···a9]]>
则会遇到两种情况,如下所述:
如果GTG是非奇异矩阵,那么得到P=(GTG)-1GTD;
如果G为奇异矩阵,那么根据反演理论,首先计算GTG,GTG是一个实对称矩阵,有K个线性无关的而且正交的特征向量,对应的特征值如下:
|λ1|≥|λ2|≥…≥|λK|
假设有L个不为零的特征值λ1≥λ2≥…≥λL,而K-L个特征值为零,得到对应于L个不为零的特征值的特征向量组成一个矩阵UL:
UL=U11...U1L······UK1...UKL]]>
其中Ui=(U1i,U2i,…UKi)T(i=1,2,…L)是对应于λi的特征向量,从而得到Vi=GUi/λi=(V1i,V2i,…VMi)T:
VL=V11...V1L······VM1...VML]]>
由特征值组成的对角阵记为下式:
ΛL=λ10...00λ2...0·········00...λL]]>
从而得到P=HD,其中H=ULΛ-1VLT,从而实现对非线性预测模型参数P的求取。
应当理解,本实施例中dxdt=a1x+a2y+a3z+a4x2+a5y2+a6z2+a7xy+a8xz+a9yz]]>可以记为D=GP,相应的也可以进行类似处理,此处不赘述。
可选的,所述根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播预测包括:将所述广度变化时间序列、深度变化时间序列、受众增加时间序列代入所述非线性预测模型,对所述消息进行传播预测。
可选的,所述转发信息包括以下至少一种:
所述消息的转发时间、转发所述消息的用户帐号、转发所述消息的用户ID、转发述消息的用户账号的粉丝数量、所述转发所述消息的用户帐号所处的转发 层。
本实施例的方法,获取社交网络中消息的转发信息,根据所述转发信息确定非线性预测模型,确定所述非线性预测模型的系数,根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播预测,从而预测消息在网络中的传输情况。
实施例2
如图2所示,本实施例提供一种消息传播预测方法,包括:
21、获取社交网络中的消息转发数据。
获取社交网络中的消息转发数据主要包括各转发消息的转发时间、转发用户帐号、转发用户ID、转发用户粉丝数以及转发者所处的转发层数。
22、对消息转发数据进行清洗及统计,得到消息转发时间序列、广度变化时间序列、深度变化时间序列以及受众增加时间序列。
根据数据获取中消息转发时间能够得到消息转发时间序列;而在每一个时间步,增加的消息转发数则为消息转发广度序列;深度序列则为每一个时间步,增加的消息转发数所在的最深层次;受众增加序列则为在每一个时间步,增加的消息转发数对应的消息转发用户ID所具有的粉丝数之和。
23、利用GP算法确定社交网络消息传播过程的关联维数,GP算确定传播过程关联维数的方法将在下文具体介绍。
24、选择消息转发过程中广度、深度及受众作为自变量。
对消息传播广度、深度及受众增加进行分析,确定广度、深度及受众增加对消息转发过程具有重要的标识作用。
25、建立消息转发中广度、深度及受众的非线性预测模型。
构建消息传播广度、深度及受众的非线性偏微分方程组,详细如下式所示。
dxdt=a1x+a2y+a3z+a4x2+a5y2+a6z2+a7xy+a8xz+a9yzdydt=b1x+b2y+b3z+b4x2+b5y2+b6z2+b7xy+b8xz+b9yzdzdt=c1x+c2y+c3z+c4x2+c5y2+c6z2+c7xy+c8xz+c9yz]]>
其中,x为广度,y为深度,z为受众,t为时间,a1,a2,…,a8,b1,b2,…,b8,c1,c2,…,c8分别为偏微分方程组的参数,偏微分方程组中每一偏微分方程都被写成差分方程的形式,例如dxdt=a1x+a2y+a3z+a4x2+a5y2+a6z2+a7xy+a8xz+a9yz]]>可以记为D=GP,其中
D=x3Δt-xΔt2Δtx4Δt-x2Δt2Δt···xmΔt-x(m-2)Δt2Δt,G=x2Δty2Δt...(yz)2Δtx3Δty3Δt...(yz)3Δt············x(m-1)Δty(m-1)Δt...(yz)(m-1)Δt,P=a1a2···a9]]>
m为观测的转发时间序列的长度,D和G都可以根据观测的转发时间序列求得,P为所述非线性预测模型的参数矩阵。
应当理解,本实施例中dxdt=a1x+a2y+a3z+a4x2+a5y2+a6z2+a7xy+a8xz+a9yz]]>可以记为D=GP,相应的也可以进行类似处理,此处不赘述。
26、根据矩阵论及反演理论,确定非线性预测模型的系数。
D和G可以由获取的消息转发时间序列数据直接获得,P则是令下式残差平方和达到最小时的取值,
S=(D-GP)T(D-GP)
按照最小二乘原则得到如下正则方程:
GTGP=GTD
其中,D和G可由观测的转发时间序列求得,P为非线性预测模型的参数,具体如下所示:
D=x3Δt-xΔt2Δtx4Δt-x2Δt2Δt···xmΔt-x(m-2)Δt2Δt,G=x2Δty2Δt...(yz)2Δtx3Δty3Δt...(yz)3Δt············x(m-1)Δty(m-1)Δt...(yz)(m-1)Δt,P=a1a2···a9]]>
则会遇到两种情况,如下所述:
如果GTG是非奇异矩阵,那么得到P=(GTG)-1GTD;
如果G为奇异矩阵,那么根据反演理论,首先计算GTG,GTG是一个实对称矩阵,有K个线性无关的而且正交的特征向量,对应的特征值如下:
|λ1|≥|λ2|≥…≥|λK|
假设有L个不为零的特征值λ1≥λ2≥…≥λL,而K-L个特征值为零,得到对应于L个不为零的特征值的特征向量组成一个矩阵UL:
UL=U11...U1L······UK1...UKL]]>
其中Ui=(U1i,U2i,…UKi)T(i=1,2,…L)是对应于λi的特征向量,从而得到Vi=GUi/λi=(V1i,V2i,…VMi)T:
VL=V11...V1L······VM1...VML]]>
由特征值组成的对角阵记为下式:
ΛL=λ10...00λ2...0·········00...λL]]>
从而得到P=HD,其中H=ULΛ-1VLT。
从而实现对非线性预测模型参数P的求取。
27、进行广度、深度及受众的非线性序列预测。
将广度、深度及受众序列代入非线性预测方程组中,可以得到广度、深度及受众在每一时间点对应的取值,完成社会网络中消息传播广度、深度及受众的非线性预测。
下面对本发明中采用的GP算法求消息传播过程关联维数的方法进行简单介绍。
GP算法的输入量为时间延迟和初始潜入维数m0;重构相空间,计算向量距离,得出最大值和最小值,从而确定超球面半径r的步长;计算关联积分C(r);以lnC(r)~lnr作图,找到曲线的线性部分,并用最小二乘法估计关联维数;增加嵌入维数m0,直到相应的维数估计值d(m)不再随着m的增加而在一定误差范围内不变为止,得到消息传播过程的关联维数。
GP算法的具体实施步骤如下所示:
(1)确定时间延迟和初始嵌入维数m0;
(2)重构相空间,计算向量距离,得出最大值和最小值,从而确定超球面半径r的步长;
(3)计算关联积分C(r);
(4)以lnC(r)~lnr作图,找到曲线的线性部分,并用最小二乘法估计关联维数;
(5)增加嵌入维数m0,直到相应的维数估计值d(m)不再随着m的增加而在一定误差范围内不变为止,得到消息传播过程的关联维数。
本实施例的方法基于获取的消息转发数据得到所需的转发时间、广度、深度、受众序列;随后基于GP算法获取消息转发过程的关联维数,从而确定描述转发过程的自变量个数;通过对广度、深度及受众三个变量分布的分析,确定以这三个变量作为非线性预测模型的自变量,并构建非线性预测模型;随后根据矩阵论、反演理论等对于非线性预测模型的系数进行求解;代入实证观测数据,获得在每一个时间点对广度、深度及受众的预测值,完成对消息传播广度、深度及受众的及时性、准确性预测,有利于对不同消息传播规律的把握及进行适当控制。
实施例3
如图3所示,本实施例提供一种消息传播预测装置,包括:
获取单元31,用于获取社交网络中消息的转发信息;
第一确定单元32,用于根据所述转发信息确定非线性预测模型;
第二确定单元33,用于确定所述非线性预测模型的系数;
预测单元34,用于根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播预测。
本发明实施例的节点可以实现上述对应的方法实施例,详细实现过程,请参阅上述方法实施例,本实施例的装置的组成单元与上述方法实施例对应,此处仅为简要描述,此处不赘述。
本实施例的消息传播预测装置,获取社交网络中消息的转发信息,根据所述转发信息确定非线性预测模型,确定所述非线性预测模型的系数,根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播预测,从而预测消息在网络中的传输情况。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和替换,这些改进和替换也应视为本发明的保护范围。
本领域普通技术人员将会理解,本发明的各个方面、或各个方面的可能实现方式可以被具体实施为系统、方法或者计算机程序产品。因此,本发明的各方面、或各个方面的可能实现方式可以采用完全硬件实施例、完全软件实施例(包括固件、驻留软件等等),或者组合软件和硬件方面的实施例的形式,在这里都统称为“电路”、“模块”或者“系统”。此外,本发明的各方面、或各个方面的可能实现方式可以采用计算机程序产品的形式,计算机程序产品是指存储在计算机可读介质中的计算机可读程序代码。
计算机可读程序代码可以完全在用户的计算机上执行、部分在用户的计算机上执行、作为单独的软件包、部分在用户的计算机上并且部分在远程计算机上,或者完全在远程计算机或者服务器上执行。也应该注意,在某些替代实施 方案中,在流程图中各步骤、或框图中各块所注明的功能可能不按图中注明的顺序发生。例如,依赖于所涉及的功能,接连示出的两个步骤、或两个块实际上可能被大致同时执行,或者这些块有时候可能被以相反顺序执行。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

消息传播预测方法及装置.pdf_第1页
第1页 / 共16页
消息传播预测方法及装置.pdf_第2页
第2页 / 共16页
消息传播预测方法及装置.pdf_第3页
第3页 / 共16页
点击查看更多>>
资源描述

《消息传播预测方法及装置.pdf》由会员分享,可在线阅读,更多相关《消息传播预测方法及装置.pdf(16页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 103699650 A (43)申请公布日 2014.04.02 CN 103699650 A (21)申请号 201310733040.2 (22)申请日 2013.12.26 G06F 17/30(2006.01) (71)申请人 清华大学 地址 100084 北京市海淀区清华园 100084-82 信箱 (72)发明人 薛一波 鲍媛媛 (74)专利代理机构 北京路浩知识产权代理有限 公司 11002 代理人 李迪 (54) 发明名称 消息传播预测方法及装置 (57) 摘要 本发明公开了一种消息传播预测方法及装 置, 能够预测消息在网络中的传输情况。 该方法包 括。

2、 : 获取社交网络中消息的转发信息 ; 根据所述 转发信息确定非线性预测模型 ; 确定所述非线性 预测模型的系数 ; 根据所述非线性预测模型及所 述非线性预测模型的系数对所述消息进行传播预 测。本发明实施例获取社交网络中消息的转发信 息, 根据所述转发信息确定非线性预测模型, 确定 所述非线性预测模型的系数, 根据所述非线性预 测模型及所述非线性预测模型的系数对所述消息 进行传播预测, 从而预测消息在网络中的传输情 况。 (51)Int.Cl. 权利要求书 3 页 说明书 9 页 附图 3 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书3页 说明书9页 附图3页 (。

3、10)申请公布号 CN 103699650 A CN 103699650 A 1/3 页 2 1. 一种消息传播预测方法, 其特征在于, 包括 : 获取社交网络中消息的转发信息 ; 根据所述转发信息确定非线性预测模型 ; 确定所述非线性预测模型的系数 ; 根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播预测。 2. 根据权利要求 1 所述的方法, 其特征在于, 所述根据所述转发信息确定非线性预测 模型包括 : 根据所述转发信息得到广度变化时间序列、 深度变化时间序列、 受众增加时间序列 ; 确定所述消息传播过程中的关联维数 ; 根据所述关联维数确定消息转发过程中广度自变量、 。

4、深度自变量及受众自变量 ; 将所述广度自变量与所述广度变化时间序列整合、 将所述深度自变量与所述深度变化 时间序列整合、 将所述受众自变量与所述受众增加时间序列整合, 得到所述非线性预测模 型。 3. 根据权利要求 2 所述的方法, 其特征在于, 所述转发信息包括所述消息的转发时间, 所述根据所述转发信息得到广度变化时间序列、 深度变化时间序列、 受众增加时间序列包 括 : 根据所述消息的转发时间得到消息的转发时间序列 ; 在所述转发时间序列每一个时间步增加消息转发数, 得到所述广度变化时间序列 ; 在所述转发时间序列每一个时间步增加的消息转发数所在的最深层次, 得到所述深度 变化时间序列 ;。

5、 在所述转发时间序列每一个时间步增加的消息转发数对应的消息转发用户 ID 所具有 的粉丝数之和, 得到所述受众增加时间序列。 4. 根据权利要求 2 所述的方法, 其特征在于, 所述确定所述消息传播过程中的关联维 数包括 : 应用 GP 算法确定所述消息传播过程中的关联维数。 5. 根据权利要求 2 所述的方法, 其特征在于, 应用偏微分方程将所述广度自变量与所 述广度变化时间序列整合, 应用偏微分方程将所述深度自变量与所述深度变化时间序列整 合, 应用偏微分方程将所述受众自变量与所述受众增加时间序列整合 ; 所述偏微分方程为 : 其中, x 为广度, y 为深度, z 为受众, t 为时间,。

6、 a1,a2,a8,b1,b2,b8,c1,c2,c8分 别为偏微分方程组的参数, 偏微分方程组中每一偏微分方程都被写成差分方程的形式, 例 如可以记为 D=GP, 其中 权 利 要 求 书 CN 103699650 A 2 2/3 页 3 m 为观测的转发时间序列的长度, D 根据观测的转发时间序列确定, G 根据观测的转发 时间序列确定, P 为所述非线性预测模型的参数矩阵。 6. 根据权利要求 1 所述的方法, 其特征在于, 所述确定所述非线性预测模型的系数包 括 : 根据使残差平方和 S 取最小值确定 P, 其中残差平方和 S (D-GP)T(D-GP), P 为所述非 线性预测模型的。

7、系数, D 根据所述观测的转发时间序列得到, G 根据所述观测的转发时间序 列得到, P 则可根据令上式残差平方和取最小确定。 7. 根据权利要求 6 所述的方法, 其特征在于, P 的确定方法为 : 按照最小二乘原则得到如下正则方程 : GTGP GTD 其中, D 由观测的转发时间序列确定, G 由观测的转发时间序列确定, P 为非线性预测模 型的参数, 具体如下所示 : 如果 GTG 为非奇异矩阵, 那么得到 P=(GTG)-1GTD ; 如果G为奇异矩阵, 那么根据反演理论, 首先计算GTG,GTG是一个实对称矩阵, 有K个线 性无关的而且正交的特征向量, 对应的特征值如下 : |1|。

8、 |2| |K| 存在 L 个不为零的特征值 1 2 L, 而 K-L 个特征值为零, 得到对应于 L 个 不为零的特征值的特征向量组成一个矩阵 UL: 其中 Ui=(U1i,U2i,UKi)T(i=1,2,L) 是对应于 i的特征向量, 从而得到 Vi=GUi/ i=(V1i,V2i,VMi)T: 由特征值组成的对角阵记为下式 : 权 利 要 求 书 CN 103699650 A 3 3/3 页 4 从而得到 P=HD, 其中 H=UL-1VLT, 从而实现对非线性预测模型参数 P 的求取。 8. 根据权利要求 2 所述的方法, 其特征在于, 所述根据所述非线性预测模型及所述非 线性预测模型。

9、的系数对所述消息进行传播预测包括 : 将所述广度变化时间序列、 深度变化 时间序列、 受众增加时间序列代入所述非线性预测模型, 对所述消息进行传播预测。 9.根据权利要求1或2或4至8中任一项所述的方法, 其特征在于, 所述转发信息包括 以下至少一种 : 所述消息的转发时间、 转发所述消息的用户帐号、 转发所述消息的用户 ID、 转发述消息 的用户账号的粉丝数量、 所述转发所述消息的用户帐号所处的转发层。 10. 一种消息传播预测装置, 其特征在于, 包括 : 获取单元, 用于获取社交网络中消息的转发信息 ; 第一确定单元, 用于根据所述转发信息确定非线性预测模型 ; 第二确定单元, 用于确定。

10、所述非线性预测模型的系数 ; 预测单元, 用于根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进 行传播预测。 权 利 要 求 书 CN 103699650 A 4 1/9 页 5 消息传播预测方法及装置 技术领域 0001 本发明涉及计算机领域, 尤其涉及一种消息传播预测方法及装置。 背景技术 0002 近几年, 社交网络成为人们交流沟通以及消息传播的全新工具, 对于正面的信息, 社交网络的参与扩大了消息的传播受众面, 并提高了消息传播的速度, 具有积极作用 ; 对于 负面信息, 社交网络中信息发布的便捷性使得负面消息迅速传播污染了社交网络环境。 0003 因此, 如何预测消息在网。

11、络中的传输情况是当前需要解决的问题。 发明内容 0004 本发明实施例提供一种消息传播预测方法及装置, 能够预测消息在网络中的传输 情况。 0005 本发明实施例采用如下技术方案 : 0006 一种消息传播预测方法, 包括 : 0007 获取社交网络中消息的转发信息 ; 0008 根据所述转发信息确定非线性预测模型 ; 0009 确定所述非线性预测模型的系数 ; 0010 根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播预 测。 0011 可选的, 所述根据所述转发信息确定非线性预测模型包括 : 0012 根据所述转发信息得到广度变化时间序列、 深度变化时间序列、 受众增加时。

12、间序 列 ; 0013 确定所述消息传播过程中的关联维数 ; 0014 根据所述关联维数确定消息转发过程中广度自变量、 深度自变量及受众自变量 ; 0015 将所述广度自变量与所述广度变化时间序列整合、 将所述深度自变量与所述深度 变化时间序列整合、 将所述受众自变量与所述受众增加时间序列整合, 得到所述非线性预 测模型。 0016 可选的, 所述转发信息包括所述消息的转发时间, 所述根据所述转发信息得到广 度变化时间序列、 深度变化时间序列、 受众增加时间序列包括 : 0017 根据所述消息的转发时间得到消息的转发时间序列 ; 0018 在所述转发时间序列每一个时间步增加消息转发数, 得到所。

13、述广度变化时间序 列 ; 0019 在所述转发时间序列每一个时间步增加的消息转发数所在的最深层次, 得到所述 深度变化时间序列 ; 0020 在所述转发时间序列每一个时间步增加的消息转发数对应的消息转发用户 ID 所 具有的粉丝数之和, 得到所述受众增加时间序列。 说 明 书 CN 103699650 A 5 2/9 页 6 0021 可选的, 所述确定所述消息传播过程中的关联维数包括 : 0022 应用 GP 算法确定所述消息传播过程中的关联维数。 0023 可选的, 应用偏微分方程将所述广度自变量与所述广度变化时间序列整合, 应用 偏微分方程将所述深度自变量与所述深度变化时间序列整合, 应。

14、用偏微分方程将所述受众 自变量与所述受众增加时间序列整合 ; 0024 所述偏微分方程为 : 0025 0026 其中, x为广度, y为深度, z为受众, t为时间, a1,a2,a8,b1,b2,b8,c1,c2,c8 分别为偏微分方程组的参数, 偏微分方程组中每一偏微分方程都被写成差分方程的形式, 例如可以记为 D=GP, 其中 0027 0028 m 为观测的转发时间序列的长度, D 根据观测的转发时间序列确定, G 根据观测的 转发时间序列确定, P 为所述非线性预测模型的参数矩阵。 0029 可选的, 所述确定所述非线性预测模型的系数包括 : 0030 根据使残差平方和 S 取最小。

15、值确定 P, 其中残差平方和 S (D-GP)T(D-GP), P 为所 述非线性预测模型的系数, D 根据所述观测的转发时间序列得到, G 根据所述观测的转发时 间序列得到, P 则可根据令上式残差平方和取最小确定。 0031 可选的, P 的确定方法为 : 0032 按照最小二乘原则得到如下正则方程 : 0033 GTGP GTD 0034 其中, D 由观测的转发时间序列确定, G 由观测的转发时间序列确定, P 为非线性预 测模型的参数, 具体如下所示 : 0035 0036 则会遇到两种情况, 如下所述 : 0037 如果 GTG 为非奇异矩阵, 那么得到 P=(GTG)-1GTD 。

16、; 0038 如果 G 为奇异矩阵, 那么根据反演理论, 首先计算 GTG,GTG 是一个实对称矩阵, 有 K 说 明 书 CN 103699650 A 6 3/9 页 7 个线性无关的而且正交的特征向量, 对应的特征值如下 : 0039 |1| |2| |K| 0040 存在有 L 个不为零的特征值 1 2 L, 而 K-L 个特征值为零, 得到对应 于 L 个不为零的特征值的特征向量组成一个矩阵 UL: 0041 0042 其中 Ui=(U1i,U2i,UKi)T(i=1,2,L) 是对应于 i的特征向量, 从而得到 Vi=GUi/ i=(V1i,V2i,VMi)T: 0043 0044 。

17、由特征值组成的对角阵记为下式 : 0045 0046 从而得到 P=HD, 其中 H=UL-1VLT, 从而实现对非线性预测模型参数 P 的求取。 0047 可选的, 所述根据所述非线性预测模型及所述非线性预测模型的系数对所述消息 进行传播预测包括 : 将所述广度变化时间序列、 深度变化时间序列、 受众增加时间序列代入 所述非线性预测模型, 对所述消息进行传播预测。 0048 可选的, 所述转发信息包括以下至少一种 : 0049 所述消息的转发时间、 转发所述消息的用户帐号、 转发所述消息的用户 ID、 转发述 消息的用户账号的粉丝数量、 所述转发所述消息的用户帐号所处的转发层。 0050 一。

18、种消息传播预测装置, 包括 : 0051 获取单元, 用于获取社交网络中消息的转发信息 ; 0052 第一确定单元, 用于根据所述转发信息确定非线性预测模型 ; 0053 第二确定单元, 用于确定所述非线性预测模型的系数 ; 0054 预测单元, 用于根据所述非线性预测模型及所述非线性预测模型的系数对所述消 息进行传播预测。 0055 基于上述方案, 本发明实施例的消息传播预测方法及装置, 获取社交网络中消息 的转发信息, 根据所述转发信息确定非线性预测模型, 确定所述非线性预测模型的系数, 根 据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播预测, 从而预测 消息在网络中的传。

19、输情况。 附图说明 0056 为了更清楚地说明本发明实施例中的技术方案, 下面将对实施例描述中所需要使 用的附图作简单地介绍, 显而易见地, 下面描述中的附图是本发明的一些实施例, 对于本领 域普通技术人员来讲, 在不付出创造性劳动的前提下, 还可以根据这些附图获得其他的附 说 明 书 CN 103699650 A 7 4/9 页 8 图。 0057 图 1 为本发明实施例 1 提供的一种消息传播预测方法的流程图 ; 0058 图 2 为本发明实施例 2 提供的另一种消息传播预测方法的流程图 ; 0059 图 3 为本发明实施例 3 提供的一种消息传播预测装置的结构图。 具体实施方式 0060。

20、 为使本发明实施例的目的、 技术方案和优点更加清楚, 下面将结合本发明实施例 中的附图, 对本发明实施例中的技术方案进行清楚地描述, 显然, 所描述的实施例是本发明 一部分实施例, 而不是全部的实施例。 基于本发明中的实施例, 本领域普通技术人员在没有 做出创造性劳动前提下所获得的所有其他实施例, 都属于本发明保护的范围。 0061 实施例 1 0062 如图 1 所示, 本实施例提供一种消息传播预测方法, 包括 : 0063 11、 获取社交网络中消息的转发信息 ; 0064 12、 根据所述转发信息确定非线性预测模型 ; 0065 13、 确定所述非线性预测模型的系数 ; 0066 14、。

21、 根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播 预测。 0067 可选的, 所述根据所述转发信息确定非线性预测模型包括 : 0068 根据所述转发信息得到广度变化时间序列、 深度变化时间序列、 受众增加时间序 列 ; 0069 确定所述消息传播过程中的关联维数 ; 0070 根据所述关联维数确定消息转发过程中广度自变量、 深度自变量及受众自变量 ; 0071 将所述广度自变量与所述广度变化时间序列整合、 将所述深度自变量与所述深度 变化时间序列整合、 将所述受众自变量与所述受众增加时间序列整合, 得到所述非线性预 测模型。 0072 可选的, 所述转发信息包括所述消息的转。

22、发时间, 所述根据所述转发信息得到广 度变化时间序列、 深度变化时间序列、 受众增加时间序列包括 : 0073 根据所述消息的转发时间得到消息的转发时间序列 ; 0074 在所述转发时间序列每一个时间步增加消息转发数, 得到所述广度变化时间序 列 ; 0075 在所述转发时间序列每一个时间步增加的消息转发数所在的最深层次, 得到所述 深度变化时间序列 ; 0076 在所述转发时间序列每一个时间步增加的消息转发数对应的消息转发用户 ID 所 具有的粉丝数之和, 得到所述受众增加时间序列。 0077 可选的, 所述确定所述消息传播过程中的关联维数包括 : 0078 应用 GP 算法确定所述消息传播。

23、过程中的关联维数。 0079 可选的, 应用偏微分方程将所述广度自变量与所述广度变化时间序列整合, 应用 偏微分方程将所述深度自变量与所述深度变化时间序列整合, 应用偏微分方程将所述受众 自变量与所述受众增加时间序列整合 ; 说 明 书 CN 103699650 A 8 5/9 页 9 0080 所述偏微分方程为 : 0081 0082 其中, x为广度, y为深度, z为受众, t为时间, a1,a2,a8,b1,b2,b8,c1,c2,c8 分别为偏微分方程组的参数, 偏微分方程组中每一偏微分方程都被写成差分方程的形式, 例如可以记为 D=GP, 其中 0083 0084 m 为观测的转发。

24、时间序列的长度, D 和 G 都可以根据观测的转发时间序列求得, P 为所述非线性预测模型的参数矩阵。 0085 可选的, 所述确定所述非线性预测模型的系数包括 : 0086 根据使残差平方和 S 取最小值求得 P, 其中残差平方和 S (D-GP)T(D-GP), P 为所 述非线性预测模型的系数, D 和 G 根据所述观测的转发时间序列得到, P 则可根据令上式残 差平方和取最小确定。 0087 可选的, P 的确定方法为 : 0088 按照最小二乘原则得到如下正则方程 : 0089 GTGP GTD 0090 其中, D和G可由观测的转发时间序列求得, P为非线性预测模型的参数, 具体如。

25、下 所示 : 0091 0092 则会遇到两种情况, 如下所述 : 0093 如果 GTG 是非奇异矩阵, 那么得到 P=(GTG)-1GTD ; 0094 如果 G 为奇异矩阵, 那么根据反演理论, 首先计算 GTG,GTG 是一个实对称矩阵, 有 K 个线性无关的而且正交的特征向量, 对应的特征值如下 : 0095 |1| |2| |K| 0096 假设有 L 个不为零的特征值 1 2 L, 而 K-L 个特征值为零, 得到对应 于 L 个不为零的特征值的特征向量组成一个矩阵 UL: 说 明 书 CN 103699650 A 9 6/9 页 10 0097 0098 其中 Ui=(U1i,。

26、U2i,UKi)T(i=1,2,L) 是对应于 i的特征向量, 从而得到 Vi=GUi/ i=(V1i,V2i,VMi)T: 0099 0100 由特征值组成的对角阵记为下式 : 0101 0102 从而得到 P=HD, 其中 H=UL-1VLT, 从而实现对非线性预测模型参数 P 的求取。 0103 应当理解, 本实施例中可以记为 D=GP, 相应的也可以进行类似处理, 此处不赘述。 0104 可选的, 所述根据所述非线性预测模型及所述非线性预测模型的系数对所述消息 进行传播预测包括 : 将所述广度变化时间序列、 深度变化时间序列、 受众增加时间序列代入 所述非线性预测模型, 对所述消息进行。

27、传播预测。 0105 可选的, 所述转发信息包括以下至少一种 : 0106 所述消息的转发时间、 转发所述消息的用户帐号、 转发所述消息的用户 ID、 转发述 消息的用户账号的粉丝数量、 所述转发所述消息的用户帐号所处的转发层。 0107 本实施例的方法, 获取社交网络中消息的转发信息, 根据所述转发信息确定非线 性预测模型, 确定所述非线性预测模型的系数, 根据所述非线性预测模型及所述非线性预 测模型的系数对所述消息进行传播预测, 从而预测消息在网络中的传输情况。 0108 实施例 2 0109 如图 2 所示, 本实施例提供一种消息传播预测方法, 包括 : 0110 21、 获取社交网络中。

28、的消息转发数据。 0111 获取社交网络中的消息转发数据主要包括各转发消息的转发时间、 转发用户帐 号、 转发用户 ID、 转发用户粉丝数以及转发者所处的转发层数。 0112 22、 对消息转发数据进行清洗及统计, 得到消息转发时间序列、 广度变化时间序 列、 深度变化时间序列以及受众增加时间序列。 0113 根据数据获取中消息转发时间能够得到消息转发时间序列 ; 而在每一个时间步, 增加的消息转发数则为消息转发广度序列 ; 深度序列则为每一个时间步, 增加的消息转发 数所在的最深层次 ; 受众增加序列则为在每一个时间步, 增加的消息转发数对应的消息转 发用户 ID 所具有的粉丝数之和。 01。

29、14 23、 利用 GP 算法确定社交网络消息传播过程的关联维数, GP 算确定传播过程关联 说 明 书 CN 103699650 A 10 7/9 页 11 维数的方法将在下文具体介绍。 0115 24、 选择消息转发过程中广度、 深度及受众作为自变量。 0116 对消息传播广度、 深度及受众增加进行分析, 确定广度、 深度及受众增加对消息转 发过程具有重要的标识作用。 0117 25、 建立消息转发中广度、 深度及受众的非线性预测模型。 0118 构建消息传播广度、 深度及受众的非线性偏微分方程组, 详细如下式所示。 0119 0120 其中, x为广度, y为深度, z为受众, t为时间。

30、, a1,a2,a8,b1,b2,b8,c1,c2,c8 分别为偏微分方程组的参数, 偏微分方程组中每一偏微分方程都被写成差分方程的形式, 例如可以记为 D=GP, 其中 0121 0122 m 为观测的转发时间序列的长度, D 和 G 都可以根据观测的转发时间序列求得, P 为所述非线性预测模型的参数矩阵。 0123 应当理解, 本实施例中可以记为 D=GP, 相应的也可以进行类似处理, 此处不赘述。 0124 26、 根据矩阵论及反演理论, 确定非线性预测模型的系数。 0125 D和G可以由获取的消息转发时间序列数据直接获得, P则是令下式残差平方和达 到最小时的取值, 0126 S (D。

31、-GP)T(D-GP) 0127 按照最小二乘原则得到如下正则方程 : 0128 GTGP GTD 0129 其中, D和G可由观测的转发时间序列求得, P为非线性预测模型的参数, 具体如下 所示 : 0130 说 明 书 CN 103699650 A 11 8/9 页 12 0131 则会遇到两种情况, 如下所述 : 0132 如果 GTG 是非奇异矩阵, 那么得到 P=(GTG)-1GTD ; 0133 如果 G 为奇异矩阵, 那么根据反演理论, 首先计算 GTG,GTG 是一个实对称矩阵, 有 K 个线性无关的而且正交的特征向量, 对应的特征值如下 : 0134 |1| |2| |K| 。

32、0135 假设有 L 个不为零的特征值 1 2 L, 而 K-L 个特征值为零, 得到对应 于 L 个不为零的特征值的特征向量组成一个矩阵 UL: 0136 0137 其中 Ui=(U1i,U2i,UKi)T(i=1,2,L) 是对应于 i的特征向量, 从而得到 Vi=GUi/ i=(V1i,V2i,VMi)T: 0138 0139 由特征值组成的对角阵记为下式 : 0140 0141 从而得到 P=HD, 其中 H=UL-1VLT。 0142 从而实现对非线性预测模型参数 P 的求取。 0143 27、 进行广度、 深度及受众的非线性序列预测。 0144 将广度、 深度及受众序列代入非线性预。

33、测方程组中, 可以得到广度、 深度及受众在 每一时间点对应的取值, 完成社会网络中消息传播广度、 深度及受众的非线性预测。 0145 下面对本发明中采用的 GP 算法求消息传播过程关联维数的方法进行简单介绍。 0146 GP算法的输入量为时间延迟和初始潜入维数m0; 重构相空间, 计算向量距离, 得出 最大值和最小值, 从而确定超球面半径 r 的步长 ; 计算关联积分 C(r) ; 以 lnC(r) lnr 作 图, 找到曲线的线性部分, 并用最小二乘法估计关联维数 ; 增加嵌入维数 m0, 直到相应的维 数估计值d(m)不再随着m的增加而在一定误差范围内不变为止, 得到消息传播过程的关联 维。

34、数。 0147 GP 算法的具体实施步骤如下所示 : 0148 (1) 确定时间延迟和初始嵌入维数 m0; 0149 (2) 重构相空间, 计算向量距离, 得出最大值和最小值, 从而确定超球面半径 r 的 步长 ; 0150 (3) 计算关联积分 C(r) ; 0151 (4) 以 lnC(r) lnr 作图, 找到曲线的线性部分, 并用最小二乘法估计关联维数 ; 0152 (5) 增加嵌入维数 m0, 直到相应的维数估计值 d(m) 不再随着 m 的增加而在一定误 差范围内不变为止, 得到消息传播过程的关联维数。 说 明 书 CN 103699650 A 12 9/9 页 13 0153 本。

35、实施例的方法基于获取的消息转发数据得到所需的转发时间、 广度、 深度、 受众 序列 ; 随后基于 GP 算法获取消息转发过程的关联维数, 从而确定描述转发过程的自变量个 数 ; 通过对广度、 深度及受众三个变量分布的分析, 确定以这三个变量作为非线性预测模型 的自变量, 并构建非线性预测模型 ; 随后根据矩阵论、 反演理论等对于非线性预测模型的系 数进行求解 ; 代入实证观测数据, 获得在每一个时间点对广度、 深度及受众的预测值, 完成 对消息传播广度、 深度及受众的及时性、 准确性预测, 有利于对不同消息传播规律的把握及 进行适当控制。 0154 实施例 3 0155 如图 3 所示, 本实。

36、施例提供一种消息传播预测装置, 包括 : 0156 获取单元 31, 用于获取社交网络中消息的转发信息 ; 0157 第一确定单元 32, 用于根据所述转发信息确定非线性预测模型 ; 0158 第二确定单元 33, 用于确定所述非线性预测模型的系数 ; 0159 预测单元 34, 用于根据所述非线性预测模型及所述非线性预测模型的系数对所述 消息进行传播预测。 0160 本发明实施例的节点可以实现上述对应的方法实施例, 详细实现过程, 请参阅上 述方法实施例, 本实施例的装置的组成单元与上述方法实施例对应, 此处仅为简要描述, 此 处不赘述。 0161 本实施例的消息传播预测装置, 获取社交网络。

37、中消息的转发信息, 根据所述转发 信息确定非线性预测模型, 确定所述非线性预测模型的系数, 根据所述非线性预测模型及 所述非线性预测模型的系数对所述消息进行传播预测, 从而预测消息在网络中的传输情 况。 0162 以上所述仅是本发明的优选实施方式, 应当指出, 对于本技术领域的普通技术人 员来说, 在不脱离本发明技术原理的前提下, 还可以做出若干改进和替换, 这些改进和替换 也应视为本发明的保护范围。 0163 本领域普通技术人员将会理解, 本发明的各个方面、 或各个方面的可能实现方式 可以被具体实施为系统、 方法或者计算机程序产品。因此, 本发明的各方面、 或各个方面的 可能实现方式可以采用。

38、完全硬件实施例、 完全软件实施例 ( 包括固件、 驻留软件等等 ), 或 者组合软件和硬件方面的实施例的形式, 在这里都统称为 “电路” 、“模块” 或者 “系统” 。此 外, 本发明的各方面、 或各个方面的可能实现方式可以采用计算机程序产品的形式, 计算机 程序产品是指存储在计算机可读介质中的计算机可读程序代码。 0164 计算机可读程序代码可以完全在用户的计算机上执行、 部分在用户的计算机上执 行、 作为单独的软件包、 部分在用户的计算机上并且部分在远程计算机上, 或者完全在远程 计算机或者服务器上执行。也应该注意, 在某些替代实施方案中, 在流程图中各步骤、 或框 图中各块所注明的功能可。

39、能不按图中注明的顺序发生。 例如, 依赖于所涉及的功能, 接连示 出的两个步骤、 或两个块实际上可能被大致同时执行, 或者这些块有时候可能被以相反顺 序执行。 0165 显然, 本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精 神和范围。这样, 倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围 之内, 则本发明也意图包含这些改动和变型在内。 说 明 书 CN 103699650 A 13 1/3 页 14 图 1 说 明 书 附 图 CN 103699650 A 14 2/3 页 15 图 2 说 明 书 附 图 CN 103699650 A 15 3/3 页 16 图 3 说 明 书 附 图 CN 103699650 A 16 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1