一种微博舆情传播范围预测的方法.pdf

上传人:Y94****206 文档编号:6355295 上传时间:2019-06-03 格式:PDF 页数:7 大小:380.77KB
返回 下载 相关 举报
摘要
申请专利号:

CN201510369026.8

申请日:

2015.06.29

公开号:

CN105183743A

公开日:

2015.12.23

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):G06F 17/30申请日:20150629|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

临沂大学

发明人:

王海峰; 曹云鹏

地址:

276002 山东省临沂市兰山区双岭路中段

优先权:

专利代理机构:

四川君士达律师事务所 51216

代理人:

芶忠义

PDF下载: PDF下载
内容摘要

本发明涉及社会网络建模与分析领域,具体涉及一种微博舆情传播范围预测的方法。按照下列顺序依次进行:1)构建微博系统的传播网络模型;2)在微博传播网络中选择判断舆情覆盖范围的哨兵节点;3)利用哨兵监测节点建立微博舆情传播范围的预测模型;4)在实际微博网络中对事件舆情进行实证统计分析,并确定预测模型中的关键参数。本发明在500-1000个微博节点的社会网络中进行实证统计实验,并以此获取预测模型的重要参数。然后再自行编写网络微博抓取程序来分析,并统计5000-10000个节点的社会网络数据,用此规模的微博网络验证预测方法的准确性,实验结果显示预测的准确性约为83.2%。

权利要求书

权利要求书
1.  一种微博舆情传播范围预测的方法,其特征在于:按照下列顺序依次进行:
1)构建微博系统的传播网络模型:将每个微博用户视为一个节点,根据微博的粉丝、关注和好友关系建立节点之间的连边,形成一个复杂的在线社会网络模型;舆情传播范围即舆情消息覆盖率;
2)在微博传播网络中选择判断舆情覆盖范围的哨兵节点;
3)利用哨兵监测节点建立微博舆情传播范围的预测模型;
4)在实际微博网络中对事件舆情进行实证统计分析,并确定预测模型中的关键参数。

2.  根据权利要求1所述的一种微博舆情传播范围预测的方法,其特征在于:1)中所述的舆情消息覆盖率为已获知消息的节点集合与全部节点集合的比值,
O=|V‾||V|,]]>
式中表示节点数,|V|为全部节点数,注意全部节点指微博网络中有效用户范围内的节点总数;
消息传播过程是时间序列T={t1,t2,…,ti,ti+1,…},监测时刻tk的信息覆盖率为Ok,即Ok=|Vk‾||V|,.]]>

3.  根据权利要求1所述的一种微博舆情传播范围预测的方法,其特征在于:3)中的预测模型为微博网络哨兵节点预测信息覆盖率的问题转变为由合并到的事件来预测Ok,研究节点子集Vk与覆盖率O之间的规律,建立预测模型,通过探测属于Vk的哨兵节点的信息实现对信息覆盖率Ok的评估;在哨兵节点中选择一个节点传播影响力。

4.  根据权利要求1所述的一种微博舆情传播范围预测的方法,其特征在于:所述的哨兵节点包括意见领袖节点、社区中活跃节点、不活跃节点。

5.  根据权利要求1所述的一种微博舆情传播范围预测的方法,其特征在于:所述的节点传播影响力为节点的度与间接连通节点平均距离的乘积,I(i)=outdegree(i)×Σj=0ndijcount(i),]]>
I(i)表示节点i的影响力,outdegree(i)为节点的出度,dij表示与节点i间接连通的节点j之间的距离,count(i)表示节点i间接连通的其他所有节点的个数;最后建立先用统计方法建立节点影响力与信息覆盖率之间的关系模型
O(I)=f(I),
以O(I)=f(I),作为预测依据,探测若干节点是否传播到某条信息,以此来评估信息覆盖率,节点j的传播影响力为Ij,则代入后得出O(Ij),简写为Oj表示用探测节点j获取到的信息覆盖率;
选S曲线作为回归分析的基础模型,

说明书

说明书一种微博舆情传播范围预测的方法
技术领域
本发明涉及社会网络建模与分析领域,具体涉及一种微博舆情传播范围预测的方法。
背景技术
微博已经成为现代社会最重要的新媒体平台之一,与传统媒体相比,具有及时、碎片化、自由开放和大众性等特征。但是任何人都可以利用微博发布不良观点和评论,而且经过众人的转发和评论后会迅速扩散到整个社会网络中。一些欺骗性的言论能够造成社会安全的破坏、严重的会引发社会群体事件。因此政府相关部门必须对微博中的舆情信息进行分析、监控和预测,为进一步的管理和控制做出准备。
现有的互联网舆情信息监控和分析主要是关注两个问题:一是解决对海量信息的人工化处理的难题,提出一些利用计算机的文本分析和机器学习的方法设计而成的自动舆情分析系统,以此减少网络舆情监控过程中的人工劳动;二是尝试解决网络舆情发现精确度的难题,通过改善和优化文本分析、聚类算法等方法,提高文本中舆情语义挖掘的准确性。
经过对现有技术的文献检索发现,中国专利公开号为:CN101661513B,专利名称为:网络热点和舆情的检测方法,该技术方案提供了网络信息处理领域中的一种网络热点和舆情的检测方法,可以应用到微博舆情的检测和分析中。通过搜集一定时间范围内的微博正文信息和评论信息,并对这些信息的文本内容进行分词处理、概念映射处理,消除语义概念的不确定性,最终提取能够反映文本内容的特征。再利用这些内容特征数据进行聚类,形成若干个包含不等数量的信息文档集合,根据各个集合包含信息文档的数目来判定是否为网络中的热点事件,在对热点事件的信息文档集合进行褒贬倾向的分析,从而掌握网民对该事件的舆情观点,以此来检测微博舆情。
现有对微博监控和分析的方法关注自动化分析处理和舆情信息的判定,忽 视了舆情在整个在线社会网络传播趋势的分析,无法向网络舆情管控人员提供舆情传播到了何种程度,即无法判定某事件的舆情扩散程度。本发明从社会网络整体角度来检测和分析微博舆情传播,提出一种预测微博舆情传播程度的方法,通过监测哨兵节点的信息来判断舆情扩散情况。
发明内容
本发明的目的在于解决上述问题,提供一种微博舆情传播范围预测的方法,通过微博预测方法利用实际统计数据建立非线性模型,根据舆情事件的性质来监控哨兵节点的状态来确定微博舆情的覆盖情况,并向网络舆情管理者提供精确的舆情传播量化数据。
本发明解决上述问题所采用的技术方案是:
一种微博舆情传播范围预测的方法,按照下列顺序依次进行:
1)构建微博系统的传播网络模型:将每个微博用户视为一个节点,根据微博的粉丝、关注和好友关系建立节点之间的连边,形成一个复杂的在线社会网络模型;舆情传播范围即舆情消息覆盖率;
2)在微博传播网络中选择判断舆情覆盖范围的哨兵节点;
3)利用哨兵监测节点建立微博舆情传播范围的预测模型;
在实际微博网络中对事件舆情进行实证统计分析,并确定预测模型中的关键参数。
优选的,1)中所述的舆情消息覆盖率为已获知消息的节点集合与全部节点集合的比值,
O=|V‾||V|,]]>
式中表示节点数,|V|为全部节点数,注意全部节点指微博网络中有效用户范围内的节点总数;
消息传播过程是时间序列T={t1,t2,…,ti,ti+1,…},监测时刻tk的信息覆盖率为Ok,即
优选的,3)中的预测模型为微博网络哨兵节点预测信息覆盖率的问题转变为由合并到的事件来预测Ok,研究节点子集Vk与覆盖率O之间的规律,建立预测模型,通过探测属于Vk的哨兵节点的信息实现对信息覆盖率Ok的评估;在哨兵节点中选择一个节点传播影响力。
优选的,所述的哨兵节点包括意见领袖节点、社区中活跃节点、不活跃节点。
优选的,所述的节点传播影响力为节点的度与间接连通节点平均距离的乘积,I(i)=outdegree(i)×Σj=0ndijcount(i),]]>
I(i)表示节点i的影响力,outdegree(i)为节点的出度,dij表示与节点i间接连通的节点j之间的距离,count(i)表示节点i间接连通的其他所有节点的个数;最后建立先用统计方法建立节点影响力与信息覆盖率之间的关系模型
O(I)=f(I),
以O(I)=f(I),作为预测依据,探测若干节点是否传播到某条信息,以此来评估信息覆盖率,节点j的传播影响力为Ij,则代入后得出O(Ij),简写为Oj表示用探测节点j获取到的信息覆盖率;
选S曲线作为回归分析的基础模型,
本发明的有益效果是:
本发明在500-1000个微博节点的社会网络中进行实证统计实验,并以此获取预测模型的重要参数。然后再自行编写网络微博抓取程序来分析,并统计5000-10000个节点的社会网络数据,用此规模的微博网络验证预测方法的准确性,实验结果显示预测的准确性约为83.2%。
附图说明
图1是本发明影响力小节点作为源点的统计信息图;
图2是本发明影响力大节点作为源点的统计信息图;
图3是本发明中等影响力节点作为源点的统计信息图;
具体实施方式
下面结合附图与具体实施方式对本发明作进一步详细描述:
如图1、图2及图3所示,本发明所述的一种微博舆情传播范围预测的方法,实证的范围是选取某大学工科四个学院的校选课学生587人,涉及3个年级12个专业15个班级的在读大学生。每个人注册新浪微博后,再以自然方式形成线上社会关系,根据同寝室、朋友、同学和校内社区活动形成稳定的线上关系后不允许添加新关系。另外,只考虑在大学范围内的节点,忽略其他方式的节点关系,比如高中同学、亲友等。
以新浪微博系统为信息传播平台,选取随机节点作为信息源点来发布一些同质信息,例如培训学习和商业推广活动的宣传,大学生活动信息的发布。只允许学生利用微博来了解和传播信息,尽量消除线下传播的干扰。为每条测试消息定义一个唯一的id,标记为Mi,每个学生节点设定唯一id,记为Vj,当学生收到Mi进行正常评论和转发,同时向一个公共的邮箱发送一封电子邮件,该电子邮件标题为Mi和Vj。最后在电子邮件列表中提取消息传播的轨迹,每个学生信息为一个三元组<Mi,Vj,ti>,其中Mi为信息标示号,Vj为用户标示号,ti为邮件的接收时间,在此近似表示消息传播到达时间。
实证中采用三种影响力节点作为传播源点:影响力低的节点、影响力高的节点和中等影响力节点,分别为图1-3所示。图中x轴表示节点影响力,y轴表示信息覆盖率。每次选择5个同质消息传播进行实证,确定信息覆盖率的误差范围。观察图1-3后可发现节点影响力与信息覆盖率之间存在一定的非线性关系,影响力高节点对应较低的信息覆盖率,而影响力低的节点对应高的信息覆盖率。这种规律与现实社会中直观分析是一致的,我们尝试通过实证数据构造一个非线性模型来建立节点影响力与信息覆盖率直接的关系。
图1中以影响力小的节点作为传播源,形成一条比较平滑的曲线。可采用回归分析的方法来拟合式(4)O(Ij)。相比较而言,实证中监测到的中等影响力节点较少,中等影响力节点的区间相对稀疏。
图2中以影响力大的节点作为传播源,中等影响力节点区域更加稀疏,但是在影响力大的节点区间中误差范围明显减小,这是因为用影响力大的节点作为传播源的因素,5次实证过程误差波动较小。
图3中以中等影响力的节点作为传播源,中等影响力节点所在区间不再稀疏,而且误差波动较小;影响力大的节点出现减少趋势,信息覆盖率误差波动变大;影响力小的节点增加,误差波动无明显变化。
本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

一种微博舆情传播范围预测的方法.pdf_第1页
第1页 / 共7页
一种微博舆情传播范围预测的方法.pdf_第2页
第2页 / 共7页
一种微博舆情传播范围预测的方法.pdf_第3页
第3页 / 共7页
点击查看更多>>
资源描述

《一种微博舆情传播范围预测的方法.pdf》由会员分享,可在线阅读,更多相关《一种微博舆情传播范围预测的方法.pdf(7页珍藏版)》请在专利查询网上搜索。

本发明涉及社会网络建模与分析领域,具体涉及一种微博舆情传播范围预测的方法。按照下列顺序依次进行:1)构建微博系统的传播网络模型;2)在微博传播网络中选择判断舆情覆盖范围的哨兵节点;3)利用哨兵监测节点建立微博舆情传播范围的预测模型;4)在实际微博网络中对事件舆情进行实证统计分析,并确定预测模型中的关键参数。本发明在500-1000个微博节点的社会网络中进行实证统计实验,并以此获取预测模型的重要参数。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1