一种挖掘目标微博用户的方法.pdf

上传人:Y948****062 文档编号:4025520 上传时间:2018-08-12 格式:PDF 页数:6 大小:289.24KB
返回 下载 相关 举报
摘要
申请专利号:

CN201510047759.X

申请日:

2015.01.30

公开号:

CN104573096A

公开日:

2015.04.29

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):G06F 17/30申请日:20150130|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

湖南识微科技有限公司

发明人:

李景泽

地址:

410013湖南省长沙市高新区文轩路27号麓谷企业广场A4栋605室

优先权:

专利代理机构:

代理人:

PDF下载: PDF下载
内容摘要

本发明涉及网络技术领域,特别是一种挖掘目标微博用户的方法,包括以下步骤,社交网络形成,以微博用户作为社交网络中的节点,以相互提交关系作为边形成社交网络;种子用户密友选择,指定用户为种子,以种子用户和其他用户互相提及关系的频繁次数选择确定种子用户的密友;种子用户好友选择,以密友和种子用户建立的社交圈选择确定种子用户的好友;种子用户普通朋友选择,以种子用户、密友和好友建立的社交圈选择确定种子用户的普通朋友;种子用户社交圈确定,以种子用户、密友、好友和普通朋友组成的集合形成种子用户社交圈。采用上述方法后,本发明速度快,挖掘目标微博用户的社交圈效率高,满足实时分析的需求。

权利要求书

权利要求书
1.  一种挖掘目标微博用户的方法,其特征在于,包括以下步骤:
步骤S101:社交网络形成,以微博用户作为社交网络中的节点,以相互提交关系作为边形成社交网络;
步骤S102:种子用户密友选择,指定用户为种子,以种子用户和其他用户互相提及关系的频繁次数选择确定种子用户的密友;
步骤S103:种子用户好友选择,以密友和种子用户建立的社交圈选择确定种子用户的好友;
步骤S104:种子用户普通朋友选择,以种子用户、密友和好友建立的社交圈选择确定种子用户的普通朋友;
步骤S105:种子用户社交圈确定,以种子用户、密友、好友和普通朋友组成的集合形成种子用户社交圈。

2.  按照权利要求1所述的一种挖掘目标微博用户的方法,其特征在于:所述密友、好友和普通朋友的数量以需要确定的种子用户社交圈的大小为准。

3.  按照权利要求2所述的一种挖掘目标微博用户的方法,其特征在于:所述步骤S101中提及关系包括转发或直接提及到其他用户的行为,并存储相互提及的次数。

4.  按照权利要求3所述的一种挖掘目标微博用户的方法,其特征在于:所述步骤S102中种子用户和其他用户互相提及关系的频繁次数为种子用户提及频繁的用户或频繁提及种子用户的用户。

5.  按照权利要求4所述的一种挖掘目标微博用户的方法,其特征在于,所述步骤S103还包括以下步骤,
步骤S1031:以种子用户和密友作为一个社交圈C;
步骤S1032:在C的邻居集合中选择一个与C中节点存在交互关系最多的节点以好友身份加入C中;
步骤S1033:判断好友数量是否满足要求,如果否,反正步骤S1032;如果是,则进入步骤S104。

6.  按照权利要求5所述的一种挖掘目标微博用户的方法,其特征在于:如果步骤S1032中同时存在多个满足条件的节点,则选取聚集系数最高的一个节点加入C。

7.  按照权利要求5所述的一种挖掘目标微博用户的方法,其特征在于,所述步骤S104包括以下步骤,
步骤S1041:以种子用户、密友和好友作为一个社交圈D;
步骤S1042:在D的邻居集合中选择一个与D中节点存在交互关系最多的节点以普通朋友身份加入D中;
步骤S1043:判断普通朋友数量是否满足要求,如果否,反正步骤S1042;如果是,则进入步骤S105。

说明书

说明书一种挖掘目标微博用户的方法
技术领域
本发明涉及网络技术领域,特别是一种挖掘目标微博用户的方法。
背景技术
在微博用户形成的社交网络中,寻找某个特定用户的社交圈对于分析用户的兴趣行为有着非常重要的作用。比较流行的算法有最大团算法等,但是最大团算法要求最大联通子图,这种约束对社交网络来说过于苛刻,很难分析出用户潜在的社交网络;另一方面,这种算法没有很好的利用微博的社交属性,当我们用交互行为作为连接微博用户节点的边时,最大团算法并不会考虑微博用户与其他用户的交互次数,而这种能够体现出用户之间交互意愿统计属性,对于分析微博用户的社交圈极其重要。
中国发明专利CN 103345535 A公开了一种微博用户挖掘方法,包括:判断用户列表中是否存在未处理用户;如果不存在,则按照预设规则从微博网页中抓取用户数据,并判断用户数据对应的抓取用户是否存在于用户列表,如果不存在,则将该抓取用户添加至用户列表,并设置该抓取用户的状态已处理;如果存在,则判断该未处理用户是否具有下级用户:如果具有,则获取该未处理用户的下级用户,并将下级用户添加到用户列表,设置未处理用户的状态为已处理;将下级用户作为未处理用户,继续执行判断未处理用户是否具有下级用户的步骤;如果不具有,则设置该未处理用户的状态为已处理。
发明内容
本发明需要解决的技术问题提供一种可以快速识别和挖掘目标微博用户相关潜在用户的方法。
为解决上述的技术问题,本发明一种挖掘目标微博用户的方法,包括以下步骤,步骤S101:社交网络形成,以微博用户作为社交网络中的节点,以相互提交关系作为边形成社交网络;步骤S102:种子用户密友选择,指定用户为种子,以种子用户和其他用户互相提及关系的频繁次数选择确定种子用户的密友;步骤S103:种子用户好友选择,以密友和种子用户建立的社交圈选择确定种子用户的好友;步骤S104:种子用户普通朋友选择,以种子用户、密友和好友建立的社交圈选择确定种子用户的普通朋友;步骤S105:种子用户社交圈确定,以种子用户、密友、好友和普通朋友组成的集合形成种子用户社交圈。
进一步的,所述密友、好友和普通朋友的数量以需要确定的种子用户社交圈的大小为准。
更进一步的,所述步骤S101中提及关系包括转发或直接提及到其他用户的行为,并存储相互提及的次数。
更进一步的,所述步骤S102中种子用户和其他用户互相提及关系的频繁次数包括种子用户提及频繁的用户或频繁提及种子用户的用户。
更进一步的,所述步骤S103还包括以下步骤,步骤S1031:以种子用户和密友作为一个社交圈C;步骤S1032:在C的邻居集合中选择一个与C中节点存在交互关系最多的节点以好友身份加入C中;步骤S1033:判断好友数量是否满足要求,如果否,反正步骤S1032;如果是,则进入步骤S104。
更进一步的,如果步骤S1032中同时存在多个满足条件的节点,则选取聚集系数最高的一个节点加入C。
更进一步的,所述步骤S104包括以下步骤,步骤S1041:以种子用户、密友和好友作为一个社交圈D;步骤S1042:在D的邻居集合中选择一个与D中节点存在交互关系最多的节点以普通朋友身份加入D中;步骤S1043:判断普通朋友数量是否满足要求,如果否,反正步骤S1042;如果是,则进入步骤S105。
采用上述方法后,本发明通过放宽对用户交互关系的约束,能够找全目标微博用户潜在的社交圈;通过对密友不同选择条件,能够分析出目标微博用户具备不同社交属性的社交圈。本发明速度快,挖掘目标微博用户的社交圈效率高,满足实时分析的需求。
附图说明
下面将结合附图和具体实施方式对本作进一步详细的说明。
图1为本发明一种挖掘目标微博用户方法的流程图。
具体实施方式
如图1所示,本发明一种挖掘目标微博用户的方法,包括以下步骤:
步骤S101:社交网络形成,以微博用户作为社交网络中的节点,以相互提交关系作为边形成社交网络。这里涉及的提及关系包括转发或直接提及到其他用户的行为,并存储相互提及的次数。本实施方式中由于最后确定的种子用户的社交圈包括种子用户、密友、好友和普通朋友,而密友、好友和普通朋友的数量要以所确定的种子用户社交圈的大小为准,这里假设需要确定的密友k人,好友m人,普通朋友n人,那么种子用户的社交圈为1+k+m+n,其中1表示种子用户本身。
步骤S102:种子用户密友选择,指定用户为种子,以种子用户和其他用户互相提及关系的频繁次数选择确定种子用户的密友。这里种子用户和其他用户互相提及关系的频繁次数包括种子用户提及频繁的用户或频繁提及种子用户的用户。这两种不同的密友选择条件,能够分析出目标微博用户(种子用户)不同社交属性的社交圈,具体如下:
a)种子用户提及最频繁的人
1、当种子用户的出度(提及到其他用户的数量)远远大于入度(提及到种子用户的其他用户数量)时,最终形成的社交圈是种子用户比较感兴趣的社群。
2、当种子用户的出度远远小于入度时,最终形成的社交圈是种子用户真实社交圈。
b)频繁提及种子用户的人
1、当种子用户的出度远远大于入度时,最终形成的社交圈是种子用户的真实社交圈。
2、当种子用户的出度远远小于入度时,最终形成的社交圈是对种子用户感兴趣的社群,即粉丝群。
根据以上条件选择适应的密友K个。
步骤S103:种子用户好友选择,以密友和种子用户建立的社交圈选择确定种子用户的好友;步骤S1031:以种子用户和密友作为一个社交圈C;步骤S1032:在C的邻居集合中选择一个与C中节点存在交互关系最多的节点以好友身份加入C中,这里如果同时存在多个满足条件的节点,则选取聚集系数最高的一个节点加入C;步骤S1033:判断好友数量是否达到m,如果否,反正步骤S1032;如果是,则进入步骤S104。其中邻居集合指与C中任一节点存在交互关系的节点。
步骤S104:种子用户普通朋友选择,以种子用户、密友和好友建立的社交圈选择确定种子用户的普通朋友。具体包括以下步骤S1041:以种子用户、密友和好友作为一个社交圈D;步骤S1042:在D的邻居集合中选择一个与D中节点存在交互关系最多的节点以普通朋友身份加入D中;步骤S1043:判断普通朋友数量是否达到n,如果否,反正步骤S1042;如果是,则进入步骤S105;这里选取聚集系数排列前n个人。
步骤S105:种子用户社交圈确定,以种子用户、密友、好友和普通朋友组成的集合形成种子用户社交圈,所述种子用户社交圈包括1+k+m+n。
虽然以上描述了本发明的具体实施方式,但是本领域熟练技术人员应当理解,这些仅是举例说明,可以对本实施方式作出多种变更或修改,而不背离发明的原理和实质,本发明的保护范围仅由所附权利要求书限定。

一种挖掘目标微博用户的方法.pdf_第1页
第1页 / 共6页
一种挖掘目标微博用户的方法.pdf_第2页
第2页 / 共6页
一种挖掘目标微博用户的方法.pdf_第3页
第3页 / 共6页
点击查看更多>>
资源描述

《一种挖掘目标微博用户的方法.pdf》由会员分享,可在线阅读,更多相关《一种挖掘目标微博用户的方法.pdf(6页珍藏版)》请在专利查询网上搜索。

本发明涉及网络技术领域,特别是一种挖掘目标微博用户的方法,包括以下步骤,社交网络形成,以微博用户作为社交网络中的节点,以相互提交关系作为边形成社交网络;种子用户密友选择,指定用户为种子,以种子用户和其他用户互相提及关系的频繁次数选择确定种子用户的密友;种子用户好友选择,以密友和种子用户建立的社交圈选择确定种子用户的好友;种子用户普通朋友选择,以种子用户、密友和好友建立的社交圈选择确定种子用户的普通。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1