《社交网络账号的识别方法和装置.pdf》由会员分享,可在线阅读,更多相关《社交网络账号的识别方法和装置.pdf(17页珍藏版)》请在专利查询网上搜索。
1、10申请公布号CN104092601A43申请公布日20141008CN104092601A21申请号201410364828522申请日20140728H04L12/58200601H04L29/06200601H04L9/3220060171申请人北京微众文化传媒有限公司地址100191北京市海淀区五道口东升园华清嘉园华清园招待所2274室72发明人高立琦王震陈儒陈博74专利代理机构北京康信知识产权代理有限责任公司11240代理人李志刚吴贵明54发明名称社交网络账号的识别方法和装置57摘要本发明公开了一种社交网络账号的识别方法和装置。其中,社交网络账号的识别方法包括接收待识别的社交网络账号。
2、的身份标识;按照身份标识查询待识别的社交网络账号的可信度,可信度为预先计算得到的用于反映待识别的社交网络账号真实性的数值;如果查询到待识别的社交网络账号的可信度,则判断可信度是否超过可信阈值;如果判断出可信度超过可信阈值,则确定待识别的社交网络账号为第一账号,第一账号为真实用户使用的账号;以及如果判断出可信度未超过可信阈值,则确定待识别的社交网络账号为第二账号,第二账号为计算机操作的账号。通过本发明,达到了提高识别社交网络账号真实性的准确性的效果。51INTCL权利要求书3页说明书11页附图2页19中华人民共和国国家知识产权局12发明专利申请权利要求书3页说明书11页附图2页10申请公布号CN。
3、104092601ACN104092601A1/3页21一种社交网络账号的识别方法,其特征在于,包括接收待识别的社交网络账号的身份标识;按照所述身份标识查询所述待识别的社交网络账号的可信度,所述可信度为预先计算得到的用于反映所述待识别的社交网络账号真实性的数值;如果查询到所述待识别的社交网络账号的可信度,则判断所述可信度是否超过可信阈值;如果判断出所述可信度超过所述可信阈值,则确定所述待识别的社交网络账号为第一账号,所述第一账号为真实用户使用的账号;以及如果判断出所述可信度未超过所述可信阈值,则确定所述待识别的社交网络账号为第二账号,所述第二账号为计算机操作的账号。2根据权利要求1所述的识别方。
4、法,其特征在于,在接收社交网络账号的身份标识之前,所述识别方法还包括基于社交网络关系计算所述社交网络关系中每个社交网络账号的可信度;将计算得到的所述每个社交网络账号的可信度存储到数据库中,按照所述身份标识查询所述待识别的社交网络账号的可信度包括按照所述身份标识从所述数据库中查询所述待识别的社交网络账号的可信度。3根据权利要求2所述的识别方法,其特征在于,基于社交网络关系计算所述社交网络关系中每个社交网络账号的可信度包括获取社交网络中通过实名认证的社交网络账号,将所述通过实名认证的社交网络账号作为第一账号圈中的社交网络账号;获取所述通过实名认证的社交网络账号所关注的社交网络账号,将所述通过实名认。
5、证的社交网络账号和所述通过实名认证的社交网络账号所关注的社交网络账号作为第二账号圈中的社交网络账号;以及计算所述第二账号圈中的每个社交网络账号被所述第二账号圈中的社交网络账号所关注的第一数量,将计算得到的第一数量作为所述社交网络关系中每个社交网络账号的第一可信度。4根据权利要求3所述的识别方法,其特征在于,在计算所述第二账号圈中的每个社交网络账号被所述第二账号圈中的社交网络账号所关注的数量之后,所述识别方法还包括获取第三账号圈中的社交网络账号,其中,所述第三账号圈中的社交网络账号包括所述第二账号圈中的社交网络账号和所述第二账号圈中的社交网络账号所关注的账号;以及计算所述第三账号圈中的每个社交网。
6、络账号被所述第三账号圈中的社交网络账号所关注的第二数量,将计算得到的第二数量作为所述社交网络关系中每个社交网络账号的第二可信度。5根据权利要求4所述的识别方法,其特征在于,所述可信阈值包括第一阈值和第二阈值,其中,如果查找到所述待识别的社交网络账号的可信度包括所述第一可信度和所述第二可信度,判断所述可信度是否超过可信阈值包括判断所述第一可信度是否超过所述第一阈值;判断所述第二可信度是否超过所述第二阈值,权利要求书CN104092601A2/3页3其中,如果判断出所述第一可信度超过所述第一阈值,或者,判断出所述第二可信度超过所述第二阈值,则确定所述待识别的社交网络账号为所述第一账号;或者,如果判。
7、断出所述第一可信度超过所述第一阈值,并且判断出所述第二可信度超过所述第二阈值,则确定所述待识别的社交网络账号为所述第一账号。6一种社交网络账号的识别装置,其特征在于,包括接收单元,用于接收待识别的社交网络账号的身份标识;查询单元,用于按照所述身份标识查询所述待识别的社交网络账号的可信度,所述可信度为预先计算得到的用于反映所述待识别的社交网络账号真实性的数值;判断单元,用于当查询到所述待识别的社交网络账号的可信度时,判断所述可信度是否超过可信阈值;第一确定单元,用于当判断出所述可信度超过所述可信阈值时,确定所述待识别的社交网络账号为第一账号,所述第一账号为真实用户使用的账号;以及第二确定单元,用。
8、于当判断出所述可信度未超过所述可信阈值时,确定所述待识别的社交网络账号为第二账号,所述第二账号为计算机操作的账号。7根据权利要求6所述的识别装置,其特征在于,所述识别装置还包括计算单元,用于在接收社交网络账号的身份标识之前,基于社交网络关系计算所述社交网络关系中每个社交网络账号的可信度;存储单元,用于将计算得到的所述每个社交网络账号的可信度存储到数据库中,所述查询单元包括查询模块,用于按照所述身份标识从所述数据库中查询所述待识别的社交网络账号的可信度。8根据权利要求7所述的识别装置,其特征在于,所述计算单元包括第一获取模块,用于获取社交网络中通过实名认证的社交网络账号,将所述通过实名认证的社交。
9、网络账号作为第一账号圈中的社交网络账号;第二获取模块,用于获取所述通过实名认证的社交网络账号所关注的社交网络账号,将所述通过实名认证的社交网络账号和所述通过实名认证的社交网络账号所关注的社交网络账号作为第二账号圈中的社交网络账号;以及第一计算模块,用于计算所述第二账号圈中的每个社交网络账号被所述第二账号圈中的社交网络账号所关注的第一数量,将计算得到的第一数量作为所述社交网络关系中每个社交网络账号的第一可信度。9根据权利要求8所述的识别装置,其特征在于,所述计算单元还包括第三获取模块,用于在计算所述第二账号圈中的每个社交网络账号被所述第二账号圈中的社交网络账号所关注的数量之后,获取第三账号圈中的。
10、社交网络账号,其中,所述第三账号圈中的社交网络账号包括所述第二账号圈中的社交网络账号和所述第二账号圈中的社交网络账号所关注的账号;以及第二计算模块,用于计算所述第三账号圈中的每个社交网络账号被所述第三账号圈中的社交网络账号所关注的第二数量,将计算得到的第二数量作为所述社交网络关系中每个社交网络账号的第二可信度。10根据权利要求9所述的识别装置,其特征在于,所述可信阈值包括第一阈值和第二阈值,其中,权利要求书CN104092601A3/3页4所述判断单元包括第一判断模块,用于当查找到所述待识别的社交网络账号的可信度包括所述第一可信度和所述第二可信度时,判断所述第一可信度是否超过所述第一阈值;第二。
11、判断模块,用于判断所述第二可信度是否超过所述第二阈值,其中,所述第一确定单元还用于当判断出所述第一可信度超过所述第一阈值,或者,判断出所述第二可信度超过所述第二阈值,确定所述待识别的社交网络账号为所述第一账号;或者,所述第一确定单元还用于当判断出所述第一可信度超过所述第一阈值,并且判断出所述第二可信度超过所述第二阈值,确定所述待识别的社交网络账号为所述第一账号。权利要求书CN104092601A1/11页5社交网络账号的识别方法和装置技术领域0001本发明涉及社交网络领域,具体而言,涉及一种社交网络账号的识别方法和装置。背景技术0002随着现代技术的发展,计算机可以模拟社交网络上真实用户的一些。
12、行为,导致社交网络用户无法有效的辨别社交网络账号的背后是真实的用户还是计算机在操作。0003社交网络在人们的生活中扮演着重要的角色,它已成为人们生活的一部分,并对人们的信息获得、思考和生活产生不可低估的影响,而有些用户为了满足虚荣心,通过一些计算机伪造方式迅速增加社交好友的现象越来越多,这就造成了庞大的无效的社会关系网络。现有鉴别账号背后是否是真实的用户的技术一般是从账号的注册时间、用户等级、标签数、地理位置信息、自我描述信息、链接信息、认证信息、微博数、粉丝数、关注数、互粉数、收藏数、交互比例、微博粉丝比例、发布微博规律性、发布微博与转发微博比例等方面进行鉴别,但是,这些特征通过计算机都可以。
13、大量的伪造或者复制,所以罗列的这些指标就不再真实,鉴别到的账号也就不准确。0004目前,对社交网络账号的真实性进行识别方案具有如下缺点00051从账号的注册时间、用户等级、标签数、地理位置信息、自我描述信息、链接信息、认证信息、微博数、粉丝数、关注数、互粉数、收藏数、交互比例、微博粉丝比例、发布微博规律性、发布微博与转发微博比例等指标,计算机可以大量的伪造或者复制,所以通过以这些指标作为输入条件的方案识别账号真实性的结果不准确。00062通过以上指标作为输入条件进行识别,必须从网络上获取大量的数据,计算量大,速度慢。0007针对现有技术中无法准确识别社交网络账号的真实性的问题,目前尚未提出有效。
14、的解决方案。发明内容0008本发明的主要目的在于提供一种社交网络账号的识别方法和装置,以解决现有技术中无法准确识别社交网络账号的真实性的问题。0009为了实现上述目的,根据本发明的一个方面,提供了一种社交网络账号的识别方法。根据本发明的社交网络账号的识别方法包括接收待识别的社交网络账号的身份标识;按照身份标识查询待识别的社交网络账号的可信度,可信度为预先计算得到的用于反映待识别的社交网络账号真实性的数值;如果查询到待识别的社交网络账号的可信度,则判断可信度是否超过可信阈值;如果判断出可信度超过可信阈值,则确定待识别的社交网络账号为第一账号,第一账号为真实用户使用的账号;以及如果判断出可信度未超。
15、过可信阈值,则确定待识别的社交网络账号为第二账号,第二账号为计算机操作的账号。0010进一步地,在接收社交网络账号的身份标识之前,识别方法还包括基于社交网络关系计算社交网络关系中每个社交网络账号的可信度;将计算得到的每个社交网络账号的说明书CN104092601A2/11页6可信度存储到数据库中,按照身份标识查询待识别的社交网络账号的可信度包括按照身份标识从数据库中查询待识别的社交网络账号的可信度。0011进一步地,基于社交网络关系计算社交网络关系中每个社交网络账号的可信度包括获取社交网络中通过实名认证的社交网络账号,将通过实名认证的社交网络账号作为第一账号圈中的社交网络账号;获取通过实名认证。
16、的社交网络账号所关注的社交网络账号,将通过实名认证的社交网络账号和通过实名认证的社交网络账号所关注的社交网络账号作为第二账号圈中的社交网络账号;以及计算第二账号圈中的每个社交网络账号被第二账号圈中的社交网络账号所关注的第一数量,将计算得到的第一数量作为社交网络关系中每个社交网络账号的第一可信度。0012进一步地,在计算第二账号圈中的每个社交网络账号被第二账号圈中的社交网络账号所关注的数量之后,识别方法还包括获取第三账号圈中的社交网络账号,其中,第三账号圈中的社交网络账号包括第二账号圈中的社交网络账号和第二账号圈中的社交网络账号所关注的账号;以及计算第三账号圈中的每个社交网络账号被第三账号圈中的。
17、社交网络账号所关注的第二数量,将计算得到的第二数量作为社交网络关系中每个社交网络账号的第二可信度。0013进一步地,可信阈值包括第一阈值和第二阈值,其中,如果查找到待识别的社交网络账号的可信度包括第一可信度和第二可信度,判断可信度是否超过可信阈值包括判断第一可信度是否超过第一阈值;判断第二可信度是否超过第二阈值,其中,如果判断出第一可信度超过第一阈值,或者,判断出第二可信度超过第二阈值,则确定待识别的社交网络账号为第一账号;或者,如果判断出第一可信度超过第一阈值,并且判断出第二可信度超过第二阈值,则确定待识别的社交网络账号为第一账号。0014为了实现上述目的,根据本发明的另一方面,提供了一种社。
18、交网络账号的识别装置。根据本发明的社交网络账号的识别装置包括接收单元,用于接收待识别的社交网络账号的身份标识;查询单元,用于按照身份标识查询待识别的社交网络账号的可信度,可信度为预先计算得到的用于反映待识别的社交网络账号真实性的数值;判断单元,用于当查询到待识别的社交网络账号的可信度时,判断可信度是否超过可信阈值;第一确定单元,用于当判断出可信度超过可信阈值时,确定待识别的社交网络账号为第一账号,第一账号为真实用户使用的账号;以及第二确定单元,用于当判断出可信度未超过可信阈值时,确定待识别的社交网络账号为第二账号,第二账号为计算机操作的账号。0015进一步地,识别装置还包括计算单元,用于在接收。
19、社交网络账号的身份标识之前,基于社交网络关系计算社交网络关系中每个社交网络账号的可信度;存储单元,用于将计算得到的每个社交网络账号的可信度存储到数据库中,查询单元包括查询模块,用于按照身份标识从数据库中查询待识别的社交网络账号的可信度。0016进一步地,计算单元包括第一获取模块,用于获取社交网络中通过实名认证的社交网络账号,将通过实名认证的社交网络账号作为第一账号圈中的社交网络账号;第二获取模块,用于获取通过实名认证的社交网络账号所关注的社交网络账号,将通过实名认证的社交网络账号和通过实名认证的社交网络账号所关注的社交网络账号作为第二账号圈中的社交网络账号;以及第一计算模块,用于计算第二账号圈。
20、中的每个社交网络账号被第二账号圈中的社交网络账号所关注的第一数量,将计算得到的第一数量作为社交网络关系说明书CN104092601A3/11页7中每个社交网络账号的第一可信度。0017进一步地,计算单元还包括第三获取模块,用于在计算第二账号圈中的每个社交网络账号被第二账号圈中的社交网络账号所关注的数量之后,获取第三账号圈中的社交网络账号,其中,第三账号圈中的社交网络账号包括第二账号圈中的社交网络账号和第二账号圈中的社交网络账号所关注的账号;以及第二计算模块,用于计算第三账号圈中的每个社交网络账号被第三账号圈中的社交网络账号所关注的第二数量,将计算得到的第二数量作为社交网络关系中每个社交网络账号。
21、的第二可信度。0018进一步地,可信阈值包括第一阈值和第二阈值,其中,判断单元包括第一判断模块,用于当查找到待识别的社交网络账号的可信度包括第一可信度和第二可信度时,判断第一可信度是否超过第一阈值;第二判断模块,用于判断第二可信度是否超过第二阈值,其中,第一确定单元还用于当判断出第一可信度超过第一阈值,或者,判断出第二可信度超过第二阈值,确定待识别的社交网络账号为第一账号;或者,第一确定单元还用于当判断出第一可信度超过第一阈值,并且判断出第二可信度超过第二阈值,确定待识别的社交网络账号为第一账号。0019根据本发明实施例,通过接收待识别的社交网络账号的身份标识,按照身份标识查询待识别的社交网络。
22、账号的可信度,如果判断出可信度超过可信阈值,则确定待识别的社交网络账号为第一账号即真实用户使用的账号,如果判断出可信度未超过可信阈值,则确定待识别的社交网络账号为第二账号即计算机操作的账号,通过可信度来判断社交网络账号的真实性,解决了无法准确识别社交网络账号的真实性的问题,达到了提高识别社交网络账号真实性的准确性的效果。附图说明0020构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中0021图1是根据本发明实施例的社交网络账号的识别方法的流程图;0022图2是根据本发明实施例的账号圈的示意图;以及0023图3。
23、是根据本发明实施例的社交网络账号的识别装置的示意图。具体实施方式0024需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。0025为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。0026需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是。
24、用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例。此外,术语“包括”和说明书CN104092601A4/11页8“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。0027本发明实施例提供了一种社交网络账号的识别方法。0028图1是根据本发明实施例的社交网络账号的识别方法的流程图。如图1所示,该社交网络账号的识别方法包括步骤如下0029步骤S。
25、102,接收待识别的社交网络账号的身份标识。0030社交网络账号可以是社会性网络服务SOCIALNETWORKINGSERVICES,简称SNS所用到的账号,可以是例如新浪微博、腾讯微博等社交网络服务的账号。身份标识ID为待识别的社交网络账号的唯一标识,以便于依据该身份标识查询该待识别的社交网络账号的可信度。0031步骤S104,按照身份标识查询待识别的社交网络账号的可信度。该可信度为预先计算得到的用于反映待识别的社交网络账号真实性的数值。0032社交网络账号的可信度可以基于社交网络关系计算得到,该社交网络关系可以是基于真实的社交网络账号建立的社交关系,例如,通过实名认证的社交网络账号及其关注。
26、的账号,以及其关注的账号所关注的账号,这样形成的层层社交关系。基于社交网络关系计算该社交网络关系中每个社交网络账号的可信度,并按照每个社交网络账号的身份标识一一对应地存储计算得到的可信度,这样,在识别社交网络账号的真实性时,可以直接从存储的可信度中查询带识别的社交网络账号的可信度,以便于通过该可信度判断待识别的社交网络账号的真实性。其中,可信度可以采用PAGERANK算法、HITS算法等进行计算得到,也可以通过自定义的算法进行计算得到。0033由于在社交网络中,并非所有的社交网络账号均能够预先计算得到其可信度,因此查询待识别的社交网络账号时,如果能够查到,则对查询到的可信度进行判断,反之,则可。
27、以认为无法识别该社交网络账号的真实性。0034步骤S106,如果查询到待识别的社交网络账号的可信度,则判断可信度是否超过可信阈值。0035可信阈值可以是用于判断社交网络账号的真实性的阈值,该阈值可以根据实际需要或者根据统计结果进行设置和调整。0036步骤S108,如果判断出可信度超过可信阈值,则确定待识别的社交网络账号为第一账号。该第一账号为真实用户使用的账号。0037步骤S110,如果判断出可信度未超过可信阈值,则确定待识别的社交网络账号为第二账号。该第二账号为计算机操作的账号。0038第一账号为真实用户使用的一类账号,该账号的使用和操作者为真实的自然人,第二账号为通过计算机操作的账号。当待。
28、识别的社交网络账号的可信度超过可信阈值时,表明该待识别的社交网络账号为第一账号即真实账号的可能性比较大,则认为该待识别的账号为第一账号;反之,则认为其为第二账号即计算机操作的账号。0039根据本发明实施例,通过接收待识别的社交网络账号的身份标识,按照身份标识查询待识别的社交网络账号的可信度,如果判断出可信度超过可信阈值,则确定待识别的社交网络账号为第一账号即真实用户使用的账号,如果判断出可信度未超过可信阈值,则说明书CN104092601A5/11页9确定待识别的社交网络账号为第二账号即计算机操作的账号,通过可信度来判断社交网络账号的真实性,解决了无法准确识别社交网络账号的真实性的问题,达到了。
29、提高识别社交网络账号真实性的准确性的效果。0040优选地,在接收社交网络账号的身份标识之前,本发明实施例的识别方法还包括基于社交网络关系计算社交网络关系中每个社交网络账号的可信度;将计算得到的每个社交网络账号的可信度存储到数据库中,按照身份标识查询社交网络账号的可信度包括按照身份标识从数据库中查询待识别的社交网络账号的可信度。0041由于社交网络中各账号之间存在相互关注或者收听等社交网络关系,由于一些真实的用户所关注或者收听的账号大都为真实的账号,因此,利用社交网络关系可以统计计算每个账号关注或者被关注的账号数量,以此为基础计算该社交网络关系中每个账号的可信度。然后将计算得到的社交网络账号的可。
30、信度,按照社交网络账号的身份标识形成一一对应的映射关系,存储到数据库中。这样,就可以按照社交网络账号身份标识从数据库中查询待识别的社交网络账号的可信度。0042具体地,以社交网络的真实用户作为基础集合,以新浪微博这个社交网络平台的场景为例,即以加“V”认证的企业账号和个人账号为基础集合,这些账号都有严格的实名认证体系,即新浪微博认可这些用户账号的真实性,且假设这些用户关注的账号背后也是真实用户。通过这些真实用户的社交网络关系开始一层层向外扩散,有效排除了计算机伪造数据的风险,用固定的方法计算可信度来达到判断账号是否真实的目的。从真实用户开始开展社交网络关系,并层层递推获得所需要的关注网络关系结。
31、构,并不局限于新浪微博平台的加“V”用户,可以用其他有权威的真实的用户来替代,譬如新浪的名人堂用户。0043根据本发明实施例,基于社交网络关系计算社交网络账号的可信度,可以进一步地提高识别社交网络账号真实性的准确性。0044另外,将计算得到的社交网络账号的可信度存入数据库中,在识别账号真实性时,只需要传入账号ID,数据库即可返回其可信度,无须再从互联网上获取大量数据,判断时计算量小,速度快。0045优选地,基于社交网络关系计算社交网络关系中每个社交网络账号的可信度包括0046获取社交网络中通过实名认证的社交网络账号,将通过实名认证的社交网络账号作为第一账号圈中的社交网络账号。0047通过实名认。
32、证的社交网络账号可以是例如新浪微博中的加“V”账号,将这些账号作为基础集合即第一账号圈。由于实名认证的社交网络账号通常为有效用户,可以基于这些账号来计算其他社交网络账号的可信度。0048获取通过实名认证的社交网络账号所关注的社交网络账号,将通过实名认证的社交网络账号和通过实名认证的社交网络账号所关注的社交网络账号作为第二账号圈中的社交网络账号。0049实名认证的社交网络账号通过社交网络关注一些账号,这些账号可以是通过实名认证的社交网络账号,也可以是未进行认证的社交网络账号,将通过实名认证的社交网络账号及其所关注的社交网络账号作为第二账号圈中的账号。0050计算第二账号圈中的每个社交网络账号被第。
33、二账号圈中的社交网络账号所关注说明书CN104092601A6/11页10的第一数量,将计算得到的第一数量作为社交网络关系中每个社交网络账号的第一可信度。0051在获取到这些账号之后,即可得到每个账号所关注的账号或者被关注的账号,计算第二账号圈中每个社交网络账号被第二账号圈中的社交网络账号所关注的第一数量,即计算第二账号圈中的账号被该圈中其他账号关注的数量,例如,第二账号圈中包含有10个账号,其中,账号A被该圈中的8个账号关注,则账号A的可信度记为8。0052需要说明的是,本发明实施例中,对第二账户圈中的账号进行计算时,可以是仅计算通过实名认证的社交网络账号之外的其他账号的可信度,通过实名认证。
34、的社交网络账号可以直接标记为真实账号,存储在数据库中,在从数据库查找这些账号时,可以直接输出结果。0053优选地,在计算第二账号圈中的每个社交网络账号被第二账号圈中的社交网络账号所关注的数量之后,识别方法还包括获取第三账号圈中的社交网络账号,其中,第三账号圈中的社交网络账号包括第二账号圈中的社交网络账号和第二账号圈中的社交网络账号所关注的账号;以及计算第三账号圈中的每个社交网络账号被第三账号圈中的社交网络账号所关注的第二数量,将计算得到的第二数量作为社交网络关系中每个社交网络账号的第二可信度。0054第三账号圈中的社交网络账号包括第二账号圈中的社交网络账号和第二账号圈中的社交网络账号所关注的账。
35、号,具体地,第三账号圈中的社交网络账号可以包括第二账号圈中所有的社交网络账号和这些账号所关注的除第二账号圈中之外的社交网络账号,然后按照与第二账号圈中相类似的计算方式计算第三账号圈中的社交网络账号的可信度。0055由此可以看出,由于第三账号圈中包括第二账号圈的账号,因此,对于第二账号圈中的社交网络账号,可能存在两个可信度,即第一可信度和第二可信度,因此,在判断该社交网络账号的真实性时,可以对这两个可信度分别进行判断,或者综合进行判断。0056需要说明的是,本发明实施例中,可以按照上述计算方式依次计算第四账号圈、第五账号圈、第N账号圈中的社交网络账号的可信度,其计算原理均相同,这里不做赘述。00。
36、57根据本发明实施例,通过将计算到的社交网络账号被相同圈内账号所关注的数量作为可信度,依次来判断社交网络账号的真实性,可以进一步提高识别社交网络真实性的准确性。0058优选地,可信阈值包括第一阈值和第二阈值,其中,如果查找到所述待识别的社交网络账号的可信度包括所述第一可信度和所述第二可信度,则判断可信度是否超过可信阈值,包括判断第一可信度是否超过第一阈值;判断第二可信度是否超过第二阈值,其中,如果判断出第一可信度超过第一阈值,或者,判断出第二可信度超过第二阈值,则确定待识别的社交网络账号为第一账号;或者,如果判断出第一可信度超过第一阈值,并且判断出第二可信度超过第二阈值,则确定待识别的社交网络。
37、账号为第一账号。0059当查找到同一社交网络账号的可信度包括两个时,可以分别判断每个可信度是否超出相应的阈值,只要有一个超出阈值,则可以认为该账号为真实账号;或者,在进行判断识别时,只有满足两个可信度均符合要求时,才认为该账号为真实账号。0060相应地,由于账号圈可以是多个,因此,当查询到的可信度为多个时,如果这些可说明书CN104092601A107/11页11信度中,一个或者多个满足条件时,可以认为该账号为真实账号。0061下面以新浪微博为例,结合图2对本发明实施例进行详细描述;00621、从网页上获取所有加“V”的账号0视为有效用户,作为基础集合VF0,即图2中第一账号圈一内的节点。00。
38、632、获取基础集合VF0中账号的关注账号1,基础集合VF0及其关注账号的集合统称为集合VF1,即图2中第二账号圈二内的节点。00643、再次获取集合VF1中账号的关注账号2,此时集合VF1及其关注账号的集合统称为集合VF2,即图2中第三账号圈三内的节点。00654、通过VF分值的方法来计算集合VF1中账号的分值IV0,集合VF2中账号的分值IV1。VF分值指圈内某一账号被同一圈子中其他账号所关注的数量。计算分值的方法不依赖于VF方法,可以使用PAGERANK、HITS算法。00665、依次类推,系统定期自动以圈内的账号作为输入进行迭代获取关注账号,进而将社交网络进行扩展,即从加“V”的账号扩。
39、展出的第一层VF1至第N层VFN,出现N组VF分值。我们假设通过加“V”用户扩展两层即满足需求,即扩展到了VF2集合,同时也就对于VF2集合中所有用户计算出了两个分值IV0和IV1。00676、将分值IV0和IV1存入数据库中。00687、通过传入账号ID,系统返回一组分值,和设定的分数阀值进行比较,鉴别账号背后是否是有效用户。设定以下条件满足全部或者满足其中几项即可视为有效用户0069IV0N1,N1为设定的分数阈值;0070IV1N2,N2为设定的分数阈值;00710072本发明实施例还提供了一种社交网络账号的识别装置。该装置可以通过社交网络账号的识别实现其功能。需要说明的是,本发明实施例。
40、的社交网络账号的识别装置可以用于执行本发明实施例所提供的社交网络账号的识别方法,本发明实施例的社交网络账号的识别方法也可以通过本发明实施例所提供的社交网络账号的识别装置来执行。0073图3是根据本发明实施例的社交网络账号的识别装置的示意图。如图3所示,该社交网络账号的识别装置包括接收单元10、查询单元20、判断单元30、第一确定单元40和第二确定单元50。0074接收单元10用于接收待识别的社交网络账号的身份标识。0075社交网络账号可以是社会性网络服务SOCIALNETWORKINGSERVICES,简称SNS所用到的账号,可以是例如新浪微博、腾讯微博等社交网络服务的账号。身份标识ID为待识。
41、别的社交网络账号的唯一标识,以便于依据该身份标识查询该待识别的社交网络账号的可信度。0076查询单元20用于按照身份标识查询待识别的社交网络账号的可信度,可信度为预先计算得到的用于反映待识别的社交网络账号真实性的数值。0077社交网络账号的可信度可以基于社交网络关系计算得到,该社交网络关系可以是基于真实的社交网络账号建立的社交关系,例如,通过实名认证的社交网络账号及其关注的账号,以及其关注的账号所关注的账号,这样形成的层层社交关系。基于社交网络关系计算该社交网络关系中每个社交网络账号的可信度,并按照每个社交网络账号的身份标识说明书CN104092601A118/11页12一一对应地存储计算得到。
42、的可信度,这样,在识别社交网络账号的真实性时,可以直接从存储的可信度中查询带识别的社交网络账号的可信度,以便于通过该可信度判断待识别的社交网络账号的真实性。其中,可信度可以采用PAGERANK算法、HITS算法等进行计算得到,也可以通过自定义的算法进行计算得到。0078由于在社交网络中,并非所有的社交网络账号均能够预先计算得到其可信度,因此查询待识别的社交网络账号时,如果能够查到,则对查询到的可信度进行判断,反之,则可以认为无法识别该社交网络账号的真实性。0079判断单元30用于当查询到待识别的社交网络账号的可信度时,判断可信度是否超过可信阈值。0080可信阈值可以是用于判断社交网络账号的真实。
43、性的阈值,该阈值可以根据实际需要或者根据统计结果进行设置和调整。0081第一确定单元40用于当判断出可信度超过可信阈值时,确定待识别的社交网络账号为第一账号,第一账号为真实用户使用的账号。0082第二确定单元50用于当判断出可信度未超过可信阈值时,确定待识别的社交网络账号为第二账号,第二账号为计算机操作的账号。0083第一账号为真实用户使用的一类账号,该账号的使用和操作者为真实的自然人,第二账号为通过计算机操作的账号。当待识别的社交网络账号的可信度超过可信阈值时,表明该待识别的社交网络账号为第一账号即真实账号的可能性比较大,则认为该待识别的账号为第一账号;反之,则认为其为第二账号即计算机操作的。
44、账号。0084根据本发明实施例,通过接收待识别的社交网络账号的身份标识,按照身份标识查询待识别的社交网络账号的可信度,如果判断出可信度超过可信阈值,则确定待识别的社交网络账号为第一账号即真实用户使用的账号,如果判断出可信度未超过可信阈值,则确定待识别的社交网络账号为第二账号即计算机操作的账号,通过可信度来判断社交网络账号的真实性,解决了无法准确识别社交网络账号的真实性的问题,达到了提高识别社交网络账号真实性的准确性的效果。0085优选地,识别装置还包括计算单元,用于在接收社交网络账号的身份标识之前,基于社交网络关系计算社交网络关系中每个社交网络账号的可信度;存储单元,用于将计算得到的每个社交网。
45、络账号的可信度存储到数据库中,查询单元包括查询模块,用于按照身份标识从数据库中查询待识别的社交网络账号的可信度。0086由于社交网络中各账号之间存在相互关注或者收听等社交网络关系,由于一些真实的用户所关注或者收听的账号大都为真实的账号,因此,利用社交网络关系可以统计计算每个账号关注或者被关注的账号数量,以此为基础计算该社交网络关系中每个账号的可信度。然后将计算得到的社交网络账号的可信度,按照社交网络账号的身份标识形成一一对应的映射关系,存储到数据库中。这样,就可以按照社交网络账号身份标识从数据库中查询待识别的社交网络账号的可信度。0087具体地,以社交网络的真实用户作为基础集合,以新浪微博这个。
46、社交网络平台的场景为例,即以加“V”认证的企业账号和个人账号为基础集合,这些账号都有严格的实名认证体系,即新浪微博认可这些用户账号的真实性,且假设这些用户关注的账号背后也是真实用户。通过这些真实用户的社交网络关系开始一层层向外扩散,有效排除了计算机伪造说明书CN104092601A129/11页13数据的风险,用固定的方法计算可信度来达到判断账号是否真实的目的。0088根据本发明实施例,基于社交网络关系计算社交网络账号的可信度,可以进一步地提高识别社交网络账号真实性的准确性。0089另外,将计算得到的社交网络账号的可信度存入数据库中,在识别账号真实性时,只需要传入账号ID,数据库即可返回其可信。
47、度,无须再从互联网上获取大量数据,判断时计算量小,速度快。0090优选地,计算单元包括第一获取模块,用于获取社交网络中通过实名认证的社交网络账号,将通过实名认证的社交网络账号作为第一账号圈中的社交网络账号;第二获取模块,用于获取通过实名认证的社交网络账号所关注的社交网络账号,将通过实名认证的社交网络账号和通过实名认证的社交网络账号所关注的社交网络账号作为第二账号圈中的社交网络账号;以及第一计算模块,用于计算第二账号圈中的每个社交网络账号被第二账号圈中的社交网络账号所关注的第一数量,将计算得到的第一数量作为社交网络关系中每个社交网络账号的第一可信度。0091通过实名认证的社交网络账号可以是例如新。
48、浪微博中的加“V”账号,将这些账号作为基础集合即第一账号圈。由于实名认证的社交网络账号通常为有效用户,可以基于这些账号来计算其他社交网络账号的可信度。0092通过实名认证的社交网络账号通过社交网络关注一些账号,这些账号可以是通过实名认证的社交网络账号,也可以是为进行认证的社交网络账号,将通过实名认证的社交网络账号及其所关注的社交网络账号作为第二账号圈中的账号。0093在获取到这些账号之后,即可得到每个账号所关注的账号或者被关注的账号,计算第二账号圈中每个社交网络账号被第二账号圈中的社交网络账号所关注的第一数量,即计算第二账号圈中的账号被该圈中其他账号关注的数量,例如,第二账号圈中包含有10个账。
49、号,其中,账号A被该圈中的8个账号关注,则账号A的可信度记为8。0094需要说明的是,本发明实施例中,对第二账户圈中的账号进行计算时,可以是仅计算通过实名认证的社交网络账号之外的其他账号的可信度,通过实名认证的社交网络账号可以直接标记为真实账号,存储在数据库中,在从数据库查找这些账号时,可以直接输出结果。0095优选地,计算单元还包括第三获取模块,用于在计算第二账号圈中的每个社交网络账号被第二账号圈中的社交网络账号所关注的数量之后,获取第三账号圈中的社交网络账号,其中,第三账号圈中的社交网络账号包括第二账号圈中的社交网络账号和第二账号圈中的社交网络账号所关注的账号;以及第二计算模块,用于计算第三账号圈中的每个社交网络账号被第三账号圈中的社交网络账号所关注的第二数量,将计算得到的第二数量作为社交网络关系中每个社交网络账号的第二可信度。0096第三账号圈中的社交网络账号包括第二账号圈中的社交网络账号和第二账号圈中的社交网络账号所关注的账号,具体地,第三账号圈中的社交网络账号可以包括第二账号圈中所有的社交网络账号和这些账号所关注的除第二账号圈中之外的社交网络账号,然后按照与第二账号圈中相类似的计算方式计算第三账号圈中的社交网络账号的可信度。0097由此可以看出,由于第三账号圈中包括第二账号圈的账号,因此,对于第二账号圈中的社交网络账号,可能存在两个可信度,即第一可信度和第二可信度,因此。