《一种用于检测互动平台中爆发信息的方法与设备.pdf》由会员分享,可在线阅读,更多相关《一种用于检测互动平台中爆发信息的方法与设备.pdf(22页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 102982041 A(43)申请公布日 2013.03.20CN102982041A*CN102982041A*(21)申请号 201110262702.3(22)申请日 2011.09.06G06F 17/30(2006.01)(71)申请人百度在线网络技术(北京)有限公司地址 100085 北京市海淀区上地十街10号百度大厦(72)发明人李彦宏 舒迅 帅帅 尹佳陈楚洁 周天 方勇 王波(74)专利代理机构北京汉昊知识产权代理事务所(普通合伙) 11370代理人罗朋(54) 发明名称一种用于检测互动平台中爆发信息的方法与设备(57) 摘要本发明的目的是提供一种用于。
2、检测互动平台中爆发信息的方法与设备,其中,检测设备通过获取互动平台中多个发布信息以确定爆发模式,进而根据所述爆发模式,从所述多个发布信息中确定爆发信息。与现有技术相比,本发明可以及时准确地检测互动平台中是否产生爆发现象,使得对爆发信息进行有效处理成为可能,从而达到用户能够有效获取互动平台的信息和进行互动沟通的目的。(51)Int.Cl.权利要求书2页 说明书17页 附图2页(19)中华人民共和国国家知识产权局(12)发明专利申请权利要求书 2 页 说明书 17 页 附图 2 页1/2页21.一种计算机实现的用于检测互动平台中爆发信息的方法,该方法包括以下步骤:a获取互动平台中多个发布信息;b根。
3、据所述多个发布信息,获取与所述多个发布信息相对应的一个或多个群发模式;c通过在爆发模式库中进行匹配查询,从所述一个或多个群发模式中确定爆发模式;d根据所述爆发模式,从所述多个发布信息中确定与所述爆发模式相对应的爆发信息。2.根据权利要求1所述的方法,其中,所述爆发模式包括以下至少任一项:-标题队列模式;-用户队列模式;-内容队列模式。3.根据权利要求1或2所述的方法,其中,所述步骤c还包括:-通过在所述爆发模式库中进行匹配查询,结合预置的辅助规则,确定所述爆发模式。4.根据权利要求3所述的方法,其中,结合基于以下至少任一项的所述预置的辅助规则,确定所述爆发模式:-所述多个发布信息的发布时间;-。
4、与所述多个发布信息相对应的信息发布者的相关信息。5.根据权利要求4所述的方法,结合基于与所述多个发布信息相对应的信息发布者的相关信息的所述预置的辅助规则,确定所述爆发模式,其中,所述信息发布者的相关信息包括以下至少任一项:-信息发布者的历史行为记录;-信息发布者的注册时间;-信息发布者的IP地址;-信息发布者在单位时间内发布信息的数量。6.根据权利要求5所述的方法,所述信息发布者的相关信息包括信息发布者的历史行为记录,其中,该方法还包括:-根据所述爆发信息,更新所述信息发布者的历史行为记录。7.根据权利要求1至6中任一项所述的方法,其中,该方法还包括:-对所述多个发布信息进行预处理,获得预处理。
5、结果;其中,所述步骤b还包括:-根据所述预处理结果,获取所述一个或多个群发模式。8.根据权利要求1至7中任一项所述的方法,其中,该方法还包括:-根据所述爆发信息,对所述互动平台进行相应的后处理。9.根据权利要求8所述的方法,其中,所述后处理包括以下至少任一项:-删除所述多个爆发信息;-禁止所述多个爆发信息的信息发布者发布信息。10.根据权利要求1至9中任一项所述的方法,其中,该方法还包括:-根据所述爆发信息,更新所述爆发模式库。11.一种用于检测互动平台中爆发信息的设备,该设备包括:信息获取装置,用于获取互动平台中多个发布信息;群发模式获取装置,用于根据所述多个发布信息,获取与所述多个发布信息。
6、相对应的权 利 要 求 书CN 102982041 A2/2页3一个或多个群发模式;爆发模式获取装置,用于通过在爆发模式库中进行匹配查询,从所述一个或多个群发模式中确定爆发模式;确定装置,用于根据所述爆发模式,从所述多个发布信息中确定与所述爆发模式相对应的爆发信息。12.根据权利要求11所述的设备,其中,所述爆发模式包括以下至少任一项:-标题队列模式;-用户队列模式;-内容队列模式。13.根据权利要求11或12所述的设备,其中,所述爆发模式获取装置还用于通过在所述爆发模式库中进行匹配查询,结合预置的辅助规则,确定所述爆发模式。14.根据权利要求13所述的设备,其中,结合基于以下至少任一项的所述。
7、预置的辅助规则,确定所述爆发模式:-所述多个发布信息的发布时间;-与所述多个发布信息相对应的信息发布者的相关信息。15.根据权利要求14所述的设备,结合基于与所述多个发布信息相对应的信息发布者的相关信息的所述预置的辅助规则,确定所述爆发模式,其中,所述信息发布者的相关信息包括以下至少任一项:-信息发布者的历史行为记录;-信息发布者的注册时间;-信息发布者的IP地址;-信息发布者在单位时间内发布信息的数量。16.根据权利要求15所述的设备,所述信息发布者的相关信息包括信息发布者的历史行为记录,其中,该设备还包括:记录更新装置,用于根据所述爆发信息,更新所述信息发布者的历史行为记录。17.根据权利。
8、要求11至16中任一项所述的设备,其中,该设备还包括:预处理装置,用于对所述多个发布信息进行预处理,获得预处理结果;其中,所述群发模式获取装置还用于根据所述预处理结果,获取所述一个或多个群发模式。18.根据权利要求11至17中任一项所述的设备,其中,该设备还包括:后处理装置,用于根据所述爆发信息,对所述互动平台进行相应的后处理。19.根据权利要求18所述的设备,其中,所述后处理包括以下至少任一项:-删除所述多个爆发信息;-禁止所述多个爆发信息的信息发布者发布信息。20.根据权利要求11至19中任一项所述的设备,其中,该设备还包括:模式库更新装置,用于根据所述爆发信息,更新所述爆发模式库。权 利。
9、 要 求 书CN 102982041 A1/17页4一种用于检测互动平台中爆发信息的方法与设备技术领域0001 本发明涉及网络技术领域,尤其涉及一种用于检测互动平台中爆发信息的技术。背景技术0002 随着网络技术的不断发展,越来越多的用户通过网络互动平台进行信息的交流,进而达到了消息快速传播的目的,但是也随之出现一种在网络互动平台中爆发信息的现象。该信息爆发的现象通过在短时间之内有组织地、不断重复地发送相同或相似无意义内容,使其他正常用户无法进行正常发言,且正常发言会很快被大量无意义爆发信息所淹没。该信息爆发现象严重影响了互动平台中的正常秩序,阻碍了信息的正常发布和接收以及网络用户间的正常交流。
10、。0003 因此,如何有效地检测互动平台中爆发信息,成为目前亟待解决的问题之一。发明内容0004 本发明的目的是提供一种检测互动平台中爆发信息的方法与设备。0005 根据本发明的一个方面,提供了一种计算机实现的用于检测互动平台中爆发信息的方法,其中,该方法包括以下步骤:0006 a获取互动平台中多个发布信息;0007 b根据所述多个发布信息,获取与所述多个发布信息相对应的一个或多个群发模式;0008 c通过在爆发模式库中进行匹配查询,从所述一个或多个群发模式中确定爆发模式;0009 d根据所述爆发模式,从所述多个发布信息中确定与所述爆发模式相对应的爆发信息。0010 根据本发明的另一方面,还提。
11、供了一种用于检测互动平台中爆发信息的设备,其中,该设备包括:0011 信息获取装置,用于获取互动平台中多个发布信息;0012 群发模式获取装置,用于根据所述多个发布信息,获取与所述多个发布信息相对应的一个或多个群发模式;0013 爆发模式获取装置,用于通过在爆发模式库中进行匹配查询,从所述一个或多个群发模式中确定爆发模式;0014 确定装置,用于根据所述爆发模式,从所述多个发布信息中确定与所述爆发模式相对应的爆发信息。0015 与现有技术相比,本发明通过判断互动平台中多个发布信息的爆发模式,进而确定与该爆发模式相对应的爆发信息,由此可以及时准确地检测互动平台中是否产生爆发现象,使得对爆发信息进。
12、行有效处理成为可能,从而达到用户能够有效获取互动平台的信息和进行互动沟通的目的。说 明 书CN 102982041 A2/17页5附图说明0016 通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:0017 图1示出根据本发明一个方面用于检测互动平台中爆发信息的设备示意图;0018 图2示出根据本发明一个方面用于检测互动平台中爆发信息的方法流程图。0019 附图中相同或相似的附图标记代表相同或相似的部件。具体实施方式0020 下面结合附图对本发明作进一步详细描述。0021 图1示出根据本发明一个方面用于检测互动平台中爆发信息的设备示意图。检测。
13、设备1包括信息获取装置11、群发模式获取装置12、爆发模式获取装置13和确定装置14。在此,检测设备1包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。0022 具体地,信息获取装置11获取互动平台中多个发布信息。更具体地,信息获取装置11在预定的时间间隔内或连续地获取互动平台或互动平台的特定版块中多个发布信息,例如通过实时监听用户通过用户设备提交的发布信息提交请求,以获取用户输入的发布信息,或者。
14、在预定的时间间隔内周期性地通过约定的通信方式,如http、https等通信协议,从互动平台中提取最新的多个发布信息。例如,检测设备1为论坛的网络服务器,用户通过用户设备通过该论坛的网页输入界面输入一段文本信息作为发布信息,然后,用户设备将该发布信息作为该论坛的发帖包装成http请求并通过http通信协议提交到检测设备1的信息获取装置11,接着,信息获取装置11通过实时监听用户消息,接收并解析该http请求,获取其中的发布信息。再如,信息获取装置11每隔五分钟周期地提取互动平台中最新的多个发布信息。在此,所述互动平台包括但不限于社区、论坛、博客、微博,购物网站中对商品的点评、新闻评论、短信互动等。
15、。本领域技术人员应能理解上述获取多个发布信息的方式仅为举例,其他现有的或今后可能出现的获取多个发布信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。0023 随后,群发模式获取装置12根据所述多个发布信息,获取与所述多个发布信息相对应的一个或多个群发模式。具体地,群发模式获取装置12根据信息获取装置11获取的多个发布信息,通过例如对该些发布信息相互之间进行分析比对,以判断该些多个发布信息是否具有相同或相似的发布特征,进而获取与该些多个发布信息相对应的一个或多个群发模式。其中,所述群发模式意为由信息发布者发布的具有相同或相似发布特征的多个发布信息的信息发布模式,。
16、例如某一论坛中就某一热点话题,多个信息发布者发布具有多个相同关键词的帖子的信息发布模式,或者某一论坛中,由多个信息发布者发布的内容完全相同的帖子的信息发布模式。例如,信息获取装置11在论坛的网球版块中获取100个发布信息,群发模式获取装置12将该100个发布信息相互之间进行分析比对,以获得该100个发布信息中的90个发布信息的标题均具有关键词“李娜”、“夺冠”,则据此可获取与该90个说 明 书CN 102982041 A3/17页6发布信息相对应的一个群发模式。又例如,信息获取装置11在论坛的李宇春版块中获取的100个发布信息,群发模式获取装置12将该100个发布信息相互之间进行分析比对,判断。
17、获得其中有80个发布信息的标题中的中文字符均相同,进而可获取与该80个发布信息相对应的一个群发模式。本领域技术人员应能理解上述获取群发模式的方式仅为举例,其他现有的或今后可能出现的获取群发模式的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。0024 接着,爆发模式获取装置13通过在爆发模式库中进行匹配查询,从所述一个或多个群发模式中确定爆发模式。具体地,爆发模式获取装置13将群发模式获取装置12获取的一个或多个群发模式在爆发模式库中进行匹配查询,例如将该一个或多个群发模式与该爆发模式库中的爆发模式进行匹配,或者通过将具有群发模式特征的多个发布信息相互之间进行比较。
18、分析,以提取其发布特征,进而将该些发布特征在爆发模式库中与多个爆发模式进行匹配,并据此匹配获得与该(些)群发模式相对应的一个或多个爆发模式。其中,所述爆发模式包括但不限于:多个发布信息的标题内容的字符数值相同,多个发布信息内容在只保留中文字符时的中文字符数相同,信息发布者账号内容在只保留中文字符时相同,多个发布信息的标题内容为诗句,多个发布信息的内容为歌词等。在此,所述爆发模式库用于存储爆发模式。例如,群发模式获取装置12获取与网球版块中关键词均为“李娜”“夺冠”的90个发布信息相对应的一个群发模式;接着,爆发模式获取装置13将该些发布信息相互之间进行比较分析,以提取其全部发布特征为该些发布信。
19、息的标题中均含有关键词“李娜” “夺冠”,且该90个发布信息中的80个发布信息为含有“RE”的回复信息,进而将该些发布特征在爆发模式库中进行匹配查询,未匹配获得与该发布特征相对应的爆发模式。又例如,群发模式获取装置12获取80个发布信息相对应的一个群发模式,该群发模式为发布信息标题的中文字数均相同;接着,爆发模式获取装置13将该些发布信息相互之间进行比较分析,获取发布信息的标题中文字符均为“床前明月光,疑是地上霜”,进而在爆发模式库中匹配获得与该80个发布信息相对应的爆发模式为标题内容为相同诗句的爆发模式。本领域技术人员应能理解上述获取爆发模式的方式仅为举例,其他现有的或今后可能出现的获取爆发。
20、模式的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。0025 确定装置14根据所述爆发模式,从所述多个发布信息中确定与所述爆发模式相对应的爆发信息。具体地,确定装置14根据爆发模式获取装置13获取的爆发模式,确定与该(些)爆发模式相对应的发布信息信息以作为爆发信息,其中,所述爆发信息意为具有符合爆发模式特征的发布信息。例如,爆发模式获取装置13获取的爆发模式为标题内容为相同诗句的爆发模式,确定装置14根据该爆发模式,提取其所对应的多个发布信息,并将该些发布信息作为爆发信息。本领域技术人员应能理解上述确定爆发信息的方式仅为举例,其他现有的或今后可能出现的确定爆发信。
21、息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。0026 优选地,信息获取装置11、群发模式获取装置12、爆发模式获取装置13和确定装置14之间是持续不断地工作。具体地,信息获取装置11获取互动平台中多个发布信息;随后,群发模式获取装置12根据所述多个发布信息,获取与所述多个发布信息相对应的一个或多个群发模式;接着,爆发模式获取装置13通过在爆发模式库中进行匹配查询,从所述说 明 书CN 102982041 A4/17页7一个或多个群发模式中确定爆发模式;接着,确定装置14根据所述爆发模式,从所述多个发布信息中确定与所述爆发模式相对应的爆发信息。在此,本领域技。
22、术人员应理解“持续”是指各装置分别按照设定的或实时调整的工作模式要求进行发布信息的获取、群发模式的获取、爆发模式的获取及爆发信息的确定,直至信息获取装置11在较长时间内停止对互动平台中多个发布信息的获取。0027 优选地,所述爆发模式包括但不限于以下至少任一项:0028 -标题队列模式;0029 -用户队列模式;0030 -内容队列模式。0031 具体地,标题队列模式包括但不限于:1)多个发布信息的标题内容的字符数相同;2)多个发布信息的标题内容中带有相同的特殊字符前缀;3)多个发布信息的标题内容中相同字符数与总字符的比值超过预设的比例阈值;4)多个发布信息的标题内容均不包含中文字符。例如,四。
23、个发布信息的标题内容为:0032 a床前明月光0033 b疑是地上霜0034 c举头望明月0035 d低头思故乡0036 该四个发布信息的标题内容字数相同,则该四个发布信息属于爆发模式中的标题队列模式,即“多个发布信息的标题内容的字符数相同”。又例如,五个发布信息的标题内容为:0037 a Fighting!0038 b My friends!0039 c Fighting!0040 d My brothers!0041 e Never give up!0042 该五个发布信息的标题内容均不包含中文字符,则该五个发布信息属于爆发模式中的标题队列模式,即“多个发布信息的标题内容均不包含中文字符”。
24、。本领域技术人员应能理解上述标题队列模式仅为举例,其他现有的或今后可能出现的标题队列模式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。0043 用户队列模式包括但不限于:1)信息发布者账号内容相同或相似2)在去除信息发布者账号内容中的无意义字符、数字等后其账号内容相同或相似;3)信息发布者账号内容中的中文字符相同或相似;4)在去除信息发布者账号内容中的无意义字符、数字等后其账号内容中的中文字符相同或相似。例如,五个发布信息的信息发布者账号内容为:0044 1)水军军团10045 2)水军军团20046 3)水军军团30047 4)水军军团&50048 5)水军军团&。
25、60049 将该五个信息发布者账号内容中的无意义字符“”、“&”和数字“1”、“2”、“3”、说 明 书CN 102982041 A5/17页8“5”、“6”去除,所保留的中文字符均相同为“水军军团”,则该五个发布信息属于爆发模式中的用户队列模式。本领域技术人员应能理解上述用户队列模式仅为举例,其他现有的或今后可能出现的用户队列模式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。0050 内容队列模式包括但不限于:1)多个发布信息内容的字符数值相同;2)多个发布信息内容的中文字符数相同;3)多个发布信息的内容均不包含中文字符。例如,四个发布信息的内容为:0051 1)。
26、#我军必胜#0052 2)我军必胜0053 3)我军必胜0054 4)&我军必胜&0055 在该四个发布信息内容只保留中文字符时,其中文字符均相同,则该四个发布信息属于爆发模式中的内容队列模式。其中,所述无意义字符意为不具有中文意义的符号,如空格符、“”、“#”等。本领域技术人员应能理解上述内容队列模式仅为举例,其他现有的或今后可能出现的内容队列模式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。0056 本领域技术人员应能理解,上述各项爆发模式不仅可以单独用于爆发信息的获取,还可以结合用于爆发信息的获取。本领域技术人员应能理解上述爆发模式仅为举例,其他现有的或今后可。
27、能出现的爆发模式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。0057 在一个优选实施例中(参照图1),所述爆发模式获取装置13还通过在所述爆发模式库中进行匹配查询,结合预置的辅助规则,确定所述爆发模式。以下参照图1对该优选实施例进行详细描述,其中,信息获取装置11获取互动平台中多个发布信息;群发模式获取装置12根据所述多个发布信息,获取与所述多个发布信息相对应的一个或多个群发模式;确定装置14根据所述爆发模式,从所述多个发布信息中确定与所述爆发模式相对应的爆发信息。其具体过程与前述参照图1所描述的实施例中信息获取装置11、群发模式获取装置12和确定装置14所执行的。
28、过程相同,为简明起见,以引用方式包含于此,而不做赘述。0058 具体地,爆发模式获取装置13将群发模式获取装置12获取的一个或多个群发模式在爆发模式库中进行匹配查询,并根据预置的辅助规则,例如多个发布信息的信息发布频次是否大于预置的信息发布频次,进而确定爆发模式。例如,群发模式获取装置12从曼联版块的20个发布信息中提取一个群发模式,该群发模式为该些发布信息的标题内容的中文字符字数相同;接着,爆发模式获取装置13将该群发模式在爆发模式库中进行匹配查询,获得与该群发模式相对应的爆发模式为标题队列爆发模式,并根据该20个发布信息的信息发布时间获得该曼联版块的信息发布频次,且该信息发布频次小于预置的。
29、信息发布频次阈值,进而判断该群发模式不是真正的标题队列爆发模式。本领域技术人员应能理解上述获取爆发模式的方式仅为举例,其他现有的或今后可能出现的获取爆发模式的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。0059 在此,爆发模式获取装置13还可以根据该些辅助规则准确地判断群发模式在爆发模式库中进行匹配查询所获取的爆发模式是否正确,极大地提高确定爆发模式的准确说 明 书CN 102982041 A6/17页9性,实现有效地对爆发信息进行确定,进而降低将正常发布信息误定为爆发信息的误判率。0060 优选地,爆发模式获取装置13结合基于但不限于以下至少任一项的所述预置。
30、的辅助规则,确定所述爆发模式:0061 -所述多个发布信息的发布时间;0062 -与所述多个发布信息相对应的信息发布者的相关信息。0063 具体地,基于所述多个发布信息的发布时间,可确定包括但不限于:一个信息发布者的信息发布频次、整个互动平台的信息发布频次、互动平台中的某一板块的信息发布频次。例如,爆发模式获取装置13通过将群发模式在爆发模式库中进行匹配查询,以确定与该(等)群发模式相对应的爆发模式,但该爆发模式获取装置13根据该群发模式所对应的位于同一版块的多个发布信息的信息发布时间,所确定的该多个发布信息所在版块的平均信息发布频次小于预设的信息发布频次阈值,则爆发模式获取装置13判断该群发。
31、模式不是爆发模式。0064 所述多个发布信息相对应的信息发布者的相关信息包括但不限于:信息发布者的注册时间、信息发布者是否在黑名单中、信息发布者的用户信用度等。例如,爆发模式获取装置13通过在爆发模式库中进行匹配查询,以确定与群发模式相对应的爆发模式,但该群发模式所对应的多个发布信息的发布者用户信息度高,则判断该群发模式不是爆发模式。0065 本领域技术人员应能理解,基于上述两项预置的辅助规则不仅可以单独用于辅助确定爆发模式,还可以结合用于辅助确定爆发模式。本领域技术人员应能理解上述确定爆发模式的方式仅为举例,其他现有的或今后可能出现的确定爆发模式的方式如可适用于本发明,也应包含在本发明保护范。
32、围以内,并在此以引用方式包含于此。0066 更优选地,爆发模式获取装置13结合基于与所述多个发布信息相对应的信息发布者的相关信息的所述预置的辅助规则,确定所述爆发模式,其中,所述信息发布者的相关信息包括但不限于以下至少任一项:0067 -信息发布者的历史行为记录;0068 -信息发布者的注册时间;0069 -信息发布者的IP地址;0070 -信息发布者在单位时间内发布信息的数量。0071 具体地,信息发布者的相关信息包括信息发布者的历史行为记录,其中,信息发布者的历史行为记录包括但不限于:信息发布者的历史发布信息内容、信息发布者的历史发布信息时间记录、信息发布者的历史在线时长等。例如,爆发模式。
33、获取装置13将发布信息的信息发布者账号在历史行为数据库中进行匹配查询,以获得该信息发布者的历史发布信息均为正常发布信息,进而判断该信息发布者的用户信用度较高。其中,所述历史行为数据库用于存储信息发布者的历史行为记录,包括但不限于关系数据库,内存存储器,硬盘存储器等。0072 信息发布者的相关信息包括信息发布者的注册时间。爆发模式获取装置13根据信息发布者的注册时间,例如信息发布者的注册时间为当前时间的两年前,则判断该信息发布者的用户信用度较高。0073 信息发布者的相关信息包括信息发布者的IP地址,基于信息发布者的IP地址,可确定包括但不限于:该IP地址是否有历史爆发信息发出、该IP地址包含信。
34、息发布者账号的说 明 书CN 102982041 A7/17页10数量等。例如,爆发模式获取装置13根据信息发布者的IP地址,在地址数据库中进行匹配查询,以获取该IP地址未曾有大量具有相似特征的发布信息发出的历史记录,进而判断该信息发布者的用户信用度较高。其中,地址数据库用于存储曾经发布过发布信息的IP地址及其对应的历史发布信息。0074 信息发布者的相关信息包括信息发布者在单位时间内发布信息的数量。例如,爆发模式获取装置13根据信息发布者在单位时间内发布信息的数量,与预定的信息发布频次阈值进行比较,当该信息发布者在单位时间内发布信息的数量小于该信息发布频次阈值,则判断该信息发布者的用户信用度。
35、较高。0075 本领域技术人员应能理解,基于上述四项信息发布者的相关信息不仅可以单独用于辅助确定爆发模式,还可以结合用于辅助确定爆发模式。本领域技术人员应能理解上述信息发布者的相关信息仅为举例,其他现有的或今后可能出现的信息发布者的相关信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。0076 更优选地,所述信息发布者的相关信息包括信息发布者的历史行为记录,其中,该检测设备1还包括记录更新装置(未示出),记录更新装置根据所述爆发信息,更新所述信息发布者的历史行为记录。具体地,信息发布者的相关信息包括信息发布者的历史行为记录,记录更新装置根据确定装置14确定的与爆发模。
36、式相对应的爆发信息,以提取该等爆发信息的信息发布者的账号、该等信息发布者发布的爆发信息内容、该等信息发布者的发布爆发信息的时间、信息发布者的在线时长等信息,在诸如历史行为数据库中,添加该等信息发布者的历史行为记录。例如,记录更新装置根据确定装置14获取的在李宇春版块中的80个爆发信息,对该80个爆发信息进行分析,以提取该等爆发信息的信息发布者账号,以及该等信息发布者账号所对应的发布的爆发信息内容、该等发布信息者发布每个爆发信息所对应的时间、该等发布信息者在此次互动平台发生信息爆发时的在线时长,接着,记录更新装置根据信息发布者账号,在历史行为数据库中对该信息发布者账号所对应的历史行为记录进行添加。
37、。本领域技术人员应能理解上述更新历史行为记录的方式仅为举例,其他现有的或今后可能出现的更新历史行为记录的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。0077 在又一个优选实施例中(参照图1),检测设备1还包括预处理装置(未示出),预处理装置对所述多个发布信息进行预处理,获得预处理结果;其中,群发模式获取装置12还根据所述预处理结果,获取所述一个或多个群发模式。以下参照图1对该优选实施例进行详细描述,其中,信息获取装置11获取互动平台中多个发布信息;爆发模式获取装置13通过在爆发模式库中进行匹配查询,从所述一个或多个群发模式中确定爆发模式;确定装置14根据所述爆发模式,从所述多个发布信息中确定与所述爆发模式相对应的爆发信息。其具体过程与前述参照图1所描述的实施例中信息获取装置11、爆发模式获取装置13和确定装置14所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。0078 具体地,预处理装置对信息获取装置11获取的多个发布信息进行预处理,该预处理的方式包括但不限于:去除多个发布信息中的无意义字符、去除多个发布信息中的数字等,以获取预处理结果;接着,群发模式获取装置12还根据该些预处理结果,获取一个或多个群发模式。例如,多个发布信息的内容为:0079 1)#我军必胜#说 明 书CN 102982041 A10。