一种网络信息的监控方法及装置.pdf

上传人:r5 文档编号:4027010 上传时间:2018-08-12 格式:PDF 页数:10 大小:512.94KB
返回 下载 相关 举报
摘要
申请专利号:

CN201510009962.8

申请日:

2015.01.08

公开号:

CN104573008A

公开日:

2015.04.29

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20150108|||公开

IPC分类号:

G06F17/30; G06F17/27

主分类号:

G06F17/30

申请人:

广东小天才科技有限公司

发明人:

郑战海

地址:

523860广东省东莞市长安镇乌沙步步高大道126号

优先权:

专利代理机构:

深圳中一专利商标事务所44237

代理人:

张全文

PDF下载: PDF下载
内容摘要

本发明适用于信息技术领域,提供了一种网络信息监控方法及装置,包括:抓取终端上发送和接收到的网络信息;对所述网络信息的文本进行分词处理,并提取出分词处理得到的分词;将提取出的所述分词一一在预设数据库中进行匹配,确定每个所述分词的特征,所述预设数据库中预先存储了不同的词语及每个所述词语对应的特征;根据匹配结果统计所述网络信息中每个所述特征的特征值;展示统计的结果,以使得用户根据所述统计的结果对所述网络信息进行监控。

权利要求书

权利要求书
1.  一种网络信息监控方法,其特征在于,包括:
抓取终端上发送和接收到的网络信息;
对所述网络信息的文本进行分词处理,并提取出分词处理得到的分词;
将提取出的所述分词一一在预设数据库中进行匹配,确定每个所述分词的特征,所述预设数据库中预先存储了不同的词语及每个所述词语对应的特征;
根据匹配结果统计所述网络信息中每个所述特征的特征值;
展示统计的结果,以使得用户根据所述统计的结果对所述网络信息进行监控。

2.  如权利要求1所述的方法,其特征在于,所述根据匹配结果统计所述网络信息中每个所述特征的特征值包括:
统计每个所述特征之下的所述分词的数量,以得到所述网络信息中每个所述特征的特征值。

3.  如权利要求1所述的方法,其特征在于,所述根据匹配结果统计所述网络信息中每个所述特征的特征值包括:
获取每个所述分词所属的所述网络信息的发布来源;
获取每个所述发布来源对应的权重;
根据每个所述发布来源对应的权重,对每个所述特征之下的所述分词的数量进行加权处理,以得到所述网络信息中每个所述特征的特征值。

4.  如权利要求1所述的方法,其特征在于,所述抓取终端上发送和接收到的网络信息包括:
每隔预设时间抓取所述终端上发送和接收到的网络信息。

5.  如权利要求1所述的方法,其特征在于,所述方法还包括:
判断是否存在任意一个所述特征的特征值超出预设的阈值范围;
当存在任意一个所述特征的特征值超出预设的阈值范围时,发出预警信息。

6.  一种网络信息监控装置,其特征在于,包括:
抓取单元,用于抓取终端上发送和接收到的网络信息;
分词单元,用于对所述网络信息的文本进行分词处理,并提取出分词处理得到的分词;
匹配单元,用于将提取出的所述分词一一在预设数据库中进行匹配,确定每个所述分词的特征,所述预设数据库中预先存储了不同的词语及每个所述词语对应的特征;
统计单元,用于根据匹配结果统计所述网络信息中每个所述特征的特征值;
监控单元,用于展示统计的结果,以使得用户根据所述统计的结果对所述网络信息进行监控。

7.  如权利要求6所述的装置,其特征在于,所述统计单元具体用于:
统计每个所述特征之下的所述分词的数量,以得到所述网络信息中每个所述特征的特征值。

8.  如权利要求6所述的装置,其特征在于,所述统计单元包括:
第一获取单元,用于获取每个所述分词所属的所述网络信息的发布来源;
第二获取单元,用于获取每个所述发布来源对应的权重;
加权单元,用于根据每个所述发布来源对应的权重,对每个所述特征之下的所述分词的数量进行加权处理,以得到所述网络信息中每个所述特征的特征值。

9.  如权利要求6所述的装置,其特征在于,所述抓取单元具体用于:
每隔预设时间抓取所述终端上发送和接收到的网络信息。

10.  如权利要求6所述的装置,其特征在于,所述装置还包括:
判断单元,用于判断是否存在任意一个所述特征的特征值超出预设的阈值范围;
预警单元,用于当存在任意一个所述特征的特征值超出预设的阈值范围时,发出预警信息。

说明书

说明书一种网络信息的监控方法及装置
技术领域
本发明属于信息技术领域,尤其涉及一种网络信息的监控方法及装置。
背景技术
随着网络用户年龄层越来越低龄化,许多心智尚未成熟的孩子已拥有了自己的网络社交账号与网络社交圈,在网络社交圈内,孩子能阅读到各式各样的网络信息,同时孩子也可以自己发布网络信息,或者对阅读到的网络信息做出回应。
然而,在目前的网络大环境之下,网络社交圈内充斥着杂乱的负面信息,由于孩子缺少主观的判断能力,面对这些负面信息时,其心智和情绪极容易被影响,需要父母及时地对孩子的网络行为进行监控。然而,目前,父母只能通过翻阅孩子网络行为的历史记录,获知孩子浏览过的网络信息以及孩子发出的网络信息,以此来判断出孩子的网络行为是否存在负面倾向,该方法会耗费大量的时间成本,且存在着信息遗漏导致监控不全面的风险,导致父母对与孩子相关的网络信息的监控不到位。
发明内容
本发明实施例的目的在于提供一种网络信息的监控方法及装置,旨在解决现有技术中无法有效地对网络信息进行监控的问题。
本发明实施例是这样实现的,一种网络信息监控方法,包括:
抓取终端上发送和接收到的网络信息;
对所述网络信息的文本进行分词处理,并提取出分词处理得到的分词;
将提取出的所述分词一一在预设数据库中进行匹配,确定每个所述分词的 特征,所述预设数据库中预先存储了不同的词语及每个所述词语对应的特征;
根据匹配结果统计所述网络信息中每个所述特征的特征值;
展示统计的结果,以使得用户根据所述统计的结果对所述网络信息进行监控。
本发明实施例的另一目的在于提供一种网络信息监控装置,包括:
抓取单元,用于抓取终端上发送和接收到的网络信息;
分词单元,用于对所述网络信息的文本进行分词处理,并提取出分词处理得到的分词;
匹配单元,用于将提取出的所述分词一一在预设数据库中进行匹配,确定每个所述分词的特征,所述预设数据库中预先存储了不同的词语及每个所述词语对应的特征;
统计单元,用于根据匹配结果统计所述网络信息中每个所述特征的特征值;
监控单元,用于展示统计的结果,以使得用户根据所述统计的结果对所述网络信息进行监控。
本发明实施例在后台自动抓取网络信息,并对网络信息进行分词处理和特征统计,从而直观地显示出对网络信息各种特征的分析结果,便于监控人员高效地实现对网络信息的监控。
附图说明
图1是本发明实施例提供的网络信息监控方法的实现流程图;
图2是本发明实施例提供的网络信息监控方法S104的具体实现流程图;
图3是本发明另一实施例提供的网络信息监控方法的实现流程图;
图4是本发明实施例提供的网络信息监控装置的结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实 施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1示出了本发明实施例提供的网络信息监控方法的实现流程,详述如下:
在S101中,抓取终端上发送和接收到的网络信息。
所述终端,包括具备网络通信功能的手机、平板、笔记本、计算机等终端设备。所述终端上发送的网络信息,包括利用浏览器或者客户端发布在网络中的信息,例如,发布在社交网站、论坛、新闻评论中的网络信息;所述终端上接收到的网络信息,包括利用浏览器或者客户端下载并进行浏览的网络信息,例如,访问新闻站点、社交应用、论坛等时浏览的网络信息。
在本实施例中,通过访问浏览器或者客户端的后台历史记录,抓取到终端上发送和接收到的网络信息。
作为本发明的一个实施例,S101具体为,每隔预设时间抓取所述终端上发送和接收到的网络信息。
例如,每隔一周或者每隔一个月执行一次网络信息的抓取,以对最近一周或者最近一个月内网络信息的监控,从而实现对网络信息的定期监控。
在S102中,对所述网络信息的文本进行分词处理,并提取出分词处理得到的分词。
由于网络信息中可能包含图片、音频、视频等数据,因此,在本实施例中,执行S102之前,首先需要提取出网络信息中的文本数据,例如发布在社交网站、论坛、新闻站点等信息发布平台上的文本。在此,需要说明的是,对于网络信息中的表情数据,比如发布在论坛中的表情符号或者表情头像,也可以根据其对应的网页代码,将其转换为相应的文本信息。
对文本进行分词处理,首先对文本进行分词切割,将文本切割成若干词语,再过滤掉其中的助词、连词等虚词,从而得到若干能够表示某种特定特征的分词。
在S103中,将提取出的所述分词一一在预设数据库中进行匹配,确定每 个所述分词的特征,所述预设数据库中预先存储了不同的词语及每个所述词语对应的特征。
在本实施例中,预设建立好存储了不同的词语以及存储了每个词语所对应的特征的数据库,其中,所述特征可以包括情绪特征。以情绪特征为例,可以包括愤怒、伤心、高兴、忧郁,等等,通过对采集到的海量文本数据进行相近词义、相关联想、短句的简单语义分析等数据处理,在数据库中建立关于每一种情绪特征的词库。且建立好的数据库也可以在后续的使用过程中不断地采集新的数据,对相应的词库添加使用频次较高的新词语或者网络用语,以提高数据库的数据完整性。
将S102中提取出的分词一一在预设数据库的每一个词库中进行匹配,判断一个分词出现在数据库中的哪一个词库中,或者该分词与数据库中的哪一个词库中的某个词语语义最为近似,则将该词库所代表的特征作为该分词的特征。例如,分词“生气”在代表愤怒情绪特征的词库中完成了匹配,则为该分词赋予愤怒的情绪特征。
在S104中,根据匹配结果统计所述网络信息中每个所述特征的特征值。
作为本发明的一个实施例,S104具体为:
统计每个所述特征之下的所述分词的数量,以得到所述网络信息中每个所述特征的特征值。
根据每个分词得到的特征,分别统计每个特征之下的分词数量,并将该数量作为相应的特征的特征值。例如,代表愤怒特征的分词有5个,则该愤怒特征的特征值为5,代表高兴特征的分词有10个,则该高兴特征的特征值为10。
作为本发明的另一实施例,如图2所示,S104具体为:
在S201中,获取每个所述分词所属的所述网络信息的发布来源。
在S202中,获取每个所述发布来源对应的权重。
网络信息可以来自不同的发布来源,而在本实施例中,为不同的发布来源设置不同的权重。例如,对于情绪特征来说,社交网络中发布的网络信息的情 绪倾向比新闻站点浏览内容的情绪倾向更加容易反映真实的情绪,则社交网络的权重要比新闻站点的权重大。进一步地,还可以根据不同分词所表达的情绪的强弱不同,为不同强弱等级的情绪赋予不同的权重。
在S203中,根据每个所述发布来源对应的权重,对每个所述特征之下的所述分词的数量进行加权处理,以得到所述网络信息中每个所述特征的特征值。
通过加权处理,得到的每个特征的特征值能够更加真实地反馈不同的特征表现。
在S105中,展示统计的结果,以使得用户根据所述统计的结果对所述网络信息进行监控。
最终的展示可以为各种特征占比的示意图,以直观地展示某一时期内网络浏览行为的特征倾向。进一步地,还可以联网采集其他终端在同一时期内生成的各种特征占比的示意图,以实现不同网络用户之间的网络访问行为比对。
进一步地,如图3所示,在S105之后,所述方法还包括:
S106,判断是否存在任意一个所述特征的特征值超出预设的阈值范围。
S107,当存在任意一个所述特征的特征值超出预设的阈值范围时,发出预警信息。
在本实施例中,可以为每一个特征设定一个预警阈值范围,一旦某个特征的特征值低于或者超出该预警阈值范围,则通过文字、声音、震动等提示方式发出预警信息,从而实现对非正常监控结果的预警。
本发明实施例在后台自动抓取网络信息,并对网络信息进行分词处理和特征统计,从而直观地显示出对网络信息各种特征的分析结果,便于监控人员高效地实现对网络信息的监控。
本发明实施例提供的网络信息监控方法可以应用于青少年的网络通信设备使用场景之下,通过统计低龄网络用户在参与网络论坛、社区、群组等社交圈的讨论,或者访问新闻、小说等站点的浏览记录,能够直观地统计出此类网络用户在网络访问期间的情绪倾向,便于此类网络用户的监护人更好地了解此类 网络用户的网络行为,引导青少年的心理健康成长。
对应于上文实施例所述的网络信息监控方法,图4示出了本发明实施例提供的网络信息监控装置的结构框图,为了便于说明,仅示出了与本实施例相关的部分。
参照图4,该装置包括:
抓取单元41,抓取终端上发送和接收到的网络信息。
分词单元42,对所述网络信息的文本进行分词处理,并提取出分词处理得到的分词。
匹配单元43,将提取出的所述分词一一在预设数据库中进行匹配,确定每个所述分词的特征,所述预设数据库中预先存储了不同的词语及每个所述词语对应的特征。
统计单元44,根据匹配结果统计所述网络信息中每个所述特征的特征值。
监控单元45,展示统计的结果,以使得用户根据所述统计的结果对所述网络信息进行监控。
可选地,所述统计单元44具体用于:
统计每个所述特征之下的所述分词的数量,以得到所述网络信息中每个所述特征的特征值。
可选地,所述统计单元44包括:
第一获取单元,获取每个所述分词所属的所述网络信息的发布来源。
第二获取单元,获取每个所述发布来源对应的权重。
加权单元,根据每个所述发布来源对应的权重,对每个所述特征之下的所述分词的数量进行加权处理,以得到所述网络信息中每个所述特征的特征值。
可选地,所述抓取单元41具体用于:
每隔预设时间抓取所述终端上发送和接收到的网络信息。
可选地,所述装置还包括:
判断单元,判断是否存在任意一个所述特征的特征值超出预设的阈值范围;
预警单元,当存在任意一个所述特征的特征值超出预设的阈值范围时,发出预警信息。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

一种网络信息的监控方法及装置.pdf_第1页
第1页 / 共10页
一种网络信息的监控方法及装置.pdf_第2页
第2页 / 共10页
一种网络信息的监控方法及装置.pdf_第3页
第3页 / 共10页
点击查看更多>>
资源描述

《一种网络信息的监控方法及装置.pdf》由会员分享,可在线阅读,更多相关《一种网络信息的监控方法及装置.pdf(10页珍藏版)》请在专利查询网上搜索。

本发明适用于信息技术领域,提供了一种网络信息监控方法及装置,包括:抓取终端上发送和接收到的网络信息;对所述网络信息的文本进行分词处理,并提取出分词处理得到的分词;将提取出的所述分词一一在预设数据库中进行匹配,确定每个所述分词的特征,所述预设数据库中预先存储了不同的词语及每个所述词语对应的特征;根据匹配结果统计所述网络信息中每个所述特征的特征值;展示统计的结果,以使得用户根据所述统计的结果对所述网络。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1