一种网页广告过滤方法及装置.pdf

上传人:n****g 文档编号:624114 上传时间:2018-02-26 格式:PDF 页数:14 大小:1.65MB
返回 下载 相关 举报
摘要
申请专利号:

CN201410374190.3

申请日:

2014.07.31

公开号:

CN104133896A

公开日:

2014.11.05

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20140731|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

可牛网络技术(北京)有限公司

发明人:

朱佳来; 陈亮

地址:

100041 北京市石景山区八大处高科技园区西井路3号1号楼150房间

优先权:

专利代理机构:

北京柏杉松知识产权代理事务所(普通合伙) 11413

代理人:

项京;马敬

PDF下载: PDF下载
内容摘要

本发明实施例公开了一种网页广告过滤方法及装置,涉及网络通信技术领域,其中,所述方法包括:确定目标网页中的广告内容元素;根据所述广告内容元素所在区域的区域参数,在所述目标网页中查找所述广告内容元素对应的广告背景元素;过滤所述广告内容元素及其对应的广告背景元素。应用本发明实施例提供的方案进行网页广告过滤时,在过滤掉网页广告中广告内容元素的同时,能够过滤掉与该广告内容元素对应的广告背景元素,提高了用户体验效果。

权利要求书

1.  一种网页广告过滤方法,其特征在于,所述方法包括:
确定目标网页中的广告内容元素;
根据所述广告内容元素所在区域的区域参数,在所述目标网页中查找所述广告内容元素对应的广告背景元素;
过滤所述广告内容元素及其对应的广告背景元素。

2.
  根据权利要求1所述的方法,其特征在于,在所述确定目标网页中的广告内容元素之后,还包括:
确定所述目标网页中的非广告元素。

3.
  根据权利要求2所述的方法,其特征在于,所述根据所述广告内容元素所在区域的区域参数,在所述目标网页中查找所述广告内容元素对应的广告背景元素,包括:
确定所述广告内容元素所在区域中心点的坐标以及非广告内容元素所在区域中心点的坐标;
根据所述广告内容元素所在区域中心点的坐标,确定所述广告内容元素所在区域的中心区域;
根据所述广告内容元素所在区域的中心区域与非广告内容元素所在区域中心点的坐标,在非广告内容元素中查找广告内容元素对应的广告背景元素。

4.
  根据权利要求3所述的方法,其特征在于,所述根据所述广告内容元素所在区域的中心区域与非广告内容元素所在区域中心点的坐标,在非广告内容元素中查找广告内容元素对应的广告背景元素,包括:
按照预设的遍历规则,获得所述广告内容元素所在区域的中心区域内第i个像素点的坐标;
计算得到第i个像素点的横向坐标与非广告内容元素所在区域中心点的横向坐标之间差值的绝对值,得第一绝对差值;
计算得到第i个像素点的纵向坐标与非广告内容元素所在区域中心点的纵向 坐标之间差值的绝对值,得第二绝对差值;
比较所述第一绝对差值与第一阈值,以及比较所述第二绝对差值与第二阈值,如果所述第一绝对差值小于所述第一阈值和/或所述第二绝对差值小于所述第二阈值,则i的取值加1,重复上述步骤,否则,判定该非广告内容元素为所述广告内容元素对应的广告背景元素。

5.
  根据权利要求1-4中任一项所述的方法,其特征在于,所述确定目标网页中的广告内容元素,包括:
判断目标网页的元素包含的链接信息中是否包含预设的关键字;
若包含,则判定该元素为广告内容元素。

6.
  一种网页广告过滤装置,其特征在于,所述装置包括:
广告内容元素确定模块,用于确定目标网页中的广告内容元素;
广告背景元素查找模块,用于根据所述广告内容元素所在区域的区域参数,在所述目标网页中查找所述广告内容元素对应的广告背景元素;
广告过滤模块,用于过滤所述广告内容元素及其对应的广告背景元素。

7.
  根据权利要求6所述的装置,其特征在于,所述装置还包括:
非广告元素确定模块,用于确定所述目标网页中的非广告元素。

8.
  根据权利要求7所述的装置,其特征在于,所述广告背景元素查找模块,包括:
中心点坐标确定子模块,用于确定所述广告内容元素所在区域中心点的坐标以及非广告内容元素所在区域中心点的坐标;
中心区域确定子模块,用于根据所述广告内容元素所在区域中心点的坐标,确定所述广告内容元素所在区域的中心区域;
广告背景元素查找子模块,用于根据所述广告内容元素所在区域的中心区域与非广告内容元素所在区域中心点的坐标,在非广告内容元素中查找广告内容元素对应的广告背景元素。

9.
  根据权利要求8所述的装置,其特征在于,所述广告背景元素查找子模 块,包括:点坐标获得单元、第一绝对差值计算单元、第二绝对差值计算单元、绝对差值比较单元和广告背景元素判定单元;
所述点坐标获得单元,用于按照预设的遍历规则,获得所述广告内容元素所在区域的中心区域内第i个像素点的坐标;
所述第一绝对差值计算单元,用于计算得到第i个像素点的横向坐标与非广告内容元素所在区域中心点的横向坐标之间差值的绝对值,得第一绝对差值;
所述第二绝对差值计算单元,用于计算得到第i个像素点的纵向坐标与非广告内容元素所在区域中心点的纵向坐标之间差值的绝对值,得第二绝对差值;
所述绝对差值比较单元,用于比较所述第一绝对差值与第一阈值,以及比较所述第二绝对差值与第二阈值,如果所述第一绝对差值小于所述第一阈值和/或所述第二绝对差值小于所述第二阈值,则i的取值加1,出发所述点坐标获得单元,获得第i个像素点的坐标,否则,触发所述广告背景元素判定单元,判定广告背景元素;
所述广告背景元素判定单元,用于判定该非广告内容元素为所述广告内容元素对应的广告背景元素。

10.
  根据权利要求6-9中任一项所述的装置,其特征在于,所述广告内容元素确定模块,包括:
链接信息判断子模块,用于判断目标网页的元素包含的链接信息中是否包含预设的关键字;
广告内容元素判定子模块,用于在所述链接信息判断子模块的判断结果为是的情况下,判定该元素为广告内容元素。

说明书

一种网页广告过滤方法及装置
技术领域
本发明涉及网络通信技术领域,特别涉及一种网页广告过滤方法及装置。
背景技术
随着网络用户数量的逐年上升,广告商开始在网页上大量投放广告,广告给用户提供信息的同时也给大多数用户带来干扰,因此,从用户的角度看,有必要对网页中的广告进行过滤。
网页中的广告通常由广告内容元素和广告背景元素组成,例如,飘窗广告由广告图片和空白飘窗组成;网页中嵌入的图片广告由广告图片和空白背景图片组成等等。
应用现有技术进行广告过滤时,过滤掉网页广告中的广告内容元素后,广告背景元素会依然保留在网页中,例如,过滤飘窗广告之后,空白飘窗依然会在网页上飘动,阻挡用户视线,干扰用户浏览网页;过滤嵌入网页中的图片广告之后,空白背景图片也会依然显示在网页中,此时若网页的背景颜色与空白背景图片的颜色不相同时,空白背景图片会给用户带来较差的视觉效果。因此,应用现有技术过滤网页广告时,用户体验效果较差。
发明内容
本发明实施例公开了一种网页广告过滤方法及装置,以过滤掉网页广告中的广告内容元素和广告背景元素,提高用户体验效果。
为达到上述目的,本发明实施例公开了一种网页广告过滤方法,所述方法包括:
确定目标网页中的广告内容元素;
根据所述广告内容元素所在区域的区域参数,在所述目标网页中查找所述广告内容元素对应的广告背景元素;
过滤所述广告内容元素及其对应的广告背景元素。
可选的,在所述确定目标网页中的广告内容元素之后,还包括:
确定所述目标网页中的非广告元素。
可选的,所述根据所述广告内容元素所在区域的区域参数,在所述目标网页中查找所述广告内容元素对应的广告背景元素,包括:
确定所述广告内容元素所在区域中心点的坐标以及非广告内容元素所在区域中心点的坐标;
根据所述广告内容元素所在区域中心点的坐标,确定所述广告内容元素所在区域的中心区域;
根据所述广告内容元素所在区域的中心区域与非广告内容元素所在区域中心点的坐标,在非广告内容元素中查找广告内容元素对应的广告背景元素。
可选的,所述根据所述广告内容元素所在区域的中心区域与非广告内容元素所在区域中心点的坐标,在非广告内容元素中查找广告内容元素对应的广告背景元素,包括:
按照预设的遍历规则,获得所述广告内容元素所在区域的中心区域内第i个像素点的坐标;
计算得到第i个像素点的横向坐标与非广告内容元素所在区域中心点的横向坐标之间差值的绝对值,得第一绝对差值;
计算得到第i个像素点的纵向坐标与非广告内容元素所在区域中心点的纵向坐标之间差值的绝对值,得第二绝对差值;
比较所述第一绝对差值与第一阈值,以及比较所述第二绝对差值与第二阈值,如果所述第一绝对差值小于所述第一阈值和/或所述第二绝对差值小于所述第二阈值,则i的取值加1,重复上述步骤,否则,判定该非广告内容元素为所述广告内容元素对应的广告背景元素。
可选的,所述确定目标网页中的广告内容元素,包括:
判断目标网页的元素包含的链接信息中是否包含预设的关键字;
若包含,则判定该元素为广告内容元素。
为达到上述目的,本发明实施例公开了一种网页广告过滤装置,所述装置包括:
广告内容元素确定模块,用于确定目标网页中的广告内容元素;
广告背景元素查找模块,用于根据所述广告内容元素所在区域的区域参数,在所述目标网页中查找所述广告内容元素对应的广告背景元素;
广告过滤模块,用于过滤所述广告内容元素及其对应的广告背景元素。
可选的,所述装置还包括:
非广告元素确定模块,用于确定所述目标网页中的非广告元素。
可选的,所述广告背景元素查找模块,包括:
中心点坐标确定子模块,用于确定所述广告内容元素所在区域中心点的坐标以及非广告内容元素所在区域中心点的坐标;
中心区域确定子模块,用于根据所述广告内容元素所在区域中心点的坐标,确定所述广告内容元素所在区域的中心区域;
广告背景元素查找子模块,用于根据所述广告内容元素所在区域的中心区域与非广告内容元素所在区域中心点的坐标,在非广告内容元素中查找广告内容元素对应的广告背景元素。
可选的,所述广告背景元素查找子模块,包括:点坐标获得单元、第一绝对差值计算单元、第二绝对差值计算单元、绝对差值比较单元和广告背景元素判定单元;
所述点坐标获得单元,用于按照预设的遍历规则,获得所述广告内容元素所在区域的中心区域内第i个像素点的坐标;
所述第一绝对差值计算单元,用于计算得到第i个像素点的横向坐标与非广告内容元素所在区域中心点的横向坐标之间差值的绝对值,得第一绝对差值;
所述第二绝对差值计算单元,用于计算得到第i个像素点的纵向坐标与非广告内容元素所在区域中心点的纵向坐标之间差值的绝对值,得第二绝对差值;
所述绝对差值比较单元,用于比较所述第一绝对差值与第一阈值,以及比 较所述第二绝对差值与第二阈值,如果所述第一绝对差值小于所述第一阈值和/或所述第二绝对差值小于所述第二阈值,则i的取值加1,出发所述点坐标获得单元,获得第i个像素点的坐标,否则,触发所述广告背景元素判定单元,判定广告背景元素;
所述广告背景元素判定单元,用于判定该非广告内容元素为所述广告内容元素对应的广告背景元素。
可选的,所述广告内容元素确定模块,包括:
链接信息判断子模块,用于判断目标网页的元素包含的链接信息中是否包含预设的关键字;
广告内容元素判定子模块,用于在所述链接信息判断子模块的判断结果为是的情况下,判定该元素为广告内容元素。
由以上可见,本发明实施例提供的方案中,确定目标网页中的广告内容元素后,根据所获得的广告内容元素所在区域的区域元素,在目标网页中查找广告内容元素对应的广告背景元素,并过滤掉广告内容元素及其对应的广告背景元素。与现有技术相比,应用本发明实施例提供的方案进行网页广告过滤,在过滤掉网页广告中广告内容元素的同时,能够过滤掉与该广告内容元素对应的广告背景元素,提高了用户体验效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的网页广告过滤方法的第一种流程示意图;
图2为本发明实施例提供的网页广告过滤方法的第二种流程示意图;
图3为本发明实施例提供的网页广告过滤方法的第三种流程示意图;
图4为本发明实施例提供的一种查找广告内容元素对应的广告背景元素的方法的流程示意图;
图5为本发明实施例提供的网页广告过滤装置的第一种结构示意图;
图6为本发明实施例提供的网页广告过滤装置的第二种结构示意图;
图7为本发明实施例提供的网页广告过滤装置的第三种结构示意图;
图8为本发明实施例提供的一种广告背景元素查找单元的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的网页广告过滤方法的第一种流程示意图,该方法包括:
S1000:确定目标网页中的广告内容元素。
具体的,网页中的广告可以划分为广告内容元素和广告背景元素,广告内容元素在网页的源代码中可以以链接的形式呈现,例如,图片的链接等等。
可选的,在确定目标网页中的广告内容元素时,可以判断目标网页的元素包含的链接信息中是否包含预设的关键字,若包含预设的关键字,可判定该元素为广告内容元素;示例性的,预设的关键字可以是ad或者advert等等。
可选的,确定目标网页中的广告内容元素时,还可以判定目标网页的元素包含的链接信息是否与预设的通配符匹配规则相符,若相符,可判定该元素为广告内容元素。
S2000:根据广告内容元素所在区域的区域参数,在目标网页中查找广告内容元素对应的广告背景元素。
其中,上述区域参数可以包括所在区域的形状信息、中心点的坐标、各个顶点的坐标和/或各条边的长度等等。
例如,网页的各个元素可以以矩形形式展示,因此,上述区域参数可以包括矩形区域的中心点的坐标、左上角顶点的坐标、右上角顶点的坐标、矩形的宽度以及矩形的高度等等。
具体的,网页的各个元素包含相应的元素标识,根据网页的各个元素的标识即可得到各个元素在网页中的位置信息,例如,矩形所在区域的左上角顶点的坐标、右上角顶点的坐标、矩形的宽度以及矩形的高度等等,进一步的,根据矩形的宽度、高度、左上角顶点坐标,能够计算得到矩形区域的中心点坐标。
S3000:过滤上述广告内容元素及其对应的广告背景元素。
可选的,在本发明的一个具体实施例中,参见图2,在确定目标网页的广告内容元素(S1000)之后,还可以包括:
S4000:确定目标网页中的非广告内容元素。
在本发明的实施例中,目标网页中包含多种元素,除了广告内容元素,其他的元素就可以认为是非广告内容元素。
当然也可以在特定范围内确定目标网页中的非广告内容元素。
优选的,在本发明的实施例中,如果上述区域参数为广告内容元素所在区域中心点的坐标,参见图3,上述根据广告内容元素所在区域的区域参数,在目标网页中查找广告内容元素对应的广告背景元素(S2000),可以包括:
S2100:确定广告内容元素所在区域中心点的坐标以及非广告内容元素所在区域中心点的坐标。
以某个元素所在区域为矩形区域为例,可以按照如下关系式计算该元素所在区域中心点的坐标(x,y),
x=xl+w/2,y=yl+h/2,其中,(xl,yl)为该元素所在矩形区域左上角顶点的坐标,w为矩形区域的宽度,h为矩形区域的高度。
S2200:根据广告内容元素所在区域中心点的坐标,确定广告内容元素所在区域的中心区域。
其中,上述的中心区域可以是广告内容元素所在区域中心点,或者,还可以是以广告内容元素所在区域中心点为中心的圆形区域或矩形区域等等。
在上述的中心区域是以广告内容元素所在区域中心点为中心的圆形区域或矩形区域时,可以根据预先设定的圆形区域的半径或者矩形区域的宽度和高度,确定上述的中心区域。
S2300:根据广告内容元素所在区域的中心区域与非广告内容元素所在区域中心点的坐标,在非广告内容元素中查找广告内容元素对应的广告背景元素。
目标网页中可能存在广告内容元素对应的广告背景元素,也可能不存在对应的广告背景元素;可选的,上述广告内容元素对应的广告背景元素可以是一层或多层广告背景元素。
不管目标网页中存在几层当前广告内容元素对应的广告背景元素,广告背景元素与广告内容元素之间一般具有所在区域大小相近、中心点的坐标距离较近等特点。
可选的,在本发明的一个具体实施例中,参见图4,根据广告内容元素所在区域的中心区域与非广告内容元素所在区域中心点的坐标,在非广告内容元素中查找广告内容元素对应的广告背景元素(S2300),可以包括:
S2310:按照预设的遍历规则,获得广告内容元素所在区域的中心区域内第i个像素点的坐标。
其中,i的初始值为1,且i≤广告内容元素所在区域的中心区域内像素点的个数。
预设的遍历顺序可以是按照逐行从左到右的顺序逐点遍历,也可以是以广告内容元素所在区域的中心点为起始点,按照各个点距离该中心点的距离由近到远的顺序逐点遍历等等,当然,本申请只是以上述为例进行说明,实际应用中遍历顺序不仅限于此。
S2320:计算得到第i个像素点的横向坐标与非广告内容元素所在区域中心点的横向坐标之间差值的绝对值,得第一绝对差值。
S2330:计算得到第i个像素点的纵向坐标与非广告内容元素所在区域中心点的纵向坐标之间差值的绝对值,得第二绝对差值。
S2340:比较第一绝对差值与第一阈值,以及比较第二绝对差值与第二阈值,如果第一绝对差值小于第一阈值和/或第二绝对差值小于第二阈值,执行S2350,否则,i的取值加1,然后转向执行S2310。
S2350:判定该非广告内容元素为该广告内容元素对应的广告背景元素。
由以上可见,本实施例提供的方案中,确定目标网页中的广告内容元素后,根据广告内容元素所在区域的区域参数,在目标网页中查找广告内容元素对应的广告背景元素,并过滤掉广告内容元素及其对应的广告背景元素。与现有技术相比,应用本实施例提供的方案进行网页广告过滤,在过滤掉网页广告中广告内容元素的同时,能够过滤掉与该广告内容元素对应的广告背景元素,提高了用户体验效果。
与上述的网页广告过滤方法相对应,本发明实施例还提供了一种网页广告过滤装置。
图5为本发明实施例提供的网页广告过滤装置的第一种结构示意图,该装置包括:广告内容元素确定模块5000、广告背景元素查找模块6000和广告过滤模块7000。
其中,广告内容元素确定模块5000,用于确定目标网页中的广告内容元素;
广告背景元素查找模块6000,用于根据所述广告内容元素所在区域的区域参数,在所述目标网页中查找所述广告内容元素对应的广告背景元素;
广告过滤模块7000,用于过滤所述广告内容元素及其对应的广告背景元素。
具体的,广告内容元素确定模块5000可以包括:链接信息判断子模块和广告内容元素判定子模块(图中未示出)。
其中,链接信息判断子模块,用于判断目标网页的元素包含的链接信息中是否包含预设的关键字;
广告内容元素判定子模块,用于在所述链接信息判断子模块的判断结果为是的情况下,判定该元素为广告内容元素。
在本发明的一个具体实施例中,参见图6,该装置还包括:非广告元素确定模块8000。
其中,非广告元素确定模块8000,用于确定所述目标网页中的非广告元素。
优选的,在本发明的实施例中,参见图7,广告背景元素查找模块6000包括:中心点坐标确定子模块6100、中心区域确定子模块6200和广告背景元素查找子模块6300。
其中,中心点坐标确定子模块6100,用于确定所述广告内容元素所在区域中心点的坐标以及非广告内容元素所在区域中心点的坐标;
中心区域确定子模块6200,用于根据所述广告内容元素所在区域中心点的坐标,确定所述广告内容元素所在区域的中心区域;
广告背景元素查找子模块6300,用于根据所述广告内容元素所在区域的中心区域与非广告内容元素所在区域中心点的坐标,在非广告内容元素中查找广告内容元素对应的广告背景元素。
可选的,在本发明的另一个具体实施例中,参见图8,广告背景元素查找子模块6300包括:点坐标获得单元6310、第一绝对差值计算单元6320、第二绝对差值计算单元6330、绝对差值比较单元6340和广告背景元素判定单元6350。
其中,点坐标获得单元6310,用于按照预设的遍历规则,获得所述广告内容元素所在区域的中心区域内第i个像素点的坐标;
第一绝对差值计算单元6320,用于计算得到第i个像素点的横向坐标与非广告内容元素所在区域中心点的横向坐标之间差值的绝对值,得第一绝对差值;
第二绝对差值计算单元6330,用于计算得到第i个像素点的纵向坐标与非广告内容元素所在区域中心点的纵向坐标之间差值的绝对值,得第二绝对差值;
绝对差值比较单元6340,用于比较所述第一绝对差值与第一阈值,以及比较所述第二绝对差值与第二阈值,如果所述第一绝对差值小于所述第一阈值和/或所述第二绝对差值小于所述第二阈值,则i的取值加1,触发所述点坐标获得单 元6310,获得第i个像素点的坐标,否则,触发所述广告背景元素判定单元6350,判定广告背景元素;
广告背景元素判定单元6350,用于判定该非广告内容元素为所述广告内容元素对应的广告背景元素。
由以上可见,本实施例提供的方案中,确定目标网页中的广告内容元素后,根据所获得的广告内容元素所在区域的区域元素,在目标网页中查找广告内容元素对应的广告背景元素,并过滤掉广告内容元素及其对应的广告背景元素。与现有技术相比,应用本实施例提供的方案进行网页广告过滤,在过滤掉网页广告中广告内容元素的同时,能够过滤掉与该广告内容元素对应的广告背景元素,提高了用户体验效果。
对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本领域普通技术人员可以理解实现上述方法实施方式中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机可读取存储介质中,这里所称得的存储介质,如:ROM/RAM、磁碟、光盘等。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

一种网页广告过滤方法及装置.pdf_第1页
第1页 / 共14页
一种网页广告过滤方法及装置.pdf_第2页
第2页 / 共14页
一种网页广告过滤方法及装置.pdf_第3页
第3页 / 共14页
点击查看更多>>
资源描述

《一种网页广告过滤方法及装置.pdf》由会员分享,可在线阅读,更多相关《一种网页广告过滤方法及装置.pdf(14页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN104133896A43申请公布日20141105CN104133896A21申请号201410374190322申请日20140731G06F17/3020060171申请人可牛网络技术(北京)有限公司地址100041北京市石景山区八大处高科技园区西井路3号1号楼150房间72发明人朱佳来陈亮74专利代理机构北京柏杉松知识产权代理事务所普通合伙11413代理人项京马敬54发明名称一种网页广告过滤方法及装置57摘要本发明实施例公开了一种网页广告过滤方法及装置,涉及网络通信技术领域,其中,所述方法包括确定目标网页中的广告内容元素;根据所述广告内容元素所在区域的区域参数,在所述目。

2、标网页中查找所述广告内容元素对应的广告背景元素;过滤所述广告内容元素及其对应的广告背景元素。应用本发明实施例提供的方案进行网页广告过滤时,在过滤掉网页广告中广告内容元素的同时,能够过滤掉与该广告内容元素对应的广告背景元素,提高了用户体验效果。51INTCL权利要求书2页说明书7页附图4页19中华人民共和国国家知识产权局12发明专利申请权利要求书2页说明书7页附图4页10申请公布号CN104133896ACN104133896A1/2页21一种网页广告过滤方法,其特征在于,所述方法包括确定目标网页中的广告内容元素;根据所述广告内容元素所在区域的区域参数,在所述目标网页中查找所述广告内容元素对应的。

3、广告背景元素;过滤所述广告内容元素及其对应的广告背景元素。2根据权利要求1所述的方法,其特征在于,在所述确定目标网页中的广告内容元素之后,还包括确定所述目标网页中的非广告元素。3根据权利要求2所述的方法,其特征在于,所述根据所述广告内容元素所在区域的区域参数,在所述目标网页中查找所述广告内容元素对应的广告背景元素,包括确定所述广告内容元素所在区域中心点的坐标以及非广告内容元素所在区域中心点的坐标;根据所述广告内容元素所在区域中心点的坐标,确定所述广告内容元素所在区域的中心区域;根据所述广告内容元素所在区域的中心区域与非广告内容元素所在区域中心点的坐标,在非广告内容元素中查找广告内容元素对应的广。

4、告背景元素。4根据权利要求3所述的方法,其特征在于,所述根据所述广告内容元素所在区域的中心区域与非广告内容元素所在区域中心点的坐标,在非广告内容元素中查找广告内容元素对应的广告背景元素,包括按照预设的遍历规则,获得所述广告内容元素所在区域的中心区域内第I个像素点的坐标;计算得到第I个像素点的横向坐标与非广告内容元素所在区域中心点的横向坐标之间差值的绝对值,得第一绝对差值;计算得到第I个像素点的纵向坐标与非广告内容元素所在区域中心点的纵向坐标之间差值的绝对值,得第二绝对差值;比较所述第一绝对差值与第一阈值,以及比较所述第二绝对差值与第二阈值,如果所述第一绝对差值小于所述第一阈值和/或所述第二绝对。

5、差值小于所述第二阈值,则I的取值加1,重复上述步骤,否则,判定该非广告内容元素为所述广告内容元素对应的广告背景元素。5根据权利要求14中任一项所述的方法,其特征在于,所述确定目标网页中的广告内容元素,包括判断目标网页的元素包含的链接信息中是否包含预设的关键字;若包含,则判定该元素为广告内容元素。6一种网页广告过滤装置,其特征在于,所述装置包括广告内容元素确定模块,用于确定目标网页中的广告内容元素;广告背景元素查找模块,用于根据所述广告内容元素所在区域的区域参数,在所述目标网页中查找所述广告内容元素对应的广告背景元素;广告过滤模块,用于过滤所述广告内容元素及其对应的广告背景元素。7根据权利要求6。

6、所述的装置,其特征在于,所述装置还包括权利要求书CN104133896A2/2页3非广告元素确定模块,用于确定所述目标网页中的非广告元素。8根据权利要求7所述的装置,其特征在于,所述广告背景元素查找模块,包括中心点坐标确定子模块,用于确定所述广告内容元素所在区域中心点的坐标以及非广告内容元素所在区域中心点的坐标;中心区域确定子模块,用于根据所述广告内容元素所在区域中心点的坐标,确定所述广告内容元素所在区域的中心区域;广告背景元素查找子模块,用于根据所述广告内容元素所在区域的中心区域与非广告内容元素所在区域中心点的坐标,在非广告内容元素中查找广告内容元素对应的广告背景元素。9根据权利要求8所述的。

7、装置,其特征在于,所述广告背景元素查找子模块,包括点坐标获得单元、第一绝对差值计算单元、第二绝对差值计算单元、绝对差值比较单元和广告背景元素判定单元;所述点坐标获得单元,用于按照预设的遍历规则,获得所述广告内容元素所在区域的中心区域内第I个像素点的坐标;所述第一绝对差值计算单元,用于计算得到第I个像素点的横向坐标与非广告内容元素所在区域中心点的横向坐标之间差值的绝对值,得第一绝对差值;所述第二绝对差值计算单元,用于计算得到第I个像素点的纵向坐标与非广告内容元素所在区域中心点的纵向坐标之间差值的绝对值,得第二绝对差值;所述绝对差值比较单元,用于比较所述第一绝对差值与第一阈值,以及比较所述第二绝对。

8、差值与第二阈值,如果所述第一绝对差值小于所述第一阈值和/或所述第二绝对差值小于所述第二阈值,则I的取值加1,出发所述点坐标获得单元,获得第I个像素点的坐标,否则,触发所述广告背景元素判定单元,判定广告背景元素;所述广告背景元素判定单元,用于判定该非广告内容元素为所述广告内容元素对应的广告背景元素。10根据权利要求69中任一项所述的装置,其特征在于,所述广告内容元素确定模块,包括链接信息判断子模块,用于判断目标网页的元素包含的链接信息中是否包含预设的关键字;广告内容元素判定子模块,用于在所述链接信息判断子模块的判断结果为是的情况下,判定该元素为广告内容元素。权利要求书CN104133896A1/。

9、7页4一种网页广告过滤方法及装置技术领域0001本发明涉及网络通信技术领域,特别涉及一种网页广告过滤方法及装置。背景技术0002随着网络用户数量的逐年上升,广告商开始在网页上大量投放广告,广告给用户提供信息的同时也给大多数用户带来干扰,因此,从用户的角度看,有必要对网页中的广告进行过滤。0003网页中的广告通常由广告内容元素和广告背景元素组成,例如,飘窗广告由广告图片和空白飘窗组成;网页中嵌入的图片广告由广告图片和空白背景图片组成等等。0004应用现有技术进行广告过滤时,过滤掉网页广告中的广告内容元素后,广告背景元素会依然保留在网页中,例如,过滤飘窗广告之后,空白飘窗依然会在网页上飘动,阻挡用。

10、户视线,干扰用户浏览网页;过滤嵌入网页中的图片广告之后,空白背景图片也会依然显示在网页中,此时若网页的背景颜色与空白背景图片的颜色不相同时,空白背景图片会给用户带来较差的视觉效果。因此,应用现有技术过滤网页广告时,用户体验效果较差。发明内容0005本发明实施例公开了一种网页广告过滤方法及装置,以过滤掉网页广告中的广告内容元素和广告背景元素,提高用户体验效果。0006为达到上述目的,本发明实施例公开了一种网页广告过滤方法,所述方法包括0007确定目标网页中的广告内容元素;0008根据所述广告内容元素所在区域的区域参数,在所述目标网页中查找所述广告内容元素对应的广告背景元素;0009过滤所述广告内。

11、容元素及其对应的广告背景元素。0010可选的,在所述确定目标网页中的广告内容元素之后,还包括0011确定所述目标网页中的非广告元素。0012可选的,所述根据所述广告内容元素所在区域的区域参数,在所述目标网页中查找所述广告内容元素对应的广告背景元素,包括0013确定所述广告内容元素所在区域中心点的坐标以及非广告内容元素所在区域中心点的坐标;0014根据所述广告内容元素所在区域中心点的坐标,确定所述广告内容元素所在区域的中心区域;0015根据所述广告内容元素所在区域的中心区域与非广告内容元素所在区域中心点的坐标,在非广告内容元素中查找广告内容元素对应的广告背景元素。0016可选的,所述根据所述广告。

12、内容元素所在区域的中心区域与非广告内容元素所在区域中心点的坐标,在非广告内容元素中查找广告内容元素对应的广告背景元素,包括0017按照预设的遍历规则,获得所述广告内容元素所在区域的中心区域内第I个像素说明书CN104133896A2/7页5点的坐标;0018计算得到第I个像素点的横向坐标与非广告内容元素所在区域中心点的横向坐标之间差值的绝对值,得第一绝对差值;0019计算得到第I个像素点的纵向坐标与非广告内容元素所在区域中心点的纵向坐标之间差值的绝对值,得第二绝对差值;0020比较所述第一绝对差值与第一阈值,以及比较所述第二绝对差值与第二阈值,如果所述第一绝对差值小于所述第一阈值和/或所述第二。

13、绝对差值小于所述第二阈值,则I的取值加1,重复上述步骤,否则,判定该非广告内容元素为所述广告内容元素对应的广告背景元素。0021可选的,所述确定目标网页中的广告内容元素,包括0022判断目标网页的元素包含的链接信息中是否包含预设的关键字;0023若包含,则判定该元素为广告内容元素。0024为达到上述目的,本发明实施例公开了一种网页广告过滤装置,所述装置包括0025广告内容元素确定模块,用于确定目标网页中的广告内容元素;0026广告背景元素查找模块,用于根据所述广告内容元素所在区域的区域参数,在所述目标网页中查找所述广告内容元素对应的广告背景元素;0027广告过滤模块,用于过滤所述广告内容元素及。

14、其对应的广告背景元素。0028可选的,所述装置还包括0029非广告元素确定模块,用于确定所述目标网页中的非广告元素。0030可选的,所述广告背景元素查找模块,包括0031中心点坐标确定子模块,用于确定所述广告内容元素所在区域中心点的坐标以及非广告内容元素所在区域中心点的坐标;0032中心区域确定子模块,用于根据所述广告内容元素所在区域中心点的坐标,确定所述广告内容元素所在区域的中心区域;0033广告背景元素查找子模块,用于根据所述广告内容元素所在区域的中心区域与非广告内容元素所在区域中心点的坐标,在非广告内容元素中查找广告内容元素对应的广告背景元素。0034可选的,所述广告背景元素查找子模块,。

15、包括点坐标获得单元、第一绝对差值计算单元、第二绝对差值计算单元、绝对差值比较单元和广告背景元素判定单元;0035所述点坐标获得单元,用于按照预设的遍历规则,获得所述广告内容元素所在区域的中心区域内第I个像素点的坐标;0036所述第一绝对差值计算单元,用于计算得到第I个像素点的横向坐标与非广告内容元素所在区域中心点的横向坐标之间差值的绝对值,得第一绝对差值;0037所述第二绝对差值计算单元,用于计算得到第I个像素点的纵向坐标与非广告内容元素所在区域中心点的纵向坐标之间差值的绝对值,得第二绝对差值;0038所述绝对差值比较单元,用于比较所述第一绝对差值与第一阈值,以及比较所述第二绝对差值与第二阈值。

16、,如果所述第一绝对差值小于所述第一阈值和/或所述第二绝对差值小于所述第二阈值,则I的取值加1,出发所述点坐标获得单元,获得第I个像素点的坐标,否则,触发所述广告背景元素判定单元,判定广告背景元素;说明书CN104133896A3/7页60039所述广告背景元素判定单元,用于判定该非广告内容元素为所述广告内容元素对应的广告背景元素。0040可选的,所述广告内容元素确定模块,包括0041链接信息判断子模块,用于判断目标网页的元素包含的链接信息中是否包含预设的关键字;0042广告内容元素判定子模块,用于在所述链接信息判断子模块的判断结果为是的情况下,判定该元素为广告内容元素。0043由以上可见,本发。

17、明实施例提供的方案中,确定目标网页中的广告内容元素后,根据所获得的广告内容元素所在区域的区域元素,在目标网页中查找广告内容元素对应的广告背景元素,并过滤掉广告内容元素及其对应的广告背景元素。与现有技术相比,应用本发明实施例提供的方案进行网页广告过滤,在过滤掉网页广告中广告内容元素的同时,能够过滤掉与该广告内容元素对应的广告背景元素,提高了用户体验效果。附图说明0044为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根。

18、据这些附图获得其他的附图。0045图1为本发明实施例提供的网页广告过滤方法的第一种流程示意图;0046图2为本发明实施例提供的网页广告过滤方法的第二种流程示意图;0047图3为本发明实施例提供的网页广告过滤方法的第三种流程示意图;0048图4为本发明实施例提供的一种查找广告内容元素对应的广告背景元素的方法的流程示意图;0049图5为本发明实施例提供的网页广告过滤装置的第一种结构示意图;0050图6为本发明实施例提供的网页广告过滤装置的第二种结构示意图;0051图7为本发明实施例提供的网页广告过滤装置的第三种结构示意图;0052图8为本发明实施例提供的一种广告背景元素查找单元的结构示意图。具体实。

19、施方式0053下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。0054图1为本发明实施例提供的网页广告过滤方法的第一种流程示意图,该方法包括0055S1000确定目标网页中的广告内容元素。0056具体的,网页中的广告可以划分为广告内容元素和广告背景元素,广告内容元素在网页的源代码中可以以链接的形式呈现,例如,图片的链接等等。0057可选的,在确定目标网页中的广告内容元素时,可以判断目标。

20、网页的元素包含的说明书CN104133896A4/7页7链接信息中是否包含预设的关键字,若包含预设的关键字,可判定该元素为广告内容元素;示例性的,预设的关键字可以是AD或者ADVERT等等。0058可选的,确定目标网页中的广告内容元素时,还可以判定目标网页的元素包含的链接信息是否与预设的通配符匹配规则相符,若相符,可判定该元素为广告内容元素。0059S2000根据广告内容元素所在区域的区域参数,在目标网页中查找广告内容元素对应的广告背景元素。0060其中,上述区域参数可以包括所在区域的形状信息、中心点的坐标、各个顶点的坐标和/或各条边的长度等等。0061例如,网页的各个元素可以以矩形形式展示,。

21、因此,上述区域参数可以包括矩形区域的中心点的坐标、左上角顶点的坐标、右上角顶点的坐标、矩形的宽度以及矩形的高度等等。0062具体的,网页的各个元素包含相应的元素标识,根据网页的各个元素的标识即可得到各个元素在网页中的位置信息,例如,矩形所在区域的左上角顶点的坐标、右上角顶点的坐标、矩形的宽度以及矩形的高度等等,进一步的,根据矩形的宽度、高度、左上角顶点坐标,能够计算得到矩形区域的中心点坐标。0063S3000过滤上述广告内容元素及其对应的广告背景元素。0064可选的,在本发明的一个具体实施例中,参见图2,在确定目标网页的广告内容元素S1000之后,还可以包括0065S4000确定目标网页中的非。

22、广告内容元素。0066在本发明的实施例中,目标网页中包含多种元素,除了广告内容元素,其他的元素就可以认为是非广告内容元素。0067当然也可以在特定范围内确定目标网页中的非广告内容元素。0068优选的,在本发明的实施例中,如果上述区域参数为广告内容元素所在区域中心点的坐标,参见图3,上述根据广告内容元素所在区域的区域参数,在目标网页中查找广告内容元素对应的广告背景元素S2000,可以包括0069S2100确定广告内容元素所在区域中心点的坐标以及非广告内容元素所在区域中心点的坐标。0070以某个元素所在区域为矩形区域为例,可以按照如下关系式计算该元素所在区域中心点的坐标X,Y,0071XXLW/2。

23、,YYLH/2,其中,XL,YL为该元素所在矩形区域左上角顶点的坐标,W为矩形区域的宽度,H为矩形区域的高度。0072S2200根据广告内容元素所在区域中心点的坐标,确定广告内容元素所在区域的中心区域。0073其中,上述的中心区域可以是广告内容元素所在区域中心点,或者,还可以是以广告内容元素所在区域中心点为中心的圆形区域或矩形区域等等。0074在上述的中心区域是以广告内容元素所在区域中心点为中心的圆形区域或矩形区域时,可以根据预先设定的圆形区域的半径或者矩形区域的宽度和高度,确定上述的中心区域。0075S2300根据广告内容元素所在区域的中心区域与非广告内容元素所在区域中心说明书CN10413。

24、3896A5/7页8点的坐标,在非广告内容元素中查找广告内容元素对应的广告背景元素。0076目标网页中可能存在广告内容元素对应的广告背景元素,也可能不存在对应的广告背景元素;可选的,上述广告内容元素对应的广告背景元素可以是一层或多层广告背景元素。0077不管目标网页中存在几层当前广告内容元素对应的广告背景元素,广告背景元素与广告内容元素之间一般具有所在区域大小相近、中心点的坐标距离较近等特点。0078可选的,在本发明的一个具体实施例中,参见图4,根据广告内容元素所在区域的中心区域与非广告内容元素所在区域中心点的坐标,在非广告内容元素中查找广告内容元素对应的广告背景元素S2300,可以包括007。

25、9S2310按照预设的遍历规则,获得广告内容元素所在区域的中心区域内第I个像素点的坐标。0080其中,I的初始值为1,且I广告内容元素所在区域的中心区域内像素点的个数。0081预设的遍历顺序可以是按照逐行从左到右的顺序逐点遍历,也可以是以广告内容元素所在区域的中心点为起始点,按照各个点距离该中心点的距离由近到远的顺序逐点遍历等等,当然,本申请只是以上述为例进行说明,实际应用中遍历顺序不仅限于此。0082S2320计算得到第I个像素点的横向坐标与非广告内容元素所在区域中心点的横向坐标之间差值的绝对值,得第一绝对差值。0083S2330计算得到第I个像素点的纵向坐标与非广告内容元素所在区域中心点的。

26、纵向坐标之间差值的绝对值,得第二绝对差值。0084S2340比较第一绝对差值与第一阈值,以及比较第二绝对差值与第二阈值,如果第一绝对差值小于第一阈值和/或第二绝对差值小于第二阈值,执行S2350,否则,I的取值加1,然后转向执行S2310。0085S2350判定该非广告内容元素为该广告内容元素对应的广告背景元素。0086由以上可见,本实施例提供的方案中,确定目标网页中的广告内容元素后,根据广告内容元素所在区域的区域参数,在目标网页中查找广告内容元素对应的广告背景元素,并过滤掉广告内容元素及其对应的广告背景元素。与现有技术相比,应用本实施例提供的方案进行网页广告过滤,在过滤掉网页广告中广告内容元。

27、素的同时,能够过滤掉与该广告内容元素对应的广告背景元素,提高了用户体验效果。0087与上述的网页广告过滤方法相对应,本发明实施例还提供了一种网页广告过滤装置。0088图5为本发明实施例提供的网页广告过滤装置的第一种结构示意图,该装置包括广告内容元素确定模块5000、广告背景元素查找模块6000和广告过滤模块7000。0089其中,广告内容元素确定模块5000,用于确定目标网页中的广告内容元素;0090广告背景元素查找模块6000,用于根据所述广告内容元素所在区域的区域参数,在所述目标网页中查找所述广告内容元素对应的广告背景元素;0091广告过滤模块7000,用于过滤所述广告内容元素及其对应的广。

28、告背景元素。0092具体的,广告内容元素确定模块5000可以包括链接信息判断子模块和广告内容元素判定子模块图中未示出。0093其中,链接信息判断子模块,用于判断目标网页的元素包含的链接信息中是否包说明书CN104133896A6/7页9含预设的关键字;0094广告内容元素判定子模块,用于在所述链接信息判断子模块的判断结果为是的情况下,判定该元素为广告内容元素。0095在本发明的一个具体实施例中,参见图6,该装置还包括非广告元素确定模块8000。0096其中,非广告元素确定模块8000,用于确定所述目标网页中的非广告元素。0097优选的,在本发明的实施例中,参见图7,广告背景元素查找模块6000。

29、包括中心点坐标确定子模块6100、中心区域确定子模块6200和广告背景元素查找子模块6300。0098其中,中心点坐标确定子模块6100,用于确定所述广告内容元素所在区域中心点的坐标以及非广告内容元素所在区域中心点的坐标;0099中心区域确定子模块6200,用于根据所述广告内容元素所在区域中心点的坐标,确定所述广告内容元素所在区域的中心区域;0100广告背景元素查找子模块6300,用于根据所述广告内容元素所在区域的中心区域与非广告内容元素所在区域中心点的坐标,在非广告内容元素中查找广告内容元素对应的广告背景元素。0101可选的,在本发明的另一个具体实施例中,参见图8,广告背景元素查找子模块63。

30、00包括点坐标获得单元6310、第一绝对差值计算单元6320、第二绝对差值计算单元6330、绝对差值比较单元6340和广告背景元素判定单元6350。0102其中,点坐标获得单元6310,用于按照预设的遍历规则,获得所述广告内容元素所在区域的中心区域内第I个像素点的坐标;0103第一绝对差值计算单元6320,用于计算得到第I个像素点的横向坐标与非广告内容元素所在区域中心点的横向坐标之间差值的绝对值,得第一绝对差值;0104第二绝对差值计算单元6330,用于计算得到第I个像素点的纵向坐标与非广告内容元素所在区域中心点的纵向坐标之间差值的绝对值,得第二绝对差值;0105绝对差值比较单元6340,用于。

31、比较所述第一绝对差值与第一阈值,以及比较所述第二绝对差值与第二阈值,如果所述第一绝对差值小于所述第一阈值和/或所述第二绝对差值小于所述第二阈值,则I的取值加1,触发所述点坐标获得单元6310,获得第I个像素点的坐标,否则,触发所述广告背景元素判定单元6350,判定广告背景元素;0106广告背景元素判定单元6350,用于判定该非广告内容元素为所述广告内容元素对应的广告背景元素。0107由以上可见,本实施例提供的方案中,确定目标网页中的广告内容元素后,根据所获得的广告内容元素所在区域的区域元素,在目标网页中查找广告内容元素对应的广告背景元素,并过滤掉广告内容元素及其对应的广告背景元素。与现有技术相。

32、比,应用本实施例提供的方案进行网页广告过滤,在过滤掉网页广告中广告内容元素的同时,能够过滤掉与该广告内容元素对应的广告背景元素,提高了用户体验效果。0108对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。0109需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存说明书CN104133896A7/7页10在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品。

33、或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。0110本领域普通技术人员可以理解实现上述方法实施方式中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机可读取存储介质中,这里所称得的存储介质,如ROM/RAM、磁碟、光盘等。0111以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。说明书CN104133896A101/4页11图1图2说明书附图CN104133896A112/4页12图3说明书附图CN104133896A123/4页13图4图5图6说明书附图CN104133896A134/4页14图7图8说明书附图CN104133896A14。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1