《页面展示广告的选取方法和系统.pdf》由会员分享,可在线阅读,更多相关《页面展示广告的选取方法和系统.pdf(19页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103425680 A(43)申请公布日 2013.12.04CN103425680A*CN103425680A*(21)申请号 201210157360.3(22)申请日 2012.05.18G06F 17/30(2006.01)(71)申请人阿里巴巴集团控股有限公司地址英属开曼群岛大开曼资本大厦一座四层847号邮箱(72)发明人张涛(74)专利代理机构北京润泽恒知识产权代理有限公司 11319代理人苏培华(54) 发明名称页面展示广告的选取方法和系统(57) 摘要本申请提供了一种页面展示广告的选取方法,包括:获取当前页面的关键词;对所述关键词进行过滤,得到目标关键。
2、词;确定各目标关键词与当前页面的关联度;基于各目标关键词与当前页面的关联度确定最终选取的目标关键词,并从所述最终选取的目标关键词所对应的广告集合中选取需要展示的广告。本申请还提供了一种实现前述方法的页面展示广告的选取系统。本申请的页面展示广告的选取方法及系统,能够在对于页面文本内容较少的页面进行展示广告的选取时提高选取准确性以及降低计算复杂度。(51)Int.Cl.权利要求书4页 说明书11页 附图3页(19)中华人民共和国国家知识产权局(12)发明专利申请权利要求书4页 说明书11页 附图3页(10)申请公布号 CN 103425680 ACN 103425680 A1/4页21.一种页面展。
3、示广告的选取方法,其特征在于,包括以下步骤:获取当前页面的关键词;对所述关键词进行过滤,得到目标关键词;确定各目标关键词与当前页面的关联度;基于各目标关键词与当前页面的关联度确定最终选取的目标关键词,并从所述最终选取的目标关键词所对应的广告集合中选取需要展示的广告。2.如权利要求1所述的页面展示广告的选取方法,其特征在于,所述获取当前页面的关键词包括:抓取当前页面内容;提取当前页面内容中的文本内容;将所述文本内容传入服务器,按照预定规则进行切分,得到当前页面的关键词。3.如权利要求1所述的页面展示广告的选取方法,其特征在于,对所述关键词进行过滤包括:查询产品词字典,若关键词不在所述产品词字典中。
4、,则过滤该关键词,反之,则保留该关键词。4.如权利要求1所述的页面展示广告的选取方法,其特征在于,所述确定各目标关键词与当前页面的关联度包括:确定目标关键词与当前页面的相关性分数,根据所述相关性分数确定各目标关键词与当前页面的关联度。5.如权利要求4所述的页面展示广告的选取方法,其特征在于,所述确定目标关键词与当前页面的相关性分数包括:统计当前目标关键词在当前页面出现的次数以及在当前应用场景的所有页面中出现的次数;统计当前页面中所有目标关键词出现次数的总和;统计当前应用场景的所有页面的数目;基于前述步骤中所获取的参数计算目标关键词与当前页面的相关性分数。6.如权利要求1所述的页面展示广告的选取。
5、方法,其特征在于,所述确定各目标关键词与当前页面的关联度包括:确定目标关键词对网站收益的影响值;确定目标关键词与当前页面的相关性分数;基于所述影响值和相关性分数计算当前目标关键词与当前页面的关联度。7.如权利要求6所述的页面展示广告的选取方法,其特征在于,所述确定目标关键词对网站收益的影响值包括:统计预定时间内当前目标关键词在投放之后为网站带来的收益总和;统计相同时间内当前目标关键词被投放的次数;根据所述收益总和和被投放的次数确定当前目标关键词对网站收益的影响值。8.如权利要求6所述的页面展示广告的选取方法,其特征在于,所述基于所述影响值和相关性分数计算当前目标关键词与当前页面的关联度包括:确。
6、定影响值的权重值;权 利 要 求 书CN 103425680 A2/4页3确定相关性分数的权重值;基于所述目标关键词的影响值、相关性分数以及二者的权重值计算各目标关键词与当前页面的关联度。9.如权利要求1所述的页面展示广告的选取方法,其特征在于,所述基于各目标关键词与当前页面的关联度确定最终选取的目标关键词,并从所述最终选取的目标关键词所对应的广告集合中选取需要展示的广告包括:按照各目标关键词与当前页面的关联度从大到小的顺序每次选取一个目标关键词;从当前选取的目标关键词所对应的广告集合中选取需要展示的广告;判断选取的广告数量是否达到预定数量,若否,则选取下一目标关键词,并重复上一步骤继续选取广。
7、告。10.如权利要求1所述的页面展示广告的选取方法,其特征在于,所述基于各目标关键词与当前页面的关联度确定最终选取的目标关键词,并从所述最终选取的目标关键词所对应的广告集合中选取需要展示的广告包括:T1,按照各目标关键词与当前页面的关联度的大小对目标关键词进行排序;T2,按照目标关键词排序的先后顺序选取一个目标关键词,并获取该目标关键词所对应的广告集合;T3,获取并比较当前广告集合中的广告数量和当前页面广告展示位剩余数量,若广告数量小于剩余数量,则进行步骤T4,反之,则进行步骤T5;T4,选取当前广告集合中所有的广告作为需要展示的广告,并选取下一目标关键词以及获取该目标关键词所对应的广告集合,。
8、返回步骤T3;T5,对当前广告集合中的广告进行排序,按照排序的先后顺序选取数量等于剩余数量的广告作为需要展示的广告。11.如权利要求10所述的页面展示广告的选取方法,其特征在于,所述对当前广告集合中的广告进行排序包括:计算各广告与对应的目标关键词的相关性分数;获取各广告对应的广告主的出价;根据所述相关性分数与出价计算各广告的排序分数,按照排序分数的大小对各广告进行排序。12.如权利要求1至11任一项所述的页面展示广告的选取方法,其特征在于,所述方法还包括:展示所有被选取广告,所述展示所有被选取广告包括随机展示或者对所有被选取广告排序后展示。13.一种页面展示广告的选取系统,其特征在于,包括:当。
9、前页面信息获取模块,用于获取当前页面的关键词;过滤模块,用于对所述关键词进行过滤,得到目标关键词;关联度计算模块,用于确定所述各目标关键词与当前页面的关联度;广告选取模块,用于基于各目标关键词与当前页面的关联度确定最终选取的目标关键词,并从所述最终选取的目标关键词所对应的广告集合中选取需要展示的广告。14.如权利要求13所述的页面展示广告的选取系统,其特征在于,所述当前页面信息权 利 要 求 书CN 103425680 A3/4页4获取模块包括:页面内容抓取单元,用于抓取当前页面内容;文本内容提取单元,用于提取当前页面内容中的文本内容;切分单元,用于将所述文本内容传入服务器,按照预定规则进行切。
10、分,得到当前页面的关键词。15.如权利要求13所述的页面展示广告的选取系统,其特征在于,所述过滤模块包括:查询单元,用于查询产品词字典,若关键词不在所述产品词字典中,则过滤该关键词,反之,则保留该关键词。16.如权利要求13所述的页面展示广告的选取系统,其特征在于,所述关联度计算模块包括:相关性分数确定单元,用于确定目标关键词与当前页面的相关性分数。17.如权利要求13所述的页面展示广告的选取系统,其特征在于,所述关联度计算模块包括:影响值确定单元,用于确定目标关键词对网站收益的影响值;相关性分数确定单元,用于确定目标关键词与当前页面的相关性分数;计算单元,用于基于所述影响值和相关性分数计算当。
11、前目标关键词与当前页面的关联度。18.如权利要求13所述的页面展示广告的选取系统,其特征在于,所述广告选取模块包括:目标关键词选取单元,用于按照各目标关键词与当前页面的关联度从大到小的顺序每次选取一个目标关键词;广告选取单元,用于从当前选取的目标关键词所对应的广告集合中选取需要展示的广告;判断单元,用于判断选取的广告数量是否达到预定数量,若否,则选取下一目标关键词,并触发广告选取单元继续选取广告。19.如权利要求13所述的页面展示广告的选取系统,其特征在于,所述广告选取模块包括:目标关键词排序单元,用于按照各目标关键词与当前页面的关联度的大小对目标关键词进行排序;目标关键词选取单元,用于按照目。
12、标关键词排序的先后顺序选取一个目标关键词,并获取该目标关键词所对应的广告集合;比较单元,用于获取并比较当前广告集合中的广告数量和当前页面广告展示位剩余数量,若广告数量小于剩余数量,则触发广告选取单元,反之,则触发广告排序单元;广告选取单元,用于选取当前广告集合中所有的广告作为需要展示的广告,并选取下一目标关键词以及获取该目标关键词所对应的广告集合,触发比较单元;广告排序单元,用于对当前广告集合中的广告进行排序,按照排序的先后顺序选取数量等于剩余数量的广告作为需要展示的广告。20.如权利要求13至19任一项所述的页面展示广告的选取系统,其特征在于,所述系统还包括:权 利 要 求 书CN 1034。
13、25680 A4/4页5展示模块,用于展示所有被选取广告,所述展示所有被选取广告包括随机展示或者对所有被选取广告排序后展示。权 利 要 求 书CN 103425680 A1/11页6页面展示广告的选取方法和系统技术领域0001 本申请涉及计算机网络数据处理技术领域,特别是涉及一种页面展示广告的选取方法及系统。背景技术0002 一般来说网站(站内)的潜在收益与访问流量成正比,因此,网站会通过多种方式来提高访问流量。在其他网站进行广告投放便是其中一种方式,将在其他网站访问的用户通过点击广告引入到网站内。0003 在实际广告投放中,往往会遇到基于页面分析的广告投放场景。例如,对于一个用户正在阅读的页。
14、面,在页面的右侧推荐相关的广告。这个时候就需要一个方法分析页面的内容,并根据分析的内容选取相应的广告进行投放,目标是平衡投放广告收益与用户体验,使得两者达到共同的最大化或者使得单独某一项最大化。0004 在实现前述广告投放时,可以对页面进行内容分析,提取其中的所有关键词,并按照一定的方法计算出所有关键词分数,组成关键词向量,然后再通过每一个关键词获取该关键词所对应的广告以及每个广告的出价,最后计算关键词向量中每个关键词分数与每个广告的相关性分数,利用相关性分数与每个广告的出价来计算广告的排序分数,并按照排序分数对广告进行排序得到需要在页面进行展示的广告。0005 前述方法中,适用于页面中所包含。
15、的文字内容较多的页面,因为文字内容较多的页面往往用少数的关键词无法准确的表示其主题,所以需要通过计算每个关键词与每个广告的相关性分数的方式来对所有广告进行排序,然后选取需要展示的广告,以保证选取的广告与当前页面的关联性。在这个过程中,因为所涉及的关键词以及广告数量较多,且每个关键词与每个广告都需要计算相关性,这无疑会增加计算量,从而增加了系统展示广告的计算时间,降低了展示广告的反应速度。0006 另外,对于包含文字内容较少的页面来说,特别是画报页面,即以图片为主的页面,例如购物网站中商品图片展示页面,因为其主题较为明确,往往通过极少的关键词便可以表示出页面主题,此时,若仍然采用前述方法,除了会。
16、增加不必要的计算,甚至还会影响最后选取广告与当前页面的相关性。因为每个关键词与其所对应的广告都会具有较高的相关性,即使与当前页面主题不太相关的关键词,其对应的广告的排序分数也可能会较高,这就会影响可以表示页面主题的关键词所对应的广告的排序。例如对于一个画报页面来说,其主要展示的图片内容是女装,但是可以提取的关键词可能包括春季、女装、韩版、欧美版等等,每个关键词都会有对应的广告,此时若按照前述方法来计算每个关键词所对应广告的排序分数,那么就可能出现春季所对应的广告的排序分数与女装所对应的广告的排序分数差不多。那么选取的展示广告中便会有部分为春季这个关键词所对应的广告,而对于该画报页面来说,其主要。
17、想展示的广告应该优选为女装所对应的广告。因为此种方式无疑会影响最后选取的展示广告准确性,同时增加了计算复杂度和计算量。说 明 书CN 103425680 A2/11页7发明内容0007 本申请所要解决的技术问题是提供一种页面展示广告的选取方法及系统,能够解决对于页面文本内容较少的页面进行展示广告的选取时选取准确性以及计算复杂度的问题。0008 为了解决上述问题,本申请公开了一种页面展示广告的选取方法,包括:0009 获取当前页面的关键词;0010 对所述关键词进行过滤,得到目标关键词;0011 确定各目标关键词与当前页面的关联度;0012 基于各目标关键词与当前页面的关联度确定最终选取的目标关。
18、键词,并从所述最终选取的目标关键词所对应的广告集合中选取需要展示的广告。0013 进一步地,所述获取当前页面的关键词包括:0014 抓取当前页面内容;0015 提取当前页面内容中的文本内容;0016 将所述文本内容传入服务器,按照预定规则进行切分,得到当前页面的关键词。0017 进一步地,对所述关键词进行过滤包括:0018 查询产品词字典,若关键词不在所述产品词字典中,则过滤该关键词,反之,则保留该关键词。0019 进一步地,所述确定各目标关键词与当前页面的关联度包括:0020 确定目标关键词与当前页面的相关性分数,根据所述相关性分数确定各目标关键词与当前页面的关联度。0021 进一步地,所述。
19、确定目标关键词与当前页面的相关性分数包括:0022 统计当前目标关键词在当前页面出现的次数以及在当前应用场景的所有页面中出现的次数;0023 统计当前页面中所有目标关键词出现次数的总和;0024 统计当前应用场景的所有页面的数目;0025 基于前述步骤中所获取的参数计算目标关键词与当前页面的相关性分数。0026 进一步地,所述确定各目标关键词与当前页面的关联度包括:0027 确定目标关键词对网站收益的影响值;0028 确定目标关键词与当前页面的相关性分数;0029 基于所述影响值和相关性分数计算当前目标关键词与当前页面的关联度。0030 进一步地,所述确定目标关键词对网站收益的影响值包括:00。
20、31 统计预定时间内当前目标关键词在投放之后为网站带来的收益总和;0032 统计相同时间内当前目标关键词被投放的次数;0033 根据所述收益总和和被投放的次数确定当前目标关键词对网站收益的影响值。0034 进一步地,所述基于所述影响值和相关性分数计算当前目标关键词与当前页面的关联度包括:0035 确定影响值的权重值;0036 确定相关性分数的权重值;0037 基于所述目标关键词的影响值、相关性分数以及二者的权重值计算各目标关键词说 明 书CN 103425680 A3/11页8与当前页面的关联度。0038 进一步地,所述基于各目标关键词与当前页面的关联度确定最终选取的目标关键词,并从所述最终选。
21、取的目标关键词所对应的广告集合中选取需要展示的广告包括:0039 按照各目标关键词与当前页面的关联度从大到小的顺序每次选取一个目标关键词;0040 从当前选取的目标关键词所对应的广告集合中选取需要展示的广告;0041 判断选取的广告数量是否达到预定数量,若否,则选取下一目标关键词,并重复上一步骤继续选取广告。0042 进一步地,所述基于各目标关键词与当前页面的关联度确定最终选取的目标关键词,并从所述最终选取的目标关键词所对应的广告集合中选取需要展示的广告包括:0043 T1,按照各目标关键词与当前页面的关联度的大小对目标关键词进行排序;0044 T2,按照目标关键词排序的先后顺序选取一个目标关。
22、键词,并获取该目标关键词所对应的广告集合;0045 T3,获取并比较当前广告集合中的广告数量和当前页面广告展示位剩余数量,若广告数量小于剩余数量,则进行步骤T4,反之,则进行步骤T5;0046 T4,选取当前广告集合中所有的广告作为需要展示的广告,并选取下一目标关键词以及获取该目标关键词所对应的广告集合,返回步骤T3;0047 T5,对当前广告集合中的广告进行排序,按照排序的先后顺序选取数量等于剩余数量的广告作为需要展示的广告。0048 进一步地,所述对当前广告集合中的广告进行排序包括:0049 计算各广告与对应的目标关键词的相关性分数;0050 获取各广告对应的广告主的出价;0051 根据所。
23、述相关性分数与出价计算各广告的排序分数,按照排序分数的大小对各广告进行排序。0052 进一步地,所述方法还包括:0053 展示所有被选取广告,所述展示所有被选取广告包括随机展示或者对所有被选取广告排序后展示。0054 为了解决上述问题,本申请还公开了一种页面展示广告的选取系统,包括:0055 当前页面信息获取模块,用于获取当前页面的关键词;0056 过滤模块,用于对所述关键词进行过滤,得到目标关键词;0057 关联度计算模块,用于确定所述各目标关键词与当前页面的关联度;0058 广告选取模块,用于基于各目标关键词与当前页面的关联度确定最终选取的目标关键词,并从所述最终选取的目标关键词所对应的广。
24、告集合中选取需要展示的广告。0059 进一步地,所述当前页面信息获取模块包括:0060 页面内容抓取单元,用于抓取当前页面内容;0061 文本内容提取单元,用于提取当前页面内容中的文本内容;0062 切分单元,用于将所述文本内容传入服务器,按照预定规则进行切分,得到当前页面的关键词。0063 进一步地,所述过滤模块包括:说 明 书CN 103425680 A4/11页90064 查询单元,用于查询产品词字典,若关键词不在所述产品词字典中,则过滤该关键词,反之,则保留该关键词。0065 进一步地,所述关联度计算模块包括:0066 相关性分数确定单元,用于确定目标关键词与当前页面的相关性分数。00。
25、67 进一步地,所述关联度计算模块包括:0068 影响值确定单元,用于确定目标关键词对网站收益的影响值;0069 相关性分数确定单元,用于确定目标关键词与当前页面的相关性分数;0070 计算单元,用于基于所述影响值和相关性分数计算当前目标关键词与当前页面的关联度。0071 进一步地,所述广告选取模块包括:0072 目标关键词选取单元,用于按照各目标关键词与当前页面的关联度从大到小的顺序每次选取一个目标关键词;0073 广告选取单元,用于从当前选取的目标关键词所对应的广告集合中选取需要展示的广告;0074 判断单元,用于判断选取的广告数量是否达到预定数量,若否,则选取下一目标关键词,并触发广告选。
26、取单元继续选取广告。0075 进一步地,所述广告选取模块包括:0076 目标关键词排序单元,用于按照各目标关键词与当前页面的关联度的大小对目标关键词进行排序;0077 目标关键词选取单元,用于按照目标关键词排序的先后顺序选取一个目标关键词,并获取该目标关键词所对应的广告集合;0078 比较单元,用于获取并比较当前广告集合中的广告数量和当前页面广告展示位剩余数量,若广告数量小于剩余数量,则触发广告选取单元,反之,则触发广告排序单元;0079 广告选取单元,用于选取当前广告集合中所有的广告作为需要展示的广告,并选取下一目标关键词以及获取该目标关键词所对应的广告集合,触发比较单元;0080 广告排序。
27、单元,用于对当前广告集合中的广告进行排序,按照排序的先后顺序选取数量等于剩余数量的广告作为需要展示的广告。0081 进一步地,所述系统还包括:0082 展示模块,用于展示所有被选取广告,所述展示所有被选取广告包括随机展示或者对所有被选取广告排序后展示。0083 与现有技术相比,本申请包括以下优点:0084 本申请的页面展示广告的选取方法及系统中,通过对画报页面的关键词进行过滤得到目标关键词,并确定目标关键词与页面的关联度,最后基于目标关键词与页面的关联度来确定所需要选取的广告。在这个过程中,通过确定目标关键词与页面的关联度来确定目标关键词是否能够代表当前画报页面的主题,并以此作为选取广告的重要。
28、指标,从而可以保证所选取的广告能够与当前画报页面的主题具有较好的相关性,保证了广告选取的客观性。同时,因为画报页面的主题较为明确,无需将所有关键词与所有广告都进行相关性计算,只需要考虑能够表示主题的关键词与其对应的广告的相关性等参数的计算即可,减少了计算复杂度以及计算量,从而可以快速的选取出较为客观准确的广告。说 明 书CN 103425680 A5/11页100085 另外,在进行广告选取时,按照目标关键词与当前页面的关联度的大小逐个选取,每次只需要计算当前选取的目标关键词所对应的广告集合中的广告的排序分数,减少了不必要的计算过程,节省了计算时间,降低了计算复杂度。0086 当然,实施本申请。
29、的任一产品不一定需要同时达到以上所述的所有优点。附图说明0087 图1是本申请的页面展示广告的选取系统架构图;0088 图2是本申请的页面展示广告的选取方法实施例一的流程图;0089 图3是本申请的页面展示广告的选取方法实施例二的流程图;0090 图4是本申请的页面展示广告的选取系统实施例一的结构示意图;0091 图5是本申请的页面展示广告的选取系统实施例二的结构示意图。具体实施方式0092 为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。0093 本申请的页面展示广告的选取方法及系统主要用于画报页面(以图片为主,文字内容较少的页面)中,。
30、通过对画报页面中的关键词进行提取以及关键词与当前画报页面的关联度的计算,并依照关键词与当前画报页面的关联度分数的高低来选取需要在当前画报页面中展示的广告。0094 参照图1,示出实现本申请的页面展示广告的选取系统架构图,页面展示广告的选取系统为服务器中的一个功能模块,并作为一个中介平台在服务器后台处理系统和前台显示系统之间进行实时判断,从而实现页面展示广告的实时选取并展示。首先,页面展示广告的选取系统从服务器后台处理装置中获取当前页面的关键词以及其历史投放数据等相关数据,历史投放数据具体包括关键词被投放的次数以及为网站所带来的收益。然后,结合这些历史投放数据来确定各关键词与当前页面的关联度,从。
31、而选取出能够表示当前页面主题的关键词,然后根据关键词与当前页面的关联度大小来选取对应的广告,并传递给前台显示系统在页面中进行展示。0095 下面对本申请的页面展示广告的选取方法及系统进行详细的说明。0096 参照图2,示出本申请的一种页面展示广告的选取方法实施例一,包括以下步骤:0097 步骤101,获取当前页面的关键词。0098 获取当前页面的关键词包括:0099 抓取当前页面内容;0100 提取当前页面内容中的文本内容;0101 将所述文本内容传入服务器,按照预定规则进行切分,得到当前页面的关键词。0102 服务器后台处理系统中预先设置有对文本内容切分的规则及方法,当接收到新传入的文本内容后,便会自动根据文本内容切分规则及方法对文本内容进行切分,得到关键词。0103 步骤102,对所述关键词进行过滤,得到目标关键词。0104 对关键词进行过滤包括:查询产品词字典,若关键词不在所述产品词字典中,则过说 明 书CN 103425680 A10。