一种基于多触点归因模型的网络广告效果衡量方法和系统技术领域
本发明属于网络技术领域,涉及一种网络营销及网络广告的效果评价,
具体涉及一种基于多触点归因模型的网络广告效果衡量方法和系统。
背景技术
随着计算机及互联网技术的发展及普及,传统的营销模式逐步向网络
化的营销模式转变,网络营销及网络广告也越来越普遍,并被社会公众所
接受。而如何对网站及在网站上发布的网络广告的访问流量和访问效果进
行客观和有效地分析和评价,是当前所面临的一个技术问题。最早的网络
广告效果分析方法,仅仅是衡量展示数和点击数;而随着技术的发展,广
告主越来越重视订单等转化数据,并试图探寻转化、触点(所谓触点,指
的是互联网用户通过各种渠道或方法到达广告主网站的行为及与此行为相
关的信息)和网络广告之间的复杂因果关系。网络广告效果的衡量,正在
由“粗放型”向“精细型”方向转变。
现有的效果衡量技术中,最常见的处理方法是把网上订单等转化的功
劳全部归功于转化发生的当次网络访问,抑或是全部归功于第一次营销活
动所带来的当次访问。这样的传统归因方法其实是一种片面的衡量方式,
其特点为“单触点”归因,即认为某一次访问及其相关渠道是发生转化的
全部原因。现有的大多数网站分析工具,均默认使用上述的单触点归因方
法。显然,成熟的网络广告分析评价技术应当综合考虑从第一次点击
(FirstClick)到最后一次点击(LastClick)整个用户行为周期中各渠道所
作出的贡献,必须追溯并重视转化的源头和桥梁。而目前却未见到这方面
的技术文献资料。
发明内容
针对现有技术中存在的缺陷,本发明的目的是提供一种基于多触点归
因模型的网络广告效果衡量方法及系统,用于实现从多个角度来全面了解
和分析实际的网络广告效果。
为达到以上目的,本发明采用的技术方案是:一种基于多触点归因模
型的网络广告效果衡量方法,包括以下步骤:
收集待监测网站的用户访问和购买转化信息并上传到服务器端;在服
务器上对所述访问和购买转化信息进行数据清理,获得触点数据和转化数
据;基于所述触点数据和转化数据,使用归因模型计算出触点贡献值数据;
将所述贡献值数据导入OLAP联机分析处理数据库,并建立多维数据仓库
以供查询。
本发明还提供了一种基于多触点归因模型的网络广告效果衡量系统,
包括:
信息收集单元,用于收集待监测网站的用户访问和购买转化信息并上
传到服务器端;
数据清理单元,用于在服务器上对所述访问和购买转化信息进行数据
清理提取转换,获得触点数据和转化数据;
贡献值获取单元,用于基于所述触点数据和转化数据,使用归因模型
计算出贡献值数据;
数据仓库创建单元,用于将所述贡献值导入OLAP联机分析处理数据
库,并借助所述OLAP聚合数据,建立多维数据仓库。
本发明摒弃了传统的单触点片面归因方法,替代以面向多视角多触点
的归因计算方法。基于本发明,可以帮助广告主客观而全面地了解和评估
网络广告效果,从而准确地衡量在传统方法中被低估或高估的渠道价值,
为优化网络广告投放、提高投资回报率提供最准确的数据支持。
附图说明
图1为本发明实施例提供的基于多触点归因模型的网络广告效果衡量
方法流程图;
图2为本发明实施例中多维度剖析结果的呈现界面示意图;
图3为本发明实施例提供的基于多触点归因模型的网络广告效果衡量
系统结构图。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步描述。
本发明实施例采用面向多视角多触点的归因计算方法,可以帮助广告
主客观而全面地了解和评估网络广告效果,从而准确地衡量在传统方法中
被低估或高估的渠道价值,为优化网络广告投放、提高投资回报率提供最
准确的数据支持。
如图1所示,一种基于多触点归因模型的网络广告效果衡量方法,包
括以下步骤:
步骤101:收集待监测网站的用户访问和购买转化信息并上传到服务
器端。在待监测网站的后台加入javascript代码,每次用户访问该网站的时
候,则运行所述javascript代码,收集该用户的访问和购买转化信息,并向
服务器发送访问和购买转化信息。
步骤102:在服务器上接收并读取所述访问和购买转化信息。导入所
述访问和购买转化信息文件,并存入数据库。
步骤103:对所述访问和购买转化信息进行数据清理,整理出触点数
据和转化数据。该数据清理包括多源头数据的整合,去重以及脏数据清理。
步骤104:基于整理后的触点数据和转化数据,使用归因模型计算出
贡献值数据。
所谓归因模型,本质即指通过转化和触点数据计算贡献值数据的方法
和策略。下面给出归因模型的具体定义和算法:
由于不同用户系列行为之间相对独立,计算贡献值时只需考虑对于单
个用户的有序触点集合E及其转化集合C。
E={e1,e2,...,en}
C={c1,c2,...,cm}
其中n为该用户的触点总数,m为发生的转化总数。
定义一个bind(绑定)函数用以表示转化发生于哪个触点之后:
bind:{1,2,...,m}→{1,2,...,n}
则归因模型的计算实质上只需确定一个相应的函数即可,称其为贡献
分配函数。该函数用以确定相关触点的贡献权值。对于某一个特定的转化cj,
此函数的定义为:
fj:[e1,ebind(j)]→[0,1]
且需满足:
Σ i = 1 bind ( j ) f j ( e i ) = 1 ]]>
最后,当归因模型所对应的贡献分配函数确定后,则可计算触点ei的
贡献值为:
AV ( e i ) = Σ j = 1 m f j ( e i ) V ( c j ) ]]>
其中V(cj)表示转化cj的原始数值,如订单金额。从公式中容易理解,归
因过程实际是对于转化的一种再分配过程,分配后的贡献值总和与原始转
化价值总和相等。在极少数情况下,个别特殊的归因模型可能会出现
的特征,以满足一些特别的需求。这会相应带来放大或缩小
总贡献值的作用。由于此类模型不具有典型性,且计算思路和方法与普通
模型无异,此处不详细展开。
下面给出几个简单归因模型的贡献分配函数:
FirstClick第一次点击模型: f j ( e i ) = 1 ( i = 1 ) 0 ( i ≠ 1 ) ]]>
AvgClick平均点击模型:
LastClick最后点击模型: f j ( e i ) = 1 ( i = bind ( j ) ) 0 ( i ≠ bind ( j ) ) ]]>
FirstLast第一次及最后一次点击模型:
若bind(j)=1,则
若bind(j)≠1,则fj(ei)=1。
在以上几种简单归因模型的基础上,可引入一种智能归因模型。其核
心思想在于对部分无意义触点降权,从而提高广告效果衡量的精确性。可
使用以下方法定义其贡献分配函数:
在原有触点集合E的基础上,引入新的虚拟有序触点集合,其中的单
个元素表示一个或多个实体触点:
E ~ = { e 1 ~ , e 2 ~ , · · · , e p ~ } ]]>
通常,被判定为重复或干扰的实体触点会同发生在前的最近一次的非
降权触点组合成为一个虚拟触点,作为一个单位参与第一次贡献分配。具
体判定和组合方法可利用sessionID(即会话标识)、发生时间等信息,亦
可根据具体场景调整。
本实施例使用两个映射表示集合E和之间的关系:
ν:{1,...,n}→{1,...,p}
v - 1 : { e 1 ~ , · · · , e p ~ } → { { e a 0 + 1 , · · · , e a 1 } , · · · , { e a p - 1 + 1 , · · · , e a p } } ]]>
其中数列ai满足:
a 0 = 0 a i + 1 ≤ a i + 1 a p = p ]]>
接着,定义两个子贡献分配函数分别为:
f ~ j : { e 1 ~ , · · · , e ~ v ( bind ( j ) ) } → [ 0,1 ] ]]>满足 Σ k = 1 v ( bind ( j ) ) f ~ j ( e k ~ ) = 1 ]]>
f ~ ~ j : v - 1 ( e ~ v ( bind ( j ) ) ) → [ 0,1 ] ]]>满足 Σ k ∈ v - 1 ( e ~ v ( bind ( j ) ) ) f ~ ~ j ( e k ) = 1 ]]>
这样贡献分配函数就可表示为两个子贡献分配函数的乘积,即相当于
有两次贡献分配的过程:
f j ( e i ) = f ~ j ( e ~ v ( i ) ) f ~ ~ j ( e i ) ]]>
子贡献函数的实现亦可参照前面给出的简单模型,如在子范围内使用
FirstClick或AvgClick,亦可根据具体需要进行灵活调整。
此基于虚拟触点的智能归因模型具有如下优点:
1、抗集中。针对在一段时间内的重复触点(短间歇内通过相同渠道的
触点),本实施例会进行降权。
2、抗干扰。对来自本站和未知来源的触点,以及支付宝等第三方合作
网站回到本站的触点,进行过滤或降权。
3、反收口。收口是指在互联网常见环境下,容易扮演促成最终转化角
色的渠道,如直接访问和百度品牌词导航。对这些触点,也可进行过滤或
降权。
4、多度量。传统归因模型中,度量是单一的。而本实施例采用了订单
数、订单金额、商品数、商品金额等多种度量方式,可以帮助广告主更精
确的判断投资回报,进行更好的广告投放。多个度量之间还会发生关联和
派生,具有更好的洞察效果。
5、参数化。参数化是指权重的分配算法,模型公式,参数可变,参数
调整后,可以重新对历史数据进行修正,数据更准确。
下面举一例具体说明根据此归因模型计算贡献值的过程。假设一用户
从各种渠道到达某网站5次,并最终在第五次访问发生转化,产生了一个
价值300元的订单。5个触点的信息如下:
第几次访问
来源渠道
SessionID
转化值(元)
1
某搜索引擎
1
0
2
某门户网站
2
0
3
某搜索引擎
3
0
4
直接访问
3
0
5
某支付网站
3
300
根据抗重复和抗干扰的原则(此处对发生在同一会话的直接访问和支
付网站进行向前归并),容易得到虚拟触点集合并使用AvgClick模型:
第几次虚拟访问
来源渠道
SessionID
贡献值(元)
1
某搜索引擎
1
100
2
某门户网站
2
100
3
某搜索引擎、直接
3
100
访问、某支付网站
|
随后在第二次贡献分配中使用FirstClick模型,可以得到最终的贡献
值数据:
第几次访问
来源渠道
SessionID
贡献值(元)
1
某搜索引擎
1
100
2
某门户网站
2
100
3
某搜索引擎
3
100
4
直接访问
3
0
5
某支付网站
3
0
可以看到,该归因模型精确而灵活,能够帮助正确认识来源渠道效果
与贡献比重,相比传统的粗放式单触点归因具有明显的优势。
步骤105:将前一步骤中计算得到的贡献值导入OLAP(on-line
transaction processing,联机分析处理)数据库,并借助OLAP聚合数据,
建立多维数据仓库。
在设计多维数据仓库时,应使用贡献值为数据立方体的主要度量,而
维度和维度属性设计则应考虑便于进行业务分析的各种触点信息,如来源
渠道、着陆页面广告参数和浏览器信息等。具体的相关ETL
(Extract-Transform-Load,即数据抽取、转换、装载的过程)和数据立方体
处理方法是业界成熟技术,此处不再赘述。
步骤106:前端应用查询OLAP获取贡献值数据。由于OLAP提供多
维度剖析和查询能力,客户端可以设定多角度的过滤条件并获取过滤后的
贡献值的分组聚合结果。聚合后的贡献值数据即可作为衡量广告效果的量
化指标及广告投放决策的依据。
图2展示了一个上述多维度剖析的结果呈现界面。可以看到,对于图
中所示若干渠道,传统的单触点归因低估了它们的实际价值,而多触点归
因则能较为准确地还原它们的贡献。
参见图3,是本发明实施例一种基于多触点归因模型的网络广告效果
衡量系统结构图,具体包括:
信息收集单元31,用于收集待监测网站的用户访问和购买转化信息并
上传到服务器端;
数据清理单元32,用于在服务器上对所述访问和购买转化信息进行数
据清理,获得触点数据和转化数据;
贡献值获取单元33,用于基于所述触点数据和转化数据,使用归因模
型计算出贡献值数据;
数据仓库创建单元34,用于将所述贡献值导入OLAP联机分析处理数
据库,并借助所述OLAP聚合数据,建立多维数据仓库;
查询单元35,用于通过查询OLAP获取贡献值数据,并能设定多角度
的过滤条件并获取过滤后的贡献值的分组聚合结果,以量化渠道价值。
综上,本实施例提供的多触点归因模型能够较全面地度量和计算各广
告渠道的实际贡献,对于网络广告的效果衡量具有重要意义。
本发明所述的方法和系统并不限于具体实施方式中所述的实施例,本
领域技术人员根据本发明的技术方案得出其他的实施方式,同样属于本发
明的技术创新范围。