效果类推广信息监控方法及系统技术领域
本发明涉及计算机应用技术领域,特别是涉及效果类推广信息监控方法
及系统。
背景技术
信息推广是指通过一定形式的媒体,向公众传递信息的宣传手段。对于
商家而言,信息推广是一种重要营销手段。传统的推广信息模式包括电视推
广信息和平面推广信息等,商家投放的推广信息样式固定,投入的推广资金
固定,而信息推广效果和直接收益都无法衡量。此外,传统推广信息模式受
单向媒体的局限性的影响,难以形成与接受方的互动,通常为获得第一手的
信息资料也是通过调查问卷或线下活动完成,具有信息面窄、成本过高等缺
点
随着互联网的发展,互联网上的效果类推广信息越来越受到商家的青睐。
作为一种新兴的营销模式,效果类推广信息与传统推广信息模式不同。由于
互联网属于双向媒体,商家可以和推广信息投放平台实时交互,随时根据情
况增减资金投入、修改推广信息样式。同时商家所投放的推广信息和消费者
有良好的交互,可以直接度量推广信息投放的效果和收益,根据投放效果和
收益再实时的优化资金投入和推广信息样式等方面,从而达到最佳的营销效
果。
随着效果类推广信息投放平台功能的不断发展,效果类推广信息涉及的
效果指标也越来越多,例如点击量、展现量等等,从平台侧而言,希望能够
了解用户更关注哪些指标,并对这些指标予以监控。但是在实际应用中,要
求每一名用户都上报自己详细的关注指标并不现实,更何况有些没有投放经
验的用户可能并不清楚自己实际应该关注哪些具体指标。如果要对所有的指
标都进行监控,对于不同的用户,总会有一部分监控结果是没有实际意义的,
造成系统资源的严重浪费。
发明内容
为解决上述技术问题,本发明实施例提供一种效果类推广信息监控方法
及系统,能够根据用户的实际情况,自动分析其关注的指标类型,并对该类
型的指标进行监控,主要技术方案如下:
本发明实施例提供一种效果类推广信息监控方法,包括:
根据用户首要关注的效果指标类型,对用户进行分类;
建立回归模型并初始化,所述模型以用户的效果指标变化情况为自变量,
以用户所属的类别作为应变量;
利用用户在预置时段的数据变化作为样本,分别确定每类用户的自变量
所对应的回归系数;
根据回归系数的大小,确定用户对各种效果指标的关注程度。
在本发明的一种实施方式中,所述根据用户首要关注的效果指标类型,
对用户进行分类,包括:
预先获得部分用户标注的首要关注效果指标类型;
根据用户的至少一种属性特征,对用户进行聚类;
在每个聚类中,根据预先获得的部分用户标注信息,确定该聚类的首要
关注指标类型;
根据各个聚类的首要关注指标类型,对多个聚类进行合并。
在本发明的一种实施方式中,在对用户进行分类之后,还包括:
将分类结果发送给用户,允许用户对分类结果进行修正。
在本发明的一种实施方式中,所述回归模型的自变量还包括用户的操作
行为。
在本发明的一种实施方式中,所述根据回归系数的大小,确定用户对各
种效果指标的关注程度,包括:
确定各种用户操作行为的回归系数之后,根据操作行为与指标效果变化
的理论对应关系,确定用户对各种效果指标的关注程度。
在本发明的一种实施方式中,确定用户对各种效果指标的关注程度,还
包括:对用户关注程度较高的效果指标进行监控。
在本发明的一种实施方式中,所述对效果指标监控方法包括:
选取所述效果指标在预置历史时段的数据点;
根据所选取的数据点,对所述效果指标在预置时段的变化趋势曲线进行
拟合;
获取用户最新的效果指标数据之后,根据该数据与变化趋势曲线的偏离
程度,判断是否发生了效果突变。
本发明实施例提供一种效果类推广信息监控系统,包括:
用户分类单元,用于根据用户首要关注的效果指标类型,对用户进行分
类;
模型初始化单元,用于建立回归模型并初始化,所述模型以用户的效果
指标变化情况为自变量,以用户所属的类别作为应变量;
系数确定单元,用于利用用户在预置时段的数据变化作为样本,分别确
定每类用户的自变量所对应的回归系数;
关注程度确定单元,用于根据回归系数的大小,确定用户对各种效果指
标的关注程度。
在本发明的一种实施方式中,所述用户分类单元包括:
标注信息获得子单元,用于预先获得部分用户标注的首要关注效果指标
类型;
聚类子单元,用于根据用户的至少一种属性特征,对用户进行聚类;
聚类类型确定子单元,用于在每个聚类中,根据预先获得的部分用户标
注信息,确定该聚类的首要关注指标类型;
聚类合并子单元,用于根据各个聚类的首要关注指标类型,对多个聚类
进行合并。
在本发明的一种实施方式中,还包括:
分类结果修正单元,用于在对用户进行分类之后,将分类结果发送给用
户,允许用户对分类结果进行修正。
在本发明的一种实施方式中,所述回归模型的自变量还包括用户的操作
行为。
在本发明的一种实施方式中,所述关注程度确定单元具体用于:
确定各种用户操作行为的回归系数之后,根据操作行为与指标效果变化
的理论对应关系,确定用户对各种效果指标的关注程度。
在本发明的一种实施方式中,还包括监控单元,用于在确定用户对各种
效果指标的关注程度之后,对用户关注程度较高的效果指标进行监控。
在本发明的一种实施方式中,所述监控单元包括:
数据点选取子单元,用于选取所述效果指标在预置历史时段的数据点;
拟合子单元,用于根据所选取的数据点,对所述效果指标在预置时段的
变化趋势曲线进行拟合;
效果突变判断子单元,用于获取用户最新的效果指标数据之后,根据该
数据与变化趋势曲线的偏离程度,判断是否发生了效果突变。
本发明实施例所提供的技术方案,首先根据用户首要关注的效果指标类
型对用户进行分类,然后利用回归模型确定用户对每类用户对各种效果指标
的关注程度。应用本发明技术方案,可以针对不同的用户,仅选取其最为关
注的几种效果指标进行监控,对于该用户不关注的指标则不需要进行监控,
从而有效地节省了系统资源。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实
施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面
描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员
来讲,还可以根据这些附图获得其他的附图。
图1为本发明实施例效果类推广信息监控方法的流程图;
图2为本发明实施例对用户进行分类的方法流程图;
图3为本发明实施例对特定效果指标的监控方法流程图;
图4为本发明实施例效果类推广信息监控系统的结构示意图;
图5为本发明实施例效果类推广信息监控系统的第二种结构示意图;
图6为本发明实施例效果类推广信息监控系统的第三种结构示意图。
具体实施方式
首先对本发明实施例所提供的一种效果类推广信息监控方法进行说明,
该方法可以包括以下步骤:
根据用户首要关注的效果指标类型,对用户进行分类;
建立回归模型并初始化,所述模型以用户的效果指标变化情况为自变量,
以用户所属的类别作为应变量;
利用用户在预置时段的数据变化作为样本,分别确定每类用户的自变量
所对应的回归系数;
根据回归系数的大小,确定用户对各种效果指标的关注程度。
上述方法首先根据用户首要关注的效果指标类型对用户进行分类,然后
利用回归模型确定用户对每类用户对各种效果指标的关注程度。应用本发明
技术方案,可以针对不同的用户,仅选取其最为关注的一种或多种效果指标
进行监控,对于该用户不关注的指标则不需要进行监控,从而有效地节省了
系统资源。
为了使本领域技术人员更好地理解本发明中的技术方案,下面将结合本
发明实施例中的附图,对本发明实施例中的技术方案进行详细地描述,显然,
所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本
发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属
于本发明保护的范围。
图1所示,为本发明一种效果类推广信息监控方法的流程图,包括以下
步骤:
S101,根据用户首要关注的效果指标类型,对用户进行分类;
现有的推广信息系统,往往涉及多种效果指标,用户可能会关注其中的
一个或多个,尽管要求每一名用户都上报自己详细关注指标的难度较大,但
是如果仅要求用户只上报一种最为关注的指标,可行性就大大提高了。
推广信息投放平台可以提供一个交互接口,将几个效果指标选项提供给
用户,让用户自行选择,例如,平台提供的选项中包括“展现量、点击量、
消费量、浏览量、成单量”5个选项,则根据用户的选择结果,可以将所有
的用户分为4个大类。
尽管仅要求用户只上报首要关注指标的方式已经有效提高了可行性,但
是考虑到要求所有用户都进行上报在实际执行时仍有困难,本发明实施例还
提供了另一种对用户进行分类的方式,参见图2所示,该方法可以包括以下
步骤:
S101a,预先获得部分用户标注的首要关注效果指标类型;
在实际应用中,可以仅要求一部分用户对自己首要关注的效果指标类型
进行标注,例如,总共有2000名用户,可以要求其中配合度较高的100名优
质用户进行标注。当然,也可以要求2000名用户全部进行标注,尽管有些用
户可能不会反馈,那么后续也可以利用部分用户反馈的内容进行处理。
S101b,根据用户的至少一种属性特征,对用户进行聚类;
根据实际调查发现,具有相似属性特征的用户,在关注指标上也具有较
大的相似性,例如主营汽车行业的商户通常更为关注展现量、主营电子商务
的商户通常更为关注成单量、规模较大的商户通常对消费量(成本)关注程
度较小、小规模客户则相反,等等。基于上述情况,可以先将所有的用户按
照其固有的情况,聚为多个小类,然后对每个聚类的标注信息进行统计,得
到该类别用的首要关注指标。
其中,聚类所依据的属性特征可以包括:客户所在行业、客户的推广信
息数量、客户的消费情况、客户推广信息的展现次数等多个方面,在聚类时,
可以考虑一个特征,也可以考虑多个特征,目的是把具有相似情况的用户划
分到一起。一般来讲,聚类的数量应大于分类的数量,即效果指标的种类数
(在本例中为5)。具体的聚类算法可以根据实际的业务需求进行设计,在
本实施例中不需要详细进行说明。
S101c,在每个聚类中,根据预先获得的部分用户标注信息,确定该聚类
的首要关注指标类型;
在本步骤中,实际上是采用投票的方式,确定各个聚类的首要关注指标
类型。即:在每个聚类中,将具有最多用户标注数的指标,作为该聚类的首
要关注指标。
S101d,根据各个聚类的首要关注指标类型,对多个聚类进行合并。
由于聚类数量大于分类数量(效果指标的种类数),因此在确定各个聚
类的首要关注指标类型后,可以多这些聚类进行合并,在本例中,最终的结
果是把所有的聚类合并为4个用户大类,分别是首要关注展现量、点击量、
消费量、浏览量、成单量的5类用户。
应用S101a-S101d的方法,就可以利用少量用户的标注信息,实现对所
有的用户的分类,并且分类结果大致是准确的。当然,分类完成后,还可以
进一步提分类结果发送给用户,允许用户对分类结果进行修正。例如,一个
用户被自动划分为“关注点击量”类,但是该用户如果发现不符合自己的情
况,可以主动进行修改。
S102,建立回归模型并初始化,所述模型以用户的效果指标变化情况为
自变量,以用户所属的类别作为应变量;
利用用户的首要关注指标,对所有用户进行初步分类后,将进一步对每
一类用户所关注的细节指标进行分析,本发明实施例利用回归模型来分析用
户所关注的细节指标,回归模型(regression model)是对统计关系进行定量
描述的一种数学模型。从一组样本数据出发,确定变量之间的数学关系式对
这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变
量中找出哪些变量的影响显著、哪些不显著。利用回归模型,可以有效分析
出某一类的用户更关注哪些指标、不关注哪些指标,以便于针对用户更为关
注的指标进行监控。
在本实施例中,利用罗杰斯特回归模型进行分析,罗杰斯特回归模型可
以表示为:
Y = e β 0 + β 1 X 1 + β 2 X 2 + · · · + β m X m 1 + e β 0 + β 1 X 1 + β 2 X 2 + · · · + β m X m ]]>
其中,Y是二值应变量,代表用户是否属于某个类别,在本实施例中,
对于某个特定的类别,以Y=1代表用户属于该类别,以Y=0代表用户不属
于该类别(即其他类别的用户)。
X1~Xm为二值自变量,代表用户在某一历史时段内,是否在某种指标上有
变化情况。例如:展现量是否上升、展现量是否下降、展现量是否上升、展
现量是否上升。在本实施例中,以X=1代表“是”,以X=0代表“否”。
β1~βm为X1~Xm的对应权重系数,每个β值越高,代表所对应的指标越被
该类用户所关注。在本实施例中,就是利用数据作为样本,通过回归计算得
到β1~βm,从而确定用户对各种效果指标的关注程度。β0为常数,在本实施
例中不具有实际含义。代表展现量
仍以前面的例子进行说明,对于展现量、点击量、消费量、浏览量、成
单量5个指标,假设以Y1代表展现量、X1~X10分别代表展现量上升、展现量
下降、点击量上升、点击量下降、消费上升、消费下降、浏览量上升、浏览
量下降、成单量上升、成单量下降10个效果变化情况,则可以得到一个关于
Y1和X1~X10的等式。类似地,分别以Y2~Y5代表点击量、消费量、浏览量、成
单量4个大类,X1~X10含义不变可以得到另外4个等式。
S103,利用用户在预置时段的数据变化作为样本,分别确定每类用户的
自变量所对应的回归系数;
建立回归模型后,选取在一段历史时期的数据作为样本,分别求解每一
大类的系数β1~βm,例如,对于“展现量”大类,假如一名用户属于该大类,
则Y1=1,如果属于其他4类,则Y1=0,X1~X10则根据在这段历史时期的数据
实际变化情况来确定,假设共有2000名用户,就可以得到2000个样本,利
用这2000个样本(根据实际需求,也可以只选择部分样本)构成方程组求解
β1~βm。
S104,根据回归系数的大小,确定用户对各种效果指标的关注程度。
求解得到Y1对应的β1~βm后即可得到“展现量”用户对各种指标的关注程
度,例如,求解得到“点击量上升”、“消费量下降”的权重最高,则表示
这类用户所追求的效果是点击量高且消费低。
类似地,可以分别求解得到Y2~Y5对应的β1~βm,从而分别得到点击量、
消费量、浏览量、成单量4个大类的用户对各个指标的具体关注程度,从而
便于系统后续有针对性地进行监控。
有些情况下,计算出的各个系数值可能差距并不明显,从而难以区分用
户对几个指标的关注程度,这种情况下,可以进一步引入用户在指定历史时
段的一些操作行为作为模型的自变量,例如,进一步增加预算升高、预算下
降、出价提高、出价降低、扩大流量、缩小流量等操作行为作为自变量。由
于这些操作行为是用户主观执行的,是用户的主观意愿的体现,每种操作行
为在理论上都会对应一种指标变化,因此,在效果变化不明显的情况下,根
据用户的行为,也可以在一定程度上了解到这类用户对各种指标的关注情况。
例如,理论上存在“预算-消费量”、“流量-展现量”、“出价-点击”
的对应关系,那么如果“增加流量”的权重较高,则说明该类用户所追求的
效果的是展现量增加。
确定用户对各种效果指标的关注程度之后,可以针对不同的用户,仅选
取其最为关注的一种或多种效果指标进行监控,对于该用户不关注的指标则
不需要进行监控,在本发明的另一个实施例中,还进一步提供了对特定效果
指标的监控方法,参见图3所示,该方法可以包括以下步骤:
S201,选取效果指标在预置历史时段的数据点;
对于特定的效果指标,可以选择最近一段时间(例如1个月、2个月)
的数据点,以时间点做为横坐标,其中,可以利用决策树模型判断不同用户
观察效果的不同粒度,利用用户的操作行为,如:登录推广信息投放平台频
率、操作频率等,确定用户关注的时间粒度,如:分钟、小时、天等。进一
步,可以用K均值聚类模型学习出第一次分类时被分为同一类的用户所关注
的时间跨度,例如在“天”级别的粒度下,是“1天”还是“2天”。
在该步骤中,还可以预先去除一些噪音点,方法如下:
设某一用户的效果指标为随机变量X,
则其过去n天均值为: μ = Σ i = 1 n X i n ]]>
标准差为: ρ = Σ i = 1 n ( X i - μ ) 2 n ]]>
定义用户时间粒度为“天”,时间跨度为1天,则当Xi<u-k*ρ或
Xi>u+k*ρ时,认为第i天有突变,其中对于上述突变定义,n和k是可以配
置的值:考虑到效果指标的自然增长和其他变化因素,n不宜过大;k=3时,
只要Xi仍然服从效果指标的分布,落在u±3*ρ的概率为99.5%左右,所以如
果超出了这个范围,基本可以认为是突变,这些数据点可以当做噪音点预先
去除。
S202,根据所选取的数据点,对所述效果指标在预置时段的变化趋势曲
线进行拟合;
将S201所选取的数据点作为输入,对输入点新进行一元线性回归,求
解效果指标在时间轴上的趋势。
一元线性回归表达式为:yi=a·xi+b
通过最小二乘法求解Q:
Q = Σ ( y i - y i ^ ) 2 = Σ [ y i - ( a + b · x i ) ] 2 ]]>
可得:
b = Σ ( x - x ‾ ) · ( y - y ‾ ) Σ ( x - x ‾ ) 2 = Σx · y - Σx · Σy / n Σ x 2 - ( Σx ) 2 / n = l xy l xx ]]>
a = y ‾ - b · x ‾ = Σy n - b · Σx n ]]>
S203,获取用户最新的效果指标数据之后,根据该数据与变化趋势曲线
的偏离程度,判断是否发生了效果突变。
求解出效果指标的线性回归方程yi=a·xi+b后,可以求解数据分布的带宽
W,W要保证一定比例(例如90%)以上的真实数据分布在带宽中,既
则yi=a·xi+b拟合的是效果指标数据分布的趋势,W则为用户
可容忍的幅度带宽。获得用户最新的效果指标数据之后,根据变化趋势曲线
判断该数据是落在否在带宽W之内,如果没有,则认为发生了突变,此时可
以对用户发出相应的提示信息。
相应于上面的方法实施例,本发明还提供一种效果类推广信息监控系统,
参见图4所示,该系统包括:
用户分类单元410,用于根据用户首要关注的效果指标类型,对用户进
行分类;
模型初始化单元420,用于建立回归模型并初始化,所述模型以用户的
效果指标变化情况为自变量,以用户所属的类别作为应变量;
系数确定单元430,用于利用用户在预置时段的数据变化作为样本,分
别确定每类用户的自变量所对应的回归系数;
关注程度确定单元440,用于根据回归系数的大小,确定用户对各种效
果指标的关注程度。
在本发明的一种实施方式中,所述回归模型的自变量还可以包括用户的
操作行为。相应地,所述关注程度确定单元440具体可以用于:确定各种用
户操作行为的回归系数之后,根据操作行为与指标效果变化的理论对应关系,
确定用户对各种效果指标的关注程度。
在本发明的一种实施方式中,所述单元用户分类单元410具体可以包括:
标注信息获得子单元,用于预先获得部分用户标注的首要关注效果指标
类型;
聚类子单元,用于根据用户的至少一种属性特征,对用户进行聚类;
聚类类型确定子单元,用于在每个聚类中,根据预先获得的部分用户标
注信息,确定该聚类的首要关注指标类型;
聚类合并子单元,用于根据各个聚类的首要关注指标类型,对多个聚类
进行合并。
参见图5所示,本发明所提供的效果类推广信息监控系统,还可以进一
步包括:
分类结果修正单元450,用于在对用户进行分类之后,将分类结果发送
给用户,允许用户对分类结果进行修正。
应用上述系统,可以针对不同的用户,仅选取其最为关注的一种或多种
效果指标进行监控,对于该用户不关注的指标则不需要进行监控,从而有效
地节省了系统资源。
参见图6所示,本发明所提供的效果类推广信息监控系统,还可以进一
步包括:
监控单元460,用于在确定用户对各种效果指标的关注程度之后,对用
户关注程度较高的效果指标进行监控。
其中,所述监控单元具体可以包括:
数据点选取子单元,用于选取所述效果指标在预置历史时段的数据点;
拟合子单元,用于根据所选取的数据点,对所述效果指标在预置时段的
变化趋势曲线进行拟合;
效果突变判断子单元,用于获取用户最新的效果指标数据之后,根据该
数据与变化趋势曲线的偏离程度,判断是否发生了效果突变。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,
在实施本发明时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到
本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,
本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品
的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、
磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,
服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所
述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同
相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同
之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,
所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描
述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元
可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可
以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。
可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目
的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本发明可用于众多通用或专用的计算系统环境或配置中。例如:个人计
算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、
基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算
机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,
例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类
型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中
实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处
理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备
在内的本地和远程计算机存储介质中。
以上所述仅是本发明的具体实施方式,应当指出,对于本技术领域的普
通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润
饰,这些改进和润饰也应视为本发明的保护范围。