效果类推广信息监控方法及系统.pdf

上传人:GAME****980 文档编号:4238644 上传时间:2018-09-09 格式:PDF 页数:15 大小:521.01KB
返回 下载 相关 举报
摘要
申请专利号:

CN201210031315.3

申请日:

2012.02.13

公开号:

CN102609527A

公开日:

2012.07.25

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20120213|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

百度在线网络技术(北京)有限公司

发明人:

马群; 徐惠; 余昌远; 徐勇明; 卢佳

地址:

100085 北京市海淀区上地十街10号百度大厦

优先权:

专利代理机构:

深圳市威世博知识产权代理事务所(普通合伙) 44280

代理人:

何青瓦;李庆波

PDF下载: PDF下载
内容摘要

本发明公开了一种效果类推广信息监控方法及系统。一种效果类推广信息监控方法包括:根据用户首要关注的效果指标类型,对用户进行分类;建立回归模型并初始化,所述模型以用户的效果指标变化情况为自变量,以用户所属的类别作为应变量;利用用户在预置时段的数据变化作为样本,分别确定每类用户的自变量所对应的回归系数;根据回归系数的大小,确定用户对各种效果指标的关注程度。应用上述方案,可以针对不同的用户,仅选取其最为关注的几种效果指标进行监控,对于该用户不关注的指标则不需要进行监控,从而有效地节省了系统资源。

权利要求书

1.一种效果类推广信息监控方法,其特征在于,包括:
根据用户首要关注的效果指标类型,对用户进行分类;
建立回归模型并初始化,所述模型以用户的效果指标变化情况为自变量,
以用户所属的类别作为应变量;
利用用户在预置时段的数据变化作为样本,分别确定每类用户的自变量
所对应的回归系数;
根据回归系数的大小,确定用户对各种效果指标的关注程度。
2.根据权利要求1所述的方法,其特征在于,所述根据用户首要关注的
效果指标类型,对用户进行分类,包括:
预先获得部分用户标注的首要关注效果指标类型;
根据用户的至少一种属性特征,对用户进行聚类;
在每个聚类中,根据预先获得的部分用户标注信息,确定该聚类的首要
关注指标类型;
根据各个聚类的首要关注指标类型,对多个聚类进行合并。
3.根据权利要求2所述的方法,其特征在于,在对用户进行分类之后,
还包括:
将分类结果发送给用户,允许用户对分类结果进行修正。
4.根据权利要求1所述的方法,其特征在于,所述回归模型的自变量还
包括用户的操作行为。
5.根据权利要求4所述的方法,其特征在于,所述根据回归系数的大小,
确定用户对各种效果指标的关注程度,包括:
确定各种用户操作行为的回归系数之后,根据操作行为与指标效果变化
的理论对应关系,确定用户对各种效果指标的关注程度。
6.根据权利要求1-5任一项所述的方法,其特征在于,确定用户对各种
效果指标的关注程度,还包括:对用户关注程度较高的效果指标进行监控。
7.根据权利要求6所述的方法,其特征在于,所述对效果指标监控方法
包括:
选取所述效果指标在预置历史时段的数据点;
根据所选取的数据点,对所述效果指标在预置时段的变化趋势曲线进行
拟合;
获取用户最新的效果指标数据之后,根据该数据与变化趋势曲线的偏离
程度,判断是否发生了效果突变。
8.一种效果类推广信息监控系统,其特征在于,包括:
用户分类单元,用于根据用户首要关注的效果指标类型,对用户进行分
类;
模型初始化单元,用于建立回归模型并初始化,所述模型以用户的效果
指标变化情况为自变量,以用户所属的类别作为应变量;
系数确定单元,用于利用用户在预置时段的数据变化作为样本,分别确
定每类用户的自变量所对应的回归系数;
关注程度确定单元,用于根据回归系数的大小,确定用户对各种效果指
标的关注程度。
9.根据权利要求8所述的系统,其特征在于,所述用户分类单元包括:
标注信息获得子单元,用于预先获得部分用户标注的首要关注效果指标
类型;
聚类子单元,用于根据用户的至少一种属性特征,对用户进行聚类;
聚类类型确定子单元,用于在每个聚类中,根据预先获得的部分用户标
注信息,确定该聚类的首要关注指标类型;
聚类合并子单元,用于根据各个聚类的首要关注指标类型,对多个聚类
进行合并。
10.根据权利要求9所述的系统,其特征在于,还包括:
分类结果修正单元,用于在对用户进行分类之后,将分类结果发送给用
户,允许用户对分类结果进行修正。
11.根据权利要求8所述的系统,其特征在于,所述回归模型的自变量
还包括用户的操作行为。
12.根据权利要求11所述的系统,其特征在于,所述关注程度确定单元
具体用于:
确定各种用户操作行为的回归系数之后,根据操作行为与指标效果变化
的理论对应关系,确定用户对各种效果指标的关注程度。
13.根据权利要求8-12任一项所述的系统,其特征在于,还包括监控单
元,用于在确定用户对各种效果指标的关注程度之后,对用户关注程度较高
的效果指标进行监控。
14.根据权利要求13所述的系统,其特征在于,所述监控单元包括:
数据点选取子单元,用于选取所述效果指标在预置历史时段的数据点;
拟合子单元,用于根据所选取的数据点,对所述效果指标在预置时段的
变化趋势曲线进行拟合;
效果突变判断子单元,用于获取用户最新的效果指标数据之后,根据该
数据与变化趋势曲线的偏离程度,判断是否发生了效果突变。

说明书

效果类推广信息监控方法及系统

技术领域

本发明涉及计算机应用技术领域,特别是涉及效果类推广信息监控方法
及系统。

背景技术

信息推广是指通过一定形式的媒体,向公众传递信息的宣传手段。对于
商家而言,信息推广是一种重要营销手段。传统的推广信息模式包括电视推
广信息和平面推广信息等,商家投放的推广信息样式固定,投入的推广资金
固定,而信息推广效果和直接收益都无法衡量。此外,传统推广信息模式受
单向媒体的局限性的影响,难以形成与接受方的互动,通常为获得第一手的
信息资料也是通过调查问卷或线下活动完成,具有信息面窄、成本过高等缺

随着互联网的发展,互联网上的效果类推广信息越来越受到商家的青睐。
作为一种新兴的营销模式,效果类推广信息与传统推广信息模式不同。由于
互联网属于双向媒体,商家可以和推广信息投放平台实时交互,随时根据情
况增减资金投入、修改推广信息样式。同时商家所投放的推广信息和消费者
有良好的交互,可以直接度量推广信息投放的效果和收益,根据投放效果和
收益再实时的优化资金投入和推广信息样式等方面,从而达到最佳的营销效
果。

随着效果类推广信息投放平台功能的不断发展,效果类推广信息涉及的
效果指标也越来越多,例如点击量、展现量等等,从平台侧而言,希望能够
了解用户更关注哪些指标,并对这些指标予以监控。但是在实际应用中,要
求每一名用户都上报自己详细的关注指标并不现实,更何况有些没有投放经
验的用户可能并不清楚自己实际应该关注哪些具体指标。如果要对所有的指
标都进行监控,对于不同的用户,总会有一部分监控结果是没有实际意义的,
造成系统资源的严重浪费。

发明内容

为解决上述技术问题,本发明实施例提供一种效果类推广信息监控方法
及系统,能够根据用户的实际情况,自动分析其关注的指标类型,并对该类
型的指标进行监控,主要技术方案如下:

本发明实施例提供一种效果类推广信息监控方法,包括:

根据用户首要关注的效果指标类型,对用户进行分类;

建立回归模型并初始化,所述模型以用户的效果指标变化情况为自变量,
以用户所属的类别作为应变量;

利用用户在预置时段的数据变化作为样本,分别确定每类用户的自变量
所对应的回归系数;

根据回归系数的大小,确定用户对各种效果指标的关注程度。

在本发明的一种实施方式中,所述根据用户首要关注的效果指标类型,
对用户进行分类,包括:

预先获得部分用户标注的首要关注效果指标类型;

根据用户的至少一种属性特征,对用户进行聚类;

在每个聚类中,根据预先获得的部分用户标注信息,确定该聚类的首要
关注指标类型;

根据各个聚类的首要关注指标类型,对多个聚类进行合并。

在本发明的一种实施方式中,在对用户进行分类之后,还包括:

将分类结果发送给用户,允许用户对分类结果进行修正。

在本发明的一种实施方式中,所述回归模型的自变量还包括用户的操作
行为。

在本发明的一种实施方式中,所述根据回归系数的大小,确定用户对各
种效果指标的关注程度,包括:

确定各种用户操作行为的回归系数之后,根据操作行为与指标效果变化
的理论对应关系,确定用户对各种效果指标的关注程度。

在本发明的一种实施方式中,确定用户对各种效果指标的关注程度,还
包括:对用户关注程度较高的效果指标进行监控。

在本发明的一种实施方式中,所述对效果指标监控方法包括:

选取所述效果指标在预置历史时段的数据点;

根据所选取的数据点,对所述效果指标在预置时段的变化趋势曲线进行
拟合;

获取用户最新的效果指标数据之后,根据该数据与变化趋势曲线的偏离
程度,判断是否发生了效果突变。

本发明实施例提供一种效果类推广信息监控系统,包括:

用户分类单元,用于根据用户首要关注的效果指标类型,对用户进行分
类;

模型初始化单元,用于建立回归模型并初始化,所述模型以用户的效果
指标变化情况为自变量,以用户所属的类别作为应变量;

系数确定单元,用于利用用户在预置时段的数据变化作为样本,分别确
定每类用户的自变量所对应的回归系数;

关注程度确定单元,用于根据回归系数的大小,确定用户对各种效果指
标的关注程度。

在本发明的一种实施方式中,所述用户分类单元包括:

标注信息获得子单元,用于预先获得部分用户标注的首要关注效果指标
类型;

聚类子单元,用于根据用户的至少一种属性特征,对用户进行聚类;

聚类类型确定子单元,用于在每个聚类中,根据预先获得的部分用户标
注信息,确定该聚类的首要关注指标类型;

聚类合并子单元,用于根据各个聚类的首要关注指标类型,对多个聚类
进行合并。

在本发明的一种实施方式中,还包括:

分类结果修正单元,用于在对用户进行分类之后,将分类结果发送给用
户,允许用户对分类结果进行修正。

在本发明的一种实施方式中,所述回归模型的自变量还包括用户的操作
行为。

在本发明的一种实施方式中,所述关注程度确定单元具体用于:

确定各种用户操作行为的回归系数之后,根据操作行为与指标效果变化
的理论对应关系,确定用户对各种效果指标的关注程度。

在本发明的一种实施方式中,还包括监控单元,用于在确定用户对各种
效果指标的关注程度之后,对用户关注程度较高的效果指标进行监控。

在本发明的一种实施方式中,所述监控单元包括:

数据点选取子单元,用于选取所述效果指标在预置历史时段的数据点;

拟合子单元,用于根据所选取的数据点,对所述效果指标在预置时段的
变化趋势曲线进行拟合;

效果突变判断子单元,用于获取用户最新的效果指标数据之后,根据该
数据与变化趋势曲线的偏离程度,判断是否发生了效果突变。

本发明实施例所提供的技术方案,首先根据用户首要关注的效果指标类
型对用户进行分类,然后利用回归模型确定用户对每类用户对各种效果指标
的关注程度。应用本发明技术方案,可以针对不同的用户,仅选取其最为关
注的几种效果指标进行监控,对于该用户不关注的指标则不需要进行监控,
从而有效地节省了系统资源。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实
施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面
描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员
来讲,还可以根据这些附图获得其他的附图。

图1为本发明实施例效果类推广信息监控方法的流程图;

图2为本发明实施例对用户进行分类的方法流程图;

图3为本发明实施例对特定效果指标的监控方法流程图;

图4为本发明实施例效果类推广信息监控系统的结构示意图;

图5为本发明实施例效果类推广信息监控系统的第二种结构示意图;

图6为本发明实施例效果类推广信息监控系统的第三种结构示意图。

具体实施方式

首先对本发明实施例所提供的一种效果类推广信息监控方法进行说明,
该方法可以包括以下步骤:

根据用户首要关注的效果指标类型,对用户进行分类;

建立回归模型并初始化,所述模型以用户的效果指标变化情况为自变量,
以用户所属的类别作为应变量;

利用用户在预置时段的数据变化作为样本,分别确定每类用户的自变量
所对应的回归系数;

根据回归系数的大小,确定用户对各种效果指标的关注程度。

上述方法首先根据用户首要关注的效果指标类型对用户进行分类,然后
利用回归模型确定用户对每类用户对各种效果指标的关注程度。应用本发明
技术方案,可以针对不同的用户,仅选取其最为关注的一种或多种效果指标
进行监控,对于该用户不关注的指标则不需要进行监控,从而有效地节省了
系统资源。

为了使本领域技术人员更好地理解本发明中的技术方案,下面将结合本
发明实施例中的附图,对本发明实施例中的技术方案进行详细地描述,显然,
所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本
发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属
于本发明保护的范围。

图1所示,为本发明一种效果类推广信息监控方法的流程图,包括以下
步骤:

S101,根据用户首要关注的效果指标类型,对用户进行分类;

现有的推广信息系统,往往涉及多种效果指标,用户可能会关注其中的
一个或多个,尽管要求每一名用户都上报自己详细关注指标的难度较大,但
是如果仅要求用户只上报一种最为关注的指标,可行性就大大提高了。

推广信息投放平台可以提供一个交互接口,将几个效果指标选项提供给
用户,让用户自行选择,例如,平台提供的选项中包括“展现量、点击量、
消费量、浏览量、成单量”5个选项,则根据用户的选择结果,可以将所有
的用户分为4个大类。

尽管仅要求用户只上报首要关注指标的方式已经有效提高了可行性,但
是考虑到要求所有用户都进行上报在实际执行时仍有困难,本发明实施例还
提供了另一种对用户进行分类的方式,参见图2所示,该方法可以包括以下
步骤:

S101a,预先获得部分用户标注的首要关注效果指标类型;

在实际应用中,可以仅要求一部分用户对自己首要关注的效果指标类型
进行标注,例如,总共有2000名用户,可以要求其中配合度较高的100名优
质用户进行标注。当然,也可以要求2000名用户全部进行标注,尽管有些用
户可能不会反馈,那么后续也可以利用部分用户反馈的内容进行处理。

S101b,根据用户的至少一种属性特征,对用户进行聚类;

根据实际调查发现,具有相似属性特征的用户,在关注指标上也具有较
大的相似性,例如主营汽车行业的商户通常更为关注展现量、主营电子商务
的商户通常更为关注成单量、规模较大的商户通常对消费量(成本)关注程
度较小、小规模客户则相反,等等。基于上述情况,可以先将所有的用户按
照其固有的情况,聚为多个小类,然后对每个聚类的标注信息进行统计,得
到该类别用的首要关注指标。

其中,聚类所依据的属性特征可以包括:客户所在行业、客户的推广信
息数量、客户的消费情况、客户推广信息的展现次数等多个方面,在聚类时,
可以考虑一个特征,也可以考虑多个特征,目的是把具有相似情况的用户划
分到一起。一般来讲,聚类的数量应大于分类的数量,即效果指标的种类数
(在本例中为5)。具体的聚类算法可以根据实际的业务需求进行设计,在
本实施例中不需要详细进行说明。

S101c,在每个聚类中,根据预先获得的部分用户标注信息,确定该聚类
的首要关注指标类型;

在本步骤中,实际上是采用投票的方式,确定各个聚类的首要关注指标
类型。即:在每个聚类中,将具有最多用户标注数的指标,作为该聚类的首
要关注指标。

S101d,根据各个聚类的首要关注指标类型,对多个聚类进行合并。

由于聚类数量大于分类数量(效果指标的种类数),因此在确定各个聚
类的首要关注指标类型后,可以多这些聚类进行合并,在本例中,最终的结
果是把所有的聚类合并为4个用户大类,分别是首要关注展现量、点击量、
消费量、浏览量、成单量的5类用户。

应用S101a-S101d的方法,就可以利用少量用户的标注信息,实现对所
有的用户的分类,并且分类结果大致是准确的。当然,分类完成后,还可以
进一步提分类结果发送给用户,允许用户对分类结果进行修正。例如,一个
用户被自动划分为“关注点击量”类,但是该用户如果发现不符合自己的情
况,可以主动进行修改。

S102,建立回归模型并初始化,所述模型以用户的效果指标变化情况为
自变量,以用户所属的类别作为应变量;

利用用户的首要关注指标,对所有用户进行初步分类后,将进一步对每
一类用户所关注的细节指标进行分析,本发明实施例利用回归模型来分析用
户所关注的细节指标,回归模型(regression model)是对统计关系进行定量
描述的一种数学模型。从一组样本数据出发,确定变量之间的数学关系式对
这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变
量中找出哪些变量的影响显著、哪些不显著。利用回归模型,可以有效分析
出某一类的用户更关注哪些指标、不关注哪些指标,以便于针对用户更为关
注的指标进行监控。

在本实施例中,利用罗杰斯特回归模型进行分析,罗杰斯特回归模型可
以表示为:

Y = e β 0 + β 1 X 1 + β 2 X 2 + · · · + β m X m 1 + e β 0 + β 1 X 1 + β 2 X 2 + · · · + β m X m ]]>

其中,Y是二值应变量,代表用户是否属于某个类别,在本实施例中,
对于某个特定的类别,以Y=1代表用户属于该类别,以Y=0代表用户不属
于该类别(即其他类别的用户)。

X1~Xm为二值自变量,代表用户在某一历史时段内,是否在某种指标上有
变化情况。例如:展现量是否上升、展现量是否下降、展现量是否上升、展
现量是否上升。在本实施例中,以X=1代表“是”,以X=0代表“否”。

β1~βm为X1~Xm的对应权重系数,每个β值越高,代表所对应的指标越被
该类用户所关注。在本实施例中,就是利用数据作为样本,通过回归计算得
到β1~βm,从而确定用户对各种效果指标的关注程度。β0为常数,在本实施
例中不具有实际含义。代表展现量

仍以前面的例子进行说明,对于展现量、点击量、消费量、浏览量、成
单量5个指标,假设以Y1代表展现量、X1~X10分别代表展现量上升、展现量
下降、点击量上升、点击量下降、消费上升、消费下降、浏览量上升、浏览
量下降、成单量上升、成单量下降10个效果变化情况,则可以得到一个关于
Y1和X1~X10的等式。类似地,分别以Y2~Y5代表点击量、消费量、浏览量、成
单量4个大类,X1~X10含义不变可以得到另外4个等式。

S103,利用用户在预置时段的数据变化作为样本,分别确定每类用户的
自变量所对应的回归系数;

建立回归模型后,选取在一段历史时期的数据作为样本,分别求解每一
大类的系数β1~βm,例如,对于“展现量”大类,假如一名用户属于该大类,
则Y1=1,如果属于其他4类,则Y1=0,X1~X10则根据在这段历史时期的数据
实际变化情况来确定,假设共有2000名用户,就可以得到2000个样本,利
用这2000个样本(根据实际需求,也可以只选择部分样本)构成方程组求解
β1~βm。

S104,根据回归系数的大小,确定用户对各种效果指标的关注程度。

求解得到Y1对应的β1~βm后即可得到“展现量”用户对各种指标的关注程
度,例如,求解得到“点击量上升”、“消费量下降”的权重最高,则表示
这类用户所追求的效果是点击量高且消费低。

类似地,可以分别求解得到Y2~Y5对应的β1~βm,从而分别得到点击量、
消费量、浏览量、成单量4个大类的用户对各个指标的具体关注程度,从而
便于系统后续有针对性地进行监控。

有些情况下,计算出的各个系数值可能差距并不明显,从而难以区分用
户对几个指标的关注程度,这种情况下,可以进一步引入用户在指定历史时
段的一些操作行为作为模型的自变量,例如,进一步增加预算升高、预算下
降、出价提高、出价降低、扩大流量、缩小流量等操作行为作为自变量。由
于这些操作行为是用户主观执行的,是用户的主观意愿的体现,每种操作行
为在理论上都会对应一种指标变化,因此,在效果变化不明显的情况下,根
据用户的行为,也可以在一定程度上了解到这类用户对各种指标的关注情况。
例如,理论上存在“预算-消费量”、“流量-展现量”、“出价-点击”
的对应关系,那么如果“增加流量”的权重较高,则说明该类用户所追求的
效果的是展现量增加。

确定用户对各种效果指标的关注程度之后,可以针对不同的用户,仅选
取其最为关注的一种或多种效果指标进行监控,对于该用户不关注的指标则
不需要进行监控,在本发明的另一个实施例中,还进一步提供了对特定效果
指标的监控方法,参见图3所示,该方法可以包括以下步骤:

S201,选取效果指标在预置历史时段的数据点;

对于特定的效果指标,可以选择最近一段时间(例如1个月、2个月)
的数据点,以时间点做为横坐标,其中,可以利用决策树模型判断不同用户
观察效果的不同粒度,利用用户的操作行为,如:登录推广信息投放平台频
率、操作频率等,确定用户关注的时间粒度,如:分钟、小时、天等。进一
步,可以用K均值聚类模型学习出第一次分类时被分为同一类的用户所关注
的时间跨度,例如在“天”级别的粒度下,是“1天”还是“2天”。

在该步骤中,还可以预先去除一些噪音点,方法如下:

设某一用户的效果指标为随机变量X,

则其过去n天均值为: μ = Σ i = 1 n X i n ]]>

标准差为: ρ = Σ i = 1 n ( X i - μ ) 2 n ]]>

定义用户时间粒度为“天”,时间跨度为1天,则当Xi<u-k*ρ或
Xi>u+k*ρ时,认为第i天有突变,其中对于上述突变定义,n和k是可以配
置的值:考虑到效果指标的自然增长和其他变化因素,n不宜过大;k=3时,
只要Xi仍然服从效果指标的分布,落在u±3*ρ的概率为99.5%左右,所以如
果超出了这个范围,基本可以认为是突变,这些数据点可以当做噪音点预先
去除。

S202,根据所选取的数据点,对所述效果指标在预置时段的变化趋势曲
线进行拟合;

将S201所选取的数据点作为输入,对输入点新进行一元线性回归,求
解效果指标在时间轴上的趋势。

一元线性回归表达式为:yi=a·xi+b

通过最小二乘法求解Q:

Q = Σ ( y i - y i ^ ) 2 = Σ [ y i - ( a + b · x i ) ] 2 ]]>

可得:

b = Σ ( x - x ) · ( y - y ) Σ ( x - x ) 2 = Σx · y - Σx · Σy / n Σ x 2 - ( Σx ) 2 / n = l xy l xx ]]>

a = y - b · x = Σy n - b · Σx n ]]>

S203,获取用户最新的效果指标数据之后,根据该数据与变化趋势曲线
的偏离程度,判断是否发生了效果突变。

求解出效果指标的线性回归方程yi=a·xi+b后,可以求解数据分布的带宽
W,W要保证一定比例(例如90%)以上的真实数据分布在带宽中,既
则yi=a·xi+b拟合的是效果指标数据分布的趋势,W则为用户
可容忍的幅度带宽。获得用户最新的效果指标数据之后,根据变化趋势曲线
判断该数据是落在否在带宽W之内,如果没有,则认为发生了突变,此时可
以对用户发出相应的提示信息。

相应于上面的方法实施例,本发明还提供一种效果类推广信息监控系统,
参见图4所示,该系统包括:

用户分类单元410,用于根据用户首要关注的效果指标类型,对用户进
行分类;

模型初始化单元420,用于建立回归模型并初始化,所述模型以用户的
效果指标变化情况为自变量,以用户所属的类别作为应变量;

系数确定单元430,用于利用用户在预置时段的数据变化作为样本,分
别确定每类用户的自变量所对应的回归系数;

关注程度确定单元440,用于根据回归系数的大小,确定用户对各种效
果指标的关注程度。

在本发明的一种实施方式中,所述回归模型的自变量还可以包括用户的
操作行为。相应地,所述关注程度确定单元440具体可以用于:确定各种用
户操作行为的回归系数之后,根据操作行为与指标效果变化的理论对应关系,
确定用户对各种效果指标的关注程度。

在本发明的一种实施方式中,所述单元用户分类单元410具体可以包括:

标注信息获得子单元,用于预先获得部分用户标注的首要关注效果指标
类型;

聚类子单元,用于根据用户的至少一种属性特征,对用户进行聚类;

聚类类型确定子单元,用于在每个聚类中,根据预先获得的部分用户标
注信息,确定该聚类的首要关注指标类型;

聚类合并子单元,用于根据各个聚类的首要关注指标类型,对多个聚类
进行合并。

参见图5所示,本发明所提供的效果类推广信息监控系统,还可以进一
步包括:

分类结果修正单元450,用于在对用户进行分类之后,将分类结果发送
给用户,允许用户对分类结果进行修正。

应用上述系统,可以针对不同的用户,仅选取其最为关注的一种或多种
效果指标进行监控,对于该用户不关注的指标则不需要进行监控,从而有效
地节省了系统资源。

参见图6所示,本发明所提供的效果类推广信息监控系统,还可以进一
步包括:

监控单元460,用于在确定用户对各种效果指标的关注程度之后,对用
户关注程度较高的效果指标进行监控。

其中,所述监控单元具体可以包括:

数据点选取子单元,用于选取所述效果指标在预置历史时段的数据点;

拟合子单元,用于根据所选取的数据点,对所述效果指标在预置时段的
变化趋势曲线进行拟合;

效果突变判断子单元,用于获取用户最新的效果指标数据之后,根据该
数据与变化趋势曲线的偏离程度,判断是否发生了效果突变。

为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,
在实施本发明时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到
本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,
本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品
的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、
磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,
服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所
述的方法。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同
相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同
之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,
所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描
述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元
可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可
以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。
可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目
的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

本发明可用于众多通用或专用的计算系统环境或配置中。例如:个人计
算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、
基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算
机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。

本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,
例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类
型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中
实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处
理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备
在内的本地和远程计算机存储介质中。

以上所述仅是本发明的具体实施方式,应当指出,对于本技术领域的普
通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润
饰,这些改进和润饰也应视为本发明的保护范围。

效果类推广信息监控方法及系统.pdf_第1页
第1页 / 共15页
效果类推广信息监控方法及系统.pdf_第2页
第2页 / 共15页
效果类推广信息监控方法及系统.pdf_第3页
第3页 / 共15页
点击查看更多>>
资源描述

《效果类推广信息监控方法及系统.pdf》由会员分享,可在线阅读,更多相关《效果类推广信息监控方法及系统.pdf(15页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 102609527 A (43)申请公布日 2012.07.25 C N 1 0 2 6 0 9 5 2 7 A *CN102609527A* (21)申请号 201210031315.3 (22)申请日 2012.02.13 G06F 17/30(2006.01) (71)申请人百度在线网络技术(北京)有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦 (72)发明人马群 徐惠 余昌远 徐勇明 卢佳 (74)专利代理机构深圳市威世博知识产权代理 事务所(普通合伙) 44280 代理人何青瓦 李庆波 (54) 发明名称 效果类推广信息监控方法及系统 (。

2、57) 摘要 本发明公开了一种效果类推广信息监控方法 及系统。一种效果类推广信息监控方法包括:根 据用户首要关注的效果指标类型,对用户进行分 类;建立回归模型并初始化,所述模型以用户的 效果指标变化情况为自变量,以用户所属的类别 作为应变量;利用用户在预置时段的数据变化作 为样本,分别确定每类用户的自变量所对应的回 归系数;根据回归系数的大小,确定用户对各种 效果指标的关注程度。应用上述方案,可以针对不 同的用户,仅选取其最为关注的几种效果指标进 行监控,对于该用户不关注的指标则不需要进行 监控,从而有效地节省了系统资源。 (51)Int.Cl. 权利要求书2页 说明书9页 附图3页 (19)。

3、中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 2 页 说明书 9 页 附图 3 页 1/2页 2 1.一种效果类推广信息监控方法,其特征在于,包括: 根据用户首要关注的效果指标类型,对用户进行分类; 建立回归模型并初始化,所述模型以用户的效果指标变化情况为自变量,以用户所属 的类别作为应变量; 利用用户在预置时段的数据变化作为样本,分别确定每类用户的自变量所对应的回归 系数; 根据回归系数的大小,确定用户对各种效果指标的关注程度。 2.根据权利要求1所述的方法,其特征在于,所述根据用户首要关注的效果指标类型, 对用户进行分类,包括: 预先获得部分用户标注的首要关注效果指标类型。

4、; 根据用户的至少一种属性特征,对用户进行聚类; 在每个聚类中,根据预先获得的部分用户标注信息,确定该聚类的首要关注指标类 型; 根据各个聚类的首要关注指标类型,对多个聚类进行合并。 3.根据权利要求2所述的方法,其特征在于,在对用户进行分类之后,还包括: 将分类结果发送给用户,允许用户对分类结果进行修正。 4.根据权利要求1所述的方法,其特征在于,所述回归模型的自变量还包括用户的操 作行为。 5.根据权利要求4所述的方法,其特征在于,所述根据回归系数的大小,确定用户对各 种效果指标的关注程度,包括: 确定各种用户操作行为的回归系数之后,根据操作行为与指标效果变化的理论对应关 系,确定用户对各。

5、种效果指标的关注程度。 6.根据权利要求1-5任一项所述的方法,其特征在于,确定用户对各种效果指标的关 注程度,还包括:对用户关注程度较高的效果指标进行监控。 7.根据权利要求6所述的方法,其特征在于,所述对效果指标监控方法包括: 选取所述效果指标在预置历史时段的数据点; 根据所选取的数据点,对所述效果指标在预置时段的变化趋势曲线进行拟合; 获取用户最新的效果指标数据之后,根据该数据与变化趋势曲线的偏离程度,判断是 否发生了效果突变。 8.一种效果类推广信息监控系统,其特征在于,包括: 用户分类单元,用于根据用户首要关注的效果指标类型,对用户进行分类; 模型初始化单元,用于建立回归模型并初始化。

6、,所述模型以用户的效果指标变化情况 为自变量,以用户所属的类别作为应变量; 系数确定单元,用于利用用户在预置时段的数据变化作为样本,分别确定每类用户的 自变量所对应的回归系数; 关注程度确定单元,用于根据回归系数的大小,确定用户对各种效果指标的关注程度。 9.根据权利要求8所述的系统,其特征在于,所述用户分类单元包括: 标注信息获得子单元,用于预先获得部分用户标注的首要关注效果指标类型; 聚类子单元,用于根据用户的至少一种属性特征,对用户进行聚类; 权 利 要 求 书CN 102609527 A 2/2页 3 聚类类型确定子单元,用于在每个聚类中,根据预先获得的部分用户标注信息,确定该 聚类的。

7、首要关注指标类型; 聚类合并子单元,用于根据各个聚类的首要关注指标类型,对多个聚类进行合并。 10.根据权利要求9所述的系统,其特征在于,还包括: 分类结果修正单元,用于在对用户进行分类之后,将分类结果发送给用户,允许用户对 分类结果进行修正。 11.根据权利要求8所述的系统,其特征在于,所述回归模型的自变量还包括用户的操 作行为。 12.根据权利要求11所述的系统,其特征在于,所述关注程度确定单元具体用于: 确定各种用户操作行为的回归系数之后,根据操作行为与指标效果变化的理论对应关 系,确定用户对各种效果指标的关注程度。 13.根据权利要求8-12任一项所述的系统,其特征在于,还包括监控单元。

8、,用于在确定 用户对各种效果指标的关注程度之后,对用户关注程度较高的效果指标进行监控。 14.根据权利要求13所述的系统,其特征在于,所述监控单元包括: 数据点选取子单元,用于选取所述效果指标在预置历史时段的数据点; 拟合子单元,用于根据所选取的数据点,对所述效果指标在预置时段的变化趋势曲线 进行拟合; 效果突变判断子单元,用于获取用户最新的效果指标数据之后,根据该数据与变化趋 势曲线的偏离程度,判断是否发生了效果突变。 权 利 要 求 书CN 102609527 A 1/9页 4 效果类推广信息监控方法及系统 技术领域 0001 本发明涉及计算机应用技术领域,特别是涉及效果类推广信息监控方法。

9、及系统。 背景技术 0002 信息推广是指通过一定形式的媒体,向公众传递信息的宣传手段。对于商家而言, 信息推广是一种重要营销手段。传统的推广信息模式包括电视推广信息和平面推广信息 等,商家投放的推广信息样式固定,投入的推广资金固定,而信息推广效果和直接收益都无 法衡量。此外,传统推广信息模式受单向媒体的局限性的影响,难以形成与接受方的互动, 通常为获得第一手的信息资料也是通过调查问卷或线下活动完成,具有信息面窄、成本过 高等缺点 0003 随着互联网的发展,互联网上的效果类推广信息越来越受到商家的青睐。作为一 种新兴的营销模式,效果类推广信息与传统推广信息模式不同。由于互联网属于双向媒体, 。

10、商家可以和推广信息投放平台实时交互,随时根据情况增减资金投入、修改推广信息样式。 同时商家所投放的推广信息和消费者有良好的交互,可以直接度量推广信息投放的效果和 收益,根据投放效果和收益再实时的优化资金投入和推广信息样式等方面,从而达到最佳 的营销效果。 0004 随着效果类推广信息投放平台功能的不断发展,效果类推广信息涉及的效果指标 也越来越多,例如点击量、展现量等等,从平台侧而言,希望能够了解用户更关注哪些指标, 并对这些指标予以监控。但是在实际应用中,要求每一名用户都上报自己详细的关注指标 并不现实,更何况有些没有投放经验的用户可能并不清楚自己实际应该关注哪些具体指 标。如果要对所有的指。

11、标都进行监控,对于不同的用户,总会有一部分监控结果是没有实际 意义的,造成系统资源的严重浪费。 发明内容 0005 为解决上述技术问题,本发明实施例提供一种效果类推广信息监控方法及系统, 能够根据用户的实际情况,自动分析其关注的指标类型,并对该类型的指标进行监控,主要 技术方案如下: 0006 本发明实施例提供一种效果类推广信息监控方法,包括: 0007 根据用户首要关注的效果指标类型,对用户进行分类; 0008 建立回归模型并初始化,所述模型以用户的效果指标变化情况为自变量,以用户 所属的类别作为应变量; 0009 利用用户在预置时段的数据变化作为样本,分别确定每类用户的自变量所对应的 回归。

12、系数; 0010 根据回归系数的大小,确定用户对各种效果指标的关注程度。 0011 在本发明的一种实施方式中,所述根据用户首要关注的效果指标类型,对用户进 行分类,包括: 说 明 书CN 102609527 A 2/9页 5 0012 预先获得部分用户标注的首要关注效果指标类型; 0013 根据用户的至少一种属性特征,对用户进行聚类; 0014 在每个聚类中,根据预先获得的部分用户标注信息,确定该聚类的首要关注指标 类型; 0015 根据各个聚类的首要关注指标类型,对多个聚类进行合并。 0016 在本发明的一种实施方式中,在对用户进行分类之后,还包括: 0017 将分类结果发送给用户,允许用户。

13、对分类结果进行修正。 0018 在本发明的一种实施方式中,所述回归模型的自变量还包括用户的操作行为。 0019 在本发明的一种实施方式中,所述根据回归系数的大小,确定用户对各种效果指 标的关注程度,包括: 0020 确定各种用户操作行为的回归系数之后,根据操作行为与指标效果变化的理论对 应关系,确定用户对各种效果指标的关注程度。 0021 在本发明的一种实施方式中,确定用户对各种效果指标的关注程度,还包括:对用 户关注程度较高的效果指标进行监控。 0022 在本发明的一种实施方式中,所述对效果指标监控方法包括: 0023 选取所述效果指标在预置历史时段的数据点; 0024 根据所选取的数据点,。

14、对所述效果指标在预置时段的变化趋势曲线进行拟合; 0025 获取用户最新的效果指标数据之后,根据该数据与变化趋势曲线的偏离程度,判 断是否发生了效果突变。 0026 本发明实施例提供一种效果类推广信息监控系统,包括: 0027 用户分类单元,用于根据用户首要关注的效果指标类型,对用户进行分类; 0028 模型初始化单元,用于建立回归模型并初始化,所述模型以用户的效果指标变化 情况为自变量,以用户所属的类别作为应变量; 0029 系数确定单元,用于利用用户在预置时段的数据变化作为样本,分别确定每类用 户的自变量所对应的回归系数; 0030 关注程度确定单元,用于根据回归系数的大小,确定用户对各种。

15、效果指标的关注 程度。 0031 在本发明的一种实施方式中,所述用户分类单元包括: 0032 标注信息获得子单元,用于预先获得部分用户标注的首要关注效果指标类型; 0033 聚类子单元,用于根据用户的至少一种属性特征,对用户进行聚类; 0034 聚类类型确定子单元,用于在每个聚类中,根据预先获得的部分用户标注信息,确 定该聚类的首要关注指标类型; 0035 聚类合并子单元,用于根据各个聚类的首要关注指标类型,对多个聚类进行合并。 0036 在本发明的一种实施方式中,还包括: 0037 分类结果修正单元,用于在对用户进行分类之后,将分类结果发送给用户,允许用 户对分类结果进行修正。 0038 在。

16、本发明的一种实施方式中,所述回归模型的自变量还包括用户的操作行为。 0039 在本发明的一种实施方式中,所述关注程度确定单元具体用于: 0040 确定各种用户操作行为的回归系数之后,根据操作行为与指标效果变化的理论对 说 明 书CN 102609527 A 3/9页 6 应关系,确定用户对各种效果指标的关注程度。 0041 在本发明的一种实施方式中,还包括监控单元,用于在确定用户对各种效果指标 的关注程度之后,对用户关注程度较高的效果指标进行监控。 0042 在本发明的一种实施方式中,所述监控单元包括: 0043 数据点选取子单元,用于选取所述效果指标在预置历史时段的数据点; 0044 拟合子。

17、单元,用于根据所选取的数据点,对所述效果指标在预置时段的变化趋势 曲线进行拟合; 0045 效果突变判断子单元,用于获取用户最新的效果指标数据之后,根据该数据与变 化趋势曲线的偏离程度,判断是否发生了效果突变。 0046 本发明实施例所提供的技术方案,首先根据用户首要关注的效果指标类型对用户 进行分类,然后利用回归模型确定用户对每类用户对各种效果指标的关注程度。应用本发 明技术方案,可以针对不同的用户,仅选取其最为关注的几种效果指标进行监控,对于该用 户不关注的指标则不需要进行监控,从而有效地节省了系统资源。 附图说明 0047 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施。

18、例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他 的附图。 0048 图1为本发明实施例效果类推广信息监控方法的流程图; 0049 图2为本发明实施例对用户进行分类的方法流程图; 0050 图3为本发明实施例对特定效果指标的监控方法流程图; 0051 图4为本发明实施例效果类推广信息监控系统的结构示意图; 0052 图5为本发明实施例效果类推广信息监控系统的第二种结构示意图; 0053 图6为本发明实施例效果类推广信息监控系统的第三种结构示意图。 具体实施方式 0054 首先对。

19、本发明实施例所提供的一种效果类推广信息监控方法进行说明,该方法可 以包括以下步骤: 0055 根据用户首要关注的效果指标类型,对用户进行分类; 0056 建立回归模型并初始化,所述模型以用户的效果指标变化情况为自变量,以用户 所属的类别作为应变量; 0057 利用用户在预置时段的数据变化作为样本,分别确定每类用户的自变量所对应的 回归系数; 0058 根据回归系数的大小,确定用户对各种效果指标的关注程度。 0059 上述方法首先根据用户首要关注的效果指标类型对用户进行分类,然后利用回归 模型确定用户对每类用户对各种效果指标的关注程度。应用本发明技术方案,可以针对不 同的用户,仅选取其最为关注的。

20、一种或多种效果指标进行监控,对于该用户不关注的指标 则不需要进行监控,从而有效地节省了系统资源。 说 明 书CN 102609527 A 4/9页 7 0060 为了使本领域技术人员更好地理解本发明中的技术方案,下面将结合本发明实施 例中的附图,对本发明实施例中的技术方案进行详细地描述,显然,所描述的实施例仅仅是 本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员 所获得的所有其他实施例,都应当属于本发明保护的范围。 0061 图1所示,为本发明一种效果类推广信息监控方法的流程图,包括以下步骤: 0062 S101,根据用户首要关注的效果指标类型,对用户进行分类;。

21、 0063 现有的推广信息系统,往往涉及多种效果指标,用户可能会关注其中的一个或多 个,尽管要求每一名用户都上报自己详细关注指标的难度较大,但是如果仅要求用户只上 报一种最为关注的指标,可行性就大大提高了。 0064 推广信息投放平台可以提供一个交互接口,将几个效果指标选项提供给用户,让 用户自行选择,例如,平台提供的选项中包括“展现量、点击量、消费量、浏览量、成单量”5个 选项,则根据用户的选择结果,可以将所有的用户分为4个大类。 0065 尽管仅要求用户只上报首要关注指标的方式已经有效提高了可行性,但是考虑到 要求所有用户都进行上报在实际执行时仍有困难,本发明实施例还提供了另一种对用户进 。

22、行分类的方式,参见图2所示,该方法可以包括以下步骤: 0066 S101a,预先获得部分用户标注的首要关注效果指标类型; 0067 在实际应用中,可以仅要求一部分用户对自己首要关注的效果指标类型进行标 注,例如,总共有2000名用户,可以要求其中配合度较高的100名优质用户进行标注。当然, 也可以要求2000名用户全部进行标注,尽管有些用户可能不会反馈,那么后续也可以利用 部分用户反馈的内容进行处理。 0068 S101b,根据用户的至少一种属性特征,对用户进行聚类; 0069 根据实际调查发现,具有相似属性特征的用户,在关注指标上也具有较大的相似 性,例如主营汽车行业的商户通常更为关注展现量。

23、、主营电子商务的商户通常更为关注成 单量、规模较大的商户通常对消费量(成本)关注程度较小、小规模客户则相反,等等。基 于上述情况,可以先将所有的用户按照其固有的情况,聚为多个小类,然后对每个聚类的标 注信息进行统计,得到该类别用的首要关注指标。 0070 其中,聚类所依据的属性特征可以包括:客户所在行业、客户的推广信息数量、客 户的消费情况、客户推广信息的展现次数等多个方面,在聚类时,可以考虑一个特征,也可 以考虑多个特征,目的是把具有相似情况的用户划分到一起。一般来讲,聚类的数量应大于 分类的数量,即效果指标的种类数(在本例中为5)。具体的聚类算法可以根据实际的业务 需求进行设计,在本实施例。

24、中不需要详细进行说明。 0071 S101c,在每个聚类中,根据预先获得的部分用户标注信息,确定该聚类的首要关 注指标类型; 0072 在本步骤中,实际上是采用投票的方式,确定各个聚类的首要关注指标类型。即: 在每个聚类中,将具有最多用户标注数的指标,作为该聚类的首要关注指标。 0073 S101d,根据各个聚类的首要关注指标类型,对多个聚类进行合并。 0074 由于聚类数量大于分类数量(效果指标的种类数),因此在确定各个聚类的首要 关注指标类型后,可以多这些聚类进行合并,在本例中,最终的结果是把所有的聚类合并为 4个用户大类,分别是首要关注展现量、点击量、消费量、浏览量、成单量的5类用户。 。

25、说 明 书CN 102609527 A 5/9页 8 0075 应用S101a-S101d的方法,就可以利用少量用户的标注信息,实现对所有的用户 的分类,并且分类结果大致是准确的。当然,分类完成后,还可以进一步提分类结果发送给 用户,允许用户对分类结果进行修正。例如,一个用户被自动划分为“关注点击量”类,但是 该用户如果发现不符合自己的情况,可以主动进行修改。 0076 S102,建立回归模型并初始化,所述模型以用户的效果指标变化情况为自变量,以 用户所属的类别作为应变量; 0077 利用用户的首要关注指标,对所有用户进行初步分类后,将进一步对每一类用户 所关注的细节指标进行分析,本发明实施例。

26、利用回归模型来分析用户所关注的细节指标, 回归模型(regression model)是对统计关系进行定量描述的一种数学模型。从一组样本 数据出发,确定变量之间的数学关系式对这些关系式的可信程度进行各种统计检验,并从 影响某一特定变量的诸多变量中找出哪些变量的影响显著、哪些不显著。利用回归模型,可 以有效分析出某一类的用户更关注哪些指标、不关注哪些指标,以便于针对用户更为关注 的指标进行监控。 0078 在本实施例中,利用罗杰斯特回归模型进行分析,罗杰斯特回归模型可以表示 为: 0079 0080 其中,Y是二值应变量,代表用户是否属于某个类别,在本实施例中,对于某个特定 的类别,以Y1代表用。

27、户属于该类别,以Y0代表用户不属于该类别(即其他类别的用 户)。 0081 X 1 X m 为二值自变量,代表用户在某一历史时段内,是否在某种指标上有变化情 况。例如:展现量是否上升、展现量是否下降、展现量是否上升、展现量是否上升。在本实施 例中,以X1代表“是”,以X0代表“否”。 0082 1 m 为X 1 X m 的对应权重系数,每个值越高,代表所对应的指标越被该 类用户所关注。在本实施例中,就是利用数据作为样本,通过回归计算得到 1 m ,从而 确定用户对各种效果指标的关注程度。 0 为常数,在本实施例中不具有实际含义。代表展 现量 0083 仍以前面的例子进行说明,对于展现量、点击量。

28、、消费量、浏览量、成单量5个指 标,假设以Y 1 代表展现量、X 1 X 10 分别代表展现量上升、展现量下降、点击量上升、点击量 下降、消费上升、消费下降、浏览量上升、浏览量下降、成单量上升、成单量下降10个效果变 化情况,则可以得到一个关于Y 1 和X 1 X 10 的等式。类似地,分别以Y 2 Y 5 代表点击量、消 费量、浏览量、成单量4个大类,X 1 X 10 含义不变可以得到另外4个等式。 0084 S103,利用用户在预置时段的数据变化作为样本,分别确定每类用户的自变量所 对应的回归系数; 0085 建立回归模型后,选取在一段历史时期的数据作为样本,分别求解每一大类的系 数 1 。

29、m ,例如,对于“展现量”大类,假如一名用户属于该大类,则Y 1 1,如果属于其 他4类,则Y 1 0,X 1 X 10 则根据在这段历史时期的数据实际变化情况来确定,假设共有 2000名用户,就可以得到2000个样本,利用这2000个样本(根据实际需求,也可以只选择 部分样本)构成方程组求解 1 m 。 说 明 书CN 102609527 A 6/9页 9 0086 S104,根据回归系数的大小,确定用户对各种效果指标的关注程度。 0087 求解得到Y 1 对应的 1 m 后即可得到“展现量”用户对各种指标的关注程度, 例如,求解得到“点击量上升”、“消费量下降”的权重最高,则表示这类用户所。

30、追求的效果是 点击量高且消费低。 0088 类似地,可以分别求解得到Y 2 Y 5 对应的 1 m ,从而分别得到点击量、消费 量、浏览量、成单量4个大类的用户对各个指标的具体关注程度,从而便于系统后续有针对 性地进行监控。 0089 有些情况下,计算出的各个系数值可能差距并不明显,从而难以区分用户对几个 指标的关注程度,这种情况下,可以进一步引入用户在指定历史时段的一些操作行为作为 模型的自变量,例如,进一步增加预算升高、预算下降、出价提高、出价降低、扩大流量、缩小 流量等操作行为作为自变量。由于这些操作行为是用户主观执行的,是用户的主观意愿的 体现,每种操作行为在理论上都会对应一种指标变化。

31、,因此,在效果变化不明显的情况下, 根据用户的行为,也可以在一定程度上了解到这类用户对各种指标的关注情况。例如,理论 上存在“预算-消费量”、“流量-展现量”、“出价-点击”的对应关系,那么如果“增加流量” 的权重较高,则说明该类用户所追求的效果的是展现量增加。 0090 确定用户对各种效果指标的关注程度之后,可以针对不同的用户,仅选取其最为 关注的一种或多种效果指标进行监控,对于该用户不关注的指标则不需要进行监控,在本 发明的另一个实施例中,还进一步提供了对特定效果指标的监控方法,参见图3所示,该方 法可以包括以下步骤: 0091 S201,选取效果指标在预置历史时段的数据点; 0092 对。

32、于特定的效果指标,可以选择最近一段时间(例如1个月、2个月)的数据点, 以时间点做为横坐标,其中,可以利用决策树模型判断不同用户观察效果的不同粒度,利用 用户的操作行为,如:登录推广信息投放平台频率、操作频率等,确定用户关注的时间粒度, 如:分钟、小时、天等。进一步,可以用K均值聚类模型学习出第一次分类时被分为同一类的 用户所关注的时间跨度,例如在“天”级别的粒度下,是“1天”还是“2天”。 0093 在该步骤中,还可以预先去除一些噪音点,方法如下: 0094 设某一用户的效果指标为随机变量X, 0095 则其过去n天均值为: 0096 标准差为: 0097 定义用户时间粒度为“天”,时间跨度。

33、为1天,则当X i u-k*或X i u+k* 时,认为第i天有突变,其中对于上述突变定义,n和k是可以配置的值:考虑到效果指标的 自然增长和其他变化因素,n不宜过大;k3时,只要X i 仍然服从效果指标的分布,落在 u3*的概率为99.5左右,所以如果超出了这个范围,基本可以认为是突变,这些数据 点可以当做噪音点预先去除。 0098 S202,根据所选取的数据点,对所述效果指标在预置时段的变化趋势曲线进行拟 说 明 书CN 102609527 A 7/9页 10 合; 0099 将S201所选取的数据点作为输入,对输入点新进行一元线性回归,求解效果指标 在时间轴上的趋势。 0100 一元线性。

34、回归表达式为:y i ax i +b 0101 通过最小二乘法求解Q: 0102 0103 可得: 0104 0105 0106 S203,获取用户最新的效果指标数据之后,根据该数据与变化趋势曲线的偏离程 度,判断是否发生了效果突变。 0107 求解出效果指标的线性回归方程y i ax i +b后,可以求解数据分布的带宽W,W 要保证一定比例(例如90)以上的真实数据分布在带宽中,既则y i ax i +b拟合的是效果指标数据分布的趋势,W则为用户可容忍的幅度带宽。获得用户最新 的效果指标数据之后,根据变化趋势曲线判断该数据是落在否在带宽W之内,如果没有,则 认为发生了突变,此时可以对用户发出。

35、相应的提示信息。 0108 相应于上面的方法实施例,本发明还提供一种效果类推广信息监控系统,参见图4 所示,该系统包括: 0109 用户分类单元410,用于根据用户首要关注的效果指标类型,对用户进行分类; 0110 模型初始化单元420,用于建立回归模型并初始化,所述模型以用户的效果指标变 化情况为自变量,以用户所属的类别作为应变量; 0111 系数确定单元430,用于利用用户在预置时段的数据变化作为样本,分别确定每类 用户的自变量所对应的回归系数; 0112 关注程度确定单元440,用于根据回归系数的大小,确定用户对各种效果指标的关 注程度。 0113 在本发明的一种实施方式中,所述回归模型。

36、的自变量还可以包括用户的操作行 为。相应地,所述关注程度确定单元440具体可以用于:确定各种用户操作行为的回归系数 之后,根据操作行为与指标效果变化的理论对应关系,确定用户对各种效果指标的关注程 度。 0114 在本发明的一种实施方式中,所述单元用户分类单元410具体可以包括: 0115 标注信息获得子单元,用于预先获得部分用户标注的首要关注效果指标类型; 0116 聚类子单元,用于根据用户的至少一种属性特征,对用户进行聚类; 0117 聚类类型确定子单元,用于在每个聚类中,根据预先获得的部分用户标注信息,确 定该聚类的首要关注指标类型; 0118 聚类合并子单元,用于根据各个聚类的首要关注指。

37、标类型,对多个聚类进行合并。 0119 参见图5所示,本发明所提供的效果类推广信息监控系统,还可以进一步包括: 说 明 书CN 102609527 A 10 8/9页 11 0120 分类结果修正单元450,用于在对用户进行分类之后,将分类结果发送给用户,允 许用户对分类结果进行修正。 0121 应用上述系统,可以针对不同的用户,仅选取其最为关注的一种或多种效果指标 进行监控,对于该用户不关注的指标则不需要进行监控,从而有效地节省了系统资源。 0122 参见图6所示,本发明所提供的效果类推广信息监控系统,还可以进一步包括: 0123 监控单元460,用于在确定用户对各种效果指标的关注程度之后,。

38、对用户关注程度 较高的效果指标进行监控。 0124 其中,所述监控单元具体可以包括: 0125 数据点选取子单元,用于选取所述效果指标在预置历史时段的数据点; 0126 拟合子单元,用于根据所选取的数据点,对所述效果指标在预置时段的变化趋势 曲线进行拟合; 0127 效果突变判断子单元,用于获取用户最新的效果指标数据之后,根据该数据与变 化趋势曲线的偏离程度,判断是否发生了效果突变。 0128 为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本 发明时可以把各单元的功能在同一个或多个软件和/或硬件中实现。 0129 通过以上的实施方式的描述可知,本领域的技术人员可以清楚地。

39、了解到本发明可 借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质 上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品 可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备 (可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些 部分所述的方法。 0130 本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部 分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或 系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之。

40、处参见方法 实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为 分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或 者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根 据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术 人员在不付出创造性劳动的情况下,即可以理解并实施。 0131 本发明可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务 器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶 盒、可编程的消费电子设备、网络PC、小型计算机。

41、、大型计算机、包括以上任何系统或设备的 分布式计算环境等等。 0132 本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序 模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组 件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由 通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以 位于包括存储设备在内的本地和远程计算机存储介质中。 0133 以上所述仅是本发明的具体实施方式,应当指出,对于本技术领域的普通技术人 说 明 书CN 102609527 A 11 9/9页 12 员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应 视为本发明的保护范围。 说 明 书CN 102609527 A 12 1/3页 13 图1 图2 说 明 书 附 图CN 102609527 A 13 2/3页 14 图3 图4 图5 说 明 书 附 图CN 102609527 A 14 3/3页 15 图6 说 明 书 附 图CN 102609527 A 15 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1