一种用于电子商务中商品推荐列表的生成方法及生成系统.pdf

上传人:32 文档编号:6098983 上传时间:2019-04-11 格式:PDF 页数:13 大小:867.82KB
返回 下载 相关 举报
摘要
申请专利号:

CN201510268039.6

申请日:

2015.05.22

公开号:

CN106296242A

公开日:

2017.01.04

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):G06Q 30/02申请日:20150522|||公开

IPC分类号:

G06Q30/02(2012.01)I

主分类号:

G06Q30/02

申请人:

苏宁云商集团股份有限公司

发明人:

陈雪峰; 孙奉海; 张侦; 刘勇

地址:

210042 江苏省南京市玄武区苏宁大道1号苏宁总部

优先权:

专利代理机构:

江苏圣典律师事务所 32237

代理人:

许峰

PDF下载: PDF下载
内容摘要

本发明公开了一种用于电子商务中商品推荐列表的生成方法,该方法包括以下步骤:S11采集用户的特征数据,并将各终端数据融合,得到融合后的实时预测特征向量;S12计算行为商品的购买概率;S13对S12得到的行为商品的购买概率进行修正,得到融合后的行为商品的购买概率;S14根据修正后的行为商品的购买概率,测算相似相关商品的购买概率,并按照购买率大小排序,生成商品推荐列表。同时还公开了一种用于电子商务中商品推荐列表的生成系统。该生产方法和生产系统能够提高商品推荐列表的预测精度。

权利要求书

1.一种用于电子商务中商品推荐列表的生成方法,其特征在于,该方法包括
以下步骤:
S11采集用户的特征数据,并将各终端数据特征融合,得到融合后的实时预
测特征向量;
S12计算行为商品的购买概率;
S13对S12得到的行为商品的购买概率进行修正,得到修正后的行为商品的
购买概率;
S14根据修正后的行为商品的购买概率,测算相似相关商品的购买概率,并
按照购买率大小排序,生成商品推荐列表。
2.按照权利要求1所述的方法,其特征在于,所述的步骤S11中,所述的特
征数据来源于PC端、WAP端和/或APP端站内数据,以及第三方线上数据和第三
方线下终端数据;所述的特征数据包括历史离线特征数据和实时特征数据。
3.按照权利要求2所述的方法,其特征在于,所述的实时特征数据采用解析
访问日志、点击日志、曝光日志、事件日志和/或订单日志的方法得到。
4.按照权利要求3所述的方法,其特征在于,所述的S11进一步包括:建立
终端的映射关系,打通或寻路各终端的数据连接通道,将各特征数据通过映射关
系关联得到融合后的特征向量,将各终端特征向量融合,得到融合后的实时预测
特征向量。
5.按照权利要求1所述的方法,其特征在于,所述的S12进一步包括:首先
对用户进行分类,并建立各类用户对应的分模型;然后将S11得到的实时预测特
征向量带入相应用户的分模型中,计算行为商品的购买概率。
6.按照权利要求5所述的方法,其特征在于,所述的对用户进行分类包括:
按照终端类型、用户类型和访客类型三种维度,对用户进行分类。
7.按照权利要求5所述的方法,其特征在于,所述的S13中,对S12得到的
行为商品的购买概率进行修正是:采用将各分模型的首次训练结果和新修正参数
作为模型融合的偏移融合因子,对S12得到的行为商品的购买概率进行修正,得
到修正后的商品购买概率。
8.按照权利要求1所述的方法,其特征在于,所述的S14中,相似相关商品
的购买概率按照式(1)测算:
Score_i=Master_SPU_Pos*SKU_Score_i/max(SKU_Score_i) 式(1)
其中,Score_i表示相似相关商品的购买概率,Master_SPU_Pos表示行为
商品的购买概率,max(SKU_Score_i)表示相似相关商品列表中关联度最高值,
SKU_Score_i表示相似相关商品SKU_i与行为商品的关联度。
9.一种用于电子商务中商品推荐列表的生成系统,其特征在于,该系统包括:
采集模块:用于采集用户的特征数据,并将各终端数据融合,得到融合后的
实时预测特征向量;
计算模块:用于计算行为商品的购买概率;
融合模块:用于对行为商品的购买概率进行修正,得到融合后的行为商品的
购买概率;
生成模块:用于测算相似相关商品的购买概率,并按照购买率大小排序,生
成商品推荐列表。
10.按照权利要求9所述的系统,其特征在于,所述的采集模块中,特征数
据来源于PC端、WAP端、APP端站内数据,以及第三方线上数据和线下终端数据;
所述的特征数据包括历史离线特征数据和实时特征数据。
11.按照权利要求9所述的系统,其特征在于,所述的采集模块具体用于:
建立终端的映射关系,打通各终端的数据连接通道,将各特征数据通过映射关系
关联得到融合后的特征向量,将各终端特征向量融合,得到融合后的实时预测特
征向量。
12.按照权利要求9所述的系统,其特征在于,所述的计算模块包括:
分类子模块:用于对用户进行分类,形成多类用户;
建模子模块:用于对各类用户建立对应的分模型;
计算子模块:用于采集模块得到的实时预测特征向量带入相应用户的分模型
中,计算行为商品的购买概率。
13.按照权利要求9所述的系统,其特征在于,所述的融合模块中,对行为
商品的购买概率进行修正是,采用将各分模型的首次训练结果和新修正参数作为
模型融合的偏移融合因子,对行为商品的购买概率进行修正,得到融合后的商品
购买概率。
14.按照权利要求9所述的系统,其特征在于,所述的生成模块中,相似相
关商品的购买概率按照式(1)测算:
Score_i=Master_SPU_Pos*SKU_Score_i/max(SKU_Score_i) 式(1)
其中,Score_i表示相似相关商品的购买概率,Master_SPU_Pos表示行为
商品的购买概率,max(SKU_Score_i)表示相似相关商品列表中关联度最高值,
SKU_Score_i表示相似相关商品SKU_i与行为商品的关联度。

说明书

一种用于电子商务中商品推荐列表的生成方法及生成系统

技术领域

本发明涉及电子商务领域,具体来说,涉及一种用于电子商务中商品推荐列
表的生成方法及生成系统。

背景技术

目前,互联网电子商务的购买预测算法的标准是基于多维特征数据源,使用
logistic regression模型,模型学习训练方法基本是最大似然算法,或是梯度
下降算法。预测模型多采用统一的数据源,统一的模型,单终端的算法预测模型。

在目前的商品购买预测中,单一模型的使用仍较为普遍,但同时也暴露出其
难以全面描述复杂业务的全部关系,预测精度和鲁棒性不尽如人意的问题。同样,
单终端和统一的数据源,也不利于提高商品购买的预测精度。

发明内容

技术问题:本发明实施例所要解决的技术问题是:提供一种用于电子商务中
商品推荐列表的生成方法及生成系统,能够提高商品推荐列表的预测精度。

技术方案:为解决上述技术问题,一方面,本实施例提供一种用于电子商务
中商品推荐列表的生成方法,该方法包括以下步骤:

S11采集用户的特征数据,并将各终端数据特征融合,得到融合后的实时预
测特征向量;

S12计算行为商品的购买概率;

S13对S12得到的行为商品的购买概率进行修正,得到修正后的行为商品的
购买概率;

S14根据修正后的行为商品的购买概率,测算相似相关商品的购买概率,并
按照购买率大小排序,生成商品推荐列表。

作为一种实施例,所述的步骤S11中,所述的特征数据来源于PC端、WAP
端和/或APP端站内数据,以及第三方线上数据和第三方线下终端数据;所述的
特征数据包括历史离线特征数据和实时特征数据。

作为一种实施例,所述的实时特征数据采用解析访问日志、点击日志、曝光
日志、事件日志和/或订单日志的方法得到。

作为一种实施例,所述的S11进一步包括:建立终端的映射关系,打通或寻
路各终端的数据连接通道,将各特征数据通过映射关系关联得到融合后的特征向
量,将各终端特征向量融合,得到融合后的实时预测特征向量。

作为一种实施例,所述的S12进一步包括:首先对用户进行分类,并建立各
类用户对应的分模型;然后将S11得到的实时预测特征向量带入相应用户的分模
型中,计算行为商品的购买概率。

作为一种实施例,所述的对用户进行分类包括:按照终端类型、用户类型和
访客类型三种维度,对用户进行分类。

作为一种实施例,所述的S13中,对S12得到的行为商品的购买概率进行修
正是:采用将各分模型的首次训练结果和新修正参数作为模型融合的偏移融合因
子,对S12得到的行为商品的购买概率进行修正,得到修正后的商品购买概率。

作为一种实施例,所述的S14中,相似相关商品的购买概率按照式(1)测
算:

Score_i=Master_SPU_Pos*SKU_Score_i/max(SKU_Score_i) 式(1)

其中,Score_i表示相似相关商品的购买概率,Master_SPU_Pos表示行为
商品的购买概率,max(SKU_Score_i)表示相似相关商品列表中关联度最高值,
SKU_Score_i表示相似相关商品SKU_i与行为商品的关联度。

另一方面,本实施例提供一种用于电子商务中商品推荐列表的生成系统,该
系统包括:

采集模块:用于采集用户的特征数据,并将各终端数据融合,得到融合后的
实时预测特征向量;

计算模块:用于计算行为商品的购买概率;

融合模块:用于对行为商品的购买概率进行修正,得到融合后的行为商品的
购买概率;

生成模块:用于测算相似相关商品的购买概率,并按照购买率大小排序,生
成商品推荐列表。

作为一种实施例,所述的采集模块中,特征数据来源于PC端、WAP端、APP
端站内数据,以及第三方线上数据和线下终端数据;所述的特征数据包括历史离
线特征数据和实时特征数据。

作为一种实施例,所述的采集模块具体用于:建立终端的映射关系,打通各
终端的数据连接通道,将各特征数据通过映射关系关联得到融合后的特征向量,
将各终端特征向量融合,得到融合后的实时预测特征向量。

作为一种实施例,所述的计算模块包括:

分类子模块:用于对用户进行分类,形成多类用户;

建模子模块:用于对各类用户建立对应的分模型;

计算子模块:用于采集模块得到的实时预测特征向量带入相应用户的分模型
中,计算行为商品的购买概率。

作为一种实施例,所述的融合模块中,对行为商品的购买概率进行修正是,
采用将各分模型的首次训练结果和新修正参数作为模型融合的偏移融合因子,对
行为商品的购买概率进行修正,得到融合后的商品购买概率。

作为一种实施例,所述的生成模块中,相似相关商品的购买概率按照式(1)
测算:

Score_i=Master_SPU_Pos*SKU_Score_i/max(SKU_Score_i) 式(1)

其中,Score_i表示相似相关商品的购买概率,Master_SPU_Pos表示行为
商品的购买概率,max(SKU_Score_i)表示相似相关商品列表中关联度最高值,
SKU_Score_i表示相似相关商品SKU_i与行为商品的关联度。

有益效果:与现有技术相比,本发明实施例提供的用于电子商务中商品推荐
列表的生成方法及系统,采集多终端的特征数据,多数据融合,可以解决数据的
完整性,提高模型精度。同时,根据用户分类建立多模型,利用多模型分别计算
购买概率,多模型可以提高预测概率的准确性和推荐的准确性。多模型融合可以
把多个模型的结果归一化,使得生成的商品推荐列表的精度更高,更符合用户的
需求。另外,多终端数据融合可以解决不同终端的行为推荐的稳定性和准确性,
多终端的数据覆盖的用户行为数据比单一终端的更加全面、丰富,从而使得鲁棒
性更好。

附图说明

图1是本发明一实施例的流程框图;

图2是本发明一实施例中模型训练的流程框图;

图3是本发明一实施例中模型的分布图;

图4是本发明另一实施例的结构框图。

具体实施方式

下面结合附图,对本发明实施例的技术方案进行详细的说明。

如图1所述,本实施例提供一种用于电子商务中商品推荐列表的生成方法,
包括以下步骤:

S11采集用户的特征数据,并将各终端数据融合,得到融合后的实时预测特
征向量;

S12计算行为商品的购买概率;

S13对S12得到的行为商品的购买概率进行修正,得到融合后的行为商品的
购买概率;

S14测算相似相关商品的购买概率,并按照购买率大小排序,生成商品推荐
列表。

上述实施例中,采集的用户特征数据来源于PC端、WAP端、APP端站内数据,
以及第三方线上数据和线下终端数据。这样,从数据采集角度而言,这些特征数
据覆盖了多个终端。与单个终端,例如WAP端相比,本实施例采集的数据来源范
围广。多终端数据来源,为后续的购买概率预测提供了更准确的基础数据。作为
一种优选方案,特征数据包括历史离线特征数据和实时特征数据。历史离线特征
数据可以选择:会员属性或标签、会员忠诚度、会员购买力、会员偏好、会员历
史访问指标等等。会员历史访问指标可以是:过去N天添加购物车行为次数、过
去N天添加收藏夹行为次数、过去N天PV数、过去N天一个会话内最多PV数、
过去N天网站访问时长、过去N天一个会话的最大时长、过去N天浏览商品详情
页数量、过去N天一个会话内最多访问详情页数量、过去N天会话数量、过去N
天天订单数量等等。实时特征数据采用解析访问日志、点击日志、曝光日志、事
件日志、订单日志的方法得到。例如,实时特征数据包括四级页商品详情区点击
次数(包括评价)、商品四级页收藏点击次数、列表页推荐点击次数、列表页收
藏点击次数、列表页商品点击次数、用户浏览pv、搜索页收藏点击次数、搜索
页推荐点击次数、新动态促销页商品点击次数、用户静态商品促销页pv等等。

在S11中,实时预测特征向量的确定方法为:建立终端的映射关系,打通各
终端的数据连接通道,将各特征数据通过映射关系关联得到融合后的特征向量,
将各终端特征向量融合,得到融合后的实时预测特征向量。对于非会员,可以通
过cookie、手机串号等对应映射关系关联得到融合后的特征指标。对于会员,
可以通过会员编码等关联实时数据和历史数据,得到融合后的特征指标。通过会
员关系、各终端识别码进行数据连接和关联,得到融合数据。

在通过S11得到融合后的实时预测特征向量后,需要计算行为商品的购买概
率。本实施例提供的行为商品的购买概率的测算方法不同于传统方法。本实施例
采用多模型的预测方法,具体来说:首先,对用户进行分类,并建立各类用户对
应的分模型;然后,将S11得到的实时预测特征向量带入相应用户的分模型中,
计算行为商品的购买概率。

对用户进行分类的方式有很多,作为一种优选方案,本实施例选择按照终端
类型、用户类型、访客类型三种维度,对用户进行分类,并对每类用户建立一分
模型。例举一实例,将用户分为8类,具体分类如下:

PC新访客模型:针对无历史行为特征的、且今天访问网站的PC访客而建立
的模型。

PC老访客模型:针对有历史行为特征的PC访客而建立的模型。

PC新会员模型,针对无历史行为特征的、且今天注册为会员的PC会员而建
立的模型。

PC老会员模型,针对有历史行为特征的、且之前注册为会员的PC会员而建
立的模型。

WAP访客模型,针对非注册会员的WAP访客而建立的模型。

WAP会员模型,针对注册会员的WAP会员而建立的模型。

APP访客模型,针对非注册会员的APP访客而建立的模型。

APP会员模型,针对注册会员的APP会员而建立的模型。

当然除此之外,其他的用户分类方法亦可行,只要分别建立相应分类的模型,
并进行训练。

采用上述多模型测算得到的行为商品的购买概率也为多个。本实施例对多个
模型进行融合,得到统一的行为商品的购买概率,即融合后的行为商品的购买概
率。对S12得到的行为商品的购买概率进行修正,具体过程为:采用将各分模型
的首次训练结果和新修正参数作为模型融合的偏移融合因子,对S12得到的行为
商品的购买概率进行概率修正,得到修正的概率,即得到融合后的商品购买概率。
修正的方法是多模型概率融合模型进行计算。

各分模型的新修正参数可以自由设定,例如,新修正参数为转化率、点击率
或者模型分类。

多模型融合可视为再次的机器学习过程。设有3个分类模型:分模型M1、
分模型M2和分模型M3,利用测试样本数据进行模型测试,测试数据输出的结果
分别为F1,F2和F3。用训练样本数据通过模型输出的训练数据预测结果为f1,
f2和f3。将f1,f2、f3和各分模型的转化率合并到训练样本数据中,对各分模
型再次训练,得到修正的模型。再用修正的模型训练测试样本数据,得到结果a,
b和c。

本实施例中,行为商品是指用户在电子商务网站上有操作行为的商品。操作
行为例如:浏览、点击、加入收藏夹等行为。相似相关商品是指与行为商品相似
或相关的商品。相似相关商品由行为商品按照关联规则、协同过滤等关联方法计
算得出的商品列表,然后根据支持度和信任度选取分别满足用户给定的阈值,按
照阈值过滤得到商品。其中选取的关联场景包括但不限于浏览最终购买、看了还
看、看了最终购买、配件搭配场景等。本实施例以式(1)计算相似相关商品的
购买概率:

Score_i=Master_SPU_Pos*SKU_Score_i/max(SKU_Score_i) 式(1)

其中,Score_i表示相似相关商品的购买概率,Master_SPU_Pos表示行为
商品的购买概率,max(SKU_Score_i)表示相似相关商品列表中关联度最高值,
SKU_Score_i表示相似相关商品与行为商品的关联度。

本实施例采用多数据源、多终端类型的数据,进行训练多模型的实时计算购
买转化预测概率。同时模型采用线性分片和融合打通的训练样本数据,并且对分
片的多模型采用偏移量因子进行模型融合归一处理,最终得到一个精度高、多终
端融合的实时购买概率预测的模型。本实施例根据不同终端、不同人群的实时访
问行为,提供一个实时、个性化的基于用户购买概率的商品推荐方法。本实施例
可以实时采集数据,并进行计算,向用户实时推荐商品。

本实施例根据不同的数据终端和融合数据,按照人群分别训练模型,然后按
照分群片区的偏移修正,融合各模型,得到统一的模型。融合所用的方法有很多,
大部分人直接用机器学习里的各类方法,或者用统计回归等。本实施例选用各分
模型初步预测结果加新修正参数重新训练的方法,得到融合模型。其他机器学习
的方法预测精度提高有限、模型比较复杂。本实施例中,步骤S11采集的数据来
源于多个终端。步骤S13中,对人群进行了分类,并对每类人群分别建立了分模
型;然后对各分模型进行训练,将首次训练结果和新修正参数作为模型融合的偏
移融合因子,对各分模型进行融合归一处理,得到修正后的统一模型,即融合后
的统一模型;最后利用该融合后的统一模型进行概率测算。相比较其他机器学习
方法,本实施例从数据来源和模型建立两方面,尤其是融合后的统一模型,提高
了预测精度。与现有技术中建立一个总模型相比,本实施例采用对各分类人群分
别建立分模型,模型简单。不同类别的人群,影响购买概率的因素不同。建立一
个总模型需要考虑各类人群的影响因素。而对各分类人群建立分模型,仅仅需要
考虑该类人群的影响因素,不需要考虑其他类人群的影响因素。因此,本实施例
的模型简单。

对本实施例采用的方法和利用单一模型进行预测的方法进行比较。按照单一
模型预测,分类器正确判断阳性样本的值高于阴性样本之概率(英文全称:Area
Under the ROC Curve,文中简称:AUC)为0.70。采用本实施例方法,AUC=0.85。
本实施例的方法的预测精度高于单一模型的预测精度。

图2所示,为本实施例中涉及的模型的离线自动训练流程,具体如下:

S21根据不同终端选取实时行为特征数据和历史特征数据。

该实时行为特征数据和历史特征数据包括PC端、WAP端、APP端等站内数据,
也包括第三方线上数据和线下终端数据。例如,实时行为特征数据包括:详情访
问特征、搜索特征、列表页访问特征、促销访问特征、页面点击特征、收藏夹次
数、购物车次数等。历史特征数据包括:会员属性或标签、会员忠诚度、会员购
买力、会员偏好、会员历史访问指标等。举例来说,会员历史访问指标包括过去
N天添加购物车行为次数、过去N天添加收藏夹行为次数、过去N天PV数、过
去N天一个会话内最多PV数、过去N天网站访问时长、过去N天一个会话的最
大时长、过去N天浏览商品详情页数量、过去N天一个会话内最多访问详情页数
量、过去N天会话数量、过去N天订单数量。

S22根据S21采集的实时行为特征数据和历史特征数据,分别提取部分数据
作为训练样本数据和离线测试样本数据,得到特征向量。

该特征向量包括实时行为特征和历史特征指标。提取部分数据可以是1-30
天产生的数据,也可以是其他天数内产生的数据。

S23根据S22得到的数据,训练模型。

依照上述实施例所述,按照终端类型、用户类型和访客类型维度,对用户进
行分类,并对每类用户建立一分模型。使用logistic regression模型训练各分
模型。

举例来说,训练的各分模型包括:

PC新访客模型,训练的样本数据包括无历史行为特征的PC访客(非会员);

PC老访客模型,训练的样本数据包括有历史历史行为特征的PC访客(非会
员);

PC新会员模型,训练的样本数据包括无历史行为特征的PC会员;

PC老会员模型,训练的样本数据包括有历史历史行为特征的PC会员;

WAP访客模型,训练的样本数据包括WAP访客(非会员);

WAP会员模型,训练的样本数据包括WAP会员;

APP访客模型,训练的样本数据包括APP访客(非会员);

APP会员模型,训练的样本数据包括APP会员。

用p(y=1|x)表示逻辑回归函数(用户购买概率的模型),如式(2)所示:

<mrow> <mi>p</mi> <mrow> <mo>(</mo> <mi>y</mi> <mo>=</mo> <mn>1</mn> <mo>|</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mn>1</mn> <mo>+</mo> <mi>exp</mi> <mrow> <mo>(</mo> <mo>-</mo> <mi>f</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow> 式(2)

其中,p(y=1|x)表示转化概率,f(x)表示特征向量的线性函数。

由于特征选取较多,且模型比较复杂,会产生过拟合、特征共线性等问题,
选用LASSO回归的方法进行模型的变量选择和正则化,lasso回归的RSS形式如
下:

<mrow> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msup> <mrow> <mo>(</mo> <msub> <mi>y</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>&beta;</mi> <mn>0</mn> </msub> <mo>-</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>&rho;</mi> </munderover> <msub> <mi>&beta;</mi> <mi>j</mi> </msub> <msub> <mi>x</mi> <mi>ij</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <mi>&lambda;</mi> <munderover> <mi>&Sigma;</mi> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>&rho;</mi> </munderover> <mo>|</mo> <msub> <mi>&beta;</mi> <mi>j</mi> </msub> <mo>|</mo> </mrow> 式(3)

其中,y表示预测变量,β0表示常量,βj表示变量参数,λ表示lasso惩
罚系数,i表示样本数量,j表示模型变量数量,xij表示变量。

模型按照终端、用户类型、访客类型维度进行分片处理,分片后的模型如式
(4):

<mrow> <mi>p</mi> <mrow> <mo>(</mo> <mi>y</mi> <mo>=</mo> <mn>1</mn> <mo>|</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mn>1</mn> <mo>+</mo> <mi>exp</mi> <mrow> <mo>(</mo> <mo>-</mo> <msub> <mi>&pi;</mi> <mi>m</mi> </msub> <mo>*</mo> <msub> <mi>&omega;</mi> <mi>i</mi> </msub> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow> 式(4)

其中,p(y=1|x)表示转化概率,即购买概率;π表示分模型,即各分类用
户对应的分模型,m表示模型数量,x表示变量,ω表示权重,i表示样本数量。

S24,根据S23得到的如式(4)所示的训练模型,加入首次训练结果和新修
正参数进行融合,得到融合后的统一模型。

如图4所示,为另一实施例。该实施例提供一种用于电子商务中商品推荐列
表的生成系统,包括:

采集模块:用于采集用户的特征数据,并将各终端数据融合,得到融合后的
实时预测特征向量;

计算模块:用于计算行为商品的购买概率;

融合模块:用于对行为商品的购买概率进行修正,得到融合后的行为商品的
购买概率;

生成模块:用于测算相似相关商品的购买概率,并按照购买率大小排序,生
成商品推荐列表。

该实施例中,采集模块采集的用户特征数据来源于PC端、WAP端、APP端站
内数据,以及第三方线上数据和线下终端数据。这样,从数据采集角度而言,这
些特征数据覆盖了多个终端。与单个终端,例如WAP端相比,本实施例采集的数
据来源范围广。多终端数据来源,为后续的购买概率预测提供了更准确的基础数
据。作为一种优选方案,特征数据包括历史离线特征数据和实时特征数据。历史
离线特征数据可以选择:会员属性或标签、会员忠诚度、会员购买力、会员偏好、
会员历史访问指标等等。会员历史访问指标可以是:过去N天添加购物车行为次
数、过去N天添加收藏夹行为次数、过去N天PV数、过去N天一个会话内最多
PV数等等。实时特征数据采用解析访问日志、点击日志、曝光日志、事件日志、
订单日志的方法得到。例如,实时特征数据包括四级页商品详情区点击次数(包
括评价)、商品四级页收藏点击次数、列表页推荐点击次数、列表页收藏点击次
数、列表页商品点击次数等等。

在采集模块中,实时预测特征向量的方法为:建立终端的映射关系,打通各
终端的数据连接通道,将各特征数据通过映射关系关联得到融合后的特征向量,
将各终端特征向量融合,得到融合后的实时预测特征向量。对于非会员,可以通
过cookie、手机串号等对应映射关系关联得到融合后的特征指标。对于会员,
可以通过会员编码等关联实时数据和历史数据,得到融合后的特征指标。通过会
员关系、各终端识别码进行数据连接和关联,得到融合数据。

通过采集模块得到融合后的实时预测特征向量后,需要计算行为商品的购买
概率。本实施例中的计算模块包括:

分类子模块:用于对用户进行分类,形成多类用户;

建模子模块:用于对各类用户建立对应的分模型;

计算子模块:用于采集模块得到的实时预测特征向量带入相应用户的分模型
中,计算行为商品的购买概率。

该计算模块不同于现有的其他计算模块。该计算模块通过分类子模块对用户
进行分类,形成多类用户;然后通过建模子模块对各类用户建立对应的分模型;
最后利用计算子模块将采集模块得到的实时预测特征向量,带入相应用户的分模
型中,计算行为商品的购买概率。对用户进行分类的方式有很多,作为一种优选
方案,本实施例选择按照终端类型、用户类型、访客类型三种维度,对用户进行
分类,并对每类用户建立一分模型。本计算模块由于采用了多个分模型,其测算
得到的行为商品的购买概率为多个。本实施例对多个模型进行融合,得到统一的
行为商品的购买概率,即融合后的行为商品的购买概率。对计算模块得到的行为
商品的购买概率进行修正,具体过程为:采用将各分模型的首次训练结果和新修
正参数作为模型融合的偏移融合因子,对计算模块得到的行为商品的购买概率进
行概率修正,得到修正的概率。修正的方法是多模型概率融合模型进行计算。

各分模型的新修正参数可以自由设定,例如,新修正参数为转化率、点击率
或者模型分类。

多模型融合可视为再次的机器学习过程。设有3个分类模型:分模型M1、
分模型M2和分模型M3,利用测试样本数据进行模型测试,测试数据输出的结果
分别为F1,F2和F3。用训练样本数据通过模型输出的训练数据预测结果为f1,
f2和f3。将f1,f2、f3和各分模型的转化率合并到训练样本数据中,对各分模
型再次训练,得到修正的模型。再用修正的模型训练测试样本数据,得到结果a,
b和c。

本实施例中,行为商品是用户有访问等行为的商品,相似相关商品是指与用
户行为商品相似或相关的商品。作为一种优选方案,按照式(1)测算相似相关
商品的购买概率。

Score_i=Master_SPU_Pos*SKU_Score_i/max(SKU_Score_i) 式(1)

其中,Score_i表示相似相关商品的购买概率,Master_SPU_Pos表示行为
商品的购买概率,max(SKU_Score_i)表示相似相关商品列表中关联度最高值,
SKU_Score_i表示相似相关商品SKU_i与行为商品的关联度。

本领域技术人员应该知晓,实现上述实施例的方法或者系统,可以通过计算
机程序指令来实现。该计算机程序指令装载到可编程数据处理设备上,例如计算
机,从而在可编程数据处理设备上执行相应的指令,用于实现上述实施例的方法
或者系统实现的功能。

本领域技术人员依据上述实施例,可以对本申请进行非创造性的技术改进,
而不脱离本发明的精神实质。这些改进仍应视为在本申请权利要求的保护范围之
内。

一种用于电子商务中商品推荐列表的生成方法及生成系统.pdf_第1页
第1页 / 共13页
一种用于电子商务中商品推荐列表的生成方法及生成系统.pdf_第2页
第2页 / 共13页
一种用于电子商务中商品推荐列表的生成方法及生成系统.pdf_第3页
第3页 / 共13页
点击查看更多>>
资源描述

《一种用于电子商务中商品推荐列表的生成方法及生成系统.pdf》由会员分享,可在线阅读,更多相关《一种用于电子商务中商品推荐列表的生成方法及生成系统.pdf(13页珍藏版)》请在专利查询网上搜索。

本发明公开了一种用于电子商务中商品推荐列表的生成方法,该方法包括以下步骤:S11采集用户的特征数据,并将各终端数据融合,得到融合后的实时预测特征向量;S12计算行为商品的购买概率;S13对S12得到的行为商品的购买概率进行修正,得到融合后的行为商品的购买概率;S14根据修正后的行为商品的购买概率,测算相似相关商品的购买概率,并按照购买率大小排序,生成商品推荐列表。同时还公开了一种用于电子商务中商品。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 >


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1