一种基于大数据和数据挖掘的个性化订单推荐方法技术领域
本发明涉及数据分析技术领域,具体涉及一种基于大数据和数据挖掘的个性化订
单推荐方法。
背景技术
现在社会每天都会产生海量的信息。面对这么多信息好多人都不知道什么信息是
自己需要的。
随着烟草行业电子商务的发展,积累了大量的用户数据和行为数据,如何有效的
利用这些数据提高用户的体验和烟草企业的经济效益,改变传统的零售户订货方式。
数据挖掘技术是近年来计算机技术发展的热点之一。通过对历史积累的大量数据
的有效挖掘,可以发现隐藏的规律或模式,为决策提供支持,而这些规律或模式是不能够依
靠简单的数据查询得到,或者是不能在可接受的时间内得到。这些规律或模式可以进一步
在专业人员的识别下成为知识。数据挖掘面对的任务是复杂的,通常包括分类、预测、关联
规则发现和聚类分析等。
Web数据挖掘建立在对大量的网络数据进行分析的基础上,采用相应的数据挖掘
算法,在具体的应用模型上进行数据的提取、数据筛选、数据转换、数据挖掘和模式分析,最
后做出归纳性的推理、预测客户的个性化行为以及用户习惯,从而帮助进行决策和管理,减
少决策的风险。
Web数据挖掘涉及多个领域,除数据挖掘外,还涉及计算机网络、数据库与数据仓
储、人工智能、信息检索、可视化、自然语言理解等技术。
发明内容
本发明要解决的技术问题是:本发明提供一种基于大数据和数据挖掘的个性化订
单推荐方法,通过对用户数据和行为的挖掘,让零售户能够快速找到合适自己销售的卷烟,
让烟草企业能够将卷烟推荐给适合的零售户。
本发明所采用的技术方案为:
一种基于大数据和数据挖掘的个性化订单推荐方法,所述方法通过计算用户之间
的相似度,找到与用户有相似经营特征的用户,基于用户的相似度向用户推荐相似用户购
买的商品,提高推荐的准确性。
所述方法中相似用户生成过程如下:
对一个用户,找到与该用户有相似经营特征的用户,并且把这组用户购买过的商
品作为候选的推荐商品,一个用户包含一组购买历史,即用户购买过的商品和数量,使用用
户的购买数量向量来标识用户,使用Pearson关联度量公式计算两两用户向量之间的相似
度sim(x,y):
其中:Pxy表示用户x,y共同购过的一组商品;
对一个用户,选择与其相似度由高到低排名前N个用户作为相似用户。
所述方法中预测商品评分过程如下:
对一个用户,根据相似用户购买商品的数量,预测该用户候选商品的可能性,并根
据下述公式计算一组相似用户候选商品的加权和:
ru,p=k∑u′∈U sim(u,u′)×ru′,p
其中k表示归一化因子;
最后通过使用概率模型建模,计算用户喜爱某件候选商品的概率。
本发明的有益效果为:
本发明通过对用户数据和行为的挖掘,让零售户能够快速找到合适自己销售的卷
烟,让烟草企业能够将卷烟推荐给适合的零售户,在帮助烟草企业推销商品,增大经济收益
的同时,也节省了用户挑选商品的时间和精力。
具体实施方式
下面根据具体实施方式对本发明进一步说明:
实施例1:
一种基于大数据和数据挖掘的个性化订单推荐方法,所述方法通过计算用户之间
的相似度,找到与用户有相似经营特征的用户,基于用户的相似度向用户推荐相似用户购
买的商品,提高推荐的准确性。
实施例2
在实施例1的基础上,本实施例所述方法中相似用户生成过程如下:
对一个用户,找到与该用户有相似经营特征的用户,并且把这组用户购买过的商
品作为候选的推荐商品,一个用户包含一组购买历史,即用户购买过的商品和数量,使用用
户的购买数量向量来标识用户,使用Pearson关联度量公式计算两两用户向量之间的相似
度sim(x,y):
其中:Pxy表示用户x,y共同购过的一组商品;
对一个用户,选择与其相似度由高到低排名前N个用户作为相似用户。
实施例3
在实施例2的基础上,本实施例所述方法中预测商品评分过程如下:
对一个用户,根据相似用户购买商品的数量,预测该用户候选商品的可能性,并根
据下述公式计算一组相似用户候选商品的加权和:
ru,p=k∑u′∈U sim(u,u′)×ru′,p
其中k表示归一化因子;
所述方法通过使用概率模型建模,计算用户喜爱某件候选商品的概率。
实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术
人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同
的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。