一种基于推荐概率融合的混合推荐方法.pdf

上传人:t**** 文档编号:6171330 上传时间:2019-05-16 格式:PDF 页数:14 大小:2.39MB
返回 下载 相关 举报
摘要
申请专利号:

CN201310637512.4

申请日:

2013.12.02

公开号:

CN103632290A

公开日:

2014.03.12

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):G06Q 30/02申请日:20131202|||公开

IPC分类号:

G06Q30/02(2012.01)I; G06F17/30

主分类号:

G06Q30/02

申请人:

合肥工业大学

发明人:

刘业政; 姜元春; 王锦坤; 孙春华; 魏婧; 杜非; 王佳佳; 姬建睿; 何建民; 凌海峰

地址:

230009 安徽省合肥市屯溪路193号

优先权:

专利代理机构:

安徽省合肥新安专利代理有限责任公司 34101

代理人:

何梅生

PDF下载: PDF下载
内容摘要

本发明公开了一种基于推荐概率融合的混合推荐方法,该方法包括如下步骤:1)用二维表表示商品的评分数据;2)对已评分集合中的任意项作为未知数,利用基础推荐方法得到对应项的预测结果,将已评分项评分和对应项的预测结果的集合利用神经网络进行训练得到评分预测模型SFM;3)利用基础推荐方法得到未评分项预测结果,将未评分项预测结果的集合利用SFM获得未评分项的最终预测值;4)将用户的所有未评分项按照未评分项最终预测值集合中各预测值的大小进行降序排列获得未评分项排序集合,选取未评分项排序集合的前N项作为推荐结果推荐给用户。本发明能有效反映用户评价的真实情况,提高个性化推荐的精度。

权利要求书

权利要求书
1.  一种基于推荐概率融合的混合推荐方法,其特征是按如下步骤进行:
步骤一、用二维表T={U,I,f}表示商品的评分数据;
所述二维表T中,U={U1,...,Uu,...,U|U|}表示用户集合,I={I1,...,Ii,...,I|I|}表示商品集合,f表示用户对商品的评分;
所述用户集合U中,|U|为用户的总个数,Uu表示第u个用户;所述商品集合I中,|I|为商品的总个数,Ii表示第i个商品;假设用户Uu对商品Ii的评分等级S为{S1,...,Ss,...,S|S|},所述评分等级S中,评分Ss为整数且S1<...<Ss<...<S|S|,S1表示商品的最低评分,S|S|表示商品的最高评分;
所述二维表T中,将所有用户的已有评分项用已评分集合表示,为所述用户Uu的已评分集合,表示用户Uu的第i个已有评分项,表示用户Uu的已有评分项的总个数;令为所述用户Uu的未评分集合,表示用户Uu的第i个未评分项,表示用户Uu的未评分项的总个数,令所述用户未评分集合中的任意项
步骤二、假设用户已评分集合中的任意项为未知数,将用户已评分集合中的其他项利用基于用户的协同过滤方法和基于项目的协同过滤方法分别获得所述任意项的邻居用户预测结果和邻居项目预测结果将所述邻居用户预测结果和邻居项目预测结果作为所述任意项的已评分项预测结果将用户已评分集合中所有项的已评分项预测结果用已评分项预测结果集合表示;
将所述已评分项预测结果集合作为神经网络的输入值,将所述用户已评分集合作为所述神经网络的输出值,对所述神经网络进行训练,获得评分预测模型SFM;
步骤三、将用户已评分集合中的所有项利用所述基于用户的协同过滤方法和基于项目的协同过滤方法获得所述用户未评分集合中的任意项的初步预测结果将所述用户未评分集合中所有项的预测结果用未评分项预测结果集合表示;将所述未评分项预测结果集合作为所述评分预测模型SFM的输入值,利用所述评分预测模 型SFM获得未评分项最终预测值集合;
步骤四、将所述用户Uu的所有未评分项按照所述未评分项最终预测值集合中各预测值的大小进行降序排列获得未评分项排序集合,选取所述未评分项排序集合的前N项作为推荐结果推荐给所述用户Uu。

2.  根据权利要求1所述的基于推荐概率融合的混合推荐方法,其特征在于:所述步骤二中基于用户的协同过滤方法是按如下步骤进行:
1)将所述用户Uu对所有商品的用户已评分集合和其他用户对所有商品的已评分集合分别利用有约束的皮尔逊相关度度量方法获得用户Uu与其他用户的用户相似度集合,将其他用户按照所述用户相似度集合中的相似度大小进行降序排列获得初步邻居用户集合Nu;
2)将所述商品Ii在已评分集合中所对应的用户表示为评分用户集合Ri;
3)将所述初步邻居集合Nu与评分用户集合Ri交集的前k个用户表示为邻居用户集合Nui;
4)将所述邻居用户集合Nui中的每个用户对商品Ii的评分表示为邻居用户评分集合Fui;
5)利用式(1)获得基于用户的评分概率
PruiU(Ss)=NumU(Ss)/k---(1)]]>
式(1)中,NumU(Ss)为所述邻居用户评分集合Fui中评分Ss出现的次数;
6)将所述评分Ss与所述基于用户的评分概率构成邻居用户预测结果
PruiU={(S1,PruiU(S1)),...,(Ss,PruiU(Ss)),...,(S|S|,PruiU(S|S|))}---(2)]]>
式(2)中,PruiU(Ss)∈[0,1].]]>

3.  根据权利要求1所述的基于推荐概率融合的混合推荐方法,其特征在于:所述基于项目的协同过滤方法是按如下步骤进行:
1)将所有用户对所述商品Ii的已评分集合和对其他商品的已评分集合分别利用有约束的皮尔逊相关度度量方法获得所述商品Ii与其他商品的商品相似度集合,将其他商品按照所述商品相似度集合中的相似度大小进行降序排列获得初步邻居商品集合Ni;
2)将用户Uu在已评分集合中所对应的商品表示为评分商品集合Ru;
3)将所述初步邻居商品集合Ni与评分商品集合Ru交集的前k个商品表示为邻居商品集合Niu;
4)将用户Uu对所述邻居商品集合Niu中的每个商品的评分表示为邻居商品评分集合Fiu;
5)利用式(3)获得基于项目的评分概率
PruiI(Ss)=NumI(Ss)/k---(3)]]>
式(3)中,NumI(Ss)为所述邻居商品评分集合Fiu中评分Ss出现的次数;
6)将所述评分Ss与所述基于项目的评分概率构成项目邻居预测结果
PruiI={(S1,PruiI(S1)),...,(Ss,PruiI(Ss)),...,(S|S|,PruiI(S|S|))}---(4)]]>
式(4)中,PruiI(Ss)∈[0,1].]]>

说明书

说明书一种基于推荐概率融合的混合推荐方法
技术领域
本发明属于电子商务领域,具体地说是一种基于推荐概率融合的混合推荐方法。
背景技术
随着电子商务的快速发展,信息过载现象愈加严重。如何基于海量的商品集合满足用户的个性化需求成为提升用户体验、提高用户满意度的重要问题。个性化推荐系统是满足用户个性化需求的重要手段。个性化推荐系统根据用户个体的在线浏览数据或购买数据构建用户兴趣偏好模型,从而向用户推荐符合其独特需求的商品。个性化商品推荐在亚马逊、京东商城、淘宝等电子商务网站得到了广泛应用,有效提高了用户购买的可能性,提升了用户对网站服务的体验。
协同过滤(Collaborative Filtering)技术是个性化推荐应用最早和最为成功的技术之一,其主要思路是基于具有相似特征的用户其兴趣偏好也相同这一假设构建用户兴趣偏好模型。现有研究方法虽然可以为个性化推荐系统的构建提供理论基础和实践指导,但是仍然存在诸多缺陷:
(1)推荐信息表示的不完整。已有推荐方法通常将用户对商品的评价表示或预测为一个具体的数值,如预测用户对商品的评价为3分即认为用户对商品评分为3分的可能性为100%。实际上,用户对特定商品的评价通常处于一种不确定的状态,如对某一商品的评价通常为“不错”、“还可以”、“挺好”。将用户对商品评价的不确定状态表示为用户针对商品给出不同评分的可能性,例如对商品评价为3分、4分、5分的可能性分别为30%、40%和20%,可以有效反映用户评价的真实情况,对提高个性化推荐的精度具有积极的影响。现有方法将用户评分表示成一个具体数值忽略了用户评价的不确定性,无法反映用户评价商品的真实情况,降低了推荐系统的精度。
(2)推荐信息的融合问题。基于用户的协同过滤方法通过计算邻居用户推荐那些和他有共同兴趣爱好的用户喜欢的物品,推荐结果着重于反映和用户兴趣相似的小群体的热点;基于项目的协同过滤方法通过计算商品邻居给用户推荐那些和他以前选择的商品类似的商品,推荐结果着重于维系用户的历史兴趣。基于用户的协同过滤、基于项目的协同过滤方法分别从用户和项目角度产生个性化推荐结果,对上述结果进行融合可以对各种角度的推荐信息进行综合利用,提高个性化推荐的精度。现有研究中缺少对不同角度推荐信息进行融合的统一框架。例如,一种基于项目评分预测的协同过滤推荐算法利用基于项目的协同过滤方法得到的预测结果作为基于用户的协同过滤方法的输入,虽然综合利用了基于用户的协同过滤方法和基于项目的协同过滤方法,但其并未对基于用户的协同过滤结果和基于项目的协同过滤结 果进行融合。
发明内容
本发明为克服现有技术存在的不足之处,提出一种基于推荐概率融合的混合推荐方法,不仅为融合不同推荐方法产生的推荐结果提供了统一的框架,而且能有效反映用户评价的真实情况,提高个性化推荐的精度。
为了达到上述目的,本发明所采用的技术方案为:
本发明一种基于推荐概率融合的混合推荐方法的特点是按如下步骤进行:
步骤一、用二维表T={U,I,f}表示商品的评分数据;
所述二维表T中,U={U1,...,Uu,...,U|U|}表示用户集合,I={I1,...,Ii,...,I|I|}表示商品集合,f表示用户对商品的评分;
所述用户集合U中,|U|为用户的总个数,Uu表示第u个用户;所述商品集合I中,|I|为商品的总个数,Ii表示第i个商品;假设用户Uu对商品Ii的评分等级S为{S1,...,Ss,...,S|S|},所述评分等级S中,评分Ss为整数且S1<...<Ss<...<S|S|,S1表示商品的最低评分,S|S|表示商品的最高评分;
所述二维表T中,将所有用户的已有评分项用已评分集合表示,为所述用户Uu的已评分集合,表示用户Uu的第i个已有评分项,表示用户Uu的已有评分项的总个数;令为所述用户Uu的未评分集合,表示用户Uu的第i个未评分项,表示用户Uu的未评分项的总个数,令所述用户未评分集合中的任意项
步骤二、假设用户已评分集合中的任意项为未知数,将用户已评分集合中的其他项利用基于用户的协同过滤方法和基于项目的协同过滤方法分别获得所述任意项的邻居用户预测结果和邻居项目预测结果;将所述邻居用户预测结果和邻居项目预测结果作为所述任意项的已评分项预测结果将用户已评分集合中所有项的已评分项预测结果用已评分项预测结果集合表示;
将所述已评分项预测结果集合作为神经网络的输入值,将所述用户已评分集合作为 所述神经网络的输出值,对所述神经网络进行训练,获得评分预测模型SFM;
步骤三、将用户已评分集合中的所有项利用所述基于用户的协同过滤方法和基于项目的协同过滤方法获得所述用户未评分集合中的任意项的初步预测结果将所述用户未评分集合中所有项的预测结果用未评分项预测结果集合表示;将所述未评分项预测结果集合作为所述评分预测模型SFM的输入值,利用所述评分预测模型SFM获得未评分项最终预测值集合;
步骤四、将所述用户Uu的所有未评分项按照所述未评分项最终预测值集合中各预测值的大小进行降序排列获得未评分项排序集合,选取所述未评分项排序集合的前N项作为推荐结果推荐给所述用户Uu。
本发明基于推荐概率融合的混合推荐方法的特点也在于:
所述步骤二中基于用户的协同过滤方法是按如下步骤进行:
1)将所述用户Uu对所有商品的用户已评分集合和其他用户对所有商品的已评分集合分别利用有约束的皮尔逊相关度度量方法获得用户Uu与其他用户的用户相似度集合,将其他用户按照所述用户相似度集合中的相似度大小进行降序排列获得初步邻居用户集合Nu;
2)将所述商品Ii在已评分集合中所对应的用户表示为评分用户集合Ri;
3)将所述初步邻居集合Nu与评分用户集合Ri交集的前k个用户表示为邻居用户集合Nui;
4)将所述邻居用户集合Nui中的每个用户对商品Ii的评分表示为邻居用户评分集合Fui;
5)利用式(1)获得基于用户的评分概率
PruiU(Ss)=NumU(Ss)/k---(1)]]>
式(1)中,NumU(Ss)为所述邻居用户评分集合Fui中评分Ss出现的次数;
6)将所述评分Ss与所述基于用户的评分概率构成邻居用户预测结果
PruiU={(S1,PruiU(S1)),...,(Ss,PruiU(Ss)),...,(S|S|,PruiU(S|S|))}---(2)]]>
式(2)中,PruiU(Ss)∈[0,1].]]>
所述基于项目的协同过滤方法是按如下步骤进行:
1)将所有用户对所述商品Ii的已评分集合和对其他商品的已评分集合分别利用有约束的皮尔逊相关度度量方法获得所述商品Ii与其他商品的商品相似度集合,将其他商品按照所述商品相似度集合中的相似度大小进行降序排列获得初步邻居商品集合Ni;
2)将用户Uu在已评分集合中所对应的商品表示为评分商品集合Ru;
3)将所述初步邻居商品集合Ni与评分商品集合Ru交集的前k个商品表示为邻居商品集合Niu;
4)将用户Uu对所述邻居商品集合Niu中的每个商品的评分表示为邻居商品评分集合Fiu;
5)利用式(3)获得基于项目的评分概率
PruiI(Ss)=NumI(Ss)/k---(3)]]>
式(3)中,NumI(Ss)为所述邻居商品评分集合Fiu中评分Ss出现的次数;
6)将所述评分Ss与所述基于项目的评分概率构成项目邻居预测结果
PruiI={(S1,PruiI(S1)),...,(Ss,PruiI(Ss)),...,(S|S|,PruiI(S|S|))}---(4)]]>
式(4)中,PruiI(Ss)∈[0,1].]]>
与已有技术相比,本发明的有益效果体现在:
1、本发明将基于用户和基于项目的推荐方法各自所获得的推荐结果表示为推荐概率,利用神经网络将各自所获得的推荐结果进行融合,克服了传统混合推荐方法推荐信息表示不完整的问题,为不同角度推荐信息的融合提供了统一的框架,其推荐精度明显优于基于用户的推荐方法和基于项目的推荐方法。
2、本发明利用评分Ss和基于用户的评分概率所构成的二元组集合来表示基于用户的推荐方法所获得的推荐信息,利用评分Ss与基于项目的评分概率所构成的二元组集合来表示基于项目的推荐方法所获得的推荐信息,与将用户对商品的评价表示为一个具体的数值相比,评分和评分概率构成的二元组能够更加真实的反映用户评价的真实情况。
3、本发明利用基于用户的协同过滤方法和基于项目的协同过滤方法得到已评分项预测结果,将已评分项预测结果集合作为输入,将已评分集合作为输出,利用神经网络特有的拟合能力获得评分预测模型SFM,保证了评分预测模型的鲁棒性。
4、本发明将未评分集合利用基于用户的协同过滤方法和基于项目的协同过滤方法得到初步预测结果,将初步预测结果作为评分预测模型SFM的输入得到未评分项最终的预测值集合,进而得到最终的推荐结果,与传统推荐方法相比,本发明能够对不同推荐方法的推荐结果进行有效融合,提高了个性化推荐的精度。
5、本发明所提混合推荐方法将基于用户的协同过滤方法和基于项目的协同过滤方法的结果进行了融合有利于提高推荐结果的多样性,更加符合用户的真实偏好,克服了现有技术中单纯使用基于用户的协同过滤方法或单纯使用基于项目的协同过滤方法的缺点。
6、本发明可用于服装和手机等实体产品、电影和音乐等数字产品、旅游线路和度假安排等服务产品的个性化推荐系统,可以在电脑和手机的网页和App等平台进行使用,应用范围广泛。
附图说明
图1为本发明的流程示意图;
图2为相似性度量方法的敏感性实验结果;
图3为邻居用户(商品)数目敏感性实验结果;
图4为预测准确性实验结果;
图5为预测训练模型敏感性实验结果。
具体实施方式
本发明利用二维表表示商品的评分数据,对已评分集合中的任意项作为未知数,利用基础推荐方法得到对应项的预测结果,将已评分项评分和对应项的预测结果的集合利用神经网络进行训练得到评分预测模型SFM。将通过基础推荐方法得到的未评分项预测结果的集合利用评分预测模型SFM获得未评分项的最终预测值。最后,在标准数据集上与基础算法进行比较。如图1所示,本发明实施例的方法包括以下步骤:
步骤一、用二维表T={U,I,f}表示商品的评分数据,具体包括:
如表1,U={U1,...,Uu,...,U|U|}表示用户集合,I={I1,...,Ii,...,I|I|}表示商品集合,f表示用户对商品的评分;
用户集合U中,|U|为用户的总个数,Uu表示第u个用户;商品集合I中,|I|为商品的总个数,Ii表示第i个商品;假设用户Uu对商品Ii的评分等级S为{S1,...,Ss,...,S|S|},评分等级S中,评分Ss为整数且S1<...<Ss<...<S|S|,S1表示商品的最低评分,S|S|表示商品的最高评分;

表1
二维表T中,将所有用户的已有评分项用已评分集合表示,为用户Uu的已评分集合,表示用户Uu的第i个已有评分项,表示用户Uu的已有评分项的总个数;令为用户Uu的未评分集合,表示用户Uu的第i个未评分项,表示用户Uu的未评分项的总个数,令用户未评分集合中的任意项
步骤二、利用基础推荐方法得到对应项的预测结果,将已评分项评分和对应项的预测结果利用神经网络进行训练得到评分预测模型SFM。具体步骤包括:
1)假设用户已评分集合中的任意项为未知数,将用户已评分集合中的其他项利用基于用户的协同过滤方法获得任意项的邻居用户预测结果其他项指在已评分集合F^u={f^u1,...,f^ui,...,f^u|F^u|}]]>中,除了以外的所有项;
1.1)将用户Uu对所有商品I={I1,...,Ii,...,I|I|}的用户已评分集合和其他用户对所有商品的已评分集合分别利用有约束的皮尔逊相关度度量方法获得用户Uu与其他用户的用户相似度集合,将其他用户按照用户相似度集合中的相似度大小进行降序排列获得初步邻居用户集合Nu,其他用户是指在用户集合U={U1,...,Uu,...,U|U|}中除了用户Uu以外的所有用户,其他用户对所有商品的已评分集合是指在已评分集合中除了用户Uu的已评分集合以外的所有用户评分集合;用户的相似度度量方法包括余弦相似性、皮尔逊相关性和有约束的皮尔逊相关性三种,为了比较不同的相似性度量方法对于本发明方法预测精度的影响本发明针对设计了5组实验,实验结果如图2所示。图中横坐标表示数据集,纵坐标表示实验预测误差,由图中曲线我们可以看出,对于本发明中的标准数据集,基于有约束的皮尔 逊相关性的相似性度量方法的误差均低于余弦相似性度量方法和皮尔森相关性度量方法,从而有助于提高本发明方法的预测精度。
1.2)将商品Ii在已评分集合中所对应的用户表示为评分用户集合Ri;
1.3)将初步邻居用户集合Nu与评分用户集合Ri交集的前k个用户表示为邻居用户集合Nui;k的选择是影响基于用户的协同过滤推荐方法效果的关键因素,为了验证邻居用户数对本发明方法预测精度的影响,本发明设计了7组实验,每组实验分别选取k个邻居用户,k=10,20,…,80;并计算预测精度。实验结果如图3所示,图中横坐标表示邻居用户数,纵坐标表示实验预测误差。当邻居用户数k较小时,预测概率不够精确,降低了预测的准确性;当邻居用户数k较大时,用户之间的相似性不高,亦会降低算法预测的准确性。因此,对于本实验所采用标准数据集而言,邻居用户数选择在[30,70]之间时可以取得较好的预测效果;对于其他数据集,最佳邻居用户数目的确定依赖于具体的数据情况。
1.4)将邻居用户集合Nui中的每个用户对商品Ii的评分表示为邻居用户评分集合Fui;
1.5)利用式(1)获得基于用户的评分概率,即用基于用户的协同过滤方法得到的用户Uu对商品Ii的评分等级为Ss的概率:
PruiU(Ss)=NumU(Ss)/k---(1)]]>
式(1)中,NumU(Ss)为所述邻居用户评分集合Fui中评分Ss出现的次数;
1.6)将评分Ss与基于用户的评分概率构成邻居用户预测结果
PruiU={(S1,PruiU(S1)),...,(Ss,PruiU(Ss)),...,(S|S|,PruiU(S|S|))}---(2)]]>
式(2)中,PruiU(Ss)∈[0,1].]]>
2)假设用户已评分集合中的任意项为未知数,将用户已评分集合中的其他项利用基于项目的协同过滤方法获得任意项的项目邻居预测结果,其他项指在已评分集合中,除了第i个已有评分项以外的所有项;
2.1)将用户集合U对商品Ii的已评分集合和对其他商品的已评分集合分别利用有约束的皮尔逊相关度度量方法获得商品Ii与其他商品的商品相似度集合,将其他商品按照商品相似度集合中的相似度大小进行降序排列获得初步商品邻居集合Ni;其他商品是指在商品集合 I={I1,...,Ii,...,I|I|}中除了商品Ii以外的所有商品。
2.2)将用户Uu在已评分集合中所对应的商品表示为评分商品集合Ru;
2.3)将初步商品邻居集合Ni与评分商品集合Ru交集的前k个商品表示为商品邻居集合Niu;k的选择是影响基于项目的协同过滤推荐方法效果的关键因素,为了验证邻居项目数对本发明方法预测精度的影响,本发明设计了7组实验,每组实验分别选取k个邻居项目,k=10,20,…,80;并计算预测精度。实验结果如图3所示,图中横坐标表示邻居项目数,纵坐标表示实验预测误差。当邻居项目数k较小时,预测概率不够精确,降低了预测的准确性;当邻居项目数k较大时,项目之间的相似性不高,亦会降低算法预测的准确性。因此,对于本实验所采用标准数据集而言,邻居用户数选择在[30,70]之间时可以取得较好的预测效果;对于其他数据集,最佳邻居用户数目的确定依赖于具体的数据情况。
2.4)将用户Uu对商品邻居集合Niu中的每个商品的评分表示为邻居商品评分集合Fiu;
2.5)利用式(3)获得基于项目的评分概率,即用基于项目的协同过滤方法得到的用户Uu对商品Ii的评分等级为Ss的概率:
PruiI(Ss)=NumI(Ss)/k---(3)]]>
式(3)中,NumI(Ss)为邻居商品评分集合Fiu中评分Ss出现的次数;
2.6)将评分Ss与基于项目的评分概率构成项目邻居预测结果
PruiI={(S1,PruiI(S1)),...,(Ss,PruiI(Ss)),...,(S|S|,PruiI(S|S|))}---(4)]]>
式(4)中,
3)将邻居用户预测结果和邻居项目预测结果作为任意项的已评分项预测结果具体地,任意项的已评分项预测结果为:
f^ui0={(S1,PruiU(S1)),...,(Ss,PruiU(Ss)),...,(S|S|,PruiU(S|S|)),(S1,PruiI(S1)),...,(Ss,PruiI(Ss)),...,(S|S|,PruiI(S|S|))}]]>
对已评分集合中所有项执行步骤1)和步骤2),将已评分集合中所有项的预测结果用已评分项预测结果集合表示;
4)将已评分项预测结果集合作为神经网络的输入值,将已评分集合作为神经网络的输出值,对神经网络进行训练,获得评分预测模型SFM。本实施例中,所采用的神经网络 是指径向基神经网络。径向基神经网络具有较强的输入和输出映射功能,具有唯一最佳逼近的特性,且学习过程收敛速度快。
步骤三、将用户已评分集合中的所有项利用基于用户的协同过滤方法和基于项目的协同过滤方法获得未评分集合中的任意项的初步预测结果将未评分集合中所有项的预测结果用未评分项预测结果集合表示;将未评分项预测结果集合作为评分预测模型SFM的输入值,利用评分预测模型SFM输出未评分项最终预测值集合;
步骤四、将用户Uu的所有未评分项按照未评分项最终预测值集合中各预测值的大小进行降序排列获得未评分项排序集合,选取未评分项排序集合的前N项作为推荐结果推荐给用户Uu,N表示推荐个数,可根据具体推荐场景设定。
针对本发明方法进行实验论证,具体包括:
1)准备标准数据集
本发明使用MovieLens数据集作为标准数据集验证概率融合推荐方法的有效性,MovieLens数据集是应用广泛的个性化推荐数据集。在MovieLens数据集中,用户对自己看过的电影进行评分,分值为1到5分,数据集包括943位独立用户,1682部电影,100000个评分。训练集和测试集采用80%/20%的规则进行分割,即随机选择80000个评分作为训练集,20000个评分作为测试集。
2)评价指标
采用平均绝对误差(MAE)作为本实施例的评价指标。平均绝对偏差MAE通过计算测试集中实际的用户评分与对应项的最终预测值之间的偏差度量预测的准确性,MAE越小,推荐质量越高。设实际用户评分集合为{p1,...,pl,...,pn},对应预测值集合表示为{q1,...,ql,...,qn},则平均绝对误差定义为式(5):
MAE=Σl=1n|ql-pl|n---(5)]]>
3)在标准数据集上进行实验
为了验证本发明所提方法的有效性,本文在MovieLens数据集的5组数据集上进行建模和预测,并将预测结果与真实评分进行比较。实验结果如图4所示,图中横坐标表示数据集序号,纵坐标表示实验预测误差。与基于用户的协同过滤方法和基于产品的协同过滤方法相 比,本发明的方法的预测误差均低于基于用户的方法和基于项目的方法,从而在每个数据集上均能取得更优的预测准确率。
为验证本发明所提方法的鲁棒性,本文通过改变径向基神经网络的隐含层神经元数量和隐含层学习函数,分别设计了7组实验进行验证。实验结果如图5所示,图中横坐标表示实验序号,纵坐标表示实验预测误差。由图5可以看出,改变径向基神经网络的隐含层神经元数量和隐含层学习函数,本发明方法的预测误差会出现一定变化;但是,在合理的隐含层神经元数量和隐含层学习函数设置下,本文方法的预测误差始终低于基于用户的方法和基于项目的方法,从而本发明优于基于用户的协同过滤方法和基于产品的协同过滤推荐方法。

一种基于推荐概率融合的混合推荐方法.pdf_第1页
第1页 / 共14页
一种基于推荐概率融合的混合推荐方法.pdf_第2页
第2页 / 共14页
一种基于推荐概率融合的混合推荐方法.pdf_第3页
第3页 / 共14页
点击查看更多>>
资源描述

《一种基于推荐概率融合的混合推荐方法.pdf》由会员分享,可在线阅读,更多相关《一种基于推荐概率融合的混合推荐方法.pdf(14页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 103632290 A (43)申请公布日 2014.03.12 CN 103632290 A (21)申请号 201310637512.4 (22)申请日 2013.12.02 G06Q 30/02(2012.01) G06F 17/30(2006.01) (71)申请人 合肥工业大学 地址 230009 安徽省合肥市屯溪路 193 号 (72)发明人 刘业政 姜元春 王锦坤 孙春华 魏婧 杜非 王佳佳 姬建睿 何建民 凌海峰 (74)专利代理机构 安徽省合肥新安专利代理有 限责任公司 34101 代理人 何梅生 (54) 发明名称 一种基于推荐概率融合的混合推荐方。

2、法 (57) 摘要 本发明公开了一种基于推荐概率融合的混 合推荐方法, 该方法包括如下步骤 : 1) 用二维表 表示商品的评分数据 ; 2) 对已评分集合中的任意 项作为未知数, 利用基础推荐方法得到对应项的 预测结果, 将已评分项评分和对应项的预测结果 的集合利用神经网络进行训练得到评分预测模 型 SFM ; 3) 利用基础推荐方法得到未评分项预测 结果, 将未评分项预测结果的集合利用 SFM 获得 未评分项的最终预测值 ; 4) 将用户的所有未评分 项按照未评分项最终预测值集合中各预测值的大 小进行降序排列获得未评分项排序集合, 选取未 评分项排序集合的前 N 项作为推荐结果推荐给用 户。。

3、 本发明能有效反映用户评价的真实情况, 提高 个性化推荐的精度。 (51)Int.Cl. 权利要求书 2 页 说明书 8 页 附图 3 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书2页 说明书8页 附图3页 (10)申请公布号 CN 103632290 A CN 103632290 A 1/2 页 2 1. 一种基于推荐概率融合的混合推荐方法, 其特征是按如下步骤进行 : 步骤一、 用二维表 T U,I,f 表示商品的评分数据 ; 所述二维表 T 中, U U1,.,Uu,.,U|U| 表示用户集合, I I1,.,Ii,.,I|I| 表示商品集合, f 表示用户。

4、对商品的评分 ; 所述用户集合 U 中, |U| 为用户的总个数, Uu表示第 u 个用户 ; 所述商品集合 I 中, |I| 为商品的总个数, Ii表示第 i 个商品 ; 假设用户 Uu对商品 Ii的评分等级 S 为 S1,.,Ss,.,S|S|, 所述评分等级 S 中, 评分 Ss为整数且 S1 . Ss . S|S|, S1 表示商品的最低评分, S|S|表示商品的最高评分 ; 所 述 二 维 表 T 中,将 所 有 用 户 的 已 有 评 分 项 用 已 评 分 集 合表 示, 为所述用户 Uu的已评分集合,表示用户 Uu的第 i 个已有评分项,表示用户 Uu的已有评分项的总个数 ; 。

5、令为所述用户 Uu的未 评分集合,表示用户Uu的第i个未评分项,表示用户Uu的未 评分项的总个数, 令所述用户未评分集合中的任意项 步骤二、 假设用户已评分集合中的任意项为未知数, 将用户已评分集合中的 其他项利用基于用户的协同过滤方法和基于项目的协同过滤方法分别获得所述任意项 的邻居用户预测结果和邻居项目预测结果将所述邻居用户预测结果和邻居 项目预测结果作为所述任意项的已评分项预测结果将用户已评分 集合中所有项的已评分项预测结果用已评分项预测结果集合表 示 ; 将所述已评分项预测结果集合作为神经网络的输入值, 将所述用户已评分集合 作为所述神经网络的输出值, 对所述神经网络进行训练, 获得评。

6、分预测模型 SFM ; 步骤三、 将用户已评分集合中的所有项利用所述基于用户的协同过滤方法和基于项 目的协同过滤方法获得所述用户未评分集合中的任意项的初步预测结果将所述 用户未评分集合中所有项的预测结果用未评分项预测结果集合 表示 ; 将所述未评分项预测结果集合作为所述评分预测模型 SFM 的输入值, 利用所述评 分预测模型 SFM 获得未评分项最终预测值集合 ; 步骤四、 将所述用户 Uu的所有未评分项按照所述未评分项最终预测值集合中各预测值 的大小进行降序排列获得未评分项排序集合, 选取所述未评分项排序集合的前 N 项作为推 荐结果推荐给所述用户 Uu。 2. 根据权利要求 1 所述的基于。

7、推荐概率融合的混合推荐方法, 其特征在于 : 所述步骤 二中基于用户的协同过滤方法是按如下步骤进行 : 权 利 要 求 书 CN 103632290 A 2 2/2 页 3 1) 将所述用户 Uu对所有商品的用户已评分集合和其他用户对所有商品的已评分集 合分别利用有约束的皮尔逊相关度度量方法获得用户 Uu与其他用户的用户相似度集合, 将 其他用户按照所述用户相似度集合中的相似度大小进行降序排列获得初步邻居用户集合 Nu; 2) 将所述商品 Ii在已评分集合中所对应的用户表示为评分用户集合 Ri; 3) 将所述初步邻居集合 Nu与评分用户集合 Ri交集的前 k 个用户表示为邻居用户集合 Nui;。

8、 4) 将所述邻居用户集合 Nui中的每个用户对商品 Ii的评分表示为邻居用户评分集合 Fui; 5) 利用式 (1) 获得基于用户的评分概率 式 (1) 中, NumU(Ss) 为所述邻居用户评分集合 Fui中评分 Ss出现的次数 ; 6) 将所述评分 Ss与所述基于用户的评分概率构成邻居用户预测结果 式 (2) 中 , 3. 根据权利要求 1 所述的基于推荐概率融合的混合推荐方法, 其特征在于 : 所述基于 项目的协同过滤方法是按如下步骤进行 : 1) 将所有用户对所述商品 Ii的已评分集合和对其他商品的已评分集合分别利用有约 束的皮尔逊相关度度量方法获得所述商品 Ii与其他商品的商品相似。

9、度集合, 将其他商品按 照所述商品相似度集合中的相似度大小进行降序排列获得初步邻居商品集合 Ni; 2) 将用户 Uu在已评分集合中所对应的商品表示为评分商品集合 Ru; 3) 将所述初步邻居商品集合 Ni与评分商品集合 Ru交集的前 k 个商品表示为邻居商品 集合 Niu; 4) 将用户 Uu对所述邻居商品集合 Niu中的每个商品的评分表示为邻居商品评分集合 Fiu; 5) 利用式 (3) 获得基于项目的评分概率 式 (3) 中, NumI(Ss) 为所述邻居商品评分集合 Fiu中评分 Ss出现的次数 ; 6) 将所述评分 Ss与所述基于项目的评分概率构成项目邻居预测结果 式 (4) 中, 。

10、权 利 要 求 书 CN 103632290 A 3 1/8 页 4 一种基于推荐概率融合的混合推荐方法 技术领域 0001 本发明属于电子商务领域, 具体地说是一种基于推荐概率融合的混合推荐方法。 背景技术 0002 随着电子商务的快速发展, 信息过载现象愈加严重。如何基于海量的商品集合满 足用户的个性化需求成为提升用户体验、 提高用户满意度的重要问题。个性化推荐系统是 满足用户个性化需求的重要手段。 个性化推荐系统根据用户个体的在线浏览数据或购买数 据构建用户兴趣偏好模型, 从而向用户推荐符合其独特需求的商品。个性化商品推荐在亚 马逊、 京东商城、 淘宝等电子商务网站得到了广泛应用, 有效。

11、提高了用户购买的可能性, 提 升了用户对网站服务的体验。 0003 协同过滤(Collaborative Filtering)技术是个性化推荐应用最早和最为成功的 技术之一, 其主要思路是基于具有相似特征的用户其兴趣偏好也相同这一假设构建用户兴 趣偏好模型。现有研究方法虽然可以为个性化推荐系统的构建提供理论基础和实践指导, 但是仍然存在诸多缺陷 : 0004 (1) 推荐信息表示的不完整。已有推荐方法通常将用户对商品的评价表示或预测 为一个具体的数值, 如预测用户对商品的评价为 3 分即认为用户对商品评分为 3 分的可能 性为100%。 实际上, 用户对特定商品的评价通常处于一种不确定的状态,。

12、 如对某一商品的评 价通常为 “不错” 、“还可以” 、“挺好” 。将用户对商品评价的不确定状态表示为用户针对商品 给出不同评分的可能性, 例如对商品评价为3分、 4分、 5分的可能性分别为30%、 40%和20%, 可以有效反映用户评价的真实情况, 对提高个性化推荐的精度具有积极的影响。现有方法 将用户评分表示成一个具体数值忽略了用户评价的不确定性, 无法反映用户评价商品的真 实情况, 降低了推荐系统的精度。 0005 (2) 推荐信息的融合问题。基于用户的协同过滤方法通过计算邻居用户推荐那些 和他有共同兴趣爱好的用户喜欢的物品, 推荐结果着重于反映和用户兴趣相似的小群体的 热点 ; 基于项。

13、目的协同过滤方法通过计算商品邻居给用户推荐那些和他以前选择的商品类 似的商品, 推荐结果着重于维系用户的历史兴趣。 基于用户的协同过滤、 基于项目的协同过 滤方法分别从用户和项目角度产生个性化推荐结果, 对上述结果进行融合可以对各种角度 的推荐信息进行综合利用, 提高个性化推荐的精度。现有研究中缺少对不同角度推荐信息 进行融合的统一框架。例如, 一种基于项目评分预测的协同过滤推荐算法利用基于项目的 协同过滤方法得到的预测结果作为基于用户的协同过滤方法的输入, 虽然综合利用了基于 用户的协同过滤方法和基于项目的协同过滤方法, 但其并未对基于用户的协同过滤结果和 基于项目的协同过滤结果进行融合。 。

14、发明内容 0006 本发明为克服现有技术存在的不足之处, 提出一种基于推荐概率融合的混合推荐 方法, 不仅为融合不同推荐方法产生的推荐结果提供了统一的框架, 而且能有效反映用户 说 明 书 CN 103632290 A 4 2/8 页 5 评价的真实情况, 提高个性化推荐的精度。 0007 为了达到上述目的, 本发明所采用的技术方案为 : 0008 本发明一种基于推荐概率融合的混合推荐方法的特点是按如下步骤进行 : 0009 步骤一、 用二维表 T U,I,f 表示商品的评分数据 ; 0010 所 述 二 维 表 T 中, U U1,.,Uu,.,U|U| 表 示 用 户 集 合, I I1,。

15、.,Ii,.,I|I| 表示商品集合, f 表示用户对商品的评分 ; 0011 所述用户集合 U 中, |U| 为用户的总个数, Uu表示第 u 个用户 ; 所述商品集合 I 中, |I| 为商品的总个数, Ii表示第 i 个商品 ; 假设用户 Uu对商品 Ii的评分等级 S 为 S1,.,Ss,.,S|S|, 所述评分等级 S 中, 评分 Ss为整数且 S1 . Ss . S|S|, S1 表示商品的最低评分, S|S|表示商品的最高评分 ; 0012 所 述 二 维 表 T 中, 将 所 有 用 户 的 已 有 评 分 项 用 已 评 分 集 合表 示, 为所述用户Uu的已评分集合,表示用。

16、户 Uu的第 i 个已有评分项,表示用户 Uu的已有评分项的总个数 ; 令为所述用户 Uu的未 评分集合,表示用户Uu的第i个未评分项,表示用户Uu的未 评分项的总个数, 令所述用户未评分集合中的任意项 0013 步骤二、 假设用户已评分集合中的任意项为未知数, 将用户已评分集合中 的其他项利用基于用户的协同过滤方法和基于项目的协同过滤方法分别获得所述任意项 的邻居用户预测结果和邻居项目预测结果; 将所述邻居用户预测结果和邻 居项目预测结果作为所述任意项的已评分项预测结果将用户已评 分集合中所有项的已评分项预测结果用已评分项预测结果集合 表示 ; 0014 将所述已评分项预测结果集合作为神经网。

17、络的输入值, 将所述用户已评分集 合作为所述神经网络的输出值, 对所述神经网络进行训练, 获得评分预测模型 SFM ; 0015 步骤三、 将用户已评分集合中的所有项利用所述基于用户的协同过滤方 法和基于项目的协同过滤方法获得所述用户未评分集合中的任意项的初步预 测结果将所述用户未评分集合中所有项的预测结果用未评分项预测结果集合 表示 ; 将所述未评分项预测结果集合作为所述评分预测模型 SFM 的输入值, 利用所述评分预测模型 SFM 获得未评分项最终预测值集合 ; 0016 步骤四、 将所述用户 Uu的所有未评分项按照所述未评分项最终预测值集合中各预 测值的大小进行降序排列获得未评分项排序集。

18、合, 选取所述未评分项排序集合的前 N 项作 为推荐结果推荐给所述用户 Uu。 0017 本发明基于推荐概率融合的混合推荐方法的特点也在于 : 说 明 书 CN 103632290 A 5 3/8 页 6 0018 所述步骤二中基于用户的协同过滤方法是按如下步骤进行 : 0019 1) 将所述用户 Uu对所有商品的用户已评分集合和其他用户对所有商品的已评 分集合分别利用有约束的皮尔逊相关度度量方法获得用户 Uu与其他用户的用户相似度集 合, 将其他用户按照所述用户相似度集合中的相似度大小进行降序排列获得初步邻居用户 集合 Nu; 0020 2) 将所述商品 Ii在已评分集合中所对应的用户表示为。

19、评分用户集合 Ri; 0021 3) 将所述初步邻居集合 Nu与评分用户集合 Ri交集的前 k 个用户表示为邻居用户 集合 Nui; 0022 4) 将所述邻居用户集合 Nui中的每个用户对商品 Ii的评分表示为邻居用户评分集 合 Fui; 0023 5) 利用式 (1) 获得基于用户的评分概率 0024 0025 式 (1) 中, NumU(Ss) 为所述邻居用户评分集合 Fui中评分 Ss出现的次数 ; 0026 6)将所述评分 Ss与所述基于用户的评分概率构成邻居用户预测结果 0027 0028 式 (2) 中 , 0029 所述基于项目的协同过滤方法是按如下步骤进行 : 0030 1)。

20、 将所有用户对所述商品 Ii的已评分集合和对其他商品的已评分集合分别利用 有约束的皮尔逊相关度度量方法获得所述商品 Ii与其他商品的商品相似度集合, 将其他商 品按照所述商品相似度集合中的相似度大小进行降序排列获得初步邻居商品集合 Ni; 0031 2) 将用户 Uu在已评分集合中所对应的商品表示为评分商品集合 Ru; 0032 3) 将所述初步邻居商品集合 Ni与评分商品集合 Ru交集的前 k 个商品表示为邻居 商品集合 Niu; 0033 4) 将用户 Uu对所述邻居商品集合 Niu中的每个商品的评分表示为邻居商品评分集 合 Fiu; 0034 5) 利用式 (3) 获得基于项目的评分概率。

21、 0035 0036 式 (3) 中, NumI(Ss) 为所述邻居商品评分集合 Fiu中评分 Ss出现的次数 ; 0037 6) 将所述评分 Ss与所述基于项目的评分概率构成项目邻居预测结果 0038 0039 式 (4) 中, 0040 与已有技术相比, 本发明的有益效果体现在 : 说 明 书 CN 103632290 A 6 4/8 页 7 0041 1、 本发明将基于用户和基于项目的推荐方法各自所获得的推荐结果表示为推荐 概率, 利用神经网络将各自所获得的推荐结果进行融合, 克服了传统混合推荐方法推荐信 息表示不完整的问题, 为不同角度推荐信息的融合提供了统一的框架, 其推荐精度明显优。

22、 于基于用户的推荐方法和基于项目的推荐方法。 0042 2、 本发明利用评分 Ss和基于用户的评分概率所构成的二元组集合来表示基 于用户的推荐方法所获得的推荐信息, 利用评分 Ss与基于项目的评分概率所构成的二元组 集合来表示基于项目的推荐方法所获得的推荐信息, 与将用户对商品的评价表示为一 个具体的数值相比, 评分和评分概率构成的二元组能够更加真实的反映用户评价的真实情 况。 0043 3、 本发明利用基于用户的协同过滤方法和基于项目的协同过滤方法得到已评分 项预测结果, 将已评分项预测结果集合作为输入, 将已评分集合作为输出, 利用神经网络特 有的拟合能力获得评分预测模型 SFM, 保证了。

23、评分预测模型的鲁棒性。 0044 4、 本发明将未评分集合利用基于用户的协同过滤方法和基于项目的协同过滤方 法得到初步预测结果, 将初步预测结果作为评分预测模型 SFM 的输入得到未评分项最终的 预测值集合, 进而得到最终的推荐结果, 与传统推荐方法相比, 本发明能够对不同推荐方法 的推荐结果进行有效融合, 提高了个性化推荐的精度。 0045 5、 本发明所提混合推荐方法将基于用户的协同过滤方法和基于项目的协同过滤 方法的结果进行了融合有利于提高推荐结果的多样性, 更加符合用户的真实偏好, 克服了 现有技术中单纯使用基于用户的协同过滤方法或单纯使用基于项目的协同过滤方法的缺 点。 0046 6。

24、、 本发明可用于服装和手机等实体产品、 电影和音乐等数字产品、 旅游线路和度 假安排等服务产品的个性化推荐系统, 可以在电脑和手机的网页和 App 等平台进行使用, 应用范围广泛。 附图说明 0047 图 1 为本发明的流程示意图 ; 0048 图 2 为相似性度量方法的敏感性实验结果 ; 0049 图 3 为邻居用户 (商品) 数目敏感性实验结果 ; 0050 图 4 为预测准确性实验结果 ; 0051 图 5 为预测训练模型敏感性实验结果。 具体实施方式 0052 本发明利用二维表表示商品的评分数据, 对已评分集合中的任意项作为未知数, 利用基础推荐方法得到对应项的预测结果, 将已评分项评。

25、分和对应项的预测结果的集合利 用神经网络进行训练得到评分预测模型 SFM。将通过基础推荐方法得到的未评分项预测结 果的集合利用评分预测模型 SFM 获得未评分项的最终预测值。最后, 在标准数据集上与基 础算法进行比较。如图 1 所示, 本发明实施例的方法包括以下步骤 : 0053 步骤一、 用二维表 T U,I,f 表示商品的评分数据, 具体包括 : 说 明 书 CN 103632290 A 7 5/8 页 8 0054 如表 1, U U1,.,Uu,.,U|U| 表示用户集合, I I1,.,Ii,.,I|I| 表示 商品集合, f 表示用户对商品的评分 ; 0055 用户集合U中, |U。

26、|为用户的总个数, Uu表示第u个用户 ; 商品集合I中, |I|为商品 的总个数, Ii表示第i个商品 ; 假设用户Uu对商品Ii的评分等级S为S1,.,Ss,.,S|S|, 评分等级 S 中, 评分 Ss为整数且 S1 . Ss . S|S|, S1表示商品的最低评分, S|S| 表示商品的最高评分 ; 0056 0057 表 1 0058 二 维 表 T 中,将 所 有 用 户 的 已 有 评 分 项 用 已 评 分 集 合表 示, 为用户 Uu 的已评分集合,表示用户 Uu 的第 i 个已有评分项,表示用户 Uu的已有评分项的总个数 ; 令为用户 Uu的未评分集 合,表示用户 Uu的第。

27、 i 个未评分项,表示用户 Uu的未评分 项的总个数, 令用户未评分集合中的任意项 0059 步骤二、 利用基础推荐方法得到对应项的预测结果, 将已评分项评分和对应项的 预测结果利用神经网络进行训练得到评分预测模型 SFM。具体步骤包括 : 0060 1) 假设用户已评分集合中的任意项为未知数, 将用户已评分集合中的其 他项利用基于用户的协同过滤方法获得任意项的邻居用户预测结果其他项指在已评 分集合中, 除了以外的所有项 ; 0061 1.1)将用户 Uu对所有商品 I I1,.,Ii,.,I|I| 的用户已评分集合和 其他用户对所有商品的已评分集合分别利用有约束的皮尔逊相关度度量方法获得用户。

28、 Uu与其他用户的用户相似度集合, 将其他用户按照用户相似度集合中的相似度大小进行 降序排列获得初步邻居用户集合 Nu, 其他用户是指在用户集合 U U1,.,Uu,.,U|U| 中除了用户 Uu以外的所有用户, 其他用户对所有商品的已评分集合是指在已评分集合 中除了用户 Uu的已评分集合以外的所有用户评分集合 ; 用户的相似 度度量方法包括余弦相似性、 皮尔逊相关性和有约束的皮尔逊相关性三种, 为了比较不同 说 明 书 CN 103632290 A 8 6/8 页 9 的相似性度量方法对于本发明方法预测精度的影响本发明针对设计了 5 组实验, 实验结果 如图 2 所示。图中横坐标表示数据集,。

29、 纵坐标表示实验预测误差, 由图中曲线我们可以看 出, 对于本发明中的标准数据集, 基于有约束的皮尔逊相关性的相似性度量方法的误差均 低于余弦相似性度量方法和皮尔森相关性度量方法, 从而有助于提高本发明方法的预测精 度。 0062 1.2) 将商品 Ii在已评分集合中所对应的用户表示为评分用户集合 Ri; 0063 1.3) 将初步邻居用户集合 Nu与评分用户集合 Ri交集的前 k 个用户表示为邻居用 户集合 Nui; k 的选择是影响基于用户的协同过滤推荐方法效果的关键因素, 为了验证邻居 用户数对本发明方法预测精度的影响, 本发明设计了7组实验, 每组实验分别选取k个邻居 用户, k=10。

30、,20,80 ; 并计算预测精度。实验结果如图 3 所示, 图中横坐标表示邻居用户 数, 纵坐标表示实验预测误差。当邻居用户数 k 较小时, 预测概率不够精确, 降低了预测的 准确性 ; 当邻居用户数 k 较大时, 用户之间的相似性不高, 亦会降低算法预测的准确性。因 此, 对于本实验所采用标准数据集而言, 邻居用户数选择在 30, 70 之间时可以取得较好 的预测效果 ; 对于其他数据集, 最佳邻居用户数目的确定依赖于具体的数据情况。 0064 1.4) 将邻居用户集合 Nui中的每个用户对商品 Ii的评分表示为邻居用户评分集合 Fui; 0065 1.5) 利用式 (1) 获得基于用户的评。

31、分概率, 即用基于用户的协同过滤方 法得到的用户 Uu对商品 Ii的评分等级为 Ss的概率 : 0066 0067 式 (1) 中, NumU(Ss) 为所述邻居用户评分集合 Fui中评分 Ss出现的次数 ; 0068 1.6) 将评分 Ss与基于用户的评分概率构成邻居用户预测结果 0069 0070 式 (2) 中, 0071 2) 假设用户已评分集合中的任意项为未知数, 将用户已评分集合中的其 他项利用基于项目的协同过滤方法获得任意项的项目邻居预测结果, 其他项指在已评 分集合中, 除了第 i 个已有评分项以外的所有项 ; 0072 2.1) 将用户集合 U 对商品 Ii的已评分集合和对其。

32、他商品的已评分集合分别利用 有约束的皮尔逊相关度度量方法获得商品 Ii与其他商品的商品相似度集合, 将其他商品按 照商品相似度集合中的相似度大小进行降序排列获得初步商品邻居集合 Ni; 其他商品是指 在商品集合 I I1,.,Ii,.,I|I| 中除了商品 Ii以外的所有商品。 0073 2.2) 将用户 Uu在已评分集合中所对应的商品表示为评分商品集合 Ru; 0074 2.3) 将初步商品邻居集合 Ni与评分商品集合 Ru交集的前 k 个商品表示为商品邻 居集合 Niu; k 的选择是影响基于项目的协同过滤推荐方法效果的关键因素, 为了验证邻居 项目数对本发明方法预测精度的影响, 本发明设。

33、计了7组实验, 每组实验分别选取k个邻居 项目, k=10,20,80 ; 并计算预测精度。实验结果如图 3 所示, 图中横坐标表示邻居项目 说 明 书 CN 103632290 A 9 7/8 页 10 数, 纵坐标表示实验预测误差。当邻居项目数 k 较小时, 预测概率不够精确, 降低了预测的 准确性 ; 当邻居项目数 k 较大时, 项目之间的相似性不高, 亦会降低算法预测的准确性。因 此, 对于本实验所采用标准数据集而言, 邻居用户数选择在 30, 70 之间时可以取得较好 的预测效果 ; 对于其他数据集, 最佳邻居用户数目的确定依赖于具体的数据情况。 0075 2.4) 将用户 Uu对商。

34、品邻居集合 Niu中的每个商品的评分表示为邻居商品评分集合 Fiu; 0076 2.5) 利用式 (3) 获得基于项目的评分概率, 即用基于项目的协同过滤方 法得到的用户 Uu对商品 Ii的评分等级为 Ss的概率 : 0077 0078 式 (3) 中, NumI(Ss) 为邻居商品评分集合 Fiu中评分 Ss出现的次数 ; 0079 2.6) 将评分 Ss与基于项目的评分概率构成项目邻居预测结果 0080 0081 式 (4) 中, 0082 3) 将邻居用户预测结果和邻居项目预测结果作为任意项的已评分项预 测结果具体地, 任意项的已评分项预测结果为 : 0083 0084 对已评分集合中所。

35、有项执行步骤 1) 和步骤 2) , 将已评分集合中所有项的预测 结果用已评分项预测结果集合表示 ; 0085 4) 将已评分项预测结果集合作为神经网络的输入值, 将已评分集合作为神 经网络的输出值, 对神经网络进行训练, 获得评分预测模型SFM。 本实施例中, 所采用的神经 网络是指径向基神经网络。径向基神经网络具有较强的输入和输出映射功能, 具有唯一最 佳逼近的特性, 且学习过程收敛速度快。 0086 步骤三、 将用户已评分集合中的所有项利用基于用户的协 同过滤方法和基于项目的协同过滤方法获得未评分集合中的任意项的初步预测结 果将未评分集合中所有项的预测结果用未评分项预测结果集合 表示 ;。

36、 将未评分项预测结果集合作为评分预测模型 SFM 的输入 值, 利用评分预测模型 SFM 输出未评分项最终预测值集合 ; 0087 步骤四、 将用户 Uu的所有未评分项按照未评分项最终预测值集合 中各预测值的大小进行降序排列获得未评分项排序集合, 选取未评分项排序集合的前 N 项 作为推荐结果推荐给用户 Uu, N 表示推荐个数, 可根据具体推荐场景设定。 说 明 书 CN 103632290 A 10 8/8 页 11 0088 针对本发明方法进行实验论证, 具体包括 : 0089 1) 准备标准数据集 0090 本发明使用 MovieLens 数据集作为标准数据集验证概率融合推荐方法的有效。

37、性, MovieLens数据集是应用广泛的个性化推荐数据集。 在MovieLens数据集中, 用户对自己看 过的电影进行评分, 分值为 1 到 5 分, 数据集包括 943 位独立用户, 1682 部电影, 100000 个 评分。训练集和测试集采用 80%/20% 的规则进行分割, 即随机选择 80000 个评分作为训练 集, 20000 个评分作为测试集。 0091 2) 评价指标 0092 采用平均绝对误差 (MAE) 作为本实施例的评价指标。平均绝对偏差 MAE 通过计 算测试集中实际的用户评分与对应项的最终预测值之间的偏差度量预测的准确性, MAE 越 小, 推荐质量越高。设实际用户。

38、评分集合为 p1,.,pl,.,pn, 对应预测值集合表示为 q1,.,ql,.,qn, 则平均绝对误差定义为式 (5) : 0093 0094 3) 在标准数据集上进行实验 0095 为了验证本发明所提方法的有效性, 本文在 MovieLens 数据集的 5 组数据集上进 行建模和预测, 并将预测结果与真实评分进行比较。实验结果如图 4 所示, 图中横坐标表示 数据集序号, 纵坐标表示实验预测误差。与基于用户的协同过滤方法和基于产品的协同过 滤方法相比, 本发明的方法的预测误差均低于基于用户的方法和基于项目的方法, 从而在 每个数据集上均能取得更优的预测准确率。 0096 为验证本发明所提方。

39、法的鲁棒性, 本文通过改变径向基神经网络的隐含层神经元 数量和隐含层学习函数, 分别设计了 7 组实验进行验证。实验结果如图 5 所示, 图中横坐标 表示实验序号, 纵坐标表示实验预测误差。由图 5 可以看出, 改变径向基神经网络的隐含层 神经元数量和隐含层学习函数, 本发明方法的预测误差会出现一定变化 ; 但是, 在合理的隐 含层神经元数量和隐含层学习函数设置下, 本文方法的预测误差始终低于基于用户的方法 和基于项目的方法, 从而本发明优于基于用户的协同过滤方法和基于产品的协同过滤推荐 方法。 说 明 书 CN 103632290 A 11 1/3 页 12 图 1 图 2 说 明 书 附 图 CN 103632290 A 12 2/3 页 13 图 3 图 4 说 明 书 附 图 CN 103632290 A 13 3/3 页 14 图 5 说 明 书 附 图 CN 103632290 A 14 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1