基于信任的社会化协同过滤推荐方法.pdf

上传人:小** 文档编号:4904205 上传时间:2018-11-26 格式:PDF 页数:18 大小:1.67MB
返回 下载 相关 举报
摘要
申请专利号:

CN201310272543.4

申请日:

2013.07.01

公开号:

CN103399858A

公开日:

2013.11.20

当前法律状态:

授权

有效性:

有权

法律详情:

登录超时

IPC分类号:

G06F17/30; G06Q30/02(2012.01)I

主分类号:

G06F17/30

申请人:

吉林大学

发明人:

杨博; 雷余

地址:

130012 吉林省长春市前进大街2699号

优先权:

专利代理机构:

长春市四环专利事务所 22103

代理人:

郭耀辉

PDF下载: PDF下载
内容摘要

一种基于信任的社会化协同过滤推荐方法,融合用户对项目的评分矩阵和用户信任网络两种数据为目标用户进行高质量的推荐,主要包括如下步骤:构建用户与项目的特征向量;构建面向用户浏览行为的评分预测模型Truster-MF;构建面向用户评价行为的评分预测模型Trustee-MF;训练模型Truster-MF;训练模型Trustee-MF;融合训练后的Truster-MF和Trustee-MF,构建综合考虑浏览和评价两种行为的评分预测模型,本发明为基于信任的社会化推荐提供了一种全新方法,与现有方法相比,具有如下主要优点:(1)有效缓解了协同过滤推荐面临的数据稀疏和冷启动两个主要问题,具有更好的推荐质量;(2)算法简洁高效,易于实施,特别适用于大型电子商务网站。

权利要求书

权利要求书
1.  一种基于信任的社会化协同过滤推荐方法,其特征在于,包括如下步骤:
步骤101:根据用户-项目矩阵和用户信任网络构建用户与项目的特征向量;
步骤102:构建面向用户浏览行为的评分预测模型Truster-MF;
步骤103:构建面向用户评价行为的评分预测模型Trustee-MF;
步骤104:训练模型Truster-MF;
步骤105:训练模型Trustee-MF;
步骤106:融合Truster-MF和Trustee-MF,构建综合考虑浏览和评价两种行为的评分预测模型TrustMF。

2.  根据权利要求1所述的基于信任的社会化协同过滤推荐方法,其特征在于,该方法采用如下基本原理构建用户的兴趣模型并做推荐:
在信任网络中,信任关系是有向的,相应的,信任行为分为两种:“信任他人”和“被他人信任”,分别由信任向量和被信任向量刻画,用户A信任用户B的强度可被建模成A的信任向量与B的被信任向量的内积;实际应用中,通过社交网站提供的界面,用户一方面可以通过他对项目的评价(撰写评论或给出评分)去影响他人,另一方面也可通过浏览别人的评价被他人所影响,因而用户的信任向量和被信任向量实际上还分别刻画了用户的“浏览”行为和“评价”行为;分别选取用户的信任向量和被信任向量作为联系用户-项目矩阵和信任关系矩阵的“桥梁”,采用矩阵分解技术,同时分解用户-项目矩阵和信任矩阵,得到面向浏览行为的评分预测模型和面向评价行为的评分预测模型,进而将两个模型融合,得到综合浏览和评价行为的评分预测模型。

3.  根据权利要求1所述的基于信任的社会化协同过滤推荐方法,其特征在于,按照如下方法构建用户与项目的特征向量:
假设推荐系统中有m个用户和n个项目;令矩阵R=[Rij]m×n表示用户-项目评分矩阵,其中Rij表示用户i对项目j的评分,评分值为1到Rmax之间的整数(Rmax通常取值5);
令集合Ω={(i,j): Rij≠0}表示观察到的评分在评分矩阵R中的位置;通过矩阵分解将用户和项目投影到一个d维空间;令d×n维矩阵V表示项目特征矩阵,V的第jVj表示项目j的特征向量,刻画了项目j是什么类型的项目;令d×m维矩阵U表示用户偏好特征矩阵,U的第iUi表示用户i的偏好特征向量,刻画了用户i喜欢何种类型的项目;则用户i对项目j的评分Rij可表示为UiTVj,评分矩阵R可表示为UTV,其中UT表矩阵U的转置矩阵;
令矩阵T=[Tik]m×m表示m个用户构成的信任网络,其中Tik表示用户i对用户k的信任权重,“0”表示用户i不信任用户k,“1”表示用户i信任用户k,由于用户间的相互信任程度不见得相同,T通常是不对称的;
Ψ={(i,k): Tik≠0}表示观察到的信任关系在矩阵T中的位置,通过矩阵分解为每个用户i构建两个d维特征向量BiWiBi表示用户i的信任特征向量,刻画了用户i信任别人的行为,或者刻画用户i喜欢浏览何种类型的项目,Wi表示用户i的被信任特征向量,刻画了用户i被其他用户信任的行为,或者刻画用户i喜欢评价何种类型的项目,则用户i对用户k的信任关系Tik可表示为BiTWk,令d×m维矩阵B表示由m个向量Bi组成的矩阵(称为信任矩阵),d×m维矩阵W表示由mWi组成的矩阵(称为被信任矩阵),则信任网络T可表示为BTW

4.  根据权利要求1所述的基于信任的社会化协同过滤推荐方法,其特征在于,按照如下方法构建面向用户浏览行为的评分预测模型Truster-MF:
将信任矩阵B作为共享的用户特征空间,即用B去近似用户的偏好特征矩阵U,这意味着用户倾向于浏览的项目很可能是其偏好的项目;则评分矩阵R可表示为BTV,同时信任网络T可表示为BTW,Truster-MF模型的数学形式表示如下,通过最小化目标函数?实现同时分解矩阵RT; 
                                                   
                (1) 
其中,λT控制评分偏好和信任关系在模型中的权重;λ控制模型的复杂度;nbinvj分别表示用户i和项目j已有的评分数量;mbi表示用户i信任的用户数量,mwk表示信任用户k的用户数量,为了方便模型的训练,引入了逻辑函数g(x)=1/(1+exp(-x)),将x的值规范化在区间[0, 1]中。

5.  根据权利要求1所述的基于信任的社会化协同过滤推荐方法,其特征在于,按照如下方法构建面向用户评价行为的评分预测模型Trustee-MF:
将被信任矩阵W作为共享的用户特征空间,即用W去近似用户的偏好特征矩阵U,这意味着用户倾向于给出评价的项目很可能是其偏好的项目,则评分矩阵R可表示为WTV,同时信任网络T可表示为BTW,Trustee-MF模型的数学形式表示如下,通过最小化目标函数?实现同时分解矩阵RT
     
       (2) 
其中,λTλg(x)的含义同(1)式;nwinvj分别表示用户i和项目j已有的评分数量;mbk表示用户k信任的用户数量,mwi表示信任用户i的用户数量。

6.  根据权利要求1所述的基于信任的社会化协同过滤推荐方法,其特征在于,按照如下方法训练模型Truster-MF:
601:设置参数dλ, λT 和α的值,其中α为下降速率;
602:用服从[0,1]均匀分布的随机数初始化矩阵B,VW
603:根据(1)式中的目标函数,按照如下公式迭代更新矩阵B,VW
 , 
 , 
 , 
604:判断迭代过程是否收敛,若没有则转至步骤603,否则结束算法。

7.  根据权利要求1所述的基于信任的社会化协同过滤推荐方法,其特征在于,按照如下方法训练模型Trustee-MF:
701:设置参数dλ, λT 和α的值,其中α为下降速率;
702:用服从[0,1]均匀分布的随机数初始化矩阵B,VW
703:根据(2)式中的目标函数,按照如下公式迭代更新矩阵B,VW: 
 , 
 , 
 ,  
704:判断迭代过程是否收敛,若没有则转至步骤703,否则结束算法。

8.  根据权利要求1所述的基于信任的社会化协同过滤推荐方法,其特征在于,按照如下方法融合训练后的Truster-MF和Trustee-MF,构建综合考虑浏览和评价两种行为的评分预测模型TrustMF: 
                          (3)
其中,BrVr为训练truster-MF得到的特征矩阵,WeVe为训练trustee-MF得到的特征矩阵,  是TrustMF模型为用户i对项目j所做出的预测评分,Rmax指得分的最大值(通常设为5)。

说明书

说明书基于信任的社会化协同过滤推荐方法
技术领域
本发明属于信息检索领域,尤其涉及协同过滤推荐方法。
背景技术
推荐系统能够主动向用户推送其感兴趣的项目(如新闻、图书、电影和音乐等),是解决互联网信息过载的有效工具,已广泛应用于各种电子商务网站和社交网络中,产生了巨大的经济效益。
推荐系统的核心是推荐算法。目前已存在多种推荐算法,主要包括协同过滤推荐、基于内容的推荐和混合推荐。在所有的推荐算法中,协同过滤算法被认为最为简单有效,已成功应用于许多大型商业推荐系统中。协同过滤的基本原理是:将与目标用户偏好相似的用户所喜欢的项目作为推荐(基于用户的协同过滤),或者将与目标用户所喜欢内容相似的项目作为推荐(基于项目的协同过滤)。在实际应用中,协同过滤算法面临着“数据稀疏”和“冷启动”两个主要问题,它们能够在多大程度上得到缓解决定了协同过滤推荐算法性能的好坏。一般而言,“数据稀疏”是指系统可利用的用户评分数据很少,导致推荐算法所依赖的用户-项目矩阵非常稀疏(矩阵中零元素很多,而非零元素很少);“冷启动”是指系统对新用户的偏好知之甚少,因而难以对其做出准确的推荐。
随着Web2.0技术的快速发展,用户除了贡献对各类项目的评分信息外,还通过社交网络平台产生和积累了大量的行为数据。将这些行为数据视为用户评分数据的重要补充,提供除评分之外的额外有用信息,能够帮助系统更好的了解用户偏好,改进推荐模型和算法的性能,有效缓解上述的“数据稀疏”和“冷启动”问题。信任网络是用户在社交网站上产生的一类重要行为信息,描述了用户间的相互信任关系。由于人们更倾向于采纳来自信任方的推荐,信任网络对用户偏好的相互影响发挥着关键作用。如何充分利用信任网络帮助推荐系统更好的建立用户偏好模型,提高推荐质量,逐渐成为研究者关注的问题,这方面的主要工作介绍如下。
2006年,Golbeck等人采用信任网络,根据目标用户信任的用户对项目的评分估计目标用户对项目的评分。2007年,Avesani等人基于信任网络,采用有限步长的信任传播方法,估计出目标用户对其他用户的信任值,进而根据估计信任值为目标用户预测评分。2010年,Jebrin等人通过用户之间的信任关系和用户对项目的评分信息计算每个用户的“全局信誉”值,进而利用“全局信誉”值较高的用户对项目的评分去估计目标用户对项目的评分。
上述方法的可扩展性差,很难应用于包含大规模用户和项目的实际推荐系统。近年来,人们提出了基于矩阵分解的推荐方法,能有效处理大规模数据。这类方法利用用户信任关系数据将原始的用户-项目矩阵分解为两个规模更小的矩阵,进而利用两个小规模矩阵的乘积矩阵预测原始矩阵中的空缺元素,以此方式为目标用户进行评分预测。2008年,Ma等人采用概率因子分析技术,基于评分数据和信任网络,提出了一个概率矩阵分解算法SocRec。2009年,Ma等人提出RSTE算法,同时考虑目标用户的兴趣以及其信任的朋友的兴趣,将目标用户的评分看作由两部分组成,一部分根据用户自己的兴趣计算,另一部分根据信任网络计算。2010年,Jamali等人提出SocialMF算法,将用户特征矩阵分解为两个矩阵的线性组合,一个刻画用户自身的特征,另一个刻画用户信任的其它用户的特征。2011年,Ma等人提出SR2PCC算法,该法引入了一种正则化方法,利用用户的信任关系,对用户的特征向量进行约束。
上述基于矩阵分解的推荐算法大都假设目标用户信任的用户具有与其相似的兴趣偏好。然而,该假设在实际应用中并非总是成立。此外,上述方法在构造矩阵分解模型和算法时,强调的是如何更好拟合观察到的评分数据,而忽略了评分数据的生成机制,没有考虑所观察到的用户对项目的评价是如何基于其他用户的评价产生的。由于以上主要原因,现有基于矩阵分解的推荐方法对信任关系数据利用有限,推荐质量提升不高,未能很好的解决协同过滤所所面临的数据稀疏和冷启动问题。
发明内容
用户的对项目的评价行为会相互影响。当某个用户对项目进行评分时,会关注其他用户对相同项目的评价(包括对项目的评分和评论),用户信任的人的评价更容易影响该用户对项目的印象以及随后对该项目的评价;反之,该用户对项目的评价又会通过信任网络影响到其他用户。基于以上观察,本发明提供了一种全新的基于信任的社会化协同过滤推荐方法,该方法能够有机融合用户对项目的评分数据(即用户-项矩阵)和用户之间的信任关系(即信任网络),为目标用户做出高质量的推荐。实验表明,该方法能有效缓解协同过滤推荐方法所面临的数据稀疏和冷启动问题。
与已有方法相比,本发明提供的方法在原理上主要有如下不同:
(1)构造矩阵分解模型的思路不同。已有方法主要考虑如何更好的拟合用户的评分数据,而本发明提出的方法则重点考虑如何构建评分数据的生成机制。
(2)使用信任矩阵的方式不同。现有方法试图采用信任矩阵更加准确的计算用户偏好的相似度,而本发明提出的方法则利用信任矩阵建模信任传播如何影响用户对项目的评价。
附图说明
图1 基于信任的社会化协同过滤推荐方法的流程示意图。
图2 用户-项目评分矩阵示意图。
图3 用户信任网络的矩阵示意图。
图4 训练模型Truster-MF的流程示意图。
图5 训练模型Trustee-MF的流程示意图。
图6 针对不同用户组的评分预测实验结果。
表1 给出了Epinions数据集的统计信息。
表2给出了作为推荐性能对比分析使用的7个现有推荐方法。
表3给出了不同推荐方法的参数设置。
表4给出了各个推荐方法在Epinions数据集上的实验结果。
表5给出了在第一种实验策略下各个推荐方法解决冷启动问题的效果。
表6给出了在第二种实验策略下各个推荐方法解决冷启动问题的效果。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细说明。实施例仅用于说明本发明,但不用来限制本发明的应用范围。本发明实施例的前提是已获得了用户对项目的评分数据(用户-项目矩阵)与用户信任关系数据(用户信任网络)。
本发明的基本思想可描述如下:
在信任网络中,信任关系是有向的。相应的,信任行为分为两种:“信任他人”和“被他人信任”,分别由信任向量和被信任向量刻画。例如,若用户A以强度w信任用户B,那么w可被建模成A的信任向量与B的被信任向量的内积。实际应用中,通过社交网站提供的界面,用户一方面可以通过他对项目的评价(撰写评论或给出评分)去影响他人,另一方面也可通过浏览别人的评价被他人所影响,因而用户的信任向量和被信任向量实际上还分别刻画了用户的“浏览”行为和“评价”行为。分别选取用户的信任向量和被信任向量作为联系用户-项目矩阵和信任关系矩阵的“桥梁”,采用矩阵分解技术,同时分解用户-项目矩阵和信任矩阵,得到面向浏览行为的评分预测模型和面向评价行为的评分预测模型,进而将两个模型融合,得到综合浏览和评价行为的评分预测模型。
图1,一种基于信任的社会化协同过滤推荐方法的流程开始于步骤101。
步骤102:根据用户-项目矩阵和信任关系矩阵,构建用户和项目的特征向量,具体如下:
假设推荐系统中有m个用户和n个项目。令矩阵R=[Rij]m×n表示用户-项目评分矩阵,其中Rij表示用户i对项目j的评分,评分值通常为1到5之间的整数。图2为一个用户-项目评分矩阵的示意图,其中U1,…U5表示用户,I1,…,I6表示项目,用户评分有5个等级,分别用1至5的整数表示,如果用户对某项目评分,则在相应位置标出评分等级,矩阵中的空位表示用户没有对项目进行评分。图中用户U1I1评分为3,对I3评分为2。 
令集合Ω={(i,j): Rij≠0}表示观察到的评分在评分矩阵R中的位置。通过矩阵分解将用户和项目投影到一个d维空间。令d×n维矩阵V表示项目特征矩阵,V的第jVj表示项目j的特征向量,刻画了项目j是什么类型的项目。令d×m维矩阵U表示用户偏好特征矩阵,U的第iUi表示用户i的偏好特征向量,刻画了用户i喜欢何种类型的项目。则用户i对项目j的评分Rij可表示为UiTVj,评分矩阵R可表示为UTV
令矩阵T=[Tik]m×m表示由m个用户构成的信任网络,其中Tik表示用户i对用户k的信任权重,“0”表示用户i不信任用户k,“1”表示用户i信任用户k。由于用户间的相互信任程度不见得相同,T通常是不对称的。图3为一个用户信任网络的矩阵表示示意图,其中U1,…U5分别为5个用户,用户U1U2U3存在信任关系。
Ψ={(i,k): Tik≠0}表示观察到的信任关系在矩阵T中的位置。通过矩阵分解为每个用户i构建两个d维特征向量BiWiBi表示用户i的信任特征向量,刻画了用户i信任别人的行为,或者刻画了用户i喜欢浏览何种类型的项目。Wi表示用户i的被信任特征向量,刻画了用户i被其他用户信任的行为,或者刻画了用户i喜欢评价何种类型的项目。则用户i对用户k的信任关系Tik可表示为BiTWk。   令d×m维矩阵B表示由m个向量Bi组成的矩阵(称为信任矩阵),d×m维矩阵W表示由mWi组成的矩阵(称为被信任矩阵),则信任网络T可表示为BTW
步骤103:构建面向用户浏览行为的评分预测模型Truster-MF
使用社交网站提供的界面,用户可以浏览其他用户对其感兴趣项目的评价,通过浏览行为,用户对项目的评价会受到其他用户(尤其是其信任的用户)的影响,为了刻画这一影响过程,我们构建面向用户浏览行为的评分预测模型(命名为Truster-MF)。
由于评分矩阵R和信任网络T涉及相同的m个用户,因而可以通过共享用户的特征空间对RT同时进行矩阵分解。这里将信任矩阵B作为共享的用户特征空间,即用B去近似用户的偏好特征矩阵U,这意味着用户倾向于浏览的项目很可能是其偏好的项目。则评分矩阵R可表示为BTV,同时信任网络T可表示为BTW。Truster-MF模型的数学形式表示如下,通过最小化目标函数?实现同时分解矩阵RT
 
                                                      
           (1)
其中,λT控制评分偏好和信任关系在模型中的权重;λ控制模型的复杂度;nbinvj分别表示用户i和项目j已有的评分数量;mbi表示用户i信任的用户数量,mwk表示信任用户k的用户数量。为了方便模型的训练,引入了逻辑函数g(x)=1/(1+exp(-x)),将x的值规范化在区间[0, 1]中。
步骤104:构建面向用户评价行为的评分预测模型Trustee-MF
使用社交网站提供的界面,用户可以对其感兴趣项目产生评价,如撰写评论或给出评分。通过评价行为,用户对项目的评价会影响到其他用户(尤其是信任其的用户),为了刻画这一影响过程,我们构建面向用户评价行为的评分预测模型(命名为Trustee-MF)。
由于评分矩阵R和信任网络T涉及相同的m个用户,因而可以通过共享用户的特征空间对RT同时进行矩阵分解。这里将被信任矩阵W作为共享的用户特征空间,即用W去近似用户的偏好特征矩阵U,这意味着用户倾向于给出评价的项目很可能是其偏好的项目。则评分矩阵R可表示为WTV,同时信任网络T可表示为BTW。Trustee-MF模型的数学形式表示如下,通过最小化目标函数?实现同时分解矩阵RT
 
        
         (2)
其中,λTλg(x)的含义同(1)式;nwinvj分别表示用户i和项目j已有的评分数量;mbk表示用户k信任的用户数量,mwi表示信任用户i的用户数量。
步骤105:根据观察到的用户-项目矩阵和信任矩阵训练Truster-MF模型,如图4所示,训练模型的过程开始于步骤401,具体如下:
步骤402:设置参数dλ, λT 和α的值,其中α为下降速率;
   步骤403:用服从[0,1]均匀分布的随机数初始化矩阵B,VW
步骤404:根据(1)式中的目标函数,按照如下公式迭代更新矩阵B,VW
 , 
 , 
 , 
步骤405:判断迭代过程是否收敛。若没有收敛,则转至步骤404,否则结束算法。
步骤106:根据观察到的用户-项目矩阵和信任矩阵训练Trustee-MF模型,如图5所示,训练模型的过程开始于步骤501,具体如下:
步骤502:设置参数dλ, λT 和α的值,其中α为下降速率;
步骤503:用服从[0,1]均匀分布的随机数初始化矩阵B,VW
步骤504:根据(2)式中的目标函数,按照如下公式迭代更新矩阵B,VW
 , 
 , 
 , 
步骤505:判断迭代过程是否收敛。若没有收敛,则转至步骤504,否则结束算法。
步骤107:融合训练后的truster-MF和truste e-MF模型,构建综合考虑浏览和评价两种行为的评分预测模型TrustMF,具体如下:
BrVr为训练truster-MF得到的特征矩阵,WeVe为训练trustee-MF得到的特征矩阵,通过如下公式(3)融合两个模型,得到最终预测模型TrustMF,即预测用户i对项目j的评分为:
                     (3)
其中, 是TrustMF模型为用户i对项目j所做出的预测评分,Rmax指得分的最大值(通常设为5)。
本实施例通过充分分析用户信任关系对评价行为的影响,利用矩阵分解技术融合用户的评分数据与信任关系数据,可有效缓解了现有协同过滤推荐面临的数据稀疏和冷启动等主要问题。
以上实施例仅用于说明本发明而非对其进行限制,有关领域的技术人员在不脱离本发明精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围具体由权利要求限定。
例1 将本发明应用于真实数据集Epinions  
Epinions.com是一个提供社会网络服务的网站,用户可以在网站上对项目进行评价(撰写评论和给出评分),也可以将其他用户加入到自己的信任列表中。本实验用到的Epinions数据集包含49289个用户对139738个项目的664823条评分信息,以及这些用户之间的487183条信任关系信息。该数据集中,评分数据的密度为0.0097%,信任数据的密度为0.0201%。表1给出了该数据集的统计信息。
例1将本发明方法应用到Epinions数据集上进行验证,具体采用5-折交叉验证方法(5-fold cross validation),将数据集的80%作为训练集,其余20%作为测试集。采用平均绝对误差(MAE)和均方根误差(RMSE)两个指标评价预测方法的准确性,分别定义如下,MAE和RMSE的值越小表明预测的误差越小,算法预测得越准确。

实验选取7个现有的推荐方法,包括2个常用的协同过滤推荐方法(UserMean和ItemMean),1个基于用户-项目矩阵分解方法(PMF)和4个最新的基于用户-项目矩阵和信任网络的推荐方法(SoRec, RSTE, SocialMF, SR2PCC),与本发明提出的TrustMF方法进行对比,7个对比方法的名字和描述如表2所示。
表3给出了实验中各个方法的参数值。
表4给出了各方法针对所有用户的平均预测性能。如表4所示,本发明提出的方法TrustMF表现最优,相对其它方法能明显提高评分预测的准确度。例如,在d取5时(将用户和项目投影到一个5维空间),与UserMean,ItemMean,PMF,SoRec,RSTE,SocialMF和SR2PCC相比,TrustMF的MAE误差分别减小了12.8%、13.7%、2.7%、10.7%、4.9%、7.0%和2.8%,RMSE误差分别减小了13.0%、14.4%、2.2%、8.0%、4.4%、4.7%和3.6%。该实验结果充分说明了本发明更加有效地融合了评分数据和信任数据,显著提高了基于信任的社会化推荐方法的推荐质量。
为了测试各方法解决冷启动问题的能力,采用两种策略进行实验。第一种是,将训练集里评分数小于或等于5的用户定义为冷启动用户,计算各方法在这组冷启动用户上的评分预测误差。实验结果如表5所示,本发明提出的方法TrustMF表现最优。例如,在d取5时,与UserMean,ItemMean,PMF,SoRec,RSTE,SocialMF和SR2PCC相比,TrustMF的MAE误差分别减小了22.8%、4.4%、2.7%、2.4%、2.6%、18.7%和3.8%,RMSE误差分别减小了26.3%、9.0%、2.8%、3.2%、3.1%、15.3%、6.7%。
第二种策略是选取数据集中评分数在50到70之间的用户,对于其中的每一个用户,随机抽取5个评分保留在训练集里,其余的评分作为测试集,计算评分的预测误差。实验结果如表6所示,本发明方法TrustMF表现最优,和其他对比方法相比,评分预测的MAE误差和RMSE误差都是最低的。
从以上两个实验结果可以看出,本发明方法针对冷启动用户表现最好,相比于现有方法,明显提高了预测准确度。这说明本发明对于评分数据稀疏和冷启动问题严重的数据也能取得较好的推荐效果。
下面通过试验进一步验证各方法利用信任数据的效率。根据用户在信任网络中“度”的大小(可理解为用户拥有信任关系的数量),将用户分为不同的组6组:“度在0-5之间的用户”,“度在6-10之间的用户”,“度在11-20之间的用户”,“度在21-40之间的用户”,“度在41-100之间的用户”和 “度在101-500之间的用户”。针对每一组用户,分别计算其在测试集中的评分预测误差。实验结果如图6所示,从中可以看出,针对不同组的用户,本发明提出的方法TrustMF都能给出较好的预测。相比其他方法,TrustMF针对大多数用户都表现最好,尤其对于RMSE指标改善明显。此外,对于度小于10的用户,TrustMF方法仍能给出稳定的预测,且优于其他现有方法。以上实验结果说明,相对于对比方法,本发明能更有效地利用稀疏的信任数据,提供质量更好的推荐。
 
表1

表2

表3 
方法参数值PMFλU=λV=0.001SoRecλUV=λZ=0.001, λC=1RSTEλUV=0.001, α=0.4SocialMFλUV=0.001, λT =1SR2PCCλ12=0.001, β=0.001TrustMFλ=0.001, λT =1
表4  

表5 

表6
方法MAERMSE PMF0.8787 1.1039 SoRec1.0060 1.2351 RSTE0.8763 1.1118 SocialMF0.8684 1.0960 SR2PCC0.8827 1.1341 TrustMF0.8224 1.0757

基于信任的社会化协同过滤推荐方法.pdf_第1页
第1页 / 共18页
基于信任的社会化协同过滤推荐方法.pdf_第2页
第2页 / 共18页
基于信任的社会化协同过滤推荐方法.pdf_第3页
第3页 / 共18页
点击查看更多>>
资源描述

《基于信任的社会化协同过滤推荐方法.pdf》由会员分享,可在线阅读,更多相关《基于信任的社会化协同过滤推荐方法.pdf(18页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 103399858 A (43)申请公布日 2013.11.20 CN 103399858 A *CN103399858A* (21)申请号 201310272543.4 (22)申请日 2013.07.01 G06F 17/30(2006.01) G06Q 30/02(2012.01) (71)申请人 吉林大学 地址 130012 吉林省长春市前进大街 2699 号 (72)发明人 杨博 雷余 (74)专利代理机构 长春市四环专利事务所 22103 代理人 郭耀辉 (54) 发明名称 基于信任的社会化协同过滤推荐方法 (57) 摘要 一种基于信任的社会化协同过滤推荐。

2、方法, 融合用户对项目的评分矩阵和用户信任网络两种 数据为目标用户进行高质量的推荐, 主要包括如 下步骤 : 构建用户与项目的特征向量 ; 构建面向 用户浏览行为的评分预测模型 Truster-MF ; 构建 面向用户评价行为的评分预测模型 Trustee-MF ; 训练模型 Truster-MF ; 训练模型 Trustee-MF ; 融 合训练后的 Truster-MF 和 Trustee-MF, 构建综 合考虑浏览和评价两种行为的评分预测模型, 本 发明为基于信任的社会化推荐提供了一种全新方 法, 与现有方法相比, 具有如下主要优点 :(1) 有 效缓解了协同过滤推荐面临的数据稀疏和冷启。

3、动 两个主要问题, 具有更好的推荐质量 ;(2) 算法简 洁高效, 易于实施, 特别适用于大型电子商务网 站。 (51)Int.Cl. 权利要求书 3 页 说明书 8 页 附图 6 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书3页 说明书8页 附图6页 (10)申请公布号 CN 103399858 A CN 103399858 A *CN103399858A* 1/3 页 2 1. 一种基于信任的社会化协同过滤推荐方法, 其特征在于, 包括如下步骤 : 步骤 101 : 根据用户 - 项目矩阵和用户信任网络构建用户与项目的特征向量 ; 步骤 102 : 构建面向用。

4、户浏览行为的评分预测模型 Truster-MF ; 步骤 103 : 构建面向用户评价行为的评分预测模型 Trustee-MF ; 步骤 104 : 训练模型 Truster-MF ; 步骤 105 : 训练模型 Trustee-MF ; 步骤 106 : 融合 Truster-MF 和 Trustee-MF, 构建综合考虑浏览和评价两种行为的评分 预测模型 TrustMF。 2. 根据权利要求 1 所述的基于信任的社会化协同过滤推荐方法, 其特征在于, 该方法 采用如下基本原理构建用户的兴趣模型并做推荐 : 在信任网络中, 信任关系是有向的, 相应的, 信任行为分为两种 :“信任他人” 和 。

5、“被他人 信任” , 分别由信任向量和被信任向量刻画, 用户 A 信任用户 B 的强度可被建模成 A 的信任 向量与 B 的被信任向量的内积 ; 实际应用中, 通过社交网站提供的界面, 用户一方面可以通 过他对项目的评价 (撰写评论或给出评分) 去影响他人, 另一方面也可通过浏览别人的评价 被他人所影响, 因而用户的信任向量和被信任向量实际上还分别刻画了用户的 “浏览” 行为 和 “评价” 行为 ; 分别选取用户的信任向量和被信任向量作为联系用户 - 项目矩阵和信任关 系矩阵的 “桥梁” , 采用矩阵分解技术, 同时分解用户 - 项目矩阵和信任矩阵, 得到面向浏览 行为的评分预测模型和面向评价。

6、行为的评分预测模型, 进而将两个模型融合, 得到综合浏 览和评价行为的评分预测模型。 3. 根据权利要求 1 所述的基于信任的社会化协同过滤推荐方法, 其特征在于, 按照如 下方法构建用户与项目的特征向量 : 假设推荐系统中有m个用户和n个项目 ; 令矩阵R=Rijmn表示用户 - 项目评分矩阵, 其中Rij表示用户i对项目j的评分, 评分值为 1 到Rmax之间的整数 (Rmax通常取值 5) ; 令集合=(i,j): Rij0表示观察到的评分在评分矩阵R中的位置 ; 通过矩阵分解 将用户和项目投影到一个d维空间 ; 令dn维矩阵V表示项目特征矩阵,V的第j列Vj表 示项目j的特征向量, 刻。

7、画了项目j是什么类型的项目 ; 令dm维矩阵U表示用户偏好特 征矩阵,U的第i列Ui表示用户i的偏好特征向量, 刻画了用户i喜欢何种类型的项目 ; 则 用户i对项目j的评分Rij可表示为UiTVj, 评分矩阵R可表示为UTV, 其中UT表矩阵U的转 置矩阵 ; 令矩阵T=Tikmm表示m个用户构成的信任网络, 其中Tik表示用户i对用户k的信任 权重,“0” 表示用户i不信任用户k,“1” 表示用户i信任用户k, 由于用户间的相互信任程 度不见得相同,T通常是不对称的 ; 令=(i,k): Tik0表示观察到的信任关系在矩阵T中的位置, 通过矩阵分解为每 个用户i构建两个d维特征向量Bi和Wi。

8、,Bi表示用户i的信任特征向量, 刻画了用户i信 任别人的行为, 或者刻画用户i喜欢浏览何种类型的项目,Wi表示用户i的被信任特征向 量, 刻画了用户i被其他用户信任的行为, 或者刻画用户i喜欢评价何种类型的项目, 则用 户i对用户k的信任关系Tik可表示为BiTWk, 令dm维矩阵B表示由m个向量Bi组成的矩 阵 (称为信任矩阵) ,dm维矩阵W表示由m个Wi组成的矩阵 (称为被信任矩阵) , 则信任网 络T可表示为BTW。 权 利 要 求 书 CN 103399858 A 2 2/3 页 3 4. 根据权利要求 1 所述的基于信任的社会化协同过滤推荐方法, 其特征在于, 按照如 下方法构建。

9、面向用户浏览行为的评分预测模型 Truster-MF : 将信任矩阵B作为共享的用户特征空间, 即用B去近似用户的偏好特征矩阵U, 这意味 着用户倾向于浏览的项目很可能是其偏好的项目 ; 则评分矩阵R可表示为BTV, 同时信任网 络T可表示为BTW,Truster-MF 模型的数学形式表示如下, 通过最小化目标函数l实现同时 分解矩阵R和T; (1) 其中,T控制评分偏好和信任关系在模型中的权重 ;控制模型的复杂度 ;nbi和nvj 分别表示用户i和项目j已有的评分数量 ;mbi表示用户i信任的用户数量,mwk表示信任用 户k的用户数量, 为了方便模型的训练, 引入了逻辑函数g(x)=1/(1。

10、+exp(-x), 将x的值规 范化在区间 0, 1 中。 5. 根据权利要求 1 所述的基于信任的社会化协同过滤推荐方法, 其特征在于, 按照如 下方法构建面向用户评价行为的评分预测模型 Trustee-MF : 将被信任矩阵W作为共享的用户特征空间, 即用W去近似用户的偏好特征矩阵U, 这意 味着用户倾向于给出评价的项目很可能是其偏好的项目, 则评分矩阵R可表示为WTV, 同时 信任网络T可表示为BTW,Trustee-MF 模型的数学形式表示如下, 通过最小化目标函数l实 现同时分解矩阵R和T; (2) 其中,T, 和g(x) 的含义同 (1) 式 ;nwi和nvj分别表示用户i和项目j。

11、已有的评分 数量 ;mbk表示用户k信任的用户数量,mwi表示信任用户i的用户数量。 6. 根据权利要求 1 所述的基于信任的社会化协同过滤推荐方法, 其特征在于, 按照如 下方法训练模型 Truster-MF : 601 : 设置参数d, , T 和的值, 其中为下降速率 ; 602 : 用服从 0,1 均匀分布的随机数初始化矩阵B,V和W; 603 : 根据 (1) 式中的目标函数, 按照如下公式迭代更新矩阵B,V和W: , 权 利 要 求 书 CN 103399858 A 3 3/3 页 4 , , 604 : 判断迭代过程是否收敛, 若没有则转至步骤 603, 否则结束算法。 7. 根。

12、据权利要求 1 所述的基于信任的社会化协同过滤推荐方法, 其特征在于, 按照如 下方法训练模型 Trustee-MF : 701 : 设置参数d, , T 和的值, 其中为下降速率 ; 702 : 用服从 0,1 均匀分布的随机数初始化矩阵B,V和W; 703 : 根据 (2) 式中的目标函数, 按照如下公式迭代更新矩阵B,V和W: , , , 704 : 判断迭代过程是否收敛, 若没有则转至步骤 703, 否则结束算法。 8. 根据权利要求 1 所述的基于信任的社会化协同过滤推荐方法, 其特征在于, 按照如 下方法融合训练后的 Truster-MF 和 Trustee-MF, 构建综合考虑浏。

13、览和评价两种行为的评 分预测模型 TrustMF : (3) 其中,Br和Vr为训练 truster-MF 得到的特征矩阵,We和Ve为训练 trustee-MF 得到的 特征矩阵, 是 TrustMF 模型为用户i对项目j所做出的预测评分,Rmax指得分的最大值 (通常设为 5) 。 权 利 要 求 书 CN 103399858 A 4 1/8 页 5 基于信任的社会化协同过滤推荐方法 技术领域 0001 本发明属于信息检索领域, 尤其涉及协同过滤推荐方法。 背景技术 0002 推荐系统能够主动向用户推送其感兴趣的项目 (如新闻、 图书、 电影和音乐等) , 是 解决互联网信息过载的有效工具。

14、, 已广泛应用于各种电子商务网站和社交网络中, 产生了 巨大的经济效益。 0003 推荐系统的核心是推荐算法。 目前已存在多种推荐算法, 主要包括协同过滤推荐、 基于内容的推荐和混合推荐。 在所有的推荐算法中, 协同过滤算法被认为最为简单有效, 已 成功应用于许多大型商业推荐系统中。协同过滤的基本原理是 : 将与目标用户偏好相似的 用户所喜欢的项目作为推荐 (基于用户的协同过滤) , 或者将与目标用户所喜欢内容相似的 项目作为推荐 (基于项目的协同过滤) 。在实际应用中, 协同过滤算法面临着 “数据稀疏” 和 “冷启动” 两个主要问题, 它们能够在多大程度上得到缓解决定了协同过滤推荐算法性能的。

15、 好坏。一般而言,“数据稀疏” 是指系统可利用的用户评分数据很少, 导致推荐算法所依赖的 用户 - 项目矩阵非常稀疏 (矩阵中零元素很多, 而非零元素很少) ;“冷启动” 是指系统对新 用户的偏好知之甚少, 因而难以对其做出准确的推荐。 0004 随着 Web2.0 技术的快速发展, 用户除了贡献对各类项目的评分信息外, 还通过社 交网络平台产生和积累了大量的行为数据。将这些行为数据视为用户评分数据的重要补 充, 提供除评分之外的额外有用信息, 能够帮助系统更好的了解用户偏好, 改进推荐模型和 算法的性能, 有效缓解上述的 “数据稀疏” 和 “冷启动” 问题。信任网络是用户在社交网站 上产生的。

16、一类重要行为信息, 描述了用户间的相互信任关系。由于人们更倾向于采纳来自 信任方的推荐, 信任网络对用户偏好的相互影响发挥着关键作用。如何充分利用信任网络 帮助推荐系统更好的建立用户偏好模型, 提高推荐质量, 逐渐成为研究者关注的问题, 这方 面的主要工作介绍如下。 0005 2006 年, Golbeck 等人采用信任网络, 根据目标用户信任的用户对项目的评分估 计目标用户对项目的评分。2007 年, Avesani 等人基于信任网络, 采用有限步长的信任传 播方法, 估计出目标用户对其他用户的信任值, 进而根据估计信任值为目标用户预测评分。 2010 年, Jebrin 等人通过用户之间的。

17、信任关系和用户对项目的评分信息计算每个用户的 “全局信誉” 值, 进而利用 “全局信誉” 值较高的用户对项目的评分去估计目标用户对项目的 评分。 0006 上述方法的可扩展性差, 很难应用于包含大规模用户和项目的实际推荐系统。近 年来, 人们提出了基于矩阵分解的推荐方法, 能有效处理大规模数据。 这类方法利用用户信 任关系数据将原始的用户 - 项目矩阵分解为两个规模更小的矩阵, 进而利用两个小规模矩 阵的乘积矩阵预测原始矩阵中的空缺元素, 以此方式为目标用户进行评分预测。2008 年, Ma 等人采用概率因子分析技术, 基于评分数据和信任网络, 提出了一个概率矩阵分解算法 SocRec。200。

18、9 年, Ma 等人提出 RSTE 算法, 同时考虑目标用户的兴趣以及其信任的朋友的兴 说 明 书 CN 103399858 A 5 2/8 页 6 趣, 将目标用户的评分看作由两部分组成, 一部分根据用户自己的兴趣计算, 另一部分根据 信任网络计算。2010 年, Jamali 等人提出 SocialMF 算法, 将用户特征矩阵分解为两个矩阵 的线性组合, 一个刻画用户自身的特征, 另一个刻画用户信任的其它用户的特征。2011 年, Ma 等人提出 SR2PCC算法, 该法引入了一种正则化方法, 利用用户的信任关系, 对用户的特征 向量进行约束。 0007 上述基于矩阵分解的推荐算法大都假设。

19、目标用户信任的用户具有与其相似的兴 趣偏好。然而, 该假设在实际应用中并非总是成立。此外, 上述方法在构造矩阵分解模型和 算法时, 强调的是如何更好拟合观察到的评分数据, 而忽略了评分数据的生成机制, 没有考 虑所观察到的用户对项目的评价是如何基于其他用户的评价产生的。由于以上主要原因, 现有基于矩阵分解的推荐方法对信任关系数据利用有限, 推荐质量提升不高, 未能很好的 解决协同过滤所所面临的数据稀疏和冷启动问题。 发明内容 0008 用户的对项目的评价行为会相互影响。当某个用户对项目进行评分时, 会关注其 他用户对相同项目的评价 (包括对项目的评分和评论) , 用户信任的人的评价更容易影响该。

20、 用户对项目的印象以及随后对该项目的评价 ; 反之, 该用户对项目的评价又会通过信任网 络影响到其他用户。基于以上观察, 本发明提供了一种全新的基于信任的社会化协同过滤 推荐方法, 该方法能够有机融合用户对项目的评分数据 (即用户 - 项矩阵) 和用户之间的信 任关系 (即信任网络) , 为目标用户做出高质量的推荐。实验表明, 该方法能有效缓解协同过 滤推荐方法所面临的数据稀疏和冷启动问题。 0009 与已有方法相比, 本发明提供的方法在原理上主要有如下不同 : (1) 构造矩阵分解模型的思路不同。已有方法主要考虑如何更好的拟合用户的评分数 据, 而本发明提出的方法则重点考虑如何构建评分数据的。

21、生成机制。 0010 (2) 使用信任矩阵的方式不同。现有方法试图采用信任矩阵更加准确的计算用户 偏好的相似度, 而本发明提出的方法则利用信任矩阵建模信任传播如何影响用户对项目的 评价。 附图说明 0011 图 1 基于信任的社会化协同过滤推荐方法的流程示意图。 0012 图 2 用户 - 项目评分矩阵示意图。 0013 图 3 用户信任网络的矩阵示意图。 0014 图 4 训练模型 Truster-MF 的流程示意图。 0015 图 5 训练模型 Trustee-MF 的流程示意图。 0016 图 6 针对不同用户组的评分预测实验结果。 0017 表 1 给出了 Epinions 数据集的统。

22、计信息。 0018 表 2 给出了作为推荐性能对比分析使用的 7 个现有推荐方法。 0019 表 3 给出了不同推荐方法的参数设置。 0020 表 4 给出了各个推荐方法在 Epinions 数据集上的实验结果。 0021 表 5 给出了在第一种实验策略下各个推荐方法解决冷启动问题的效果。 说 明 书 CN 103399858 A 6 3/8 页 7 0022 表 6 给出了在第二种实验策略下各个推荐方法解决冷启动问题的效果。 具体实施方式 0023 下面结合附图和实施例, 对本发明的具体实施方式作进一步详细说明。实施例仅 用于说明本发明, 但不用来限制本发明的应用范围。本发明实施例的前提是已。

23、获得了用户 对项目的评分数据 (用户 - 项目矩阵) 与用户信任关系数据 (用户信任网络) 。 0024 本发明的基本思想可描述如下 : 在信任网络中, 信任关系是有向的。相应的, 信任行为分为两种 :“信任他人” 和 “被他 人信任” , 分别由信任向量和被信任向量刻画。例如, 若用户 A 以强度w信任用户 B, 那么w 可被建模成 A 的信任向量与 B 的被信任向量的内积。实际应用中, 通过社交网站提供的界 面, 用户一方面可以通过他对项目的评价 (撰写评论或给出评分) 去影响他人, 另一方面也 可通过浏览别人的评价被他人所影响, 因而用户的信任向量和被信任向量实际上还分别刻 画了用户的 。

24、“浏览” 行为和 “评价” 行为。分别选取用户的信任向量和被信任向量作为联系 用户-项目矩阵和信任关系矩阵的 “桥梁” , 采用矩阵分解技术, 同时分解用户-项目矩阵和 信任矩阵, 得到面向浏览行为的评分预测模型和面向评价行为的评分预测模型, 进而将两 个模型融合, 得到综合浏览和评价行为的评分预测模型。 0025 图 1, 一种基于信任的社会化协同过滤推荐方法的流程开始于步骤 101。 0026 步骤 102 : 根据用户 - 项目矩阵和信任关系矩阵, 构建用户和项目的特征向量, 具 体如下 : 假设推荐系统中有m个用户和n个项目。令矩阵R=Rijmn表示用户 - 项目评分矩 阵, 其中Ri。

25、j表示用户i对项目j的评分, 评分值通常为 1 到 5 之间的整数。图 2 为一个用 户 - 项目评分矩阵的示意图, 其中U1,U5表示用户,I1,I6表示项目, 用户评分有 5 个 等级, 分别用1至5的整数表示, 如果用户对某项目评分, 则在相应位置标出评分等级, 矩阵 中的空位表示用户没有对项目进行评分。图中用户U1对I1评分为 3, 对I3评分为 2。 0027 令集合=(i,j): Rij 0 表示观察到的评分在评分矩阵R中的位置。通过矩 阵分解将用户和项目投影到一个d维空间。令dn维矩阵V表示项目特征矩阵,V的第j 列Vj表示项目j的特征向量, 刻画了项目j是什么类型的项目。令dm。

26、维矩阵U表示用 户偏好特征矩阵,U的第i列Ui表示用户i的偏好特征向量, 刻画了用户i喜欢何种类型的 项目。则用户i对项目j的评分Rij可表示为UiTVj, 评分矩阵R可表示为UTV。 0028 令矩阵T=Tikmm表示由m个用户构成的信任网络, 其中Tik表示用户i对用户k 的信任权重,“0” 表示用户i不信任用户k,“1” 表示用户i信任用户k。由于用户间的相互 信任程度不见得相同,T通常是不对称的。图 3 为一个用户信任网络的矩阵表示示意图, 其 中U1,U5分别为 5 个用户, 用户U1对U2和U3存在信任关系。 0029 令=(i,k): Tik 0 表示观察到的信任关系在矩阵T中的。

27、位置。通过矩阵分 解为每个用户i构建两个d维特征向量Bi和Wi。Bi表示用户i的信任特征向量, 刻画了用 户i信任别人的行为, 或者刻画了用户i喜欢浏览何种类型的项目。Wi表示用户i的被信 任特征向量, 刻画了用户i被其他用户信任的行为, 或者刻画了用户i喜欢评价何种类型的 项目。则用户i对用户k的信任关系Tik可表示为BiTWk。 令dm维矩阵B表示由m个 向量Bi组成的矩阵 (称为信任矩阵) ,dm维矩阵W表示由m个Wi组成的矩阵 (称为被信任 说 明 书 CN 103399858 A 7 4/8 页 8 矩阵) , 则信任网络T可表示为BTW。 0030 步骤 103 : 构建面向用户浏。

28、览行为的评分预测模型 Truster-MF 使用社交网站提供的界面, 用户可以浏览其他用户对其感兴趣项目的评价, 通过浏览 行为, 用户对项目的评价会受到其他用户 (尤其是其信任的用户) 的影响, 为了刻画这一影 响过程, 我们构建面向用户浏览行为的评分预测模型 (命名为 Truster-MF) 。 0031 由于评分矩阵R和信任网络T涉及相同的m个用户, 因而可以通过共享用户的特 征空间对R和T同时进行矩阵分解。这里将信任矩阵B作为共享的用户特征空间, 即用B 去近似用户的偏好特征矩阵U, 这意味着用户倾向于浏览的项目很可能是其偏好的项目。 则 评分矩阵R可表示为BTV, 同时信任网络T可表。

29、示为BTW。Truster-MF 模型的数学形式表示 如下, 通过最小化目标函数l实现同时分解矩阵R和T。 0032 (1) 其中,T控制评分偏好和信任关系在模型中的权重 ;控制模型的复杂度 ;nbi和nvj 分别表示用户i和项目j已有的评分数量 ;mbi表示用户i信任的用户数量,mwk表示信任用 户k的用户数量。 为了方便模型的训练, 引入了逻辑函数g(x)=1/(1+exp(-x), 将x的值规 范化在区间 0, 1 中。 0033 步骤 104 : 构建面向用户评价行为的评分预测模型 Trustee-MF 使用社交网站提供的界面, 用户可以对其感兴趣项目产生评价, 如撰写评论或给出评 分。

30、。通过评价行为, 用户对项目的评价会影响到其他用户 (尤其是信任其的用户) , 为了刻画 这一影响过程, 我们构建面向用户评价行为的评分预测模型 (命名为 Trustee-MF) 。 0034 由于评分矩阵R和信任网络T涉及相同的m个用户, 因而可以通过共享用户的特 征空间对R和T同时进行矩阵分解。这里将被信任矩阵W作为共享的用户特征空间, 即用W 去近似用户的偏好特征矩阵U, 这意味着用户倾向于给出评价的项目很可能是其偏好的项 目。则评分矩阵R可表示为WTV, 同时信任网络T可表示为BTW。Trustee-MF 模型的数学形 式表示如下, 通过最小化目标函数l实现同时分解矩阵R和T。 003。

31、5 (2) 其中,T, 和g(x) 的含义同 (1) 式 ;nwi和nvj分别表示用户i和项目j已有的评分 数量 ;mbk表示用户k信任的用户数量,mwi表示信任用户i的用户数量。 0036 步骤105 : 根据观察到的用户-项目矩阵和信任矩阵训练Truster-MF模型, 如图4 所示, 训练模型的过程开始于步骤 401, 具体如下 : 说 明 书 CN 103399858 A 8 5/8 页 9 步骤 402 : 设置参数d, , T 和的值, 其中为下降速率 ; 步骤 403 : 用服从 0,1 均匀分布的随机数初始化矩阵B,V和W; 步骤 404 : 根据 (1) 式中的目标函数, 按。

32、照如下公式迭代更新矩阵B,V和W: , , , 步骤 405 : 判断迭代过程是否收敛。若没有收敛, 则转至步骤 404, 否则结束算法。 0037 步骤106 : 根据观察到的用户-项目矩阵和信任矩阵训练Trustee-MF模型, 如图5 所示, 训练模型的过程开始于步骤 501, 具体如下 : 步骤 502 : 设置参数d, , T 和的值, 其中为下降速率 ; 步骤 503 : 用服从 0,1 均匀分布的随机数初始化矩阵B,V和W; 步骤 504 : 根据 (2) 式中的目标函数, 按照如下公式迭代更新矩阵B,V和W: , , , 步骤 505 : 判断迭代过程是否收敛。若没有收敛, 则。

33、转至步骤 504, 否则结束算法。 0038 步骤 107 : 融合训练后的 truster-MF 和 truste e-MF 模型, 构建综合考虑浏览和 评价两种行为的评分预测模型 TrustMF, 具体如下 : 令Br和Vr为训练 truster-MF 得到的特征矩阵,We和Ve为训练 trustee-MF 得到的特 征矩阵, 通过如下公式 (3) 融合两个模型, 得到最终预测模型 TrustMF, 即预测用户i对项目 j的评分为 : (3) 其中, 是 TrustMF 模型为用户i对项目j所做出的预测评分,Rmax指得分的 最大值 (通常设为 5) 。 0039 本实施例通过充分分析用户。

34、信任关系对评价行为的影响, 利用矩阵分解技术融合 说 明 书 CN 103399858 A 9 6/8 页 10 用户的评分数据与信任关系数据, 可有效缓解了现有协同过滤推荐面临的数据稀疏和冷启 动等主要问题。 0040 以上实施例仅用于说明本发明而非对其进行限制, 有关领域的技术人员在不脱离 本发明精神和范围的情况下, 还可以做出各种变化和变型, 因此所有等同的技术方案也属 于本发明的范畴, 本发明的专利保护范围具体由权利要求限定。 0041 例 1 将本发明应用于真实数据集 Epinions E 是一个提供社会网络服务的网站, 用户可以在网站上对项目进行评 价 (撰写评论和给出评分) , 。

35、也可以将其他用户加入到自己的信任列表中。本实验用到的 Epinions 数据集包含 49289 个用户对 139738 个项目的 664823 条评分信息, 以及这些用户 之间的487183条信任关系信息。 该数据集中, 评分数据的密度为0.0097%, 信任数据的密度 为 0.0201%。表 1 给出了该数据集的统计信息。 0042 例 1 将本发明方法应用到 Epinions 数据集上进行验证, 具体采用 5- 折交叉验证 方法 (5-fold cross validation) , 将数据集的 80% 作为训练集, 其余 20% 作为测试集。采 用平均绝对误差 (MAE) 和均方根误差 。

36、(RMSE) 两个指标评价预测方法的准确性, 分别定义如 下, MAE 和 RMSE 的值越小表明预测的误差越小, 算法预测得越准确。 0043 实验选取 7 个现有的推荐方法, 包括 2 个常用的协同过滤推荐方法 (UserMean 和 ItemMean) , 1 个基于用户 - 项目矩阵分解方法 (PMF) 和 4 个最新的基于用户 - 项目矩阵和 信任网络的推荐方法 (SoRec, RSTE, SocialMF, SR2PCC) , 与本发明提出的 TrustMF 方法进 行对比, 7 个对比方法的名字和描述如表 2 所示。 0044 表 3 给出了实验中各个方法的参数值。 0045 表。

37、 4 给出了各方法针对所有用户的平均预测性能。如表 4 所示, 本发明提出的方 法 TrustMF 表现最优, 相对其它方法能明显提高评分预测的准确度。例如, 在d取 5 时 (将 用户和项目投影到一个 5 维空间) , 与 UserMean, ItemMean, PMF, SoRec, RSTE, SocialMF 和 SR2PCC相比, TrustMF的MAE误差分别减小了12.8%、 13.7%、 2.7%、 10.7%、 4.9%、 7.0%和2.8%, RMSE 误差分别减小了 13.0%、 14.4%、 2.2%、 8.0%、 4.4%、 4.7% 和 3.6%。该实验结果充分说明。

38、 了本发明更加有效地融合了评分数据和信任数据, 显著提高了基于信任的社会化推荐方法 的推荐质量。 0046 为了测试各方法解决冷启动问题的能力, 采用两种策略进行实验。 第一种是, 将训 练集里评分数小于或等于 5 的用户定义为冷启动用户, 计算各方法在这组冷启动用户上的 评分预测误差。实验结果如表 5 所示, 本发明提出的方法 TrustMF 表现最优。例如, 在d取 5 时, 与 UserMean, ItemMean, PMF, SoRec, RSTE, SocialMF 和 SR2PCC相比, TrustMF 的 MAE 误 差分别减小了 22.8%、 4.4%、 2.7%、 2.4%、。

39、 2.6%、 18.7% 和 3.8%, RMSE 误差分别减小了 26.3%、 9.0%、 2.8%、 3.2%、 3.1%、 15.3%、 6.7%。 0047 第二种策略是选取数据集中评分数在 50 到 70 之间的用户, 对于其中的每一个用 户, 随机抽取 5 个评分保留在训练集里, 其余的评分作为测试集, 计算评分的预测误差。实 验结果如表 6 所示, 本发明方法 TrustMF 表现最优, 和其他对比方法相比, 评分预测的 MAE 说 明 书 CN 103399858 A 10 7/8 页 11 误差和 RMSE 误差都是最低的。 0048 从以上两个实验结果可以看出, 本发明方法。

40、针对冷启动用户表现最好, 相比于现 有方法, 明显提高了预测准确度。这说明本发明对于评分数据稀疏和冷启动问题严重的数 据也能取得较好的推荐效果。 0049 下面通过试验进一步验证各方法利用信任数据的效率。根据用户在信任网络中 “度” 的大小 (可理解为用户拥有信任关系的数量) , 将用户分为不同的组 6 组 :“度在 0-5 之 间的用户” ,“度在 6-10 之间的用户” ,“度在 11-20 之间的用户” ,“度在 21-40 之间的用户” , “度在 41-100 之间的用户” 和 “度在 101-500 之间的用户” 。针对每一组用户, 分别计算其 在测试集中的评分预测误差。实验结果如。

41、图 6 所示, 从中可以看出, 针对不同组的用户, 本 发明提出的方法 TrustMF 都能给出较好的预测。相比其他方法, TrustMF 针对大多数用户 都表现最好, 尤其对于 RMSE 指标改善明显。此外, 对于度小于 10 的用户, TrustMF 方法仍 能给出稳定的预测, 且优于其他现有方法。以上实验结果说明, 相对于对比方法, 本发明能 更有效地利用稀疏的信任数据, 提供质量更好的推荐。 0050 表 1 表 2 表 3 方法参数值 PMFU=V=0.001 SoRecU=V=Z=0.001,C=1 说 明 书 CN 103399858 A 11 8/8 页 12 RSTEU=V=。

42、0.001,=0.4 SocialMFU=V=0.001,T=1 SR2PCC1=2=0.001,=0.001 TrustMF=0.001,T=1 表 4 表 5 表 6 方法MAERMSE PMF0.87871.1039 SoRec1.00601.2351 RSTE0.87631.1118 SocialMF0.86841.0960 SR2PCC0.88271.1341 TrustMF0.82241.0757 说 明 书 CN 103399858 A 12 1/6 页 13 图 1 说 明 书 附 图 CN 103399858 A 13 2/6 页 14 图 2 说 明 书 附 图 CN 103399858 A 14 3/6 页 15 图 3 说 明 书 附 图 CN 103399858 A 15 4/6 页 16 图 4 说 明 书 附 图 CN 103399858 A 16 5/6 页 17 图 5 说 明 书 附 图 CN 103399858 A 17 6/6 页 18 图 6 说 明 书 附 图 CN 103399858 A 18 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1