基于用户的协同过滤组合推荐方法.pdf

上传人:a3 文档编号:4486019 上传时间:2018-10-17 格式:PDF 页数:7 大小:608.56KB
返回 下载 相关 举报
基于用户的协同过滤组合推荐方法.pdf_第1页
第1页 / 共7页
基于用户的协同过滤组合推荐方法.pdf_第2页
第2页 / 共7页
基于用户的协同过滤组合推荐方法.pdf_第3页
第3页 / 共7页
点击查看更多>>
资源描述

《基于用户的协同过滤组合推荐方法.pdf》由会员分享,可在线阅读,更多相关《基于用户的协同过滤组合推荐方法.pdf(7页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 104077357 A (43)申请公布日 2014.10.01 CN 104077357 A (21)申请号 201410242692.0 (22)申请日 2014.05.31 G06F 17/30(2006.01) H04L 29/08(2006.01) (71)申请人 浙江工商大学 地址 310018 浙江省杭州市下沙高教园区学 正街 18 号 (72)发明人 琚春华 吕晓敏 肖亮 魏建良 鲍福光 (74)专利代理机构 杭州裕阳专利事务所 ( 普通 合伙 ) 33221 代理人 应圣义 (54) 发明名称 基于用户的协同过滤组合推荐方法 (57) 摘要 本发明涉。

2、及计算机协同推荐方法, 公开了一 种基于用户的协同过滤组合推荐方法, 包括以下 具体步骤 : 评分矩阵建立步骤, 建立用户 - 项目 评分矩阵 ; 相似度计算步骤, 计算不同用户之间 的相似度 ; 模糊矩阵建立步骤, 建立基于不同用 户之间的相似度的模糊相似矩阵 ; 关系簇构造步 骤, 构建基于无向图的最近邻居集合 ; 预测步骤, 对用户的未评分项目进行预测。本发明的优点在 于, 有效地解决了用户评价不完整所导致的推荐 精度低的问题, 计算方法简单, 步骤少, 复杂度小, 计算精确度高, 通过对用户未评分项进行预测, 从 而提高推荐的精度, 具有较好的应用价值。 (51)Int.Cl. 权利要。

3、求书 1 页 说明书 4 页 附图 1 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书1页 说明书4页 附图1页 (10)申请公布号 CN 104077357 A CN 104077357 A 1/1 页 2 1. 一种基于用户的协同过滤组合推荐方法, 其特征在于, 包括以下具体步骤 : 评分矩 阵建立步骤 (100) : 建立 mn 阶的用户 - 项目评分矩阵, 所述评分矩阵表示为 A(m, n), 其 中, m 为用户数, n 为项目数, 第 i 行第 j 列的项 Rij表示用户 i 对项目 j 的评分 ; 相似度计算步骤 (200) : 分别计算不同用户之间的。

4、相似度 sim(i, j) ; 模糊矩阵建立步骤 (300) : 建立模糊相似矩阵 Mmm, 所述模糊相似矩阵为对角线的项 为 1 的对称矩阵, 其余项为所述相似度 sim(i, j), 且其余项的行、 列分别与所述评分矩阵的 行、 列相对应 ; 关系簇构造步骤 (400) : 建立对应于所述模糊相似矩阵 Mmm的无向图 G(V, E), 其中, V 表示项目集合, E 由所述模糊相似矩阵 Mmm中 Mij 的边组成, 所述 Mij表示模糊相似矩 阵 Mmm的项, 表示聚类阈值 ; 求得聚类阈值 的模糊等价类, 所述聚类阈值 的模糊等 价类为无向图G(V, E)在不同的聚类阈值上的连通分支的顶。

5、点集合 ; 所述聚类阈值的 模糊等价类为特定用户的最近邻居集合 ; 预测步骤 (500) : 采用以下公式预测用户 u 对未评分项目 i 的评分 其中, sim(u, v) 表示用户 u 与用户 v 之间的相似 性, Rv, i表示用户 v 对项目 i 的评分,分别表示用户 u 与用户 v 对项目 i 的评分, Neighbours(u) 表示所述用户 u 的最近邻居集合。 2. 根据权利要求 1 所述的基于用户的协同过滤组合推荐方法, 其特征在于, 还包括以 下具体步骤 : 在评分矩阵建立步骤 (100) 中, 当用户 u 对项目 j 未评分, 则 Rij 0 ; 在预测 步骤 (500) 。

6、中, 将用户 u 对未评分项 j 的预测得到的评分 Pu, j加入所述评分矩阵。 3. 根据权利要求 1 所述的基于用户的协同过滤组合推荐方法, 其特征在于, 还包括以 下具体步骤 : 基于不同的聚类阈值 求得至少两个模糊等价类并得到最近邻居集合, 根据 不同的最近邻居集合在预测步骤 (500) 中得到不同的预测评分 Pu, i, 去预测评分数值较高 的评分作为用户 u 对未评分项 i 的最终评分。 4. 根据权利要求 1 所述的基于用户的协同过滤组合推荐方法, 其特征在于, 所述相似 度计算步骤 (200) 中, 所述相似度其中, Ri, c、 Rj, c分 别表示用户 i、 用户 j 对项。

7、目 c 的评分,分别表示用户 i、 用户 j 的平均评分, Iij表 示用户 i、 用户 j 共同评分过的项的集合。 5. 根据权利要求 1 所述的基于用户的协同过滤组合推荐方法, 其特征在于, 所述关系 簇构造步骤 (400) 还包括 : 确定 m 个用户作为样本, 计算所述样本内任意两个用户 i, j 之 间的相似度 sim(i, j), 确定一个截集阈值集合 S ; 对于所述截集阈值集合 S 中的每一个聚 类阈值 , 建立无向图 G(V, E), 其中, V 为 m 个用户的集合, E 为相似度 sim(i, j) 的 边 (i, j) 的集合 ; 计算所述无向图 G(V, E) 的连通。

8、分支, 所述连通分支内的顶点集合构成 聚类阈值 的模糊等价类。 权 利 要 求 书 CN 104077357 A 2 1/4 页 3 基于用户的协同过滤组合推荐方法 技术领域 0001 本发明涉及计算机协同推荐方法, 特别涉及一种基于用户的协同过滤组合推荐方 法。 背景技术 0002 当面对大量软件信息时, 用户经常会迷失在商品信息空间中, 无法顺利找到自己 需要的信息。 个性化云服务推荐系统整合海量的用户数据, 如用户注册信息、 销售排行和用 户消费历史等数据, 然后模拟商店销售员向用户提供商品推荐, 帮助用户找到所需商品, 从 而顺利完成购买过程。 0003 在推荐系统领域, 有多种基于数。

9、据挖掘的推荐技术, User-based 协同过滤推荐和 模糊聚类是目前较流行的推荐方法。 0004 User-based 协同过滤推荐一般采用找最近邻居的技术, 利用用户的评分信息分析 用户的兴趣爱好, 并以此计算用户的相似性, 评分的相似度越高说明这两个用户越邻近, 然 后可以找到目标用户的最近邻居。最后根据最近邻居的评分预测目标用户的评分。它基于 这样一个假设 : 如果用户对一些项的评分比较相似, 则他们对其它项的评分也比较相似。 0005 聚类就是按照事物的某些属性, 把事物聚集成类, 按这种方式组成的类应尽可能 让类间的相似性足够小, 而同一个类内相似性尽可能大。而模糊聚类是一种使用。

10、模糊等价 关系将对象划分为一些等价类的聚类方法, 可以使类间的相似性足够小, 而同一个类内相 似性尽可能大, 给定阀值集合条件下给出的聚类结果的比传统的聚类更有效, 因为传统的 聚类方法中, 每个用户均被划分到了某一个类别, 而对于一些属性特征不明显的用户, 他们 属于另外的类别也是合理的, 将他们生硬地划分到某一个类别显然是不合理的 ; 而模糊聚 类引入隶属度概念, 隶属度越高则被划分到某一个类别的优先级越高。 0006 两种推荐技术各有适用的范围, 协同过滤推荐方法是当前最成功的也是研究最深 入的推荐方法, 基于用户的协同过滤推荐可以处理更复杂的非结构化对象, 但依然存在数 据极端稀疏性、。

11、 新用户和冷启动等问题。所以基于以上原因笔者通过将两种不同方法相互 组合, 设计一种基于用户的协同过滤组合推荐方法构建构建个性化推荐系统。 发明内容 0007 本发明针对现有技术中, 协同过滤推荐方法中依旧存在数据稀疏, 新用户和冷启 动数据不足的缺点, 提供了一种基于用户的协同过滤组合推荐方法。 0008 为实现上述目的, 本发明可采取下述技术方案 : 0009 基于用户的协同过滤组合推荐方法, 包括以下具体步骤 : 0010 评分矩阵建立步骤 : 建立 mn 阶的用户 - 项目评分矩阵, 所述评分矩阵表示为 A(m, n), 其中, m 为用户数, n 为项目数, 第 i 行第 j 列的项。

12、 Rij表示用户 i 对项目 j 的评分 ; 0011 相似度计算步骤 : 分别计算不同用户之间的相似度 sim(i, j) ; 0012 模糊矩阵建立步骤 : 建立模糊相似矩阵 Mmm, 所述模糊相似矩阵为对角线的项为 1 说 明 书 CN 104077357 A 3 2/4 页 4 的对称矩阵, 其余项为所述相似度 sim(i, j), 且其余项的行、 列分别与说书评分矩阵的行、 列相对应 ; 0013 关系簇构造步骤 : 建立对应于所述模糊相似矩阵 Mmm的无向图 G(V, E), 其中, V 表 示项目集合, E 由所述模糊相似矩阵 Mmm中 Mij 的边组成, 所述 Mij表示模糊相。

13、似矩阵 Mmm的项, 表示聚类阈值 ; 求得聚类阈值 的模糊等价类, 所述聚类阈值 的模糊等价 类为无向图G(V, E)在不同的聚类阈值上的连通分支的顶点集合 ; 所述聚类阈值的模 糊等价类为特定用户的最近邻居集合 ; 0014 预测步骤 : 采用以下公式预测用户 u 对未评分项目 i 的评分 其中, sim(u, v) 表示用户 u 与用户 v 之间的相似性, Rv, i表示用户 v 对项目 i 的评分,分别表示用户 u 与用户 v 对项目 i 的评分, Neighbours(u) 表示所述用户 u 的最近邻居集合。 0015 于本发明的实施例中, 还包括以下具体步骤 : 在评分矩阵建立步骤。

14、中, 当用户 u 对 项目 j 未评分, 则 Rij 0 ; 在预测步骤中, 将用户 u 对未评分项 j 的预测得到的评分 Ru, j加 入所述评分矩阵。 0016 于本发明的实施例中, 还包括以下具体步骤 : 基于不同的聚类阈值 求得至少两 个模糊等价类并得到最近邻居集合, 根据不同的最近邻居集合在预测步骤中得到不同的预 测评分 Pu, i, 去预测评分数值较高的评分作为用户 u 对未评分项 i 的最终评分。 0017 于本发明的实施例中, 所述相似度计算步骤中, 所述相似度 其中, Ri, c、 Rj, c分别表示用户 i、 用户 j 对项目 c 的评分, 分别表示用户 i、 用户 j 的。

15、平均评分, Iij表示用户 i、 用户 j 共同评分过的项的集合。 0018 于本发明的实施例中, 所述关系簇构造步骤还包括 : 确定 m 个用户作为样本, 计算 所述样本内任意两个用户 i, j 之间的相似度 sim(i, j), 确定一个截集阈值集合 S ; 对于所 述截集阈值集合 S 中的每一个聚类阈值 , 建立无向图 G(V, E), 其中, V 为 m 个用户的集 合, E 为相似度 sim(i, j) 的边 (i, j) 的集合 ; 计算所述无向图 G(V, E) 的连通分支, 所述连通分支内的顶点集合构成聚类阈值 的模糊等价类。 0019 本发明具有以下的显著技术效果 : 002。

16、0 基于用户的协同过滤推荐可以处理更复杂的非结构化对象, 结合模糊聚类方法提 出的个性化云服务方法在推荐精度上有明显改善。 附图说明 0021 图 1 为基于用户的协同过滤组合推荐方法的流程示意图。 具体实施方式 0022 下面结合实施例对本发明作进一步的详细描述。 0023 实施例 1 说 明 书 CN 104077357 A 4 3/4 页 5 0024 一种基于用户的协同过滤组合推荐方法, 如图 1 所示, 包括以下具体步骤 : 0025 评分矩阵建立步骤 100 : 建立 mn 阶的用户 - 项目评分矩阵, 所述评分矩阵表示 为 A(m, n), 其中, m 为用户数, n 为项目数,。

17、 第 i 行第 j 列的项 Rij表示用户 i 对项目 j 的评 分 ; 进一步地, 为了能够更好地应用本方法, 可以将用户评价的项目置零, 即令 Rij 0。此 外, 用户i对项目j的评分还需要经过定量化规则转换为具体的评分数值, 所述的定量化规 则包括将各种不同的用户体验结果用一定的数值进行标识, 并依据不同的用户体验之间的 差异, 确定数值标识之间的数量关系, 采用定量评估分析, 依据统计数据, 建立数学模型, 并 用数学模型计算出分析对象的各项指标及其数值来评估分析的一种方法。 与定性分析评估 分析相对应的主要凭分析者的直觉、 经验进行分析。定量评估分析一般需要较高深的数学 知识, 对。

18、社会现象的数量特征、 数量关系与数量变化的分析。 其功能在于揭示和描述社会现 象的相互作用和发展趋势。 0026 相似度计算步骤 200 : 分别计算不同用户之间的相似度 sim(i, j) ; 相似度计算步 骤 200 具体而言, 使用修正后的余弦相似度, 以保证对用户的相似程度进行更为准确的度 量和评价, 所述相似度其中, Ri, c、 Rj, c分别表示用户 i、 用户 j 对项目 c 的评分,分别表示用户 i、 用户 j 的平均评分, Iij表示用户 i、 用 户 j 共同评分过的项的集合。 0027 模糊矩阵建立步骤 300 : 建立模糊相似矩阵 Mmm, 所述模糊相似矩阵为对角线的。

19、项 为 1 的对称矩阵, 其余项为所述相似度 sim(i, j), 且其余项的行、 列分别与所述评分矩阵的 行、 列相对应 ; 0028 关系簇构造步骤 400 : 建立对应于所述模糊相似矩阵 Mmm的无向图 G(V, E), 其中, V 表示项目集合, E 由所述模糊相似矩阵 Mmm中 Mij 的边组成, 所述 Mij表示模糊相似 矩阵 Mmm的项, 表示聚类阈值 ; 求得聚类阈值 的模糊等价类, 所述聚类阈值 的模糊 等价类为无向图 G(V, E) 在不同的聚类阈值 上的连通分支的顶点集合 ; 所述聚类阈值 的模糊等价类为特定用户的最近邻居集合 ; 0029 预测步骤 500 : 采用以下。

20、公式预测用户 u 对未评分项目 i 的评分 其中, sim(u, v) 表示用户 u 与用户 v 之间的相似性, Rv, i表示用户 v 对项目 i 的评分,分别表示用户 u 与用户 v 对项目 i 的评分, Neighbours(u) 表示所述用户 u 的最近邻居集合。 0030 进一步地, 云服务推荐系统适时地更新用户数据并动态地调整用户的评分值, 提 供给用户个性化推荐服务。包括 : 0031 建立个性云服务数据库。针对不同用户群体, 分门别类地存储用户数据并建立科 学的索引目录。 0032 添加用户标签。对于每个用户, 嵌入用户群体标签, 如 : 性别、 年龄段、 爱好等。 0033 。

21、更新用户评分数据库。由于用户数据库会新增一些新的浏览和消费数据, 根据新 说 明 书 CN 104077357 A 5 4/4 页 6 增的用户数据库信息不断调整用户评分, 从而实现动态调整过程并提供给用户个性化推荐 服务。 0034 所述协同过滤组合推荐方法还包括以下具体步骤 : 在评分矩阵建立步骤 100 中, 当用户 u 对项目 j 未评分, 则 Rij 0 ; 在预测步骤 500 中, 将用户 u 对未评分项 j 的预测得 到的评分 Pu, j加入所述评分矩阵。 0035 所述协同过滤组合推荐方法还包括以下具体步骤 : 基于不同的聚类阈值 求得 至少两个模糊等价类并得到最近邻居集合, 。

22、根据不同的最近邻居集合在预测步骤 500 中得 到不同的预测评分 Pu, i, 去预测评分数值较高的评分作为用户 u 对未评分项 i 的最终评分。 0036 所述关系簇构造步骤400还包括 : 确定m个用户作为样本, 计算所述样本内任意两 个用户i, j之间的相似度sim(i, j), 确定一个截集阈值集合S ; 对于所述截集阈值集合S中 的每一个聚类阈值 , 建立无向图 G(V, E), 其中, V 为 m 个用户的集合, E 为相似度 sim(i, j) 的边 (i, j) 的集合 ; 计算所述无向图 G(V, E) 的连通分支, 所述连通分支内的顶点 集合构成聚类阈值 的模糊等价类。 0037 总之, 以上所述仅为本发明的较佳实施例, 凡依本发明申请专利范围所作的均等 变化与修饰, 皆应属本发明专利的涵盖范围。 说 明 书 CN 104077357 A 6 1/1 页 7 图 1 说 明 书 附 图 CN 104077357 A 7 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1