一种基于用户轨迹的协同过滤推荐方法、装置及系统.pdf

上传人:00****42 文档编号:1569653 上传时间:2018-06-25 格式:PDF 页数:17 大小:3.22MB
返回 下载 相关 举报
摘要
申请专利号:

CN201310030471.2

申请日:

2013.01.25

公开号:

CN103116614A

公开日:

2013.05.22

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20130125|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

北京奇艺世纪科技有限公司

发明人:

晋向前; 傅一峰; 王敏; 张磊; 杨子斌

地址:

100080 北京市海淀区海淀北一街2号鸿城拓展大厦11层1101号

优先权:

专利代理机构:

北京集佳知识产权代理有限公司 11227

代理人:

王宝筠

PDF下载: PDF下载
内容摘要

本发明公开了一种基于用户轨迹的协同过滤推荐方法,用于在用户浏览挑选网页或视频时,为用户提供更有效的推荐,该方法包括:获得移动终端的位置信息,根据位置信息确定用户的地理位置坐标;对由地理位置坐标确定的位置点进行聚类,确定用户的用户轨迹,用户轨迹为半径小于第一阈值且位置点密度大于第二阈值的区域;比较目标用户与其他用户的用户轨迹,确定目标用户的近邻用户,目标用户为用户中待提供推荐结果的用户;获得并保存用户的浏览记录;根据目标用户与近邻用户的浏览记录,利用协同过滤算法,为目标用户提供推荐结果。本发明还公开了一种基于用户轨迹的协同过滤推荐装置及系统。

权利要求书

权利要求书一种基于用户轨迹的协同过滤推荐方法,其特征在于,所述方法包括:
获得移动终端的位置信息,根据所述位置信息确定用户的地理位置坐标;
对由所述地理位置坐标确定的位置点进行聚类,确定所述用户的用户轨迹,所述用户轨迹为半径小于第一阈值且所述位置点密度大于第二阈值的区域;
比较目标用户与其他用户的用户轨迹,确定所述目标用户的近邻用户,所述目标用户为所述用户中待提供推荐结果的用户;
获得并保存所述用户的浏览记录;
根据所述目标用户与所述近邻用户的所述浏览记录,利用协同过滤算法,为目标用户提供推荐结果。
根据权利要求1所述的方法,其特征在于,所述比较目标用户与其他用户的用户轨迹,确定所述目标用户的近邻用户,包括:
比较目标用户与其他用户的用户轨迹,将用户轨迹与所述目标用户的用户轨迹直接相交区域面积大于第三阈值的其他用户确定为所述目标用户的近邻用户;
比较目标用户与其他用户的用户轨迹,将用户轨迹与所述目标用户的用户轨迹间接相交区域面积大于第四阈值的其他用户确定为所述目标用户的近邻用户。
根据权利要求1所述的方法,其特征在于,所述根据所述目标用户与所述近邻用户的所述浏览记录,利用协同过滤算法,为目标用户提供推荐结果,包括:
根据所述目标用户与所述近邻用户的所述浏览记录,计算所述目标用户与每个近邻用户的兴趣相似度;
确定所述近邻用户中与所述目标用户中兴趣相似度大于第五阈值的用户为所述目标用户的兴趣相似用户;
根据所述兴趣相似用户的浏览记录,获得为目标用户提供的推荐结果。
根据权利要求2所述的方法,其特征在于,所述方法还包括:
当所述地理位置坐标数据不断增加,利用机器学习,调整第一阈值和/或第二阈值的取值范围。
根据权利要求2或3所述的方法,其特征在于,所述方法还包括:
将所述用户化分为若干组;
在为不同组用户中的所述目标用户分别提供推荐结果的过程中,设置不同的所述第三阈值、所述第四阈值和/或所述第五阈值;
获得不同组的目标用户的推荐结果转化率;
根据所述不同组的目标用户的推荐结果转化率,调整所述第三阈值、所述第四阈值和/或所述第五阈值。
一种基于用户轨迹的协同过滤推荐装置,其特征在于,所述装置包括:
第一确定单元,用于获取移动终端的位置信息,根据所述位置信息确定用户的地理位置坐标;
第二确定单元,用于对由所述地理位置坐标确定的位置点进行聚类,确定所述用户的用户轨迹,所述用户轨迹为半径小于第一阈值且所述位置点密度大于第二阈值的区域;
第三确定单元,用于比较目标用户与其他用户的用户轨迹,确定所述目标用户的近邻用户,所述目标用户为所述用户中待提供推荐结果的用户;
第一获得单元,用于获得并保存所述用户的浏览记录;
推荐单元,用于根据所述目标用户与所述近邻用户的所述浏览记录,利用协同过滤算法,为目标用户提供推荐结果。
根据权利要求6所述的装置,其特征在于,所述第三确定单元包括:
第一确定子单元,用于比较目标用户与其他用户的用户轨迹,将用户轨迹与所述目标用户的用户轨迹直接相交区域面积大于第三阈值的其他用户确定为所述目标用户的近邻用户;
第二确定子单元,用于比较目标用户与其他用户的用户轨迹,将用户轨迹与所述目标用户的用户轨迹间接相交区域面积大于第四阈值的其他用户确定为所述目标用户的近邻用户。
根据权利要求6所述的装置,其特征在于,所述推荐单元包括:
计算子单元,用于根据所述目标用户与所述近邻用户的所述浏览记录,计算所述目标用户与每个近邻用户的兴趣相似度;
第三确定子单元,用于确定所述近邻用户中与所述目标用户中兴趣相似度大于第五阈值的用户为所述目标用户的兴趣相似用户;
推荐子单元,用于根据所述兴趣相似用户的浏览记录,获得为目标用户提供的推荐结果。
根据权利要求7所述的装置,其特征在于,所述装置还包括:
第一调整单元,用于当所述地理位置坐标数据不断增加,利用机器学习,调整第一阈值和/或第二阈值的取值范围。
根据权利要求7或8所述的装置,其特征在于,所述装置还包括:
划分单元,用于将所述用户化分为若干组;
设置单元,用于在为不同组用户中的所述目标用户分别提供推荐结果的过程中,设置不同的所述第三阈值、所述第四阈值和/或所述第五阈值;
第二获得单元,用于获得不同组的目标用户的推荐结果转化率;
第二调整单元,用于根据所述不同组的目标用户的推荐结果转化率,调整所述第三阈值、所述第四阈值和/或所述第五阈值。
一种基于用户轨迹的协同过滤推荐系统,其特征在于,所述系统包括:
若干个移动终端以及推荐服务器;
所述推荐服务器是权利要求6‑10任一项所述的基于用户轨迹的协同过滤推荐装置;
所述移动终端,用于向所述推荐服务器发送位置信息以及用户的浏览记录并获得所述推荐服务器为目标用户提供的推荐结果。

说明书

说明书一种基于用户轨迹的协同过滤推荐方法、装置及系统
技术领域
本发明涉及网络技术领域,具体涉及一种基于用户轨迹的协同过滤推荐方法、装置及系统。
背景技术
随着互联网技术的不断发展,用户能够获得的信息量不断增加,用户面临着信息过载的问题。例如,当用户以休闲为目的没有明确需求时浏览视频网站或视频客户端时,面对数不胜数的视频文件,用户会面对不知如何进行选择的问题。因此,需要推荐系统帮助用户进行信息过滤。协同过滤推荐是信息过滤和信息系统中的一项重要技术。
在现有技术中,协同过滤推荐算法的步骤包括:记录并统计用户的浏览记录;利用存在相似兴趣的用户群体或与用户兴趣相似的信息做推荐;当用户产生新的浏览行为时,推荐系统对用户没有看过但可能感兴趣的信息队列重新排序,推荐给用户。
但是,协同过滤推荐算法在线运算中往往需要考虑到实际服务器的压力来简化算法。在拥有千万级用户的网站中,如果要维护一个用户相似度矩阵,从存储和计算的角度来说,维护成本很高。因此在实际应用中在线计算通常不会遍历所有的用户或者用户所有的浏览记录,只能截取一小部分用户及一小部分用户的浏览记录,依据几个共同的浏览记录来判断相似兴趣的用户群体,而这些浏览记录的产生很可能是偶然发生而非兴趣类似导致。因此,以此为据进行推荐往往准确率不高,并且很难将推荐理由介绍给被推荐用户。另外,对于新用户来说,由于缺乏该用户的浏览记录,故很难预测其感兴趣的内容,推荐系统会遇到冷启动现象。
发明内容
有鉴于此,本发明的主要目的是提供一种基于用户轨迹的协同过滤推荐方法、装置及系统,以解决现有技术中协同过滤推荐方法推荐准确率不高的问题。
为解决上述问题,本发明提供的技术方案如下:
一种基于用户轨迹的协同过滤推荐方法,所述方法包括:
获得移动终端的位置信息,根据所述位置信息确定用户的地理位置坐标;
对由所述地理位置坐标确定的位置点进行聚类,确定所述用户的用户轨迹,所述用户轨迹为半径小于第一阈值且所述位置点密度大于第二阈值的区域;
比较目标用户与其他用户的用户轨迹,确定所述目标用户的近邻用户,所述目标用户为所述用户中待提供推荐结果的用户;
获得并保存所述用户的浏览记录;
根据所述目标用户与所述近邻用户的所述浏览记录,利用协同过滤算法,为目标用户提供推荐结果。
相应的,所述比较目标用户与其他用户的用户轨迹,确定所述目标用户的近邻用户,包括:
比较目标用户与其他用户的用户轨迹,将用户轨迹与所述目标用户的用户轨迹直接相交区域面积大于第三阈值的其他用户确定为所述目标用户的近邻用户;
比较目标用户与其他用户的用户轨迹,将用户轨迹与所述目标用户的用户轨迹间接相交区域面积大于第四阈值的其他用户确定为所述目标用户的近邻用户。
相应的,所述根据所述目标用户与所述近邻用户的所述浏览记录,利用协同过滤算法,为目标用户提供推荐结果,包括:
根据所述目标用户与所述近邻用户的所述浏览记录,计算所述目标用户与每个近邻用户的兴趣相似度;
确定所述近邻用户中与所述目标用户中兴趣相似度大于第五阈值的用户为所述目标用户的兴趣相似用户;
根据所述兴趣相似用户的浏览记录,获得为目标用户提供的推荐结果。
相应的,所述方法还包括:
当所述地理位置坐标数据不断增加,利用机器学习,调整第一阈值和/或第二阈值的取值范围。
相应的,所述方法还包括:
将所述用户化分为若干组;
在为不同组用户中的所述目标用户分别提供推荐结果的过程中,设置不同的所述第三阈值、所述第四阈值和/或所述第五阈值;
获得不同组的目标用户的推荐结果转化率;
根据所述不同组的目标用户的推荐结果转化率,调整所述第三阈值、所述第四阈值和/或所述第五阈值。
一种基于用户轨迹的协同过滤推荐装置,所述装置包括:
第一确定单元,用于获取移动终端的位置信息,根据所述位置信息确定用户的地理位置坐标;
第二确定单元,用于对由所述地理位置坐标确定的位置点进行聚类,确定所述用户的用户轨迹,所述用户轨迹为半径小于第一阈值且所述位置点密度大于第二阈值的区域;
第三确定单元,用于比较目标用户与其他用户的用户轨迹,确定所述目标用户的近邻用户,所述目标用户为所述用户中待提供推荐结果的用户;
第一获得单元,用于获得并保存所述用户的浏览记录;
推荐单元,用于根据所述目标用户与所述近邻用户的所述浏览记录,利用协同过滤算法,为目标用户提供推荐结果。
相应的,所述第三确定单元包括:
第一确定子单元,用于比较目标用户与其他用户的用户轨迹,将用户轨迹与所述目标用户的用户轨迹直接相交区域面积大于第三阈值的其他用户确定为所述目标用户的近邻用户;
第二确定子单元,用于比较目标用户与其他用户的用户轨迹,将用户轨迹与所述目标用户的用户轨迹间接相交区域面积大于第四阈值的其他用户确定为所述目标用户的近邻用户。
相应的,所述推荐单元包括:
计算子单元,用于根据所述目标用户与所述近邻用户的所述浏览记录,计算所述目标用户与每个近邻用户的兴趣相似度;
第三确定子单元,用于确定所述近邻用户中与所述目标用户中兴趣相似度大于第五阈值的用户为所述目标用户的兴趣相似用户;
推荐子单元,用于根据所述兴趣相似用户的浏览记录,获得为目标用户提供的推荐结果。
相应的,所述装置还包括:
第一调整单元,用于当所述地理位置坐标数据不断增加,利用机器学习,调整第一阈值和/或第二阈值的取值范围。
相应的,所述装置还包括:
划分单元,用于将所述用户化分为若干组;
设置单元,用于在为不同组用户中的所述目标用户分别提供推荐结果的过程中,设置不同的所述第三阈值、所述第四阈值和/或所述第五阈值;
第二获得单元,用于获得不同组的目标用户的推荐结果转化率;
第二调整单元,用于根据所述不同组的目标用户的推荐结果转化率,调整所述第三阈值、所述第四阈值和/或所述第五阈值。
一种基于用户轨迹的协同过滤推荐系统,所述系统包括:
若干个移动终端以及推荐服务器;
所述推荐服务器是权利要求6‑10任一项所述的基于用户轨迹的协同过滤推荐装置;
所述移动终端,用于向所述推荐服务器发送位置信息以及用户的浏览记录并获得所述推荐服务器为目标用户提供的推荐结果。
由此可见,本发明具有如下有益效果:
本发明利用移动设备对用户的地理位置坐标进行聚类,产生用户轨迹,利用用户轨迹确定近邻用户,可以将兴趣相似的用户在空间上进行划分,进而通过近邻用户及其浏览记录,将用户线上行为和线下行为相结合,利用协同过滤算法获得推荐结果。由于用户的活动范围可以反映该用户的自身属性,同时将全国范围内的用户相似度计算大幅度降低为附近区域高度重叠的用户相似度计算,降低了计算难度,提高了推荐准确率。另外,一个新用户只要产生用户轨迹,就可以在其浏览记录不足够的情况下,利用其近邻用户的浏览记录为该新用户提供推荐结果,避免了推荐系统冷启动的现象。
附图说明
图1为本发明基于用户轨迹的协同过滤推荐方法的流程图;
图2为本发明中用户轨迹的示意图;
图3为本发明中近邻用户的示意图;
图4为本发明基于用户轨迹的协同过滤推荐方法的一种实施例流程图;
图5为本发明中用户‑物品排列表以及物品‑用户排列表的示意图;
图6为本发明中用户相似度矩阵表的示意图;
图7为本发明基于用户轨迹的协同过滤推荐方法的一种具体实施例的流程图;
图8为本发明基于用户轨迹的协同过滤推荐装置的示意图;
图9为本发明基于用户轨迹的协同过滤推荐装置中的第三确定单元的示意图;
图10为本发明基于用户轨迹的协同过滤推荐装置中的推荐单元的示意图;
图11为本发明基于用户轨迹的协同过滤推荐装置的一种具体实施例的示意图;
图12为本发明实现基于用户轨迹的协同过滤推荐系统的示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明实施例作进一步详细的说明。
本发明基于用户轨迹的协同过滤推荐方法,主要是针对现有技术中协同过滤推荐方法推荐准确率低的问题。由于兴趣特征类似的用户在空间上的活动也往往存在区域高度重叠的现象,如:某重点大学的学生人群、某IT公司的职员,这些人群在兴趣上有分别,在活动范围上各自保持一定的区域,区域间的人群很少相互重叠,而同一群体内的人活动范围基本类似。因此,提出引入地理位置服务获取用户位置信息后,通过用户轨迹分析,可以从看似杂乱无章的用户位置集合中确定出用户的主要活动区域,并根据重叠区域找出近邻用户,将其它近邻用户的兴趣爱好联系用户目标,使用户在浏览、挑选网页信息时,例如浏览视频时,给出用户更有效的推荐,使移动在线浏览与传统的PC在线浏览形成差异。
基于上述思想,参见图1所示,本发明用户轨迹的协同过滤推荐方法,包括以下步骤:
步骤101:获得移动终端的位置信息,根据位置信息确定用户的地理位置坐标。
对同意开启该功能的用户,在用户开启该功能时,为每个用户使用的移动终端分配不同的经过加密的唯一编号,匿名统计该移动终端(即代表该用户)的位置信息。具体的,位置信息可以通过GPS、wifi网络或移动运营商基站获得。将位置地理转换为地理位置坐标,如经纬度坐标。该地理位置坐标与实际地址无关,即采用“双匿名”模式,既可以保护用户的隐私,有可以获得用户的位置信息,完成用户行为分析。
步骤102:对由地理位置坐标确定的位置点进行聚类,确定用户的用户轨迹,用户轨迹为半径小于第一阈值且位置点密度大于第二阈值的区域。
用户的地理位置坐标可以形成位置点的集合,对这些位置点进行聚类,形成用户的用户轨迹,即用户主要活动的区域,可以以此来描述该用户的属性,每个用户形成的用户轨迹可以为若干个“点簇”。具体的,可以设置第二阈值,将密度大于第二阈值的位置点集聚类,将密度小于或等于第二阈值的位置点集抛弃,并考虑到点集的连续性,尽量减少形成“点簇”的数量,最后形成用户的轨迹。聚类的同时考虑到最大聚合半径(第一阈值),该参数可以不断进行调整,保证聚类而成的每个“点簇”不会无限制的扩大,从而保证协同的效果。
参见图2所示,对由地理位置坐标确定的位置点进行聚类后确定的用户轨迹,可以抽象为若干个“点簇”,例如,一个用户常见的用户轨迹通常会包括两个“点簇”:“居住地区3公里以内”以及“工作地区3公里以内”,其它零星点由于其位置点集密度不能达到第二阈值,则可以被抛弃。
步骤103:比较目标用户与其他用户的用户轨迹,确定目标用户的近邻用户,目标用户为用户中待提供推荐结果的用户。
具体的,该步骤可以包括:比较目标用户与其他用户的用户轨迹,将用户轨迹与目标用户的用户轨迹直接相交区域面积大于第三阈值的其他用户确定为目标用户的近邻用户;
比较目标用户与其他用户的用户轨迹,将用户轨迹与目标用户的用户轨迹间接相交区域面积大于第四阈值的其他用户确定为目标用户的近邻用户。
在步骤102中,获得了每个用户的用户轨迹,可以通过判断每个用户的用户轨迹直接的相交情况,确定近邻用户。参见图3所示,例如,一个用户目标A与其他用户B‑H在居住地区的用户轨迹如图所示,当目标用户的用户轨迹与其他用户的用户轨迹直接相交面积区域大于第三阈值时,例如,用户A与用户C、D,则用户C、D为用户A的近邻用户;当目标用户的用户轨迹与其他用户的用户轨迹间接相交面积区域大于第四阈值时,例如,用户A与用户B、E,则用户B、E为用户A的近邻用户;当目标用户的用户轨迹与其他用户的用户轨迹相切或不相交时,为非近邻用户,例如用户H;当目标用户的用户轨迹与其他用户的用户轨迹间接相交面积区域小于或等于第四阈值时,为非近邻用户,例如用户F、G。这样,可以获得目标用户的所有近邻用户,另外,也可以说这些用户互为近邻用户,例如,用户A、B、C、D、E之间互为近邻用户。
步骤104:获得并保存用户的浏览记录。
用户对网站的操作可定义为用户行为,用户行为可以包括所有能表示用户喜好的与网站系统交互的操作,用户行为在网站中的通常用用户日志的形式保存。具体的,可以通过用户日志获得并保存用户在网站中的浏览记录。
步骤105:根据目标用户与近邻用户的浏览记录,利用协同过滤算法,为目标用户提供推荐结果。
协同过滤算法是研究预测用户行为的一类算法,一般是指在个性化推荐系统中,当一个目标用户A需要个性化推荐时,可以先找到和他有相似特征的人群,然后把那些用户喜欢而用户A没有听说过的物品推荐给A,或者根据A以往喜好过的物品,将类似的物品推荐给用户,这种方法称协同过滤算法。
在上述实施例中,步骤101‑103可以与步骤104并行执行。
本发明利用目标用户与近邻用户的浏览记录,为目标用户提供推荐结果,将兴趣爱好类似的用户在空间上进行划分,帮助用户发现对自己有价值的信息,为用户提供更好的使用体验。
参见图4所示,在上述实施例中,根据目标用户与近邻用户的浏览记录,利用协同过滤算法,为目标用户提供推荐结果,具体可以包括:
步骤1051:根据目标用户与近邻用户的浏览记录,计算目标用户与每个近邻用户的兴趣相似度。
假设有用户U和用户V,令N(u)为用户U的浏览记录的集合,N(v)为用户V的浏览记录的集合,根据用户矩阵表,用户U和用户V的兴趣相似度WUV为:参见图5所示,可以在近邻用户中获得用户‑物品排列表,例如用户A‑E,浏览记录I‑V,可以将用户‑物品排列表转换为物品‑用户排列表。参见图6所示,以5个用户为例,根据物品‑用户排列表可以得到用户矩阵表,表格中的数值为用户之间的兴趣相似度示例,例如对物品I,用户A、B、E都操作过,因此AB、BA、AE、EA、BE、EB的相似度加1,以此类推,当扫描完全部浏览记录后,即可以得到WUV的分子部分。
本发明的方法在近邻用户中计算兴趣相似度,可以简化用户矩阵,大幅降低服务器的计算压力,同时,降低新用户冷启动现象,提高推荐结果。
步骤1052:确定近邻用户中与目标用户中兴趣相似度大于第五阈值的用户为目标用户的兴趣相似用户。
步骤1053:根据兴趣相似用户的浏览记录,获得为目标用户提供的推荐结果。
假设用户U对物品i感兴趣的程度为:其中,S(u,K)表示和用户U兴趣最接近的K个用户,N(i)是对物品i有过行为的用户集合,wuv表示用户U和用户V之间的兴趣相似度,rvi表示用户V对物品i的兴趣。即可通过兴趣相似用户的浏览记录,获得为目标用户提供的推荐结果。
本发明用户轨迹的协同过滤推荐方法还可以包括:
当地理位置坐标数据不断增加,利用机器学习,调整第一阈值和/或第二阈值的取值范围。
当地理位置坐标数据不断增加时,用户经常活动区域更加突出,可以调整第一阈值和/或第二阈值的取值范围,即可以调整“点簇”半径,并进一步控制最大近邻数目,使得协同推荐结果更加准确。
另外,本发明用户轨迹的协同过滤推荐方法还可以包括:
将用户化分为若干组;
在为不同组用户中的目标用户分别提供推荐结果的过程中,设置不同的第三阈值、第四阈值和/或第五阈值;
获得不同组的目标用户的推荐结果转化率;
根据不同组的目标用户的推荐结果转化率,调整第三阈值、第四阈值和/或第五阈值。
该方法是一种在线算法测评试验方法,当用户访问时,将用户划分为若干个组,将部分用户在使用推荐功能时设置新的参数值,而另一部分用户在使用推荐功能时依然使用原有的参数值,通过对推荐结果转化率的分析,评估新的参数值是否优于旧的参数值,并确定优于现有参数值的方法进行调整。例如,对视频信息对用户进行推荐,推荐结果转化率是指视频播放次数与视频展示次数之间的比值。可以由推荐结果转化率对推荐结果进行评价,不断逼近最优的推荐算法参数取值范围。具体的,第三阈值、第四阈值和/或第五阈值也可以利用机器学习进行调整。
参见图7所示,本发明用户轨迹的协同过滤推荐方法的一种具体实施例,包括以下步骤:
步骤201:获得移动终端的位置信息,根据位置信息确定用户的地理位置坐标。
步骤202:对由地理位置坐标确定的位置点进行聚类,确定用户的用户轨迹,用户轨迹为半径小于第一阈值且位置点密度大于第二阈值的区域。
步骤203:当地理位置坐标数据不断增加,利用机器学习,调整第一阈值和/或第二阈值的取值范围。
步骤204:在为不同组用户中的目标用户分别提供推荐结果的过程中,将用户化分为若干组,设置不同的第三阈值、第四阈值和/或第五阈值。
步骤205:比较目标用户与其他用户的用户轨迹,将用户轨迹与目标用户的用户轨迹直接相交区域面积大于第三阈值和/或间接相交区域面积大于第四阈值的其他用户确定为目标用户的近邻用户。
步骤206:获得并保存用户的浏览记录。
步骤207:根据目标用户与近邻用户的浏览记录,计算目标用户与每个近邻用户的兴趣相似度。
步骤208:确定近邻用户中与目标用户中兴趣相似度大于第五阈值的用户为目标用户的兴趣相似用户。
步骤209:根据兴趣相似用户的浏览记录,获得为目标用户提供的推荐结果。
步骤210:获得不同组的目标用户的推荐结果转化率。
步骤211:根据不同组的目标用户的推荐结果转化率,调整第三阈值、第四阈值和/或第五阈值,之后可以返回步骤204,获得最优的第三阈值、第四阈值以及第五阈值取值范围。
这样,利用移动设备对用户的地理位置坐标进行聚类,产生用户轨迹,利用用户轨迹确定近邻用户,可以将兴趣相似的用户在空间上进行划分,进而通过近邻用户及其浏览记录,将用户线上行为和线下行为相结合,利用协同过滤算法获得推荐结果。由于用户的活动范围可以反映该用户的自身属性,同时将全国范围内的用户相似度计算大幅度降低为附近区域高度重叠的用户相似度计算,降低了计算难度,提高了推荐准确率。另外,一个新用户只要产生用户轨迹,就可以在其浏览记录不足够的情况下,利用其近邻用户的浏览记录为该新用户提供推荐结果,避免了推荐系统冷启动的现象。
相应的,本发明还提供一种基于用户轨迹的协同过滤推荐装置,参见图8所示,该装置包括:
第一确定单元11、第二确定单元12、第三确定单元13、第一获得单元14以及推荐单元15。
其中,第一确定单元11,用于获取移动终端的位置信息,根据位置信息确定用户的地理位置坐标;
第二确定单元12,用于对由地理位置坐标确定的位置点进行聚类,确定用户的用户轨迹,用户轨迹为半径小于第一阈值且位置点密度大于第二阈值的区域;
第三确定单元13,用于比较目标用户与其他用户的用户轨迹,确定目标用户的近邻用户,目标用户为用户中待提供推荐结果的用户;
第一获得单元14,用于获得并保存用户的浏览记录;
推荐单元15,用于根据目标用户与近邻用户的浏览记录,利用协同过滤算法,为目标用户提供推荐结果。
在上述实施例中,参见图9所示,第三确定单元13可以包括:
第一确定子单元131,用于比较目标用户与其他用户的用户轨迹,将用户轨迹与目标用户的用户轨迹直接相交区域面积大于第三阈值的其他用户确定为目标用户的近邻用户;
第二确定子单元132,用于比较目标用户与其他用户的用户轨迹,将用户轨迹与目标用户的用户轨迹间接相交区域面积大于第四阈值的其他用户确定为目标用户的近邻用户。
参见图10所示,推荐单元15可以包括:
计算子单元151,用于根据目标用户与近邻用户的浏览记录,计算目标用户与每个近邻用户的兴趣相似度;
第三确定子单元152,用于确定近邻用户中与目标用户中兴趣相似度大于第五阈值的用户为目标用户的兴趣相似用户;
推荐子单元153,用于根据兴趣相似用户的浏览记录,获得为目标用户提供的推荐结果。
参见图11所示,本发明一种基于用户轨迹的协同过滤推荐装置还可以包括:
第一调整单元16,用于当地理位置坐标数据不断增加,利用机器学习,调整第一阈值和/或第二阈值的取值范围。
划分单元17,用于将用户化分为若干组。
设置单元18,用于在为不同组用户中的目标用户分别提供推荐结果的过程中,设置不同的第三阈值、第四阈值和/或第五阈值。
第二获得单元19,用于获得不同组的目标用户的推荐结果转化率。
第二调整单元110,用于根据不同组的目标用户的推荐结果转化率,调整第三阈值、第四阈值和/或第五阈值。
相应的,本发明还提供一种基于用户轨迹的协同过滤推荐系统,参见图12所示,该系统包括:
若干个移动终端2以及推荐服务器1。
其中,推荐服务器1可以是上述实施例提供的基于用户轨迹的协同过滤推荐装置;
移动终端2,用于向推荐服务器发送位置信息以及用户的浏览记录并获得推荐服务器为目标用户提供的推荐结果。
该移动终端中可以包括客户端,例如视频客户端,用户使用该移动终端在客户端软件中浏览、选择视频,由该客户端为用户提供推荐结果。
本系统的工作原理是:
在移动终端使用时可以根据用户的移动将位置信息以及用户的浏览记录发送推荐服务器,在推荐服务器形成日志。推荐服务器根据位置信息确定用户的地理位置坐标;对由地理位置坐标确定的位置点进行聚类,确定用户的用户轨迹,用户轨迹为半径小于第一阈值且位置点密度大于第二阈值的区域;当地理位置坐标数据不断增加,利用机器学习,调整第一阈值和/或第二阈值的取值范围;在为不同组用户中的目标用户分别提供推荐结果的过程中,将用户化分为若干组,设置不同的第三阈值、第四阈值和/或第五阈值;比较目标用户与其他用户的用户轨迹,将用户轨迹与目标用户的用户轨迹直接相交区域面积大于第三阈值和/或间接相交区域面积大于第四阈值的其他用户确定为目标用户的近邻用户;根据目标用户与近邻用户的浏览记录,计算目标用户与每个近邻用户的兴趣相似度;确定近邻用户中与目标用户中兴趣相似度大于第五阈值的用户为目标用户的兴趣相似用户;根据兴趣相似用户的浏览记录,获得为目标用户提供的推荐结果;获得不同组的目标用户的推荐结果转化率;根据不同组的目标用户的推荐结果转化率,调整第三阈值、第四阈值和/或第五阈值。移动终端最终获得推荐服务器为目标用户提供的推荐结果。
这样,本发明利用移动设备对用户的地理位置坐标进行聚类,产生用户轨迹,利用用户轨迹确定近邻用户,可以将兴趣相似的用户在空间上进行划分,进而通过近邻用户及其浏览记录,将用户线上行为和线下行为相结合,利用协同过滤算法获得推荐结果。由于用户的活动范围可以反映该用户的自身属性,同时将全国范围内的用户相似度计算大幅度降低为附近区域高度重叠的用户相似度计算,降低了计算难度,提高了推荐准确率。另外,一个新用户只要产生用户轨迹,就可以在其浏览记录不足够的情况下,利用其近邻用户的浏览记录为该新用户提供推荐结果,避免了推荐系统冷启动的现象。
需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统或装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD‑ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

一种基于用户轨迹的协同过滤推荐方法、装置及系统.pdf_第1页
第1页 / 共17页
一种基于用户轨迹的协同过滤推荐方法、装置及系统.pdf_第2页
第2页 / 共17页
一种基于用户轨迹的协同过滤推荐方法、装置及系统.pdf_第3页
第3页 / 共17页
点击查看更多>>
资源描述

《一种基于用户轨迹的协同过滤推荐方法、装置及系统.pdf》由会员分享,可在线阅读,更多相关《一种基于用户轨迹的协同过滤推荐方法、装置及系统.pdf(17页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 103116614 A(43)申请公布日 2013.05.22CN103116614A*CN103116614A*(21)申请号 201310030471.2(22)申请日 2013.01.25G06F 17/30(2006.01)(71)申请人北京奇艺世纪科技有限公司地址 100080 北京市海淀区海淀北一街2号鸿城拓展大厦11层1101号(72)发明人晋向前 傅一峰 王敏 张磊杨子斌(74)专利代理机构北京集佳知识产权代理有限公司 11227代理人王宝筠(54) 发明名称一种基于用户轨迹的协同过滤推荐方法、装置及系统(57) 摘要本发明公开了一种基于用户轨迹的协同。

2、过滤推荐方法,用于在用户浏览挑选网页或视频时,为用户提供更有效的推荐,该方法包括:获得移动终端的位置信息,根据位置信息确定用户的地理位置坐标;对由地理位置坐标确定的位置点进行聚类,确定用户的用户轨迹,用户轨迹为半径小于第一阈值且位置点密度大于第二阈值的区域;比较目标用户与其他用户的用户轨迹,确定目标用户的近邻用户,目标用户为用户中待提供推荐结果的用户;获得并保存用户的浏览记录;根据目标用户与近邻用户的浏览记录,利用协同过滤算法,为目标用户提供推荐结果。本发明还公开了一种基于用户轨迹的协同过滤推荐装置及系统。(51)Int.Cl.权利要求书2页 说明书9页 附图5页(19)中华人民共和国国家知识。

3、产权局(12)发明专利申请权利要求书2页 说明书9页 附图5页(10)申请公布号 CN 103116614 ACN 103116614 A1/2页21.一种基于用户轨迹的协同过滤推荐方法,其特征在于,所述方法包括:获得移动终端的位置信息,根据所述位置信息确定用户的地理位置坐标;对由所述地理位置坐标确定的位置点进行聚类,确定所述用户的用户轨迹,所述用户轨迹为半径小于第一阈值且所述位置点密度大于第二阈值的区域;比较目标用户与其他用户的用户轨迹,确定所述目标用户的近邻用户,所述目标用户为所述用户中待提供推荐结果的用户;获得并保存所述用户的浏览记录;根据所述目标用户与所述近邻用户的所述浏览记录,利用协。

4、同过滤算法,为目标用户提供推荐结果。2.根据权利要求1所述的方法,其特征在于,所述比较目标用户与其他用户的用户轨迹,确定所述目标用户的近邻用户,包括:比较目标用户与其他用户的用户轨迹,将用户轨迹与所述目标用户的用户轨迹直接相交区域面积大于第三阈值的其他用户确定为所述目标用户的近邻用户;比较目标用户与其他用户的用户轨迹,将用户轨迹与所述目标用户的用户轨迹间接相交区域面积大于第四阈值的其他用户确定为所述目标用户的近邻用户。3.根据权利要求1所述的方法,其特征在于,所述根据所述目标用户与所述近邻用户的所述浏览记录,利用协同过滤算法,为目标用户提供推荐结果,包括:根据所述目标用户与所述近邻用户的所述浏。

5、览记录,计算所述目标用户与每个近邻用户的兴趣相似度;确定所述近邻用户中与所述目标用户中兴趣相似度大于第五阈值的用户为所述目标用户的兴趣相似用户;根据所述兴趣相似用户的浏览记录,获得为目标用户提供的推荐结果。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:当所述地理位置坐标数据不断增加,利用机器学习,调整第一阈值和/或第二阈值的取值范围。5.根据权利要求2或3所述的方法,其特征在于,所述方法还包括:将所述用户化分为若干组;在为不同组用户中的所述目标用户分别提供推荐结果的过程中,设置不同的所述第三阈值、所述第四阈值和/或所述第五阈值;获得不同组的目标用户的推荐结果转化率;根据所述不同组的。

6、目标用户的推荐结果转化率,调整所述第三阈值、所述第四阈值和/或所述第五阈值。6.一种基于用户轨迹的协同过滤推荐装置,其特征在于,所述装置包括:第一确定单元,用于获取移动终端的位置信息,根据所述位置信息确定用户的地理位置坐标;第二确定单元,用于对由所述地理位置坐标确定的位置点进行聚类,确定所述用户的用户轨迹,所述用户轨迹为半径小于第一阈值且所述位置点密度大于第二阈值的区域;第三确定单元,用于比较目标用户与其他用户的用户轨迹,确定所述目标用户的近邻用户,所述目标用户为所述用户中待提供推荐结果的用户;权 利 要 求 书CN 103116614 A2/2页3第一获得单元,用于获得并保存所述用户的浏览记。

7、录;推荐单元,用于根据所述目标用户与所述近邻用户的所述浏览记录,利用协同过滤算法,为目标用户提供推荐结果。7.根据权利要求6所述的装置,其特征在于,所述第三确定单元包括:第一确定子单元,用于比较目标用户与其他用户的用户轨迹,将用户轨迹与所述目标用户的用户轨迹直接相交区域面积大于第三阈值的其他用户确定为所述目标用户的近邻用户;第二确定子单元,用于比较目标用户与其他用户的用户轨迹,将用户轨迹与所述目标用户的用户轨迹间接相交区域面积大于第四阈值的其他用户确定为所述目标用户的近邻用户。8.根据权利要求6所述的装置,其特征在于,所述推荐单元包括:计算子单元,用于根据所述目标用户与所述近邻用户的所述浏览记。

8、录,计算所述目标用户与每个近邻用户的兴趣相似度;第三确定子单元,用于确定所述近邻用户中与所述目标用户中兴趣相似度大于第五阈值的用户为所述目标用户的兴趣相似用户;推荐子单元,用于根据所述兴趣相似用户的浏览记录,获得为目标用户提供的推荐结果。9.根据权利要求7所述的装置,其特征在于,所述装置还包括:第一调整单元,用于当所述地理位置坐标数据不断增加,利用机器学习,调整第一阈值和/或第二阈值的取值范围。10.根据权利要求7或8所述的装置,其特征在于,所述装置还包括:划分单元,用于将所述用户化分为若干组;设置单元,用于在为不同组用户中的所述目标用户分别提供推荐结果的过程中,设置不同的所述第三阈值、所述第。

9、四阈值和/或所述第五阈值;第二获得单元,用于获得不同组的目标用户的推荐结果转化率;第二调整单元,用于根据所述不同组的目标用户的推荐结果转化率,调整所述第三阈值、所述第四阈值和/或所述第五阈值。11.一种基于用户轨迹的协同过滤推荐系统,其特征在于,所述系统包括:若干个移动终端以及推荐服务器;所述推荐服务器是权利要求6-10任一项所述的基于用户轨迹的协同过滤推荐装置;所述移动终端,用于向所述推荐服务器发送位置信息以及用户的浏览记录并获得所述推荐服务器为目标用户提供的推荐结果。权 利 要 求 书CN 103116614 A1/9页4一种基于用户轨迹的协同过滤推荐方法、 装置及系统技术领域0001 本。

10、发明涉及网络技术领域,具体涉及一种基于用户轨迹的协同过滤推荐方法、装置及系统。背景技术0002 随着互联网技术的不断发展,用户能够获得的信息量不断增加,用户面临着信息过载的问题。例如,当用户以休闲为目的没有明确需求时浏览视频网站或视频客户端时,面对数不胜数的视频文件,用户会面对不知如何进行选择的问题。因此,需要推荐系统帮助用户进行信息过滤。协同过滤推荐是信息过滤和信息系统中的一项重要技术。0003 在现有技术中,协同过滤推荐算法的步骤包括:记录并统计用户的浏览记录;利用存在相似兴趣的用户群体或与用户兴趣相似的信息做推荐;当用户产生新的浏览行为时,推荐系统对用户没有看过但可能感兴趣的信息队列重新。

11、排序,推荐给用户。0004 但是,协同过滤推荐算法在线运算中往往需要考虑到实际服务器的压力来简化算法。在拥有千万级用户的网站中,如果要维护一个用户相似度矩阵,从存储和计算的角度来说,维护成本很高。因此在实际应用中在线计算通常不会遍历所有的用户或者用户所有的浏览记录,只能截取一小部分用户及一小部分用户的浏览记录,依据几个共同的浏览记录来判断相似兴趣的用户群体,而这些浏览记录的产生很可能是偶然发生而非兴趣类似导致。因此,以此为据进行推荐往往准确率不高,并且很难将推荐理由介绍给被推荐用户。另外,对于新用户来说,由于缺乏该用户的浏览记录,故很难预测其感兴趣的内容,推荐系统会遇到冷启动现象。发明内容00。

12、05 有鉴于此,本发明的主要目的是提供一种基于用户轨迹的协同过滤推荐方法、装置及系统,以解决现有技术中协同过滤推荐方法推荐准确率不高的问题。0006 为解决上述问题,本发明提供的技术方案如下:0007 一种基于用户轨迹的协同过滤推荐方法,所述方法包括:0008 获得移动终端的位置信息,根据所述位置信息确定用户的地理位置坐标;0009 对由所述地理位置坐标确定的位置点进行聚类,确定所述用户的用户轨迹,所述用户轨迹为半径小于第一阈值且所述位置点密度大于第二阈值的区域;0010 比较目标用户与其他用户的用户轨迹,确定所述目标用户的近邻用户,所述目标用户为所述用户中待提供推荐结果的用户;0011 获得。

13、并保存所述用户的浏览记录;0012 根据所述目标用户与所述近邻用户的所述浏览记录,利用协同过滤算法,为目标用户提供推荐结果。0013 相应的,所述比较目标用户与其他用户的用户轨迹,确定所述目标用户的近邻用户,包括:说 明 书CN 103116614 A2/9页50014 比较目标用户与其他用户的用户轨迹,将用户轨迹与所述目标用户的用户轨迹直接相交区域面积大于第三阈值的其他用户确定为所述目标用户的近邻用户;0015 比较目标用户与其他用户的用户轨迹,将用户轨迹与所述目标用户的用户轨迹间接相交区域面积大于第四阈值的其他用户确定为所述目标用户的近邻用户。0016 相应的,所述根据所述目标用户与所述近。

14、邻用户的所述浏览记录,利用协同过滤算法,为目标用户提供推荐结果,包括:0017 根据所述目标用户与所述近邻用户的所述浏览记录,计算所述目标用户与每个近邻用户的兴趣相似度;0018 确定所述近邻用户中与所述目标用户中兴趣相似度大于第五阈值的用户为所述目标用户的兴趣相似用户;0019 根据所述兴趣相似用户的浏览记录,获得为目标用户提供的推荐结果。0020 相应的,所述方法还包括:0021 当所述地理位置坐标数据不断增加,利用机器学习,调整第一阈值和/或第二阈值的取值范围。0022 相应的,所述方法还包括:0023 将所述用户化分为若干组;0024 在为不同组用户中的所述目标用户分别提供推荐结果的过。

15、程中,设置不同的所述第三阈值、所述第四阈值和/或所述第五阈值;0025 获得不同组的目标用户的推荐结果转化率;0026 根据所述不同组的目标用户的推荐结果转化率,调整所述第三阈值、所述第四阈值和/或所述第五阈值。0027 一种基于用户轨迹的协同过滤推荐装置,所述装置包括:0028 第一确定单元,用于获取移动终端的位置信息,根据所述位置信息确定用户的地理位置坐标;0029 第二确定单元,用于对由所述地理位置坐标确定的位置点进行聚类,确定所述用户的用户轨迹,所述用户轨迹为半径小于第一阈值且所述位置点密度大于第二阈值的区域;0030 第三确定单元,用于比较目标用户与其他用户的用户轨迹,确定所述目标用。

16、户的近邻用户,所述目标用户为所述用户中待提供推荐结果的用户;0031 第一获得单元,用于获得并保存所述用户的浏览记录;0032 推荐单元,用于根据所述目标用户与所述近邻用户的所述浏览记录,利用协同过滤算法,为目标用户提供推荐结果。0033 相应的,所述第三确定单元包括:0034 第一确定子单元,用于比较目标用户与其他用户的用户轨迹,将用户轨迹与所述目标用户的用户轨迹直接相交区域面积大于第三阈值的其他用户确定为所述目标用户的近邻用户;0035 第二确定子单元,用于比较目标用户与其他用户的用户轨迹,将用户轨迹与所述目标用户的用户轨迹间接相交区域面积大于第四阈值的其他用户确定为所述目标用户的近邻用户。

17、。说 明 书CN 103116614 A3/9页60036 相应的,所述推荐单元包括:0037 计算子单元,用于根据所述目标用户与所述近邻用户的所述浏览记录,计算所述目标用户与每个近邻用户的兴趣相似度;0038 第三确定子单元,用于确定所述近邻用户中与所述目标用户中兴趣相似度大于第五阈值的用户为所述目标用户的兴趣相似用户;0039 推荐子单元,用于根据所述兴趣相似用户的浏览记录,获得为目标用户提供的推荐结果。0040 相应的,所述装置还包括:0041 第一调整单元,用于当所述地理位置坐标数据不断增加,利用机器学习,调整第一阈值和/或第二阈值的取值范围。0042 相应的,所述装置还包括:0043。

18、 划分单元,用于将所述用户化分为若干组;0044 设置单元,用于在为不同组用户中的所述目标用户分别提供推荐结果的过程中,设置不同的所述第三阈值、所述第四阈值和/或所述第五阈值;0045 第二获得单元,用于获得不同组的目标用户的推荐结果转化率;0046 第二调整单元,用于根据所述不同组的目标用户的推荐结果转化率,调整所述第三阈值、所述第四阈值和/或所述第五阈值。0047 一种基于用户轨迹的协同过滤推荐系统,所述系统包括:0048 若干个移动终端以及推荐服务器;0049 所述推荐服务器是权利要求6-10任一项所述的基于用户轨迹的协同过滤推荐装置;0050 所述移动终端,用于向所述推荐服务器发送位置。

19、信息以及用户的浏览记录并获得所述推荐服务器为目标用户提供的推荐结果。0051 由此可见,本发明具有如下有益效果:0052 本发明利用移动设备对用户的地理位置坐标进行聚类,产生用户轨迹,利用用户轨迹确定近邻用户,可以将兴趣相似的用户在空间上进行划分,进而通过近邻用户及其浏览记录,将用户线上行为和线下行为相结合,利用协同过滤算法获得推荐结果。由于用户的活动范围可以反映该用户的自身属性,同时将全国范围内的用户相似度计算大幅度降低为附近区域高度重叠的用户相似度计算,降低了计算难度,提高了推荐准确率。另外,一个新用户只要产生用户轨迹,就可以在其浏览记录不足够的情况下,利用其近邻用户的浏览记录为该新用户提。

20、供推荐结果,避免了推荐系统冷启动的现象。附图说明0053 图1为本发明基于用户轨迹的协同过滤推荐方法的流程图;0054 图2为本发明中用户轨迹的示意图;0055 图3为本发明中近邻用户的示意图;0056 图4为本发明基于用户轨迹的协同过滤推荐方法的一种实施例流程图;0057 图5为本发明中用户-物品排列表以及物品-用户排列表的示意图;0058 图6为本发明中用户相似度矩阵表的示意图;说 明 书CN 103116614 A4/9页70059 图7为本发明基于用户轨迹的协同过滤推荐方法的一种具体实施例的流程图;0060 图8为本发明基于用户轨迹的协同过滤推荐装置的示意图;0061 图9为本发明基于。

21、用户轨迹的协同过滤推荐装置中的第三确定单元的示意图;0062 图10为本发明基于用户轨迹的协同过滤推荐装置中的推荐单元的示意图;0063 图11为本发明基于用户轨迹的协同过滤推荐装置的一种具体实施例的示意图;0064 图12为本发明实现基于用户轨迹的协同过滤推荐系统的示意图。具体实施方式0065 为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明实施例作进一步详细的说明。0066 本发明基于用户轨迹的协同过滤推荐方法,主要是针对现有技术中协同过滤推荐方法推荐准确率低的问题。由于兴趣特征类似的用户在空间上的活动也往往存在区域高度重叠的现象,如:某重点大学的学生人。

22、群、某IT公司的职员,这些人群在兴趣上有分别,在活动范围上各自保持一定的区域,区域间的人群很少相互重叠,而同一群体内的人活动范围基本类似。因此,提出引入地理位置服务获取用户位置信息后,通过用户轨迹分析,可以从看似杂乱无章的用户位置集合中确定出用户的主要活动区域,并根据重叠区域找出近邻用户,将其它近邻用户的兴趣爱好联系用户目标,使用户在浏览、挑选网页信息时,例如浏览视频时,给出用户更有效的推荐,使移动在线浏览与传统的PC在线浏览形成差异。0067 基于上述思想,参见图1所示,本发明用户轨迹的协同过滤推荐方法,包括以下步骤:0068 步骤101:获得移动终端的位置信息,根据位置信息确定用户的地理位。

23、置坐标。0069 对同意开启该功能的用户,在用户开启该功能时,为每个用户使用的移动终端分配不同的经过加密的唯一编号,匿名统计该移动终端(即代表该用户)的位置信息。具体的,位置信息可以通过GPS、wifi网络或移动运营商基站获得。将位置地理转换为地理位置坐标,如经纬度坐标。该地理位置坐标与实际地址无关,即采用“双匿名”模式,既可以保护用户的隐私,有可以获得用户的位置信息,完成用户行为分析。0070 步骤102:对由地理位置坐标确定的位置点进行聚类,确定用户的用户轨迹,用户轨迹为半径小于第一阈值且位置点密度大于第二阈值的区域。0071 用户的地理位置坐标可以形成位置点的集合,对这些位置点进行聚类,。

24、形成用户的用户轨迹,即用户主要活动的区域,可以以此来描述该用户的属性,每个用户形成的用户轨迹可以为若干个“点簇”。具体的,可以设置第二阈值,将密度大于第二阈值的位置点集聚类,将密度小于或等于第二阈值的位置点集抛弃,并考虑到点集的连续性,尽量减少形成“点簇”的数量,最后形成用户的轨迹。聚类的同时考虑到最大聚合半径(第一阈值),该参数可以不断进行调整,保证聚类而成的每个“点簇”不会无限制的扩大,从而保证协同的效果。0072 参见图2所示,对由地理位置坐标确定的位置点进行聚类后确定的用户轨迹,可以抽象为若干个“点簇”,例如,一个用户常见的用户轨迹通常会包括两个“点簇”:“居住地区3公里以内”以及“工。

25、作地区3公里以内”,其它零星点由于其位置点集密度不能达到第二阈值,则可以被抛弃。说 明 书CN 103116614 A5/9页80073 步骤103:比较目标用户与其他用户的用户轨迹,确定目标用户的近邻用户,目标用户为用户中待提供推荐结果的用户。0074 具体的,该步骤可以包括:比较目标用户与其他用户的用户轨迹,将用户轨迹与目标用户的用户轨迹直接相交区域面积大于第三阈值的其他用户确定为目标用户的近邻用户;0075 比较目标用户与其他用户的用户轨迹,将用户轨迹与目标用户的用户轨迹间接相交区域面积大于第四阈值的其他用户确定为目标用户的近邻用户。0076 在步骤102中,获得了每个用户的用户轨迹,可。

26、以通过判断每个用户的用户轨迹直接的相交情况,确定近邻用户。参见图3所示,例如,一个用户目标A与其他用户B-H在居住地区的用户轨迹如图所示,当目标用户的用户轨迹与其他用户的用户轨迹直接相交面积区域大于第三阈值时,例如,用户A与用户C、D,则用户C、D为用户A的近邻用户;当目标用户的用户轨迹与其他用户的用户轨迹间接相交面积区域大于第四阈值时,例如,用户A与用户B、E,则用户B、E为用户A的近邻用户;当目标用户的用户轨迹与其他用户的用户轨迹相切或不相交时,为非近邻用户,例如用户H;当目标用户的用户轨迹与其他用户的用户轨迹间接相交面积区域小于或等于第四阈值时,为非近邻用户,例如用户F、G。这样,可以获。

27、得目标用户的所有近邻用户,另外,也可以说这些用户互为近邻用户,例如,用户A、B、C、D、E之间互为近邻用户。0077 步骤104:获得并保存用户的浏览记录。0078 用户对网站的操作可定义为用户行为,用户行为可以包括所有能表示用户喜好的与网站系统交互的操作,用户行为在网站中的通常用用户日志的形式保存。具体的,可以通过用户日志获得并保存用户在网站中的浏览记录。0079 步骤105:根据目标用户与近邻用户的浏览记录,利用协同过滤算法,为目标用户提供推荐结果。0080 协同过滤算法是研究预测用户行为的一类算法,一般是指在个性化推荐系统中,当一个目标用户A需要个性化推荐时,可以先找到和他有相似特征的人。

28、群,然后把那些用户喜欢而用户A没有听说过的物品推荐给A,或者根据A以往喜好过的物品,将类似的物品推荐给用户,这种方法称协同过滤算法。0081 在上述实施例中,步骤101-103可以与步骤104并行执行。0082 本发明利用目标用户与近邻用户的浏览记录,为目标用户提供推荐结果,将兴趣爱好类似的用户在空间上进行划分,帮助用户发现对自己有价值的信息,为用户提供更好的使用体验。0083 参见图4所示,在上述实施例中,根据目标用户与近邻用户的浏览记录,利用协同过滤算法,为目标用户提供推荐结果,具体可以包括:0084 步骤1051:根据目标用户与近邻用户的浏览记录,计算目标用户与每个近邻用户的兴趣相似度。。

29、0085 假设有用户U和用户V,令N(u)为用户U的浏览记录的集合,N(v)为用户V的浏览记录的集合,根据用户矩阵表,用户U和用户V的兴趣相似度WUV为:参见图5所示,可以在近邻用户中获得用户-物品排列表,例如用户A-E,浏览记录I-V,可说 明 书CN 103116614 A6/9页9以将用户-物品排列表转换为物品-用户排列表。参见图6所示,以5个用户为例,根据物品-用户排列表可以得到用户矩阵表,表格中的数值为用户之间的兴趣相似度示例,例如对物品I,用户A、B、E都操作过,因此AB、BA、AE、EA、BE、EB的相似度加1,以此类推,当扫描完全部浏览记录后,即可以得到WUV的分子部分。008。

30、6 本发明的方法在近邻用户中计算兴趣相似度,可以简化用户矩阵,大幅降低服务器的计算压力,同时,降低新用户冷启动现象,提高推荐结果。0087 步骤1052:确定近邻用户中与目标用户中兴趣相似度大于第五阈值的用户为目标用户的兴趣相似用户。0088 步骤1053:根据兴趣相似用户的浏览记录,获得为目标用户提供的推荐结果。0089 假设用户U对物品i感兴趣的程度为:其中,S(u,K)表示和用户U兴趣最接近的K个用户,N(i)是对物品i有过行为的用户集合,wuv表示用户U和用户V之间的兴趣相似度,rvi表示用户V对物品i的兴趣。即可通过兴趣相似用户的浏览记录,获得为目标用户提供的推荐结果。0090 本发。

31、明用户轨迹的协同过滤推荐方法还可以包括:0091 当地理位置坐标数据不断增加,利用机器学习,调整第一阈值和/或第二阈值的取值范围。0092 当地理位置坐标数据不断增加时,用户经常活动区域更加突出,可以调整第一阈值和/或第二阈值的取值范围,即可以调整“点簇”半径,并进一步控制最大近邻数目,使得协同推荐结果更加准确。0093 另外,本发明用户轨迹的协同过滤推荐方法还可以包括:0094 将用户化分为若干组;0095 在为不同组用户中的目标用户分别提供推荐结果的过程中,设置不同的第三阈值、第四阈值和/或第五阈值;0096 获得不同组的目标用户的推荐结果转化率;0097 根据不同组的目标用户的推荐结果转。

32、化率,调整第三阈值、第四阈值和/或第五阈值。0098 该方法是一种在线算法测评试验方法,当用户访问时,将用户划分为若干个组,将部分用户在使用推荐功能时设置新的参数值,而另一部分用户在使用推荐功能时依然使用原有的参数值,通过对推荐结果转化率的分析,评估新的参数值是否优于旧的参数值,并确定优于现有参数值的方法进行调整。例如,对视频信息对用户进行推荐,推荐结果转化率是指视频播放次数与视频展示次数之间的比值。可以由推荐结果转化率对推荐结果进行评价,不断逼近最优的推荐算法参数取值范围。具体的,第三阈值、第四阈值和/或第五阈值也可以利用机器学习进行调整。0099 参见图7所示,本发明用户轨迹的协同过滤推荐。

33、方法的一种具体实施例,包括以下步骤:0100 步骤201:获得移动终端的位置信息,根据位置信息确定用户的地理位置坐标。0101 步骤202:对由地理位置坐标确定的位置点进行聚类,确定用户的用户轨迹,用户轨迹为半径小于第一阈值且位置点密度大于第二阈值的区域。说 明 书CN 103116614 A7/9页100102 步骤203:当地理位置坐标数据不断增加,利用机器学习,调整第一阈值和/或第二阈值的取值范围。0103 步骤204:在为不同组用户中的目标用户分别提供推荐结果的过程中,将用户化分为若干组,设置不同的第三阈值、第四阈值和/或第五阈值。0104 步骤205:比较目标用户与其他用户的用户轨迹。

34、,将用户轨迹与目标用户的用户轨迹直接相交区域面积大于第三阈值和/或间接相交区域面积大于第四阈值的其他用户确定为目标用户的近邻用户。0105 步骤206:获得并保存用户的浏览记录。0106 步骤207:根据目标用户与近邻用户的浏览记录,计算目标用户与每个近邻用户的兴趣相似度。0107 步骤208:确定近邻用户中与目标用户中兴趣相似度大于第五阈值的用户为目标用户的兴趣相似用户。0108 步骤209:根据兴趣相似用户的浏览记录,获得为目标用户提供的推荐结果。0109 步骤210:获得不同组的目标用户的推荐结果转化率。0110 步骤211:根据不同组的目标用户的推荐结果转化率,调整第三阈值、第四阈值和。

35、/或第五阈值,之后可以返回步骤204,获得最优的第三阈值、第四阈值以及第五阈值取值范围。0111 这样,利用移动设备对用户的地理位置坐标进行聚类,产生用户轨迹,利用用户轨迹确定近邻用户,可以将兴趣相似的用户在空间上进行划分,进而通过近邻用户及其浏览记录,将用户线上行为和线下行为相结合,利用协同过滤算法获得推荐结果。由于用户的活动范围可以反映该用户的自身属性,同时将全国范围内的用户相似度计算大幅度降低为附近区域高度重叠的用户相似度计算,降低了计算难度,提高了推荐准确率。另外,一个新用户只要产生用户轨迹,就可以在其浏览记录不足够的情况下,利用其近邻用户的浏览记录为该新用户提供推荐结果,避免了推荐系。

36、统冷启动的现象。0112 相应的,本发明还提供一种基于用户轨迹的协同过滤推荐装置,参见图8所示,该装置包括:0113 第一确定单元11、第二确定单元12、第三确定单元13、第一获得单元14以及推荐单元15。0114 其中,第一确定单元11,用于获取移动终端的位置信息,根据位置信息确定用户的地理位置坐标;0115 第二确定单元12,用于对由地理位置坐标确定的位置点进行聚类,确定用户的用户轨迹,用户轨迹为半径小于第一阈值且位置点密度大于第二阈值的区域;0116 第三确定单元13,用于比较目标用户与其他用户的用户轨迹,确定目标用户的近邻用户,目标用户为用户中待提供推荐结果的用户;0117 第一获得单元14,用于获得并保存用户的浏览记录;0118 推荐单元15,用于根据目标用户与近邻用户的浏览记录,利用协同过滤算法,为目标用户提供推荐结果。0119 在上述实施例中,参见图9所示,第三确定单元13可以包括:0120 第一确定子单元131,用于比较目标用户与其他用户的用户轨迹,将用户轨迹与目说 明 书CN 103116614 A10。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1