一种基于相似度计算的个性化职位推荐方法和系统.pdf

上传人:le****a 文档编号:6062672 上传时间:2019-04-05 格式:PDF 页数:17 大小:1.02MB
返回 下载 相关 举报
摘要
申请专利号:

CN201511016094.2

申请日:

2015.12.29

公开号:

CN106933821A

公开日:

2017.07.07

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):G06F 17/30申请日:20151229|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

中国电信股份有限公司

发明人:

孟维业; 郭靓; 王学敏; 柏振; 么遥; 项超

地址:

100033 北京市西城区金融大街31号

优先权:

专利代理机构:

中国国际贸易促进委员会专利商标事务所 11038

代理人:

孙宝海

PDF下载: PDF下载
内容摘要

本发明公开了一种基于相似度计算的个性化职位推荐方法和系统,涉及数据挖掘中推荐系统领域。其中的方法包括:提取并分析用户行为数据,建立用户兴趣模型;根据用户兴趣模型,计算各用户之间或各职位之间的相似度;对相似度的值排序,获取与当前用户相似度最高的前N个用户集,或与当前职位相似度最高的前N个职位集;将前N个用户集中相似用户申请的职位或前N个职位集中相似职位推荐给当前用户。即根据用户浏览和访问职位的行为信息,建立用户职位兴趣模型,实现个性化职位推荐,可以帮助用户更快更好地发现和找到自己感兴趣的以及适合自己的职位。

权利要求书

1.一种基于相似度计算的个性化职位推荐方法,其特征在于,
包括:
提取并分析用户行为数据,建立用户兴趣模型;
根据所述用户兴趣模型,计算各用户之间或各职位之间的相似
度;
对所述相似度的值排序,获取与当前用户相似度最高的前N个用
户集,或与当前职位相似度最高的前N个职位集;
将所述前N个用户集中相似用户申请的职位或所述前N个职位
集中相似职位推荐给所述当前用户。
2.根据权利要求1所述的方法,其特征在于,根据所述用户兴
趣模型,计算各用户之间的相似度的步骤包括:
获取各用户对各个职位的兴趣值;
以所述各用户对各个职位的兴趣值为向量,计算各用户之间的相
似度。
3.根据权利要求2所述的方法,其特征在于,还包括:
计算各用户查询职位内容的相似度,并将所述各用户查询职位内
容的相似度作为各用户之间的相似度。
4.根据权利要求3所述的方法,其特征在于,计算各用户查询
职位内容的相似度的步骤包括:
将各用户查询职位内容进行分词处理,将分词处理后的每个字段
作为一个集合;
计算各集合的交集大小与各集合的并集大小的比值;
根据所述比值计算各用户查询职位内容的相似度。
5.根据权利要求1所述的方法,其特征在于,根据所述用户兴
趣模型计算各职位之间的相似度的步骤包括:
基于各个用户对各个职位的偏好获得各个职位的用户偏好向量;
基于各个职位的用户偏好向量计算各个职位之间的相似度。
6.根据权利要求1所述的方法,其特征在于,提取并分析用户
行为数据,建立用户兴趣模型的步骤包括:
为所述用户行为数据中的用户申请职位行为设置第一兴趣权值,
为用户收藏职位行为设置第二兴趣权值,为用户浏览职位行为设置第
三兴趣权值;
根据所述第一兴趣权值、第二兴趣权值和第三兴趣权值,计算用
户对职位的兴趣值,从而建立用户兴趣模型。
7.根据权利要求1-6任一所述的方法,其特征在于,还包括:
将当前用户的注册信息与职位数据库中的职位属性进行匹配,所
述职位属性包括薪酬、技能、专业和工作地点要求;
将匹配度最高的职位推荐给所述当前用户。
8.一种基于相似度计算的个性化职位推荐系统,其特征在于,
包括:
兴趣模型建立单元,用于提取并分析用户行为数据,建立用户兴
趣模型;
相似度计算单元,用于根据所述用户兴趣模型,计算各用户之间
或各职位之间的相似度;
相似度排序单元,用于对所述相似度的值排序,获取与当前用户
相似度最高的前N个用户集,或与当前职位相似度最高的前N个职位
集;
职位推荐单元,用于将所述前N个用户集中相似用户申请的职位
或所述前N个职位集中相似职位推荐给所述当前用户。
9.根据权利要求8所述的系统,其特征在于,
所述相似度计算单元用于获取各用户对各个职位的兴趣值;以所
述各用户对各个职位的兴趣值为向量,计算各用户之间的相似度。
10.根据权利要求9所述的系统,其特征在于,
所述相似度计算单元还用于计算各用户查询职位内容的相似度,
并将所述各用户查询职位内容的相似度作为各用户之间的相似度。
11.根据权利要求10所述的系统,其特征在于,
所述相似度计算单元还用于将各用户查询职位内容进行分词处
理,将分词处理后的每个字段作为一个集合;计算各集合的交集大小
与各集合的并集大小的比值;根据所述比值计算各用户查询职位内容
的相似度。
12.根据权利要求8所述的系统,其特征在于,
所述相似度计算单元还用于基于各个用户对各个职位的偏好获
得各个职位的用户偏好向量;基于各个职位的用户偏好向量计算各个
职位之间的相似度。
13.根据权利要求8所述的系统,其特征在于,
所述兴趣模型建立单元用于为所述用户行为数据中的用户申请
职位行为设置第一兴趣权值,为用户收藏职位行为设置第二兴趣权值,
为用户浏览职位行为设置第三兴趣权值;根据所述第一兴趣权值、第
二兴趣权值和第三兴趣权值,计算用户对职位的兴趣值,从而建立用
户兴趣模型。
14.根据权利要求8-13任一所述的系统,其特征在于,还包括:
用户注册信息推荐单元,用于将当前用户的注册信息与职位数据
库中的职位属性进行匹配,所述职位属性包括薪酬、技能、专业和工
作地点要求;将匹配度最高的职位推荐给所述当前用户。

说明书

一种基于相似度计算的个性化职位推荐方法和系统

技术领域

本发明涉及数据挖掘中推荐系统领域,尤其涉及一种基于相似度
计算的个性化职位推荐方法和系统。

背景技术

随着互联网技术的快速发展,人们面临着信息过载的情况,在琳
琅满目的内容面前,用户需要大量的时间才能找到自己想要的信息和
商品。因此,推荐系统在这种环境下应运而生。个性化推荐,主要是
根据用户的行为兴趣特点和购买行为,向用户推荐用户感兴趣的信息
和商品。目前在电子商务系统、电影、视频网站、个性化音乐电台、
个性化广告、个性化阅读等方面得到广泛运用。其中电子商务网站是
个性化推荐的一大应用领域,著名的电子商务网站亚马逊是个性化系
统的积极应用者和推广者,国内的淘宝和京东商城近年也大力推进推
荐系统的发展。此外,在电影和视频中,美国的Netflix非常看重推荐
技术的发展,并建立Netflix Prize推荐系统比赛。亚马逊和Netflix是
推荐系统领域最具代表性的两家公司,主要运用协同过滤的推荐技术
实现个性化的商品和视频电影推荐。

当前推荐系统的主要研究技术,有基于协同过滤的推荐、基于关
联规则的推荐、基于内容推荐、基于模型的推荐、基于社会化的推荐、
和基于移动位置的推荐等。

本院翼实习系统提供数十万职位,用户在进行选择申报时,尽管
通过搜索可以过滤一些信息,但还是需要花费一定的时间才能找到自
己满意的职位。

发明内容

本发明要解决的技术问题是现有技术中搜索、申请职位不方便。

根据本发明一方面,提出一种基于相似度计算的个性化职位推荐
方法,包括:提取并分析用户行为数据,建立用户兴趣模型;根据用
户兴趣模型,计算各用户之间或各职位之间的相似度;对相似度的值
排序,获取与当前用户相似度最高的前N个用户集,或与当前职位相
似度最高的前N个职位集;将前N个用户集中相似用户申请的职位或
前N个职位集中相似职位推荐给当前用户。

进一步地,根据用户兴趣模型,计算各用户之间的相似度的步骤
包括:获取各用户对各个职位的兴趣值;以各用户对各个职位的兴趣
值为向量,计算各用户之间的相似度。

进一步地,还包括:计算各用户查询职位内容的相似度,并将各
用户查询职位内容的相似度作为各用户之间的相似度。

进一步地,计算各用户查询职位内容的相似度的步骤包括:将各
用户查询职位内容进行分词处理,将分词处理后的每个字段作为一个
集合;计算各集合的交集大小与各集合的并集大小的比值;根据比值
计算各用户查询职位内容的相似度。

进一步地,根据用户兴趣模型计算各职位之间的相似度的步骤包
括:基于各个用户对各个职位的偏好获得各个职位的用户偏好向量;
基于各个职位的用户偏好向量计算各个职位之间的相似度。

进一步地,提取并分析用户行为数据,建立用户兴趣模型的步骤
包括:为用户行为数据中的用户申请职位行为设置第一兴趣权值,为
用户收藏职位行为设置第二兴趣权值,为用户浏览职位行为设置第三
兴趣权值;根据第一兴趣权值、第二兴趣权值和第三兴趣权值,计算
用户对职位的兴趣值,从而建立用户兴趣模型。

进一步地,还包括:将当前用户的注册信息与职位数据库中的职
位属性进行匹配,职位属性包括薪酬、技能、专业和工作地点要求;
将匹配度最高的职位推荐给当前用户。

根据本发明的另一方面,还提出一种基于相似度计算的个性化职
位推荐系统,包括:兴趣模型建立单元,用于提取并分析用户行为数
据,建立用户兴趣模型;相似度计算单元,用于根据用户兴趣模型,
计算各用户之间或各职位之间的相似度;相似度排序单元,用于对相
似度的值排序,获取与当前用户相似度最高的前N个用户集,或与当
前职位相似度最高的前N个职位集;职位推荐单元,用于将前N个用
户集中相似用户申请的职位或前N个职位集中相似职位推荐给当前用
户。

进一步地,相似度计算单元用于获取各用户对各个职位的兴趣
值;以各用户对各个职位的兴趣值为向量,计算各用户之间的相似度。

进一步地,相似度计算单元还用于计算各用户查询职位内容的相
似度,并将各用户查询职位内容的相似度作为各用户之间的相似度。

进一步地,相似度计算单元还用于将各用户查询职位内容进行分
词处理,将分词处理后的每个字段作为一个集合;计算各集合的交集
大小与各集合的并集大小的比值;根据比值计算各用户查询职位内容
的相似度。

进一步地,相似度计算单元还用于基于各个用户对各个职位的偏
好获得各个职位的用户偏好向量;基于各个职位的用户偏好向量计算
各个职位之间的相似度。

进一步地,兴趣模型建立单元用于为用户行为数据中的用户申请
职位行为设置第一兴趣权值,为用户收藏职位行为设置第二兴趣权值,
为用户浏览职位行为设置第三兴趣权值;根据第一兴趣权值、第二兴
趣权值和第三兴趣权值,计算用户对职位的兴趣值,从而建立用户兴
趣模型。

进一步地,还包括:用户注册信息推荐单元,用于将当前用户的
注册信息与职位数据库中的职位属性进行匹配,职位属性包括薪酬、
技能、专业和工作地点要求;将匹配度最高的职位推荐给当前用户。

与现有技术相比,本发明从传统单一的基于用户评分的协同过滤
推荐技术,提升为基于用户行为信息个性化推荐技术。即根据用户浏
览和访问职位的行为信息,建立用户职位兴趣模型,实现个性化职位
推荐,可以帮助用户更快更好地发现和找到自己感兴趣的以及适合自
己的职位。

通过以下参照附图对本发明的示例性实施例的详细描述,本发明
的其它特征及其优点将会变得清楚。

附图说明

构成说明书的一部分的附图描述了本发明的实施例,并且连同说
明书一起用于解释本发明的原理。

参照附图,根据下面的详细描述,可以更加清楚地理解本发明,
其中:

图1为本发明基于相似度计算的个性化职位推荐方法的一个实施
例的流程示意图。

图2为本发明基于用户相似的个性化职位推荐方法的一个实施例
的流程示意图。

图3为本发明基于用户相似的个性化职位推荐方法的另一个实施
例的流程示意图。

图4为本发明基于职位相似的个性化职位推荐方法的一个实施例
的流程示意图。

图5为本发明个性化职位推荐推荐引擎设计示意图。

图6为本发明基于相似度计算的个性化职位推荐系统的一个实施
例的流程示意图。

具体实施方式

现在将参照附图来详细描述本发明的各种示例性实施例。应注意
到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相
对布置、数字表达式和数值不限制本发明的范围。

同时,应当明白,为了便于描述,附图中所示出的各个部分的尺
寸并不是按照实际的比例关系绘制的。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决
不作为对本发明及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详
细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说
明书的一部分。

在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是
示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具
有不同的值。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,
一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行
进一步讨论。

为使本发明的目的、技术方案和优点更加清楚明白,以下结合具
体实施例,并参照附图,对本发明进一步详细说明。

图1为本发明基于相似度计算的个性化职位推荐方法的一个实施
例的流程示意图。该方法包括以下步骤:

在步骤110,提取并分析用户行为数据,建立用户兴趣模型。

用户行为包括用户申请职位行为、用户收藏职位行为、用户浏览
职位行为等,其中,可以为用户申请职位行为设置第一兴趣权值,为
用户收藏职位行为设置第二兴趣权值,为用户浏览职位行为设置第三
兴趣权值;根据第一兴趣权值、第二兴趣权值和第三兴趣权值,计算
用户对职位的兴趣值,从而建立用户兴趣模型。在一个实施例中,可
以根据关联性大小调整兴趣模型中各种行为对应的权值。例如,对申
请职位行为设置兴趣权值为5,对收藏职位行为设置的兴趣权值为4,
对浏览职位行为设置兴趣权值为3。这些兴趣参数值在运用的过程中,
可进行适当的微调。除此参数外,还可以设置个性化推荐的职位数,
例如用户推荐职位数设置为5。

在步骤120,根据用户兴趣模型,计算各用户之间或各职位之间
的相似度。

可以以各用户对各个职位的兴趣值为向量,计算各用户之间的相
似度,或者基于各个用户对各个职位的偏好获得各个职位的用户偏好
向量,然后基于各个职位的用户偏好向量计算各个职位之间的相似度。

在步骤130,对相似度的值排序,获取与当前用户相似度最高的
前N个用户集,或与当前职位相似度最高的前N个职位集。

在步骤140,将前N个用户集中相似用户申请的职位或前N个职
位集中相似职位推荐给所述当前用户。

例如,根据用户行为历史数据,推荐和当前用户职位兴趣相似的
用户所喜欢的职位,或者推荐和当前职位相似的职位。

本发明可以应用于翼实习项目的职位推荐模块,根据用户浏览和
访问职位的行为信息,建立用户职位兴趣模型,实现了基于用户相似
的和职位相似的个性化职位推荐的方法,可以帮助用户更快更好地发
现和找到自己感兴趣以及适合自己的职位。

图2为本发明基于用户相似的个性化职位推荐方法的一个实施例
的流程示意图。该方法包括以下步骤:

在步骤210,在用户行为数据库进行行为提取和分析,建立用户
兴趣模型。

用户行为数据库中包括用户申请职位行为、用户收藏职位行为、
用户浏览职位行为、用户职位查询内容行为等。

在步骤220,根据用户兴趣模型,获取各用户对各个职位的兴趣
值。

在步骤230,以各用户对各个职位的兴趣值为向量,计算各用户
之间的相似度。

例如,用户A和B都申请了职位1、2,用户C申请了职位1、3,
则用户A和B的相似度高于用户A和C的相似度。

在步骤240,对相似度的值排序,获取与当前用户相似度最高的
前N个用户集。

根据用户对职位的行为数据,包括申请、收藏、浏览职位行为建
立用户兴趣模型,然后根据用户兴趣模型产生用户对职位的兴趣值,
基于用户对职位的兴趣值找到最相似的邻居用户集。

在步骤250,将前N个用户集中相似用户申请的职位推荐给当前
用户。

即根据邻居的相似度权重以及他们对职位的偏好,推荐当前用户
未涉及职位(推荐的职位,相似用户之前没有申请),计算得到一个
排序的职位列表作为推荐。

例如,如表1所示,对于用户A,申请了职位1和职位3,用户
C申请职位1,3,4,而用户B申请了职位2,因此用户A和用户C
相似。即根据用户的历史偏好,这里只计算得到一个相似邻居用户C
因此将用户C申请的职位4推荐给用户A。

用户/职位
职位1
职位2
职位3
职位4
用户A



推荐
用户B




用户C




表1

在该实施例中,根据用户的对职位的行为数据,包括申请、收藏、
浏览行为建立用户兴趣模型,然后根据用户兴趣模型产生用户对职位
的兴趣值,基于用户对职位的兴趣值找到最相似的邻居用户集,然后
将相似用户申请的职位推荐给当前用户。因此,方便了用户更快更好
地发现和找到自己感兴趣的以及适合自己的职位。

图3为本发明基于用户相似的个性化职位推荐方法的另一个实施
例的流程示意图。

在步骤310,在用户行为数据库进行行为提取和分析,建立用户
兴趣模型。

在步骤320,根据用户兴趣模型,计算各用户查询职位内容的相
似度,并将各用户查询职位内容的相似度作为各用户之间的相似度。

在一个实施例中,将各用户查询职位内容利用自然语言处理技术
进行分词处理,将分词处理后的每个字段作为一个集合,可以将每个
集合存在用户行为数据库中。计算各集合的交集大小与各集合的并集
大小的比值;根据比值计算各用户查询职位内容的相似度。

例如,利用Jaccard相似度的方法,A,B分别代
表查询内容字段的集合,J(A,B)为两个集合交集的大小/两个集合并集
的大小。

在步骤330,对相似度的值排序,获取与当前用户相似度最高的
前N个用户集。

在步骤340,将前N个用户集中相似用户申请的职位推荐给当前
用户。

例如,如表2所示,对于用户A查询了北京,计算机,申请了职
位1、2和3,用户B查询了上海,计算机,申请了职位1和4,用户
C也查询了北京,计算机,同时申请了职位1和2,此时判断用户A
和C相似度高,将职位3推荐给用户C。

用户查询内容/职位
职位1
职位2
职位3
职位4
用户A:北京计算机




用户B:上海计算机




用户C:北京计算机


推荐

表2

由于实习职位业务的特殊性,地点作为职位的关键要素受用户关
注度较高,因此在此增加针对地点的修正算法,提高实习位置信息内
容在相似度计算中的占比。

在该实施例中,将用户职位查询内容字段,用自然语言处理技术
中的分词后,分词后存在用户行为数据库中。然后通过计算用户查询
内容相似性,作为用户之间的相似性,将相似用户申请的职位,推荐
给未申请该职位的相似用户。因此,方便了用户更快更好地发现和找
到自己感兴趣的以及适合自己的职位。

图4为本发明基于职位相似的个性化职位推荐方法的一个实施例
的流程示意图。该方法包括以下步骤:

在步骤410,提取并分析用户行为数据,建立用户兴趣模型。

用户行为包括用户申请职位行为、用户收藏职位行为、用户浏览
职位行为等。

在步骤420,基于各个用户对各个职位的偏好获得各个职位的用
户偏好向量。

在步骤430,基于各个职位的用户偏好向量计算各个职位之间的
相似度。

例如,申请职位A的用户大部分都申请职位B,则职位A和职
位B为相似职位。

在步骤440,对相似度的值排序,获取与当前职位相似度最高的
前N个职位集。

在步骤450,将前N个职位集中相似职位推荐给当前用户。

例如,如表3所示,对于职位1,根据各个用户的历史偏好,喜
欢职位1的用户都喜欢职位3,得出职位1和职位3比较相似,而用
户C喜欢职位1,那么可以推断出用户C可能也喜欢职位3。

用户/职位
职位1
职位2
职位3
用户A



用户B



用户C


推荐

表3

在该实施例中,根据用户对职位的行为数据,包括申请、收藏、
浏览行为建立用户兴趣模型,然后根据用户兴趣模型产生用户对职位
的兴趣值,基于用户对职位的兴趣找到相似的职位,然后根据用户的
历史偏好,推荐相似的职位给该用户。因此,方便了用户更快更好地
发现和找到自己感兴趣的以及适合自己的职位。

本发明的另一个实施例,针对系统初始阶段用户数据行为数据稀
缺这一问题,采用利用用户注册信息进行推荐的方法,根据用户注册
时的信息,其中包括用户研究方向、专业、学历、所选行业、兴趣职
位等进行相应的职位推荐。

例如,在翼实习系统中,用户注册信息包含了对实习感兴趣的在
校大学生的用户基本画像属性,包括:性别、高校、专业、年龄、技能、
工作地点等;对应的职位描述属性中也有一些职位要求的标签,诸如
岗位、薪酬、技能、专业、工作地点的要求,将职位要求与用户基本
属性进行比对,从而实现向用户推荐对应的职位。此外还可以增加用
户订阅器,根据用户的要求向其推荐职位。

在该实施例中,增加了基于用户注册信息的推荐方法,可以有效
地解决初始阶段用户行为数据稀缺的冷启动问题。随着用户和系统行
为交互的增加,系统个性化职位推荐的效果会显著提高。

图5为本发明个性化职位推荐推荐引擎设计示意图。

510为业务数据满足时进行推荐的过程。即用户数据行为数据足
够多时,在用户行为数据库进行行为提取和分析,建立用户兴趣特征。
离线计算用户相似度和职位相似度表,产生初步推荐结果。进一步,
根据用户反馈,对初步的推荐结果进行过滤和排名,产生最终的推荐
结果。

520为冷启动机制,即在系统初始阶段用户数据行为数据稀缺时,
启动冷启动机制。基本属性推荐模型指的就是510标准相似度计算之
外,根据用户数据模型中的基本属性以及用户的期望属性值和职位的
数据模型中的属性进行属性匹配,从而达到推荐给用户有效职位的目
的。属于相似度模型的一个补充模式。

由于实习职位业务的特殊性,地点作为职位的关键要素受用户关
注度较高,因此可以增加针对地点的修正算法,提高实习位置信息内
容在相似度计算中的占比。

本发明应用于翼实习项目的职位推荐模块,使用本发明的个性化
推荐技术,并结合具体的应用环境进行改进。从传统单一的基于用户
评分的协同过滤推荐技术,提升为基于用户行为信息个性化推荐技术,
包括用户申请职位、收藏职位、浏览职位等行为信息,建立用户职位
兴趣模型,实现个性化推荐职位。此外,在此基础上又整合了基于用
户查询内容的推荐技术,有效地提升了推荐的效果。在推荐的设计过
程中,还增加了基于用户注册信息的推荐,可以有效地解决初始阶段
用户行为数据稀缺的冷启动问题,另外还可以提升业务主体(职位、
用户)关键属性(如地点)在相似度算法模型中的占比,提升算法精
确度。随着用户和系统行为交互的增加,系统个性化职位推荐的效果
会显著提高。

图6为本发明基于相似度计算的个性化职位推荐系统的一个实施
例的流程示意图。该系统包括:兴趣模型建立单元610、相似度计算
单元620、相似度排序单元630和职位推荐单元640。

兴趣模型建立单元610用于提取并分析用户行为数据,建立用户
兴趣模型。

用户行为包括用户申请职位行为、用户收藏职位行为、用户浏览
职位行为等,其中,可以为用户申请职位行为设置第一兴趣权值,为
用户收藏职位行为设置第二兴趣权值,为用户浏览职位行为设置第三
兴趣权值;根据第一兴趣权值、第二兴趣权值和第三兴趣权值,计算
用户对职位的兴趣值,从而建立用户兴趣模型。在一个实施例中,可
以根据关联性大小调整兴趣模型中各种行为对应的权值。例如,对申
请职位行为设置兴趣权值为5,对收藏职位行为设置的兴趣权值为4,
对浏览职位行为设置兴趣权值为3。这些兴趣参数值在运用的过程中,
可进行适当的微调。除此参数外,个性化推荐的职位数可进行设置,
例如用户推荐职位数设置为5。

相似度计算单元620用于根据用户兴趣模型,计算各用户之间或
各职位之间的相似度。

可以以各用户对各个职位的兴趣值为向量,计算各用户之间的相
似度,或者基于各个用户对各个职位的偏好获得各个职位的用户偏好
向量,然后基于各个职位的用户偏好向量计算各个职位之间的相似度。

相似度排序单元630用于对相似度的值排序,获取与当前用户相
似度最高的前N个用户集,或与当前职位相似度最高的前N个职位集。

职位推荐单元640用于将前N个用户集中相似用户申请的职位或
前N个职位集中相似职位推荐给所述当前用户。

例如,根据用户行为历史数据,推荐和当前用户职位兴趣相似的
用户所喜欢的职位,或者推荐和当前职位相似的职位。

本发明可以应用于翼实习项目的职位推荐模块,根据用户浏览和
访问职位的行为信息,建立用户职位兴趣模型,实现了基于用户相似
的和职位相似的个性化职位推荐的方法,可以帮助用户更快更好地发
现和找到自己感兴趣以及适合自己的职位。

本发明的另一个实施例,兴趣模型建立单元610用于在用户行为
数据库进行行为提取和分析,建立用户兴趣模型。

用户行为数据库中包括用户申请职位行为、用户收藏职位行为、
用户浏览职位行为、用户职位查询内容行为等。

相似度计算单元620用于根据用户兴趣模型,获取各用户对各个
职位的兴趣值,以各用户对各个职位的兴趣值为向量,计算各用户之
间的相似度。

例如,用户A和B都申请了职位1、2,用户C申请了职位1、3,
则用户A和B的相似度高于用户A和C的相似度。

相似度排序单元630用于对相似度的值排序,获取与当前用户相
似度最高的前N个用户集。

根据用户对职位的行为数据,包括申请、收藏、浏览职位行为建
立用户兴趣模型,然后根据用户兴趣模型产生用户对职位的兴趣值,
基于用户对职位的兴趣值找到最相似的邻居用户集。

职位推荐单元640用于将前N个用户集中相似用户申请的职位推
荐给当前用户。

即根据邻居的相似度权重以及他们对职位的偏好,推荐当前用户
未涉及职位(推荐的职位,相似用户之前没有申请),计算得到一个
排序的职位列表作为推荐。

例如,如表1所示,对于用户A,申请了职位1和职位3,用户
C申请职位1,3,4,而用户B申请了职位2,因此用户A和用户C
相似。即根据用户的历史偏好,这里只计算得到一个相似邻居用户C
因此将用户C申请的职位4推荐给用户A。

在该实施例中,根据用户的对职位的行为数据,包括申请、收藏、
浏览行为建立用户兴趣模型,然后根据用户兴趣模型产生用户对职位
的兴趣值,基于用户对职位的兴趣值找到最相似的邻居用户集,然后
将相似用户申请的职位推荐给当前用户。因此,方便了用户更快更好
地发现和找到自己感兴趣的以及适合自己的职位。

本发明的另一个实施例,兴趣模型建立单元610用于在用户行为
数据库进行行为提取和分析,建立用户兴趣模型。

相似度计算单元620用于根据用户兴趣模型,计算各用户查询职
位内容的相似度,并将各用户查询职位内容的相似度作为各用户之间
的相似度。

在一个实施例中,将各用户查询职位内容利用自然语言处理技术
进行分词处理,将分词处理后的每个字段作为一个集合,可以将每个
集合存在用户行为数据库中。计算各集合的交集大小与各集合的并集
大小的比值;根据比值计算各用户查询职位内容的相似度。

例如,利用Jaccard相似度的方法,A,B分别代
表查询内容字段的集合,J(A,B)为两个集合交集的大小/两个集合并集
的大小。

相似度排序单元630用于对相似度的值排序,获取与当前用户相
似度最高的前N个用户集。

职位推荐单元640用于将前N个用户集中相似用户申请的职位推
荐给当前用户。

例如,如表2所示,对于用户A查询了北京,计算机,申请了职
位1、2和3,用户B查询了上海,计算机,申请了职位1和4,用户
C也查询了北京,计算机,同时申请了职位1和2,此时判断用户A
和C相似度高,将职位3推荐给用户C。

由于实习职位业务的特殊性,地点作为职位的关键要素受用户关
注度较高,因此在此增加针对地点的修正算法,提高实习位置信息内
容在相似度计算中的占比。

在该实施例中,将用户职位查询内容字段,用自然语言处理技术
中的分词后,分词后存在用户行为数据库中。然后通过计算用户查询
内容相似性,作为用户之间的相似性,将相似用户申请的职位,推荐
给未申请该职位的相似用户。因此,方便了用户更快更好地发现和找
到自己感兴趣的以及适合自己的职位。

本发明的另一个实施例,兴趣模型建立单元610用于提取并分析
用户行为数据,建立用户兴趣模型。

用户行为包括用户申请职位行为、用户收藏职位行为、用户浏览
职位行为等。

相似度计算单元620用于根据用户兴趣模型,基于各个用户对各
个职位的偏好获得各个职位的用户偏好向量,基于各个职位的用户偏
好向量计算各个职位之间的相似度。

例如,申请职位A的用户大部分都申请职位B,则职位A和职
位B为相似职位。

相似度排序单元630用于对相似度的值排序,获取与当前职位相
似度最高的前N个职位集。

职位推荐单元640用于将前N个职位集中相似职位推荐给当前用
户。

例如,如表3所示,对于职位1,根据各个用户的历史偏好,喜
欢职位1的用户都喜欢职位3,得出职位1和职位3比较相似,而用
户C喜欢职位1,那么可以推断出用户C可能也喜欢职位3。

在该实施例中,根据用户对职位的行为数据,包括申请、收藏、
浏览行为建立用户兴趣模型,然后根据用户兴趣模型产生用户对职位
的兴趣值,基于用户对职位的兴趣找到相似的职位,然后根据用户的
历史偏好,推荐相似的职位给该用户。因此,方便了用户更快更好地
发现和找到自己感兴趣的以及适合自己的职位。

本发明的另一个实施例,还可以包括用户注册信息推荐单元,用
于将当前用户的注册信息与职位数据库中的职位属性进行匹配。例如,
在翼实习系统中,用户注册信息包含了对实习感兴趣的在校大学生的
用户基本画像属性,包括:性别、高校、专业、年龄、技能、工作地点
等;对应的职位描述属性中也有一些职位要求的标签,诸如岗位、薪
酬、技能、专业、工作地点的要求,将职位要求与用户基本属性进行
比对,从而实现向用户推荐对应的职位。此外还可以增加用户订阅器,
根据用户的要求向其推荐职位。

在该实施例中,增加了基于用户注册信息的推荐方法,可以有效
地解决初始阶段用户行为数据稀缺的冷启动问题。随着用户和系统行
为交互的增加,系统个性化职位推荐的效果会显著提高。

至此,已经详细描述了本发明。为了避免遮蔽本发明的构思,没
有描述本领域所公知的一些细节。本领域技术人员根据上面的描述,
完全可以明白如何实施这里公开的技术方案。

可能以许多方式来实现本发明的方法以及装置。例如,可通过软
件、硬件、固件或者软件、硬件、固件的任何组合来实现本发明的方
法以及装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本
发明的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别
说明。此外,在一些实施例中,还可将本发明实施为记录在记录介质
中的程序,这些程序包括用于实现根据本发明的方法的机器可读指令。
因而,本发明还覆盖存储用于执行根据本发明的方法的程序的记录介
质。

虽然已经通过示例对本发明的一些特定实施例进行了详细说明,
但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不
是为了限制本发明的范围。本领域的技术人员应该理解,可在不脱离
本发明的范围和精神的情况下,对以上实施例进行修改。本发明的范
围由所附权利要求来限定。

一种基于相似度计算的个性化职位推荐方法和系统.pdf_第1页
第1页 / 共17页
一种基于相似度计算的个性化职位推荐方法和系统.pdf_第2页
第2页 / 共17页
一种基于相似度计算的个性化职位推荐方法和系统.pdf_第3页
第3页 / 共17页
点击查看更多>>
资源描述

《一种基于相似度计算的个性化职位推荐方法和系统.pdf》由会员分享,可在线阅读,更多相关《一种基于相似度计算的个性化职位推荐方法和系统.pdf(17页珍藏版)》请在专利查询网上搜索。

本发明公开了一种基于相似度计算的个性化职位推荐方法和系统,涉及数据挖掘中推荐系统领域。其中的方法包括:提取并分析用户行为数据,建立用户兴趣模型;根据用户兴趣模型,计算各用户之间或各职位之间的相似度;对相似度的值排序,获取与当前用户相似度最高的前N个用户集,或与当前职位相似度最高的前N个职位集;将前N个用户集中相似用户申请的职位或前N个职位集中相似职位推荐给当前用户。即根据用户浏览和访问职位的行为信。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1