标签的推荐方法及装置.pdf

上传人:00****42 文档编号:24062 上传时间:2018-01-12 格式:PDF 页数:16 大小:1.09MB
返回 下载 相关 举报
摘要
申请专利号:

CN201510107973.X

申请日:

2015.03.12

公开号:

CN104750789A

公开日:

2015.07.01

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):G06F 17/30申请日:20150312|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

百度在线网络技术(北京)有限公司

发明人:

李国洪; 匡柘溪; 杨帆

地址:

100085北京市海淀区上地十街10号百度大厦

优先权:

专利代理机构:

北京鸿德海业知识产权代理事务所(普通合伙)11412

代理人:

袁媛

PDF下载: PDF下载
内容摘要

本发明提供一种标签的推荐方法及装置。本发明实施例通过根据候选标签的描述数据,以及用户在所确定的应用中所产生的行为数据和所述用户在除了所述应用之外的其他应用中所产生的行为数据,获得的所述用户的描述数据,获得至少一个候选标签,以作为推荐标签,使得能够向用户展现所获得的推荐标签,由于是基于用户在全网中所产生的行为数据所获得的推荐标签,使得这些推荐标签很可能就是用户所感兴趣的标签,从而引导用户根据这些推荐标签,执行相关操作,例如,标签定制等,这样,能够有效提高标签的操作效率。

权利要求书

1.  一种标签的推荐方法,其特征在于,包括:
确定用户当前所使用的应用;
根据候选标签的描述数据和所述用户的描述数据,获得至少一个候选标签,以作为推荐标签;所述用户的描述数据为根据所述用户的历史行为数据获得,所述用户的历史行为数据包括所述用户在所述应用中所产生的行为数据和所述用户在除了所述应用之外的其他应用中所产生的行为数据;
展现所述推荐标签。

2.
  根据权利要求1所述的方法,其特征在于,所述候选标签的描述数据包括候选标签的语义描述数据、候选标签的分布描述数据和候选标签的行为描述数据中的至少一项。

3.
  根据权利要求2所述的方法,其特征在于,所述候选标签的语义描述数据包括下列数据中的至少一项:
候选标签的标签名称;
候选标签下的关键词;
与候选标签的语义相关的扩展标签的标签名称;以及
与候选标签下的关键词的语义相关的扩展关键词。

4.
  根据权利要求3所述的方法,其特征在于,所述根据候选标签的描述数据和所述用户的描述数据,获得至少一个候选标签,以作为推荐标签之前,还包括:
根据一个候选标签,获得文本集合;
根据所述文本集合,获得该候选标签下的关键词。

5.
  根据权利要求2~4任一权利要求所述的方法,其特征在于,所述候选标签的分布描述数据包括下列数据中的至少一项:
候选标签的类别分布;以及
候选标签的主题分布,所述主题分布包括M个特定主题的分布信息,M 为大于或等于1的整数。

6.
  根据权利要求2~4任一权利要求所述的方法,其特征在于,所述候选标签的行为描述数据包括下列数据中的至少一项:
与候选标签的行为相关的关联标签。

7.
  根据权利要求2~4任一权利要求所述的方法,其特征在于,所述候选标签的描述数据还包括候选标签的应用特征数据。

8.
  根据权利要求7所述的方法,其特征在于,所述候选标签的应用特征数据包括下列数据中的至少一项:
候选标签在应用中的热度;以及
候选标签在应用中的时间分布。

9.
  一种标签的推荐装置,其特征在于,包括:
确定单元,用于确定用户当前所使用的应用;
获得单元,用于根据候选标签的描述数据和所述用户的描述数据,获得至少一个候选标签,以作为推荐标签;所述用户的描述数据为根据所述用户的历史行为数据获得,所述用户的历史行为数据包括所述用户在所述应用中所产生的行为数据和所述用户在除了所述应用之外的其他应用中所产生的行为数据;
展现单元,用于展现所述推荐标签。

10.
  根据权利要求9所述的装置,其特征在于,所述候选标签的描述数据包括候选标签的语义描述数据、候选标签的分布描述数据和候选标签的行为描述数据中的至少一项。

11.
  根据权利要求10所述的装置,其特征在于,所述候选标签的语义描述数据包括下列数据中的至少一项:
候选标签的标签名称;
候选标签下的关键词;
与候选标签的语义相关的扩展标签的标签名称;以及
与候选标签下的关键词的语义相关的扩展关键词。

12.
  根据权利要求11所述的装置,其特征在于,所述装置还包括挖掘单元,用于
根据一个候选标签,获得文本集合;以及
根据所述文本集合,获得该候选标签下的关键词。

13.
  根据权利要求10~12任一权利要求所述的装置,其特征在于,所述候选标签的分布描述数据包括下列数据中的至少一项:
候选标签的类别分布;以及
候选标签的主题分布,所述主题分布包括M个特定主题的分布信息,M为大于或等于1的整数。

14.
  根据权利要求10~12任一权利要求所述的装置,其特征在于,所述候选标签的行为描述数据包括下列数据中的至少一项:
与候选标签的行为相关的关联标签。

15.
  根据权利要求10~12任一权利要求所述的装置,其特征在于,所述候选标签的描述数据还包括候选标签的应用特征数据。

16.
  根据权利要求15所述的装置,其特征在于,所述候选标签的应用特征数据包括下列数据中的至少一项:
候选标签在应用中的热度;以及
候选标签在应用中的时间分布。

说明书

标签的推荐方法及装置
技术领域
本发明涉及标签的推荐技术,尤其涉及一种标签的推荐方法及装置。
背景技术
社会标签(Social tagging)简称为标签,是一种更为灵活、有趣的分类方式,它允许用户自由地标注各种资源,例如网页、学术论文和多媒体等资源。社会标签可以帮助用户分类整理和查询各类信息,广泛应用于社会标签网站(例如,Flickr、Picassa、YouTube、Plaxo等)、博客(例如,Blogger、WordPress、LiveJournal等)、百科(例如,Wikipedia、PBWiki等)、微博(例如,Twitter、Jaiku等)等系统。
为用户推荐感兴趣的标签,成为目前的一个研究热点。
发明内容
本发明的多个方面提供一种标签的推荐方法及装置,用以为用户推荐感兴趣的标签。
本发明的一方面,提供一种标签的推荐方法,包括:
确定用户当前所使用的应用;
根据候选标签的描述数据和所述用户的描述数据,获得至少一个候选标签,以作为推荐标签;所述用户的描述数据为根据所述用户的历史行为数据获得,所述用户的历史行为数据包括所述用户在所述应用中所产生的行为数据和所述用户在除了所述应用之外的其他应用中所产生的行为数据;
展现所述推荐标签。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述候选标签的描述数据包括候选标签的语义描述数据、候选标签的分布描述数据和候选标签的行为描述数据中的至少一项。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述候选标签的语义描述数据包括下列数据中的至少一项:
候选标签的标签名称;
候选标签下的关键词;
与候选标签的语义相关的扩展标签的标签名称;以及
与候选标签下的关键词的语义相关的扩展关键词。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据候选标签的描述数据和所述用户的描述数据,获得至少一个候选标签,以作为推荐标签之前,还包括:
根据一个候选标签,获得文本集合;
根据所述文本集合,获得该候选标签下的关键词。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述候选标签的分布描述数据包括下列数据中的至少一项:
候选标签的类别分布;以及
候选标签的主题分布,所述主题分布包括M个特定主题的分布信息,M为大于或等于1的整数。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述候选标签的行为描述数据包括下列数据中的至少一项:
与候选标签的行为相关的关联标签。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述候选标签的描述数据还包括候选标签的应用特征数据。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述候选标签的应用特征数据包括下列数据中的至少一项:
候选标签在应用中的热度;以及
候选标签在应用中的时间分布。
本发明的另一方面,提供一种标签的推荐装置,包括:
确定单元,用于确定用户当前所使用的应用;
获得单元,用于根据候选标签的描述数据和所述用户的描述数据,获得至少一个候选标签,以作为推荐标签;所述用户的描述数据为根据所述用户的历史行为数据获得,所述用户的历史行为数据包括所述用户在所述应用中所产生的行为数据和所述用户在除了所述应用之外的其他应用中所产生的行为数据;
展现单元,用于展现所述推荐标签。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述候选标签的描述数据包括候选标签的语义描述数据、候选标签的分布描述数据和候选标签的行为描述数据中的至少一项。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述候选标签的语义描述数据包括下列数据中的至少一项:
候选标签的标签名称;
候选标签下的关键词;
与候选标签的语义相关的扩展标签的标签名称;以及
与候选标签下的关键词的语义相关的扩展关键词。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述装置还包括挖掘单元,用于
根据一个候选标签,获得文本集合;以及
根据所述文本集合,获得该候选标签下的关键词。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述候选标签的分布描述数据包括下列数据中的至少一项:
候选标签的类别分布;以及
候选标签的主题分布,所述主题分布包括M个特定主题的分布信息,M为大于或等于1的整数。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述候选标签的行为描述数据包括下列数据中的至少一项:
与候选标签的行为相关的关联标签。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述候选标签的描述数据还包括候选标签的应用特征数据。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述候选标签的应用特征数据包括下列数据中的至少一项:
候选标签在应用中的热度;以及
候选标签在应用中的时间分布。
由上述技术方案可知,本发明实施例通过根据候选标签的描述数据,以 及用户在所确定的应用中所产生的行为数据和所述用户在除了所述应用之外的其他应用中所产生的行为数据,获得的所述用户的描述数据,获得至少一个候选标签,以作为推荐标签,使得能够向用户展现所获得的推荐标签,由于是基于用户在全网中所产生的行为数据所获得的推荐标签,使得这些推荐标签很可能就是用户所感兴趣的标签,从而引导用户根据这些推荐标签,执行相关操作,例如,标签定制等,这样,能够有效提高标签的操作效率。
另外,采用本发明提供的技术方案,由于候选标签的描述数据包括候选标签的语义描述数据、候选标签的分布描述数据和候选标签的行为描述数据中的至少一项,使得能够从多个维度对候选标签进行描述,因此,能够有效提高标签推荐的可靠性。
另外,采用本发明提供的技术方案,通过将候选标签的应用特征数据增加到候选标签的描述数据中,使得能够从应用维度对候选标签进行描述,无需针对每个应用分布对候选标签进行描述,因此,能够有效提高标签推荐的效率。
另外,采用本发明提供的技术方案,由于考虑了用户在除了所确定的应用之外的其他应用中所产生的行为数据,使得能够从该应用之外的其他应用的维度对所述用户进行描述,因此,能够实现该应用的冷启动情况下的标签推荐,同时,还能够有效提高标签推荐的覆盖度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造 性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的标签的推荐方法的流程示意图;
图2为本发明另一实施例提供的标签的推荐装置的结构示意图;
图3为本发明另一实施例提供的标签的推荐装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例中所涉及的终端可以包括但不限于手机、个人数字助理(Personal Digital Assistant,PDA)、无线手持设备、平板电脑(Tablet Computer)、个人电脑(Personal Computer,PC)、MP3播放器、MP4播放器、可穿戴设备(例如,智能眼镜、智能手表、智能手环等)等。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
图1为本发明一实施例提供的标签的推荐方法的流程示意图,如图1所示。
101、确定用户当前所使用的应用。
102、根据候选标签的描述数据和所述用户的描述数据,获得至少一个候选标签,以作为推荐标签;所述用户的描述数据为根据所述用户的历史行为数据获得,所述用户的历史行为数据包括所述用户在所述应用中所产生的行 为数据和所述用户在除了所述应用之外的其他应用中所产生的行为数据。
用户当前所使用的应用,与除了用户当前所使用的应用之外的其他应用,为不同的应用,例如,PC上安装的淘宝应用与手机上安装的淘宝应用等不同类型的终端上所安装的不同应用,或者,再例如,手机上安装的百度地图应用与手机上安装的百度搜索应用等相同类型终端上所安装的不同应用,等等,本实施例对此不进行特别限定。
可以理解的是,除了用户当前所使用的应用之外的其他应用,还可以近似认为是包括当前所使用的应用的整个互联网络中的全部应用。
103、展现所述推荐标签。
需要说明的是,101~103的执行主体的部分或全部可以为位于本地终端的应用,或者还可以为位于本地终端的应用中的插件或软件开发工具包(Software Development Kit,SDK)等功能单元,或者还可以为位于网络侧的服务器中的处理引擎,或者还可以为位于网络侧的分布式系统,本实施例对此不进行特别限定,本实施例对此不进行特别限定。
可以理解的是,所述应用可以是安装在终端上的本地程序(nativeApp),或者还可以是终端上的浏览器的一个网页程序(webApp),本实施例对此不进行特别限定。
这样,通过根据候选标签的描述数据,以及用户在所确定的应用中所产生的行为数据和所述用户在除了所述应用之外的其他应用中所产生的行为数据,获得的所述用户的描述数据,获得至少一个候选标签,以作为推荐标签,使得能够向用户展现所获得的推荐标签,由于是基于用户在全网中所产生的行为数据所获得的推荐标签,使得这些推荐标签很可能就是用户所感兴趣的标签,从而引导用户根据这些推荐标签,执行相关操作,例如,标签定制等,这样,能够有效提高标签的操作效率。
可选地,在本实施例的一个可能的实现方式中,在102中,所采用的所述候选标签的描述数据可以包括但不限于候选标签的语义描述数据、候选标签的分布描述数据和候选标签的行为描述数据中的至少一项,本实施例对此 不进行特别限定。
所谓的候选标签的语义描述数据,从候选标签的自身语义角度出发,用以在细粒度的描述候选标签所包含的语义。另外,还进一步考虑到候选标签的自身语义的信息量较少,因此,可以通过在用户当前所使用的应用所提供的内容数据中,利用无监督机器学习模型,例如,Word2Vec、RandomWalk等,对候选标签的自身语义描述进行语义相关扩展。
在一个具体的实现过程中,所述候选标签的语义描述数据可以包括但不限于下列数据中的至少一项:
候选标签的标签名称;
候选标签下的关键词;
与候选标签的语义相关的扩展标签的标签名称;以及
与候选标签下的关键词的语义相关的扩展关键词。
所述候选标签下的关键词,是指用于表达候选标签的主题内容的词或短语等内容。具体地,在102之前,还可以进一步根据一个候选标签,获得文本集合,例如,问答类应用中该候选标签所对应的问答内容数据等,进而,则可以根据所述文本集合,获得该候选标签下的关键词。
所谓的候选标签的分布描述数据,从候选标签的体系角度出发,用以在粗粒度的描述候选标签的概念和类别体系。
在一个具体的实现过程中,所述候选标签的分布描述数据可以包括但不限于下列数据中的至少一项:
候选标签的类别分布;以及
候选标签的主题分布,所述主题分布包括M个特定主题的分布信息,M为大于或等于1的整数。
具体地,在一个例子中,所述候选标签的类别分布和所述候选标签的主题分布,均可以由人工设定。
具体地,在另一个例子中,可以利用机器挖掘方法,生成关于若干个指定类别的分类器。例如,具体可以利用历史标签和所述历史标签关联的内容 数据,训练关于若干个指定类别的历史标签分类器。进而,利用该历史标签分类器,生成候选标签的类别分布。
具体地,在另一个例子中,可以利用监督方法,生成关于M个特定主题的分类器。例如,具体可以确定特定主题的数量和每个特定主题的定义,收集训练数据,利用训练数据,训练关于M个特定主题的历史标签分类器,以获得关于M个特定主题的分类器。进而,利用该关于M个特定主题的分类器,生成候选标签的主题分布。这种方法,精度高,但召回率低。
具体地,在另一个例子中,可以利用非监督方法,建立关于M个特定主题的主题模型。例如,具体可以将历史标签和所述历史标签关联的内容数据中的题目组合成一个片段,对该片段进行分词处理,以生成训练数据。利用训练数据,训练主题模型(Topic Model)。然后,对主题模型进行优化操作,例如,基于语义的删除操作、基于语义的去重操作等,以获得关于M个特定主题的主题模型。进而,利用该关于M个特定主题的主题模型,生成候选标签的主题分布。这种方法,精度稍低,但召回率高。
可以理解的是,在另一个例子中,具体还可以对利用监督方法所生成的关于M个特定主题的分类器,以及利用非监督方法所建立关于M个特定主题的主题模型,进行整合处理,以获得一个更加可靠的生成关于M个特定主题的模型。
具体地,可以采用利用监督方法所生成的关于M个特定主题的分类器,生成候选标签的主题分布。例如,采集全部用户的历史行为数据中的历史标签,以作为候选标签,进而利用该分类器,生成候选标签的主题分布。
具体地,可以采用利用非监督方法所建立关于M个特定主题的主题模型,生成候选标签的主题分布。例如,采集全部用户的历史行为数据中的历史标签,以作为候选标签,以及该候选标签关联的内容数据中的题目,将候选标签和该候选标签关联的内容数据中的题目组合成一个片段,对该片段进行分词处理,以生成分词结果,进而利用该主题模型,生成候选标签的主题分布。
可以理解的是,具体还可以对上述两种方法所生成的候选标签的主题分 布进行整合,以获得更加可靠的候选标签的主题分布。
所谓的候选标签的行为描述数据,从用户对标签推荐结果产生的后续反馈行为角度出发,用以描述候选标签的动态行为特征。
在一个具体的实现过程中,所述候选标签的行为描述数据可以包括但不限于下列数据中的至少一项:
与候选标签的行为相关的关联标签。
具体地,在一个例子中,候选标签的行为可以为候选标签的定制行为,或者还可以为候选标签的应用行为,如问答类应用中的问答行为等,本实施例对此不进行特别限定。
例如,具体可以利用某个候选标签所对应的历史问答类行为数据,计算该候选标签与其他标签的共现概率,将满足预先设置的关联条件的共现概率所对应的其他标签,确定为与该候选标签的行为相关的关联标签。
可选地,在本实施例的一个可能的实现方式中,在102中,所采用的所述候选标签的描述数据还可以进一步包括但不限于候选标签的应用特征数据,本实施例对此不进行特别限定。
所谓的候选标签的应用特征数据,也是从用户对标签推荐结果产生的后续反馈行为角度出发,用以描述候选标签的动态行为特征。
在一个具体的实现过程中,所述候选标签的应用特征数据可以包括但不限于下列数据中的至少一项:
候选标签在应用中的热度;以及
候选标签在应用中的时间分布。
可选地,在本实施例的一个可能的实现方式中,在102中,所采用的所述用户的描述数据可以包括但不限于用户当前所使用的应用中关于该用户的描述数据和除了用户当前所使用的应用之外的其他应用中关于该用户的描述数据,本实施例对此不进行特别限定。
其中,用户当前所使用的应用中关于该用户的描述数据,具体可以根据所述用户在所述应用中所产生的行为数据获得。
在一个具体的实现过程中,用户当前所使用的应用中关于该用户的描述数据,具体可以包括但不限于用户的语义描述数据、用户的分布描述数据和用户的行为描述数据中的至少一项,本实施例对此不进行特别限定。
所谓的用户的语义描述数据,可以包括但不限于用户在当前所使用的应用中的兴趣描述,以及历史定制标签集合中的至少一项。
具体地,在一个例子中,具体可以根据用户在当前所使用的应用中的注册信息,获得用户在当前所使用的应用中的兴趣描述,例如,兴趣词集合。
具体地,在另一个例子中,具体可以根据用户在当前所使用的应用中的历史行为数据,获得用户在当前所使用的应用中的兴趣描述,例如,兴趣词集合。
所谓的用户的分布描述数据,可以包括但不限于用户在当前所使用的应用中的兴趣的类别分布,以及兴趣的主题分布中的至少一项。
具体地,在一个例子中,可以利用机器挖掘方法,生成关于若干个指定类别的分类器。例如,具体可以利用用户兴趣(即所采集的全部用户的用户兴趣)和所述用户兴趣关联的内容数据,训练关于若干个指定类别的用户兴趣分类器。进而,利用该用户兴趣分类器,生成用户在当前所使用的应用中的兴趣的类别分布。
具体地,在另一个例子中,可以利用监督方法,生成关于M个特定主题的分类器。例如,具体可以确定特定主题的数量和每个特定主题的定义,收集训练数据,利用训练数据,训练关于M个特定主题的用户兴趣签分类器,以获得关于M个特定主题的分类器。进而,利用该关于M个特定主题的分类器,生成用户在当前所使用的应用中的兴趣的主题分布。这种方法,精度高,但召回率低。
具体地,在另一个例子中,可以利用非监督方法,建立关于M个特定主题的主题模型。例如,具体可以将用户兴趣和所述用户兴趣关联的内容数据中的题目组合成一个片段,对该片段进行分词处理,以生成训练数据。利用训练数据,训练主题模型(Topic Model)。然后,对主题模型进行优化操作, 例如,基于语义的删除操作、基于语义的去重操作等,以获得关于M个特定主题的主题模型。进而,利用该关于M个特定主题的主题模型,生成用户在当前所使用的应用中的兴趣的主题分布。这种方法,精度稍低,但召回率高。
可以理解的是,在另一个例子中,具体还可以对利用监督方法所生成的关于M个特定主题的分类器,以及利用非监督方法所建立关于M个特定主题的主题模型,进行整合处理,以获得一个更加可靠的生成关于M个特定主题的模型。
具体地,可以采用利用监督方法所生成的关于M个特定主题的分类器,生成用户在当前所使用的应用中的兴趣的主题分布。例如,采集用户在当前所使用的应用中的历史行为数据中的兴趣,以作为用户在当前所使用的应用中的兴趣,进而利用该分类器,生成用户在当前所使用的应用中的兴趣的主题分布。
具体地,可以采用利用非监督方法所建立关于M个特定主题的主题模型,生成用户在当前所使用的应用中的兴趣的主题分布。例如,采集全部用户的历史行为数据中的兴趣,以作为用户在当前所使用的应用中的兴趣,以及该兴趣关联的内容数据中的题目,将用户在当前所使用的应用中的兴趣和该兴趣关联的内容数据中的题目组合成一个片段,对该片段进行分词处理,以生成分词结果,进而利用该主题模型,生成用户在当前所使用的应用中的兴趣的主题分布。
可以理解的是,具体还可以对上述两种方法所生成的用户在当前所使用的应用中的兴趣的主题分布进行整合,以获得更加可靠的用户在当前所使用的应用中的兴趣的主题分布。
所谓的用户的行为描述数据,可以包括但不限于与用户相关的关联用户的行为描述数据中的至少一项。
具体地,在一个例子中,关联用户的行为描述数据,用以描述关联用户的行为,具体可以为关联用户的定制行为,或者还可以为关联用户的应用行为,如问答类应用中的问答行为等,本实施例对此不进行特别限定。
在另一个具体的实现过程中,用户当前所使用的应用中关于该用户的描述数据,具体还可以进一步包括用户的应用特征数据,本实施例对此不进行特别限定。
所谓的用户的应用特征数据,可以包括但不限于下列数据中的至少一项:
用户在当前所使用的应用中的兴趣在该应用中的时间分布。
其中,除了用户当前所使用的应用之外的其他应用中关于该用户的描述数据,具体可以根据所述用户在除了所述应用之外的其他应用中所产生的行为数据获得。
在一个具体的实现过程中,除了用户当前所使用的应用之外的其他应用中关于该用户的描述数据,具体可以包括但不限于用户的语义描述数据和用户的分布描述数据中的至少一项,本实施例对此不进行特别限定。
所谓的用户的语义描述数据,可以包括但不限于用户在除了用户当前所使用的应用之外的其他应用中的兴趣描述,以及历史定制标签集合中的至少一项。
具体地,在一个例子中,具体可以根据用户在其他应用中的注册信息,获得用户在其他应用中的兴趣描述,例如,兴趣词集合。
具体地,在另一个例子中,具体可以根据用户在其他应用中的历史行为数据,获得用户在其他应用中的兴趣描述,例如,兴趣词集合。
可选地,在本实施例的一个可能的实现方式中,在102中,具体可以计算候选标签的描述数据与所述用户的描述数据的相关性参数,进而,则可以将满足预先设置的推荐条件的相关性参数所对应的候选标签,作为推荐标签。
其中,所谓的相关性参数,可以包括但不限于下列数据中的至少一项:
候选标签的语义描述数据与用户的语义描述数据的相关度得分;
候选标签的分布描述数据与用户的分布描述数据的相关度得分;
候选标签的行为描述数据与用户的行为描述数据的相关度得分;以及
候选标签的应用特征数据与用户的应用特征数据的相关度得分。
在一个具体的实现过程中,具体可以采用交叉相关性的方式,分别从用 户在当前所使用的应用中的兴趣描述、用户在当前所使用的应用中的历史定制标签集合、用户在除了用户当前所使用的应用之外的其他应用中的兴趣描述,以及用户在除了用户当前所使用的应用之外的其他应用中的历史定制标签集合等用户的语义描述数据的子维度,计算其与候选标签的标签名称、候选标签下的关键词、与候选标签的语义相关的扩展标签的标签名称、以及与候选标签下的关键词的语义相关的扩展关键词等候选标签的语义描述数据的子维度的交叉相关度,进而,利用每个子维度的权重,以加权融合的方式,获得候选标签的语义描述数据与用户的语义描述数据的相关度得分。
在另一个具体的实现过程中,具体可以采用交叉相关性的方式,分别从用户在当前所使用的应用中的兴趣的类别分布、以及用户在当前所使用的应用中的兴趣的主题分布等用户的分布描述数据的子维度,计算其与候选标签的类别分布、以及候选标签的主题分布等候选标签的分布描述数据的子维度的交叉相关度,进而,利用每个子维度的权重,以加权融合的方式,获得候选标签的分布描述数据与用户的分布描述数据的相关度得分。
在另一个具体的实现过程中,具体可以根据候选标签的行为描述数据和用户的行为描述数据,采用矩阵分解(Matrix Factorization,MF)算法,例如,协同过滤(Collaborative Filtering,CF)算法、奇异值分解(Singular Value Decomposition,SVD)等,获得候选标签的行为描述数据与用户的行为描述数据的相关度得分。
在另一个具体的实现过程中,具体可以根据候选标签的应用特征数据和用户的应用特征数据,将二者的构成查询状态,在启发式规则库中进行查询,将查询结果,作为候选标签的应用特征数据与用户的应用特征数据的相关度得分。
在获得了这些相关度得分之后,具体可以将每个相关度得分,都分别作为候选标签的描述数据与所述用户的描述数据的相关性参数,进而,则可以依据该相关性参数,分别获得推荐标签,或者还可以根据每个相关度得分的权重,以加权融合的方式,获得候选标签的描述数据与所述用户的描述数据 的相关性参数,进而,则可以依据该相关性参数,获得推荐标签,本实施例对此不进行特别限定。
在另一个具体的实现过程中,具体可以将相关性参数按照从大到小的顺序进行排序,然后,选择排在前P位的相关性参数所对应的候选标签,作为推荐标签。
在另一个具体的实现过程中,具体可以预先设置一个相关性阈值,然后,选择大于或等于该相关性阈值的相关性参数所对应的候选标签,作为推荐标签。
本实施例所提供的技术方案,可以抽象为元数据层、特征数据层和模型层这三个层次部分。其中,元数据层,主要包含用户当前所使用的应用,以及除了用户当前所使用的应用之外的其他应用中的用户行为数据,例如,问答平台场景中的用户发布的问题、回答用户在平台上的回答产生的数据等;特征数据层,是在用户当前所使用的应用积累的用户行为数据基础上,完成对待推荐的候选标签的描述和应用中用户的描述,以及在除了用户当前所使用的应用之外的其他应用积累的用户行为数据基础上,完成对其他应用中用户的描述,这两个描述所构成的中间数据;模型层,可以分为几个推荐子系统,每个推荐子系统都按照各自的推荐策略,产生相关性参数,最终,则根据每个推荐子系统所产生的相关性参数,完成推荐标签的确定。
本实施例中,通过根据候选标签的描述数据,以及用户在所确定的应用中所产生的行为数据和所述用户在除了所述应用之外的其他应用中所产生的行为数据,获得的所述用户的描述数据,获得至少一个候选标签,以作为推荐标签,使得能够向用户展现所获得的推荐标签,由于是基于用户在全网中所产生的行为数据所获得的推荐标签,使得这些推荐标签很可能就是用户所感兴趣的标签,从而引导用户根据这些推荐标签,执行相关操作,例如,标签定制等,这样,能够有效提高标签的操作效率。
另外,采用本发明提供的技术方案,由于候选标签的描述数据包括候选标签的语义描述数据、候选标签的分布描述数据和候选标签的行为描述数据 中的至少一项,使得能够从多个维度对候选标签进行描述,因此,能够有效提高标签推荐的可靠性。
另外,采用本发明提供的技术方案,通过将候选标签的应用特征数据增加到候选标签的描述数据中,使得能够从应用维度对候选标签进行描述,无需针对每个应用分布对候选标签进行描述,因此,能够有效提高标签推荐的效率。
另外,采用本发明提供的技术方案,由于考虑了用户在除了所确定的应用之外的其他应用中所产生的行为数据,使得能够从该应用之外的其他应用的维度对所述用户进行描述,因此,能够实现该应用的冷启动情况下的标签推荐,同时,还能够有效提高标签推荐的覆盖度。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
图2为本发明另一实施例提供的标签的推荐装置的结构示意图,如图2所示。本实施例的标签的推荐装置可以包括确定单元21、获得单元22和展现单元23。其中,确定单元21,用于确定用户当前所使用的应用;获得单元22,用于根据候选标签的描述数据和所述用户的描述数据,获得至少一个候选标签,以作为推荐标签;所述用户的描述数据为根据所述用户的历史行为数据获得,所述用户的历史行为数据包括所述用户在所述应用中所产生的行为数据和所述用户在除了所述应用之外的其他应用中所产生的行为数据;展现单元23,用于展现所述推荐标签。
需要说明的是,本实施例所提供的标签的推荐装置的部分或全部可以为位于本地终端的应用,或者还可以为位于本地终端的应用中的插件或软件开 发工具包(Software Development Kit,SDK)等功能单元,或者还可以为位于网络侧的服务器中的处理引擎,或者还可以为位于网络侧的分布式系统,本实施例对此不进行特别限定,本实施例对此不进行特别限定。
可以理解的是,所述应用可以是安装在终端上的本地程序(nativeApp),或者还可以是终端上的浏览器的一个网页程序(webApp),本实施例对此不进行特别限定。
可选地,在本实施例的一个可能的实现方式中,所述获得单元22所采用的所述候选标签的描述数据可以包括但不限于候选标签的语义描述数据、候选标签的分布描述数据和候选标签的行为描述数据中的至少一项,本实施例对此不进行特别限定。
在一个具体的实现过程中,所述候选标签的语义描述数据可以包括但不限于下列数据中的至少一项:
候选标签的标签名称;
候选标签下的关键词;
与候选标签的语义相关的扩展标签的标签名称;以及
与候选标签下的关键词的语义相关的扩展关键词。
具体地,如图3所示,本实施例所提供的标签的推荐装置还可以进一步包括挖掘单元31,用于根据一个候选标签,获得文本集合;以及根据所述文本集合,获得该候选标签下的关键词。
在一个具体的实现过程中,所述候选标签的分布描述数据可以包括但不限于下列数据中的至少一项:
候选标签的类别分布;以及
候选标签的主题分布,所述主题分布包括M个特定主题的分布信息,M为大于或等于1的整数。
在一个具体的实现过程中,所述候选标签的行为描述数据可以包括但不限于下列数据中的至少一项:
与候选标签的行为相关的关联标签。
可选地,在本实施例的一个可能的实现方式中,所述获得单元22所采用的所述候选标签的描述数据还可以进一步包括但不限于候选标签的应用特征数据,本实施例对此不进行特别限定。
在一个具体的实现过程中,所述候选标签的应用特征数据可以包括但不限于下列数据中的至少一项:
候选标签在应用中的热度;以及
候选标签在应用中的时间分布。
需要说明的是,图1对应的实施例中方法,可以由本实施例提供的标签的推荐装置实现。详细描述可以参见图1对应的实施例中的关联资源,此处不再赘述。
本实施例中,通过获得单元根据候选标签的描述数据,以及用户在确定单元所确定的应用中所产生的行为数据和所述用户在除了所述应用之外的其他应用中所产生的行为数据,获得的所述用户的描述数据,获得至少一个候选标签,以作为推荐标签,使得展现单元能够向用户展现所获得的推荐标签,由于是基于用户在全网中所产生的行为数据所获得的推荐标签,使得这些推荐标签很可能就是用户所感兴趣的标签,从而引导用户根据这些推荐标签,执行相关操作,例如,标签定制等,这样,能够有效提高标签的操作效率。
另外,采用本发明提供的技术方案,由于候选标签的描述数据包括候选标签的语义描述数据、候选标签的分布描述数据和候选标签的行为描述数据中的至少一项,使得能够从多个维度对候选标签进行描述,因此,能够有效提高标签推荐的可靠性。
另外,采用本发明提供的技术方案,通过将候选标签的应用特征数据增加到候选标签的描述数据中,使得能够从应用维度对候选标签进行描述,无需针对每个应用分布对候选标签进行描述,因此,能够有效提高标签推荐的效率。
另外,采用本发明提供的技术方案,由于考虑了用户在除了所确定的应用之外的其他应用中所产生的行为数据,使得能够从该应用之外的其他应用 的维度对所述用户进行描述,因此,能够实现该应用的冷启动情况下的标签推荐,同时,还能够有效提高标签推荐的覆盖度。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

标签的推荐方法及装置.pdf_第1页
第1页 / 共16页
标签的推荐方法及装置.pdf_第2页
第2页 / 共16页
标签的推荐方法及装置.pdf_第3页
第3页 / 共16页
点击查看更多>>
资源描述

《标签的推荐方法及装置.pdf》由会员分享,可在线阅读,更多相关《标签的推荐方法及装置.pdf(16页珍藏版)》请在专利查询网上搜索。

本发明提供一种标签的推荐方法及装置。本发明实施例通过根据候选标签的描述数据,以及用户在所确定的应用中所产生的行为数据和所述用户在除了所述应用之外的其他应用中所产生的行为数据,获得的所述用户的描述数据,获得至少一个候选标签,以作为推荐标签,使得能够向用户展现所获得的推荐标签,由于是基于用户在全网中所产生的行为数据所获得的推荐标签,使得这些推荐标签很可能就是用户所感兴趣的标签,从而引导用户根据这些推荐。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1