《应用推荐的实现方法、装置和系统.pdf》由会员分享,可在线阅读,更多相关《应用推荐的实现方法、装置和系统.pdf(15页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 102880501 A (43)申请公布日 2013.01.16 C N 1 0 2 8 8 0 5 0 1 A *CN102880501A* (21)申请号 201210258813.1 (22)申请日 2012.07.24 G06F 9/46(2006.01) H04L 29/08(2006.01) (71)申请人北京奇虎科技有限公司 地址 100088 北京市西城区新街口外大街 28号D座112室(德胜园区) 申请人奇智软件(北京)有限公司 (72)发明人常富洋 秦吉胜 叶松 李少伟 (74)专利代理机构北京德恒律治知识产权代理 有限公司 11409 代理人章社。
2、杲 孙征 (54) 发明名称 应用推荐的实现方法、装置和系统 (57) 摘要 本发明公开了一种应用推荐的实现方法、装 置和系统,该方法包括:对应用的特征信息进行 归一化处理,得到该应用的质量分数,并根据多个 用户的历史行为数据确定多个应用之间的关联 度;在需要将推荐给用户的应用的信息发送给用 户的情况下,根据其他应用的质量分数、以及其他 应用与目标应用之间的关联度,将其他应用中的 部分或全部推荐给用户,其中,目标应用包括用户 当前或之前操作的应用。本发明能够参照应用本 身的特征将应用推荐给用户,因此,对于刚上线或 用户操作量较小的应用,也能够合理地推荐给用 户,并且能够克服推荐应用时主观判断的。
3、不准确 性,并且,在此基础上结合关联性进行推荐,能够 进一步提高推荐的准确性,提高用户体验。 (51)Int.Cl. 权利要求书3页 说明书8页 附图3页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 3 页 说明书 8 页 附图 3 页 1/3页 2 1.一种应用app推荐的实现方法,其特征在于,包括: 对于应用的特征信息进行归一化处理,得到该应用的质量分数,并根据多个用户端设 备的历史行为数据确定多个应用之间的关联度; 在需要将推荐给用户端设备的应用的信息发送给用户端设备的情况下,根据其他应用 的质量分数、以及其他应用与目标应用之间的关联度,将其他应用中的部分或全。
4、部推荐给 用户端设备,其中,所述目标应用包括所述用户端设备当前或之前操作的应用。 2.根据权利要求1所述的实现方法,其特征在于,在用户端设备发起请求的情况下,通 过用户端设备发起的请求确定所述用户端设备的标识,并根据所述标识确定所述用户端设 备之前操作的应用。 3.根据权利要求1所述的实现方法,其特征在于,根据多个用户端设备的历史行为数 据确定多个应用之间的关联度包括: 在确定第一应用和第二应用之间的关联度时,根据对所述第一应用和所述第二应用均 进行操作的用户端设备的数量、对所述第一应用进行操作的用户端设备的数量、以及对所 述第二应用进行操作的用户端设备的数量,确定所述第一应用与所述第二应用之。
5、间的关联 度。 4.根据权利要求1所述的实现方法,其特征在于,对于每个应用,该应用的特征信息包 括多个特征参数,并且,得到该应用的质量分数包括: 对该应用的多个特征参数的数据进行归一化处理,将归一化处理后的数据映射为特征 标识以及对应的特征值; 根据所述多个特征参数对应的特征值得到训练数据; 根据所述训练数据和预定的训练模型得到该应用的质量分数。 5.根据权利要求4所述的实现方法,其特征在于,对一应用的特征信息进行归一化处 理进一步包括: 在进行归一化处理之前,对于取值为连续值的特征参数,根据当前待平滑的连续数值、 当前平滑数据的最小值、以及当前平滑数据的最大值对该特征信息进行平滑处理得到平滑。
6、 后的特征参数。 6.根据权利要求4或5所述的实现方法,其特征在于,所述多个特征参数包括以下至少 之一: 该应用的下载量、该应用的入库时间、该应用的被打开次数、该应用的被卸载次数、该 应用被使用的时间长度、用户端设备对该应用的评分、该应用的名称、该应用所对应标签的 名称。 7.根据权利要求1所述的实现方法,其特征在于,将其他应用中的部分或全部推荐给 用户端设备包括: 对于其他应用中的每个应用,对该应用的质量分数、以及该应用与目标应用之间的相 似度进行加权求和,得到该应用的推荐得分; 将其他应用中推荐得分达到预定分数值的应用推荐给所述用户端设备。 8.一种应用推荐的实现装置,其特征在于,包括: 。
7、归一化处理模块,用于对应用的特征信息进行归一化处理,得到每个应用的质量分 数; 权 利 要 求 书CN 102880501 A 2/3页 3 确定模块,用于根据多个用户端设备的历史行为数据确定多个应用之间的关联度; 推荐处理模块,用于在需要将推荐给用户端设备的应用的信息发送给用户端设备的情 况下,根据其他应用的质量分数、以及其他应用与目标应用之间的关联度,将其他应用中的 部分或全部推荐给用户端设备,其中,所述目标应用包括所述用户端设备当前或之前操作 的应用。 9.根据权利要求8所述的实现装置,其特征在于, 在确定第一应用和第二应用之间的关联度时,所述确定模块用于根据对所述第一应用 和所述第二应。
8、用均进行操作的用户端设备的数量、对所述第一应用进行操作的用户端设备 的数量、以及对所述第二应用进行操作的用户端设备的数量,确定所述第一应用与所述第 二应用之间的关联度。 10.根据权利要求8所述的实现装置,其特征在于,对于每个应用,该应用的特征信息 包括多个特征参数,并且,所述归一化模块用于对该应用的多个特征参数的数据进行归一 化处理,将归一化处理后的数据映射为特征标识以及对应的特征值;所述归一化模块还用 于根据所述多个特征参数对应的特征值得到训练数据;以及,还用于根据所述训练数据和 预定的训练模型得到该应用的质量分数。 11.根据权利要求10所述的实现装置,其特征在于,对于取值为连续值的特征。
9、参数,所 述归一化处理模块还用于在进行归一化处理之前,根据当前待平滑的连续数值、当前平滑 数据的最小值、以及当前平滑数据的最大值对该特征信息进行平滑处理得到平滑后的特征 参数。 12.根据权利要求10或11所述的实现装置,其特征在于,所述多个特征参数包括以下 至少之一: 该应用的下载量、该应用的入库时间、该应用的被打开次数、该应用的被卸载次数、该 应用被使用的时间长度、用户端设备对该应用的评分、该应用的名称、该应用所对应标签的 名称。 13.根据权利要求8所述的实现装置,其特征在于,对于其他应用中的每个应用,所述 推荐处理模块用于对该应用的质量分数、以及该应用与目标应用之间的相似度进行加权求 。
10、和,得到该应用的推荐得分; 并且,所述推荐处理模块用于将其他应用中推荐得分达到预定分数值的应用推荐给所 述用户端设备。 14.一种应用推荐的实现系统,其特征在于,包括: 日志单元,用于获取多个用户端设备的历史行为数据,并将获取的历史行为数据发送 给推荐单元; 抓取单元,用于抓取应用的特征信息,并将抓取的特征信息发送给所述推荐单元; 所述推荐单元,包括: 归一化处理模块,用于对应用的特征信息进行归一化处理,得到每个应用的质量分 数; 确定模块,用于根据多个用户端设备的历史行为数据确定多个应用之间的关联度; 推荐处理模块,用于在需要将推荐给用户端设备的应用的信息发送给用户端设备的情 况下,根据其他。
11、应用的质量分数、以及其他应用与目标应用之间的关联度,将其他应用中的 权 利 要 求 书CN 102880501 A 3/3页 4 部分或全部推荐给用户端设备,其中,所述目标应用包括所述用户端设备当前或之前操作 的应用。 权 利 要 求 书CN 102880501 A 1/8页 5 应用推荐的实现方法、 装置和系统 技术领域 0001 本发明涉及计算机通信领域,并且特别地,涉及一种应用推荐的实现方法、装置和 系统。 背景技术 0002 随着智能终端设备的不断发展,目前,已经出现了很多种高智能性的终端设备 (本文中也称为用户端设备),例如,智能手机,平板电脑等。 0003 由于智能终端具有强大的功。
12、能,因此,对于智能终端,已经提出了很多种的应用 (应用程序,英文名称为applicant,简称为app),从而对智能终端进行进一步完善,使得智 能终端具有更加丰富、实用的功能,有效提高用户体验。 0004 目前,已经有大量的应用登录到各大智能终端平台上。但是,由于应用数量非常 大,新增应用非常多,因此,如何智能地将应用推荐给终端用户,避免用户进行大量的搜索 和查找工作,是一个较为关键的问题。 0005 目前,虽然对用户的操作能够通过日志来记录,并且,还能够将类型或评分存在一 定类似的应用推荐给用户。 0006 但是,目前所采用的推荐方案只能够根据用户的历史操作记录来进行推荐,因此, 对于用户操。
13、作量较小或者新上线的应用,则难以找到较为合理的参照,无法有效将这些应 用推荐给用户。 0007 针对相关技术中无法将各种应用都以合理的方式推荐给用户的问题,目前尚未提 出有效的解决方案。 发明内容 0008 针对相关技术中无法将各种应用都以合理的方式推荐给用户的问题,本发明提出 一种应用推荐的实现方法、装置和系统,能够以合理的方式将各种类型的应用推荐给用户 端设备。 0009 本发明的技术方案是这样实现的: 0010 根据本发明的一个方面,提供了一种应用推荐的实现方法。 0011 该方法包括:对于应用的特征信息进行归一化处理,得到该应用的质量分数,并根 据多个用户端设备的历史行为数据确定多个应。
14、用之间的关联度;在需要将推荐给用户端设 备的应用的信息发送给用户端设备的情况下,根据其他应用的质量分数、以及其他应用与 目标应用之间的关联度,将其他应用中的部分或全部推荐给用户端设备,其中,目标应用包 括用户端设备当前或之前操作的应用。 0012 此外,在用户端设备发起请求的情况下,通过用户端设备发起的请求确定用户端 设备的标识,并根据标识确定用户端设备之前操作的应用。 0013 此外,根据多个用户端设备的历史行为数据确定多个应用之间的关联度包括: 0014 在确定第一应用和第二应用之间的关联度时,根据对第一应用和第二应用均进行 说 明 书CN 102880501 A 2/8页 6 操作的用户。
15、端设备的数量、对第一应用进行操作的用户端设备的数量、以及对第二应用进 行操作的用户端设备的数量,确定第一应用与第二应用之间的关联度。 0015 并且,对于每个应用,该应用的特征信息包括多个特征参数,并且,得到该应用的 质量分数包括:对该应用的多个特征参数的数据进行归一化处理,将归一化处理后的数据 映射为特征标识以及对应的特征值;根据多个特征参数对应的特征值得到训练数据;根据 训练数据和预定的训练模型得到该应用的质量分数。 0016 并且,对一应用的特征信息进行归一化处理进一步包括:在进行归一化处理之前, 对于取值为连续值的特征参数,根据当前待平滑的连续数值、当前平滑数据的最小值、以及 当前平滑。
16、数据的最大值对该特征信息进行平滑处理得到平滑后的特征参数。 0017 并且,多个特征参数包括以下至少之一:该应用的下载量、该应用的入库时间、该 应用的被打开次数、该应用的被卸载次数、该应用被使用的时间长度、用户端设备对该应用 的评分、该应用的名称、该应用所对应标签的名称。 0018 此外,将其他应用中的部分或全部推荐给用户端设备包括: 0019 对于其他应用中的每个应用,对该应用的质量分数、以及该应用与目标应用之间 的相似度进行加权求和,得到该应用的推荐得分;将其他应用中推荐得分达到预定分数值 的应用推荐给用户端设备。 0020 根据本发明的另一方面,提供了一种应用推荐的实现装置。 0021 。
17、该装置包括:归一化处理模块,用于对应用的特征信息进行归一化处理,得到每个 应用的质量分数;确定模块,用于根据多个用户端设备的历史行为数据确定多个应用之间 的关联度;推荐处理模块,用于在需要将推荐给用户端设备的应用的信息发送给用户端设 备的情况下,根据其他应用的质量分数、以及其他应用与目标应用之间的关联度,将其他应 用中的部分或全部推荐给用户端设备,其中,目标应用包括用户端设备当前或之前操作的 应用。 0022 其中,在确定第一应用和第二应用之间的关联度时,确定模块用于根据对第一应 用和第二应用均进行操作的用户端设备的数量、对第一应用进行操作的用户端设备的数 量、以及对第二应用进行操作的用户端设。
18、备的数量,确定第一应用与第二应用之间的关联 度。 0023 此外,对于每个应用,该应用的特征信息包括多个特征参数,并且,归一化模块用 于对该应用的多个特征参数的数据进行归一化处理,将归一化处理后的数据映射为特征标 识以及对应的特征值;归一化模块还用于根据多个特征参数对应的特征值得到训练数据; 以及,还用于根据训练数据和预定的训练模型得到该应用的质量分数。 0024 此外,对于取值为连续值的特征参数,归一化处理模块还用于在进行归一化处理 之前,根据当前待平滑的连续数值、当前平滑数据的最小值、以及当前平滑数据的最大值对 该特征信息进行平滑处理得到平滑后的特征参数。 0025 优选地,多个特征参数包。
19、括以下至少之一:该应用的下载量、该应用的入库时间、 该应用的被打开次数、该应用的被卸载次数、该应用被使用的时间长度、用户端设备对该应 用的评分、该应用的名称、该应用所对应标签的名称。 0026 此外,对于其他应用中的每个应用,推荐处理模块用于对该应用的质量分数、以及 该应用与目标应用之间的相似度进行加权求和,得到该应用的推荐得分;并且,推荐处理模 说 明 书CN 102880501 A 3/8页 7 块用于将其他应用中推荐得分达到预定分数值的应用推荐给用户端设备。 0027 根据本发明的在一方面,提供了一种应用推荐的实现系统。 0028 该系统包括:日志单元,用于获取多个用户端设备的历史行为数。
20、据,并将获取的历 史行为数据发送给推荐单元;抓取单元,用于抓取应用的特征信息,并将抓取的特征信息 发送给推荐单元;推荐单元,包括:归一化处理模块,用于对应用的特征信息进行归一化处 理,得到每个应用的质量分数;确定模块,用于根据多个用户端设备的历史行为数据确定多 个应用之间的关联度;推荐处理模块,用于在需要将推荐给用户端设备的应用的信息发送 给用户端设备的情况下,根据其他应用的质量分数、以及其他应用与目标应用之间的关联 度,将其他应用中的部分或全部推荐给用户端设备,其中,目标应用包括用户端设备当前或 之前操作的应用。 0029 本发明通过对应用进行归一化处理得到应用的质量分数,并且根据应用之间的。
21、关 联,从而以此作为依据将应用推荐给用户端设备,能够参照应用本身的特征将应用推荐给 用户端设备,因此,对于刚上线或用户端设备操作量较小的应用,也能够合理地推荐给用户 端设备,并且能够克服推荐应用时主观判断的不准确性,并且,在此基础上结合关联性进行 推荐,能够进一步提高推荐的准确性,提高用户体验。 附图说明 0030 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所 需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施 例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获 得其他的附图。 0031 图1是根据本发明实施例。
22、的应用推荐的实现方法的流程图; 0032 图2是根据本发明实施例的应用推荐的实现方法的原理示意图; 0033 图3是根据本发明实施例的应用推荐的实现装置的框图; 0034 图4是根据本发明实施例的应用推荐的实现系统的框图。 具体实施方式 0035 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的 范围。 0036 根据本发明的实施例,提供了一种应用推荐的实现方法。下文中提到的用户端设 备可以是指用户终端,也就是通。
23、常所说的用户。另外,本文中提到的用户端设备不仅可以 是手机终端,也可以是笔记本电脑、平板电脑、计算机设备、个人数字助理(PDA)等多种终 端设备。另外,本文中所提到的应用(即,应用程序,英文名称为applicant,简称为app), 可以是能够应用于多种操作系统的应用程序,这些操作系统包括但不限于windows、iOS、 Android(安卓)、Symbian(塞班)等多种适用于用户端设备的操作系统。 0037 如图1所示,根据本发明实施例的应用推荐的实现方法包括: 0038 步骤S101,对于应用的特征信息进行归一化处理,得到该应用的质量分数(其中, 说 明 书CN 102880501 A 。
24、4/8页 8 这里的质量分数只是应用本身的特征和/或应用当前的使用情况的一种体现),并根据多 个用户端设备的历史行为数据确定多个应用之间的关联度; 0039 其中,归一化处理的目的是对不同类型的参数进行统一量化,得到该参数的数值, 从而使得这些参数彼此之间能够进行计算,其目的在于借助于每个应用的各个特征信息得 到该应用的质量,从而使质量分数能够更加客观地反应该应用的所有特征。 0040 步骤S103,在需要将推荐给用户端设备的应用的信息发送给用户端设备的情况 下,根据其他应用的质量分数、以及其他应用与目标应用之间的关联度,将其他应用中的部 分或全部推荐给用户端设备,其中,目标应用包括用户端设备。
25、当前或之前操作(这里的操 作可以包括浏览、评论、下载、安装、卸载等操作或其组合)的应用。 0041 其中,可以在用户端设备发起请求的情况下,通过用户端设备发起的请求确定用 户端设备的标识,并根据标识确定用户端设备之前操作的应用。 0042 此外,在确定第一应用和第二应用之间的关联度时,根据对第一应用和第二应用 均进行操作的用户端设备的数量、对第一应用进行操作的用户端设备的数量、以及对第二 应用进行操作的用户端设备的数量,确定第一应用与第二应用之间的关联度。 0043 具体地,在根据多个用户端设备的历史行为数据确定多个应用之间的关联度时, 对于应用A和应用B,根据以下公式确定个该两个应用之间的关。
26、联度sim(A,B): 0044 0045 其中,count(A,B)是同时点击应用A,B的用户端设备数,count(A)是点击应用A 的用户端设备数,count(B)是点击应用B的用户端设备数。 0046 此外,对于每个应用,该应用的特征信息包括多个特征参数,并且,在获得该应用 的质量分数时,可以对该应用的多个特征参数的数据进行归一化处理,将归一化处理后的 数据映射为特征标识以及对应的特征值;根据多个特征参数对应的特征值得到训练数据; 根据训练数据和预定的训练模型得到该应用的质量分数。 0047 可选地,在进行归一化处理之前,对于取值为连续值的特征参数,根据当前待平滑 的连续数值、当前平滑数。
27、据的最小值、以及当前平滑数据的最大值对该特征信息进行平滑 处理得到平滑后的特征参数。 0048 具体地,可以预先根据以下公式对该特征信息进行平滑处理得到平滑后的特征参 数f(score): 0049 0050 其中,score是当前待平滑的连续数值,minScore是当前平滑数据的最小值, maxScore是当前平滑数据的最大值。 0051 可选地,对于每个应用,用于计算质量分数的多个特征参数可以包括以下至少之 一:该应用的下载量、该应用的入库时间、该应用的被打开次数、该应用的被卸载次数、该应 用被使用的时间长度、用户端设备对该应用的评分、该应用的名称、该应用所对应标签的名 称。 0052 应。
28、当注意,这里对于特征参数的列举仅仅是具体的实例。在实际应用中,可以选择 其他的参数作为进行质量分数计算的依据。 说 明 书CN 102880501 A 5/8页 9 0053 另外,在上述方法中,在将其他应用中的部分或全部推荐给用户端设备时,对于其 他应用中的每个应用,对该应用的质量分数、以及该应用与目标应用之间的相似度进行加 权求和,得到该应用的推荐得分。 0054 具体地,可以根据以下公式确定该应用的推荐得分: 0055 f(score)*simScore+(1-)*qualityScore;其中,为取值0-1数, simScore表示该应用与目标应用的相似度,qualityScore表示。
29、该应用的质量分数;将其他 应用中推荐得分达到预定分数值的应用推荐给用户端设备。 0056 图2是根据本发明实施例的上述方法的具体执行过程的原理图。 0057 如图2所示,其中具体包括以下步骤: 0058 (步骤1)用户端设备行为数据获取 0059 用户行为获取模块主要是获取用户主动点击行为,是推荐算法运行的基础。当用 户点击一款应用的时候,程序会自动发送log日志到日志服务器。日志服务器汇总日志,定 时同步到hadoop集群,用于后续的推荐,也正是通过这种方式,能够获知用户当前或之前 操作过的应用。 0060 打点到服务器上的log至少包含以下字段:用户端设备标识,应用标识,用户端设 备点击的。
30、时间等字段。 0061 (步骤2)采取关联推荐算法,根据用户端设备的行为数据计算应用之间的相似 性。得到应用之间的相似性数据。 0062 根据所有用户端设备的访问历史,根据相似度计算公式,计算应用之间的相似性。 相似度公式如下: 0063 0064 其中,count(A,B)是同时点击应用A,B的用户端设备数。 0065 count(A)是点击应用A的用户端设备数。 0066 count(B)是点击应用B的用户端设备数。 0067 (步骤3)根据以上计算结果,得到应用(item)的相似性数据(关联性)。 0068 (步骤4)获取用于计算应用质量评价的各种数据,包括下载量、入库时间、打开次 数、。
31、卸载量、使用时长、用户端设备的评分、应用名称、应用tag。 0069 (步骤5)将各个特征的数据归一化,并映射成特征id,计算各个特征的分数并训 练模型。 0070 具体地,在步骤5中,对于取值是连续的数据,首先将数值归一化及平滑处理,采 取的平滑公式如下: 0071 0072 其中score是当前待平滑的连续数值,minScore是当前平滑数据的最小值, maxScore是当前平滑数据的最大值。 0073 对于平滑后的数据,按照0.1的间隔将数据离散化成特征。例如: 0074 说 明 书CN 102880501 A 6/8页 10 特征id 1 2 3 4 5 6 7 8 9 数值 0.1 。
32、0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0075 假如平滑后的数值取值是0.25,则对应的第2个特征的取值是1。 0076 对应非连续的数据,例如应用名称,则将每个汉字和空格分开的连续英文字符作 为一个特征。 0077 例如:对于应用“Show time!帅男登场”,对应的特征有 0078 特征id 551 552 553 554 555 556 特征含义 Show time 帅 男 登 场 0079 对于训练数组中的每款应用,计算各个应用的点击率,假如小于0.5则将目标设 为0,否则将目标设为1。 0080 将上述数据输入到逻辑回归模型中,训练模型。 0081 例如,。
33、对于“Show time!帅男登场”这款应用,假如其下载量是100,入库时间是 2012-06-05, 0082 打开次数是10次,卸载量是5次,使用时长是30分钟,用户评分是5分,应用tag 是生活休闲。 0083 首先,约定下载量的特征编号是1到100,入库时间的特征编号是101到200,打开 次数的特征编号是201到300,卸载量的特征编号是从301到400,使用时长的特征编号是 从401到500,用户评分的特征编号是从501到550,应用名称和tag的特征区间是551到 3000。 0084 对应上述的各个特征,按照特征归一化的方法进行归一化,例如,假如下载量归一 化后的数值是0.25。
34、,则特征id编号为2的特征取值是1。采用同样的方法,将其他连续性 的特征对应的特征id编号设置为1,这里,假设入库时间对应的是101,打开次数对应的是 201,卸载量对应的特征id是301,使用时长对应的特征id是401,。对于非连续特征,例如, 应用名称,假如男对应的特征id编号是554,则对应的554的取值是1。 0085 将上述各个特征抽取出来,最终的训练数据如下: 0086 21 1011 2011 3011 4011 5511 5521 5531 5541 5541。 0087 (步骤6)根据训练好的模型对每个应用计算质量分数。 0088 (步骤7)将质量分数与相似度分数融合,得到最。
35、终的推荐分数。 0089 计算最终的得分,主要综合相似度分数和质量分,采取的公式如下: 0090 f(score)*simScore+(1-)*qualityScore 0091 其中,是取值0-1的一个数,simScore表示相似度的分数,qualityScore表示 应用的质量得分。 0092 (步骤8)得到最终的推荐结果,将推荐结果发送给用户端设备。 0093 根据本发明的实施例,还提供了一种应用推荐的实现装置。 说 明 书CN 102880501 A 10 7/8页 11 0094 如图3所示,根据本发明实施例的应用推荐的实现装置包括: 0095 归一化处理模块31,用于对应用的特征信。
36、息进行归一化处理,得到每个应用的质 量分数; 0096 确定模块32,用于根据多个用户端设备的历史行为数据确定多个应用之间的关联 度; 0097 推荐处理模块33,连接至归一化处理模块31和确定模块32,推荐处理模块33用 于在需要将推荐给用户端设备的应用的信息发送给用户端设备的情况下,根据其他应用的 质量分数、以及其他应用与目标应用之间的关联度,将其他应用中的部分或全部推荐给用 户端设备,其中,目标应用包括用户端设备当前或之前操作的应用。 0098 其中,在确定第一应用和第二应用之间的关联度时,确定模块用于根据对第一应 用和第二应用均进行操作的用户端设备的数量、对第一应用进行操作的用户端设备。
37、的数 量、以及对第二应用进行操作的用户端设备的数量,确定第一应用与第二应用之间的关联 度。 0099 具体地,对于应用A和应用B,确定模块用于根据以下公式确定个该两个应用之间 的关联度sim(A,B): 0100 0101 其中,count(A,B)是同时点击应用A,B的用户端设备数,count(A)是点击应用A 的用户端设备数,count(B)是点击应用B的用户端设备数。 0102 此外,对于每个应用,该应用的特征信息包括多个特征参数,并且,归一化模块用 于对该应用的多个特征参数的数据进行归一化处理,将归一化处理后的数据映射为特征标 识以及对应的特征值;归一化模块还用于根据多个特征参数对应的。
38、特征值得到训练数据; 以及,还用于根据训练数据和预定的训练模型得到该应用的质量分数。 0103 可选地,对于取值为连续值的特征参数,归一化处理模块还用于在进行归一化处 理之前,根据当前待平滑的连续数值、当前平滑数据的最小值、以及当前平滑数据的最大值 对该特征信息进行平滑处理得到平滑后的特征参数。具体地,可以根据以下公式对该特征 信息进行平滑处理得到平滑后的特征参数f(score): 0104 0105 其中,score是当前待平滑的连续数值,minScore是当前平滑数据的最小值, maxScore是当前平滑数据的最大值。 0106 优选地,多个特征参数包括以下至少之一: 0107 该应用的下。
39、载量、该应用的入库时间、该应用的被打开次数、该应用的被卸载次 数、该应用被使用的时间长度、用户端设备对该应用的评分、该应用的名称、该应用所对应 标签的名称。 0108 此外,对于其他应用中的每个应用,推荐处理模块用于对该应用的质量分数、以及 该应用与目标应用之间的相似度进行加权求和,得到该应用的推荐得分;并且,推荐处理模 块用于将其他应用中推荐得分达到预定分数值的应用推荐给用户端设备。具体地,推荐处 理模块用于根据以下公式确定该应用的推荐得分: 说 明 书CN 102880501 A 11 8/8页 12 0109 f(score)*simScore+(1-)*qualityScore;其中,。
40、为取值0-1数, simScore表示该应用与目标应用的相似度,qualityScore表示该应用的质量分数; 0110 并且,推荐处理模块用于将其他应用中推荐得分达到预定分数值的应用推荐给用 户端设备。 0111 根据本发明的实施例,还提供了一种应用推荐的实现系统。 0112 如图4所示,根据本发明实施例的应用推荐的实现系统包括: 0113 日志单元41,用于获取多个用户端设备的历史行为数据,并将获取的历史行为数 据发送给推荐单元(如图4中所示的云服务器43); 0114 抓取单元42,用于抓取应用的特征信息,并将抓取的特征信息发送给推荐单元 43; 0115 其中,推荐单元43,包括: 0。
41、116 归一化处理模块(未示出),用于对应用的特征信息进行归一化处理,得到每个应 用的质量分数;确定模块(未示出),用于根据多个用户端设备的历史行为数据确定多个应 用之间的关联度;推荐处理模块(未示出),用于在需要将推荐给用户端设备的应用的信息 发送给用户端设备的情况下,根据其他应用的质量分数、以及其他应用与目标应用之间的 关联度,将其他应用中的部分或全部推荐给用户端设备,其中,目标应用包括用户端设备当 前或之前操作的应用。 0117 在实际应用中,日志单元、推荐单元、以及抓取单元中的每一个均可以通过不同的 服务器(或服务器机组)来实现,也可以通过程序的方式来实现而设置在同一网络设备中。 如果。
42、通过单独的服务器来实现上述单元,日志单元所在的服务器可以称为日志服务器,推 荐单元所在的服务器可以称为推荐服务器,抓取单元所在的服务器可以称为抓取服务器。 0118 如图4所示的系统按照以下流程进行工作: 0119 步骤51,用户端设备请求线上的服务器,其中包含了用户端设备的唯一标识mid。 0120 步骤52,服务器(图4中的登录服务器)提取当前用户端设备的mid,根据mid查 找线上引擎,并将结果返回给该用户端设备。 0121 步骤53,服务器将当前用户端设备的请求保存到日志单元(日志服务器),用于后 台日志分析。 0122 步骤54,日志单元(日志服务器)定时将数据推送到云服务器集群,用。
43、于数据处理。 0123 步骤55,外部抓取单元(抓取服务器)抓取应用的各种数据,并将数据存放到推荐 单元(例如,推荐服务器,该推荐服务器可以是一个云服务器集群),用于数据处理。 0124 步骤56,推荐单元根据用户端设备的查询日志以及外部服务器抓取的数据,采取 算法处理规则对数据进行处理,并将最终的推荐结果返回给用户端设备。 0125 综上所述,借助于本发明的上述技术方案,通过对应用进行归一化处理得到应用 的质量分数,并且根据应用之间的关联,从而以此作为依据将应用推荐给用户端设备,能够 参照应用本身的特征将应用推荐给用户端设备,因此,对于刚上线或用户端设备操作量较 小的应用,也能够合理地推荐给用户端设备,并且能够克服推荐应用时主观判断的不准确 性,并且,在此基础上结合关联性进行推荐,能够进一步提高推荐的准确性,提高用户体验。 0126 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精 神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。 说 明 书CN 102880501 A 12 1/3页 13 图1 图2 说 明 书 附 图CN 102880501 A 13 2/3页 14 图3 说 明 书 附 图CN 102880501 A 14 3/3页 15 图4 说 明 书 附 图CN 102880501 A 15 。