一种基于用户已安装应用来推荐热词的方法和装置.pdf

上传人:r7 文档编号:1301909 上传时间:2018-04-14 格式:PDF 页数:14 大小:817.03KB
返回 下载 相关 举报
摘要
申请专利号:

CN201710035726.2

申请日:

2017.01.17

公开号:

CN106844612A

公开日:

2017.06.13

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):G06F 17/30申请日:20170117|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

广州优视网络科技有限公司

发明人:

潘岸腾

地址:

510627 广东省广州市黄埔大道西平云路163号广电平云广场B塔15层自编02单元

优先权:

专利代理机构:

北京律谱知识产权代理事务所(普通合伙) 11457

代理人:

黄云铎

PDF下载: PDF下载
内容摘要

本发明提供了一种基于用户已安装应用来推荐热词的方法和装置。所述方法包括:确定用户已安装应用与应用库里的应用的相似度;确定用户通过搜索热词库里的热词而下载了应用的概率;基于所述相似度和所述概率确定用户已安装应用与所述热词的匹配度;基于所述用户已安装应用与所述热词的匹配度和用户已安装应用的数量来确定用户与所述热词的匹配度;按用户与所述热词的匹配度值从大到小顺序从热词库里选取一定数量的相应热词作为推荐热词。

权利要求书

1.一种基于用户已安装应用来推荐热词的方法,其包括:
确定用户已安装应用与应用库里的应用的相似度;
确定用户通过搜索热词库里的热词而下载了应用的概率;
基于所述相似度和所述概率确定用户已安装应用与所述热词的匹配度;
基于所述用户已安装应用与所述热词的匹配度和用户已安装应用的数量来确定用户
与所述热词的匹配度;
按用户与所述热词的匹配度值从大到小顺序从热词库里选取一定数量的相应热词作
为推荐热词。
2.根据权利要求1所述的方法,其特征在于所述确定用户已安装应用与其他应用的相
似度的方法如下:
<mrow> <msub> <mi>Sim</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mrow> <mo>(</mo> <mrow> <msup> <mi>&beta;</mi> <mrow> <mo>|</mo> <msub> <mi>K</mi> <mi>i</mi> </msub> <mo>&cap;</mo> <msub> <mi>K</mi> <mi>j</mi> </msub> <mo>|</mo> </mrow> </msup> <mo>-</mo> <mn>1</mn> </mrow> <mo>)</mo> </mrow> <mo>*</mo> <mfrac> <mrow> <mo>|</mo> <msub> <mi>U</mi> <mi>i</mi> </msub> <mo>&cap;</mo> <msub> <mi>U</mi> <mi>j</mi> </msub> <mo>|</mo> </mrow> <mrow> <mo>|</mo> <msub> <mi>U</mi> <mi>i</mi> </msub> <mo>&cup;</mo> <msub> <mi>U</mi> <mi>j</mi> </msub> <mo>|</mo> </mrow> </mfrac> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>,</mo> <mn>...</mn> <mo>,</mo> <mi>n</mi> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mo>&NotEqual;</mo> <mi>j</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>,</mo> <mn>...</mn> <mo>,</mo> <mi>n</mi> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mo>=</mo> <mi>j</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>
其中:
n表示表示应用库里的应用数量;
Ki表示用户已安装应用i具有的标签集合;
Kj表示应用库里的应用j具有的标签集合;
Ui表示安装了应用i的用户集合;
Uj表示安装了应用j的用户集合;
β>1。
3.根据权利要求1所述的方法,其特征在于所述确定用户通过搜索热词库里的热词而
下载了应用的概率的方法如下:
<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>P</mi> <mrow> <mi>l</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>=</mo> <mfrac> <msub> <mi>a</mi> <mrow> <mi>l</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <msub> <mi>w</mi> <mi>l</mi> </msub> </mfrac> </mrow> </mtd> <mtd> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mi>n</mi> </mrow> </mtd> <mtd> <mrow> <mi>l</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mi>m</mi> </mrow> </mtd> </mtr> </mtable> </mfenced>
其中:
n表示表示应用库里的应用数量;
m表示表示热词库里的热词数量;
al,j表示通过搜索热词l而下载应用j的用户总数;
wl表示搜索了热词l的用户总数。
4.根据权利要求1所述的方法,其特征在于所述基于所述相似度和所述概率确定用户
已安装应用与所述热词的匹配度的方法如下:
<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>Wim</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>l</mi> </mrow> </msub> <mo>=</mo> <msubsup> <mi>&Sigma;</mi> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </msubsup> <msub> <mi>Sim</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>*</mo> <msub> <mi>P</mi> <mrow> <mi>l</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mi>n</mi> </mrow> </mtd> <mtd> <mrow> <mi>l</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mi>m</mi> </mrow> </mtd> </mtr> </mtable> </mfenced>
其中:
n表示表示应用库里的应用数量;
m表示表示热词库里的热词数量;
Simi,j表示所述相似度;
Pl,j表示所述概率。
5.根据权利要求1所述的方法,其特征在于所述基于所述用户已安装应用与所述热词
的匹配度和用户已安装应用的数量来确定用户与所述热词的匹配度的方法如下:
<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>S</mi> <mrow> <mi>u</mi> <mo>,</mo> <mi>l</mi> </mrow> </msub> <mo>=</mo> <msubsup> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </msubsup> <msub> <mi>h</mi> <mrow> <mi>u</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>*</mo> <msub> <mi>Wim</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>l</mi> </mrow> </msub> </mrow> </mtd> <mtd> <mrow> <mi>l</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mi>m</mi> </mrow> </mtd> </mtr> </mtable> </mfenced>
其中:
n表示表示应用库里的应用数量;
m表示表示热词库里的热词数量;
hu,i表示用户安装应用库里的应用i与否,取值1和0,安装了应用i取值为1,没有安装应
用i取值为0。
6.一种基于用户已安装应用来推荐热词的装置,其包括:
应用的相似度确定单元,用于确定用户已安装应用与应用库里的应用的相似度;
应用下载概率确定单元,用于确定用户通过搜索热词库里的热词而下载了应用的概
率;
匹配度第一确定单元,用于基于所述相似度和所述概率确定用户已安装应用与所述热
词的匹配度;
匹配度第二确定单元,基于所述用户已安装应用与所述热词的匹配度和用户已安装应
用的数量来确定用户与所述热词的匹配度;
推荐单元,用于按用户与所述热词的匹配度值从大到小顺序从热词库里选取一定数量
的相应热词作为推荐热词。
7.根据权利要求6所述的装置,其特征在于所述确定用户已安装应用与其他应用的相
似度的方法如下:
<mrow> <msub> <mi>Sim</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mrow> <mo>(</mo> <mrow> <msup> <mi>&beta;</mi> <mrow> <mo>|</mo> <msub> <mi>K</mi> <mi>i</mi> </msub> <mo>&cap;</mo> <msub> <mi>K</mi> <mi>j</mi> </msub> <mo>|</mo> </mrow> </msup> <mo>-</mo> <mn>1</mn> </mrow> <mo>)</mo> </mrow> <mo>*</mo> <mfrac> <mrow> <mo>|</mo> <msub> <mi>U</mi> <mi>i</mi> </msub> <mo>&cap;</mo> <msub> <mi>U</mi> <mi>j</mi> </msub> <mo>|</mo> </mrow> <mrow> <mo>|</mo> <msub> <mi>U</mi> <mi>i</mi> </msub> <mo>&cup;</mo> <msub> <mi>U</mi> <mi>j</mi> </msub> <mo>|</mo> </mrow> </mfrac> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>,</mo> <mn>...</mn> <mo>,</mo> <mi>n</mi> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mo>&NotEqual;</mo> <mi>j</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>,</mo> <mn>...</mn> <mo>,</mo> <mi>n</mi> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mo>=</mo> <mi>j</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>
其中:
n表示表示应用库里的应用数量;
Ki表示用户已安装应用i具有的标签集合;
Kj表示应用库里的应用j具有的标签集合;
Ui表示安装了应用i的用户集合;
Uj表示安装了应用j的用户集合;
β>1。
8.根据权利要求6所述的装置,其特征在于所述确定用户通过搜索热词库里的热词而
下载了应用的概率的方法如下:
<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>P</mi> <mrow> <mi>l</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>=</mo> <mfrac> <msub> <mi>a</mi> <mrow> <mi>l</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <msub> <mi>w</mi> <mi>l</mi> </msub> </mfrac> </mrow> </mtd> <mtd> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mi>n</mi> </mrow> </mtd> <mtd> <mrow> <mi>l</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mi>m</mi> </mrow> </mtd> </mtr> </mtable> </mfenced>
其中:
n表示表示应用库里的应用数量;
m表示表示热词库里的热词数量;
al,j表示通过搜索热词l而下载应用j的用户总数;
wl表示搜索了热词l的用户总数。
9.根据权利要求6所述的装置,其特征在于所述基于所述相似度和所述概率确定用户
已安装应用与所述热词的匹配度的方法如下:
<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>Wim</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>l</mi> </mrow> </msub> <mo>=</mo> <msubsup> <mi>&Sigma;</mi> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </msubsup> <msub> <mi>Sim</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>*</mo> <msub> <mi>P</mi> <mrow> <mi>l</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mi>n</mi> </mrow> </mtd> <mtd> <mrow> <mi>l</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mi>m</mi> </mrow> </mtd> </mtr> </mtable> </mfenced>
其中:
n表示表示应用库里的应用数量;
m表示表示热词库里的热词数量;
Simi,j表示所述相似度;
Pl,j表示所述概率。
10.根据权利要求6所述的装置,其特征在于所述基于所述用户已安装应用与所述热词
的匹配度和用户已安装应用的数量来确定用户与所述热词的匹配度的方法如下:
<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>S</mi> <mrow> <mi>u</mi> <mo>,</mo> <mi>l</mi> </mrow> </msub> <mo>=</mo> <msubsup> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </msubsup> <msub> <mi>h</mi> <mrow> <mi>u</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>*</mo> <msub> <mi>Wim</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>l</mi> </mrow> </msub> </mrow> </mtd> <mtd> <mrow> <mi>l</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mi>m</mi> </mrow> </mtd> </mtr> </mtable> </mfenced>
其中:
n表示表示应用库里的应用数量;
m表示表示热词库里的热词数量;
hu,i表示用户安装应用库里的应用i与否,取值1和0,安装了应用i取值为1,没有安装应
用i取值为0。

说明书

一种基于用户已安装应用来推荐热词的方法和装置

技术领域

本发明涉及信息处理技术领域,具体而言涉及一种基于用户已安装应用来推荐热
词的方法和装置。

背景技术

随着互联网技术和智能移动终端技术的快速发展,很多在计算机终端上实现的功
能(例如购物、阅读)也都可以在智能移动终端上实现,例如使用智能手机或平板电脑等。另
外,这些功能的实现需要在智能移动终端上安装相应的应用程序。例如,网上购物,需要安
装例如淘宝客户端,听音乐需要安装音乐播放器客户端等。由此,很多软件公司提供了应用
商店或应用市场,例如豌豆荚或者PP助手等。用户可以打开应用商店或者应用市场,从而能
够快速搜索和下载所需要的各种应用程序,包括影音播放类、系统工具类、通讯社交类、网
上购物类、阅读类等,当然还可以下载游戏等休闲娱乐类应用程序(APP)。

在应用商店或者应用市场中,搜索是用户下载应用的主要入口。为了帮助用户发
现更多有趣的应用,需要在搜索首页中对用户进行热词推荐,图1示出了在搜索首页中推荐
显示热词的一个例子。现有技术中,搜索首页上展示的热词往往是目前搜索热度最高的词,
或者基于运营策略而推荐的热词。但是,由于不同的用户拥有不同的兴趣,根据现有技术推
荐的热词不一定是用户感兴趣的,无法满足不同用户的需求,致使用户的体验感不佳。

发明内容

本发明的目的在于提供一种基于用户已安装应用来推荐热词的方法和装置,以改
善上述问题。

本发明实施例提供了一种基于用户已安装应用来推荐热词的方法,其包括:

确定用户已安装应用与应用库里的应用的相似度;

确定用户通过搜索热词库里的热词而下载了应用的概率;

基于所述相似度和所述概率确定用户已安装应用与所述热词的匹配度;

基于所述用户已安装应用与所述热词的匹配度和用户已安装应用的数量来确定
用户与所述热词的匹配度;

按用户与所述热词的匹配度值从大到小顺序从热词库里选取一定数量的相应热
词作为推荐热词。

本发明实施例还提供了一种基于用户已安装应用来推荐热词的装置,其包括:

应用的相似度确定单元,用于确定用户已安装应用与应用库里的应用的相似度;

应用下载概率确定单元,用于确定用户通过搜索热词库里的热词而下载了应用的
概率;

匹配度第一确定单元,用于基于所述相似度和所述概率确定用户已安装应用与所
述热词的匹配度;

匹配度第二确定单元,基于所述用户已安装应用与所述热词的匹配度和用户已安
装应用的数量来确定用户与所述热词的匹配度;

推荐单元,用于按用户与所述热词的匹配度值从大到小顺序从热词库里选取一定
数量的相应热词作为推荐热词。

其中,所述确定用户已安装应用与其他应用的相似度的方法如下:


其中:

n表示表示应用库里的应用数量;

Ki表示用户已安装应用i具有的标签集合;

Kj表示应用库里的应用j具有的标签集合;

Ui表示安装了应用i的用户集合;

Uj表示安装了应用j的用户集合;

β>1。

其中,所述确定用户通过搜索热词库里的热词而下载了应用的概率的方法如下:


其中:

n表示表示应用库里的应用数量;

m表示表示热词库里的热词数量;

al,j表示通过搜索热词l而下载应用j的用户总数;

wl表示搜索了热词l的用户总数。

其中,所述基于所述相似度和所述概率确定用户已安装应用与所述热词的匹配度
的方法如下:


其中:

n表示表示应用库里的应用数量;

m表示表示热词库里的热词数量;

Simi,j表示所述相似度;

Pl,j表示所述概率。

其中,所述基于所述用户已安装应用与所述热词的匹配度和用户已安装应用的数
量来确定用户与所述热词的匹配度的方法如下:


其中:

n表示表示应用库里的应用数量;

m表示表示热词库里的热词数量;

hu,i表示用户安装应用库里的应用i与否,取值1和0,安装了应用i取值为1,没有安
装应用i取值为0。

根据本发明的基于用户已安装应用来推荐热词的方法和装置,通过先确定用户已
安装应用与应用库里的应用的相似度,和用户通过热词下载应用的概率,来确定用户已安
装应用与所述热词的匹配度,再将用户安装的多个应用与相关热词的匹配度综合归纳为用
户与相关热词的匹配度,从而实现了根据用户的兴趣爱好进行个性化推荐热词的目的,大
大提高了用户体验。

附图说明

图1是示出根据现有技术在搜索首页中推荐热词的一个例子的截图;

图2是示例性的示出应用市场上显示的具有2个标签的应用的截图;

图3是根据本发明的基于用户已安装应用来推荐热词的方法的流程图;

图4是本发明的基于用户已安装应用来推荐热词的装置的示意性框图。

具体实施方式

下面将结合本发明实施例和附图,对本发明实施例中的技术方案进行清楚、完整
地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。通常在此
处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,
以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范
围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出
创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

在上面提到的用户体验感不佳的原因之一是不同的用户拥有不同的兴趣,而现有
技术的推荐方案仅仅是推荐搜索热度最高的词,但搜索热度最高的不一定是人人都喜欢
的。以游戏为例,假设“捕鱼达人”是搜索热度最高的词,但用户A不喜欢玩“捕鱼达人”的游
戏,而是喜欢玩格斗游戏,所以向用户A推荐“捕鱼达人”是无法激发他的兴趣去点击下载;
再例如,用户B在朋友的推荐下下载了“捕鱼达人”,但不喜欢玩,将其卸载。但根据现有技术
的推荐方法,当用户B进入应用商店或者应用市场的搜索首页时依然会向其推荐“捕鱼达
人”,这就带来了不好的用户体验。

本技术方案的发明人充分考虑了用户的兴趣和爱好,提出一种新的个性化推荐方
法,能够根据不同用户的兴趣爱好不同而推荐的不同热词,从而实现个性化推荐,这会大大
提升用户的体验感。

通常可以认为,用户使用的例如智能手机或平板电脑或计算机等智能终端上安装
的各种应用,如游戏类、休闲类、办公类等,是该用户感兴趣的应用,如果能够找到一种方法
可以基于用户已安装应用来推荐热词,就可以实现所述的个性化推荐的目的。

图3是根据本发明的基于用户已安装应用来推荐热词的方法的流程图。如图3所
示,本发明的基于用户已安装应用来推荐热词的方法包括以下步骤:

S1:确定用户已安装应用与应用库里的应用的相似度。

首先根据用户使用的终端设备上已安装的应用来确定该已安装应用与应用库里
的所有应用之间的相似度。应用库为应用市场或应用商店里提供的所有应用的集合。这里
所述的已安装应用是指在向用户推荐热词时在用户使用的终端上已安装着的应用。

确定所述相似度的方法有很多,很简单的方法如分类法,将与该已安装应用同类
的应用的相似度设为1,不同类的应用的相似度设为0。另外,应用商店或者应用市场里提供
的各种应用程序(简称应用)通常都具有标签,标签的作用是标识各种应用程序的分类或内
容,便于用户查找。目前,在应用市场或应用商店中每一个应用都会包含至少1个应用标签,
如图2所示,图2示出了娱乐应用“天天欢乐斗地主”包含2个标签,1个标签显示其标识该应
用的内容是“斗地主”,另1个标签显示其标识该应用的分类是“纸牌”。这样,可以根据是否
与该已安装应用具有相同标签,来确定应用的相似度。再者,还可以根据具体相同标签的数
量确定相似度的值,例如可以设具有1个相同标签的应用的相似度为1,设具有2个相同标签
的应用的相似度为2。

当然,上述举例的方法为最简单的方法,也可以使用其他方法。但在本发明里,优
选提供一种更佳的确定方法,由此得到的相似度值更能表现已安装应用与应用库里的所有
应用之间的相似性。

确定用户已安装应用与应用库里的应用的相似度的方法如下:


其中:

n表示表示应用库里的应用数量;

Ki表示用户已安装应用i具有的标签集合;

Kj表示应用库里的应用j具有的标签集合;

Ui表示安装了应用i的用户集合;

Uj表示安装了应用j的用户集合;

其中β>1,其取值考虑两个因素:1是应用库里的应用j具有的平均标签数量,设为
k;2是标签相似权重,设为m,则根据经验,应用库里的应用j具有的平均标签数量k
=2,标签相似权重m一般为4,因此β的经验值为2。

已知用户通常会在其使用的终端上安装多个应用,例如2个或更多。

该优选方法考虑了2个应用之间的相似度的两个因素:1是具有相同标签的数量因
素,用值衡量,其中表示2个应用之间每多一个相同标签,相似度增加
β倍,而减1是为了把没有相同标签的应用之间的相似度归为0;2是杰卡德相似系数,用杰卡
德公式衡量,杰卡德相似系数是衡量两个集合相似度的一种指标,即衡量已安装应
用i的用户集合和安装应用j的用户集合的相似度。

这里简单举例说明具有相同标签的数量因素。例如,三个应用分别是应用A“斗地
主”(其标签有“休闲”、“棋牌”、“斗地主”)、应用B“消消乐”(其标签有“休闲”“消除”)、应用C
“德州扑克”(其标签有“休闲”“棋牌”);假设β=2,因为应用A和应用B之间具有1个相同标
签,所以因为应用A和应用C之间具有2个相同标签,所以
这意味着在标签维度上应用A与应用C的相似度是应用A与应用B的相
似度的3倍,即增加β=2倍。

S2:确定用户通过搜索热词库里的热词而下载了应用的概率。

在应用商店或者应用市场具有了推荐功能之后,开发商都会建立热词库,用于从
热词库里选择出一定数量的热词向用户推荐。用于选择热词来建立热词库的方法可以是多
种方式或多种方式并存,例如方法之一:统计用户输入搜索词,选择搜索词的出现次数排在
前面的多个词作为热词;方法之二:将下载量排在前面的多个应用所属的类型的词作为热
词;方法之三:根据用户对应用的评分或下载行为等统计数据对排名靠前的应用进行归纳
整理,由运营工作人员归纳出多个词作为热词;除此之外,其他任何可以将某个词放入热词
库里作为热词的方法都可以在这里使用。

用户使用的智能移动终端上安装的各种应用可能是通过热词搜索到该应用并下
载安装,也可能没有通过热词搜索该应用来下载安装,例如该应用是智能移动终端预安装
的;再如该应用是用户直接在官网上下载安装的;再如也可以是用户通过朋友发送的安装
包直接安装的。因此,有必要确定用户通过搜索热词库里的热词而下载了应用的概率。

可以通过下面的公式来计算所述概率Pl,j


其中:

n表示表示应用库里的应用数量;

m表示表示热词库里的热词数量;

al,j表示通过搜索热词l而下载应用j的用户总数;

wl表示搜索了热词l的用户总数。

这样可知,概率Pl,j表示在搜索了热词库里的热词l的所有用户中通过该热词l下
载了应用j的用户所占比例。

S3:基于所述相似度和所述概率确定用户已安装应用与所述热词的匹配度。

在得到了用户已安装应用与应用库里的应用的相似度,和用户通过搜索热词库里
的热词而下载了应用的概率之后,就可以确定用户已安装应用与所述热词的匹配度,即通
过热词而下载了应用的所述热词。确定用户已安装应用与热词的匹配度的方法如下:


其中:

n表示表示应用库里的应用数量;

m表示表示热词库里的热词数量;

Simi,j表示所述相似度;

Pl,j表示所述概率。

S4:基于所述用户已安装应用与所述热词的匹配度和用户已安装应用的数量来确
定用户与所述热词的匹配度。

因为通常情况下用户会在其使用的终端上安装超过1个数量的应用,例如安装有5
个、10个或更多应用等,所以需要把已安装的每个应用与相关热词的匹配度综合归纳为用
户与相关热词的匹配度。由此,确定用户与所述热词的匹配度的方法如下:


其中:

n表示表示应用库里的应用数量;

m表示表示热词库里的热词数量;

hu,i表示用户安装应用库里的应用i与否,取值1和0,安装了应用i取值为1,没有安
装应用i取值为0。

这样可知,Su,l表示用户安装的多个应用与各自相应热词的匹配度累加之和。

S5:按用户与所述热词的匹配度值从大到小顺序从热词库里选取一定数量的相应
热词作为推荐热词。

根据用户u与热词l的匹配度Su,l的大小,对热词库里的所有热词按匹配度Su,l值从
大到小做降序排列,从排在最前面的热词开始选取一定数量的热词作为推荐热词,展示给
用户。所述一定数量在实践中可以自由选择,例如选择10个,或者20个或其他等。

在一个优选实施例中,常见的应用商店或者应用市场在搜索首页上都会给热词分
类,因此这里也提供了一种确定每个热词l的类别的方法,即在通过搜索该热词l下载的所
有应用中,同类应用数量最多的类别就设为该热词l的类别。

根据本发明的基于用户已安装应用来推荐热词的方法,通过先确定用户已安装应
用与应用库里的应用的相似度,和用户通过热词下载应用的概率,来确定用户已安装应用
与所述热词的匹配度,再将用户安装的多个应用与相关热词的匹配度综合归纳为用户与相
关热词的匹配度,从而实现了根据用户的兴趣爱好进行个性化推荐热词的目的,大大提高
了用户体验。

图4是本发明的基于用户已安装应用来推荐热词的装置的示意性框图。如图4所
示,本发明的基于用户已安装应用来推荐热词的装置包括:

应用的相似度确定单元,用于确定用户已安装应用与应用库里的应用的相似度;

应用下载概率确定单元,用于确定用户通过搜索热词库里的热词而下载了应用的
概率;

匹配度第一确定单元,用于基于所述相似度和所述概率确定用户已安装应用与所
述热词的匹配度;

匹配度第二确定单元,基于所述用户已安装应用与所述热词的匹配度和用户已安
装应用的数量来确定用户与所述热词的匹配度;

推荐单元,用于按用户与所述热词的匹配度值从大到小顺序从热词库里选取一定
数量的相应热词作为推荐热词。

其中,所包含的应用的相似度确定单元、应用下载概率确定单元、匹配度第一确定
单元、匹配度第二确定单元和推荐单元的具体工作过程可以参见上述对应的方法步骤S1-
S5,这里不再重复描述。

在一个优选实施例中,所述基于用户已安装应用来推荐热词的装置还包括:分类
单元,用于在通过搜索热词l下载的所有应用中,确定同类应用数量最多的类别为该热词l
的类别。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置
的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再重复描述。

根据本发明的基于用户已安装应用来推荐热词的装置,通过先确定用户已安装应
用与应用库里的应用的相似度,和用户通过热词下载应用的概率,来确定用户已安装应用
与所述热词的匹配度,再将用户安装的多个应用与相关热词的匹配度综合归纳为用户与相
关热词的匹配度,从而实现了根据用户的兴趣爱好进行个性化推荐热词的目的,大大提高
了用户体验。

本发明实施例所提供的基于用户已安装应用来推荐热词的方法的计算机程序产
品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前
面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以
存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说
对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计
算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个
人计算机,平板电脑,智能手机,服务器,或者网络设备等)执行本发明各个实施例所述方法
的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM)、随机存取存
储器(RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何
熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵
盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

一种基于用户已安装应用来推荐热词的方法和装置.pdf_第1页
第1页 / 共14页
一种基于用户已安装应用来推荐热词的方法和装置.pdf_第2页
第2页 / 共14页
一种基于用户已安装应用来推荐热词的方法和装置.pdf_第3页
第3页 / 共14页
点击查看更多>>
资源描述

《一种基于用户已安装应用来推荐热词的方法和装置.pdf》由会员分享,可在线阅读,更多相关《一种基于用户已安装应用来推荐热词的方法和装置.pdf(14页珍藏版)》请在专利查询网上搜索。

本发明提供了一种基于用户已安装应用来推荐热词的方法和装置。所述方法包括:确定用户已安装应用与应用库里的应用的相似度;确定用户通过搜索热词库里的热词而下载了应用的概率;基于所述相似度和所述概率确定用户已安装应用与所述热词的匹配度;基于所述用户已安装应用与所述热词的匹配度和用户已安装应用的数量来确定用户与所述热词的匹配度;按用户与所述热词的匹配度值从大到小顺序从热词库里选取一定数量的相应热词作为推荐热。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1