网络信息推荐、建立网络资源索引的方法及系统.pdf

上传人:e1 文档编号:966061 上传时间:2018-03-21 格式:PDF 页数:32 大小:528.98KB
返回 下载 相关 举报
摘要
申请专利号:

CN200910236867.6

申请日:

2009.11.04

公开号:

CN102054003A

公开日:

2011.05.11

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20091104|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

北京搜狗科技发展有限公司

发明人:

高志; 茹立云; 佟子健; 李毅

地址:

100084 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间

优先权:

专利代理机构:

北京集佳知识产权代理有限公司 11227

代理人:

逯长明;王宝筠

PDF下载: PDF下载
内容摘要

本发明公开了网络信息推荐、建立网络资源索引的方法及系统,其中,所述网络信息推荐方法包括:获得用户访问网络资源的资源访问记录;将所述用户的资源访问记录中的网络资源拆分为网络资源访问对,每一网络资源访问对包含所述资源访问记录中的两个网络资源信息;汇集各用户的网络资源对,获得网络资源二维关系;当需要为用户进行推荐时,根据所述网络资源二维关系为用户推荐相关的网络资源。通过本发明,能够扩大用户获得信息的范围,提高信息的利用率,降低了用户获得有用信息的难度。

权利要求书

1: 一种网络信息推荐的方法, 其特征在于, 包括 : 获得用户访问网络资源的资源访问记录 ; 将所述用户的资源访问记录中的网络资源拆分为网络资源访问对, 每一网络资源访问 对包含所述资源访问记录中的两个网络资源信息 ; 汇集各用户的网络资源对, 获得网络资源二维关系 ; 当需要为用户进行推荐时, 根据所述网络资源二维关系为用户推荐相关的网络资源。
2: 根据权利要求 1 所述的方法, 其特征在于, 所述根据所述网络资源二维关系为用户 推荐相关的网络资源包括 : 根据所述网络资源二维关系为用户推荐与当前访问的网络资源 相关的网络资源。
3: 根据权利要求 1 所述的方法, 其特征在于, 所述根据所述网络资源二维关系为用户 推荐相关的网络资源包括 : 根据所述网络资源二维关系获得相关的网络资源集合, 根据所述网络资源集合向用户 推荐网络资源。
4: 根据权利要求 3 所述的方法, 其特征在于, 还包括 : 获得各网络资源对中两网络资源 的相关度 ; 在所述根据所述网络资源二维关系获得相关的网络资源集合之后还包括 : 根据各网络资源对中两网络资源的相关度, 对所述集合中的网络资源进行排序。
5: 根据权利要求 4 所述的方法, 其特征在于, 通过以下方式获得各网络资源对中两网 络资源的相关度 : 将相同的网络资源对进行合并 ; 根据网络资源对的合并次数, 获得各网络资源对中两 网络资源的相关度 ; 和 / 或, 根据网络资源对中两网络资源之间的间隔时间, 获得各网络资源对中两网络资源的相 关度 ; 和 / 或, 通过预置的分类信息为各网络资源生成网络资源特征向量, 利用各网络资源的特征向 量获得各网络资源对中两网络资源的相关度 ; 所述网络资源特征向量用于描述网络资源属 于各类别的置信度。
6: 根据权利要求 4 所述的方法, 其特征在于, 还包括, 通过以下方式对所述相关度进行 修正 : 将相同的网络资源对进行合并 ; 根据网络资源对的合并次数, 对所述相关度进行修 正; 和 / 或, 根据网络资源对中两网络资源之间的间隔时间, 对所述相关度进行修正 ; 和 / 或, 通过预置的分类信息为各网络资源生成网络资源特征向量, 利用各网络资源的特征向 量对所述相关度进行修正 ; 所述网络资源特征向量用于描述网络资源属于各类别的置信 度; 和 / 或, 通过预置的分类信息为各网络资源生成网络资源特征向量, 所述网络资源特征向量用 2 于描述网络资源属于各类别的置信度 ; 根据用户的访问历史获知用户最可能访问的网络资 源; 将所述用户最可能访问的网络资源的特征向量合并, 得到各用户的兴趣向量 ; 利用各 用户的兴趣向量对所述相关度进行修正 ; 所述兴趣向量用于描述用户对各类别的感兴趣程 度。
7: 根据权利要求 3 或 4 所述的方法, 其特征在于, 所述网络资源二维关系为核心索引, 还包括 : 根据辅助索引对所述集合中的网络资源进行排序。
8: 根据权利要求 7 所述的方法, 其特征在于, 所述根据辅助索引对所述集合中的网络 资源进行排序包括 : 通过预置的分类信息为各网络资源生成网络资源特征向量, 所述网络资源特征向量用 于描述网络资源属于各类别的置信度 ; 分别将各所述相关网络资源的特征向量与用户当 前访问的网络资源的特征向量进行内积计算, 并根据内积计算的结果对各网络资源进行排 序; 或者, 通过预置的分类信息为各网络资源生成网络资源特征向量, 所述网络资源特征向量用 于描述网络资源属于各类别的置信度 ; 根据用户的访问历史获知用户最可能访问的网络资 源; 将所述用户最可能访问的网络资源的特征向量合并, 得到各用户的兴趣向量 ; 所述兴 趣向量用于描述用户对各类别的感兴趣程度 ; 分别将各所述相关网络资源的特征向量与该 用户的兴趣向量进行内积计算, 并根据内积计算的结果对各网络资源进行排序。
9: 根据权利要求 1 至 6、 8 任一项所述的方法, 其特征在于, 所述资源访问记录为资源访 问序列。
10: 一种网络信息推荐的系统, 其特征在于, 包括 : 资源访问记录获得单元, 用于获得用户访问网络资源的资源访问记录 ; 网络资源拆分单元, 用于将所述用户的资源访问记录中的网络资源拆分为网络资源访 问对, 每一网络资源访问对包含所述资源访问记录中的两个网络资源信息 ; 网络资源对汇集单元, 用于汇集各用户的网络资源对, 获得网络资源二维关系 ; 网络资源推荐单元, 用于当需要为用户进行推荐时, 根据所述网络资源二维关系为用 户推荐相关的网络资源。
11: 根据权利要求 10 所述的系统, 其特征在于, 所述网络资源推荐单元包括 : 第一网络资源推荐子单元, 用于根据所述网络资源二维关系为用户推荐与当前访问的 网络资源相关的网络资源。
12: 根据权利要求 10 所述的系统, 其特征在于, 所述网络资源推荐单元包括 : 网络资源集合获得子单元, 用于根据所述网络资源二维关系获得与当前访问的网络资 源相关的网络资源集合 ; 第二网络资源推荐子单元, 用于根据所述集合向用户推荐网络资源。
13: 根据权利要求 12 所述的系统, 其特征在于, 还包括 : 网络资源相关度获得单元, 用于获得各网络资源对中两网络资源的相关度 ; 所述网络资源推荐单元还包括 : 第一排序子单元, 用于根据所述网络资源二维关系获得与当前访问的网络资源相关的 3 网络资源集合之后, 根据各网络资源对中两网络资源的相关度, 对所述集合中的网络资源 进行排序。
14: 根据权利要求 13 所述的系统, 其特征在于, 所述网络资源相关度获得单元包括 : 第一网络资源相关度获得子单元, 用于将相同的网络资源对进行合并 ; 根据网络资源 对的合并次数, 为各个网络资源对进行评分, 得到各网络资源对中两网络资源的相关度 ; 和 / 或, 第二网络资源相关度获得子单元, 用于根据网络资源对中两网络资源之间的间隔时 间, 为各个网络资源对进行评分, 得到各网络资源对中两网络资源的相关度 ; 和 / 或, 第三网络资源相关度获得子单元, 用于通过预置的分类信息为各网络资源生成网络资 源特征向量, 利用各网络资源的特征向量获得各网络资源对中两网络资源的相关度 ; 所述 网络资源特征向量用于描述网络资源属于各类别的置信度。
15: 根据权利要求 12 或 13 所述的系统, 其特征在于, 所述网络资源二维关系为核心索 引, 所述网络资源推荐单元还包括 : 第二排序子单元, 用于根据辅助索引对所述集合中的网络资源进行排序。
16: 根据权利要求 15 所述的系统, 其特征在于 : 所述第二排序子单元包括 : 特征向量生成子单元, 用于通过预置的分类信息为各网络资源生成网络资源特征向 量, 所述网络资源特征向量用于描述网络资源属于各类别的置信度 ; 第一计算子单元, 用于 分别将各所述相关网络资源的特征向量与用户当前访问的网络资源的特征向量进行内积 计算, 并根据内积计算的结果对各网络资源进行排序 ; 或者, 所述第二排序子单元包括 : 兴趣向量生成子单元, 用于通过预置的分类信息为各网络资源生成网络资源特征向 量, 所述网络资源特征向量用于描述网络资源属于各类别的置信度 ; 根据用户的访问历史 获知用户最可能访问的网络资源 ; 将所述用户最可能访问的网络资源的特征向量合并, 得 到各用户的兴趣向量 ; 所述兴趣向量用于描述用户对各类别的感兴趣程度 ; 第二计算子单 元, 用于分别将各所述相关网络资源的特征向量与该用户的兴趣向量进行内积计算, 并根 据内积计算的结果对各网络资源进行排序。
17: 根据权利要求 10 所述的系统, 其特征在于, 还包括 : 过滤单元, 用于过滤掉无效的网络资源对, 所述无效的网络资源对包括 : 内容不相关的 网络资源对、 访问时间间隔超过预置阈值的网络资源对或者包含有广告导航页的网络资源 对。
18: 一种建立网络资源索引的方法, 其特征在于, 包括 : 获得用户访问网络资源的资源访问记录 ; 将所述用户的资源访问记录中的网络资源拆分为网络资源访问对, 每一网络资源访问 对包含所述资源访问记录中的两个网络资源信息 ; 汇集各用户的网络资源对, 获得网络资源二维关系, 建立起网络资源索引。
19: 根据权利要求 18 所述的方法, 其特征在于, 还包括 : 获得各网络资源对中两网络资 4 源的相关度, 以便根据所述相关度对所述网络资源进行排序。
20: 根据权利要求 19 所述的方法, 其特征在于, 通过以下方式获得各网络资源对中两 网络资源的相关度 : 将相同的网络资源对进行合并 ; 根据网络资源对的合并次数, 获得各网络资源对中两 网络资源的相关度 ; 和 / 或, 根据网络资源对中两网络资源之间的间隔时间, 获得各网络资源对中两网络资源的相 关度 ; 和 / 或, 通过预置的分类信息为各网络资源生成网络资源特征向量, 利用各网络资源的特征向 量获得各网络资源对中两网络资源的相关度 ; 所述网络资源特征向量用于描述网络资源属 于各类别的置信度。
21: 一种建立网络资源索引的系统, 其特征在于, 包括 : 资源访问记录获得单元, 用于获得用户访问网络资源的资源访问记录 ; 网络资源拆分单元, 用于将所述用户的资源访问记录中的网络资源拆分为网络资源访 问对, 每一网络资源访问对包含所述资源访问记录中的两个网络资源信息 ; 网络资源对汇集单元, 用于汇集各用户的网络资源对, 获得网络资源二维关系, 建立起 网络资源索引。
22: 根据权利要求 21 所述的系统, 其特征在于, 还包括 : 网络资源相关度获得单元, 用于获得各网络资源对中两网络资源的相关度, 以便根据 所述相关度对所述网络资源进行排序。
23: 根据权利要求 22 所述的系统, 其特征在于, 所述网络资源相关度获得单元包括 : 第一网络资源相关度获得子单元, 用于将相同的网络资源对进行合并 ; 根据网络资源 对的合并次数, 获得各网络资源对中两网络资源的相关度 ; 和 / 或, 第二网络资源相关度获得子单元, 用于根据网络资源对中两网络资源之间的间隔时 间, 获得各网络资源对中两网络资源的相关度 ; 和 / 或, 第三网络资源相关度获得子单元, 用于通过预置的分类信息为各网络资源生成网络资 源特征向量, 利用各网络资源的特征向量获得各网络资源对中两网络资源的相关度 ; 所述 网络资源特征向量用于描述网络资源属于各类别的置信度。
24: 根据权利要求 22 所述的系统, 其特征在于, 还包括 : 第一网络资源相关度修正单元, 用于将相同的网络资源对进行合并 ; 根据网络资源对 的合并次数, 对所述相关度进行修正 ; 和 / 或, 第二网络资源相关度修正单元, 用于根据网络资源对中两网络资源之间的间隔时间, 对所述相关度进行修正 ; 和 / 或, 第三网络资源相关度修正单元, 用于通过预置的分类信息为各网络资源生成网络资源 5 特征向量, 利用各网络资源的特征向量对所述相关度进行修正 ; 所述网络资源特征向量用 于描述网络资源属于各类别的置信度 ; 和 / 或, 第四网络资源相关度修正单元, 通过预置的分类信息为各网络资源生成网络资源特征 向量, 所述网络资源特征向量用于描述网络资源属于各类别的置信度 ; 根据用户的访问历 史获知用户最可能访问的网络资源 ; 将所述用户最可能访问的网络资源的特征向量合并, 得到各用户的兴趣向量 ; 利用各用户的兴趣向量对所述相关度进行修正 ; 所述兴趣向量用 于描述用户对各类别的感兴趣程度。
25: 一种网络信息推荐的方法, 其特征在于, 包括 : 获得访问同一网络资源的用户记录 ; 将所述用户记录中的各用户信息拆分为用户对, 每一用户对包含所述用户记录中的两 个用户信息 ; 汇集各个网络资源的用户对, 建立用户二维关系 ; 当需要为用户进行推荐时, 根据所述用户二维关系推荐相关的用户信息。
26: 根据权利要求 25 所述的方法, 其特征在于, 所述根据所述用户二维关系推荐相关 的用户信息包括 : 根据所述用户二维关系推荐与当前访问的用户相关的用户信息。
27: 根据权利要求 25 所述的方法, 其特征在于, 所述根据所述用户二维关系推荐相关 的用户信息包括 : 根据所述用户二维关系获得相关的用户集合, 根据所述集合向用户推荐 相关的用户信息 ; 所述方法还包括 : 获得各用户对中两用户的相关度, 在所述根据所述用户二维关系获 得相关的用户集合之后还包括 : 根据各用户对中两用户的相关度, 对所述集合中的用户进 行排序。
28: 根据权利要求 27 所述的方法, 其特征在于, 所述用户二维关系为核心索引, 还包 括: 根据辅助索引对所述集合中的用户进行排序。
29: 一种网络信息推荐的系统, 其特征在于, 包括 : 用户记录获得单元, 用于获得访问同一网络资源的用户记录 ; 用户拆分单元, 用于将所述用户记录中的各用户信息拆分为用户对, 每一用户对包含 所述用户记录中的两个用户信息 ; 用户对汇集单元, 用于汇集各个网络资源的用户对, 获得用户二维关系 ; 用户信息推荐单元, 用于当需要为用户进行推荐时, 根据所述用户二维关系推荐相关 的用户信息。
30: 根据权利要求 29 所述的系统, 其特征在于, 所述用户信息推荐单元包括 : 第一用户信息推荐子单元, 用于根据所述用户二维关系推荐与当前访问的用户相关的 用户信息。
31: 根据权利要求 29 所述的系统, 其特征在于, 所述用户信息推荐单元包括 : 用户信息 集合生成子单元, 用于根据所述用户二维关系获得相关的用户集合 ; 第二用户信息推荐子 单元, 用于根据所述集合向用户推荐相关的用户信息 ; 6 或者, 所述系统还包括 : 用户相关度获得单元, 用于获得各用户对中两用户的相关度 ; 所述 用户信息推荐单元还包括 : 第一用户排序子单元, 用于根据各用户对中两用户的相关度, 对 所述集合中的用户进行排序。
32: 根据权利要求 31 所述的系统, 其特征在于, 所述用户二维关系为核心索引, 所述用 户信息推荐单元还包括 : 第二用户排序子单元, 用于根据辅助索引对所述集合中的用户进行排序。
33: 一种建立用户索引的方法, 其特征在于, 包括 : 获得访问同一网络资源的用户记录 ; 将所述用户记录中的各用户拆分为用户对, 每一用户对包含所述用户记录中的两个用 户; 汇集各个网络资源的用户对, 获得用户二维关系, 建立起用户索引。
34: 根据权利要求 33 所述的方法, 其特征在于, 还包括 : 获得各用户对中两用户的相关度。
35: 根据权利要求 34 所述的方法, 其特征在于, 通过以下方式获得各用户对中两用户 的相关度 : 将相同的用户对进行合并 ; 根据用户对的合并次数, 为各个用户对进行评分, 得到各用 户对的相关度 ; 和 / 或, 通过预置的分类信息为各网络资源生成网络资源特征向量, 根据用户的访问历史获知 用户最可能访问的网络资源 ; 将所述用户最可能访问的网络资源的特征向量合并, 得到各 用户的兴趣向量 ; 根据所述用户的兴趣向量获得各用户对中两用户的相关度 ; 所述网络资 源特征向量用于描述网络资源属于各类别的置信度 ; 所述兴趣向量用于描述用户对各类别 的感兴趣程度。
36: 一种建立用户索引的系统, 其特征在于, 包括 : 用户记录获得单元, 用于获得访问同一网络资源的用户记录 ; 用户拆分单元, 用于将所述用户记录中的各用户信息拆分为用户对, 每一用户对包含 所述用户记录中的两个用户信息 ; 用户对汇集单元, 用于汇集各个网络资源的用户对, 获得用户二维关系, 建立起用户索 引。
37: 根据权利要求 36 所述的系统, 其特征在于, 还包括 : 用户相关度获得单元, 用于获得各用户对中两用户的相关度, 以便根据所述相关度对 用户进行排序。
38: 根据权利要求 37 所述的系统, 其特征在于, 所述用户相关度获得单元包括 : 第一用户相关度获得子单元, 用于将相同的用户对进行合并 ; 根据用户对的合并次数, 为各个用户对进行评分, 得到各用户对的相关度 ; 和 / 或, 第二用户相关度获得子单元, 用于通过预置的分类信息为各网络资源生成网络资源特 征向量, 根据用户的访问历史获知用户最可能访问的网络资源 ; 将所述用户最可能访问的 7 网络资源的特征向量合并, 得到各用户的兴趣向量 ; 根据所述用户的兴趣向量获得各用户 对中两用户的相关度 ; 所述网络资源特征向量用于描述网络资源属于各类别的置信度 ; 所 述兴趣向量用于描述用户对各类别的感兴趣程度。

说明书


网络信息推荐、 建立网络资源索引的方法及系统

    技术领域 本发明涉及浏览器技术领域, 特别是涉及网络信息推荐、 建立网络资源索引的方 法及系统。
     背景技术 现在网络技术飞速发展, 互联网上的信息量非常大, 因此如何让用户快速找到自 己想要或者适合自己的网络信息则成为技术人员迫切需要解决的技术问题。
     为了解决上述技术问题, 出现了一种网络信息推荐系统 (Recommender system), 该系统是信息过滤系统的一种。 以网页推荐为例, 通常需要预先建立网页索引, 在需要给用 户进行推荐时, 在网页索引中检索出可以推荐的网页。现有技术中的网页索引通常是基于 关键词建立的, 例如, 可以预先提取各个网页中具有代表性的关键词, 然后按照关键词建立 网页索引 ; 当需要进行网页推荐时, 提取当前网页中具有代表性的关键词作为检索词, 然后 在预先建立的索引中检索具有该检索词的网页, 然后将检索到的网页推荐给相关用户。
     但是在基于这种索引方式的网络信息推荐系统下, 对于不包含检索词的网页, 就 无法推荐给用户, 使得用户获得信息的范围比较狭窄, 既限制了信息的利用率, 也增加了用 户获得有用信息的难度。
     发明内容
     本发明提供了网络信息推荐、 建立网络资源索引的方法及系统, 能够提高网络信 息的利用率。
     本发明提供了如下方案 :
     一种网络信息推荐的方法, 包括 :
     获得用户访问网络资源的资源访问记录 ;
     将所述用户的资源访问记录中的网络资源拆分为网络资源访问对, 每一网络资源 访问对包含所述资源访问记录中的两个网络资源信息 ;
     汇集各用户的网络资源对, 获得网络资源二维关系 ;
     当需要为用户进行推荐时, 根据所述网络资源二维关系为用户推荐相关的网络资 源。
     优选的, 所述根据所述网络资源二维关系为用户推荐相关的网络资源包括 : 根据 所述网络资源二维关系为用户推荐与当前访问的网络资源相关的网络资源。
     优选的, 所述根据所述网络资源二维关系为用户推荐相关的网络资源包括 :
     根据所述网络资源二维关系获得相关的网络资源集合, 根据所述网络资源集合向 用户推荐网络资源。
     优选的 : 获得各网络资源对中两网络资源的相关度 ; 在所述根据所述网络资源二 维关系获得相关的网络资源集合之后还包括 :
     根据各网络资源对中两网络资源的相关度, 对所述集合中的网络资源进行排序。优选的, 通过以下方式获得各网络资源对中两网络资源的相关度 :
     将相同的网络资源对进行合并 ; 根据网络资源对的合并次数, 获得各网络资源对 中两网络资源的相关度 ;
     和 / 或,
     根据网络资源对中两网络资源之间的间隔时间, 获得各网络资源对中两网络资源 的相关度 ;
     和 / 或,
     通过预置的分类信息为各网络资源生成网络资源特征向量, 利用各网络资源的特 征向量获得各网络资源对中两网络资源的相关度 ; 所述网络资源特征向量用于描述网络资 源属于各类别的置信度。
     优选的, 通过以下方式对所述相关度进行修正 :
     将相同的网络资源对进行合并 ; 根据网络资源对的合并次数, 对所述相关度进行 修正 ;
     和 / 或,
     根据网络资源对中两网络资源之间的间隔时间, 对所述相关度进行修正 ; 和 / 或,
     通过预置的分类信息为各网络资源生成网络资源特征向量, 利用各网络资源的特 征向量对所述相关度进行修正 ; 所述网络资源特征向量用于描述网络资源属于各类别的置 信度 ;
     和 / 或,
     通过预置的分类信息为各网络资源生成网络资源特征向量, 所述网络资源特征向 量用于描述网络资源属于各类别的置信度 ; 根据用户的访问历史获知用户最可能访问的网 络资源 ; 将所述用户最可能访问的网络资源的特征向量合并, 得到各用户的兴趣向量 ; 利 用各用户的兴趣向量对所述相关度进行修正 ; 所述兴趣向量用于描述用户对各类别的感兴 趣程度。
     优选的, 所述网络资源二维关系为核心索引, 还包括 :
     根据辅助索引对所述集合中的网络资源进行排序。
     优选的, 所述根据辅助索引对所述集合中的网络资源进行排序包括 :
     通过预置的分类信息为各网络资源生成网络资源特征向量, 所述网络资源特征向 量用于描述网络资源属于各类别的置信度 ; 分别将各所述相关网络资源的特征向量与用户 当前访问的网络资源的特征向量进行内积计算, 并根据内积计算的结果对各网络资源进行 排序 ;
     或者,
     通过预置的分类信息为各网络资源生成网络资源特征向量, 所述网络资源特征向 量用于描述网络资源属于各类别的置信度 ; 根据用户的访问历史获知用户最可能访问的网 络资源 ; 将所述用户最可能访问的网络资源的特征向量合并, 得到各用户的兴趣向量 ; 所 述兴趣向量用于描述用户对各类别的感兴趣程度 ; 分别将各所述相关网络资源的特征向量 与该用户的兴趣向量进行内积计算, 并根据内积计算的结果对各网络资源进行排序。
     优选的, 所述资源访问记录为资源访问序列。
     一种网络信息推荐的系统, 包括 :
     资源访问记录获得单元, 用于获得用户访问网络资源的资源访问记录 ;
     网络资源拆分单元, 用于将所述用户的资源访问记录中的网络资源拆分为网络资 源访问对, 每一网络资源访问对包含所述资源访问记录中的两个网络资源信息 ;
     网络资源对汇集单元, 用于汇集各用户的网络资源对, 获得网络资源二维关系 ;
     网络资源推荐单元, 用于当需要为用户进行推荐时, 根据所述网络资源二维关系 为用户推荐相关的网络资源。
     优选的, 所述网络资源推荐单元包括 :
     第一网络资源推荐子单元, 用于根据所述网络资源二维关系为用户推荐与当前访 问的网络资源相关的网络资源。
     优选的, 所述网络资源推荐单元包括 :
     网络资源集合获得子单元, 用于根据所述网络资源二维关系获得与当前访问的网 络资源相关的网络资源集合 ;
     第二网络资源推荐子单元, 用于根据所述集合向用户推荐网络资源。
     优选的, 还包括 : 网络资源相关度获得单元, 用于获得各网络资源对中两网络资源的相关度 ;
     所述网络资源推荐单元还包括 :
     第一排序子单元, 用于根据所述网络资源二维关系获得与当前访问的网络资源相 关的网络资源集合之后, 根据各网络资源对中两网络资源的相关度, 对所述集合中的网络 资源进行排序。
     优选的, 所述网络资源相关度获得单元包括 :
     第一网络资源相关度获得子单元, 用于将相同的网络资源对进行合并 ; 根据网络 资源对的合并次数, 为各个网络资源对进行评分, 得到各网络资源对中两网络资源的相关 度;
     和 / 或,
     第二网络资源相关度获得子单元, 用于根据网络资源对中两网络资源之间的间隔 时间, 为各个网络资源对进行评分, 得到各网络资源对中两网络资源的相关度 ;
     和 / 或,
     第三网络资源相关度获得子单元, 用于通过预置的分类信息为各网络资源生成网 络资源特征向量, 利用各网络资源的特征向量获得各网络资源对中两网络资源的相关度 ; 所述网络资源特征向量用于描述网络资源属于各类别的置信度。
     优选的, 所述网络资源二维关系为核心索引, 所述网络资源推荐单元还包括 :
     第二排序子单元, 用于根据辅助索引对所述集合中的网络资源进行排序。
     优选的 :
     所述第二排序子单元包括 :
     特征向量生成子单元, 用于通过预置的分类信息为各网络资源生成网络资源特征 向量, 所述网络资源特征向量用于描述网络资源属于各类别的置信度 ; 第一计算子单元, 用 于分别将各所述相关网络资源的特征向量与用户当前访问的网络资源的特征向量进行内 积计算, 并根据内积计算的结果对各网络资源进行排序 ;
     或者,
     所述第二排序子单元包括 :
     兴趣向量生成子单元, 用于通过预置的分类信息为各网络资源生成网络资源特征 向量, 所述网络资源特征向量用于描述网络资源属于各类别的置信度 ; 根据用户的访问历 史获知用户最可能访问的网络资源 ; 将所述用户最可能访问的网络资源的特征向量合并, 得到各用户的兴趣向量 ; 所述兴趣向量用于描述用户对各类别的感兴趣程度 ; 第二计算子 单元, 用于分别将各所述相关网络资源的特征向量与该用户的兴趣向量进行内积计算, 并 根据内积计算的结果对各网络资源进行排序。
     优选的, 还包括 :
     过滤单元, 用于过滤掉无效的网络资源对, 所述无效的网络资源对包括 : 内容不相 关的网络资源对、 访问时间间隔超过预置阈值的网络资源对或者包含有广告导航页的网络 资源对。
     一种建立网络资源索引的方法, 包括 :
     获得用户访问网络资源的资源访问记录 ;
     将所述用户的资源访问记录中的网络资源拆分为网络资源访问对, 每一网络资源 访问对包含所述资源访问记录中的两个网络资源信息 ; 汇集各用户的网络资源对, 获得网络资源二维关系, 建立起网络资源索引。
     优选的, 还包括 : 获得各网络资源对中两网络资源的相关度, 以便根据所述相关度 对所述网络资源进行排序。
     优选的, 通过以下方式获得各网络资源对中两网络资源的相关度 :
     将相同的网络资源对进行合并 ; 根据网络资源对的合并次数, 获得各网络资源对 中两网络资源的相关度 ;
     和 / 或,
     根据网络资源对中两网络资源之间的间隔时间, 获得各网络资源对中两网络资源 的相关度 ;
     和 / 或,
     通过预置的分类信息为各网络资源生成网络资源特征向量, 利用各网络资源的特 征向量获得各网络资源对中两网络资源的相关度 ; 所述网络资源特征向量用于描述网络资 源属于各类别的置信度。
     一种建立网络资源索引的系统, 包括 :
     资源访问记录获得单元, 用于获得用户访问网络资源的资源访问记录 ;
     网络资源拆分单元, 用于将所述用户的资源访问记录中的网络资源拆分为网络资 源访问对, 每一网络资源访问对包含所述资源访问记录中的两个网络资源信息 ;
     网络资源对汇集单元, 用于汇集各用户的网络资源对, 获得网络资源二维关系, 建 立起网络资源索引。
     优选的, 还包括 :
     网络资源相关度获得单元, 用于获得各网络资源对中两网络资源的相关度, 以便 根据所述相关度对所述网络资源进行排序。
     优选的, 所述网络资源相关度获得单元包括 :
     第一网络资源相关度获得子单元, 用于将相同的网络资源对进行合并 ; 根据网络 资源对的合并次数, 获得各网络资源对中两网络资源的相关度 ;
     和 / 或,
     第二网络资源相关度获得子单元, 用于根据网络资源对中两网络资源之间的间隔 时间, 获得各网络资源对中两网络资源的相关度 ;
     和 / 或,
     第三网络资源相关度获得子单元, 用于通过预置的分类信息为各网络资源生成网 络资源特征向量, 利用各网络资源的特征向量获得各网络资源对中两网络资源的相关度 ; 所述网络资源特征向量用于描述网络资源属于各类别的置信度。
     优选的, 还包括 :
     第一网络资源相关度修正单元, 用于将相同的网络资源对进行合并 ; 根据网络资 源对的合并次数, 对所述相关度进行修正 ;
     和 / 或,
     第二网络资源相关度修正单元, 用于根据网络资源对中两网络资源之间的间隔时 间, 对所述相关度进行修正 ;
     和 / 或,
     第三网络资源相关度修正单元, 用于通过预置的分类信息为各网络资源生成网络 资源特征向量, 利用各网络资源的特征向量对所述相关度进行修正 ; 所述网络资源特征向 量用于描述网络资源属于各类别的置信度 ;
     和 / 或,
     第四网络资源相关度修正单元, 通过预置的分类信息为各网络资源生成网络资源 特征向量, 所述网络资源特征向量用于描述网络资源属于各类别的置信度 ; 根据用户的访 问历史获知用户最可能访问的网络资源 ; 将所述用户最可能访问的网络资源的特征向量合 并, 得到各用户的兴趣向量 ; 利用各用户的兴趣向量对所述相关度进行修正 ; 所述兴趣向 量用于描述用户对各类别的感兴趣程度。
     一种网络信息推荐的方法, 包括 :
     获得访问同一网络资源的用户记录 ;
     将所述用户记录中的各用户信息拆分为用户对, 每一用户对包含所述用户记录中 的两个用户信息 ;
     汇集各个网络资源的用户对, 建立用户二维关系 ;
     当需要为用户进行推荐时, 根据所述用户二维关系推荐相关的用户信息。
     优选的, 所述根据所述用户二维关系推荐相关的用户信息包括 :
     根据所述用户二维关系推荐与当前访问的用户相关的用户信息。
     优选的, 所述根据所述用户二维关系推荐相关的用户信息包括 : 根据所述用户二 维关系获得相关的用户集合, 根据所述集合向用户推荐相关的用户信息 ;
     所述方法还包括 : 获得各用户对中两用户的相关度, 在所述根据所述用户二维关 系获得相关的用户集合之后还包括 : 根据各用户对中两用户的相关度, 对所述集合中的用 户进行排序。
     优选的, 所述用户二维关系为核心索引, 还包括 :根据辅助索引对所述集合中的用户进行排序。
     一种网络信息推荐的系统, 包括 :
     用户记录获得单元, 用于获得访问同一网络资源的用户记录 ;
     用户拆分单元, 用于将所述用户记录中的各用户信息拆分为用户对, 每一用户对 包含所述用户记录中的两个用户信息 ;
     用户对汇集单元, 用于汇集各个网络资源的用户对, 获得用户二维关系 ;
     用户信息推荐单元, 用于当需要为用户进行推荐时, 根据所述用户二维关系推荐 相关的用户信息。
     优选的, 所述用户信息推荐单元包括 :
     第一用户信息推荐子单元, 用于根据所述用户二维关系推荐与当前访问的用户相 关的用户信息。
     优选的, 所述用户信息推荐单元包括 : 用户信息集合生成子单元, 用于根据所述用 户二维关系获得相关的用户集合 ; 第二用户信息推荐子单元, 用于根据所述集合向用户推 荐相关的用户信息 ;
     或者,
     所述系统还包括 : 用户相关度获得单元, 用于获得各用户对中两用户的相关度 ; 所述用户信息推荐单元还包括 : 第一用户排序子单元, 用于根据各用户对中两用户的相关 度, 对所述集合中的用户进行排序。
     优选的, 所述用户二维关系为核心索引, 所述用户信息推荐单元还包括 :
     第二用户排序子单元, 用于根据辅助索引对所述集合中的用户进行排序。
     一种建立用户索引的方法, 包括 :
     获得访问同一网络资源的用户记录 ;
     将所述用户记录中的各用户拆分为用户对, 每一用户对包含所述用户记录中的两 个用户 ;
     汇集各个网络资源的用户对, 获得用户二维关系, 建立起用户索引。
     优选的, 还包括 :
     获得各用户对中两用户的相关度。
     优选的, 通过以下方式获得各用户对中两用户的相关度 :
     将相同的用户对进行合并 ; 根据用户对的合并次数, 为各个用户对进行评分, 得到 各用户对的相关度 ;
     和 / 或,
     通过预置的分类信息为各网络资源生成网络资源特征向量, 根据用户的访问历史 获知用户最可能访问的网络资源 ; 将所述用户最可能访问的网络资源的特征向量合并, 得 到各用户的兴趣向量 ; 根据所述用户的兴趣向量获得各用户对中两用户的相关度 ; 所述网 络资源特征向量用于描述网络资源属于各类别的置信度 ; 所述兴趣向量用于描述用户对各 类别的感兴趣程度。
     一种建立用户索引的系统, 包括 :
     用户记录获得单元, 用于获得访问同一网络资源的用户记录 ;
     用户拆分单元, 用于将所述用户记录中的各用户信息拆分为用户对, 每一用户对包含所述用户记录中的两个用户信息 ;
     用户对汇集单元, 用于汇集各个网络资源的用户对, 获得用户二维关系, 建立起用 户索引。
     优选的, 还包括 :
     用户相关度获得单元, 用于获得各用户对中两用户的相关度, 以便根据所述相关 度对用户进行排序。
     优选的, 所述用户相关度获得单元包括 :
     第一用户相关度获得子单元, 用于将相同的用户对进行合并 ; 根据用户对的合并 次数, 为各个用户对进行评分, 得到各用户对的相关度 ;
     和 / 或,
     第二用户相关度获得子单元, 用于通过预置的分类信息为各网络资源生成网络资 源特征向量, 根据用户的访问历史获知用户最可能访问的网络资源 ; 将所述用户最可能访 问的网络资源的特征向量合并, 得到各用户的兴趣向量 ; 根据所述用户的兴趣向量获得各 用户对中两用户的相关度 ; 所述网络资源特征向量用于描述网络资源属于各类别的置信 度; 所述兴趣向量用于描述用户对各类别的感兴趣程度。 根据本发明提供的具体实施例, 本发明公开了以下技术效果 :
     本发明将用户的访问序列拆分为网络资源对 ; 获得用户访问网络资源的资源访问 记录 ; 将所述用户的资源访问记录中的网络资源拆分为网络资源访问对, 每一网络资源访 问对包含所述资源访问记录中的两个网络资源信息 ; 汇集各用户的网络资源对, 获得网络 资源二维关系 ; 当需要为用户进行推荐时, 根据所述网络资源二维关系为用户推荐相关的 网络资源。由于可以基于所有用户的访问序列建立网络资源二维关系, 而众多用户的访问 行为通常可以遍及全网, 因此, 不会局限在特定数据集中, 而是可以在全网范围内建立二维 的网络资源索引, 因此, 可以便于在全网范围内进行相关检索。 如果推荐系统中应用本发明 实施例所建立的二维索引结构, 则进行信息推荐时, 可以在全网范围内向用户进行推荐, 因 此, 能够扩大用户获得信息的范围, 提高信息的利用率, 降低了用户获得有用信息的难度。
     另外, 还可以通过生成网络资源的特征向量及用户的兴趣向量, 来建立辅助索引, 以便于优化检索结果, 还可以对二维网络资源索引进行修正。
     附图说明
     图 1 是本发明实施例提供的建立网络信息索引方法的流程图 ;
     图 2 是本发明实施例提供的网络信息推荐方法的流程图 ;
     图 3 是本发明实施例提供的建立用户索引方法的流程图 ;
     图 4 是本发明实施例提供的另一网络信息推荐方法的流程图 ;
     图 5 是本发明实施例提供的网络信息推荐系统的示意图 ;
     图 6 是本发明实施例提供的另一网络信息推荐系统的示意图 ;
     图 7 是本发明实施例提供的建立网络信息索引系统的示意图 ;
     图 8 是本发明实施例提供的建立用户索引系统的示意图。具体实施方式
     为使本发明的上述目的、 特征和优点能够更加明显易懂, 下面结合附图和具体实 施方式对本发明作进一步详细的说明。
     实施例一、 为了扩大用户获得信息的范围, 提高信息的利用率, 在该实施例中, 首 先提供了一种建立网络资源索引的方法, 参见图 1, 本发明实施例提供的建立网络资源索引 的方法包括以下步骤 :
     S101 : 获得用户访问网络资源的资源访问记录 ;
     其中, 本发明实施例中提到的网络资源可以一个网页, 也可以是网络中的一个视 频、 音频或图片等等, 只要是互联网上能够展现给用户的信息, 都属于本发明限定的网络资 源范畴。所述网页就是通常在网页浏览器 (IE 等 ) 中打开的网页, 其内容可能包括视频、 音 频、 图片、 文字、 flash 等多种元素 ; 同时, 所述网络资源也可以是不依附于网页而独立存在 的视频、 音频、 图片、 文字、 flash 等。
     首先需要说明的是, 本发明实施例可以由浏览器的服务器来完成建立网络资源索 引的过程。由于, 用户通常是通过浏览器访问网络资源, 因此, 浏览器能够记录大多数用户 的访问日志, 包括用户通过浏览器浏览所有网络资源的 URL、 访问时间、 停留时间等等。 S102 : 将所述用户的资源访问记录中的网络资源拆分为网络资源访问对, 每一网 络资源访问对包含所述资源访问记录中的两个网络资源信息 ;
     所述资源访问记录中记录了用户访问过的网络资源集合, 将该集合中的网络资源 两两组成网络资源对即可。
     由于用户在访问网络资源时, 会有一定的时序关系, 浏览器能够记录这种时序关 系 ( 根据访问时间 ), 因此可以产生访问序列, 该访问序列中的各网络资源不一定具有链接 关系, 但都体现着用户的兴趣, 彼此之间通过用户的兴趣产生联系, 因此, 在本发明实施例 中, 所述资源访问记录可以是资源访问序列, 拆分网络资源对时, 可以依据资源访问序列进 行拆分。例如, 用户 A 依次访问了网络资源 1、 网络资源 2、 网络资源 3、 网络资源 4, 则可以 将该用户的访问序列拆分为 < 网络资源 1, 网络资源 2>、 < 网络资源 2, 网络资源 3>、 < 网络 资源 1, 网络资源 3>、 < 网络资源 2, 网络资源 4> 等等。当然, 在根据资源访问序列进行拆分 时, 不一定是序列中的每两个网络资源都拆分成网络资源对, 例如, 如果两个网络资源之间 的时间间隔很长, 则可以认为其不具有明显的相关性, 因此可以把这种网络资源对过滤掉。
     需要说明的是, 资源访问记录中的各网络资源不一定具有链接关系是指, 用户不 一定是在访问网络资源 1( 比如是网页 A) 时, 通过在网页 A 中点击某链接的方式来访问网 络资源 2, 而是可以各种访问方式都可以。例如, 用户可以首先访问网络资源 1, 然后在地址 栏中输入网络资源 2 的 URL, 来访问网络资源 2 ; 或者, 首先访问网络资源 1, 然后新建标签 页来访问网络资源 2 等等。也就是说, 在本发明实施例中, 用户所有的访问行为都会被记录 下来, 用于建立索引结构。
     当然, 也可以根据实际情况需要, 将用于建立网络资源索引的访问序列限定为内 部各网络资源具有链接关系的访问序列。换而言之, 就是只收集那些内部各网络资源之间 具有链接关系的访问序列, 利用这些访问序列建立网络资源索引。
     S103 : 汇集各用户的网络资源对, 获得网络资源二维关系, 建立起网络资源索引。
     可以按照用户的 ID 将各用户拆分后产生的网络资源对进行聚类, 聚类的目的就
     是将所有用户的网络资源对汇集在一起, 可选的, 还将相同的网络资源对进行合并。例如, 用户 A 和用户 B 的访问序列拆分后都包括 < 网络资源 1, 网络资源 2>, 则可以合并, 这样, 不 会出现重复的网络资源对。
     其中, 所述网络资源二维关系就是指网络资源两两之间的关系, 所述二维中的一 维是网页, 另一维也是网页, 因此, 相当于建立了网络资源相关矩阵, 通过该矩阵来记录网 络资源的相关性。同时, 通过该网络资源二维关系就可以建立起网络资源索引。
     按照实施例一的方法建立网络资源二维关系时, 两个网络资源之间的相关性是非 有即无的关系, 因此, 在矩阵中, 可以用 “1” 表示两个网络资源之间具有相关性, 用 “0” 表示 两个网络资源之间不相关。如果在推荐系统中使用该网络资源二维关系, 则推荐的各网络 资源之间将是无差别的。
     但实际上不同的网络资源之间的相关性有强弱之分, 因此, 还可以对网络资源二 维关系中的各网络资源对进行评分, 获得网络资源对中两网络资源之间的相关度, 这样, 在 推荐系统中应用该二维关系时, 就可以根据网络资源对中两网络资源之间的相关度进行排 序, 将分数高的进行优先推荐。
     具体在获得网络资源对中两网络资源之间的相关度时, 可以有多种方法, 下面分 别进行介绍 :
     方法 1 : 以网络资源对的合并次数为依据获得网络资源对中两网络资源之间的相 关度。 即可以将相同的网络资源对进行合并, 然后根据网络资源对的合并次数, 为各个网络 资源对进行评分, 得到各网络资源对中两网络资源的相关度。 具体而言, 可以网络资源对进 行汇集的过程中, 将相同的网络资源对进行合并, 记录合并网络资源对的次数, 发生合并的 次数越多, 则证明该网络资源对之间的相关性就越大。
     例如, 在网络资源二维关系中, 网络资源 1 分别与网络资源 2 和网络资源 3 相关, 有 100 个用户的访问序列中拆分出了 < 网络资源 1, 网络资源 2>, 有 10 个用户的访问序列 中拆分出了 < 网络资源 1, 网络资源 3>, 则 < 网络资源 1, 网络资源 2> 的分数将比 < 网络资 源 1, 网络资源 3> 的分数高, 当某用户正在访问网络资源 1 时, 如果需要向用户推荐其他的 网络资源, 则可以优先推荐网络资源 2, 或者将网络资源 2 排在网络资源 3 之前推荐给用户。
     方法 2 : 可以根据网络资源对中两网络资源之间的间隔时间, 为各个网络资源对 进行评分, 得到各网络资源对中两网络资源的相关度。由于访问日志中能够记录访问时间 信息, 因此, 同一用户的访问记录中的各网络资源两两之间的间隔时间是可以获知的, 由此 也可以获知网络资源对中两网络资源之间的间隔时间。 如果多个用户的资源访问记录中都 拆分出了同样的网络资源对, 则可以取时间间隔的平均值, 然后据此确定各网络资源对的 相关度。
     方法 3 : 通过预置的分类信息为各网络资源生成网络资源特征向量, 利用各网络 资源的特征向量获得各网络资源对中两网络资源的相关度 ; 所述网络资源特征向量用于描 述网络资源属于各类别的置信度。该方法主要从网页的内容角度, 建立网络资源之间的相 关度。关于网络资源特征向量, 后文中会有更加详细的描述。
     当然, 也可以将上述各种方法相结合, 考虑多方面因素来获得网络资源之间的相 关度, 这样便于提高相关度的有效性及准确性。
     此外, 在获得到网络资源对中两网络资源之间的相关度之后, 还可以对该相关度进行修正。具体进行修正时, 可以采用以下方法 :
     方法 4 : 将相同的网络资源对进行合并 ; 根据网络资源对的合并次数, 对所述相关 度进行修正 ;
     方法 5 : 根据网络资源对中两网络资源之间的间隔时间, 对所述相关度进行修正 ;
     方法 6 : 通过预置的分类信息为各网络资源生成网络资源特征向量, 利用各网络 资源的特征向量对所述相关度进行修正 ; 所述网络资源特征向量用于描述网络资源属于各 类别的置信度 ;
     方法 7 : 通过预置的分类信息为各网络资源生成网络资源特征向量, 所述网络资 源特征向量用于描述网络资源属于各类别的置信度 ; 根据用户的访问历史获知用户最可能 访问的网络资源 ; 将所述用户最可能访问的网络资源的特征向量合并, 得到各用户的兴趣 向量 ; 利用各用户的兴趣向量对所述相关度进行修正 ; 所述兴趣向量用于描述用户对各类 别的感兴趣程度。
     上述获得相关度的方法可以与修正方法配合使用, 保证获得相关度与修正相关度 使用的参数不同即可, 例如, 如果使用方法 1 获得相关度, 则可以利用方法 5 和 / 或方法 6 对相关度进行修正 ; 如果使用方法 2 获得相关度, 则可以利用方法 4 和 / 或方法 6 对相关度 进行修正 ; 如果使用方法 1 和方法 2 获得相关度, 则可以使用方法 6 对相关度进行修正, 等 等。关于使用网络资源特征向量进行修正的具体方法, 后文会有详细地介绍。
     此外, 在对相关度进行修正时, 还可以考虑用户的因素。具体的, 可以根据用户的 访问历史获知用户最可能访问的网络资源 ; 将所述用户最可能访问的网络资源的特征向量 合并, 得到各用户的兴趣向量 ; 利用各用户的兴趣向量对所述相关度进行修正 ; 所述兴趣 向量用于描述用户对各类别的感兴趣程度。使用上述任意种方法获得相关度时, 都可以使 用用户的兴趣向量对相关度进行修正。关于用户的兴趣向量及其修正方法, 后文中会有更 加详细的描述。
     实施例二、 当需要检索与某网络资源相关的网络资源时, 利用实施例一建立的网 络资源二维关系中进行查找即可。 例如, 在推荐系统中, 本发明实施例二还提供了一种网络 信息推荐的方法, 参见图 2, 该方法包括 :
     S201 : 获得用户访问网络资源的资源访问记录 ;
     S202 : 将所述用户的资源访问记录中的网络资源拆分为网络资源访问对, 每一网 络资源访问对包含所述资源访问记录中的两个网络资源信息 ;
     S203 : 汇集各用户的网络资源对, 获得网络资源二维关系 ;
     S204 : 当需要为用户进行推荐时, 根据所述网络资源二维关系为用户推荐相关的 网络资源。
     例如, 假设当前用户正在访问网络资源 1, 此时, 就可以在网络资源二维关系中查 找, 假设发现网络资源 1 分别与网络资源 2 和网络资源 3 相关, 则可以将网络资源 2 和网络 资源 3 推荐给该用户。
     其中, 所述相关的网络资源可以是 : 与用户当前访问的网络资源相关的网络资源。 具体在根据所述网络资源二维关系推荐与当前访问的网络资源相关的网络资源时, 可以首 先根据所述网络资源二维关系获得与当前访问的网络资源相关的网络资源集合, 根据所述 集合向用户推荐相关的网络资源。如果建立的网络资源二维关系中, 包括各网络资源对中两网络资源的相关度信 息, 则在在所述根据所述网络资源二维关系获得相关的网络资源集合之后, 还可以根据各 网络资源对中两网络资源的相关度, 对所述集合中的网络资源进行排序。具体获取所述相 关度的方法可以参见实施例一中的具体描述。
     可见, 在本发明实施例中, 假设了访问序列中网络资源之间的传递性, 如果两个网 络资源出现在同一用户的访问序列中, 则意味着这两个网络资源具有某种程度上的相关 性, 由此, 建立起网络资源二维关系, 用于对网络资源进行检索。由于可以基于所有用户的 访问序列建立网络资源二维关系, 而众多用户的访问行为通常可以遍及全网, 因此, 不会局 限在特定数据集中, 而是可以在全网范围内建立二维的网络资源索引, 因此, 可以便于在全 网范围内进行相关检索, 有利于扩大用户获得信息的范围, 提高信息的利用率。
     需要说明的是, 由于随着用户访问行为的发生, 用户的访问历史是实时更新的, 因 此, 上述建立网络资源索引的过程可以实时进行的, 当然也可以是定期更新。
     另外需要说明的是, 用户可能会由于误操作等原因访问了广告导航页, 但是在用 户的访问日志中, 仍然会记载该广告导航页, 而本发明实施例是根据用户的访问日志获得 网络资源对的, 因此, 该广告导航页页会出现在网络资源对中, 进行推荐时, 可能会将该广 告导航页推荐给用户, 但是实际上这种网络资源通常是不应该向用户推荐的。 因此, 为了避 免这种情况的出现, 在本发明实施例中, 还可以对网络资源对进行过滤, 过滤掉无效的网络 资源对, 这些无效的网络资源对包括包含有广告导航页的网络资源对。
     此外, 所述无效的网络资源对还可以包括内容不相关的网络资源对, 以及访问时 间间隔超过预置阈值的网络资源对, 等等。
     其中, 为了便于进行网络资源对的过滤, 可以根据在拆分访问序列获得网络资源 对时, 将网络资源的一些信息作为网络资源对的属性进行保存。 这些信息包括访问时间、 停 留时间等等。 这样, 由于如果用户不小心打开了广告导航页, 则通常在该网页上的停留时间 会非常短, 因此, 根据停留时间可以判断是否为广告导航页, 当然还可以根据经验建立广告 导航页的黑名单, 根据黑名单对广告导航页进行过滤。 同时, 还可以根据各网络资源的访问 时间, 来计算网络资源之间的访问时间间隔。
     由于矩阵通过使用二维数组表示, 二维数组的大小与使用的存储器空间成正比, 如果多数的元素没有数据, 则会造成存储器空间的浪费, 为此, 可以设计稀疏矩阵的阵列储 存方式, 利用较少的存储器空间储存完整的矩阵数据。即, 假设二维数组 Amn 中有 N 个非零 元素, 若 N << m*n, 则称 A 为稀疏矩阵。
     在本发明实施例中, 由于互联网中网络资源的数目非常庞大, 每个用户的访问序 列仅是其中非常小的一部分, 具有相关性的网络资源相对于所有的网络资源也是非常小 的, 因此, 也可以采用稀疏矩阵的方式存储网络资源对, 以节省存储空间。
     由以上所述可见, 本发明实施例建立了网络资源的二维索引结构, 通过该索引结 构能够在全网范围内进行网络资源的推荐。
     以上所述建立了网络资源的二维索引结构, 为了更好地实现网络资源的索引, 本 发明实施例可以将上述二维索引结构作为核心索引, 并同时建立网络资源的辅助索引, 根 据辅助索引对所述集合中的网络资源进行排序。具体建立辅助索引的方法可以有多种, 下 面分别进行详细地描述。( 一 ) 可以通过生成网络资源的特征向量建立辅助索引, 具体的, 可以通过预置的 分类信息为各网络资源生成网络资源特征向量, 所述网络资源特征向量用于描述网络资源 属于各类别的置信度 ; 分别将各所述相关网络资源的特征向量与用户当前访问的网络资源 的特征向量进行内积计算, 并根据内积计算的结果对各网络资源进行排序。
     也就是说, 在建立起网络资源的二维索引结构的基础上, 还可以针对网络资源自 身的特性建立一维索引, 这样, 就可以在针对二维索引给出检索结果之后, 再利用一维索引 进行筛选、 过滤、 排序等, 以便优化检索结果。
     为了生成网络资源的特征向量, 首先可以对网络知识进行分类, 例如可以分为体 育类、 财经类等等, 然后计算每个网络资源属于某个类别的置信度, 为各网络资源生成网络 资源特征向量, 即, 网络资源特征向量用于描述网络资源属于各类别的置信度。 一个网络资 源的特征向量可以是一个 N 维的数组, N 表示总的分类数目, 数组的每一维对应着该网络资 源属于一个分类的置信度。例如, 向量空间为 < 新闻类, 体育类, 财经类 ......>, 则某网络 资源的特征向量可以为 <0.85, 0.1, 0.05......>, 这就代表该网络资源属于新闻类的置信 度为 0.85, 属于体育类的置信度为 0.1, 属于财经类的置信度为 0.05, 等等。
     实际应用中, 对网络知识的分类可能会很细, 例如, 可能并不会笼统地分为体育 类、 新闻类等, 而是分为 NBA、 足球、 体彩等等, 这就使得特征向量的维度非常大, 如果对于每 一个网络资源, 都分别计算属于各个类别的置信度, 则工作量会非常大, 对于系统的计算及 存储性能都有较高的要求。
     因此, 为了便于生成网络资源的特征向量, 在本发明实施例中, 可以首先将网络知 识分成一定数目 ( 例如 40 个 ) 的大类, 再将每个大类进行细分, 称为一定数目 ( 例如 400 个 ) 的小类, 这样, 就相当于将网络知识分成了 40 个一级分类, 400 个二级分类, 在生成网络 资源特征向量时, 可以首先计算网络资源属于各一级分类的置信度, 如果在某一级分类下 的置信度较高, 则分别计算属于该一级分类下各二级分类的置信度 ; 否则, 如果在某一级分 类下的置信度非常低甚至为 0, 则不再计算属于该一级分类下各二级分类的置信度, 这样可 以大大降低计算的工作量。
     需要说明的是, 本领域技术人员可以采用现有贝叶斯的方法计算网络资源在某类 别下的置信度, 这里不再赘述。
     生成网络资源的特征向量之后, 可以有助于进行优化检索结果。 例如, 当推荐网页 时, 可以首先使用所述二维索引结构检索出与当前网页相关的所有网页, 然后再利用网页 的特征向量对网页进行排序, 这样就可以相关度更高的网页排在更加靠前的位置推荐给用 户。 具体的, 可以首先从数据库中取出用户当前浏览的网页的特征向量, 以及与该网页相关 的各网页的特征向量, 然后用所述与该网页相关的各网页的特征向量分别于当前浏览的网 页的特征向量做内积, 所得的值越大, 则证明网页的相关度越高。
     当然, 在获得到网络资源相关度的情况下, 也可以首先使用所述二维索引结构检 索出与当前网页相关的所有网页, 利用网页对中两网页的相关度进行排序, 然后再利用网 页的特征向量对网页进行重新排序。
     此外, 生成的网络资源的特征向量也可以用于修正已经建立的二维索引结构, 即 可以结合各网络资源的特征向量及网络资源对的合并次数, 为各个网络资源对进行评分, 得到各网络资源对的相关度。 因为网络资源对之间的相关度不仅与同时被用户访问的次数有关, 还与网络资源自身的特征有关。 因此, 可以在根据同时被用户访问的次数计算网络资 源对置信度时, 用两个网络资源的特征向量做内积, 用所得结果作为置信度的权重, 如果所 得结果非常低或者为 0, 则可以将该网络资源对视为无效而过滤掉。
     下面对特征向量的内积进行简单的介绍。假设有特征向量 , 则这两个特征向量内积为 a1*b1+a2*b2+a3*b3, 所得结果为一个标量, 该标量值越 大, 则证明两个特征向量的相关度越高 ; 体现在实际应用中, 如果两个网络资源的特征向量 做内积的值很大, 则如果用户对其中一个网络资源感兴趣, 则对另一个网络资源也敢兴趣 的概率较高。
     ( 二 ) 可以将用户的因素考虑进来, 统计用户的行为特征, 生成用户的兴趣向量, 将用户的兴趣向量也作为一种辅助索引, 以便于实现个性化检索, 从符合用户个性化需求 角度优化检索结果。
     具体而言, 可以在生成了所述网络资源特征向量的基础上, 根据用户的访问历史 获知用户最可能访问的网络资源 ; 将所述用户最可能访问的网络资源的特征向量合并, 得 到各用户的兴趣向量 ; 所述兴趣向量用于描述用户对各类别的感兴趣程度 ; 分别将各所述 相关网络资源的特征向量与该用户的兴趣向量进行内积计算, 并根据内积计算的结果对各 网络资源进行排序。
     在生成用户的兴趣向量时, 可以利用 ( 一 ) 中计算得到的网络资源的特征向量。 具 体的, 可以统计用户的访问历史, 利用贝叶斯方法计算用户最可能访问的网络资源, 然后将 这些网络资源的特征向量合并, 即可将合并后的结果作为该用户的兴趣向量。
     例如, 假设计算出用户最可能访问的网络资源包括网络资源 1 和网络资源 2, 其中 网络资源 1 的特征向量为 , 网络资源 2 的特征向量为 , 则将特征向 量 合并, 就可以得到该用户的兴趣向量。其中, 具体在合并时, 可以直接采用向量相加的方式, 或者根据用户的感兴趣程度为各网络资源赋予权重, 然后 根据权重将特征向量相加, 得到用户的兴趣向量。
     需要说明的是, 由于用户的兴趣向量是由网络资源的特征向量合并而成的, 因此, 用户的兴趣向量与网络资源的特征向量具有相同的向量空间, 因此, 可以方便所述兴趣向 量与特征向量之间进行内积运算。
     生成用户的兴趣向量之后, 可以有助于进行优化检索结果。例如, 当推荐网页时, 可以首先使用所述二维索引结构检索出与当前网页相关的所有网页, 此时, 对所有用户推 荐的结果都是相同的。例如, 用户 A 和用户 B 都在浏览网页 1, 则向用户 A 和用户 B 推荐的 都是与网页 1 相关的网络资源, 展现给用户的推荐结果是相同的。此时就可以使用用户的 兴趣向量, 针对不同的用户对推荐结果进行重新排序, 实现对不同用户的个性化推荐。
     具体的, 当向用户进行网页推荐时, 还需要与网页的特征向量相结合, 可以包括以 下步骤 :
     步骤 1 : 从二维索引结构中找出与当前网页相关的相关网页集 ;
     步骤 2 : 获得相关网页集中各网页的特征向量以及用户的兴趣向量 ; 具体在获得 网页的特征向量及用户的兴趣向量时, 可以是从预先生成的数据库中查询得到, 也可以在 线计算得到 ;
     步骤 3 : 将相关网页集中各网页的特征向量分别与用户的兴趣向量进行内积计算, 所得结果越高, 则证明网页与用户兴趣的相关度越高 ;
     步骤 4 : 利用所得结果, 对相关网页集中的各网页进行排序, 生成展现结果。
     当然, 在获得到网络资源相关度的情况下, 也可以首先使用所述二维索引结构检 索出与当前网页相关的所有网页, 利用网页对中两网页的相关度进行排序, 然后再利用用 户的兴趣向量对网页进行重新排序。
     这样, 利用用户的兴趣向量及网络资源的特征向量, 就可以实现针对不同用户的 个性化推荐。例如, 三个用户都在浏览某条关于巴西足球的消息, 分别为足球教练、 球迷及 商家, 则这三个用户对这条消息的关注点可能是不同的, 因此向这三个用户推荐的网络资 源也应有所不同。这样, 利用用户的兴趣向量, 推荐的结果就会具有个性化的特征。例如, 向教练推荐时, 某对该赛事进行分析的网页链接会排在靠前的位置 ; 向球迷推荐时, 会更多 地推荐其他赛事的链接 ; 而对于商家, 可能会将关于商机的网络资源推荐给该用户。
     需要说明的是, 由于二维索引结构中的网络资源对是从用户的访问序列中拆分出 来的, 以此作为网络资源对中的两个网络资源具有一定的相关性的依据, 但是从不同用户 的访问序列中拆分出来的网页资源对, 对网络资源相关性的贡献可能是不同的。 因此, 用户 的因素也可能会影响到二维索引结构的建立。例如, 用户 A 的访问序列中拆分出了 < 网络 资源 1, 网络资源 2>, 并且用户对该网络资源 1 及网络资源 2 都感兴趣 ; 而用户 B 的访问序 列中也拆分出了 < 网络资源 1, 网络资源 2>, 但是其中的网络资源 1 与用户兴趣的相关度非 常低 ; 此时, 用户 A 和用户 B 的访问序列中都拆分出了 < 网络资源 1, 网络资源 2>, 但是用户 A 的置信度可能高于用户 2 的置信度。 为此, 与网络资源的特征向量类似, 用户的兴趣向量也可以用于修正二维索引结 构, 即, 可以结合各用户的兴趣向量及网络资源对的合并次数, 为各个网络资源对进行评 分, 得到各网络资源对的相关度。
     具体在利用用户的兴趣向量对相关度进行修正时, 可以首先将网络资源对中的两 个网络资源的特征向量相加, 然后再将相加后得到的特征向量与用户的兴趣向量做内积, 再根据内积所得的结果为各用户赋予相应的权重, 根据用户在该网络资源对下的权重进行 合并。这样, 相当于使得各用户对网络资源相关性的贡献是不同的。通俗地讲, 用户 A 的访 问序列中如果拆分出了 < 网络资源 1, 网络资源 2>, 则相当于用户 A 为该网络资源对投了 票; 在不利用用户的兴趣向量进行修正的情况下, 则直接记录为用户 A 为该网络资源对投 票一次, 其他用户也是同样, 每拆分出一次, 都相当于投票一次。而如果利用用户的兴趣向 量进行修正, 则用户拆分出一次该网络资源对时, 则不一定会被记为一票, 可能是多于或少 于一票。
     也可以直接利用用户的兴趣向量来获得网络资源之间的相关度, 具体的, 同样可 以首先将网络资源对中的两个网络资源的特征向量相加, 再将相加后得到的特征向量与用 户的兴趣向量做内积, 然后可以直接将该内积的结果作为所述相关度。
     此外, 生成二维索引结构时, 还可以首先将用户的兴趣向量与访问序列中各网络 资源的特征向量进行内积, 将所得结果非常低的网络资源赋予较低的权重, 计算网络资源 对的相关度时将该权重作为一个因素进行计算 ; 另外, 还可以直接将结果为 0 的网络资源 其从访问序列中删除。
     上述各实施例介绍了如何建立网络资源的索引结构, 在实际应用中, 由于需要在
     全网范围内进行计算, 因此存储量及运算量都非常大。 为了解决该问题, 本发明实施例可以 采用集群的方法来实现。
     具体的, 可以将系统分为以下几个集群 :
     索引集群 : 负责存储索引信息, 计算检索结果, 定期的网络资源对生成计算 ;
     Cache 集群 : 负责结果收集计算, 再排序计算, 网络资源显示计算及缓存 ;
     增量加载集群 : 用于实时处理用户的访问请求, 对新增的访问序列进行网络资源 对生成计算, 插入索引集群 ;
     网页存储集群 : 用于存储 doc 信息。
     本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以 通过程序来指令相关的硬件来完成, 所述的程序可以存储于一计算机可读取存储介质中, 该程序在执行时, 包括如下步骤 : 获得用户访问网络资源的资源访问记录 ; 将所述用户的 资源访问记录中的网络资源拆分为网络资源访问对, 每一网络资源访问对包含所述资源访 问记录中的两个网络资源信息 ; 汇集各用户的网络资源对, 获得网络资源二维关系 ; 当需 要为用户进行推荐时, 根据所述网络资源二维关系为用户推荐相关的网络资源。所述的存 储介质, 如: ROM/RAM、 磁碟、 光盘等。
     实施例三、 前文所述建立了网络资源的二维索引结构, 因此, 可以利用该二维索引 结构向用户推荐网络资源。 在本发明的实施例三中, 还可以建立用户之间的二维索引结构, 并利用该索引结构向用户推荐其他的相关用户, 这样, 可以方便用户交友、 扩展圈子等。
     参见图 3, 本发明实施例提供的建立用户索引的方法包括以下步骤 :
     S301 : 获得访问同一网络资源的用户记录 ;
     S302 : 将所述用户记录中的各用户拆分为用户对, 每一用户对包含所述用户记录 中的两个用户 ;
     S303 : 汇集各个网络资源的用户对, 获得用户二维关系, 建立起用户索引。
     相应的, 本发明实施例还提供了另一种网络信息推荐的方法, 参见图 4, 该方法包 括以下步骤 :
     S401 : 获得访问同一网络资源的用户记录 ;
     S402 : 将所述用户记录中的各用户拆分为用户对, 每一用户对包含所述用户记录 中的两个用户 ;
     S403 : 汇集各个网络资源的用户对, 获得用户二维关系。
     S404 : 当需要为用户进行推荐时, 根据所述用户二维关系推荐相关的用户信息。
     例如, 假设用户 A 正在浏览用户 B 发表在博客上的文章, 则证明用户 A 可能对于用 户 B 相关的其他用户感兴趣, 此时就可以根据用户二维关系, 向用户 A 推荐与用户 B 相关的 其他用户。
     其中, 所述相关的用户信息可以是与当前用户相关的用户信息, 或者与当前被访 问的用户相关的用户信息。 具体在根据所述用户二维关系推荐与当前访问的用户相关的用 户信息时, 可以首先根据所述用户二维关系获得与当前访问的用户相关的用户集合, 然后 根据所述集合向用户推荐相关的用户信息。
     与实施例一相似, 该实施例中, 也可以获得各用户对中两用户的相关度, 所述根据 所述用户二维关系获得与当前访问的用户相关的用户集合之后, 还可以根据各用户对中两用户的相关度, 对所述集合中的用户进行排序。
     具体的获得用户对中两用户的相关度的方法可以包括 :
     将相同的用户对进行合并 ; 根据用户对的合并次数, 为各个用户对进行评分, 得到 各用户对的相关度 ;
     或者, 通过预置的分类信息为各网络资源生成网络资源特征向量, 根据用户的访 问历史获知用户最可能访问的网络资源 ; 将所述用户最可能访问的网络资源的特征向量合 并, 得到各用户的兴趣向量 ; 根据所述用户的兴趣向量获得各用户对中两用户的相关度 ; 所述网络资源特征向量用于描述网络资源属于各类别的置信度 ; 所述兴趣向量用于描述用 户对各类别的感兴趣程度。
     当然, 也可以将上述方法向结合, 综合考虑多方面因素, 获得用户对中两用户的相 关度。
     在获得到所述相关度之后, 还可以对相关度进行修正。具体的修正方法可以是将 相同的用户对进行合并 ; 根据用户对的合并次数, 对所述相关度进行修正 ; 或者, 利用用户 的兴趣向量进行修正。获得相关度的方法与修正的方法可以任意组合, 但是要保证获得相 关度与修正相关度的方法使用的参数不同。 例如, 可以先利用合并次数获得相关度, 再用用 户的兴趣向量对相关度进行修正, 等等。
     此外, 还可以利用各网络资源的特征向量对所述相关度进行修正。该修正方法可 以与前述任意种获得相关度的方法配合使用。
     另外, 同样可以将用户二维关系作为核心索引, 然后利用辅助索引对推荐结果进 行排序、 筛选等。例如, 可以所述根据各用户对中两用户的相关度, 对所述集合中的用户进 行排序之后, 根据辅助索引对所述集合中的用户进行重新排序。也可以在获得到所述集合 之后, 直接利用辅助索引对集合中的用户进行排序。
     具体的, 可以分别将各所述相关用户的兴趣向量与当前用户的兴趣向量进行内积 计算, 并根据内积计算的结果对各用户进行排序或重新排序。
     该实施例的细节部分可以参见实施例一、 二, 由于篇幅限制, 这里不再赘述。
     本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以 通过程序来指令相关的硬件来完成, 所述的程序可以存储于一计算机可读取存储介质中, 该程序在执行时, 包括如下步骤 : 获得访问同一网络资源的用户记录 ; 将所述用户记录中 的各用户信息拆分为用户对, 每一用户对包含所述用户记录中的两个用户信息 ; 汇集各个 网络资源的用户对, 建立用户二维关系 ; 当需要为用户进行推荐时, 根据所述用户二维关系 推荐相关的用户信息。所述的存储介质, 如: ROM/RAM、 磁碟、 光盘等。
     与本发明实施例提供的第一种网络信息推荐的方法相对应, 本发明实施例还提供 了一种网络信息推荐的系统, 参见图 5, 该系统包括 :
     资源访问记录获得单元 U501, 用于获得用户访问网络资源的资源访问记录 ;
     网络资源拆分单元 U502, 用于将所述用户的资源访问记录中的网络资源拆分为网 络资源访问对, 每一网络资源访问对包含所述资源访问记录中的两个网络资源信息 ;
     网络资源对汇集单元 U503, 用于汇集各用户的网络资源对, 获得网络资源二维关 系;
     网络资源推荐单元 U504, 用于当需要为用户进行推荐时, 根据所述网络资源二维关系为用户推荐相关的网络资源。
     其中, 网络资源推荐单元 U504 包括 :
     第一网络资源推荐子单元, 用于根据所述网络资源二维关系为用户推荐与当前访 问的网络资源相关的网络资源。
     具体的, 网络资源推荐单元 U504 包括 :
     网络资源集合获得子单元, 用于根据所述网络资源二维关系获得与当前访问的网 络资源相关的网络资源集合 ;
     第二网络资源推荐子单元, 用于根据所述集合向用户推荐网络资源。
     为了对推荐结果进行排序, 该系统还可以包括 :
     网络资源相关度获得单元, 用于获得各网络资源对中两网络资源的相关度 ;
     此时, 网络资源推荐单元 U504 还包括 :
     第一排序子单元, 用于根据所述网络资源二维关系获得与当前访问的网络资源相 关的网络资源集合之后, 根据各网络资源对中两网络资源的相关度, 对所述集合中的网络 资源进行排序。
     其中, 所述网络资源相关度获得单元包括 :
     第一网络资源相关度获得子单元, 用于将相同的网络资源对进行合并 ; 根据网络 资源对的合并次数, 为各个网络资源对进行评分, 得到各网络资源对中两网络资源的相关 度;
     和 / 或,
     第二网络资源相关度获得子单元, 用于根据网络资源对中两网络资源之间的间隔 时间, 为各个网络资源对进行评分, 得到各网络资源对中两网络资源的相关度 ;
     和 / 或,
     第三网络资源相关度获得子单元, 用于通过预置的分类信息为各网络资源生成网 络资源特征向量, 利用各网络资源的特征向量获得各网络资源对中两网络资源的相关度 ; 所述网络资源特征向量用于描述网络资源属于各类别的置信度。
     获得到相关度之后, 还可以对相关度进行修正, 此时, 该系统还包括 :
     第一网络资源相关度修正单元, 用于将相同的网络资源对进行合并 ; 根据网络资 源对的合并次数, 对所述相关度进行修正 ;
     和 / 或,
     第二网络资源相关度修正单元, 用于根据网络资源对中两网络资源之间的间隔时 间, 对所述相关度进行修正 ;
     和 / 或,
     第三网络资源相关度修正单元, 用于通过预置的分类信息为各网络资源生成网络 资源特征向量, 利用各网络资源的特征向量对所述相关度进行修正 ; 所述网络资源特征向 量用于描述网络资源属于各类别的置信度 ;
     和 / 或,
     第四网络资源相关度修正单元, 通过预置的分类信息为各网络资源生成网络资源 特征向量, 所述网络资源特征向量用于描述网络资源属于各类别的置信度 ; 根据用户的访 问历史获知用户最可能访问的网络资源 ; 将所述用户最可能访问的网络资源的特征向量合并, 得到各用户的兴趣向量 ; 利用各用户的兴趣向量对所述相关度进行修正 ; 所述兴趣向 量用于描述用户对各类别的感兴趣程度。
     具体在进行推荐时, 还可以将所述网络资源二维关系为核心索引, 此时, 网络资源 推荐单元 U504 还包括 :
     第二排序子单元, 用于根据辅助索引对所述集合中的网络资源进行排序。第二排 序子单元可以在根据所述网络资源二维关系获得与当前访问的网络资源相关的网络资源 集合之后进行排序, 也可以在根据各网络资源对中两网络资源的相关度, 对所述集合中的 网络资源进行排序之后, 进行重新排序。
     其中, 所述第二排序子单元包括 :
     特征向量生成子单元, 用于通过预置的分类信息为各网络资源生成网络资源特征 向量, 所述网络资源特征向量用于描述网络资源属于各类别的置信度 ;
     第一计算子单元, 用于分别将各所述相关网络资源的特征向量与用户当前访问的 网络资源的特征向量进行内积计算, 并根据内积计算的结果对各网络资源进行排序。
     或者, 所述第二排序子单元也可以包括 :
     兴趣向量生成子单元, 用于通过预置的分类信息为各网络资源生成网络资源特征 向量, 所述网络资源特征向量用于描述网络资源属于各类别的置信度 ; 根据用户的访问历 史获知用户最可能访问的网络资源 ; 将所述用户最可能访问的网络资源的特征向量合并, 得到各用户的兴趣向量 ; 所述兴趣向量用于描述用户对各类别的感兴趣程度 ;
     第二计算子单元, 用于分别将各所述相关网络资源的特征向量与该用户的兴趣向 量进行内积计算, 并根据内积计算的结果对各网络资源进行排序。
     此外, 该系统还可以包括 :
     过滤单元, 用于过滤掉无效的网络资源对, 所述无效的网络资源对包括 : 内容不相 关的网络资源对、 访问时间间隔超过预置阈值的网络资源对或者包含有广告导航页的网络 资源对。
     与本发明实施例提供的第二种网络信息推荐的方法相对应, 本发明实施例还提供 了另一种网络信息推荐的系统, 参见图 6, 该系统包括 :
     用户记录获得单元 U601, 用于获得访问同一网络资源的用户记录 ;
     用户拆分单元 U602, 用于将所述用户记录中的各用户信息拆分为用户对, 每一用 户对包含所述用户记录中的两个用户信息 ;
     用户对汇集单元 U603, 用于汇集各个网络资源的用户对, 获得用户二维关系 ;
     用户信息推荐单元 U604, 用于当需要为用户进行推荐时, 根据所述用户二维关系 推荐相关的用户信息。
     其中, 用户信息推荐单元 U604 包括 :
     第一用户信息推荐子单元, 用于根据所述用户二维关系推荐与当前访问的用户相 关的用户信息。
     具体的, 所述用户信息推荐单元 U604 包括 :
     用户信息集合生成子单元, 用于根据所述用户二维关系获得相关的用户集合 ;
     第二用户信息推荐子单元, 用于根据所述集合向用户推荐相关的用户信息。
     为了在推荐时能够对用户信息进行排序, 该系统还可以包括 :用户相关度获得单元, 用于获得各用户对中两用户的相关度 ;
     所述用户信息推荐单元还包括 :
     第一用户排序子单元, 用于根据各用户对中两用户的相关度, 对所述集合中的用 户进行排序。
     其中, 所述用户相关度获得单元包括 :
     第一用户相关度获得子单元, 用于将相同的用户对进行合并 ; 根据用户对的合并 次数, 为各个用户对进行评分, 得到各用户对的相关度 ;
     和 / 或,
     第二用户相关度获得子单元, 用于通过预置的分类信息为各网络资源生成网络资 源特征向量, 根据用户的访问历史获知用户最可能访问的网络资源 ; 将所述用户最可能访 问的网络资源的特征向量合并, 得到各用户的兴趣向量 ; 根据所述用户的兴趣向量获得各 用户对中两用户的相关度 ; 所述网络资源特征向量用于描述网络资源属于各类别的置信 度; 所述兴趣向量用于描述用户对各类别的感兴趣程度。
     获得到相关度之后还可以对相关度进行修正, 该系统还包括 :
     第一用户相关度修正单元, 用于将相同的用户对进行合并 ; 根据用户对的合并次 数, 对所述相关度进行修正 ; 和 / 或,
     第二用户相关度修正单元, 用于通过预置的分类信息为各网络资源生成网络资源 特征向量, 根据用户的访问历史获知用户最可能访问的网络资源 ; 将所述用户最可能访问 的网络资源的特征向量合并, 得到各用户的兴趣向量 ; 根据所述用户的兴趣向量对所述相 关度进行修正 ; 所述网络资源特征向量用于描述网络资源属于各类别的置信度 ; 所述兴趣 向量用于描述用户对各类别的感兴趣程度 ;
     和 / 或,
     第三用户相关度修正单元, 用于通过预置的分类信息为各网络资源生成网络资源 特征向量, 利用各网络资源的特征向量对所述相关度进行修正 ; 所述网络资源特征向量用 于描述网络资源属于各类别的置信度。
     此外, 还可以讲所述用户二维关系为核心索引, 此时, 用户信息推荐 U604 单元还 包括 :
     第二用户排序子单元, 用于根据辅助索引对所述集合中的用户进行排序。
     其中, 所述第二用户排序子单元包括 :
     兴趣向量生成子单元, 用于通过预置的分类信息为各网络资源生成网络资源特征 向量, 所述网络资源特征向量用于描述网络资源属于各类别的置信度 ; 根据用户的访问历 史获知用户最可能访问的网络资源 ; 将所述用户最可能访问的网络资源的特征向量合并, 得到各用户的兴趣向量 ; 所述兴趣向量用于描述用户对各类别的感兴趣程度 ;
     内积计算子单元, 用于分别将各所述相关用户的兴趣向量与当前用户的兴趣向量 进行内积计算, 并根据内积计算的结果对各用户进行排序。
     与本发明实施例提供的建立网络资源索引的方法相对应, 本发明实施例还提供了 一种建立网络资源索引的系统, 参见图 7, 该系统包括 :
     资源访问记录获得单元 U701, 用于获得用户访问网络资源的资源访问记录 ;
     网络资源拆分单元 U702, 用于将所述用户的资源访问记录中的网络资源拆分为网 络资源访问对, 每一网络资源访问对包含所述资源访问记录中的两个网络资源信息 ;
     网络资源对汇集单元 U703, 用于汇集各用户的网络资源对, 获得网络资源二维关 系, 建立起网络资源索引。
     其中, 该系统还可以包括 :
     网络资源相关度获得单元, 用于获得各网络资源对中两网络资源的相关度, 以便 根据所述相关度对所述网络资源进行排序。
     具体的, 所述网络资源相关度获得单元包括 :
     第一网络资源相关度获得子单元, 用于将相同的网络资源对进行合并 ; 根据网络 资源对的合并次数, 为各个网络资源对进行评分, 得到各网络资源对中两网络资源的相关 度;
     和 / 或,
     第二网络资源相关度获得子单元, 用于根据网络资源对中两网络资源之间的间隔 时间, 为各个网络资源对进行评分, 得到各网络资源对中两网络资源的相关度 ;
     和 / 或,
     第三网络资源相关度获得子单元, 用于通过预置的分类信息为各网络资源生成网 络资源特征向量, 利用各网络资源的特征向量获得各网络资源对中两网络资源的相关度 ; 所述网络资源特征向量用于描述网络资源属于各类别的置信度。
     获得到相关度之后还可以进行修正, 此时, 该系统还包括 :
     第一网络资源相关度修正单元, 用于将相同的网络资源对进行合并 ; 根据网络资 源对的合并次数, 对所述相关度进行修正 ;
     和 / 或,
     第二网络资源相关度修正单元, 用于根据网络资源对中两网络资源之间的间隔时 间, 对所述相关度进行修正 ;
     和 / 或,
     第三网络资源相关度修正单元, 用于通过预置的分类信息为各网络资源生成网络 资源特征向量, 利用各网络资源的特征向量对所述相关度进行修正 ; 所述网络资源特征向 量用于描述网络资源属于各类别的置信度 ;
     和 / 或,
     第四网络资源相关度修正单元, 通过预置的分类信息为各网络资源生成网络资源 特征向量, 所述网络资源特征向量用于描述网络资源属于各类别的置信度 ; 根据用户的访 问历史获知用户最可能访问的网络资源 ; 将所述用户最可能访问的网络资源的特征向量合 并, 得到各用户的兴趣向量 ; 利用各用户的兴趣向量对所述相关度进行修正 ; 所述兴趣向 量用于描述用户对各类别的感兴趣程度。
     与本发明实施例提供的建立用户索引的方法相对应, 本发明实施例还提供了一种 建立用户索引的系统, 参见图 8, 该系统包括 :
     用户记录获得单元 U801, 用于获得访问同一网络资源的用户记录 ;
     用户拆分单元 U802, 用于将所述用户记录中的各用户信息拆分为用户对, 每一用 户对包含所述用户记录中的两个用户信息 ;用户对汇集单元 U803, 用于汇集各个网络资源的用户对, 获得用户二维关系, 建立 起用户索引。
     该系统还包括 :
     用户相关度获得单元, 用于获得各用户对中两用户的相关度, 以便根据所述相关 度对用户进行排序。
     具体的, 所述用户相关度获得单元包括 :
     第一用户相关度获得子单元, 用于将相同的用户对进行合并 ; 根据用户对的合并 次数, 为各个用户对进行评分, 得到各用户对的相关度 ;
     和 / 或,
     第二用户相关度获得子单元, 用于通过预置的分类信息为各网络资源生成网络资 源特征向量, 根据用户的访问历史获知用户最可能访问的网络资源 ; 将所述用户最可能访 问的网络资源的特征向量合并, 得到各用户的兴趣向量 ; 根据所述用户的兴趣向量获得各 用户对中两用户的相关度 ; 所述网络资源特征向量用于描述网络资源属于各类别的置信 度; 所述兴趣向量用于描述用户对各类别的感兴趣程度。
     获得到相关度之后还可以进行修正, 此时, 该系统还包括 :
     第一用户相关度修正单元, 用于将相同的用户对进行合并 ; 根据用户对的合并次 数, 对所述相关度进行修正 ;
     和 / 或,
     第二用户相关度修正单元, 用于通过预置的分类信息为各网络资源生成网络资源 特征向量, 根据用户的访问历史获知用户最可能访问的网络资源 ; 将所述用户最可能访问 的网络资源的特征向量合并, 得到各用户的兴趣向量 ; 根据所述用户的兴趣向量对所述相 关度进行修正 ; 所述网络资源特征向量用于描述网络资源属于各类别的置信度 ; 所述兴趣 向量用于描述用户对各类别的感兴趣程度 ;
     和 / 或,
     第三用户相关度修正单元, 用于通过预置的分类信息为各网络资源生成网络资源 特征向量, 利用各网络资源的特征向量对所述相关度进行修正 ; 所述网络资源特征向量用 于描述网络资源属于各类别的置信度。
     本发明中所描述的系统、 装置和方法适用于各种网络或客户端环境中, 其例如可 以实现在诸如个人计算机设备之类的计算机设备中, 或者可以实现在诸如移动电话、 移动 通信设备、 个人数字助理 (PDA) 等其他电子设备中。
     以上对本发明所提供的网络信息推荐、 建立网络资源索引方法及系统, 进行了详 细介绍, 本文中应用了具体个例对本发明的原理及实施方式进行了阐述, 以上实施例的说 明只是用于帮助理解本发明的方法及其核心思想 ; 同时, 对于本领域的一般技术人员, 依据 本发明的思想, 在具体实施方式及应用范围上均会有改变之处。 综上所述, 本说明书内容不 应理解为对本发明的限制。

网络信息推荐、建立网络资源索引的方法及系统.pdf_第1页
第1页 / 共32页
网络信息推荐、建立网络资源索引的方法及系统.pdf_第2页
第2页 / 共32页
网络信息推荐、建立网络资源索引的方法及系统.pdf_第3页
第3页 / 共32页
点击查看更多>>
资源描述

《网络信息推荐、建立网络资源索引的方法及系统.pdf》由会员分享,可在线阅读,更多相关《网络信息推荐、建立网络资源索引的方法及系统.pdf(32页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN102054003A43申请公布日20110511CN102054003ACN102054003A21申请号200910236867622申请日20091104G06F17/3020060171申请人北京搜狗科技发展有限公司地址100084北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间72发明人高志茹立云佟子健李毅74专利代理机构北京集佳知识产权代理有限公司11227代理人逯长明王宝筠54发明名称网络信息推荐、建立网络资源索引的方法及系统57摘要本发明公开了网络信息推荐、建立网络资源索引的方法及系统,其中,所述网络信息推荐方法包括获得用户访问网络资源的资源访问记录。

2、;将所述用户的资源访问记录中的网络资源拆分为网络资源访问对,每一网络资源访问对包含所述资源访问记录中的两个网络资源信息;汇集各用户的网络资源对,获得网络资源二维关系;当需要为用户进行推荐时,根据所述网络资源二维关系为用户推荐相关的网络资源。通过本发明,能够扩大用户获得信息的范围,提高信息的利用率,降低了用户获得有用信息的难度。51INTCL19中华人民共和国国家知识产权局12发明专利申请权利要求书7页说明书21页附图3页CN102054010A1/7页21一种网络信息推荐的方法,其特征在于,包括获得用户访问网络资源的资源访问记录;将所述用户的资源访问记录中的网络资源拆分为网络资源访问对,每一网。

3、络资源访问对包含所述资源访问记录中的两个网络资源信息;汇集各用户的网络资源对,获得网络资源二维关系;当需要为用户进行推荐时,根据所述网络资源二维关系为用户推荐相关的网络资源。2根据权利要求1所述的方法,其特征在于,所述根据所述网络资源二维关系为用户推荐相关的网络资源包括根据所述网络资源二维关系为用户推荐与当前访问的网络资源相关的网络资源。3根据权利要求1所述的方法,其特征在于,所述根据所述网络资源二维关系为用户推荐相关的网络资源包括根据所述网络资源二维关系获得相关的网络资源集合,根据所述网络资源集合向用户推荐网络资源。4根据权利要求3所述的方法,其特征在于,还包括获得各网络资源对中两网络资源的。

4、相关度;在所述根据所述网络资源二维关系获得相关的网络资源集合之后还包括根据各网络资源对中两网络资源的相关度,对所述集合中的网络资源进行排序。5根据权利要求4所述的方法,其特征在于,通过以下方式获得各网络资源对中两网络资源的相关度将相同的网络资源对进行合并;根据网络资源对的合并次数,获得各网络资源对中两网络资源的相关度;和/或,根据网络资源对中两网络资源之间的间隔时间,获得各网络资源对中两网络资源的相关度;和/或,通过预置的分类信息为各网络资源生成网络资源特征向量,利用各网络资源的特征向量获得各网络资源对中两网络资源的相关度;所述网络资源特征向量用于描述网络资源属于各类别的置信度。6根据权利要求。

5、4所述的方法,其特征在于,还包括,通过以下方式对所述相关度进行修正将相同的网络资源对进行合并;根据网络资源对的合并次数,对所述相关度进行修正;和/或,根据网络资源对中两网络资源之间的间隔时间,对所述相关度进行修正;和/或,通过预置的分类信息为各网络资源生成网络资源特征向量,利用各网络资源的特征向量对所述相关度进行修正;所述网络资源特征向量用于描述网络资源属于各类别的置信度;和/或,通过预置的分类信息为各网络资源生成网络资源特征向量,所述网络资源特征向量用权利要求书CN102054003ACN102054010A2/7页3于描述网络资源属于各类别的置信度;根据用户的访问历史获知用户最可能访问的网。

6、络资源;将所述用户最可能访问的网络资源的特征向量合并,得到各用户的兴趣向量;利用各用户的兴趣向量对所述相关度进行修正;所述兴趣向量用于描述用户对各类别的感兴趣程度。7根据权利要求3或4所述的方法,其特征在于,所述网络资源二维关系为核心索引,还包括根据辅助索引对所述集合中的网络资源进行排序。8根据权利要求7所述的方法,其特征在于,所述根据辅助索引对所述集合中的网络资源进行排序包括通过预置的分类信息为各网络资源生成网络资源特征向量,所述网络资源特征向量用于描述网络资源属于各类别的置信度;分别将各所述相关网络资源的特征向量与用户当前访问的网络资源的特征向量进行内积计算,并根据内积计算的结果对各网络资。

7、源进行排序;或者,通过预置的分类信息为各网络资源生成网络资源特征向量,所述网络资源特征向量用于描述网络资源属于各类别的置信度;根据用户的访问历史获知用户最可能访问的网络资源;将所述用户最可能访问的网络资源的特征向量合并,得到各用户的兴趣向量;所述兴趣向量用于描述用户对各类别的感兴趣程度;分别将各所述相关网络资源的特征向量与该用户的兴趣向量进行内积计算,并根据内积计算的结果对各网络资源进行排序。9根据权利要求1至6、8任一项所述的方法,其特征在于,所述资源访问记录为资源访问序列。10一种网络信息推荐的系统,其特征在于,包括资源访问记录获得单元,用于获得用户访问网络资源的资源访问记录;网络资源拆分。

8、单元,用于将所述用户的资源访问记录中的网络资源拆分为网络资源访问对,每一网络资源访问对包含所述资源访问记录中的两个网络资源信息;网络资源对汇集单元,用于汇集各用户的网络资源对,获得网络资源二维关系;网络资源推荐单元,用于当需要为用户进行推荐时,根据所述网络资源二维关系为用户推荐相关的网络资源。11根据权利要求10所述的系统,其特征在于,所述网络资源推荐单元包括第一网络资源推荐子单元,用于根据所述网络资源二维关系为用户推荐与当前访问的网络资源相关的网络资源。12根据权利要求10所述的系统,其特征在于,所述网络资源推荐单元包括网络资源集合获得子单元,用于根据所述网络资源二维关系获得与当前访问的网络。

9、资源相关的网络资源集合;第二网络资源推荐子单元,用于根据所述集合向用户推荐网络资源。13根据权利要求12所述的系统,其特征在于,还包括网络资源相关度获得单元,用于获得各网络资源对中两网络资源的相关度;所述网络资源推荐单元还包括第一排序子单元,用于根据所述网络资源二维关系获得与当前访问的网络资源相关的权利要求书CN102054003ACN102054010A3/7页4网络资源集合之后,根据各网络资源对中两网络资源的相关度,对所述集合中的网络资源进行排序。14根据权利要求13所述的系统,其特征在于,所述网络资源相关度获得单元包括第一网络资源相关度获得子单元,用于将相同的网络资源对进行合并;根据网络。

10、资源对的合并次数,为各个网络资源对进行评分,得到各网络资源对中两网络资源的相关度;和/或,第二网络资源相关度获得子单元,用于根据网络资源对中两网络资源之间的间隔时间,为各个网络资源对进行评分,得到各网络资源对中两网络资源的相关度;和/或,第三网络资源相关度获得子单元,用于通过预置的分类信息为各网络资源生成网络资源特征向量,利用各网络资源的特征向量获得各网络资源对中两网络资源的相关度;所述网络资源特征向量用于描述网络资源属于各类别的置信度。15根据权利要求12或13所述的系统,其特征在于,所述网络资源二维关系为核心索引,所述网络资源推荐单元还包括第二排序子单元,用于根据辅助索引对所述集合中的网络。

11、资源进行排序。16根据权利要求15所述的系统,其特征在于所述第二排序子单元包括特征向量生成子单元,用于通过预置的分类信息为各网络资源生成网络资源特征向量,所述网络资源特征向量用于描述网络资源属于各类别的置信度;第一计算子单元,用于分别将各所述相关网络资源的特征向量与用户当前访问的网络资源的特征向量进行内积计算,并根据内积计算的结果对各网络资源进行排序;或者,所述第二排序子单元包括兴趣向量生成子单元,用于通过预置的分类信息为各网络资源生成网络资源特征向量,所述网络资源特征向量用于描述网络资源属于各类别的置信度;根据用户的访问历史获知用户最可能访问的网络资源;将所述用户最可能访问的网络资源的特征向。

12、量合并,得到各用户的兴趣向量;所述兴趣向量用于描述用户对各类别的感兴趣程度;第二计算子单元,用于分别将各所述相关网络资源的特征向量与该用户的兴趣向量进行内积计算,并根据内积计算的结果对各网络资源进行排序。17根据权利要求10所述的系统,其特征在于,还包括过滤单元,用于过滤掉无效的网络资源对,所述无效的网络资源对包括内容不相关的网络资源对、访问时间间隔超过预置阈值的网络资源对或者包含有广告导航页的网络资源对。18一种建立网络资源索引的方法,其特征在于,包括获得用户访问网络资源的资源访问记录;将所述用户的资源访问记录中的网络资源拆分为网络资源访问对,每一网络资源访问对包含所述资源访问记录中的两个网。

13、络资源信息;汇集各用户的网络资源对,获得网络资源二维关系,建立起网络资源索引。19根据权利要求18所述的方法,其特征在于,还包括获得各网络资源对中两网络资权利要求书CN102054003ACN102054010A4/7页5源的相关度,以便根据所述相关度对所述网络资源进行排序。20根据权利要求19所述的方法,其特征在于,通过以下方式获得各网络资源对中两网络资源的相关度将相同的网络资源对进行合并;根据网络资源对的合并次数,获得各网络资源对中两网络资源的相关度;和/或,根据网络资源对中两网络资源之间的间隔时间,获得各网络资源对中两网络资源的相关度;和/或,通过预置的分类信息为各网络资源生成网络资源特。

14、征向量,利用各网络资源的特征向量获得各网络资源对中两网络资源的相关度;所述网络资源特征向量用于描述网络资源属于各类别的置信度。21一种建立网络资源索引的系统,其特征在于,包括资源访问记录获得单元,用于获得用户访问网络资源的资源访问记录;网络资源拆分单元,用于将所述用户的资源访问记录中的网络资源拆分为网络资源访问对,每一网络资源访问对包含所述资源访问记录中的两个网络资源信息;网络资源对汇集单元,用于汇集各用户的网络资源对,获得网络资源二维关系,建立起网络资源索引。22根据权利要求21所述的系统,其特征在于,还包括网络资源相关度获得单元,用于获得各网络资源对中两网络资源的相关度,以便根据所述相关度。

15、对所述网络资源进行排序。23根据权利要求22所述的系统,其特征在于,所述网络资源相关度获得单元包括第一网络资源相关度获得子单元,用于将相同的网络资源对进行合并;根据网络资源对的合并次数,获得各网络资源对中两网络资源的相关度;和/或,第二网络资源相关度获得子单元,用于根据网络资源对中两网络资源之间的间隔时间,获得各网络资源对中两网络资源的相关度;和/或,第三网络资源相关度获得子单元,用于通过预置的分类信息为各网络资源生成网络资源特征向量,利用各网络资源的特征向量获得各网络资源对中两网络资源的相关度;所述网络资源特征向量用于描述网络资源属于各类别的置信度。24根据权利要求22所述的系统,其特征在于。

16、,还包括第一网络资源相关度修正单元,用于将相同的网络资源对进行合并;根据网络资源对的合并次数,对所述相关度进行修正;和/或,第二网络资源相关度修正单元,用于根据网络资源对中两网络资源之间的间隔时间,对所述相关度进行修正;和/或,第三网络资源相关度修正单元,用于通过预置的分类信息为各网络资源生成网络资源权利要求书CN102054003ACN102054010A5/7页6特征向量,利用各网络资源的特征向量对所述相关度进行修正;所述网络资源特征向量用于描述网络资源属于各类别的置信度;和/或,第四网络资源相关度修正单元,通过预置的分类信息为各网络资源生成网络资源特征向量,所述网络资源特征向量用于描述网。

17、络资源属于各类别的置信度;根据用户的访问历史获知用户最可能访问的网络资源;将所述用户最可能访问的网络资源的特征向量合并,得到各用户的兴趣向量;利用各用户的兴趣向量对所述相关度进行修正;所述兴趣向量用于描述用户对各类别的感兴趣程度。25一种网络信息推荐的方法,其特征在于,包括获得访问同一网络资源的用户记录;将所述用户记录中的各用户信息拆分为用户对,每一用户对包含所述用户记录中的两个用户信息;汇集各个网络资源的用户对,建立用户二维关系;当需要为用户进行推荐时,根据所述用户二维关系推荐相关的用户信息。26根据权利要求25所述的方法,其特征在于,所述根据所述用户二维关系推荐相关的用户信息包括根据所述用。

18、户二维关系推荐与当前访问的用户相关的用户信息。27根据权利要求25所述的方法,其特征在于,所述根据所述用户二维关系推荐相关的用户信息包括根据所述用户二维关系获得相关的用户集合,根据所述集合向用户推荐相关的用户信息;所述方法还包括获得各用户对中两用户的相关度,在所述根据所述用户二维关系获得相关的用户集合之后还包括根据各用户对中两用户的相关度,对所述集合中的用户进行排序。28根据权利要求27所述的方法,其特征在于,所述用户二维关系为核心索引,还包括根据辅助索引对所述集合中的用户进行排序。29一种网络信息推荐的系统,其特征在于,包括用户记录获得单元,用于获得访问同一网络资源的用户记录;用户拆分单元,。

19、用于将所述用户记录中的各用户信息拆分为用户对,每一用户对包含所述用户记录中的两个用户信息;用户对汇集单元,用于汇集各个网络资源的用户对,获得用户二维关系;用户信息推荐单元,用于当需要为用户进行推荐时,根据所述用户二维关系推荐相关的用户信息。30根据权利要求29所述的系统,其特征在于,所述用户信息推荐单元包括第一用户信息推荐子单元,用于根据所述用户二维关系推荐与当前访问的用户相关的用户信息。31根据权利要求29所述的系统,其特征在于,所述用户信息推荐单元包括用户信息集合生成子单元,用于根据所述用户二维关系获得相关的用户集合;第二用户信息推荐子单元,用于根据所述集合向用户推荐相关的用户信息;权利要。

20、求书CN102054003ACN102054010A6/7页7或者,所述系统还包括用户相关度获得单元,用于获得各用户对中两用户的相关度;所述用户信息推荐单元还包括第一用户排序子单元,用于根据各用户对中两用户的相关度,对所述集合中的用户进行排序。32根据权利要求31所述的系统,其特征在于,所述用户二维关系为核心索引,所述用户信息推荐单元还包括第二用户排序子单元,用于根据辅助索引对所述集合中的用户进行排序。33一种建立用户索引的方法,其特征在于,包括获得访问同一网络资源的用户记录;将所述用户记录中的各用户拆分为用户对,每一用户对包含所述用户记录中的两个用户;汇集各个网络资源的用户对,获得用户二维关。

21、系,建立起用户索引。34根据权利要求33所述的方法,其特征在于,还包括获得各用户对中两用户的相关度。35根据权利要求34所述的方法,其特征在于,通过以下方式获得各用户对中两用户的相关度将相同的用户对进行合并;根据用户对的合并次数,为各个用户对进行评分,得到各用户对的相关度;和/或,通过预置的分类信息为各网络资源生成网络资源特征向量,根据用户的访问历史获知用户最可能访问的网络资源;将所述用户最可能访问的网络资源的特征向量合并,得到各用户的兴趣向量;根据所述用户的兴趣向量获得各用户对中两用户的相关度;所述网络资源特征向量用于描述网络资源属于各类别的置信度;所述兴趣向量用于描述用户对各类别的感兴趣程。

22、度。36一种建立用户索引的系统,其特征在于,包括用户记录获得单元,用于获得访问同一网络资源的用户记录;用户拆分单元,用于将所述用户记录中的各用户信息拆分为用户对,每一用户对包含所述用户记录中的两个用户信息;用户对汇集单元,用于汇集各个网络资源的用户对,获得用户二维关系,建立起用户索引。37根据权利要求36所述的系统,其特征在于,还包括用户相关度获得单元,用于获得各用户对中两用户的相关度,以便根据所述相关度对用户进行排序。38根据权利要求37所述的系统,其特征在于,所述用户相关度获得单元包括第一用户相关度获得子单元,用于将相同的用户对进行合并;根据用户对的合并次数,为各个用户对进行评分,得到各用。

23、户对的相关度;和/或,第二用户相关度获得子单元,用于通过预置的分类信息为各网络资源生成网络资源特征向量,根据用户的访问历史获知用户最可能访问的网络资源;将所述用户最可能访问的权利要求书CN102054003ACN102054010A7/7页8网络资源的特征向量合并,得到各用户的兴趣向量;根据所述用户的兴趣向量获得各用户对中两用户的相关度;所述网络资源特征向量用于描述网络资源属于各类别的置信度;所述兴趣向量用于描述用户对各类别的感兴趣程度。权利要求书CN102054003ACN102054010A1/21页9网络信息推荐、建立网络资源索引的方法及系统技术领域0001本发明涉及浏览器技术领域,特别。

24、是涉及网络信息推荐、建立网络资源索引的方法及系统。背景技术0002现在网络技术飞速发展,互联网上的信息量非常大,因此如何让用户快速找到自己想要或者适合自己的网络信息则成为技术人员迫切需要解决的技术问题。0003为了解决上述技术问题,出现了一种网络信息推荐系统RECOMMENDERSYSTEM,该系统是信息过滤系统的一种。以网页推荐为例,通常需要预先建立网页索引,在需要给用户进行推荐时,在网页索引中检索出可以推荐的网页。现有技术中的网页索引通常是基于关键词建立的,例如,可以预先提取各个网页中具有代表性的关键词,然后按照关键词建立网页索引;当需要进行网页推荐时,提取当前网页中具有代表性的关键词作为。

25、检索词,然后在预先建立的索引中检索具有该检索词的网页,然后将检索到的网页推荐给相关用户。0004但是在基于这种索引方式的网络信息推荐系统下,对于不包含检索词的网页,就无法推荐给用户,使得用户获得信息的范围比较狭窄,既限制了信息的利用率,也增加了用户获得有用信息的难度。发明内容0005本发明提供了网络信息推荐、建立网络资源索引的方法及系统,能够提高网络信息的利用率。0006本发明提供了如下方案0007一种网络信息推荐的方法,包括0008获得用户访问网络资源的资源访问记录;0009将所述用户的资源访问记录中的网络资源拆分为网络资源访问对,每一网络资源访问对包含所述资源访问记录中的两个网络资源信息;。

26、0010汇集各用户的网络资源对,获得网络资源二维关系;0011当需要为用户进行推荐时,根据所述网络资源二维关系为用户推荐相关的网络资源。0012优选的,所述根据所述网络资源二维关系为用户推荐相关的网络资源包括根据所述网络资源二维关系为用户推荐与当前访问的网络资源相关的网络资源。0013优选的,所述根据所述网络资源二维关系为用户推荐相关的网络资源包括0014根据所述网络资源二维关系获得相关的网络资源集合,根据所述网络资源集合向用户推荐网络资源。0015优选的获得各网络资源对中两网络资源的相关度;在所述根据所述网络资源二维关系获得相关的网络资源集合之后还包括0016根据各网络资源对中两网络资源的相。

27、关度,对所述集合中的网络资源进行排序。说明书CN102054003ACN102054010A2/21页100017优选的,通过以下方式获得各网络资源对中两网络资源的相关度0018将相同的网络资源对进行合并;根据网络资源对的合并次数,获得各网络资源对中两网络资源的相关度;0019和/或,0020根据网络资源对中两网络资源之间的间隔时间,获得各网络资源对中两网络资源的相关度;0021和/或,0022通过预置的分类信息为各网络资源生成网络资源特征向量,利用各网络资源的特征向量获得各网络资源对中两网络资源的相关度;所述网络资源特征向量用于描述网络资源属于各类别的置信度。0023优选的,通过以下方式对所。

28、述相关度进行修正0024将相同的网络资源对进行合并;根据网络资源对的合并次数,对所述相关度进行修正;0025和/或,0026根据网络资源对中两网络资源之间的间隔时间,对所述相关度进行修正;0027和/或,0028通过预置的分类信息为各网络资源生成网络资源特征向量,利用各网络资源的特征向量对所述相关度进行修正;所述网络资源特征向量用于描述网络资源属于各类别的置信度;0029和/或,0030通过预置的分类信息为各网络资源生成网络资源特征向量,所述网络资源特征向量用于描述网络资源属于各类别的置信度;根据用户的访问历史获知用户最可能访问的网络资源;将所述用户最可能访问的网络资源的特征向量合并,得到各用。

29、户的兴趣向量;利用各用户的兴趣向量对所述相关度进行修正;所述兴趣向量用于描述用户对各类别的感兴趣程度。0031优选的,所述网络资源二维关系为核心索引,还包括0032根据辅助索引对所述集合中的网络资源进行排序。0033优选的,所述根据辅助索引对所述集合中的网络资源进行排序包括0034通过预置的分类信息为各网络资源生成网络资源特征向量,所述网络资源特征向量用于描述网络资源属于各类别的置信度;分别将各所述相关网络资源的特征向量与用户当前访问的网络资源的特征向量进行内积计算,并根据内积计算的结果对各网络资源进行排序;0035或者,0036通过预置的分类信息为各网络资源生成网络资源特征向量,所述网络资源。

30、特征向量用于描述网络资源属于各类别的置信度;根据用户的访问历史获知用户最可能访问的网络资源;将所述用户最可能访问的网络资源的特征向量合并,得到各用户的兴趣向量;所述兴趣向量用于描述用户对各类别的感兴趣程度;分别将各所述相关网络资源的特征向量与该用户的兴趣向量进行内积计算,并根据内积计算的结果对各网络资源进行排序。0037优选的,所述资源访问记录为资源访问序列。说明书CN102054003ACN102054010A3/21页110038一种网络信息推荐的系统,包括0039资源访问记录获得单元,用于获得用户访问网络资源的资源访问记录;0040网络资源拆分单元,用于将所述用户的资源访问记录中的网络资。

31、源拆分为网络资源访问对,每一网络资源访问对包含所述资源访问记录中的两个网络资源信息;0041网络资源对汇集单元,用于汇集各用户的网络资源对,获得网络资源二维关系;0042网络资源推荐单元,用于当需要为用户进行推荐时,根据所述网络资源二维关系为用户推荐相关的网络资源。0043优选的,所述网络资源推荐单元包括0044第一网络资源推荐子单元,用于根据所述网络资源二维关系为用户推荐与当前访问的网络资源相关的网络资源。0045优选的,所述网络资源推荐单元包括0046网络资源集合获得子单元,用于根据所述网络资源二维关系获得与当前访问的网络资源相关的网络资源集合;0047第二网络资源推荐子单元,用于根据所述。

32、集合向用户推荐网络资源。0048优选的,还包括0049网络资源相关度获得单元,用于获得各网络资源对中两网络资源的相关度;0050所述网络资源推荐单元还包括0051第一排序子单元,用于根据所述网络资源二维关系获得与当前访问的网络资源相关的网络资源集合之后,根据各网络资源对中两网络资源的相关度,对所述集合中的网络资源进行排序。0052优选的,所述网络资源相关度获得单元包括0053第一网络资源相关度获得子单元,用于将相同的网络资源对进行合并;根据网络资源对的合并次数,为各个网络资源对进行评分,得到各网络资源对中两网络资源的相关度;0054和/或,0055第二网络资源相关度获得子单元,用于根据网络资源。

33、对中两网络资源之间的间隔时间,为各个网络资源对进行评分,得到各网络资源对中两网络资源的相关度;0056和/或,0057第三网络资源相关度获得子单元,用于通过预置的分类信息为各网络资源生成网络资源特征向量,利用各网络资源的特征向量获得各网络资源对中两网络资源的相关度;所述网络资源特征向量用于描述网络资源属于各类别的置信度。0058优选的,所述网络资源二维关系为核心索引,所述网络资源推荐单元还包括0059第二排序子单元,用于根据辅助索引对所述集合中的网络资源进行排序。0060优选的0061所述第二排序子单元包括0062特征向量生成子单元,用于通过预置的分类信息为各网络资源生成网络资源特征向量,所述。

34、网络资源特征向量用于描述网络资源属于各类别的置信度;第一计算子单元,用于分别将各所述相关网络资源的特征向量与用户当前访问的网络资源的特征向量进行内积计算,并根据内积计算的结果对各网络资源进行排序;说明书CN102054003ACN102054010A4/21页120063或者,0064所述第二排序子单元包括0065兴趣向量生成子单元,用于通过预置的分类信息为各网络资源生成网络资源特征向量,所述网络资源特征向量用于描述网络资源属于各类别的置信度;根据用户的访问历史获知用户最可能访问的网络资源;将所述用户最可能访问的网络资源的特征向量合并,得到各用户的兴趣向量;所述兴趣向量用于描述用户对各类别的感。

35、兴趣程度;第二计算子单元,用于分别将各所述相关网络资源的特征向量与该用户的兴趣向量进行内积计算,并根据内积计算的结果对各网络资源进行排序。0066优选的,还包括0067过滤单元,用于过滤掉无效的网络资源对,所述无效的网络资源对包括内容不相关的网络资源对、访问时间间隔超过预置阈值的网络资源对或者包含有广告导航页的网络资源对。0068一种建立网络资源索引的方法,包括0069获得用户访问网络资源的资源访问记录;0070将所述用户的资源访问记录中的网络资源拆分为网络资源访问对,每一网络资源访问对包含所述资源访问记录中的两个网络资源信息;0071汇集各用户的网络资源对,获得网络资源二维关系,建立起网络资。

36、源索引。0072优选的,还包括获得各网络资源对中两网络资源的相关度,以便根据所述相关度对所述网络资源进行排序。0073优选的,通过以下方式获得各网络资源对中两网络资源的相关度0074将相同的网络资源对进行合并;根据网络资源对的合并次数,获得各网络资源对中两网络资源的相关度;0075和/或,0076根据网络资源对中两网络资源之间的间隔时间,获得各网络资源对中两网络资源的相关度;0077和/或,0078通过预置的分类信息为各网络资源生成网络资源特征向量,利用各网络资源的特征向量获得各网络资源对中两网络资源的相关度;所述网络资源特征向量用于描述网络资源属于各类别的置信度。0079一种建立网络资源索引。

37、的系统,包括0080资源访问记录获得单元,用于获得用户访问网络资源的资源访问记录;0081网络资源拆分单元,用于将所述用户的资源访问记录中的网络资源拆分为网络资源访问对,每一网络资源访问对包含所述资源访问记录中的两个网络资源信息;0082网络资源对汇集单元,用于汇集各用户的网络资源对,获得网络资源二维关系,建立起网络资源索引。0083优选的,还包括0084网络资源相关度获得单元,用于获得各网络资源对中两网络资源的相关度,以便根据所述相关度对所述网络资源进行排序。0085优选的,所述网络资源相关度获得单元包括说明书CN102054003ACN102054010A5/21页130086第一网络资源。

38、相关度获得子单元,用于将相同的网络资源对进行合并;根据网络资源对的合并次数,获得各网络资源对中两网络资源的相关度;0087和/或,0088第二网络资源相关度获得子单元,用于根据网络资源对中两网络资源之间的间隔时间,获得各网络资源对中两网络资源的相关度;0089和/或,0090第三网络资源相关度获得子单元,用于通过预置的分类信息为各网络资源生成网络资源特征向量,利用各网络资源的特征向量获得各网络资源对中两网络资源的相关度;所述网络资源特征向量用于描述网络资源属于各类别的置信度。0091优选的,还包括0092第一网络资源相关度修正单元,用于将相同的网络资源对进行合并;根据网络资源对的合并次数,对所。

39、述相关度进行修正;0093和/或,0094第二网络资源相关度修正单元,用于根据网络资源对中两网络资源之间的间隔时间,对所述相关度进行修正;0095和/或,0096第三网络资源相关度修正单元,用于通过预置的分类信息为各网络资源生成网络资源特征向量,利用各网络资源的特征向量对所述相关度进行修正;所述网络资源特征向量用于描述网络资源属于各类别的置信度;0097和/或,0098第四网络资源相关度修正单元,通过预置的分类信息为各网络资源生成网络资源特征向量,所述网络资源特征向量用于描述网络资源属于各类别的置信度;根据用户的访问历史获知用户最可能访问的网络资源;将所述用户最可能访问的网络资源的特征向量合并。

40、,得到各用户的兴趣向量;利用各用户的兴趣向量对所述相关度进行修正;所述兴趣向量用于描述用户对各类别的感兴趣程度。0099一种网络信息推荐的方法,包括0100获得访问同一网络资源的用户记录;0101将所述用户记录中的各用户信息拆分为用户对,每一用户对包含所述用户记录中的两个用户信息;0102汇集各个网络资源的用户对,建立用户二维关系;0103当需要为用户进行推荐时,根据所述用户二维关系推荐相关的用户信息。0104优选的,所述根据所述用户二维关系推荐相关的用户信息包括0105根据所述用户二维关系推荐与当前访问的用户相关的用户信息。0106优选的,所述根据所述用户二维关系推荐相关的用户信息包括根据所。

41、述用户二维关系获得相关的用户集合,根据所述集合向用户推荐相关的用户信息;0107所述方法还包括获得各用户对中两用户的相关度,在所述根据所述用户二维关系获得相关的用户集合之后还包括根据各用户对中两用户的相关度,对所述集合中的用户进行排序。0108优选的,所述用户二维关系为核心索引,还包括说明书CN102054003ACN102054010A6/21页140109根据辅助索引对所述集合中的用户进行排序。0110一种网络信息推荐的系统,包括0111用户记录获得单元,用于获得访问同一网络资源的用户记录;0112用户拆分单元,用于将所述用户记录中的各用户信息拆分为用户对,每一用户对包含所述用户记录中的两。

42、个用户信息;0113用户对汇集单元,用于汇集各个网络资源的用户对,获得用户二维关系;0114用户信息推荐单元,用于当需要为用户进行推荐时,根据所述用户二维关系推荐相关的用户信息。0115优选的,所述用户信息推荐单元包括0116第一用户信息推荐子单元,用于根据所述用户二维关系推荐与当前访问的用户相关的用户信息。0117优选的,所述用户信息推荐单元包括用户信息集合生成子单元,用于根据所述用户二维关系获得相关的用户集合;第二用户信息推荐子单元,用于根据所述集合向用户推荐相关的用户信息;0118或者,0119所述系统还包括用户相关度获得单元,用于获得各用户对中两用户的相关度;所述用户信息推荐单元还包括。

43、第一用户排序子单元,用于根据各用户对中两用户的相关度,对所述集合中的用户进行排序。0120优选的,所述用户二维关系为核心索引,所述用户信息推荐单元还包括0121第二用户排序子单元,用于根据辅助索引对所述集合中的用户进行排序。0122一种建立用户索引的方法,包括0123获得访问同一网络资源的用户记录;0124将所述用户记录中的各用户拆分为用户对,每一用户对包含所述用户记录中的两个用户;0125汇集各个网络资源的用户对,获得用户二维关系,建立起用户索引。0126优选的,还包括0127获得各用户对中两用户的相关度。0128优选的,通过以下方式获得各用户对中两用户的相关度0129将相同的用户对进行合并。

44、;根据用户对的合并次数,为各个用户对进行评分,得到各用户对的相关度;0130和/或,0131通过预置的分类信息为各网络资源生成网络资源特征向量,根据用户的访问历史获知用户最可能访问的网络资源;将所述用户最可能访问的网络资源的特征向量合并,得到各用户的兴趣向量;根据所述用户的兴趣向量获得各用户对中两用户的相关度;所述网络资源特征向量用于描述网络资源属于各类别的置信度;所述兴趣向量用于描述用户对各类别的感兴趣程度。0132一种建立用户索引的系统,包括0133用户记录获得单元,用于获得访问同一网络资源的用户记录;0134用户拆分单元,用于将所述用户记录中的各用户信息拆分为用户对,每一用户对说明书CN。

45、102054003ACN102054010A7/21页15包含所述用户记录中的两个用户信息;0135用户对汇集单元,用于汇集各个网络资源的用户对,获得用户二维关系,建立起用户索引。0136优选的,还包括0137用户相关度获得单元,用于获得各用户对中两用户的相关度,以便根据所述相关度对用户进行排序。0138优选的,所述用户相关度获得单元包括0139第一用户相关度获得子单元,用于将相同的用户对进行合并;根据用户对的合并次数,为各个用户对进行评分,得到各用户对的相关度;0140和/或,0141第二用户相关度获得子单元,用于通过预置的分类信息为各网络资源生成网络资源特征向量,根据用户的访问历史获知用户。

46、最可能访问的网络资源;将所述用户最可能访问的网络资源的特征向量合并,得到各用户的兴趣向量;根据所述用户的兴趣向量获得各用户对中两用户的相关度;所述网络资源特征向量用于描述网络资源属于各类别的置信度;所述兴趣向量用于描述用户对各类别的感兴趣程度。0142根据本发明提供的具体实施例,本发明公开了以下技术效果0143本发明将用户的访问序列拆分为网络资源对;获得用户访问网络资源的资源访问记录;将所述用户的资源访问记录中的网络资源拆分为网络资源访问对,每一网络资源访问对包含所述资源访问记录中的两个网络资源信息;汇集各用户的网络资源对,获得网络资源二维关系;当需要为用户进行推荐时,根据所述网络资源二维关系。

47、为用户推荐相关的网络资源。由于可以基于所有用户的访问序列建立网络资源二维关系,而众多用户的访问行为通常可以遍及全网,因此,不会局限在特定数据集中,而是可以在全网范围内建立二维的网络资源索引,因此,可以便于在全网范围内进行相关检索。如果推荐系统中应用本发明实施例所建立的二维索引结构,则进行信息推荐时,可以在全网范围内向用户进行推荐,因此,能够扩大用户获得信息的范围,提高信息的利用率,降低了用户获得有用信息的难度。0144另外,还可以通过生成网络资源的特征向量及用户的兴趣向量,来建立辅助索引,以便于优化检索结果,还可以对二维网络资源索引进行修正。附图说明0145图1是本发明实施例提供的建立网络信息。

48、索引方法的流程图;0146图2是本发明实施例提供的网络信息推荐方法的流程图;0147图3是本发明实施例提供的建立用户索引方法的流程图;0148图4是本发明实施例提供的另一网络信息推荐方法的流程图;0149图5是本发明实施例提供的网络信息推荐系统的示意图;0150图6是本发明实施例提供的另一网络信息推荐系统的示意图;0151图7是本发明实施例提供的建立网络信息索引系统的示意图;0152图8是本发明实施例提供的建立用户索引系统的示意图。说明书CN102054003ACN102054010A8/21页16具体实施方式0153为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式。

49、对本发明作进一步详细的说明。0154实施例一、为了扩大用户获得信息的范围,提高信息的利用率,在该实施例中,首先提供了一种建立网络资源索引的方法,参见图1,本发明实施例提供的建立网络资源索引的方法包括以下步骤0155S101获得用户访问网络资源的资源访问记录;0156其中,本发明实施例中提到的网络资源可以一个网页,也可以是网络中的一个视频、音频或图片等等,只要是互联网上能够展现给用户的信息,都属于本发明限定的网络资源范畴。所述网页就是通常在网页浏览器IE等中打开的网页,其内容可能包括视频、音频、图片、文字、FLASH等多种元素;同时,所述网络资源也可以是不依附于网页而独立存在的视频、音频、图片、。

50、文字、FLASH等。0157首先需要说明的是,本发明实施例可以由浏览器的服务器来完成建立网络资源索引的过程。由于,用户通常是通过浏览器访问网络资源,因此,浏览器能够记录大多数用户的访问日志,包括用户通过浏览器浏览所有网络资源的URL、访问时间、停留时间等等。0158S102将所述用户的资源访问记录中的网络资源拆分为网络资源访问对,每一网络资源访问对包含所述资源访问记录中的两个网络资源信息;0159所述资源访问记录中记录了用户访问过的网络资源集合,将该集合中的网络资源两两组成网络资源对即可。0160由于用户在访问网络资源时,会有一定的时序关系,浏览器能够记录这种时序关系根据访问时间,因此可以产生。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1