1、10申请公布号CN102054003A43申请公布日20110511CN102054003ACN102054003A21申请号200910236867622申请日20091104G06F17/3020060171申请人北京搜狗科技发展有限公司地址100084北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间72发明人高志茹立云佟子健李毅74专利代理机构北京集佳知识产权代理有限公司11227代理人逯长明王宝筠54发明名称网络信息推荐、建立网络资源索引的方法及系统57摘要本发明公开了网络信息推荐、建立网络资源索引的方法及系统,其中,所述网络信息推荐方法包括获得用户访问网络资源的资源访问记录
2、;将所述用户的资源访问记录中的网络资源拆分为网络资源访问对,每一网络资源访问对包含所述资源访问记录中的两个网络资源信息;汇集各用户的网络资源对,获得网络资源二维关系;当需要为用户进行推荐时,根据所述网络资源二维关系为用户推荐相关的网络资源。通过本发明,能够扩大用户获得信息的范围,提高信息的利用率,降低了用户获得有用信息的难度。51INTCL19中华人民共和国国家知识产权局12发明专利申请权利要求书7页说明书21页附图3页CN102054010A1/7页21一种网络信息推荐的方法,其特征在于,包括获得用户访问网络资源的资源访问记录;将所述用户的资源访问记录中的网络资源拆分为网络资源访问对,每一网
3、络资源访问对包含所述资源访问记录中的两个网络资源信息;汇集各用户的网络资源对,获得网络资源二维关系;当需要为用户进行推荐时,根据所述网络资源二维关系为用户推荐相关的网络资源。2根据权利要求1所述的方法,其特征在于,所述根据所述网络资源二维关系为用户推荐相关的网络资源包括根据所述网络资源二维关系为用户推荐与当前访问的网络资源相关的网络资源。3根据权利要求1所述的方法,其特征在于,所述根据所述网络资源二维关系为用户推荐相关的网络资源包括根据所述网络资源二维关系获得相关的网络资源集合,根据所述网络资源集合向用户推荐网络资源。4根据权利要求3所述的方法,其特征在于,还包括获得各网络资源对中两网络资源的
4、相关度;在所述根据所述网络资源二维关系获得相关的网络资源集合之后还包括根据各网络资源对中两网络资源的相关度,对所述集合中的网络资源进行排序。5根据权利要求4所述的方法,其特征在于,通过以下方式获得各网络资源对中两网络资源的相关度将相同的网络资源对进行合并;根据网络资源对的合并次数,获得各网络资源对中两网络资源的相关度;和/或,根据网络资源对中两网络资源之间的间隔时间,获得各网络资源对中两网络资源的相关度;和/或,通过预置的分类信息为各网络资源生成网络资源特征向量,利用各网络资源的特征向量获得各网络资源对中两网络资源的相关度;所述网络资源特征向量用于描述网络资源属于各类别的置信度。6根据权利要求
5、4所述的方法,其特征在于,还包括,通过以下方式对所述相关度进行修正将相同的网络资源对进行合并;根据网络资源对的合并次数,对所述相关度进行修正;和/或,根据网络资源对中两网络资源之间的间隔时间,对所述相关度进行修正;和/或,通过预置的分类信息为各网络资源生成网络资源特征向量,利用各网络资源的特征向量对所述相关度进行修正;所述网络资源特征向量用于描述网络资源属于各类别的置信度;和/或,通过预置的分类信息为各网络资源生成网络资源特征向量,所述网络资源特征向量用权利要求书CN102054003ACN102054010A2/7页3于描述网络资源属于各类别的置信度;根据用户的访问历史获知用户最可能访问的网
6、络资源;将所述用户最可能访问的网络资源的特征向量合并,得到各用户的兴趣向量;利用各用户的兴趣向量对所述相关度进行修正;所述兴趣向量用于描述用户对各类别的感兴趣程度。7根据权利要求3或4所述的方法,其特征在于,所述网络资源二维关系为核心索引,还包括根据辅助索引对所述集合中的网络资源进行排序。8根据权利要求7所述的方法,其特征在于,所述根据辅助索引对所述集合中的网络资源进行排序包括通过预置的分类信息为各网络资源生成网络资源特征向量,所述网络资源特征向量用于描述网络资源属于各类别的置信度;分别将各所述相关网络资源的特征向量与用户当前访问的网络资源的特征向量进行内积计算,并根据内积计算的结果对各网络资
7、源进行排序;或者,通过预置的分类信息为各网络资源生成网络资源特征向量,所述网络资源特征向量用于描述网络资源属于各类别的置信度;根据用户的访问历史获知用户最可能访问的网络资源;将所述用户最可能访问的网络资源的特征向量合并,得到各用户的兴趣向量;所述兴趣向量用于描述用户对各类别的感兴趣程度;分别将各所述相关网络资源的特征向量与该用户的兴趣向量进行内积计算,并根据内积计算的结果对各网络资源进行排序。9根据权利要求1至6、8任一项所述的方法,其特征在于,所述资源访问记录为资源访问序列。10一种网络信息推荐的系统,其特征在于,包括资源访问记录获得单元,用于获得用户访问网络资源的资源访问记录;网络资源拆分
8、单元,用于将所述用户的资源访问记录中的网络资源拆分为网络资源访问对,每一网络资源访问对包含所述资源访问记录中的两个网络资源信息;网络资源对汇集单元,用于汇集各用户的网络资源对,获得网络资源二维关系;网络资源推荐单元,用于当需要为用户进行推荐时,根据所述网络资源二维关系为用户推荐相关的网络资源。11根据权利要求10所述的系统,其特征在于,所述网络资源推荐单元包括第一网络资源推荐子单元,用于根据所述网络资源二维关系为用户推荐与当前访问的网络资源相关的网络资源。12根据权利要求10所述的系统,其特征在于,所述网络资源推荐单元包括网络资源集合获得子单元,用于根据所述网络资源二维关系获得与当前访问的网络
9、资源相关的网络资源集合;第二网络资源推荐子单元,用于根据所述集合向用户推荐网络资源。13根据权利要求12所述的系统,其特征在于,还包括网络资源相关度获得单元,用于获得各网络资源对中两网络资源的相关度;所述网络资源推荐单元还包括第一排序子单元,用于根据所述网络资源二维关系获得与当前访问的网络资源相关的权利要求书CN102054003ACN102054010A3/7页4网络资源集合之后,根据各网络资源对中两网络资源的相关度,对所述集合中的网络资源进行排序。14根据权利要求13所述的系统,其特征在于,所述网络资源相关度获得单元包括第一网络资源相关度获得子单元,用于将相同的网络资源对进行合并;根据网络
10、资源对的合并次数,为各个网络资源对进行评分,得到各网络资源对中两网络资源的相关度;和/或,第二网络资源相关度获得子单元,用于根据网络资源对中两网络资源之间的间隔时间,为各个网络资源对进行评分,得到各网络资源对中两网络资源的相关度;和/或,第三网络资源相关度获得子单元,用于通过预置的分类信息为各网络资源生成网络资源特征向量,利用各网络资源的特征向量获得各网络资源对中两网络资源的相关度;所述网络资源特征向量用于描述网络资源属于各类别的置信度。15根据权利要求12或13所述的系统,其特征在于,所述网络资源二维关系为核心索引,所述网络资源推荐单元还包括第二排序子单元,用于根据辅助索引对所述集合中的网络
11、资源进行排序。16根据权利要求15所述的系统,其特征在于所述第二排序子单元包括特征向量生成子单元,用于通过预置的分类信息为各网络资源生成网络资源特征向量,所述网络资源特征向量用于描述网络资源属于各类别的置信度;第一计算子单元,用于分别将各所述相关网络资源的特征向量与用户当前访问的网络资源的特征向量进行内积计算,并根据内积计算的结果对各网络资源进行排序;或者,所述第二排序子单元包括兴趣向量生成子单元,用于通过预置的分类信息为各网络资源生成网络资源特征向量,所述网络资源特征向量用于描述网络资源属于各类别的置信度;根据用户的访问历史获知用户最可能访问的网络资源;将所述用户最可能访问的网络资源的特征向
12、量合并,得到各用户的兴趣向量;所述兴趣向量用于描述用户对各类别的感兴趣程度;第二计算子单元,用于分别将各所述相关网络资源的特征向量与该用户的兴趣向量进行内积计算,并根据内积计算的结果对各网络资源进行排序。17根据权利要求10所述的系统,其特征在于,还包括过滤单元,用于过滤掉无效的网络资源对,所述无效的网络资源对包括内容不相关的网络资源对、访问时间间隔超过预置阈值的网络资源对或者包含有广告导航页的网络资源对。18一种建立网络资源索引的方法,其特征在于,包括获得用户访问网络资源的资源访问记录;将所述用户的资源访问记录中的网络资源拆分为网络资源访问对,每一网络资源访问对包含所述资源访问记录中的两个网
13、络资源信息;汇集各用户的网络资源对,获得网络资源二维关系,建立起网络资源索引。19根据权利要求18所述的方法,其特征在于,还包括获得各网络资源对中两网络资权利要求书CN102054003ACN102054010A4/7页5源的相关度,以便根据所述相关度对所述网络资源进行排序。20根据权利要求19所述的方法,其特征在于,通过以下方式获得各网络资源对中两网络资源的相关度将相同的网络资源对进行合并;根据网络资源对的合并次数,获得各网络资源对中两网络资源的相关度;和/或,根据网络资源对中两网络资源之间的间隔时间,获得各网络资源对中两网络资源的相关度;和/或,通过预置的分类信息为各网络资源生成网络资源特
14、征向量,利用各网络资源的特征向量获得各网络资源对中两网络资源的相关度;所述网络资源特征向量用于描述网络资源属于各类别的置信度。21一种建立网络资源索引的系统,其特征在于,包括资源访问记录获得单元,用于获得用户访问网络资源的资源访问记录;网络资源拆分单元,用于将所述用户的资源访问记录中的网络资源拆分为网络资源访问对,每一网络资源访问对包含所述资源访问记录中的两个网络资源信息;网络资源对汇集单元,用于汇集各用户的网络资源对,获得网络资源二维关系,建立起网络资源索引。22根据权利要求21所述的系统,其特征在于,还包括网络资源相关度获得单元,用于获得各网络资源对中两网络资源的相关度,以便根据所述相关度
15、对所述网络资源进行排序。23根据权利要求22所述的系统,其特征在于,所述网络资源相关度获得单元包括第一网络资源相关度获得子单元,用于将相同的网络资源对进行合并;根据网络资源对的合并次数,获得各网络资源对中两网络资源的相关度;和/或,第二网络资源相关度获得子单元,用于根据网络资源对中两网络资源之间的间隔时间,获得各网络资源对中两网络资源的相关度;和/或,第三网络资源相关度获得子单元,用于通过预置的分类信息为各网络资源生成网络资源特征向量,利用各网络资源的特征向量获得各网络资源对中两网络资源的相关度;所述网络资源特征向量用于描述网络资源属于各类别的置信度。24根据权利要求22所述的系统,其特征在于
16、,还包括第一网络资源相关度修正单元,用于将相同的网络资源对进行合并;根据网络资源对的合并次数,对所述相关度进行修正;和/或,第二网络资源相关度修正单元,用于根据网络资源对中两网络资源之间的间隔时间,对所述相关度进行修正;和/或,第三网络资源相关度修正单元,用于通过预置的分类信息为各网络资源生成网络资源权利要求书CN102054003ACN102054010A5/7页6特征向量,利用各网络资源的特征向量对所述相关度进行修正;所述网络资源特征向量用于描述网络资源属于各类别的置信度;和/或,第四网络资源相关度修正单元,通过预置的分类信息为各网络资源生成网络资源特征向量,所述网络资源特征向量用于描述网
17、络资源属于各类别的置信度;根据用户的访问历史获知用户最可能访问的网络资源;将所述用户最可能访问的网络资源的特征向量合并,得到各用户的兴趣向量;利用各用户的兴趣向量对所述相关度进行修正;所述兴趣向量用于描述用户对各类别的感兴趣程度。25一种网络信息推荐的方法,其特征在于,包括获得访问同一网络资源的用户记录;将所述用户记录中的各用户信息拆分为用户对,每一用户对包含所述用户记录中的两个用户信息;汇集各个网络资源的用户对,建立用户二维关系;当需要为用户进行推荐时,根据所述用户二维关系推荐相关的用户信息。26根据权利要求25所述的方法,其特征在于,所述根据所述用户二维关系推荐相关的用户信息包括根据所述用
18、户二维关系推荐与当前访问的用户相关的用户信息。27根据权利要求25所述的方法,其特征在于,所述根据所述用户二维关系推荐相关的用户信息包括根据所述用户二维关系获得相关的用户集合,根据所述集合向用户推荐相关的用户信息;所述方法还包括获得各用户对中两用户的相关度,在所述根据所述用户二维关系获得相关的用户集合之后还包括根据各用户对中两用户的相关度,对所述集合中的用户进行排序。28根据权利要求27所述的方法,其特征在于,所述用户二维关系为核心索引,还包括根据辅助索引对所述集合中的用户进行排序。29一种网络信息推荐的系统,其特征在于,包括用户记录获得单元,用于获得访问同一网络资源的用户记录;用户拆分单元,
19、用于将所述用户记录中的各用户信息拆分为用户对,每一用户对包含所述用户记录中的两个用户信息;用户对汇集单元,用于汇集各个网络资源的用户对,获得用户二维关系;用户信息推荐单元,用于当需要为用户进行推荐时,根据所述用户二维关系推荐相关的用户信息。30根据权利要求29所述的系统,其特征在于,所述用户信息推荐单元包括第一用户信息推荐子单元,用于根据所述用户二维关系推荐与当前访问的用户相关的用户信息。31根据权利要求29所述的系统,其特征在于,所述用户信息推荐单元包括用户信息集合生成子单元,用于根据所述用户二维关系获得相关的用户集合;第二用户信息推荐子单元,用于根据所述集合向用户推荐相关的用户信息;权利要
20、求书CN102054003ACN102054010A6/7页7或者,所述系统还包括用户相关度获得单元,用于获得各用户对中两用户的相关度;所述用户信息推荐单元还包括第一用户排序子单元,用于根据各用户对中两用户的相关度,对所述集合中的用户进行排序。32根据权利要求31所述的系统,其特征在于,所述用户二维关系为核心索引,所述用户信息推荐单元还包括第二用户排序子单元,用于根据辅助索引对所述集合中的用户进行排序。33一种建立用户索引的方法,其特征在于,包括获得访问同一网络资源的用户记录;将所述用户记录中的各用户拆分为用户对,每一用户对包含所述用户记录中的两个用户;汇集各个网络资源的用户对,获得用户二维关
21、系,建立起用户索引。34根据权利要求33所述的方法,其特征在于,还包括获得各用户对中两用户的相关度。35根据权利要求34所述的方法,其特征在于,通过以下方式获得各用户对中两用户的相关度将相同的用户对进行合并;根据用户对的合并次数,为各个用户对进行评分,得到各用户对的相关度;和/或,通过预置的分类信息为各网络资源生成网络资源特征向量,根据用户的访问历史获知用户最可能访问的网络资源;将所述用户最可能访问的网络资源的特征向量合并,得到各用户的兴趣向量;根据所述用户的兴趣向量获得各用户对中两用户的相关度;所述网络资源特征向量用于描述网络资源属于各类别的置信度;所述兴趣向量用于描述用户对各类别的感兴趣程
22、度。36一种建立用户索引的系统,其特征在于,包括用户记录获得单元,用于获得访问同一网络资源的用户记录;用户拆分单元,用于将所述用户记录中的各用户信息拆分为用户对,每一用户对包含所述用户记录中的两个用户信息;用户对汇集单元,用于汇集各个网络资源的用户对,获得用户二维关系,建立起用户索引。37根据权利要求36所述的系统,其特征在于,还包括用户相关度获得单元,用于获得各用户对中两用户的相关度,以便根据所述相关度对用户进行排序。38根据权利要求37所述的系统,其特征在于,所述用户相关度获得单元包括第一用户相关度获得子单元,用于将相同的用户对进行合并;根据用户对的合并次数,为各个用户对进行评分,得到各用
23、户对的相关度;和/或,第二用户相关度获得子单元,用于通过预置的分类信息为各网络资源生成网络资源特征向量,根据用户的访问历史获知用户最可能访问的网络资源;将所述用户最可能访问的权利要求书CN102054003ACN102054010A7/7页8网络资源的特征向量合并,得到各用户的兴趣向量;根据所述用户的兴趣向量获得各用户对中两用户的相关度;所述网络资源特征向量用于描述网络资源属于各类别的置信度;所述兴趣向量用于描述用户对各类别的感兴趣程度。权利要求书CN102054003ACN102054010A1/21页9网络信息推荐、建立网络资源索引的方法及系统技术领域0001本发明涉及浏览器技术领域,特别
24、是涉及网络信息推荐、建立网络资源索引的方法及系统。背景技术0002现在网络技术飞速发展,互联网上的信息量非常大,因此如何让用户快速找到自己想要或者适合自己的网络信息则成为技术人员迫切需要解决的技术问题。0003为了解决上述技术问题,出现了一种网络信息推荐系统RECOMMENDERSYSTEM,该系统是信息过滤系统的一种。以网页推荐为例,通常需要预先建立网页索引,在需要给用户进行推荐时,在网页索引中检索出可以推荐的网页。现有技术中的网页索引通常是基于关键词建立的,例如,可以预先提取各个网页中具有代表性的关键词,然后按照关键词建立网页索引;当需要进行网页推荐时,提取当前网页中具有代表性的关键词作为
25、检索词,然后在预先建立的索引中检索具有该检索词的网页,然后将检索到的网页推荐给相关用户。0004但是在基于这种索引方式的网络信息推荐系统下,对于不包含检索词的网页,就无法推荐给用户,使得用户获得信息的范围比较狭窄,既限制了信息的利用率,也增加了用户获得有用信息的难度。发明内容0005本发明提供了网络信息推荐、建立网络资源索引的方法及系统,能够提高网络信息的利用率。0006本发明提供了如下方案0007一种网络信息推荐的方法,包括0008获得用户访问网络资源的资源访问记录;0009将所述用户的资源访问记录中的网络资源拆分为网络资源访问对,每一网络资源访问对包含所述资源访问记录中的两个网络资源信息;
26、0010汇集各用户的网络资源对,获得网络资源二维关系;0011当需要为用户进行推荐时,根据所述网络资源二维关系为用户推荐相关的网络资源。0012优选的,所述根据所述网络资源二维关系为用户推荐相关的网络资源包括根据所述网络资源二维关系为用户推荐与当前访问的网络资源相关的网络资源。0013优选的,所述根据所述网络资源二维关系为用户推荐相关的网络资源包括0014根据所述网络资源二维关系获得相关的网络资源集合,根据所述网络资源集合向用户推荐网络资源。0015优选的获得各网络资源对中两网络资源的相关度;在所述根据所述网络资源二维关系获得相关的网络资源集合之后还包括0016根据各网络资源对中两网络资源的相
27、关度,对所述集合中的网络资源进行排序。说明书CN102054003ACN102054010A2/21页100017优选的,通过以下方式获得各网络资源对中两网络资源的相关度0018将相同的网络资源对进行合并;根据网络资源对的合并次数,获得各网络资源对中两网络资源的相关度;0019和/或,0020根据网络资源对中两网络资源之间的间隔时间,获得各网络资源对中两网络资源的相关度;0021和/或,0022通过预置的分类信息为各网络资源生成网络资源特征向量,利用各网络资源的特征向量获得各网络资源对中两网络资源的相关度;所述网络资源特征向量用于描述网络资源属于各类别的置信度。0023优选的,通过以下方式对所
28、述相关度进行修正0024将相同的网络资源对进行合并;根据网络资源对的合并次数,对所述相关度进行修正;0025和/或,0026根据网络资源对中两网络资源之间的间隔时间,对所述相关度进行修正;0027和/或,0028通过预置的分类信息为各网络资源生成网络资源特征向量,利用各网络资源的特征向量对所述相关度进行修正;所述网络资源特征向量用于描述网络资源属于各类别的置信度;0029和/或,0030通过预置的分类信息为各网络资源生成网络资源特征向量,所述网络资源特征向量用于描述网络资源属于各类别的置信度;根据用户的访问历史获知用户最可能访问的网络资源;将所述用户最可能访问的网络资源的特征向量合并,得到各用
29、户的兴趣向量;利用各用户的兴趣向量对所述相关度进行修正;所述兴趣向量用于描述用户对各类别的感兴趣程度。0031优选的,所述网络资源二维关系为核心索引,还包括0032根据辅助索引对所述集合中的网络资源进行排序。0033优选的,所述根据辅助索引对所述集合中的网络资源进行排序包括0034通过预置的分类信息为各网络资源生成网络资源特征向量,所述网络资源特征向量用于描述网络资源属于各类别的置信度;分别将各所述相关网络资源的特征向量与用户当前访问的网络资源的特征向量进行内积计算,并根据内积计算的结果对各网络资源进行排序;0035或者,0036通过预置的分类信息为各网络资源生成网络资源特征向量,所述网络资源
30、特征向量用于描述网络资源属于各类别的置信度;根据用户的访问历史获知用户最可能访问的网络资源;将所述用户最可能访问的网络资源的特征向量合并,得到各用户的兴趣向量;所述兴趣向量用于描述用户对各类别的感兴趣程度;分别将各所述相关网络资源的特征向量与该用户的兴趣向量进行内积计算,并根据内积计算的结果对各网络资源进行排序。0037优选的,所述资源访问记录为资源访问序列。说明书CN102054003ACN102054010A3/21页110038一种网络信息推荐的系统,包括0039资源访问记录获得单元,用于获得用户访问网络资源的资源访问记录;0040网络资源拆分单元,用于将所述用户的资源访问记录中的网络资
31、源拆分为网络资源访问对,每一网络资源访问对包含所述资源访问记录中的两个网络资源信息;0041网络资源对汇集单元,用于汇集各用户的网络资源对,获得网络资源二维关系;0042网络资源推荐单元,用于当需要为用户进行推荐时,根据所述网络资源二维关系为用户推荐相关的网络资源。0043优选的,所述网络资源推荐单元包括0044第一网络资源推荐子单元,用于根据所述网络资源二维关系为用户推荐与当前访问的网络资源相关的网络资源。0045优选的,所述网络资源推荐单元包括0046网络资源集合获得子单元,用于根据所述网络资源二维关系获得与当前访问的网络资源相关的网络资源集合;0047第二网络资源推荐子单元,用于根据所述
32、集合向用户推荐网络资源。0048优选的,还包括0049网络资源相关度获得单元,用于获得各网络资源对中两网络资源的相关度;0050所述网络资源推荐单元还包括0051第一排序子单元,用于根据所述网络资源二维关系获得与当前访问的网络资源相关的网络资源集合之后,根据各网络资源对中两网络资源的相关度,对所述集合中的网络资源进行排序。0052优选的,所述网络资源相关度获得单元包括0053第一网络资源相关度获得子单元,用于将相同的网络资源对进行合并;根据网络资源对的合并次数,为各个网络资源对进行评分,得到各网络资源对中两网络资源的相关度;0054和/或,0055第二网络资源相关度获得子单元,用于根据网络资源
33、对中两网络资源之间的间隔时间,为各个网络资源对进行评分,得到各网络资源对中两网络资源的相关度;0056和/或,0057第三网络资源相关度获得子单元,用于通过预置的分类信息为各网络资源生成网络资源特征向量,利用各网络资源的特征向量获得各网络资源对中两网络资源的相关度;所述网络资源特征向量用于描述网络资源属于各类别的置信度。0058优选的,所述网络资源二维关系为核心索引,所述网络资源推荐单元还包括0059第二排序子单元,用于根据辅助索引对所述集合中的网络资源进行排序。0060优选的0061所述第二排序子单元包括0062特征向量生成子单元,用于通过预置的分类信息为各网络资源生成网络资源特征向量,所述
34、网络资源特征向量用于描述网络资源属于各类别的置信度;第一计算子单元,用于分别将各所述相关网络资源的特征向量与用户当前访问的网络资源的特征向量进行内积计算,并根据内积计算的结果对各网络资源进行排序;说明书CN102054003ACN102054010A4/21页120063或者,0064所述第二排序子单元包括0065兴趣向量生成子单元,用于通过预置的分类信息为各网络资源生成网络资源特征向量,所述网络资源特征向量用于描述网络资源属于各类别的置信度;根据用户的访问历史获知用户最可能访问的网络资源;将所述用户最可能访问的网络资源的特征向量合并,得到各用户的兴趣向量;所述兴趣向量用于描述用户对各类别的感
35、兴趣程度;第二计算子单元,用于分别将各所述相关网络资源的特征向量与该用户的兴趣向量进行内积计算,并根据内积计算的结果对各网络资源进行排序。0066优选的,还包括0067过滤单元,用于过滤掉无效的网络资源对,所述无效的网络资源对包括内容不相关的网络资源对、访问时间间隔超过预置阈值的网络资源对或者包含有广告导航页的网络资源对。0068一种建立网络资源索引的方法,包括0069获得用户访问网络资源的资源访问记录;0070将所述用户的资源访问记录中的网络资源拆分为网络资源访问对,每一网络资源访问对包含所述资源访问记录中的两个网络资源信息;0071汇集各用户的网络资源对,获得网络资源二维关系,建立起网络资
36、源索引。0072优选的,还包括获得各网络资源对中两网络资源的相关度,以便根据所述相关度对所述网络资源进行排序。0073优选的,通过以下方式获得各网络资源对中两网络资源的相关度0074将相同的网络资源对进行合并;根据网络资源对的合并次数,获得各网络资源对中两网络资源的相关度;0075和/或,0076根据网络资源对中两网络资源之间的间隔时间,获得各网络资源对中两网络资源的相关度;0077和/或,0078通过预置的分类信息为各网络资源生成网络资源特征向量,利用各网络资源的特征向量获得各网络资源对中两网络资源的相关度;所述网络资源特征向量用于描述网络资源属于各类别的置信度。0079一种建立网络资源索引
37、的系统,包括0080资源访问记录获得单元,用于获得用户访问网络资源的资源访问记录;0081网络资源拆分单元,用于将所述用户的资源访问记录中的网络资源拆分为网络资源访问对,每一网络资源访问对包含所述资源访问记录中的两个网络资源信息;0082网络资源对汇集单元,用于汇集各用户的网络资源对,获得网络资源二维关系,建立起网络资源索引。0083优选的,还包括0084网络资源相关度获得单元,用于获得各网络资源对中两网络资源的相关度,以便根据所述相关度对所述网络资源进行排序。0085优选的,所述网络资源相关度获得单元包括说明书CN102054003ACN102054010A5/21页130086第一网络资源
38、相关度获得子单元,用于将相同的网络资源对进行合并;根据网络资源对的合并次数,获得各网络资源对中两网络资源的相关度;0087和/或,0088第二网络资源相关度获得子单元,用于根据网络资源对中两网络资源之间的间隔时间,获得各网络资源对中两网络资源的相关度;0089和/或,0090第三网络资源相关度获得子单元,用于通过预置的分类信息为各网络资源生成网络资源特征向量,利用各网络资源的特征向量获得各网络资源对中两网络资源的相关度;所述网络资源特征向量用于描述网络资源属于各类别的置信度。0091优选的,还包括0092第一网络资源相关度修正单元,用于将相同的网络资源对进行合并;根据网络资源对的合并次数,对所
39、述相关度进行修正;0093和/或,0094第二网络资源相关度修正单元,用于根据网络资源对中两网络资源之间的间隔时间,对所述相关度进行修正;0095和/或,0096第三网络资源相关度修正单元,用于通过预置的分类信息为各网络资源生成网络资源特征向量,利用各网络资源的特征向量对所述相关度进行修正;所述网络资源特征向量用于描述网络资源属于各类别的置信度;0097和/或,0098第四网络资源相关度修正单元,通过预置的分类信息为各网络资源生成网络资源特征向量,所述网络资源特征向量用于描述网络资源属于各类别的置信度;根据用户的访问历史获知用户最可能访问的网络资源;将所述用户最可能访问的网络资源的特征向量合并
40、,得到各用户的兴趣向量;利用各用户的兴趣向量对所述相关度进行修正;所述兴趣向量用于描述用户对各类别的感兴趣程度。0099一种网络信息推荐的方法,包括0100获得访问同一网络资源的用户记录;0101将所述用户记录中的各用户信息拆分为用户对,每一用户对包含所述用户记录中的两个用户信息;0102汇集各个网络资源的用户对,建立用户二维关系;0103当需要为用户进行推荐时,根据所述用户二维关系推荐相关的用户信息。0104优选的,所述根据所述用户二维关系推荐相关的用户信息包括0105根据所述用户二维关系推荐与当前访问的用户相关的用户信息。0106优选的,所述根据所述用户二维关系推荐相关的用户信息包括根据所
41、述用户二维关系获得相关的用户集合,根据所述集合向用户推荐相关的用户信息;0107所述方法还包括获得各用户对中两用户的相关度,在所述根据所述用户二维关系获得相关的用户集合之后还包括根据各用户对中两用户的相关度,对所述集合中的用户进行排序。0108优选的,所述用户二维关系为核心索引,还包括说明书CN102054003ACN102054010A6/21页140109根据辅助索引对所述集合中的用户进行排序。0110一种网络信息推荐的系统,包括0111用户记录获得单元,用于获得访问同一网络资源的用户记录;0112用户拆分单元,用于将所述用户记录中的各用户信息拆分为用户对,每一用户对包含所述用户记录中的两
42、个用户信息;0113用户对汇集单元,用于汇集各个网络资源的用户对,获得用户二维关系;0114用户信息推荐单元,用于当需要为用户进行推荐时,根据所述用户二维关系推荐相关的用户信息。0115优选的,所述用户信息推荐单元包括0116第一用户信息推荐子单元,用于根据所述用户二维关系推荐与当前访问的用户相关的用户信息。0117优选的,所述用户信息推荐单元包括用户信息集合生成子单元,用于根据所述用户二维关系获得相关的用户集合;第二用户信息推荐子单元,用于根据所述集合向用户推荐相关的用户信息;0118或者,0119所述系统还包括用户相关度获得单元,用于获得各用户对中两用户的相关度;所述用户信息推荐单元还包括
43、第一用户排序子单元,用于根据各用户对中两用户的相关度,对所述集合中的用户进行排序。0120优选的,所述用户二维关系为核心索引,所述用户信息推荐单元还包括0121第二用户排序子单元,用于根据辅助索引对所述集合中的用户进行排序。0122一种建立用户索引的方法,包括0123获得访问同一网络资源的用户记录;0124将所述用户记录中的各用户拆分为用户对,每一用户对包含所述用户记录中的两个用户;0125汇集各个网络资源的用户对,获得用户二维关系,建立起用户索引。0126优选的,还包括0127获得各用户对中两用户的相关度。0128优选的,通过以下方式获得各用户对中两用户的相关度0129将相同的用户对进行合并
44、;根据用户对的合并次数,为各个用户对进行评分,得到各用户对的相关度;0130和/或,0131通过预置的分类信息为各网络资源生成网络资源特征向量,根据用户的访问历史获知用户最可能访问的网络资源;将所述用户最可能访问的网络资源的特征向量合并,得到各用户的兴趣向量;根据所述用户的兴趣向量获得各用户对中两用户的相关度;所述网络资源特征向量用于描述网络资源属于各类别的置信度;所述兴趣向量用于描述用户对各类别的感兴趣程度。0132一种建立用户索引的系统,包括0133用户记录获得单元,用于获得访问同一网络资源的用户记录;0134用户拆分单元,用于将所述用户记录中的各用户信息拆分为用户对,每一用户对说明书CN
45、102054003ACN102054010A7/21页15包含所述用户记录中的两个用户信息;0135用户对汇集单元,用于汇集各个网络资源的用户对,获得用户二维关系,建立起用户索引。0136优选的,还包括0137用户相关度获得单元,用于获得各用户对中两用户的相关度,以便根据所述相关度对用户进行排序。0138优选的,所述用户相关度获得单元包括0139第一用户相关度获得子单元,用于将相同的用户对进行合并;根据用户对的合并次数,为各个用户对进行评分,得到各用户对的相关度;0140和/或,0141第二用户相关度获得子单元,用于通过预置的分类信息为各网络资源生成网络资源特征向量,根据用户的访问历史获知用户
46、最可能访问的网络资源;将所述用户最可能访问的网络资源的特征向量合并,得到各用户的兴趣向量;根据所述用户的兴趣向量获得各用户对中两用户的相关度;所述网络资源特征向量用于描述网络资源属于各类别的置信度;所述兴趣向量用于描述用户对各类别的感兴趣程度。0142根据本发明提供的具体实施例,本发明公开了以下技术效果0143本发明将用户的访问序列拆分为网络资源对;获得用户访问网络资源的资源访问记录;将所述用户的资源访问记录中的网络资源拆分为网络资源访问对,每一网络资源访问对包含所述资源访问记录中的两个网络资源信息;汇集各用户的网络资源对,获得网络资源二维关系;当需要为用户进行推荐时,根据所述网络资源二维关系
47、为用户推荐相关的网络资源。由于可以基于所有用户的访问序列建立网络资源二维关系,而众多用户的访问行为通常可以遍及全网,因此,不会局限在特定数据集中,而是可以在全网范围内建立二维的网络资源索引,因此,可以便于在全网范围内进行相关检索。如果推荐系统中应用本发明实施例所建立的二维索引结构,则进行信息推荐时,可以在全网范围内向用户进行推荐,因此,能够扩大用户获得信息的范围,提高信息的利用率,降低了用户获得有用信息的难度。0144另外,还可以通过生成网络资源的特征向量及用户的兴趣向量,来建立辅助索引,以便于优化检索结果,还可以对二维网络资源索引进行修正。附图说明0145图1是本发明实施例提供的建立网络信息
48、索引方法的流程图;0146图2是本发明实施例提供的网络信息推荐方法的流程图;0147图3是本发明实施例提供的建立用户索引方法的流程图;0148图4是本发明实施例提供的另一网络信息推荐方法的流程图;0149图5是本发明实施例提供的网络信息推荐系统的示意图;0150图6是本发明实施例提供的另一网络信息推荐系统的示意图;0151图7是本发明实施例提供的建立网络信息索引系统的示意图;0152图8是本发明实施例提供的建立用户索引系统的示意图。说明书CN102054003ACN102054010A8/21页16具体实施方式0153为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式
49、对本发明作进一步详细的说明。0154实施例一、为了扩大用户获得信息的范围,提高信息的利用率,在该实施例中,首先提供了一种建立网络资源索引的方法,参见图1,本发明实施例提供的建立网络资源索引的方法包括以下步骤0155S101获得用户访问网络资源的资源访问记录;0156其中,本发明实施例中提到的网络资源可以一个网页,也可以是网络中的一个视频、音频或图片等等,只要是互联网上能够展现给用户的信息,都属于本发明限定的网络资源范畴。所述网页就是通常在网页浏览器IE等中打开的网页,其内容可能包括视频、音频、图片、文字、FLASH等多种元素;同时,所述网络资源也可以是不依附于网页而独立存在的视频、音频、图片、
50、文字、FLASH等。0157首先需要说明的是,本发明实施例可以由浏览器的服务器来完成建立网络资源索引的过程。由于,用户通常是通过浏览器访问网络资源,因此,浏览器能够记录大多数用户的访问日志,包括用户通过浏览器浏览所有网络资源的URL、访问时间、停留时间等等。0158S102将所述用户的资源访问记录中的网络资源拆分为网络资源访问对,每一网络资源访问对包含所述资源访问记录中的两个网络资源信息;0159所述资源访问记录中记录了用户访问过的网络资源集合,将该集合中的网络资源两两组成网络资源对即可。0160由于用户在访问网络资源时,会有一定的时序关系,浏览器能够记录这种时序关系根据访问时间,因此可以产生
copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1