基于社交网络的内容推荐方法和系统.pdf

上传人:b*** 文档编号:625637 上传时间:2018-02-26 格式:PDF 页数:18 大小:1.99MB
返回 下载 相关 举报
摘要
申请专利号:

CN201410308039.X

申请日:

2014.06.30

公开号:

CN104063476A

公开日:

2014.09.24

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):G06F 17/30申请日:20140630|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

北京奇虎科技有限公司; 奇智软件(北京)有限公司

发明人:

周楠; 常富洋; 秦吉胜

地址:

100088 北京市西城区新街口外大街28号D座112室(德胜园区)

优先权:

专利代理机构:

北京鼎佳达知识产权代理事务所(普通合伙) 11348

代理人:

王伟锋;刘铁生

PDF下载: PDF下载
内容摘要

本发明关于一种基于社交网络的内容推荐方法和系统,涉及信息技术领域,主要目的在于针对不同类型的用户进行其感兴趣的内容推送。方法包括:提取社交网络数据的特征;根据某一类型的用户对社交网络数据的行为,计算并记录社交网络数据的特征对于类型的用户的兴趣权值;提取多个待推送内容的特征;从已记录的特征及兴趣权值中,查找多个待推送内容的特征的兴趣权值,并计算出多个待推送内容对于类型的用户的兴趣得分;根据多个待推送内容对于类型的用户的兴趣得分的高低,对类型的用户进行内容推送。通过本发明,可以分析不同类型用户的兴趣所在,并将符合用户兴趣的内容推送给用户。

权利要求书

1.  一种基于社交网络的内容推荐方法,其包括:
提取社交网络数据的特征;
根据某一类型的用户对所述社交网络数据的行为,计算并记录所述社交网络数据的特征对于所述类型的用户的兴趣权值;
提取多个待推送内容的特征;
从已记录的特征及兴趣权值中,查找所述多个待推送内容的特征的兴趣权值,并计算出所述多个待推送内容对于所述类型的用户的兴趣得分;
根据所述多个待推送内容对于所述类型的用户的兴趣得分的高低,对所述类型的用户进行内容推送。

2.
  根据权利要求1所述的基于社交网络的内容推荐方法,其中,还包括:
根据所述类型的用户对所述多个待推送内容的点击行为,重新确定所述多个待推送内容的兴趣得分;
按重新确定的兴趣得分,计算所述多个待推送内容的特征的兴趣权值并进行记录。

3.
  根据权利要求1-2任一项所述的基于社交网络的内容推荐方法,其中,所述社交网络数据包括社交网络账号,所述社交网络数据的特征包括所述社交网络账号的类别和主题,所述类型的用户对所述社交网络数据的行为包括对相同类别或相同主题的所述社交网络账号的关注行为。

4.
  根据权利要求1-3任一项所述的基于社交网络的内容推荐方法,其中,所述社交网络数据包括社交网络账号发布的社交内容,所述社交网络数据的特征包括所述社交内容的类别和主题,所述类型的用户对所述社交网络数据的行为包括对相同类别或相同主题的所述社交内容的转发行为。

5.
  根据权利要求1-4任一项所述的基于社交网络的内容推荐方法,其中,所述社交网络数据包括社交网络账号发布的URL,所述社交网络数据的特征包括所述URL指向的推送内容的类别和主题,所述类型的用户对所述社交网络数据的行为包括对相同类别或相同主题的推送内容的URL的点击行为,或 对相同类别或相同主题的推送内容上的页面标签的点击行为。

6.
  根据权利要求1-5任一项所述的基于社交网络的内容推荐方法,其中,所述社交网络数据包括社交网络账号发布的URL,所述社交网络数据的特征包括所述URL中包含的域名的类别,所述类型的用户对所述社交网络数据的行为包括对相同类别的域名对应的URL的点击行为。

7.
  一种基于社交网络的内容推荐系统,其包括:
第一特征提取模块,用于提取社交网络数据的特征;
兴趣权值计算模块,用于根据某一类型的用户对所述社交网络数据的行为,计算并记录所述社交网络数据的特征对于所述类型的用户的兴趣权值;
第二特征提取模块,用于提取多个待推送内容的特征;
兴趣得分计算模块,用于从已记录的特征及兴趣权值中,查找所述多个待推送内容的特征的兴趣权值,并计算出所述多个待推送内容对于所述类型的用户的兴趣得分;
内容待推荐模块,用于根据所述多个待推送内容对于所述类型的用户的兴趣得分的高低,对所述类型的用户进行内容推送。

8.
  根据权利要求7所述的基于社交网络的内容推荐系统,其中,还包括:
第一重新确定模块,用于根据所述类型的用户对所述多个待推送内容的点击行为,重新确定所述多个待推送内容的兴趣得分;
第二重新确定模块,用于按重新确定的兴趣得分,计算所述多个待推送内容的特征的兴趣权值并进行记录。

9.
  根据权利要求7-8任一项所述的基于社交网络的内容推荐系统,其中,所述社交网络数据包括社交网络账号,所述社交网络数据的特征包括所述社交网络账号的类别和主题,所述类型的用户对所述社交网络数据的行为包括对相同类别或相同主题的所述社交网络账号的关注行为。

10.
  根据权利要求7-9任一项所述的基于社交网络的内容推荐系统,其中,所述社交网络数据包括社交网络账号发布的社交内容,所述社交网络数据的特征包括所述社交内容的类别和主题,所述类型的用户对所述社交网络数据 的行为包括对相同类别或相同主题的所述社交内容的转发行为。

说明书

基于社交网络的内容推荐方法和系统
技术领域
本发明涉及信息技术领域,具体而言,涉及一种基于社交网络的内容推荐方法和系统。
背景技术
获取新闻和资讯是现代社会中人们的生活习惯,随着计算机技术的发展和互联网用户规模的不断扩大,越来越多的人使用通过互联网获得各种各样所需的信息。同时,通过互联网提供新闻和资讯服务的网站也越来越多,越来越多的突发新闻和事件是通过互联网得到迅速传播的,互联网信息呈现出爆发式的增长趋势。近些年来,移动互联网的快速发展使得用户的阅读时间变得越来越碎片化,在这种背景下,如何在海量的信息中筛选出最有价值的信息,向用户个性化推荐其最感兴趣的新闻和资讯,就变得极其重要。
现在的互联网新闻资讯阅读产品主要包括web(网页)端和移动app(应用程序)端,从新闻和资讯的整合方式来看,大部分依然是人工编辑和分类浏览的形式,这种方式的阅读会使用户浏览到大量不感兴趣的新闻和资讯,浪费用户的时间,同时产品本身也需要大量的编辑来进行新闻和资讯的更新和维护;以google reader为代表的订阅类新闻阅读产品是不同于上述产品的另外一种产品形式,用户可以订阅自己感兴趣的网站的内容进行阅读和浏览,这种阅读形式减少了用户浏览到不感兴趣的内容的可能性,但是用户需要自己寻找自己感兴趣的内容和网站进行一系列设置,而对于大多数互联网用户来说,他们不喜欢这种繁琐的方式。
为了使得用户在短时间内以便捷的方式获取有价值和感兴趣的新闻和资讯,必须采取一种更加智能的方式去提供给用户所需的信息,针对不同的用户推荐用户感兴趣和有价值的新闻和资讯。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的基于社交网络的内容推荐方法和系统。
依据本发明的一个方面,提供了一种基于社交网络的内容推荐方法,其包括:提取社交网络数据的特征;根据某一类型的用户对所述社交网络数据的行为,计算并记录所述社交网络数据的特征对于所述类型的用户的兴趣权值;提取多个待推送内容的特征;从已记录的特征及兴趣权值中,查找所述多个待推送内容的特征的兴趣权值,并计算出所述多个待推送内容对于所述类型的用户的兴趣得分;根据所述多个待推送内容对于所述类型的用户的兴趣得分的高低,对所述类型的用户进行内容推送。
可选地,前述的基于社交网络的内容推荐方法,其中,还包括:根据所述类型的用户对所述多个待推送内容的点击行为,重新确定所述多个待推送内容的兴趣得分;按重新确定的兴趣得分,计算所述多个待推送内容的特征的兴趣权值并进行记录。
可选地,前述的基于社交网络的内容推荐方法,其中,所述社交网络数据包括社交网络账号,所述社交网络数据的特征包括所述社交网络账号的类别和主题,所述类型的用户对所述社交网络数据的行为包括对相同类别或相同主题的所述社交网络账号的关注行为。
可选地,前述的基于社交网络的内容推荐方法,其中,所述社交网络数据包括社交网络账号发布的社交内容,所述社交网络数据的特征包括所述社交内容的类别和主题,所述类型的用户对所述社交网络数据的行为包括对相同类别或相同主题的所述社交内容的转发行为。
可选地,前述的基于社交网络的内容推荐方法,其中,所述社交网络数据包括社交网络账号发布的URL,所述社交网络数据的特征包括所述URL指向的推送内容的类别和主题,所述类型的用户对所述社交网络数据的行为包括对相同类别或相同主题的推送内容的URL的点击行为,或对相同类别或相同主题的推送内容上的页面标签的点击行为。
可选地,前述的基于社交网络的内容推荐方法,其中,所述社交网络数 据包括社交网络账号发布的URL,所述社交网络数据的特征包括所述URL中包含的域名的类别,所述类型的用户对所述社交网络数据的行为包括对相同类别的域名对应的URL的点击行为。
可选地,前述的基于社交网络的内容推荐方法,其中,第i个待推送内容的兴趣得分为:
P=ab+e-g(Vi)]]>
其中,Vi=x1×w1+x2×w2+…+xN×wN,其中,w1……wN为第i个待推送内容的N个特征,x1……xN为对应所述N个特征的兴趣权值,a为第一常数,b为第二常数,e、g均为固定常数。
依据本发明的另一方面,还提供了一种基于社交网络的内容推荐系统,其包括:第一特征提取模块,用于提取社交网络数据的特征;兴趣权值计算模块,用于根据某一类型的用户对所述社交网络数据的行为,计算并记录所述社交网络数据的特征对于所述类型的用户的兴趣权值;第二特征提取模块,用于提取多个待推送内容的特征;兴趣得分计算模块,用于从已记录的特征及兴趣权值中,查找所述多个待推送内容的特征的兴趣权值,并计算出所述多个待推送内容对于所述类型的用户的兴趣得分;内容待推荐模块,用于根据所述多个待推送内容对于所述类型的用户的兴趣得分的高低,对所述类型的用户进行内容推送。
可选地,前述的基于社交网络的内容推荐系统,其中,还包括:第一重新确定模块,用于根据所述类型的用户对所述多个待推送内容的点击行为,重新确定所述多个待推送内容的兴趣得分;第二重新确定模块,用于按重新确定的兴趣得分,计算所述多个待推送内容的特征的兴趣权值并进行记录。
可选地,前述的基于社交网络的内容推荐系统,其中,所述社交网络数据包括社交网络账号,所述社交网络数据的特征包括所述社交网络账号的类别和主题,所述类型的用户对所述社交网络数据的行为包括对相同类别或相同主题的所述社交网络账号的关注行为。
可选地,前述的基于社交网络的内容推荐系统,其中,所述社交网络数据包括社交网络账号发布的社交内容,所述社交网络数据的特征包括所述社 交内容的类别和主题,所述类型的用户对所述社交网络数据的行为包括对相同类别或相同主题的所述社交内容的转发行为。
可选地,前述的基于社交网络的内容推荐系统,其中,所述社交网络数据包括社交网络账号发布的URL,所述社交网络数据的特征包括所述URL指向的推送内容的类别和主题,所述类型的用户对所述社交网络数据的行为包括对相同类别或相同主题的推送内容的URL的点击行为,或对相同类别或相同主题的推送内容上的页面标签的点击行为。
可选地,前述的基于社交网络的内容推荐系统,其中,所述社交网络数据包括社交网络账号发布的URL,所述社交网络数据的特征包括所述URL中包含的域名的类别,所述类型的用户对所述社交网络数据的行为包括对相同类别的域名对应的URL的点击行为。
可选地,前述的基于社交网络的内容推荐系统,其中,第i个待推送内容的兴趣得分为:
P=ab+e-g(Vi)]]>
其中,Vi=x1×w1+x2×w2+…+xN×wN,其中,w1……wN为第i个待推送内容的N个特征,x1……xN为对应所述N个特征的兴趣权值,a为第一常数,b为第二常数,e、g均为固定常数。
在本发明的基于社交网络的内容推荐方法和系统中,由于不同类型用户在网络上的社交行为,能够反映对该类型用户的兴趣所在,所以基于不同类型用户对社交网络数据的行为,分析得到社交网络数据特征对于不同类型用户的兴趣权值,以及计算出待推送内容对不同类型用户的兴趣得分,实际上是合理分析出了不同类型用户对待推送内容的兴趣高低,按兴趣高低对不同类型的用户进行推荐;本发明的技术方案给用户展示推荐内容,大大减少了人工编辑的工作量,对用户而言,提升了推荐内容的可读性,减少了大量用户不喜欢的推荐内容,节约了用户的时间,推荐质量的提高也会带动更多的用户,提高了推荐内容的点击率,最终带来推送流量的稳步提升。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它 目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明的一个实施例的基于社交网络的内容推荐方法的流程图;
图2示出了根据本发明的一个实施例的基于社交网络的内容推荐方法的流程图;
图3示出了根据本发明的一个实施例的基于社交网络的内容推荐方法的工作流程图;
图4示出了根据本发明的一个实施例的基于社交网络的内容推荐系统的框图;
图5示出了根据本发明的一个实施例的基于社交网络的内容推荐系统的框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
如图1所示,本发明的一个实施例提供了一种基于社交网络的内容推荐方法,其包括:
步骤110,提取社交网络数据的特征。本实施例中对于社交网络数据的类型不做限定,例如,可以是用户所使用的社交网站、社交工具,例如微博、博客等,本实施例对社交网络数据的特征也不进行限定,例如,可以是社交 网站、社交工具的名称、分类、标签内容等。
步骤120,根据某一类型的用户对社交网络数据的行为,计算并记录社交网络数据的特征对于上述类型的用户的兴趣权值。例如,用户在社交网络上频繁发出体育类消息,由此可见用户对体育类内容具有较高的兴趣。
步骤130,提取多个待推送内容的特征。本实施例中的待推送内容包括但不限于新闻以及资讯,或其他形式的信息。
步骤140,从已记录的特征及兴趣权值中,查找多个待推送内容的特征的兴趣权值,并计算出多个待推送内容对于上述类型的用户的兴趣得分。在本实施例的技术方案中,依据前述的社交网络数据的特征以及相应的兴趣权值可以建立用户的兴趣模型,通过兴趣模型可以选择出需要推送给用户的候选推送内容。
步骤150,根据多个待推送内容对于上述类型的用户的兴趣得分的高低,对上述类型的用户进行内容推送。本实施例中,基于兴趣得分对待推送内容进行排序,根据排序结果可以确定最终要推荐给用户的内容集合以及顺序。
在本实施例的技术方案中,基于兴趣得分的高低,也即不同类型用户对于待推送内容的兴趣高低进行内容推送,大大减少了人工编辑的工作量,对用户而言,提升了推荐内容的可读性,减少了大量用户不喜欢的推荐内容,节约了用户的时间,推荐质量的提高也会带动更多的用户,提高了每条推荐内容的点击率,最终带来推送流量的稳步提升。
如图2所示,本发明的另一实施例还提供了一种基于社交网络的内容推荐方法,其中,还包括:
步骤160,根据上述类型的用户对多个待推送内容的点击行为,重新确定多个待推送内容的兴趣得分。
步骤170,按重新确定的兴趣得分,计算多个待推送内容的特征的兴趣权值并进行记录。
在本实施例的技术方案中,如果用户点击阅读了推送内容,说明推送准确;但如用户对推送的某条内容点击了不感兴趣的按钮或忽略推送内容,表 示用户对于该内容所对应的分类或主题等特征具有较低兴趣,此时根据用户的实际行为估算该内容的兴趣得分,并反向修正该内容中的特征的兴趣权值,以便于在以后使得计算的兴趣得分与用户的实际兴趣更符合。
本发明的另一实施例还提供了一种基于社交网络的内容推荐方法,其中,社交网络数据包括社交网络账号,社交网络数据的特征包括社交网络账号的类别和主题,上述类型的用户对社交网络数据的行为包括对相同类别或相同主题的社交网络账号的关注行为。
在本实施例的技术方案中,以目前流行的微博为例,如用户关注某一媒体账号或者名人账号,则表示用户对该类型或主题的微博账号感兴趣,用户对同一标签下的微博账号关注的越多,则可设置较高的兴趣权值。目前微博账号均可设置对应的类别、主题或是其他形式的标签;也可以预先为不同微博账号制定至少一个标签,并在标签中记录微博账号的特征,微博账号的标签可以存储在数据库中,以在需要时进行提取。
本发明的另一实施例还提供了一种基于社交网络的内容推荐方法,其中,社交网络数据包括社交网络账号发布的社交内容,社交网络数据的特征包括社交内容的类别和主题,上述类型的用户对社交网络数据的行为包括对相同类别或相同主题的社交内容的转发行为。
在本实施例的技术方案中,以目前流行的微博发出的正文为例,如用户对某一类别或主题的微博账号的正文的转发次数越多,则表示用户对该类别或主题的微博账号的正文具有较高的兴趣,则可以设置较高的兴趣权值。
本发明的另一实施例还提供了一种基于社交网络的内容推荐方法,其中,社交网络数据包括社交网络账号发布的URL,社交网络数据的特征包括URL指向的推送内容的类别和主题,上述类型的用户对社交网络数据的行为包括对相同类别或相同主题的推送内容的URL的点击行为,或对相同类别或相同主题的推送内容上的页面标签的点击行为。
在本实施例的技术方案中,可以预先为不同推送内容设置类别标签,例如,如果推送内容为体育资讯,则其标签设置为体育标签。域名的类别标签可预先存储在数据库中。在本实施例的技术方案中,用户点击了某社交账号发布的URL指向的新闻,则表示用户对于该域名的类别和主题感兴趣,则可以设置较高的兴趣权值。
本发明的另一实施例还提供了一种基于社交网络的内容推荐方法,其中,社交网络数据包括社交网络账号发布的URL,社交网络数据的特征包括URL中包含的域名的类别,上述类型的用户对社交网络数据的行为包括对相同类别的域名对应的URL的点击行为。
在本实施例的技术方案中,可以预先为不同域名设置类别标签,例如,一个域名的类别标签通常是这个域名下的网页所包含的网页的信息类别,比如sports.abc.com,其下的网页可能包含了各个方面的体育信息,则可以把此域名的类别标签确定为“体育”。域名的类别标签可预先存储在数据库中。
在本实施例的技术方案中,用户点击了某社交账号发布的URL指向的新闻,则表示用户对于该域名的类别和主题感兴趣,则可以设置较高的兴趣权值。
本发明的另一实施例还提供了一种基于社交网络的内容推荐方法,其中,第i个待推送内容的兴趣得分为:
P=ab+e-g(Vi)]]>
其中,Vi=x1×w1+x2×w2+…+xN×wN,其中,w1……wN为第i个待推送内容的N个特征,x1……xN为对应N个特征的兴趣权值,a为第一常数,b为第二常数,e、g均为固定常数。
在本实施例的技术方案中,基于上述的得分公式,可以实现一排序模型,该模型利用上述公式计算兴趣得分。排序模型实际上是一个逻辑回归分类器,该逻辑回归分类器的输入是一条推送内容的特征,输出是一条推送内容针对某一类型的用户的兴趣得分,得分越高表示该类型用户对这条推送内容可能 越感兴趣。每条推送内容可以抽象为一个特征向量,向量的每个维度表示该条推送内容的主题、分类,甚至关键词、热度等多个特征。
假设我们已经根据上述的兴趣权值得到模型系数向量为x={x1,x2,...,xN},则可将用来进行推送内容兴趣值计算的逻辑回归分类器表示为:
P(Y=1|newsi)=11+e-g(V)]]>
其中,v=xw,X表示上述类型的用户对应的模型系数向量,W表示推送内容的特征向量,上述等式的左边的意义是当向用户推荐一条推送内容newsi时,用户点击的可能性,所以计算得到的右边的兴趣得分可以作为对上述类型用户推送内容的依据。
结合前述的实施例,在用户对推送内容进行处理的情况下,W已知/X未知,求X。
根据用户的点击行为的反馈,可以得到用户点击过的推送内容集合和一批向用户推送过但是用户没有点击的内容集合,对于用户点击过的推送内容newsc,可以得到:
P(Y=1|newsc)=11+e-g(Vc)=1]]>
对于用户没有点击过的推送内容newsd,可以得到:
P(Y=1|newsd)=11+e-g(Vd)=0]]>
这样根据一个用户对m条推送内容点击记录,我们就得到了m个形式如上所述两个表达式的式子,联立求解,即可得到该用户的排序模型系数向量X,也即修正了兴趣权值。
在兴趣权值修正之后,设模型系数向量为{x1,x2,...,xN},将候选的推送内容集合中的每一条推送内容提取得到对应的特征向量Wi={w1,w2,...,wN},带入到模型中:
P(Y=1|newsi)=11+e-g(Vi)]]>
其中,Vi=x1*w1+x2*w2+…+xN*wN,计算则可得到P(Y=1|newsi)。这个值就是该用户对此条内容的兴趣得分。根据候选推送内容兴趣得分的高低可以确定给该用户推荐内容的先后顺序,由此可见,本实施例的技术方案中根据用户对推送内容的实际点击行为,修正了兴趣权值,有利于再次更加准确地对用户进行内容推送,最终本实施例结合前述实施例得到的技术方案,其工作流程如图3所示。
需要说明的是,上述各个公式并不是实现本发明的唯一公式,仅作为实施例的一种实现方式。技术人员可以根据业务需要对公式做适当变形,依然落在本发明的范围之内,例如增添参数或倍数值等。
如图4所示,本发明的另一实施还提供了一种基于社交网络的内容推荐系统,其包括:
第一特征提取模块410,用于提取社交网络数据的特征。本实施例中对于社交网络数据的类型不做限定,例如,可以是用户所使用的社交网站、社交工具,例如微博、博客等,本实施例对社交网络数据的特征也不进行限定,例如,可以是社交网站、社交工具的名称、分类、标签内容等。
兴趣权值计算模块420,用于根据某一类型的用户对社交网络数据的行为,计算并记录社交网络数据的特征对于上述类型的用户的兴趣权值。例如,用户在社交网络上频繁发出体育类消息,由此可见用户对体育类内容具有较高的兴趣。
第二特征提取模块430,用于提取多个待推送内容的特征。本实施例中的待推送内容包括但不限于新闻以及资讯,或其他形式的信息。
兴趣得分计算模块440,用于从已记录的特征及兴趣权值中,查找多个待推送内容的特征的兴趣权值,并计算出多个待推送内容对于上述类型的用户的兴趣得分。在本实施例的技术方案中,依据前述的社交网络数据的特征以及相应的兴趣权值可以建立用户的兴趣模型,通过兴趣模型可以选择出需要推送给用户的候选推送内容。
内容待推荐模块450,用于根据多个待推送内容对于上述类型的用户的兴 趣得分的高低,对上述类型的用户进行内容推送。本实施例中,基于兴趣得分对待推送内容进行排序,根据排序结果可以确定最终要推荐给用户的内容集合以及顺序。
在本实施例的技术方案中,基于兴趣得分的高低,也即不同类型用户对于待推送内容的兴趣高低进行内容推送,大大减少了人工编辑的工作量,对用户而言,提升了推荐内容的可读性,减少了大量用户不喜欢的推荐内容,节约了用户的时间,推荐质量的提高也会带动更多的用户,提高了每条推荐内容的点击率,最终带来推送流量的稳步提升。
如图5所示,本发明的另一实施例还提供了一种基于社交网络的内容推荐系统,其中,还包括:
第一重新确定模块460,用于根据上述类型的用户对多个待推送内容的点击行为,重新确定多个待推送内容的兴趣得分。
第二重新确定模块470,用于按重新确定的兴趣得分,计算多个待推送内容的特征的兴趣权值并进行记录。
在本实施例的技术方案中,如果用户点击阅读了推送内容或忽略推送内容,说明推送准确;但如用户对推送的某条内容点击了不感兴趣的按钮,表示用户对于该内容所对应的分类或主题等特征具有较低兴趣,此时根据用户的实际行为估算该内容的兴趣得分,并反向修正该内容中的特征的兴趣权值,以便于在以后使得计算的兴趣得分与用户的实际兴趣更符合。
本发明的另一实施例还提供了一种基于社交网络的内容推荐系统,其中,社交网络数据包括社交网络账号,社交网络数据的特征包括社交网络账号的类别和主题,上述类型的用户对社交网络数据的行为包括对相同类别或相同主题的社交网络账号的关注行为。
在本实施例的技术方案中,以目前流行的微博为例,如用户关注某一媒体账号或者名人账号,则表示用户对该类型或主题的微博账号感兴趣,用户对同一标签下的微博账号关注的越多,则可设置较高的兴趣权值。目前微博 账号均可设置对应的类别、主题或是其他形式的标签;也可以预先为不同微博账号制定至少一个标签,并在标签中记录微博账号的特征,微博账号的标签可以存储在数据库中,以在需要时进行提取。
本发明的另一实施例还提供了一种基于社交网络的内容推荐系统,其中,社交网络数据包括社交网络账号发布的社交内容,社交网络数据的特征包括社交内容的类别和主题,上述类型的用户对社交网络数据的行为包括对相同类别或相同主题的社交内容的转发行为。
在本实施例的技术方案中,以目前流行的微博发出的正文为例,如用户对某一类别或主题的微博账号的正文的转发次数越多,则表示用户对该类别或主题的微博账号的正文具有较高的兴趣,则可以设置较高的兴趣权值。
本发明的另一实施例还提供了一种基于社交网络的内容推荐系统,其中,社交网络数据包括社交网络账号发布的URL,社交网络数据的特征包括URL指向的推送内容的类别和主题,上述类型的用户对社交网络数据的行为包括对相同类别或相同主题的推送内容的URL的点击行为,或对相同类别或相同主题的推送内容上的页面标签的点击行为。
在本实施例的技术方案中,可以预先为不同推送内容设置类别标签,例如,如果推送内容为体育资讯,则其标签设置为体育标签。域名的类别标签可预先存储在数据库中。在本实施例的技术方案中,用户点击了某社交账号发布的URL指向的新闻,则表示用户对于该域名的类别和主题感兴趣,则可以设置较高的兴趣权值。
本发明的另一实施例还提供了一种基于社交网络的内容推荐系统,其中,社交网络数据包括社交网络账号发布的URL,社交网络数据的特征包括URL中包含的域名的类别,上述类型的用户对社交网络数据的行为包括对相同类别的域名对应的URL的点击行为。
在本实施例的技术方案中,可以预先为不同域名设置类别标签,例如, 一个域名的类别标签通常是这个域名下的网页所包含的网页的信息类别,比如sports.abc.com,其下的网页可能包含了各个方面的体育信息,则可以把此域名的类别标签确定为“体育”。域名的类别标签可预先存储在数据库中。
在本实施例的技术方案中,用户点击了某社交账号发布的URL指向的新闻,则表示用户对于该域名的类别和主题感兴趣,则可以设置较高的兴趣权值。
本发明的另一实施例还提供了一种基于社交网络的内容推荐系统,其中,第i个待推送内容的兴趣得分为:
P=ab+e-g(Vi)]]>
其中,Vi=x1×w1+x2×w2+…+xN×wN,其中,w1……wN为第i个待推送内容的N个特征,x1……xN为对应N个特征的兴趣权值,a为第一常数,b为第二常数,e、g均为固定常数。
在本实施例的技术方案中,基于上述的得分公式,可以实现一排序模型,该模型利用上述公式计算兴趣得分。排序模型实际上是一个逻辑回归分类器,该逻辑回归分类器的输入是一条推送内容的特征,输出是一条推送内容针对某一类型的用户的兴趣得分,得分越高表示该类型用户对这条推送内容可能越感兴趣。每条推送内容可以抽象为一个特征向量,向量的每个维度表示该条推送内容的主题、分类,甚至关键词、热度等多个特征。
假设我们已经根据上述的兴趣权值得到模型系数向量为x={x1,x2,...,xN},则可将用来进行推送内容兴趣值计算的逻辑回归分类器表示为:
P(Y=1|newsi)=11+e-g(V)]]>
其中,v=xw,X表示上述类型的用户对应的模型系数向量,W表示推送内容的特征向量,上述等式的左边的意义是当向用户推荐一条推送内容newsi时,用户点击的可能性,所以计算得到的右边的兴趣得分可以作为对上述类型用户推送内容的依据。
结合前述的实施例,在用户对推送内容进行处理的情况下,W已知/X未 知,求X。
根据用户的点击行为的反馈,可以得到用户点击过的推送内容集合和一批向用户推送过但是用户没有点击的内容集合,对于用户点击过的推送内容newsc,可以得到:
P(Y=1|newsc)=11+e-g(Vc)=1]]>
对于用户没有点击过的推送内容newsd,可以得到:
P(Y=1|newsd)=11+e-g(Vd)=0]]>
这样根据一个用户对m条推送内容点击记录,我们就得到了m个形式如上所述两个表达式的式子,联立求解,即可得到该用户的排序模型系数向量X,也即修正了兴趣权值。
在兴趣权值修正之后,设模型系数向量为{x1,x2,...,xN},将候选的推送内容集合中的每一条推送内容提取得到对应的特征向量Wi={w1,w2,...,wN},带入到模型中:
P(Y=1|newsi)=11+e-g(Vi)]]>
其中,Vi=x1*w1+x2*w2+…+xN*wN,计算则可得到P(Y=1|newsi)。这个值就是该用户对此条内容的兴趣得分。根据候选推送内容兴趣得分的高低可以确定给该用户推荐内容的先后顺序,由此可见,本实施例的技术方案中根据用户对推送内容的实际点击行为,修正了兴趣权值,有利于再次更加准确地对用户进行内容推送,最终本实施例结合前述实施例得到的技术方案,其工作流程如图3所示。
需要说明的是,上述各个公式并不是实现本发明的唯一公式,仅作为实施例的一种实现方式。技术人员可以根据业务需要对公式做适当变形,依然落在本发明的范围之内,例如增添参数或倍数值等。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述, 构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发 明实施例的基于社交网络的内容推荐系统中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

基于社交网络的内容推荐方法和系统.pdf_第1页
第1页 / 共18页
基于社交网络的内容推荐方法和系统.pdf_第2页
第2页 / 共18页
基于社交网络的内容推荐方法和系统.pdf_第3页
第3页 / 共18页
点击查看更多>>
资源描述

《基于社交网络的内容推荐方法和系统.pdf》由会员分享,可在线阅读,更多相关《基于社交网络的内容推荐方法和系统.pdf(18页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN104063476A43申请公布日20140924CN104063476A21申请号201410308039X22申请日20140630G06F17/3020060171申请人北京奇虎科技有限公司地址100088北京市西城区新街口外大街28号D座112室(德胜园区)申请人奇智软件(北京)有限公司72发明人周楠常富洋秦吉胜74专利代理机构北京鼎佳达知识产权代理事务所普通合伙11348代理人王伟锋刘铁生54发明名称基于社交网络的内容推荐方法和系统57摘要本发明关于一种基于社交网络的内容推荐方法和系统,涉及信息技术领域,主要目的在于针对不同类型的用户进行其感兴趣的内容推送。方法包括。

2、提取社交网络数据的特征;根据某一类型的用户对社交网络数据的行为,计算并记录社交网络数据的特征对于类型的用户的兴趣权值;提取多个待推送内容的特征;从已记录的特征及兴趣权值中,查找多个待推送内容的特征的兴趣权值,并计算出多个待推送内容对于类型的用户的兴趣得分;根据多个待推送内容对于类型的用户的兴趣得分的高低,对类型的用户进行内容推送。通过本发明,可以分析不同类型用户的兴趣所在,并将符合用户兴趣的内容推送给用户。51INTCL权利要求书2页说明书10页附图5页19中华人民共和国国家知识产权局12发明专利申请权利要求书2页说明书10页附图5页10申请公布号CN104063476ACN104063476。

3、A1/2页21一种基于社交网络的内容推荐方法,其包括提取社交网络数据的特征;根据某一类型的用户对所述社交网络数据的行为,计算并记录所述社交网络数据的特征对于所述类型的用户的兴趣权值;提取多个待推送内容的特征;从已记录的特征及兴趣权值中,查找所述多个待推送内容的特征的兴趣权值,并计算出所述多个待推送内容对于所述类型的用户的兴趣得分;根据所述多个待推送内容对于所述类型的用户的兴趣得分的高低,对所述类型的用户进行内容推送。2根据权利要求1所述的基于社交网络的内容推荐方法,其中,还包括根据所述类型的用户对所述多个待推送内容的点击行为,重新确定所述多个待推送内容的兴趣得分;按重新确定的兴趣得分,计算所述。

4、多个待推送内容的特征的兴趣权值并进行记录。3根据权利要求12任一项所述的基于社交网络的内容推荐方法,其中,所述社交网络数据包括社交网络账号,所述社交网络数据的特征包括所述社交网络账号的类别和主题,所述类型的用户对所述社交网络数据的行为包括对相同类别或相同主题的所述社交网络账号的关注行为。4根据权利要求13任一项所述的基于社交网络的内容推荐方法,其中,所述社交网络数据包括社交网络账号发布的社交内容,所述社交网络数据的特征包括所述社交内容的类别和主题,所述类型的用户对所述社交网络数据的行为包括对相同类别或相同主题的所述社交内容的转发行为。5根据权利要求14任一项所述的基于社交网络的内容推荐方法,其。

5、中,所述社交网络数据包括社交网络账号发布的URL,所述社交网络数据的特征包括所述URL指向的推送内容的类别和主题,所述类型的用户对所述社交网络数据的行为包括对相同类别或相同主题的推送内容的URL的点击行为,或对相同类别或相同主题的推送内容上的页面标签的点击行为。6根据权利要求15任一项所述的基于社交网络的内容推荐方法,其中,所述社交网络数据包括社交网络账号发布的URL,所述社交网络数据的特征包括所述URL中包含的域名的类别,所述类型的用户对所述社交网络数据的行为包括对相同类别的域名对应的URL的点击行为。7一种基于社交网络的内容推荐系统,其包括第一特征提取模块,用于提取社交网络数据的特征;兴趣。

6、权值计算模块,用于根据某一类型的用户对所述社交网络数据的行为,计算并记录所述社交网络数据的特征对于所述类型的用户的兴趣权值;第二特征提取模块,用于提取多个待推送内容的特征;兴趣得分计算模块,用于从已记录的特征及兴趣权值中,查找所述多个待推送内容的特征的兴趣权值,并计算出所述多个待推送内容对于所述类型的用户的兴趣得分;内容待推荐模块,用于根据所述多个待推送内容对于所述类型的用户的兴趣得分的高低,对所述类型的用户进行内容推送。权利要求书CN104063476A2/2页38根据权利要求7所述的基于社交网络的内容推荐系统,其中,还包括第一重新确定模块,用于根据所述类型的用户对所述多个待推送内容的点击行。

7、为,重新确定所述多个待推送内容的兴趣得分;第二重新确定模块,用于按重新确定的兴趣得分,计算所述多个待推送内容的特征的兴趣权值并进行记录。9根据权利要求78任一项所述的基于社交网络的内容推荐系统,其中,所述社交网络数据包括社交网络账号,所述社交网络数据的特征包括所述社交网络账号的类别和主题,所述类型的用户对所述社交网络数据的行为包括对相同类别或相同主题的所述社交网络账号的关注行为。10根据权利要求79任一项所述的基于社交网络的内容推荐系统,其中,所述社交网络数据包括社交网络账号发布的社交内容,所述社交网络数据的特征包括所述社交内容的类别和主题,所述类型的用户对所述社交网络数据的行为包括对相同类别。

8、或相同主题的所述社交内容的转发行为。权利要求书CN104063476A1/10页4基于社交网络的内容推荐方法和系统技术领域0001本发明涉及信息技术领域,具体而言,涉及一种基于社交网络的内容推荐方法和系统。背景技术0002获取新闻和资讯是现代社会中人们的生活习惯,随着计算机技术的发展和互联网用户规模的不断扩大,越来越多的人使用通过互联网获得各种各样所需的信息。同时,通过互联网提供新闻和资讯服务的网站也越来越多,越来越多的突发新闻和事件是通过互联网得到迅速传播的,互联网信息呈现出爆发式的增长趋势。近些年来,移动互联网的快速发展使得用户的阅读时间变得越来越碎片化,在这种背景下,如何在海量的信息中筛。

9、选出最有价值的信息,向用户个性化推荐其最感兴趣的新闻和资讯,就变得极其重要。0003现在的互联网新闻资讯阅读产品主要包括WEB网页端和移动APP应用程序端,从新闻和资讯的整合方式来看,大部分依然是人工编辑和分类浏览的形式,这种方式的阅读会使用户浏览到大量不感兴趣的新闻和资讯,浪费用户的时间,同时产品本身也需要大量的编辑来进行新闻和资讯的更新和维护;以GOOGLEREADER为代表的订阅类新闻阅读产品是不同于上述产品的另外一种产品形式,用户可以订阅自己感兴趣的网站的内容进行阅读和浏览,这种阅读形式减少了用户浏览到不感兴趣的内容的可能性,但是用户需要自己寻找自己感兴趣的内容和网站进行一系列设置,而。

10、对于大多数互联网用户来说,他们不喜欢这种繁琐的方式。0004为了使得用户在短时间内以便捷的方式获取有价值和感兴趣的新闻和资讯,必须采取一种更加智能的方式去提供给用户所需的信息,针对不同的用户推荐用户感兴趣和有价值的新闻和资讯。发明内容0005鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的基于社交网络的内容推荐方法和系统。0006依据本发明的一个方面,提供了一种基于社交网络的内容推荐方法,其包括提取社交网络数据的特征;根据某一类型的用户对所述社交网络数据的行为,计算并记录所述社交网络数据的特征对于所述类型的用户的兴趣权值;提取多个待推送内容的特征;从已记录的特征及。

11、兴趣权值中,查找所述多个待推送内容的特征的兴趣权值,并计算出所述多个待推送内容对于所述类型的用户的兴趣得分;根据所述多个待推送内容对于所述类型的用户的兴趣得分的高低,对所述类型的用户进行内容推送。0007可选地,前述的基于社交网络的内容推荐方法,其中,还包括根据所述类型的用户对所述多个待推送内容的点击行为,重新确定所述多个待推送内容的兴趣得分;按重新确定的兴趣得分,计算所述多个待推送内容的特征的兴趣权值并进行记录。0008可选地,前述的基于社交网络的内容推荐方法,其中,所述社交网络数据包括社交说明书CN104063476A2/10页5网络账号,所述社交网络数据的特征包括所述社交网络账号的类别和。

12、主题,所述类型的用户对所述社交网络数据的行为包括对相同类别或相同主题的所述社交网络账号的关注行为。0009可选地,前述的基于社交网络的内容推荐方法,其中,所述社交网络数据包括社交网络账号发布的社交内容,所述社交网络数据的特征包括所述社交内容的类别和主题,所述类型的用户对所述社交网络数据的行为包括对相同类别或相同主题的所述社交内容的转发行为。0010可选地,前述的基于社交网络的内容推荐方法,其中,所述社交网络数据包括社交网络账号发布的URL,所述社交网络数据的特征包括所述URL指向的推送内容的类别和主题,所述类型的用户对所述社交网络数据的行为包括对相同类别或相同主题的推送内容的URL的点击行为,。

13、或对相同类别或相同主题的推送内容上的页面标签的点击行为。0011可选地,前述的基于社交网络的内容推荐方法,其中,所述社交网络数据包括社交网络账号发布的URL,所述社交网络数据的特征包括所述URL中包含的域名的类别,所述类型的用户对所述社交网络数据的行为包括对相同类别的域名对应的URL的点击行为。0012可选地,前述的基于社交网络的内容推荐方法,其中,第I个待推送内容的兴趣得分为00130014其中,VIX1W1X2W2XNWN,其中,W1WN为第I个待推送内容的N个特征,X1XN为对应所述N个特征的兴趣权值,A为第一常数,B为第二常数,E、G均为固定常数。0015依据本发明的另一方面,还提供了。

14、一种基于社交网络的内容推荐系统,其包括第一特征提取模块,用于提取社交网络数据的特征;兴趣权值计算模块,用于根据某一类型的用户对所述社交网络数据的行为,计算并记录所述社交网络数据的特征对于所述类型的用户的兴趣权值;第二特征提取模块,用于提取多个待推送内容的特征;兴趣得分计算模块,用于从已记录的特征及兴趣权值中,查找所述多个待推送内容的特征的兴趣权值,并计算出所述多个待推送内容对于所述类型的用户的兴趣得分;内容待推荐模块,用于根据所述多个待推送内容对于所述类型的用户的兴趣得分的高低,对所述类型的用户进行内容推送。0016可选地,前述的基于社交网络的内容推荐系统,其中,还包括第一重新确定模块,用于根。

15、据所述类型的用户对所述多个待推送内容的点击行为,重新确定所述多个待推送内容的兴趣得分;第二重新确定模块,用于按重新确定的兴趣得分,计算所述多个待推送内容的特征的兴趣权值并进行记录。0017可选地,前述的基于社交网络的内容推荐系统,其中,所述社交网络数据包括社交网络账号,所述社交网络数据的特征包括所述社交网络账号的类别和主题,所述类型的用户对所述社交网络数据的行为包括对相同类别或相同主题的所述社交网络账号的关注行为。0018可选地,前述的基于社交网络的内容推荐系统,其中,所述社交网络数据包括社交网络账号发布的社交内容,所述社交网络数据的特征包括所述社交内容的类别和主题,所说明书CN1040634。

16、76A3/10页6述类型的用户对所述社交网络数据的行为包括对相同类别或相同主题的所述社交内容的转发行为。0019可选地,前述的基于社交网络的内容推荐系统,其中,所述社交网络数据包括社交网络账号发布的URL,所述社交网络数据的特征包括所述URL指向的推送内容的类别和主题,所述类型的用户对所述社交网络数据的行为包括对相同类别或相同主题的推送内容的URL的点击行为,或对相同类别或相同主题的推送内容上的页面标签的点击行为。0020可选地,前述的基于社交网络的内容推荐系统,其中,所述社交网络数据包括社交网络账号发布的URL,所述社交网络数据的特征包括所述URL中包含的域名的类别,所述类型的用户对所述社交。

17、网络数据的行为包括对相同类别的域名对应的URL的点击行为。0021可选地,前述的基于社交网络的内容推荐系统,其中,第I个待推送内容的兴趣得分为00220023其中,VIX1W1X2W2XNWN,其中,W1WN为第I个待推送内容的N个特征,X1XN为对应所述N个特征的兴趣权值,A为第一常数,B为第二常数,E、G均为固定常数。0024在本发明的基于社交网络的内容推荐方法和系统中,由于不同类型用户在网络上的社交行为,能够反映对该类型用户的兴趣所在,所以基于不同类型用户对社交网络数据的行为,分析得到社交网络数据特征对于不同类型用户的兴趣权值,以及计算出待推送内容对不同类型用户的兴趣得分,实际上是合理分。

18、析出了不同类型用户对待推送内容的兴趣高低,按兴趣高低对不同类型的用户进行推荐;本发明的技术方案给用户展示推荐内容,大大减少了人工编辑的工作量,对用户而言,提升了推荐内容的可读性,减少了大量用户不喜欢的推荐内容,节约了用户的时间,推荐质量的提高也会带动更多的用户,提高了推荐内容的点击率,最终带来推送流量的稳步提升。0025上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。附图说明0026通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技。

19、术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中0027图1示出了根据本发明的一个实施例的基于社交网络的内容推荐方法的流程图;0028图2示出了根据本发明的一个实施例的基于社交网络的内容推荐方法的流程图;0029图3示出了根据本发明的一个实施例的基于社交网络的内容推荐方法的工作流程图;0030图4示出了根据本发明的一个实施例的基于社交网络的内容推荐系统的框图;0031图5示出了根据本发明的一个实施例的基于社交网络的内容推荐系统的框图。说明书CN104063476A4/10页7具体实施方式0032下面将。

20、参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。0033如图1所示,本发明的一个实施例提供了一种基于社交网络的内容推荐方法,其包括0034步骤110,提取社交网络数据的特征。本实施例中对于社交网络数据的类型不做限定,例如,可以是用户所使用的社交网站、社交工具,例如微博、博客等,本实施例对社交网络数据的特征也不进行限定,例如,可以是社交网站、社交工具的名称、分类、标签内容等。0035步骤120,。

21、根据某一类型的用户对社交网络数据的行为,计算并记录社交网络数据的特征对于上述类型的用户的兴趣权值。例如,用户在社交网络上频繁发出体育类消息,由此可见用户对体育类内容具有较高的兴趣。0036步骤130,提取多个待推送内容的特征。本实施例中的待推送内容包括但不限于新闻以及资讯,或其他形式的信息。0037步骤140,从已记录的特征及兴趣权值中,查找多个待推送内容的特征的兴趣权值,并计算出多个待推送内容对于上述类型的用户的兴趣得分。在本实施例的技术方案中,依据前述的社交网络数据的特征以及相应的兴趣权值可以建立用户的兴趣模型,通过兴趣模型可以选择出需要推送给用户的候选推送内容。0038步骤150,根据多。

22、个待推送内容对于上述类型的用户的兴趣得分的高低,对上述类型的用户进行内容推送。本实施例中,基于兴趣得分对待推送内容进行排序,根据排序结果可以确定最终要推荐给用户的内容集合以及顺序。0039在本实施例的技术方案中,基于兴趣得分的高低,也即不同类型用户对于待推送内容的兴趣高低进行内容推送,大大减少了人工编辑的工作量,对用户而言,提升了推荐内容的可读性,减少了大量用户不喜欢的推荐内容,节约了用户的时间,推荐质量的提高也会带动更多的用户,提高了每条推荐内容的点击率,最终带来推送流量的稳步提升。0040如图2所示,本发明的另一实施例还提供了一种基于社交网络的内容推荐方法,其中,还包括0041步骤160,。

23、根据上述类型的用户对多个待推送内容的点击行为,重新确定多个待推送内容的兴趣得分。0042步骤170,按重新确定的兴趣得分,计算多个待推送内容的特征的兴趣权值并进行记录。0043在本实施例的技术方案中,如果用户点击阅读了推送内容,说明推送准确;但如用户对推送的某条内容点击了不感兴趣的按钮或忽略推送内容,表示用户对于该内容所对应的分类或主题等特征具有较低兴趣,此时根据用户的实际行为估算该内容的兴趣得分,并反向修正该内容中的特征的兴趣权值,以便于在以后使得计算的兴趣得分与用户的实际兴趣更符合。0044本发明的另一实施例还提供了一种基于社交网络的内容推荐方法,其中,社交网络数据包括社交网络账号,社交网。

24、络数据的特征包括社交网络账号的类别和主题,上述类说明书CN104063476A5/10页8型的用户对社交网络数据的行为包括对相同类别或相同主题的社交网络账号的关注行为。0045在本实施例的技术方案中,以目前流行的微博为例,如用户关注某一媒体账号或者名人账号,则表示用户对该类型或主题的微博账号感兴趣,用户对同一标签下的微博账号关注的越多,则可设置较高的兴趣权值。目前微博账号均可设置对应的类别、主题或是其他形式的标签;也可以预先为不同微博账号制定至少一个标签,并在标签中记录微博账号的特征,微博账号的标签可以存储在数据库中,以在需要时进行提取。0046本发明的另一实施例还提供了一种基于社交网络的内容。

25、推荐方法,其中,社交网络数据包括社交网络账号发布的社交内容,社交网络数据的特征包括社交内容的类别和主题,上述类型的用户对社交网络数据的行为包括对相同类别或相同主题的社交内容的转发行为。0047在本实施例的技术方案中,以目前流行的微博发出的正文为例,如用户对某一类别或主题的微博账号的正文的转发次数越多,则表示用户对该类别或主题的微博账号的正文具有较高的兴趣,则可以设置较高的兴趣权值。0048本发明的另一实施例还提供了一种基于社交网络的内容推荐方法,其中,社交网络数据包括社交网络账号发布的URL,社交网络数据的特征包括URL指向的推送内容的类别和主题,上述类型的用户对社交网络数据的行为包括对相同类。

26、别或相同主题的推送内容的URL的点击行为,或对相同类别或相同主题的推送内容上的页面标签的点击行为。0049在本实施例的技术方案中,可以预先为不同推送内容设置类别标签,例如,如果推送内容为体育资讯,则其标签设置为体育标签。域名的类别标签可预先存储在数据库中。在本实施例的技术方案中,用户点击了某社交账号发布的URL指向的新闻,则表示用户对于该域名的类别和主题感兴趣,则可以设置较高的兴趣权值。0050本发明的另一实施例还提供了一种基于社交网络的内容推荐方法,其中,社交网络数据包括社交网络账号发布的URL,社交网络数据的特征包括URL中包含的域名的类别,上述类型的用户对社交网络数据的行为包括对相同类别。

27、的域名对应的URL的点击行为。0051在本实施例的技术方案中,可以预先为不同域名设置类别标签,例如,一个域名的类别标签通常是这个域名下的网页所包含的网页的信息类别,比如SPORTSABCCOM,其下的网页可能包含了各个方面的体育信息,则可以把此域名的类别标签确定为“体育”。域名的类别标签可预先存储在数据库中。0052在本实施例的技术方案中,用户点击了某社交账号发布的URL指向的新闻,则表示用户对于该域名的类别和主题感兴趣,则可以设置较高的兴趣权值。0053本发明的另一实施例还提供了一种基于社交网络的内容推荐方法,其中,第I个待推送内容的兴趣得分为00540055其中,VIX1W1X2W2XNW。

28、N,其中,W1WN为第I个待推送内容的N个特征,X1XN为对应N个特征的兴趣权值,A为第一常数,B为第二常数,E、G均为固定常数。0056在本实施例的技术方案中,基于上述的得分公式,可以实现一排序模型,该模型利用上述公式计算兴趣得分。排序模型实际上是一个逻辑回归分类器,该逻辑回归分类器的说明书CN104063476A6/10页9输入是一条推送内容的特征,输出是一条推送内容针对某一类型的用户的兴趣得分,得分越高表示该类型用户对这条推送内容可能越感兴趣。每条推送内容可以抽象为一个特征向量,向量的每个维度表示该条推送内容的主题、分类,甚至关键词、热度等多个特征。0057假设我们已经根据上述的兴趣权值。

29、得到模型系数向量为XX1,X2,XN,则可将用来进行推送内容兴趣值计算的逻辑回归分类器表示为00580059其中,VXW,X表示上述类型的用户对应的模型系数向量,W表示推送内容的特征向量,上述等式的左边的意义是当向用户推荐一条推送内容NEWSI时,用户点击的可能性,所以计算得到的右边的兴趣得分可以作为对上述类型用户推送内容的依据。0060结合前述的实施例,在用户对推送内容进行处理的情况下,W已知/X未知,求X。0061根据用户的点击行为的反馈,可以得到用户点击过的推送内容集合和一批向用户推送过但是用户没有点击的内容集合,对于用户点击过的推送内容NEWSC,可以得到00620063对于用户没有点。

30、击过的推送内容NEWSD,可以得到00640065这样根据一个用户对M条推送内容点击记录,我们就得到了M个形式如上所述两个表达式的式子,联立求解,即可得到该用户的排序模型系数向量X,也即修正了兴趣权值。0066在兴趣权值修正之后,设模型系数向量为X1,X2,XN,将候选的推送内容集合中的每一条推送内容提取得到对应的特征向量WIW1,W2,WN,带入到模型中00670068其中,VIX1W1X2W2XNWN,计算则可得到PY1|NEWSI。这个值就是该用户对此条内容的兴趣得分。根据候选推送内容兴趣得分的高低可以确定给该用户推荐内容的先后顺序,由此可见,本实施例的技术方案中根据用户对推送内容的实际。

31、点击行为,修正了兴趣权值,有利于再次更加准确地对用户进行内容推送,最终本实施例结合前述实施例得到的技术方案,其工作流程如图3所示。0069需要说明的是,上述各个公式并不是实现本发明的唯一公式,仅作为实施例的一种实现方式。技术人员可以根据业务需要对公式做适当变形,依然落在本发明的范围之内,例如增添参数或倍数值等。0070如图4所示,本发明的另一实施还提供了一种基于社交网络的内容推荐系统,其包括0071第一特征提取模块410,用于提取社交网络数据的特征。本实施例中对于社交网络数据的类型不做限定,例如,可以是用户所使用的社交网站、社交工具,例如微博、博客等,本实施例对社交网络数据的特征也不进行限定,。

32、例如,可以是社交网站、社交工具的名称、分类、标签内容等。0072兴趣权值计算模块420,用于根据某一类型的用户对社交网络数据的行为,计算并说明书CN104063476A7/10页10记录社交网络数据的特征对于上述类型的用户的兴趣权值。例如,用户在社交网络上频繁发出体育类消息,由此可见用户对体育类内容具有较高的兴趣。0073第二特征提取模块430,用于提取多个待推送内容的特征。本实施例中的待推送内容包括但不限于新闻以及资讯,或其他形式的信息。0074兴趣得分计算模块440,用于从已记录的特征及兴趣权值中,查找多个待推送内容的特征的兴趣权值,并计算出多个待推送内容对于上述类型的用户的兴趣得分。在本。

33、实施例的技术方案中,依据前述的社交网络数据的特征以及相应的兴趣权值可以建立用户的兴趣模型,通过兴趣模型可以选择出需要推送给用户的候选推送内容。0075内容待推荐模块450,用于根据多个待推送内容对于上述类型的用户的兴趣得分的高低,对上述类型的用户进行内容推送。本实施例中,基于兴趣得分对待推送内容进行排序,根据排序结果可以确定最终要推荐给用户的内容集合以及顺序。0076在本实施例的技术方案中,基于兴趣得分的高低,也即不同类型用户对于待推送内容的兴趣高低进行内容推送,大大减少了人工编辑的工作量,对用户而言,提升了推荐内容的可读性,减少了大量用户不喜欢的推荐内容,节约了用户的时间,推荐质量的提高也会。

34、带动更多的用户,提高了每条推荐内容的点击率,最终带来推送流量的稳步提升。0077如图5所示,本发明的另一实施例还提供了一种基于社交网络的内容推荐系统,其中,还包括0078第一重新确定模块460,用于根据上述类型的用户对多个待推送内容的点击行为,重新确定多个待推送内容的兴趣得分。0079第二重新确定模块470,用于按重新确定的兴趣得分,计算多个待推送内容的特征的兴趣权值并进行记录。0080在本实施例的技术方案中,如果用户点击阅读了推送内容或忽略推送内容,说明推送准确;但如用户对推送的某条内容点击了不感兴趣的按钮,表示用户对于该内容所对应的分类或主题等特征具有较低兴趣,此时根据用户的实际行为估算该。

35、内容的兴趣得分,并反向修正该内容中的特征的兴趣权值,以便于在以后使得计算的兴趣得分与用户的实际兴趣更符合。0081本发明的另一实施例还提供了一种基于社交网络的内容推荐系统,其中,社交网络数据包括社交网络账号,社交网络数据的特征包括社交网络账号的类别和主题,上述类型的用户对社交网络数据的行为包括对相同类别或相同主题的社交网络账号的关注行为。0082在本实施例的技术方案中,以目前流行的微博为例,如用户关注某一媒体账号或者名人账号,则表示用户对该类型或主题的微博账号感兴趣,用户对同一标签下的微博账号关注的越多,则可设置较高的兴趣权值。目前微博账号均可设置对应的类别、主题或是其他形式的标签;也可以预先。

36、为不同微博账号制定至少一个标签,并在标签中记录微博账号的特征,微博账号的标签可以存储在数据库中,以在需要时进行提取。0083本发明的另一实施例还提供了一种基于社交网络的内容推荐系统,其中,社交网络数据包括社交网络账号发布的社交内容,社交网络数据的特征包括社交内容的类别和主题,上述类型的用户对社交网络数据的行为包括对相同类别或相同主题的社交内容的转发行为。0084在本实施例的技术方案中,以目前流行的微博发出的正文为例,如用户对某一类说明书CN104063476A108/10页11别或主题的微博账号的正文的转发次数越多,则表示用户对该类别或主题的微博账号的正文具有较高的兴趣,则可以设置较高的兴趣权。

37、值。0085本发明的另一实施例还提供了一种基于社交网络的内容推荐系统,其中,社交网络数据包括社交网络账号发布的URL,社交网络数据的特征包括URL指向的推送内容的类别和主题,上述类型的用户对社交网络数据的行为包括对相同类别或相同主题的推送内容的URL的点击行为,或对相同类别或相同主题的推送内容上的页面标签的点击行为。0086在本实施例的技术方案中,可以预先为不同推送内容设置类别标签,例如,如果推送内容为体育资讯,则其标签设置为体育标签。域名的类别标签可预先存储在数据库中。在本实施例的技术方案中,用户点击了某社交账号发布的URL指向的新闻,则表示用户对于该域名的类别和主题感兴趣,则可以设置较高的。

38、兴趣权值。0087本发明的另一实施例还提供了一种基于社交网络的内容推荐系统,其中,社交网络数据包括社交网络账号发布的URL,社交网络数据的特征包括URL中包含的域名的类别,上述类型的用户对社交网络数据的行为包括对相同类别的域名对应的URL的点击行为。0088在本实施例的技术方案中,可以预先为不同域名设置类别标签,例如,一个域名的类别标签通常是这个域名下的网页所包含的网页的信息类别,比如SPORTSABCCOM,其下的网页可能包含了各个方面的体育信息,则可以把此域名的类别标签确定为“体育”。域名的类别标签可预先存储在数据库中。0089在本实施例的技术方案中,用户点击了某社交账号发布的URL指向的。

39、新闻,则表示用户对于该域名的类别和主题感兴趣,则可以设置较高的兴趣权值。0090本发明的另一实施例还提供了一种基于社交网络的内容推荐系统,其中,第I个待推送内容的兴趣得分为00910092其中,VIX1W1X2W2XNWN,其中,W1WN为第I个待推送内容的N个特征,X1XN为对应N个特征的兴趣权值,A为第一常数,B为第二常数,E、G均为固定常数。0093在本实施例的技术方案中,基于上述的得分公式,可以实现一排序模型,该模型利用上述公式计算兴趣得分。排序模型实际上是一个逻辑回归分类器,该逻辑回归分类器的输入是一条推送内容的特征,输出是一条推送内容针对某一类型的用户的兴趣得分,得分越高表示该类型。

40、用户对这条推送内容可能越感兴趣。每条推送内容可以抽象为一个特征向量,向量的每个维度表示该条推送内容的主题、分类,甚至关键词、热度等多个特征。0094假设我们已经根据上述的兴趣权值得到模型系数向量为XX1,X2,XN,则可将用来进行推送内容兴趣值计算的逻辑回归分类器表示为00950096其中,VXW,X表示上述类型的用户对应的模型系数向量,W表示推送内容的特征向量,上述等式的左边的意义是当向用户推荐一条推送内容NEWSI时,用户点击的可能性,所以计算得到的右边的兴趣得分可以作为对上述类型用户推送内容的依据。0097结合前述的实施例,在用户对推送内容进行处理的情况下,W已知/X未知,求X。说明书C。

41、N104063476A119/10页120098根据用户的点击行为的反馈,可以得到用户点击过的推送内容集合和一批向用户推送过但是用户没有点击的内容集合,对于用户点击过的推送内容NEWSC,可以得到00990100对于用户没有点击过的推送内容NEWSD,可以得到01010102这样根据一个用户对M条推送内容点击记录,我们就得到了M个形式如上所述两个表达式的式子,联立求解,即可得到该用户的排序模型系数向量X,也即修正了兴趣权值。0103在兴趣权值修正之后,设模型系数向量为X1,X2,XN,将候选的推送内容集合中的每一条推送内容提取得到对应的特征向量WIW1,W2,WN,带入到模型中01040105。

42、其中,VIX1W1X2W2XNWN,计算则可得到PY1|NEWSI。这个值就是该用户对此条内容的兴趣得分。根据候选推送内容兴趣得分的高低可以确定给该用户推荐内容的先后顺序,由此可见,本实施例的技术方案中根据用户对推送内容的实际点击行为,修正了兴趣权值,有利于再次更加准确地对用户进行内容推送,最终本实施例结合前述实施例得到的技术方案,其工作流程如图3所示。0106需要说明的是,上述各个公式并不是实现本发明的唯一公式,仅作为实施例的一种实现方式。技术人员可以根据业务需要对公式做适当变形,依然落在本发明的范围之内,例如增添参数或倍数值等。0107在此提供的算法和显示不与任何特定计算机、虚拟系统或者其。

43、它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。0108在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。0109类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有。

44、时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。0110本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或说。

45、明书CN104063476A1210/10页13子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书包括伴随的权利要求、摘要和附图中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书包括伴随的权利要求、摘要和附图中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。0111此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任。

46、意之一都可以以任意的组合方式来使用。0112本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器DSP来实现根据本发明实施例的基于社交网络的内容推荐系统中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序例如,计算机程序和计算机程序产品。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。01。

47、13应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。说明书CN104063476A131/5页14图1说明书附图CN104063476A142/5页15图2说明书附图CN104063476A153/5页16图3说明书附图CN104063476A164/5页17图4说明书附图CN104063476A175/5页18图5说明书附图CN104063476A18。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1