CN200780028077.8
2007.07.24
CN101495941A
2009.07.29
驳回
无权
发明专利申请公布后的驳回IPC(主分类):G06F 3/00申请公布日:20090729|||实质审查的生效|||公开
G06F3/00; H04N5/445; G06F13/00
G06F3/00
索尼株式会社; 索尼电子有限公司
尼考劳斯·乔治斯; 保罗·金·黄; 弗兰克·力-德·林
日本东京都
2006.8.1 US 60/835,020; 2006.11.21 US 11/602,566
北京东方亿思知识产权代理有限责任公司
宋 鹤;南 霆
例如使用模拟退火来随机地优化成本函数,以提供实体的邻域,基于该邻域可以将内容推荐提供给家用娱乐系统(14)的用户。成本函数表示来自邻域的实体(15)的、与用户所观看的内容项目有关的评级相似度评分的归一化的和。
1. 一种用于向家用系统(14)推荐内容以便将所述内容显示在所述家用系统(14)的显示设备上的方法,包括:使用下面的成本函数定义其它用户的邻域:C=f(N)=1|N|Σs∈S^(1Σc′∈C^|sim(c,c′)|×Σc′∈C^sim(c,c′)×rc′,s)]]>基于所述邻域,向所述家用系统(14)的用户提供至少一个内容推荐。2. 如权利要求1所述的方法,其中,所述成本函数的一项表示来自所述邻域的实体的并且与所述用户观看的内容项目有关的评级相似度评分之和。3. 如权利要求1所述的方法,其中,所述成本函数被归一化。4. 如权利要求2所述的方法,其中,所述评级相似度评分是基于余弦的相似度评分。5. 如权利要求1所述的方法,其中,使用随机方法来优化所述成本函数。6. 如权利要求5所述的方法,其中,所述随机方法是模拟退火。7. 如权利要求6所述的方法,其中,使用至少两个操作符来实现所述模拟退火,所述至少两个操作符是从包括如下操作符的组中选出的:将非邻域实体移动到所述邻域中(“移动”),将邻域实体移出所述邻域(“移动”),将在所述邻域中的实体与不在所述邻域中的实体交换(“交换”),将在所述邻域中的实体与不在所述邻域中的实体连续交换两次(“交换一交换”),以及执行交换随后紧接着执行移动。8. 一种系统,该系统从总地包括邻域中对象用户的潜在邻居(15)的实体接收评级,并且该系统至少部分地基于所述评级将内容推荐返回给所述对象用户,该系统包括:至少一个服务器(12、16、18),所述至少一个服务器被编程以至少部分地基于所述评级来随机建立伪最佳邻域,并且至少部分地基于所述邻域来返回内容推荐。9. 如权利要求8所述的系统,其中,服务器(12、16、18)使用成本函数来定义所述邻域,其中,所述成本函数的一项表示来自所述邻域的实体的并且与所述用户观看的内容项目有关的评级相似度评分之和。
用于内容推荐的邻域优化 本申请要求2006年8月1日提交的美国临时专利申请序列号60/835,020的优先权,该专利申请通过引用结合于此。 技术领域 本发明一般涉及用于内容推荐的系统和方法。 背景技术 已经开发了基于来自邻居(neighbor)(例如,有线电视系统中的其它家用系统或者其它娱乐网络)的内容评级(rating)向家用娱乐系统的用户推荐内容的系统和方法。容易理解,为了向特定用户推荐内容,选择邻域(neighborhood)成员是很重要的,这是因为如果使用了错误的邻域,那么推荐可能对其所针对的特定人员来说作用不大。 如在此所理解的,邻域选择的当前方法并不是它们可能具有的最佳方法。例如,在协同过滤中(CF),项目评级形式的用户意见被收集,并且在系统被请求作出推荐时,系统例如基于人口统计的相似度来识别类似用户以建议这些用户过去喜欢的项目。这种方法仅仅基于对用户邻域的判断。 可以使用两个用户之间的基于余弦的相似度来评估用户相似度,但是如在此所认识到的,单独凭借这种方法,通常必须预先限定邻居数目,而没有好的方法得知多少邻居是最佳的。因此,在不知道可能使个人用户受益的邻居的最佳数目的情况下,一般预先固定邻居数目。使问题变得复杂的事实是:用于形成一千其它用户的合理大小的邻域的方法的总数比已知宇宙中的微粒数目还多,因此,如在此所认识到的,最好可以可行地限定伪最佳(pseudo-optimal)邻域。针对这个问题提出了本发明。 发明内容 公开了一种用于向家用系统推荐内容以便将所述内容显示在所述家用系统的显示设备上的方法。该方法包括:使用下面描述的成本函数定义其它用户的邻域,并且基于所述邻域,向所述家用系统的用户提供至少一个内容推荐。 在一些实施例中,所述成本函数的一项表示来自所述邻域的实体的并且与所述用户观看的内容项目有关的评级相似度评分之和。所述成本函数可以被归一化。如果需要,所述评级相似度评分可以是基于余弦的相似度评分,并且可以使用诸如模拟退火之类的随机方法来优化所述成本函数。在一些实施例中,可以使用下面描述的并被称为“移动”、“交换”、“交换-交换”和“交换-移动”的操作符(operator)来实现所述模拟退火。 在另一方面,一种系统接收来自实体的评级,所述实体总地包括邻域中对象用户的潜在邻居。该系统基于所述评级将内容推荐返回给对象用户。该系统包括至少一个服务器,该服务器被编程以基于所述评级随机建立伪最佳邻域,并且基于所述邻域将内容推荐返回。 在另一方面,计算机迭代地计算成本函数,该成本函数表示来自家用娱乐系统的邻域的实体的并且与所述家用娱乐系统的用户观看的内容项目有关的评级相似度评分之和。所述邻域用来向所述家用娱乐系统的用户推荐内容。 可以参考附图来最好地理解本发明的关于其结构和操作的细节,在附图中,相似的标号指示相似的部分,其中: 附图说明 图1是根据本发明的非限制性系统的框图;以及 图2是本逻辑的流程图。 具体实施方式 首先参考图1,示出了总地被指定为10的系统,该系统包括内容提供商服务器12,例如但不限于可以以智能方式向主用户家用系统14提供内容的有线前端(cable head end)服务器。主家用系统14可以包括诸如电视机和/或计算机之类的一个或多个多媒体显示设备,以及可以提供在显示设备上显示的内容的一个或多个多媒体或内容数据存储装置,例如DVR和光盘播放器(例如数字视频光盘(DVD)或蓝光播放器等)。在没有限制的情况下,用户系统接口可以由机顶盒来实现。代替机顶盒或除了机顶盒之外,用户系统接口还可以由诸如有线或无线调制解调器之类的因特网连接设备或其它类型的广域网连接来实现。因此,主家用系统14和下面将描述的服务器之间的通信可以经由陆地和卫星方式的因特网和/或TV线缆和/或广播链路,并且可以是双向的,例如,主家用系统14可以接收来自服务器12的内容并且将对特定的多项内容的评级传输回服务器12。 如图1所示,不仅主家用系统14可以与服务器12通信,而且邻居家用系统15也可以与服务器12通信。与主家用系统14相似,邻居系统15可以接收来自服务器12的内容,并且将对特定的多项内容的评级传输回服务器12。本发明的目的是将邻居系统15的接近最佳(“伪最佳”)的子集定义为主家用系统14的“邻域”,来自邻域的评级可用来向主家用系统14推荐内容。应当明白,相同的处理可以用于每个邻居系统15,其中,邻居系统15可以是下述算法中的主家用系统。 在所示出的非限制性实现方式中,内容服务器12可以与邻域确定服务器16通信,邻域确定服务器16实际上是执行下述逻辑以确定接近最佳的邻域的计算机。根据本领域公知的原理,接近最佳的邻域可以被发送到推荐服务器18,推荐服务器18可以通过使用该邻域将内容推荐返回给主家用系统14。虽然示出了三个服务器12、16、18,但是也可以使用更多或更少的服务器。 现在转到图2,在块20处,建立了成本(cost)函数C。根据本发明,由式子(1)给出了优选的成本函数。成本函数用来基于来自邻域系统15的评级而随机地建立伪最佳邻域。式子(1)中最右边的和表示来自邻域系统15的、与主家庭娱乐系统14的用户所观看的内容项目有关的评级相似度评分的和(其可以使用基于余弦的方法或其它相似度方法),并且中间的和实际上是一个归一化因子。换句话说,要优化的成本函数C是对于给定的邻域N的、针对所有已经在主系统14的用户接收器(bin)中的内容项目的评分之和,并且其范围(由于归一化)为从0变化到1,其中,1指示发现了理想的最佳邻域。 (1),C=f(N)=1|N|Σs∈S^(1Σc′∈C^|sim(c,c′)|×Σc′∈C^sim(c,c′)×rc′,s)]]> 上面的式子用文字表示为:C(要被最大化)=1/N乘以(经过了评级的所有电影s的和){1/(对于当前邻域中的所有候选邻居15,来自每个候选邻居15的评级和来自主系统14的评级之间的相似度的绝对值的和)乘以[(对于当前邻域中的所有候选邻居15,来自每个候选邻居15的评级和来自主系统14的评级之间的相似度的和)乘以来自候选邻居的对所相加的电影的评级]}。 一旦定义了成本函数,则逻辑移动到块22以将所有邻居系统15的初始子集定义为主系统14的初始“邻域”。可以随机选择子集。前进到块24,第一次计算上述的成本函数。 在块26处,选择一个操作符,利用这个操作符,邻域被扰动(perturb)。在一种非限制性的实现方式中,在块26处,可以选择四个操作符之一。非邻域的一个系统15可以进入邻域(“移动”),同时“移动”还包括将一个系统15移出当前的邻域。第二个操作符(“交换”)涉及将不在当前邻域中的系统15与在当前邻域中的系统15交换,而第三个操作符(“交换-交换”)涉及将不在当前邻域中的系统15与在邻域中的系统15连续交换两次。第四个操作符(“交换-移动”)需要执行交换然后紧接着执行移动。 前进到块28,在由块26处的操作符进行扰动之后,重新计算成本函数。前进到判决菱形30,判定成本函数的值是否比先前值增加了,如果增加了,则在块32处接受扰动。但是,如果在判决菱形30处成本函数未增加,则逻辑移动到判决菱形34,利用由式子(2)定义的概率来接受或不接受扰动。基于该概率和将一个数字与该概率进行比较的随机抽签(random draw),可以在块32接受扰动或者在块36不接受扰动,不接受扰动则扰动实际上被取消以使得邻域继续保持在块26处对其进行扰动之前其所具有的成员关系。 (2),P=e-ΔCT]]> P=e-(C中的改变)/T,其中“T”是根据经验确定的退火“温度”(annealing“temperature”)。 判决菱形38判定概率是否足够低(例如,低于根据经验确定的值),以指示已经获得接近最佳的邻域。如果概率足够低,则过程在状态40结束以将当前邻域作为推荐基础输出到主系统14。否则,逻辑循环回块26。 如果需要,可以使用递增成本函数评估,也可以使用查找表。除了这里所述的那些操作符之外还可以使用另外的操作符,并且可以使用快速退火。而且,可以使用标准的基于用户的成本函数解决方案来定义初始邻域,并且可以使用其它成本函数。 现在可以理解,本发明可以用作对当前引擎,例如对当前基于余弦的相似度引擎的改进,而无需针对用户/项目相似度评估进行成对比较。可以使用本随机算法获得接近最佳的(在此也称为“伪最佳”)解决方案。与已有方法相比,可以获得不同大小的邻域,这些邻域可以有利地用于不同用户以获得更好的解决方案。 作为模拟退火的替代,可以使用遗传算法即所谓的蚁群(ant colony)优化,以及其它方法。 虽然在此详细示出并描述了特定的用于内容推荐的邻域优化系统和方法,但是应当明白,本发明所包含的主题仅仅由权利要求来限定。
《用于内容推荐的领域优化.pdf》由会员分享,可在线阅读,更多相关《用于内容推荐的领域优化.pdf(9页珍藏版)》请在专利查询网上搜索。
例如使用模拟退火来随机地优化成本函数,以提供实体的邻域,基于该邻域可以将内容推荐提供给家用娱乐系统(14)的用户。成本函数表示来自邻域的实体(15)的、与用户所观看的内容项目有关的评级相似度评分的归一化的和。 。
copyright@ 2017-2020 zhuanlichaxun.net网站版权所有经营许可证编号:粤ICP备2021068784号-1