CN201380044422.2
2013.08.22
CN104584001A
2015.04.29
授权
有权
授权|||实质审查的生效IPC(主分类):G06F 17/00申请日:20130822|||公开
G06F17/00; G06F17/30
G06F17/00
兰屈克有限公司
迈克尔·文森; 布鲁斯·格利希; 阿米尔·雅兹达尼; 玛丽亚·洛佩尔
美国俄勒冈州
61/691,924 2012.08.22 US
北京商专永信知识产权代理事务所(普通合伙)11400
邬玥; 葛强
各种用于生成和扩大收视数据集的系统和方法在此公开。特别是,一些实施例通过基于可用的数据补充丢失的信息,以准备用于进一步分析的数据集。该系统可以组织收视数据从不同格式到统一的形式,以便于对不报告的设备数据进行分析和预测。在一些实施例中,该预测可基于有关于在不同地区市场中的不报告设备的存在和性质的信息,扩展现有累积的测定。
权利要求书1. 一种计算机系统,所述系统包括:至少一个处理器;存储器,其包括被配置为可由所述至少一个处理器执行的指令,以使得所述计算机系统:接收多个地区市场的收视数据集,所述收视数据集,至少部分地由一个或多个直播卫星(DBS)运营商、有线运营商、无线(OTA)运营商,或互联网协议电视(IPTV)运营商提供,并且其中所述收视数据集包括与多个报告设备相关的调优事件,所述调优事件包括调优开始时间和调优结束时间;接收内容日程表,所述内容日程表描绘内容分布的开始时间和结束时间;基于所述收视数据集的至少一部分,确定生存模型;基于所述生存模型,调整所述收视数据集中的调优结束时间;在调整调优结束时间之后,通过移除具有低于阈值的持续时间的条目过滤所述收视数据集;在过滤所述数据集之后,基于所述收视数据集和所述内容日程表创建内容观看数据集,所述内容观看数据集指出所述调优开始时间和调优结束时间之间观看的所述内容;估算所述地区市场中的观看设备的数量,但其不报告所述收视数据集中的数据;根据来自所述收视数据集中运营商的数据,为所述多个地区市场中的观看设备的所述估算的数量预测观看数据,但其不报告所述收视数据集中的数据;以及至少部分地基于所述被预测的观看数据,为至少一个内容确定收视的总时间和观看家庭的总数量。2. 根据权利要求1所述的计算机系统,其中创建所述内容观看数据集,包括:叠加所述内容日程表到所述调优数据,并将频道信息替换为内容信息。3. 根据权利要求1所述的计算机系统,其中所述指令进一步被配置为可由所述至少一个处理器执行,以使得所述计算机系统:为所述至少一个内容确定收视的每个市场测定。4. 根据权利要求1所述的计算机系统,其中所述指令进一步被配置为可由所述至少一个处理器执行,以使得所述计算机系统:通过以订阅显示所述内容的网络的报告家庭的百分比缩放观看内容的家庭的百分比来计算覆盖率。5. 一种计算机实现的方法,所述方法包括:接收多个地区市场的收视数据集,所述收视数据集包括与报告设备相关的调优事件,所述调优事件包括调优开始时间和调优结束时间;基于所述收视数据集的至少一部分确定生存曲线;基于所述生存曲线调整所述收视数据集中的调优结束时间;为所述多个地区市场中的观看设备的所述数量预测数据,但其不报告所述收视数据集中的数据;以及至少部分地基于所述被预测的数据,为至少一个的内容确定收视的总时间和观看家庭的总数量。6. 根据权利要求5所述的计算机实现的方法,其中所述收视数据集包括至少部分地由一个或多个直播卫星(DBS)运营商、有线运营商、无线(OTA)运营商,或互联网协议电视(IPTV)运营商提供的数据。7. 根据权利要求5所述的计算机实现的方法,进一步包括:接收内容日程表,所述内容日程表描绘内容分布的开始时间和结束时间;基于所述生存曲线,调整所述收视数据集中的调优结束时间;以及在调整调优结束时间之后,通过移除具有调优开始时间和低于阈值的调优结束时间的持续时间的条目过滤所述收视。8. 根据权利要求7所述的计算机实现的方法,进一步包括:在过滤所述数据集之后,基于所述收视数据集和所述内容日程表创建内容观看数据集,所述内容观看数据集指出所述调优开始时间和调优结束时间之间观看的所述内容。9. 根据权利要求7所述的计算机实现的方法,进一步包括:估算所述地区市场中DBS观看设备的数量,但其不报告所述收视数据集中的数据;以及估算所述地区市场中非DBS观看设备的数量,但其不报告所述收视数据集中的数据。10. 根据权利要求9所述的计算机实现的方法,进一步包括:基于来自所述收视数据集中的DBS运营商的数据,为所述多个地区市场中的DBS观看设备的所述估算的数量预测DBS观看数据,但其不报告所述收视数据集中的数据;根据所述收视数据集中来自DBS运营商的数据,为所述多个地区市场中的非DBS收视设备的所述估算的数量预测非DBS收视数据,但其不报告所述收视数据集中的数据。11. 根据权利要求7所述的计算机实现的方法,进一步包括:通过基于订阅网络的报告家庭的所述百分比缩放比率值,确定与网络相关的家庭覆盖率。12. 根据权利要求11所述的计算机实现的方法,进一步包括:通过以订阅网络的所述层次中的家庭的百分比缩放所述家庭覆盖率,确定层次覆盖率。13. 一种计算机系统,所述系统包括:至少一个处理器;存储器,其包括被配置为可由所述至少一个处理器执行的指令,以使得所述计算机系统:接收多个地区市场的收视数据集,所述收视数据集包括与多个报告设备相关的调优事件,所述调优事件包括调优开始时间和调优结束时间;基于所述收视数据集的至少一部分,确定生存曲线;基于所述生存曲线,调整所述收视数据集中的调优结束时间;为所述多个地区市场中的观看设备的所述数量预测数据,但其不报告所述收视数据集中的数据;以及至少部分地基于所述被预测的数据,为至少一个内容确定收视的总时间和观看家庭的总数量。14. 根据权利要求13所述的计算机系统,其中所述收视数据集包括至少部分地由一个或多个直播卫星(DBS)运营商、有线运营商、无线(OTA)运营商,或互联网协议电视(IPTV)运营商提供的数据。15. 根据权利要求13所述的计算机系统,所述指令进一步被配置为可由所述至少一个处理器执行,以使得所述计算机系统:接收内容日程表,所述内容日程表描绘内容分布的开始时间和结束时间;基于所述生存曲线调整所述收视数据集中的调优结束时间;以及在调整调优结束时间之后,通过除去具有调优开始时间和低于阈值的调优结束时间的持续时间的条目过滤所述收视。16. 根据权利要求15所述的计算机系统,所述指令进一步被配置为可由所述至少一个处理器执行,以使得所述计算机系统:在过滤所述数据集之后,基于所述收视数据集和所述内容日程表创建内容观看数据集,所述内容观看数据集指出所述调优开始时间和调优结束时间之间观看的所述内容。17. 根据权利要求16所述的计算机系统,所述指令进一步被配置为可由所述至少一个处理器执行,以使得所述计算机系统:估算所述地区市场中DBS观看设备的数量,但其不报告所述收视数据集中的数据;以及估算所述地区市场中非DBS观看设备的数量,但其不报告所述收视数据集中的数据。18. 根据权利要求17所述的计算机系统,所述指令进一步被配置为可由所述至少一个处理器执行,以使得所述计算机系统:基于来自所述收视数据集中DBS运营商的数据,为所述多个地区市场中的DBS观看设备的所述估算的数量预测DBS观看数据,但其不报告所述收视数据集中的数据;基于来自所述收视数据集中DBS运营商的数据,为所述多个地区市场中的非DBS观看设备的所述估算的数量预测非DBS观看数据,但其不报告所述收视数据集中的数据。19. 根据权利要求13所述的计算机系统,所述指令进一步被配置为可由所述至少一个处理器执行,以使得所述计算机系统:通过基于订阅网络的报告家庭的百分比缩放比率值,确定与网络相关的家庭覆盖率。20. 根据权利要求19所述的计算机系统,所述指令进一步被配置为可由所述至少一个处理器执行,以使得所述计算机系统:通过以订阅网络的层次中的家庭的百分比缩放所述家庭覆盖率,确定层次覆盖率。
说明书用于预测收视数据的系统和方法 相关申请的交叉引用 本申请要求2012年8月22日提交的美国临时专利申请号61/691,924,标题为SYSTEM AND METHOD FOR PROJECTING TELEVISION USER BEHAVIOR的优先权及权益。 背景技术 许多利益相关者,例如广告商、电视网络和内容提供商,期望准确的收视信息,使他们可以定制他们的内容和未来的节目。这样的数据可能来自多个源,并且可能采取许多不同的形式。此外,数据可能由多种不同的服务、运营商和技术提供商管理,他们各自可能以不同的方式管理数据。在这些不同的实体间协调数据的收集,并准备用于进行有意义的分析的数据是非常具有挑战性的。例如,不同分发通道上的数据可能采取不同的形式,可能以不同的速率进行报告,并且可能满足不同的最低报告标准。数据可能来自电视机顶盒(STB),或内置于电视或其它收看设备内的等效硬件,并且可能包括来自每一个信道改变,DVR事件或用户交互的数据。 因此,存在对协调数据的收集和来自不同内容分发源的格式化的系统和方法的需求。如果利益相关者在适当的时间并以适当的方式拥有他们需要的信息,那么补充所收集的数据中的缺损并对它们的内容做出有意义的预测对以采取行动是至关重要的。 附图说明 各种公开的实施例的示例方面在附图中被示出。这些示例和附图是说 明性的而不是限制性的。 图1示出了可以在一些实施例中使用的用于接收和处理媒体的收视数据的数据收集拓扑。 图2是描绘一些实施例中的采样家庭的示意图。 图3是如在一些实施例中所实现的描绘预测(projection)系统的另一实施例的示意图。 图4是如在一些实施例中所实现的示出数据分析过程中的各个步骤的一般化过程流程图。 图5描绘了在一些实施例中接收的调优信息。 图6描绘了在一些实施例中接收的日程信息。 图7描绘了在一些实施例中接收的订户信息。 图8描绘了在一些实施例中应用的日程信息的叠加。 图9描绘了如在一些实施例中执行的长度滤波之前和之后的调优数据的示例。 图10描绘了如在一些实施例中实现的以运营商订户信息补充调优数据的示例方法。 图11描绘了如在一些实施例中实现的按邮政编码和按收视市场汇总的调优数据。 图12描绘了如在一些实施例中实现的收视预测的一般化透视图。 图13描绘了如在一些实施例中参照的跨越美国的地区市场分解。 图14描绘了如在一些实施例中实现的数字广播卫星(DBS)观看数据预测拓扑。 图15描绘了如在一些实施例中实现的有线观看数据预测拓扑。 图16描绘了如在一些实施例中实现的无线(OTA)观看数据预测拓扑。 图17描绘了如在一些实施例中实现的因特网协议电视(IPTV)观看数 据预测拓扑。 图18描绘了如在一些实施例中实现的聚合数据预测拓扑。 图19描绘了如在一些实施例中的系统中接收的各个运营商的不规则报告时间。 图20示出了如在某些实施例中实现的用于准备观看数据以对在预测估计中使用的丢失数据作出解释的数据流程图。 图21示出了如在一些实施例中实现的确定网络收视的每个市场分布的数据处理体系结构的高层次拓扑。 图22展示了计算机系统示例形式的机器的示意图,在其中的一组指令可能被执行用于使机器实现任意一个或多个的本文讨论的方法。 本领域技术人员将理解的是以下所讨论的各种流程图中示出的逻辑和处理步骤可以以各种方式来改变。例如,逻辑的顺序可以被重新安排,子步骤可以并行地执行,示出的逻辑可以被省略,其它逻辑可以被包括等。将认识到的是某些步骤可以被合并成单个步骤,而由单个步骤表示的动作可以替代性地表示为一系列子步骤。附图被设计以使公开的概念更容易被读者理解。本领域技术人员将理解的是用于存储信息的实际数据结构可能与展示的附图和/或表格不同,因为,例如它们可能以不同的方式被组织;可能包含多于或少于所展示的信息;可能被压缩和/或加密等。 具体实施例 以下描述和附图是说明性的,而不应被解释为限制性的。许多具体细节被描述,以提供对本公开的透彻理解。然而,在某些情况下,公知的或常规的细节未被描述以避免模糊本说明书。本公开中对一个或一实施例的引用可以是,但不必然是对同一实施例的引用;并且,这样的引用指至少一个实施例。 在专利说明书中对“一个实施例”或“一实施例”的引用指所描述的与该实施例相关的特定的特征、结构或特性被包括在本公开的至少一个实施例中。专利说明书中各处“在一个实施例中”的短语的出现并不必然全部指同一实施例,也不是其他实施例相互排斥的单独的或替代的实施例。此外,对各种特征的描述,可能由一些实施例而不是其他来展示。相似地,对各种要求的描述,可能是对一些实施例而不是其它实施例的要求。 本专利说明书中所使用的术语通常具有本领域中的、本公开的语境内的,以及每个术语被使用的具体语境中的普通含义。用于描述本公开的某些术语将在下文或说明书的其他地方被讨论以为实践者提供关于本公开的说明书的额外指导。为了方便起见,某些术语可能被突出显示,例如使用斜体字和/或引号。对突出显示的使用对术语的范围和含义没有影响;术语的范围和含义在相同的语境下是相同的,不论其是否被突出显示。应该理解的是同样的事物可以以多于一种的方式进行说明。 因此,替代性的语言和同义词可用于任意一个或多个本文所讨论的术语,术语是否在本文被阐述或讨论都不需要赋予任何特殊意义。某些术语的同义词被提供。一个或多个同义词的使用不排除其它同义词的使用。本说明书中任何位置对包括本文所讨论的任何术语的示例的使用仅是说明性的,而并非意在进一步限制本公开或任何示例性术语的范围和含义。类似地,本公开不限于本说明书中给出的各种实施例。 根据本公开的实施例,在不意图限制本公开的范围的情况下,仪器、装置、方法的示例,及其相关结果被示出如下。注意,标题或副标题可能为了方便读者在示例中被使用,这不可能限制本公开的范围。除非另有定义,否则本文所使用的所有技术和科学术语具有与本领域普通技术人员对本公开涉及的术语的通常理解的相同含义。在冲突的情况下,以本文件包括的定义为准。 系统概述 本公开的实施例包括上传流加密到在线服务或基于云的平台或环境和/或从在线服务或基于云的平台或环境下载流加密的系统和方法。 图1示出了如在一些实施例中使用的用于接收和处理媒体收视数据的数据收集拓扑100。若干地区市场101a-c,每个都包含多个家庭102a-f和103a-d。单独的、每个市场的数据可能对一些家庭102a-f而不是其他家庭103a-d提供。例如,家庭103a-d内的设备可能无法报告他们的收视,或者他们报告的收视可能不被提供。虽然为了便于描述提到了家庭,但将认识到的是单个家庭可能包含报告和不报告的设备,以及可提供数据的设备和不可提供数据的设备。报告家庭发送数据114a-114d的一个或多个数据收集中心105a-b。然后,一个或多个数据收集中心105a-b提供数据106到处理中心107。 如本文所使用的,“家庭”(HH)指居住单元(或其它观看场所,例如可提供观看设备的商业场所)。“报告的HH”指具有反馈调优数据的一个或多个报告设备(一般为机顶盒或STB,但报告设备不需要是如字面上的与观看设备通信的盒子)的家庭。“调优”可以被表示为数据记录,其识别与电视或其他观看设备的特定的用户交互,例如频道的改变、DVR使用等。在一些实施例中,这些数据记录包括以下数据:STB和/或HH(例如,如果调优数据仅识别了机顶盒,那么运营商也可以提供机STB到HH的映射)的一个或多个独有的标识符;一个或多个日期/时间戳(例如,调优开始的日期/时间戳调优,结束的日期/时间戳);一个或多个内容标识符(例如频道号、网络名等)。将认识到的是STB可能指在物理上位于显示设备的外部的机顶盒,设备内的软件和/或固件(例如,在桌面计算机中的程序监控浏览器的请求),或设备内的硬件模块等。本文所使用的STB表示报告调优数据的任何 设备。 在理想情况下,单独的每个市场数据将为每个市场中的每个家庭提供。不幸的是,技术的,合同的和组织的限制往往阻碍了为处理中心107提供这些数据。多种公开的实施例必须进而推断网络订阅的每个市场的分布。因此,本文所使用的“不报告的HH”指不具有随时提供的调优数据的家庭。一些实施例估计来自不报告的HH(和/或来自报告的HH内的不报告STB的观看,其是在本文中称为“水平预测”)的观看数据。然后,一些实施例中使用调优级数据来计算观看小时、平均观众、评价、分享,以及其他指标。 此外,报告的HH在他们的观看行为上可能与不报告HH在根本上不同。例如,在一些情况下,数据不会从OTA HH提供,且这些HH在他们可用的频道数量上与有线/DBS/IPTV HH不同。因此,在一些实施例中,预测系统将对报告和不报告的HH之间的行为差异作出解释。在一些实施例中,本文公开的系统和方法可以采取措施来对这些差异作出解释。 示例分析系统 图3是展示预测系统300的实施例的示意图。如图3所示,预测系统300包括导入模块301、数据处理模块302、存储模块303、预测模块304和显示模块305。在一些实施例中,一个或多个网络运营商116可以直接提供采样家庭信息12到预测系统300的导入模块301。采样家庭信息12涉及用户行为,例如,选择与回复来自内容源105的内容。在一些实施例中,采样家庭信息12可以包括调优数据,其中包括一组订户数据。调优数据反映了采样家庭217的用户行为。订户数据展示了采样家庭217中的用户的人口统计信息。在一些实施例中,调优数据可以与涉及内容11的播放日程的日程数据组合。在一些实施例中,日程数据可被接收作为单独的数据馈送,并且可以通过网络/场所/日期/时间的方式与调优数据进行组合。 导入模块301可以导入采样家庭信息12到数据处理模块302以进行进一步处理。如图3所示,数据处理模块302可以进一步包括调整子模块3021和计算子模块3022。调整子模块3021可以首先验证采样家庭信息12,然后根据该数据的可靠性调整信息12。在一些实施例中,当他或她实际上不收看显示在显示设备211上的内容时,数据的可靠性可以通过用户是否关闭家庭设备204来确定。例如,根据实证研究,约37%到55%的用户在24小时内从不关闭家庭设备204。该数据可能显示,很有可能即使家庭设备204被保持在打开状态并且该记录显示某节目被访问,这些用户在至少一些时间段(例如,在夜间)不看任何节目。在一些实施例中,确定来自家庭装置204的数据是否可靠可以包括:(1)如果家庭设备204在每个收看日生成了至少一次断电事件,那么家庭设备204是可靠的;或(2)如果家庭设备204具有少于1%的调优,调优是六个小时或更长,那么家庭装置204是可靠的。2011年4月6日提交的美国专利申请号13/081,437,标题为“Method and System for Detecting Non-powered Video Playback Devices”更详细地描述了有关确定家庭设备何时关闭的方法和系统,其全部内容出于所有目的通过引用方式被合并于此。 重新参照图3,在完成调整后,调整子模块3021传送调整的采样家庭信息22到计算子模块3022。然后,计算子模块3022基于至少一个预置的因素,包括人口分布、地区分布,或用户行为调查计算经处理的家庭信息13。 在计算后,数据处理模块302可以传送经处理的家庭信息13到存储模块303。在一些实施例中,存储模块303可以包括若干存储单元3031、3032和3033。例如,存储模块303可以在第一存储单元3031中保存从第一网络运营商提供的采样家庭信息12生成的经处理的家庭信息13。类似地,从第二网络运营商提供的采样家庭信息12生成的经处理的家庭信息13也可以保存在第二存储单元3032中。此外,所有经处理的家庭信息13可以集成地保 存在集成的第三存储单元3033中。如上所讨论的,在一些实施例中,经处理的家庭信息13包括一个时间段内所有预定地区市场区域101中的所有用户行为信息。在一些实施例中,经处理的家庭信息13可以包括某些内容11的收视率,或目标用户访问特定内容11的时长或通过哪一分布频道107或网络运营商316目标用户访问特定内容11。在一些实施例中,经处理的家庭信息13可以是计算预测信息14的基础。 如图3所示,经处理的家庭信息13可以从存储模块303传送到预测模块304。在一些实施例中,预测模块304可以基于来自客户的预测请求或自动地生成预测信息14。在一些实施例中,预测信息14可以包括:某个时间段的某个区域内内容11的收视率,某些内容11的用户资料,访问某些内容11的用户的偏好,或不同内容之间的用户行为的相互关系。在一些实施例中,预测信息14可以根据客户的请求进行定制。在一些实施例中,预测信息14也可以保存在存储模块303中。 如图3所示,系统300可以进一步包括显示模块305。在一些实施例中,显示模块305可以在用户界面上以电子文档、硬拷贝报告、图像文件或表格或图表形式显示预测信息14。 分析过程 图4是可以在一些实施例中实现的,示出数据分析过程400中的各个步骤的一般化过程流程图。 在一些实施例中,在框401中被导入的数据可以包括调优数据存储库402a,描绘内容显示时间的主日程数据库402,包括DVR收视数据的DVR活动存储库402c,包括HH和/或各个订户信息的订户存储库402d,以及包括关于位于各自市场的人口的信息的人口信息存储库402e。额外或更少的存储库可以被包括在描绘不同数据的一些实施例中。 系统可以在框403应用TV关闭/机顶盒逻辑至导入的数据。例如,该系统可以产生生存曲线和/或识别无效的调优数据。 在框404中,该系统可以汇总数据的报告。 在框405中,该系统可以预测缺失的收视并纠正运营商的偏差。一些用于预测收视的方法将在下文更详细地描述。 在框406中,该系统可以将数据加载和验证,例如,到集成的TV评级数据库407。虽然被称为“TV数据库”,但将认识到的是该数据库可以包括一般内容信息,诸如经由网站、视频点播(VOD)、按次付费等分布的内容的信息,并且可以包括实况收视和DVR录制和回放。 在框408中,该系统可以计算详细的报告,其详细说明利益相关者期望的特征和特性。 在框409中,该系统可以为分析师提供报告用于回顾。 调优信息 图5描绘了如在一些实施例中接收的调优信息500。信息500可以包括“机顶盒”ID 505,“调优开始”时间戳510,“调优结束”时间戳515,以及频道指示器520(或其他内容地址,例如URL)。 图6描绘了如在一些实施例中接收的日程信息600。信息600可以包括市场605、频道610、节目615(或类似的内容标识),以及“广播开始”时间戳620和“广播结束”时间戳625。本文所使用的“广播”不仅指无线电和电视广播,通常还指内容的收看,诸如当按用户的请求,例如通过下载被传输时。 订户信息 图7描绘了如在一些实施例中接收的订户信息700。信息700可以包括 STB ID 705、家庭ID 710,以及邮政编码715。将会认识到的是这些示例的细节可以被改变(例如,被提供的可能是市场标识符而不是邮政编码)。在一些实施例中,TV市场720和服务提供商725的信息也可以被提供。 调优数据的后续处理:叠加调优信息上的日程 图8描绘了如在一些实施例中应用的日程信息的叠加。该系统可以接收调优数据805和日程信息810。通过在调优数据805上叠加日程信息810,频道可以被替换为在组合数据815中描绘的由运营商播出的广播。 调优数据的后续处理:过滤 图9描绘了如在一些实施例中执行的长度滤波之前和之后的调优数据的示例。最初,调优数据条目905包括调优开始和结束的时间。以下处理条目出现在减少的形式910中。由于第3行包括少于30秒的持续时间,该系统可以删除该条目。 运营商信息 图10描绘了如在一些实施例中实现的以运营商订户信息补充调优数据的示例方法。最初的运营商订户信息1005可以基于STB ID,例如减少的形式910,与调优数据配对以创建复合条目1010。 数据汇总 图11描绘了在一些实施例中实现的按邮政编码和按收视市场汇总的调优数据。该系统可以采用复合条目1010,并计算邮政编码内的广播收看信息。例如,该系统可以采用按邮政编码1105组织的收视数据,并按市场1110重新组织数据。数据组织1105的第4行,三台STB收看“A.M Show”,但仅 两个HH被描绘为观看“A.M Show”。这表明在家庭5030中的两台STB调优到同一节目。 收视预测 图12描绘了如在一些实施例中实现的收视预测的一般化透视图。该报告数据1205可以包括不同层次(例如,有线电视、IPTV、OTA、卫星等)中的每个报告家庭的一些信息。然而,每个层次可能包含多个不报告的家庭或数据尚未提供的家庭。因此,该系统可以部分地根据报告家庭预测数据以产生预测的收视数据1210。 图13描绘了如在一些实施例中参照的跨越美国的地区市场的分解。 在一些实施例中,系统收集来自210个美国电视市场区域的每一个中的运营商合作伙伴的收视数据。该系统可以接收来自各个网络运营商的数据,如DishAT&T的U-verse DigitalCharter等。在一些实施例中,该系统收集来自使用多个网络运营商的报告家庭的收视信息(例如,有线电视;直播卫星(DBS);互联网协议电视(IPTV),有时被称为电信(telco);无线(OTA)家庭)。这些不同的信息来源在本文中被称为“层次”,但这不暗示来源的部分或整体的排序。在一些实施例中,对于每个210电视市场,预测系统将使用被报告的信息来建立未报告的收视家庭的模型。该系统可以积累210个市场以产生全国性的测量。在一些实施例中,对于每个市场,预测系统可以预测DBS观看有线观看数据,OTA观看数据,IPTV观看数据,并且可以聚合这四个层次。 在一些实施例中,来自每个层次的数据可以具有其自身的考虑和其自身的挑战。例如,在一些实施例中,DBS数据仅基于单个运营商(例如,)的观看数据(假设卫星HH更类似于彼此,而不是其它报告运营商)被估算。在一些实施例中,电信(telco)数据可以同样仅包括来自单个运营 商(例如,)的数据。在一些实施例中,有线数据基于来自报告的有线运营商(例如,),或来自另一数据来源,诸如全国调查的有线HH上被观测的收视。在一些实施例中,OTA要素可以从全国调查估算,由于可能没有OTA HH报告STB数据。 收视预测-预测DBS数据 图14描绘了如在一些实施例中实现的数字广播卫星(DBS)收视数据预测拓扑。将认识到的是图14-18的每个“dish network”,“Charter”,以及“AT&T”标志都是他们的拥有者(DISH网络有限责任公司,Charter通信公司和AT&T知识产权和/或AT&T的附属公司)的注册商标,并且出现在这里只是作为在一些实施例中使用的可能的报告的运营商的示例。在一些实施例中,因为dish家庭提供了用于估算DBS收视数据的较好的基础。因此,一些实施例中,仅来自Dish数据集1405的家庭被使用于预测1410以创建预测的DBS收视数据。 收视预测-预测有线数据 图15描绘了如在一些实施例中实现的有线收视数据预测拓扑。在一些实施例中,来自每个可用层次数据集的数据1510a-c可以被用于创建预测的有线观看数据1525。 在一些情况下,有线家庭可能收看多于DBS和IPTV家庭所观看的一些网络。相反,有线电视家庭也可能收看少于DBS和IPTV家庭的一些网络。一些实施例使用来自有线运营商的收视信息来调整DBS和IPTV家庭的报告的收视,以解释这些收视差异。该系统可以以例如,消费者调查补充有线收视信息。在一些实施例中,该调整可以在网络间基础上进行。各种要素或其它统计调整也可以应用于解释不同类型的电视服务和之后的收看者行为之间 的差异。在一些实施例中,表示不报告有线层次HH中的每HH收看小时与报告HH中的每HH收小时的比值的要素可以从另外的数据来源或从国家调查来推断。在一些实施例中,对于有线和DBS,预测系统可以解释报告运营商的网络覆盖和预测层次的网络覆盖之间的差异。过程的示例可以如下进行。 首先,该系统可以计算报告家庭中的比率。例如,假设特定的内容(网络,站点,节目等)的报告的收视,在家庭的给定的时间段显示为1.5%的比率值(意味着在上述时间段期间内的平均水平,全部HH的1.5%正在观看给定的内容)。 其次,该系统可以应用运营商的网络覆盖。该系统可以计算出一个“覆盖率”,其仅测算可以收看网络(例如,网络的订户)的报告家庭中的收视。例如,假设80%的报告HH订阅了网络。在这个例子中: 覆盖率=1.5%/0.80=1.875% 例如,如果更少的家庭订阅,覆盖率将增加,以反映那些家庭更大的权重。相反,如果更多的家庭订阅,覆盖率将减少。如果所有家庭订阅,那么该比率也不会改变。 第三,该系统可以应用该层次的网络覆盖。预测系统可以应用覆盖率,1.875%,到所有市场的覆盖的有线电视家庭或覆盖的DBS家庭。例如,该系统可以假定可以收看网络的1.875%的该层次家庭收看了网络(在讨论的时间段内)。如果该层次所有家庭的60%订阅了网络,那么: 预测比率=1.875%*0.60=1.125% 收视预测-预测OTA数据 图16描绘了如在一些实施例中实现的无线(OTA)收视数据预测拓扑。在一些实施例中,来自每个可用层次数据集的数据1610a-c可以被用于创建的预测的有线收视数据1625。 在一些实施例中,系统可以不具有来自OTA家庭的直接报告,但仍可能认识到OTA家庭收看电视,不同于DBS、IPTV和有线家庭。例如,在OTA家庭可以收看多于或少于其它层次的一些网络。一些实施例使用消费者调查,以调整在网络间的基础上的差异。各种要素或其它统计调整也可以应用于解释不同类型的电视服务,和之后的收看者行为之间的差异。在一些实施例中,表示不报告OTA层次HH中的每HH观看小时与报告HH中的每HH观看小时的比值的要素可以从另外的数据来源或从国家调查来推断。 此外,在一些实施例中,因为OTA家庭仅可以收看少数广播频道,所以当OTA观看被预测时,这些频道报告的观看获得更大的权重。例如,该系统可以分配非广播网络上的所有报告的观看时间到广播网络。 收视预测-预测IPTV数据 图17描绘了如在一些实施例中实现的互联网协议电视(IPTV)观看数据预测拓扑。在一些实施例中,如图17所示,IPTV层次仅由来自一个来源1705,例如......的数据1710组成。因此,预测1725可以唯一地基于该数据。 收视预测-累计层次 图18描绘了如在一些实施例中实现的聚合数据预测拓扑。一旦预测数据1820a-d已经为每个层次准备,该系统可以集成预测数据,以产生收视1815的每个市场的测定。 在此步骤中,系统可以合计所有四个层次的观看,其中数据已经被估算。 数据预处理操作 数据预处理操作-不完全报告 图19描绘了如在一些实施例中的系统中接收的各个运营商的不规则报告时间。随着时间1901的前进,运营商1在时间1902a-c报告,运营商2在时间1903a-b报告,运营商3在时间1904报告。因此,如果分析将在时间1905被执行,那么该处理中心可能需要估算在时间1904、1903b和1902c的报告中的数据。 图20示出了如在某些实施例中实现的用于准备收视数据以在预测估计中使用的观看数据的数据流程图。该系统可依赖报告HH,STB的“预期的数量”,和/或观看小时,并且可以通过按预期与实际HH,STB和/或小时的比值放大报告的观看为不足进行调整。 在图20的示例中,通过采用来自家庭(HH)垂直2001、机顶盒(STB)垂直2002,以及时间垂直2003的数据描绘三要素垂直预测。在一些实施例中,HH和STB的不完整预测,可以按每个市场/运营商在报告日、周或月的级别进行计算。最后的预测值可以按市场/运营商积累。 在一些实施例中,对小时的不完整预测按市场/运营商在小时的级别进行计算。小时的预测数量可以累积到报告的级别。 在一些实施例中,所有HH报告者被配置为报告已经充分报告一段时间内所有数据的HH。在一些实施例中,DISH数据可以在系统处理按日期起算的第一文件的14天后被提供。 在一些实施例中,垂直HH要素2001可以包括发生在该报告(日、周或月)的级别的HH的预测数量,并可以由市场/运营商来进行计算。在一些实施例中,所有市场/运营商的报告可以按市场累积预测的HH的数量。运营商可以以这种方式给出HH的预测总数(HH垂直要素)。 当HH数据是完整时2004,垂直HH要素2001的预测的报告HH可以是如框2010所示的(HH CRB*%HH Active Basecount)。 在一些实施例中,当HH数据是不完整时2004,系统可以确定框2007中%HH Active Basecount是否大于%HH Expected Active。如果是,那么HH可以在框2010中被设置为(HH CRB*%HH Active Basecount)。 相反,如果%HH Active Reporting小于%HH Expected Active,那么HH可以在框2011中被设置为(HH CRB*%HH Expected Active Basecount)。然后,在框2014中,系统可以缩放垂直HH要素:(Projected Reporting HHs)/(Active STB Basecount)。 关于垂直STB要素2002,STB的预测数量可以发生在该报告的级别(日、周或月),并可以按市场来进行计算。在一些实施例中,最低级别的预测发生在市场日。然后,市场日要素可以应用于所有更低级别的报告。 当完整的STB数据可用2005,STB可以被设置为框2012中的(STB CRB*%STB Active Basecount)。当STB数据不完整时2005,系统可以在框2008中确定%STB Active Basecount是否大于%STB Expected Active。如果是,那么该系统在框2012中可以将STB赋值为(STB CRB*%STB Active Basecount)。 相反,如果条件为否,例如如果%STB Active Reporting小于%STB Expected Active,该系统可以在框2013中将STB设置为(STB CRB*%STB Expected Active Basecount)。在框2015中,该系统可以缩放垂直STB要素:(Projected Reporting STBs)/(ActiVe STB Basecount)。 关于垂直小时要素2003,小时的预测可以在operator_market_hour发生。在一些实施例中,operator_market_hour可以包括报告小时的CTRB。在一些实施例中,要素可以被应用于operator_market_network_hour,并且累积到适当的报告级别。 在一些实施例中,当确定预测报告小时的时候,在框2006中,数据是完整时,系统在框2016可以不对小时进行调整。 相反,如果该数据是不完整的,那么在框2009中系统可以判断operator_market_hour是否大于(例如,最后3个对应的完整operator_market_hours的)平均值。如果是这种情况,那么在框2016中没有小时调整发生。 相反,如果operator_market_hour小于(例如,最后3个对应的完整operator_market_hour的)平均值,那么在框2017小时被设定为平均值(最后3个对应的完整operator_market_hour)。 在框2018中,系统可以缩放垂直时间要素:(从op_market_hour合计的预测的小时)/(实际时间)。 在框2019中,收视估算可以基于要素生成。 数据预处理操作-地区分布 图21示出了如在一些实施例中实现的确定网络收视的每个市场分布的数据处理体系结构的高层次拓扑。如本文的各种实施例所讨论的,分析引擎2106可以接收多个数据2101-2105,并产生网络订阅收视2107的每个市场的分布。 电脑系统 图22展示了计算机系统示例形式的机器的示意图,其中一组指令可被执行以用于使机器执行任意一个或多个的本文讨论的方法。 在替代实施例中,机器作为独立的设备运行,或者可以被连接(例如,联网)到其它机器。在联网的部署中,机器可执行在客户端-服务器网络环境中的服务器或客户端机器的能力,或者作为点对点(或分布式)网络环境中的对等机器运行。 该机器可以是服务器计算机、客户端计算机、个人计算机(PC),用 户设备、平板PC、笔记本计算机、机顶盒(STB)、个人数字助理(PDA)、蜂窝电话、iPhone、iPad、黑莓、处理器、电话、网络设备、网络路由器、交换机或桥接器、控制台、手持式游戏机、(手持式)游戏设备、音乐播放器、任何便携式、移动式、手持式设备,或能够执行指定以待该机器执行动作的一组指令(顺序的或其它方式)的任何机器。 虽然机器可读介质或机器可读存储介质在示例性实施例中示出为单个介质,但是术语“机器可读介质”和“机器可读存储介质”应当被视为包括单个介质或多个介质(例如,集中式或分布式数据库,和/或相关的缓存和服务器),其存储所述一个或多个指令集。术语“机器可读介质”和“机器可读存储介质”也应该被理解为包括任何非临时性介质,其能够存储、编码或携带一组指令用于机器的执行,并且其使得机器执行任何当前公开的技术和发明的一个或多个方法。 一般而言,执行以实现本公开的实施例的例程,可以被实现作为操作系统的一部分或被称为“计算机程序”的特定应用,组件,程序,对象,模块或指令序列。计算机程序通常包括设置在计算机中的各种存储器和存储设备在各种的一个或多个指令,而且,当由计算机中的一个或多个处理单元或处理器读取和执行时,使得计算机执行操作,以执行涉及本公开的各种方面的元素。 此外,虽然实施例已经在全功能计算机和计算机系统的语境下进行了描述,本领域的技术人员将认识到各种实施例能够被分布作为各种形式下的程序产品,并且本公开在不考虑被用于实际上产生分布的具体类型的机器或计算机可读介质的情况下,等同地应用。 机器可读存储介质、机器可读介质,或计算机可读(存储)介质的其它示例包括,但不限于,可读类型介质,诸如易失性和非易失性存储器设备,软盘和其它可移动磁盘,硬盘驱动器,光盘(例如,压缩磁盘只读存储器 (CD ROMS),数字多功能磁盘(DVD)等),此外还有传输型介质,诸如数字和模拟通信链路。 网络接口设备通过由主机和外部实体支持的任何已知和/或方便的通信协议的实体使机器2200解调具有外部于主机服务器的实体的网络中的数据。网络接口设备可以包括一个或多个网络适配器卡、无线网络接口卡、路由器、接入点、无线路由器、交换机、多层交换机、协议转换器、网关、网桥、桥路由器、集线器、数字媒体接收器和/或中继器。 所述的网络接口设备可以包括防火墙,其可以在一些实施例中支配和/或管理访问/代理计算机网络中的数据的权限,并跟踪改变不同机器和/或应用之间的信任级。防火墙可以是具有硬件和/或软件组件的组合,能够在特定机器组和应用,机器和机器,和/或应用和应用之间执行预置访问权组的任何数量的模块,例如,以疏导不同实体之间共享的通信和资源的流量。防火墙可以附加地管理和/或访问访问控制列表,其详述了包括例如个人,机器,和/或应用的对象的访问和操作权利的权限,以及权限所在的情况。 其它网络安全功能可以被执行或被包括在防火墙的功能中,在不偏离本公开的新颖领域的情况下,其可以是例如,但不限于,入侵预防、入侵检测、下一代防火墙、个人防火墙等。 备注 一般而言,执行以实现本公开的实施例的例程,可以被实现作为操作系统的一部分或被称为“计算机程序”的特定应用,组件,程序,对象,模块或指令序列。计算机程序通常包括设置在计算机中的各种存储器和存储设备在各种的一个或多个指令,而且,当由计算机中的一个或多个处理单元或处理器读取和执行时,使得计算机执行操作,以执行涉及本公开的各种方面的元素。 此外,虽然实施例已经在全功能计算机和计算机系统的语境下进行了描述,本领域的技术人员将认识到各种实施例能够被分布作为各种形式下的程序产品,并且本公开在不考虑被用于实际上产生分布的具体类型的机器或计算机可读介质的情况下,等同地应用。 机器可读存储介质、机器可读介质,或计算机可读(存储)介质的其它示例包括,但不限于,可读类型介质,诸如易失性和非易失性存储器设备,软盘和其它可移动磁盘,硬盘驱动器,光盘(例如,压缩磁盘只读存储器(CD ROMS),数字多功能磁盘(DVD)等),此外还有传输型介质,诸如数字和模拟通信链路。 除非语境中清楚地要求,否则遍及说明书和权利要求书中,词语“包括(comprise)”,“包括(comprising)”等将被解释为包含的意义,而不是排他或穷举的含义;也就是说,是“包括但不限于”的含义。如本文所用的,术语“连接”,“连结”或其任何变体,是指这两者或以上的元素之间的直接或间接的任何连接或连结;元素之间的连接的连结可以是物理的、逻辑的或它们的组合。另外,词语“本文中”、“以上”、“以下”,以及类似含义的词语,在本申请中使用时,应指本申请的整体而不是这个申请的任何特定部分。只要语境允许,在以上具体实施方式中的词语使用单数或复数还可以分别包括复数或单数。参照两个或更多个项目的列表中的词语“或”覆盖了所有该词语的以下解释:该列表中的任意项目,该列表中的所有项目,以及该项目中项目的任意组合。 本公开的实施例的以上具体实施方式并不是为了穷举,或者将这些指导限制于以上公开的精确形式。本领域技术人员将认识到虽然本发明的具体的实施例和示例在上文以说明的目的描述,但各种等同修改是在本发明的范围之内是可行的。例如,尽管处理或模块以给定的顺序呈现,备选实施例可以以不同的顺序执行具有多个步骤的程序或采用具有多个模块的系统,并且 某些过程或模块可以被删除、移动、添加、细分、组合和/或修改。这些过程或模块可以以各种不同的方式来实现。此外,尽管过程或模块偶尔在串行执行时被示出,这些过程或模块可改为并行执行,或可以在不同的时间执行。此外,本文提到的任何具体数字仅仅是示例:替换的实现可以采用不同的值或范围。 本文所提供的公开的指导可以应用于其它系统,而并不必然是上述系统。上述的各种实施例的元素和动作可以被组合以提供进一步的实施例。 任何专利和申请,以及包括任何可能被列于所附申请文件的提及的其它引用都通过引用并入本文。如有必要,本公开的各方面可以被修改为采用上述各种引用的系统、功能以及概念来提供本公开的进一步实施例。 根据上述详细说明可对本发明做出这些或其它修改。虽然上述说明详细描述了本发明的某些实施例和描述了最佳预期模式,无论上述描述在文章中多么详细,本发明可以以多种方式实现。本发明的细节可以在其实现细节上产生相当大的变化,同时仍然被包含在本文所公开的发明中。如上所述,所使用的特定术语在描述本发明的某些特征或各方面时,不应被视为暗示该术语在此被重新定义以与该术语相关的方面限制本发明的任何特定的特性、特征,或各方面。在一般情况下,以下权利要求书中所使用的术语不应当被解释为将本发明限制在本说明书中公开的具体实施例,除非上述详细说明部分明确定义了此种术语。因此,本发明的实际范围不仅包括所公开的实施例,而且还包括实施或实现本发明的所有等同的方式。 当本公开的某些方面以某些权利要求的形式在以下呈现,发明人设想了以权利要求形式的数量的本公开的各个方面。例如,虽然仅本公开的一方面被记载为35 U.S.C §112,下的功能性限定权利要求,其它方面同样可以体现为方法加功能或其它形式的权利要求,诸如被体现在计算机可读介质中。(任何旨在以35 U.S.C §112,对待的权利要求将以词语“...的装置” 开始)。因此,在提交申请后,申请人保留增加附加的权利要求的权利,以寻求用于本公开的其它方面的这样的附加权利要求形式。
《用于预测收视数据的系统和方法.pdf》由会员分享,可在线阅读,更多相关《用于预测收视数据的系统和方法.pdf(37页珍藏版)》请在专利查询网上搜索。
各种用于生成和扩大收视数据集的系统和方法在此公开。特别是,一些实施例通过基于可用的数据补充丢失的信息,以准备用于进一步分析的数据集。该系统可以组织收视数据从不同格式到统一的形式,以便于对不报告的设备数据进行分析和预测。在一些实施例中,该预测可基于有关于在不同地区市场中的不报告设备的存在和性质的信息,扩展现有累积的测定。。
copyright@ 2017-2020 zhuanlichaxun.net网站版权所有经营许可证编号:粤ICP备2021068784号-1