一种面向媒体的网络影响力指数计算方法 【技术领域】
本发明涉及一种定量评估电视、广播、报纸等的网络影响力的方法,尤其涉及一种面向电视、广播、报纸等传统媒体,通过定量评估其在论坛、网页等网络媒体上的影响力,准确评估传统媒体价值高低的网络影响力指数计算方法,属于互联网增值服务技术领域。
背景技术
随着我国互联网产业的飞速发展,互联网已经成为新闻信息服务传播领域中影响巨大的、最具发展潜力的媒体,对政治、经济、文化及人民生活等方方面面都产生着深刻的影响。据有关研究机构统计,目前中国的互联网用户已经超过2.5亿,具全球首位,而且这一数字还在高速增长过程之中。
对于电视、广播、报纸等媒体而言,其传播效果的评价不应该忽视影响力正在不断上升的网络媒体。但是,现有的各种评价体系和方法均对网络影响力有所忽视。
以电视行业为例,传统的电视评价体系基本上是将收视率作为唯一的评价指标。但是,收视率是观众在强制状态下做出的一种被动性反应,既无法反映观众的主动性要求,又无法代表观众的真实满意程度,更无法测量电视媒体的社会影响力。同时,收视率指标评价的是在看电视的观众总数中有多少人看某个电视媒体的节目,而对于没有看电视的人是否了解某个电视媒体以及所持的看法等却无法评价。因此,以收视率作为电视节目的唯一评价标准具有较大的表面性和片面性。
在互联网高速发展的浪潮中,传统的电视收视率调查渐渐显示其不足,因为它不能囊括电视媒体在互联网上的影响力。人们可以在互联网上关注某电视频道和节目,搜索相关信息,欣赏之前错过的视频,并与志趣相同的网友讨论互动。于是,网络成为电视媒体重要的营销平台,也成了评价其影响力的另一个重要指标。因此,通过互联网数据研究电视媒体的影响力显得尤为重要,它可成为电视台一项重要的市场参考指标。
但是,准确评估某一媒体在论坛、网页等网络上的影响力存在相当的技术难度。主要的难点在于不论是搜索量还是点击量(这两个是可以准确统计的客观数据)都无法准确评价网络对于该媒体的影响力。例如某一电视节目很不受欢迎,网络上是骂声一片(网络上这种负面言论其实是更容易传播的),但是从统计结果来看其搜索量还是点击量都可能非常高,因此单纯依据搜索量或者点击量来评价电视节目在网络上的影响力很容易产生误导。人们迫切需要一种编制更加科学、结果更加客观的网络影响力指数计算方法来准确评价该媒体在网络上的影响力。
根据发明人的研究,编制网络影响力指数时必须考虑以下几点:
1.样本网站必须具有典型性,为此,选择样本应综合考虑网站类型、市场影响力、点击量等因素。
2.计算方法应具有高度的适应性,能对不断变化的网络情况作出相应的调整或修正,使影响力指数有较好的敏感性。
3.要有科学的计算依据和手段。计算依据的口径必须统一。
4.基期应有较好的均衡性和代表性。
5.必须有很强的抗人为操作性,最大限度避免人为操作带来的负面效果。
6.编制出来的指数要相对稳定,不确定性因素对它的影响要降到最低。
7.不同期的指数要有可比性。
【发明内容】
本发明所要解决的技术问题在于提供一种编制手段科学、结果真实可靠的媒体网络影响力指数计算方法。通过该方法所获得的网络影响力指数是建立在电视、广播、报纸等传统媒体与网络媒体互动、融合基础上的一个新型评价指标。
为实现上述的目的,本发明采用下述的技术方案:
一种面向媒体的网络影响力指数计算方法,其特征在于包括如下步骤:
(”按照网络影响力指数所包含的指标数量,将网站分为多个样本空间,分别与各个指标相对应;
(2)在各样本空间中,确定网站综合实力排名在前E名的网站,再按日均点击量进行排名,各以排名序数每F个分为一组,从每组中随机抽取一个网站作为样本网站,其中E、F均为自然数,且E为F的倍数;
(3)以报告期内样本网站的调整点击量作为权重,采用分级靠档技术确定样本网站的权重;
(4)以样本网站为基础,分别计算网络影响力指数所包含的各个指标的数值;
(5)将步骤(4)获得的各个指标数值的加权平均之和作为媒体的网络影响力指数。
其中,在所述步骤(1)中,所述网络影响力指数所包含的指标为四个,分别是知名度指标I
1、被关注度指标I
2、网络收视度指标I
3和网络美誉度指标I
4。
所述知名度指标I
1以样本网站搜索引擎的搜索结果为依据,所述被关注度指标I
2以样本网站搜索引擎的论坛搜索结果为依据,所述网络收视度指标I
3以样本网站中节目的被下载次数为依据。
所述网络美誉度指标I
4是通过设定若干个表明用户态度的典型关键词,对作者的态度进行判断获得的。
在计算所述网络美誉度指标I
4时,将作者对节目的态度分为称赞、中立和批评三类,将持称赞和中立态度的信息量减去持批评态度的信息量,其结果作为网络美誉度指标I
4的依据。
所述步骤(2)中,将媒体的自办网站也作为样本网站。
所述步骤(2)中,E的取值不少于200。
所述步骤(2)中,定期对所选用的样本网站进行调整,将各样本空间的前E名为调整缓冲区,每次调整前未能进入前E名的网站将被淘汰,而新进入前E名的网站将入选缓冲区。
所述步骤(3)中,所述调整点击量为报告期内样本网站的点击量与所有样本平均点击量的相对值。
所述分级靠档技术为将调整点击量分为多个等级,将各个样本网站分别归入不同的等级中,对于不同的等级分别赋予不同的权重。
利用本媒体网络影响力指数计算方法可以准确、客观地评估电视、广播、报纸等传统媒体在网络上的影响力,为传统媒体正确处理与网络的关系、准确把握传统媒体与新媒体之间融合趋势提供科学依据,为行业内外评价和掌握传统媒体的经营业绩提供有效参考。
【附图说明】
下面结合附图和具体实施方式对本发明作进一步的说明。
图1为本发明所提供的媒体网络影响力指数计算方法的实施过程示意图。
【具体实施方式】
经过认真研究,本发明人认为电视、广播、报纸等传统媒体的网络影响力指数本质上是传统媒体品牌的内涵和外延在网络上扩张力的表现。它应该能体现出媒体节目(在本发明中为电视节目、广播节目、报纸文章等的统称)在网上有多少人收看、下载评论,栏目频道以及媒体节目的正面信息有多少,负面信息有多少,网民对电视、广播、报纸等媒体的好恶,这些信息对现实中的观众可能带来的影响等。另外,网络影响力指数还应能体现出传统媒体传播的内容,比如某个信息、某种现象在网络上所带来的网民的集聚程度,对网民注意力的集聚程度等。
基于上述的认识,本媒体网络影响力指数计算方法所创制的网络影响力指数主要包含四个指标,分别反映媒体节目在网络上影响力的不同层面。这四个指标中,第一是知名度指标I
1,指的是由正式机构发布的关于某一媒体的信息量的总和;第二是被关注度指标I
2,指的是某一媒体在网络各大论坛中被讨论的量;第三是网络收视度指标I
3,指的是媒体生产的电视节目、广播节目、报纸文章等在网络中被收看/被下载的次数;第四是网络美誉度指标I
4,指的是网友对媒体品牌评价所持的满意及赞美程度。由于网络影响力指数是由这四个指标组成的有机整体,因此能够从不同角度、不同层面综合反映媒体节目在网络上的影响力大小。
下面以电视媒体为例,详细介绍计算上述四个指标的具体过程。
如图1所示,首先按照网络影响力四个指标的要求,把符合要求的网站分为四个样本空间,分别与四个指标相对应。
由于网站种类繁多,计算全部网站各类数据的工作是艰巨而复杂的,因此在调查中选择若干种富有代表性的样本网站,并计算这些样本网站的相关数据,用以近似表示整个网络的影响力指数变动总趋势。为了在选择样本网站的过程中进一步排除人为因素的干扰,本发明中依据网站综合实力排名对各样本空间网站在最近一年的位次由高到低排序,确定前E名网站,再按日均点击量由高到低进行排名,各以排名序数每F(F≥4,且E为F的倍数)个分为一组,如1、2、3、4为一组,F+1、F+2、F+3、F+5为一组,以此类推,共分为E/F组。从每组中随机抽取一个网站作为样本网站,共得到E/F个样本网站。为了对电视媒体直接经营的网站做出鼓励,可以把他们的自办网站作为常设样本,因此每组样本网站为(E/F)+1个。
由于上述四个指标都直接或者间接与点击量相关,特别是知名度指标I
1,被关注度指标I
2和网络收视度指标I
3更是直接与广大网络用户的点击量相关,因此网络影响力指数以规模和点击量作为选样的两个根本标准,并赋予点击量更大的权重。在对各类网站进行指标排序后做出选择。在计算网络影响力指数时,对于点击量的处理将是十分重要的一个环节,下面对此展开具体的说明。
在选择样本网站时,网站的点击量是一个十分重要的标准。为了保证点击量统计的准确和客观,防止人为因素的干扰,可以通过交叉使用不同网络流量统计工具如google anaytics、Alexa Toolbar等的方式统计点击量。对于短时间内点击量变动较为剧烈的网站或者已经被证实采用了作弊手段来提高点击量排名的网站,原则上不将其列入样本网站之中。
为了准确客观地计算网络影响力指数,作为样本空间的网站数量不宜太少,一般而言,E的数量不应该少于200。随着技术的发展和经验的丰富,每组样本网站的数量可以逐步增加。另外,所选用的网站必须有代表性,它们都是国内甚至世界上具有重要影响的著名网站,其表现为网络市场所瞩目,社会各方面都极为重视。
为了减少人为操作因素和更能代表网络市场的发展状况,样本网站依据稳定性和动态跟踪相结合的原则,将对所选用的网站定期调整,一般每季度调整一次,用具有活力的、更有代表性的网站替代那些失去代表性的网站,一般为1、4、7、10月的月初实施调整。各样本空间的前E名为调整缓冲区,每次调整前未能进入前E名的网站将被淘汰,而新进入前E名的网站将入选缓冲区。每次调整均是从每组中随机抽取一个,组成一组样本网站。
这种选取方法的优点在于:第一是保证了样本网站具有较高的代表性和典型性,通过不断以点击量和规模等标准进行动态排名,保证了网络中主流网站的入选,排除了没有影响力的小网站;第二是保证了对网民的覆盖率,能够最大限度地反映网民的意愿;第三是使支撑指数走势的力量更加多元化,样本网站相对较为分散,使得个别网站影响指数走势的可能性进一步降低,控制了人为操纵的因素,使指数表现出持续稳定的变化态势。另外,采取缓冲区设置后,既保证样本定期调整的幅度,提高样本网站的稳定性,也增强调整的可预期性和指数管理的透明度,使得人为操纵网站进入或退出样本网站的难度加大了,指数的抗操纵性也得到加强。
本发明所推出的网络影响力指数是反映媒体在网络上不同时期的影响力变动情况的相对指标。就一个较长的时期来说,网络影响力指数比一般的绝对数或平均数等评价方法能更为精确地衡量网络中与媒体相关的变动。为了实现计算简便、易于修正并能保持统计口径的一致性和连续性的指数编制目标,本发明中的网络影响力指数采用加权法进行计算。
由于网络中不同的网站地位也不同,对网络的影响也有大小。加权法按样本网站在市场上不同地位赋予其不同的权数,地位重要的权数大,地位次要的权数小。考虑到网络的特殊性以及未来可能的结构变动,同时也为了避免影响力指数非正常性的波动,以报告期样本网站的点击量与所有样本平均点击量的相对值(即调整点击量)作为权重。确定网络影响力样本网站权重的方法为分级靠档技术。在本实施例中,共分为九级。
调整点击量按下式计算。
X0=1n×Σj=1nXj---(1)]]> Wj=XjX0-1---(2)]]> 其中,W
j为报告期第j个网站的调整点击量,X
j为报告期第j个网站的点击量,X
0为报告期所有样本网站的平均点击量。
九级靠档的具体数值和比例根据实际情况做明确规定,并在一定条件下作出调整。具体数值举例如下。
调整点击量(%) 权重(%)
≤20 20
(20,30] 30
(30,40] 40
(40,50] 50
(50,60] 60
(60,70] 70
(70,80] 80
(80,90] 90
>90 100
对于点击量比例接近、且处在分档位上下很近的网站,分级靠档技术可以扩大它们在指数中权重的差距,导致指数的精确性有所降低。但是,从指数复制角度出发,分级靠档技术为指数的权重预留了一定空间。以上述举例为依据,假如某样本网站的调整点击量为26%,则在计算指数时赋予该网站权重为30%。这种做法的好处是可以使在样本网站的点击量及调整点击量发生微小变动时保持权重的稳定,避免由网站相关数据频繁变动带来的跟踪成本增加,便于电视媒体进行跟踪。
网络影响力指数的风险可分为系统性风险和非系统性风险两个部分。系统性风险是指对整个网络中的所有网站都产生影响的风险。这种风险是由宏观性因素决定的,它作用时间长,涉及面广,往往使整个网络或一组网站发生剧烈的点击量变动。这是事先很难预计的,难以规避,又称不可控风险。非系统性风险则是针对待定的个别网站而产生的风险。这种风险一般是由这个网站内部的微观因素引起的,与整个市场无关,又称为可控风险。网络影响力指数的计算能够规避的风险主要是非系统性风险。因此,在具体计算网络影响力指数时,在考虑样本网站权重的基础上,将报告期电视媒体在某样本网站的搜索量、下载量和浏览量等与基期所有样本网站的点击量相比较,并将两者的比值乘以基期的指数值,即为该报告期内的知名度指标I
1,被关注度指标I
2和网络收视度指标I
3的具体数值。
即,知名度指标I
1所对应的知名度指数P
1为:
P1=Σj=1nVjZjΣj=1nVj---(3)]]> 被关注度指标I
2所对应的被关注度指数P
2为:
P2=Σj=1nVjUjΣj=1nVj---(4)]]> 网络收视度指标I
3所对应的网络收视度指数P
3为:
P3=Σj=1nVjQjΣj=1nVj---(5)]]> 上述的公式(3)~(5)中,V
j为报告期第j个网站的权重,Z
j为报告期电视媒体在第j个网站的搜索量,U
j为报告期电视媒体在第j个网站的论坛、社区等的搜索量,Q
j为报告期电视媒体在第j个网站的下载量和浏览量。
对于第四个指标-网络美誉度指标I
4,其计算方法比较特殊。这主要是因为网络美誉度指标指的是网友对电视品牌评价所持的满意及赞美程度。它是以知名度和被关注度为前提的,但又不像知名度和被关注度那样可以通过客观统计的点击量或者下载量作出定量的判断。这是因为网友的满意及赞美程度是一项带有主观色彩的指标,难以通过常规的技术手段进行判断。
目前,对于网络美誉度指标I
4这样的网络舆论监测,常用的处理方法是不停的运用各种搜索技术进行搜索,然后人工的进行语义判断。监测结果一般会是一份数据报告:多少条正面,多少条负面,多少条中性。有的监测报告会进一步给出舆论分析:多少负面信息是高危的(比如处于门户网站的首页或者某个大型综合论坛的首页),什么事件已经具有了初步扩散趋势(通过转载量和评论量)……。这种处理方法对于海量的网络数据而言无疑是杯水车薪,而且误差也很难得到控制。
本发明为了解决上述的问题,采用了语意搜索(Semantic Search)的技术。通过设定若干个表明用户态度的典型关键词,并结合扩展正则表达式注释器的规则,可以执行初步的文本分析任务,从而对作者的态度进行基本的判断。
基于上述的思路,本发明对新闻网站、网络社区以及博客中的相关文章、评论等进行文本分析,在此基础上将作者对电视节目、频道等的态度分为称赞、中立和批评三类。因此,网络美誉度指标I
4所对应的网络美誉度指数P
4为:
P
4=P′
4+P″
4-P″′
4 (6)
其中P
4′表示对电视媒体持称赞态度的指数,P
4″表示对电视媒体持中立态度的指数,P
4′″表示对电视媒体持批评态度的指数。
上述的各指数通过如下的公式获得:
P4′=Σj=1nVjRj′Σj=1nVj]]> P4′′=Σj=1nVjRj′′Σj=1nVj]]> P4′′′=Σj=1nVjRj′′′Σj=1nVj]]> 其中,R′
j为报告期第j个网站上对电视媒体持称赞态度的信息量;R″
j为报告期第j个网站上对电视媒体持中立态度的信息量;R″′
j为报告期第j个网站上对电视媒体持反对态度的信息量。
另外,网络影响力指数是逐期进行的,这样不同期的指数才有可比的价值。基期根据具体情况确定,基期指数为N=10
n(n≥1)。
Y0=Σj=1nYj---(7)]]> 其中Y
0为基期内所有样本网站的点击量,Y
j为基期第j个网站的点击量。
综合上述的说明,本媒体网络影响力指数计算方法所创制的网络影响力指数主要包含四个指标:
一是知名度指标I
1,指的是由正式机构发布的关于某一电视媒体的信息量的总和。这一指标表明了某一电视媒体的信息在网络中传播的广度,主要以样本网站搜索引擎的搜索结果为依据。从数学角度来表征,电视媒体的网络知名度指数I
1为:
I1=P1Y0N---(8)]]> 二是被关注度指标I
2,指的是某一电视媒体在网络各大论坛中被讨论的量,被讨论次数越多表明媒体越受关注。这一指标表明电视媒体在网络中的信息传播深度,主要以样本网站搜索引擎的论坛搜索结果为依据。从数学角度来表征,电视媒体的网络被关注度指数I
2为:
I2=P2Y0N---(9)]]> 三是网络收视度指标I
3,指的是电视媒体生产的内容在网络中被收看/被下载的次数,表明观众的主动收看行为,是电视媒体网络影响力的最高指标,主要以样本网站中电视节目的被下载次数为依据。从数学角度来表征,电视媒体的网络收视度指数I
3为:
I3=P3Y0N---(10)]]> 四是网络美誉度指标I
4,指的是网友对电视品牌评价所持的满意及赞美程度。网络知名度和被关注度是网络美誉度的基础;而美誉度才能真正反映了电视品牌在消费者心目中的价值水平。美誉度指标I
4是以知名度和被关注度为前提的,知名度和被关注度可以通过宣传手段快速提升,而美誉度则需要通过长期的品牌经营方能树立起来。从数学角度来表征,电视媒体的网络美誉度指数I
4为:
I4=P4Y0N---(11)]]> 上述四个指标的加权平均之和即为最终的网络影响力指数,即电视媒体的网络影响力指数I为:
I=I1I1′+I2I2′+I3I3′+I4I4′I1′+I2′+I3′+I4′---(12)]]> 上述的I′
1,I′
2,I′
3,I′
4分别为I
1,I
2,I
3,I
4的权重,该权重可以根据不同电视节目的特点进行动态调整。
上述对本发明所提供的媒体网络影响力指数计算方法进行了详细的说明。该媒体网络影响力指数使电视、广播、报纸等传统媒体能够比较自己不同时期在网络上的表现和经营情况,从而成为观察传统媒体和网络之间关系的主要参考指标。
需要说明的是,本媒体网络影响力指数计算方法的实现思路也可以用在计算某一企业或者某个地区的网络影响力指数上。在具体计算某一企业或者某个地区的网络影响力指数时,可以根据该企业/地区的特点和网络空间的具体情况,适当调整(增加、减少或者更换)上述的各项指标,例如网络收视度指标I
3就不适合于计算企业/地区的网络影响力指数。这种调整是本领域一般技术人员参照本发明所提供的思路能够轻易实现的,在此就不详细赘述了。
以上对本发明所述的面向媒体的网络影响力指数计算方法进行了详细的说明。对本领域的一般技术人员而言,在不背离本发明实质精神的前提下对它所做的任何显而易见的改动,都将构成对本发明专利权的侵犯,将承担相应的法律责任。