统计页面平均停留时间、确定页面用户黏性的方法和装置.pdf

上传人:54 文档编号:508107 上传时间:2018-02-20 格式:PDF 页数:15 大小:1.64MB
返回 下载 相关 举报
摘要
申请专利号:

CN201410250438.5

申请日:

2014.06.06

公开号:

CN104111970A

公开日:

2014.10.22

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20140606|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

微梦创科网络科技(中国)有限公司

发明人:

刘洋

地址:

100080 北京市海淀区彩和坊路6号7-10层

优先权:

专利代理机构:

北京市京大律师事务所 11321

代理人:

张璐;方晓明

PDF下载: PDF下载
内容摘要

本发明公开了一种统计页面平均停留时间、确定网页用户黏性的方法和装置,统计页面平均停留时间的方法包括:对于网站中待统计的页面,获取网站服务器记录的该页面的停留时间;其中,大于预设会话时间阈值的该页面的停留时间以空值表示;计算出值为空值的该页面的停留时间的个数在获取的该页面的停留时间的个数中所占的比重;根据获取的非空值的该页面的停留时间,计算出该页面的平均停留时间的基础值;若判定计算出的比重大于预设比重阈值,则根据该比重与预设会话时间阈值确定该页面的平均停留时间;否则将计算出的该页面的平均停留时间的基础值作为该页面的平均停留时间。应用本发明可以提高计算网站页面的平均停留时间的准确性。

权利要求书

1.  一种统计页面平均停留时间的方法,其特征在于,包括:
对于网站中待统计的页面,获取网站服务器记录的所述页面的若干个停留时间;其中,大于预设会话时间阈值的所述页面的停留时间以空值null表示;
计算出值为null的所述页面的停留时间的个数在获取的所述页面的停留时间的个数中所占的比重;并根据获取的非null值的所述页面的停留时间,计算出所述页面的平均停留时间的基础值;
若判定所述比重大于预设比重阈值,则根据所述比重与所述预设会话时间阈值确定所述页面的平均停留时间;否则,将所述基础值作为所述页面的平均停留时间。

2.
  如权利要求1所述的方法,其特征在于,所述若判定所述比重大于预设比重阈值,则根据所述比重与所述预设会话时间阈值确定所述页面的平均停留时间,具体包括:
若判定所述比重大于预设比重阈值,则进一步判断所述基础值是否大于预设停留时间阈值;若是,则将所述比重与预设会话时间阈值相乘后与所述基础值相加,得到所述页面的平均停留时间;否则,将所述比重与预设会话时间阈值相乘,得到所述页面的平均停留时间。

3.
  如权利要求1或2所述的方法,其特征在于,所述根据获取的非null值的所述页面的停留时间,计算出所述页面的平均停留时间的基础值,具体包括:
将获取的非null值的所述页面的停留时间进行排序,选取排序在预设的排序区间内的所述页面的停留时间后,计算出选取出的所述页面的停留时间的平均值,作为所述页面的平均停留时间的基础值。

4.
  如权利要求3所述的方法,其特征在于,所述预设的排序区间的两个端点分别为INT(m1×n)和INT(m2×n),其中,n为获取的所述页面的平均停留时间的个数,m1和m2为预设的百分比,且m1<m2;INT(m1×n)表示对m1×n取整;INT(m2×n)表示对m2×n取整;以及
所述选取排序在预设的排序区间内的所述页面的停留时间,具体包括:
选取排序在第INT(m1×n)位与第INT(m2×n)位之间的所述页面的停留时间。

5.
  一种确定页面用户黏性的方法,其特征在于,包括:
对于网站中待统计的页面,根据如权利要求1-4任一所述的方法统计出该页面的平均停留时间;
根据统计出的该页面的平均停留时间、以及预设的平均停留时间与黏性等级的对应关系,确定用户对该页面的黏性等级。

6.
  一种统计页面平均停留时间的装置,其特征在于,包括:
停留时间获取模块,用户对于网站中待统计的页面,获取网站服务器记录的所述页面的若干个停留时间;其中,大于预设会话时间阈值的所述页面的停留时间以空值null表示;
比重计算模块,用于从所述停留时间获取模块获取的所述页面的停留时间中统计出值为null的所述页面的停留时间的个数,计算该个数在所述停留时间获取模块获取的所述页面的停留时间的个数中所占的比重;
基础值计算模块,用于根据所述停留时间获取模块获取的非null值的所述页面的停留时间,计算出所述页面的平均停留时间的基础值;
平均停留时间计算模块,用于若判定所述比重大于预设比重阈值,则根据所述比重与所述预设会话时间阈值确定所述页面的平均停留时间;否则,将所述基础值作为所述页面的平均停留时间。

7.
  如权利要求6所述的装置,其特征在于,所述平均停留时间计算模块具体包括:
判断单元,用于若判定所述比重大于所述预设比重阈值,则进一步判断所述基础值是否大于预设停留时间阈值,若是,则发送第一计算通知,否则发送第二计算通知;若判断所述比重小于等于所述预设比重阈值,则发送第三计算通知;
平均停留时间计算单元,用于接收到第一计算通知后,将所述比重与预设会话时间阈值相乘后与所述基础值相加,得到所述页面的平均停留时间;接收到第二计算通知后,将所述比重与预设会话时间阈值相乘,得到所述页面的平均停留时间;以及接收到第三计算通知后,将所述基础值作为所述页 面的平均停留时间。

8.
  如权利要求6或7所述的装置,其特征在于,
所述基础值计算模块具体用于将所述停留时间获取模块获取的非null的所述页面的停留时间进行排序,选取排序在预设的排序区间内的所述页面的停留时间后,计算出选取出的所述页面的停留时间的平均值,作为所述页面的平均停留时间的基础值。

9.
  如权利要求8所述的装置,其特征在于,所述基础值计算模块中预设的排序区间的两个端点分别为INT(m1×n)和INT(m2×n),其中,n为获取的所述页面的平均停留时间的个数,m1和m2为预设的百分比,且m1<m2;INT(m1×n)表示对m1×n取整;INT(m2×n)表示对m2×n取整。

10.
  一种确定页面用户黏性的装置,其特征在于,包括:
如权利要求6-9任一所述的网站页面平均停留时间统计装置;以及
网页用户黏性确定模块,用于对于网站中待统计的页面,根据所述网站页面平均停留时间统计装置统计出的该页面的平均停留时间、以及预设的平均停留时间与黏性等级的对应关系,确定用户对该页面的黏性等级。

说明书

统计页面平均停留时间、确定页面用户黏性的方法和装置
技术领域
本发明涉及互联网技术领域,尤其涉及一种统计页面平均停留时间、确定页面用户黏性统计方法和装置。
背景技术
通常,一个网站中包含多个页面,网站运营人员可以在网站页面上发布想要公开的资讯,或者利用网站来提供相关的网络服务。人们可以通过网页浏览器来访问网站,获取需要的资讯或者享受网络服务。
网站页面的停留时间通俗的讲就是用户在浏览这个网站页面时所花费的时间,在一定程度上反映了该网站页面对用户的黏性。因此,网站运营人员通常统计出一个网站页面的平均停留时间,将其作为衡量网站的性能的一个指标,来了解网站页面的内容质量,并为网站运营提供决策支持。
在实际应用中,网络服务器对于网站的一个页面,将用户访问该页面的时间(t1)和访问下一个页面的时间(t2)的差值(t2-t1)作为用户浏览该页面的时间,即该页面的停留时间。基于此,现有技术的计算网站的网页平均停留时间的方法是:统计出该页面的每次访问的停留时间后,将该页面的每次访问的停留时间之和与该页面的访问次数的比值,作为该页面的平均停留时间。
然而,本发明的发明人发现,根据现有方法计算的网站页面的平均停留时间不够准确;并进一步分析后发现原因在于:用户行为存在较大差异,比如用户访问一个页面后,可能因为有事离开长时间未关闭该页面,而当该页面中带有视频或者难以理解的文字等时,用户也可能是因为在一直浏览该页面(观看该页面的视频或者一直致力于理解其中的文字)而长时间未关闭该页面,现有方法无法得知用户长时间未关闭页面是因为用户有事离开还是用户一直在浏览该页面,在计算网站页面的平均停留时间时,对于上述长时间未关闭网页的情况并不进行区分,使得计算出的网站页面的平均停留时间不够准确。
发明内容
针对上述现有技术存在的缺陷,本发明实施例提供了一种统计页面平均 停留时间、确定页面用户黏性的方法和装置,用以提高网站页面平均停留时间确定的准确性,并确定用户对页面的黏性。
本发明实施例提供了一种统计页面平均停留时间的方法,包括:
对于网站中待统计的页面,获取网站服务器记录的所述页面的若干个停留时间;其中,大于预设会话时间阈值的所述页面的停留时间以空值null表示;
计算出值为null的所述页面的停留时间的个数在获取的所述页面的停留时间的个数中所占的比重;并根据获取的非null值的所述页面的停留时间,计算出所述页面的平均停留时间的基础值;
若判定所述比重大于预设比重阈值,则根据所述比重与所述预设会话时间阈值确定所述页面的平均停留时间;否则,将所述基础值作为所述页面的平均停留时间。
较佳地,所述若判定所述比重大于预设比重阈值,则根据所述比重与所述预设会话时间阈值确定所述页面的平均停留时间,具体包括:
若判定所述比重大于预设比重阈值,则进一步判断所述基础值是否大于预设停留时间阈值;若是,则将所述比重与预设会话时间阈值相乘后与所述基础值相加,得到所述页面的平均停留时间;否则,将所述比重与预设会话时间阈值相乘,得到所述页面的平均停留时间。
较佳地,所述根据获取的非null值的所述页面的停留时间,计算出所述页面的平均停留时间的基础值,具体包括:
将获取的非null值的所述页面的停留时间进行排序,选取排序在预设的排序区间内的所述页面的停留时间后,计算出选取出的所述页面的停留时间的平均值,作为所述页面的平均停留时间的基础值。
其中,所述预设的排序区间的两个端点分别为INT(m1×n)和INT(m2×n),其中,n为获取的所述页面的平均停留时间的个数,m1和m2为预设的百分比,且m1<m2;INT(m1×n)表示对m1×n取整;INT(m2×n)表示对m2×n取整;以及
所述选取排序在预设的排序区间内的所述页面的停留时间,具体包括:
选取排序在第INT(m1×n)位与第INT(m2×n)位之间的所述页面的停留时间。
本发明实施例还提供了一种确定页面用户黏性的方法,包括:
对于网站中待统计的页面,根据上述的统计页面平均停留时间的方法统 计出该页面的平均停留时间;
根据统计出的该页面的平均停留时间、以及预设的平均停留时间与黏性等级的对应关系,确定用户对该页面的黏性等级。
本发明实施例还提供了一种统计页面平均停留时间的装置,包括:
停留时间获取模块,用户对于网站中待统计的页面,获取网站服务器记录的所述页面的若干个停留时间;其中,大于预设会话时间阈值的所述页面的停留时间以空值null表示;
比重计算模块,用于从所述停留时间获取模块获取的所述页面的停留时间中统计出值为null的所述页面的停留时间的个数,计算该个数在所述停留时间获取模块获取的所述页面的停留时间的个数中所占的比重;
基础值计算模块,用于根据所述停留时间获取模块获取的非null值的所述页面的停留时间,计算出所述页面的平均停留时间的基础值;
平均停留时间计算模块,用于若判定所述比重大于预设比重阈值,则根据所述比重与所述预设会话时间阈值确定所述页面的平均停留时间;否则,将所述基础值作为所述页面的平均停留时间。
较佳地,所述平均停留时间计算模块具体包括:
判断单元,用于若判定所述比重大于所述预设比重阈值,则进一步判断所述基础值是否大于预设停留时间阈值,若是,则发送第一计算通知,否则发送第二计算通知;若判断所述比重小于等于所述预设比重阈值,则发送第三计算通知;
平均停留时间计算单元,用于接收到第一计算通知后,将所述比重与预设会话时间阈值相乘后与所述基础值相加,得到所述页面的平均停留时间;接收到第二计算通知后,将所述比重与预设会话时间阈值相乘,得到所述页面的平均停留时间;以及接收到第三计算通知后,将所述基础值作为所述页面的平均停留时间。
较佳地,所述基础值计算模块具体用于将所述停留时间获取模块获取的非null的所述页面的停留时间进行排序,选取排序在预设的排序区间内的所述页面的停留时间后,计算出选取出的所述页面的停留时间的平均值,作为所述页面的平均停留时间的基础值。
其中,所述基础值计算模块中预设的排序区间的两个端点分别为INT(m1×n)和INT(m2×n),其中,n为获取的所述页面的平均停留时间的个数,m1和m2为预设的百分比,且m1<m2;INT(m1×n)表示对m1×n取整;INT (m2×n)表示对m2×n取整。
本发明实施例还提供了一种确定页面用户黏性的装置,包括:
上述的网站页面平均停留时间统计装置;以及
网页用户黏性确定模块,用于对于网站中待统计的页面,根据所述网站页面平均停留时间统计装置统计出的该页面的平均停留时间、以及预设的平均停留时间与黏性等级的对应关系,确定用户对该页面的黏性等级。
本发明的技术方案中,对于网站的待统计的页面,获取网络服务器中记录的该页面的若干个停留时间后,计算出值为null的该页面的停留时间的个数在获取的该页面的停留时间的个数中所占的比重,根据该比重与预设比重阈值的大小关系,采用不同的方式来计算该页面的平均停留时间,即当该比重大于预设比重阈值时,根据该比重与预设会话时间阈值的乘积来计算该页面的平均停留时间,当该比重小于等于预设比重阈值时,根据该页面的平均停留时间的基础值计算该页面的平均停留时间。本发明考虑了网络服务器记录的值为null的页面的停留时间对页面的平均停留时间的影响,提高了页面的平均停留时间的的准确性。而且,基于统计出的页面的平均停留时间,可以确定出用户对页面的黏性等级,进而便于网站运营人员作出运营决策等。
附图说明
图1为本发明实施例的统计页面平均停留时间的方法流程图;
图2为本发明实施例的统计页面平均停留时间的装置的内部结构框图;
图3为本发明实施例的确定页面用户黏性的装置的内部结构框图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举出优选实施例,对本发明进一步详细说明。然而,需要说明的是,说明书中列出的许多细节仅仅是为了使读者对本发明的一个或多个方面有一个透彻的理解,即便没有这些特定的细节也可以实现本发明的这些方面。
本申请使用的“模块”、“系统”等术语旨在包括与计算机相关的实体,例如但不限于硬件、固件、软硬件组合、软件或者执行中的软件。例如,模块可以是,但并不仅限于:处理器上运行的进程、处理器、对象、可执行程序、执行的线程、程序和/或计算机。举例来说,计算设备上运行的应用程序和此计算设备都可以是模块。一个或多个模块可以位于执行中的一个进程和/或线程内。
本发明的发明人发现,网络服务器在确定用户在一个页面的停留时间大于预设会话时间阈值后,便会将用户在该页面的停留时间记录为空值(null),因此并不能对用户离开和一直在浏览网页而长时间未关闭页面的情况进行区分。而且,本发明的发明人还发现,在网络服务器记录的一个页面的停留时间中,若值为null的该页面的停留时间的个数在该页面的停留时间的总数中所占的比重大于一定值,比如20%,则通常认为该页面中包含诸如视频类的内容。因此,本发明的发明人考虑到,对于网站的一个页面,可以将值为null的该页面的停留时间的个数在该页面的停留时间的总数中所占的比重,作为一个影响因素对该页面的平均停留时间进行统计,以使得计算出的平均停留时间更为准确。
基于此,本发明的技术方案中,对于网站的一个页面,获取网络服务器中记录的该页面的若干个停留时间,计算出值为null的该页面的停留时间的个数在获取的该页面的停留时间的个数中所占的比重,并根据获取的非null值(值不为null)的该页面的停留时间,计算出该页面的平均停留时间的基础值;之后,根据计算出的比重与预设比重阈值的大小关系,计算出该页面的平均停留时间。从而,提高页面的平均停留时间的准确性。
下面结合附图详细说明本发明的技术方案。本发明实施例提供的统计网页平均停留时间的方法的流程,如图1所示,具体包括如下步骤:
S101:对于网站中待统计的页面(记为页面A),获取网站服务器记录的页面A的若干个停留时间。
具体地,网站服务器中记录有网站的页面的停留时间,对于一个待统计平均停留时间的页面A,获取网站服务器记录的页面A的若干个停留时间,具体可以是获取设定时间段内或者设定数量的网站服务器记录的页面A的停留时间。其中,大于预设会话时间阈值的页面A的停留时间以null(空值)表示。通常,预设会话时间阈值由本领域技术人员根据实际需求或经验进行设定,具体可以是20分钟、30分钟。
例如,表1示出了获取的页面A的10个停留时间,其中预设会话时间阈值为30分钟(1800秒)。如表1所示,针对一次访问的页面A的停留时间,也就是针对该次访问,将访问下一个页面的时间(向网络服务器发送下一个页面的请求的时间)减去访问页面A的时间(向网络服务器发送页面A的请求的时间),便可得到针对该次访问的页面A的停留时间。
表1

S102:计算出值为null的页面A的停留时间的个数在获取的页面A的停留时间的个数中所占的比重,作为页面A的停留时间的null值比重。
例如,若获取的页面A的停留时间如表1所示,其中值为null的停留时间的个数为2,则计算出的值为null的页面A的停留时间的个数在获取的页面A的停留时间的个数中所占的比重为20%。
S103:根据获取的非null值的页面A的停留时间,计算出页面A的平均停留时间的基础值。
具体地,可根据现有技术的方法,将获取的非null值的页面A的停留时间的平均值,作为页面A的平均停留时间的基础值。
较优地,还可以将获取的非null值(即值不为null)的页面A的停留时间进行排序,选取排序在预设的排序区间内的页面A的停留时间后,计算出选取出的页面A的停留时间的平均值,作为页面A的平均停留时间的基础值。其中,预设的排序区间的两个端点分别为INT(m1×n)和INT(m2×n),n为获取的页面A的平均停留时间的个数,m1和m2为预设的百分比,且m1<m2;INT(m1×n)表示对m1×n取整;INT(m2×n)表示对m2×n取整。这样,选取排序在预设排序区间内的页面A的停留时间也就是选取排序在第INT(m1×n)位与第INT(m2×n)位之间的页面A的停留时间。m1和m2可以由本领域技术人员进行设定,m1具体可以为20%,m2具体可以为80%。例如,获 取的非null值的页面A的停留时间为101个,则可确定出预设的排序区间的端点为20和80,即选取出排序第20位和第80位之间的页面A的停留时间。
这种将排序靠前和靠后的部分停留时间排除掉的方式,可以排除一些因用户行为差异导致的干扰数据,尤其是该方式很好地排除了那些手误打开网站页面后,又立即关闭该页面的情况,较好地提高了页面平均停留时间计算的准确性。
例如,表2是对上述表1所示的非null值的页面A的停留时间进行排序后的结果,根据该方式选取出排序在第3位与第6位之间的页面A的停留时间,即30s、41s、50s、57s,这样计算出的页面A的平均停留时间的基础值为44.5s。
表2

其中,上述步骤S102和S103并没有严格的执行顺序,也就是可以先执行S102,也可以先执行S103,还可以并行执行S102和S103。
S104:判断计算出的页面A的停留时间的null值比重是否大于预设比重阈值;若是,则执行步骤S105;否则,执行步骤S108。
若在本步骤中,若判定计算出的页面A的停留时间的null值比重大于预设比重阈值,则可根据计算出的页面A的停留时间的null值比重与预设会话时间阈值确定页面A的平均停留时间,具体如下述步骤S105~S107所示;若判定计算出的页面A的停留时间的null值比重小于等于预设比重阈值,则可将计算出的页面A的平均停留时间的基础值作为页面A的平均停留时间,具体如下述步骤S108所示。其中,预设比重阈值具体由本领域技术人员根据实 际需求或经验进行设定,例如,预设比重阈值可以设定为20%。
S105:判断计算出的页面A的平均停留时间的基础值是否大于预设停留时间阈值;若是,则执行步骤S106;否则,执行步骤S107。
具体地,若判定页面A的停留时间的null值比重大于预设比重阈值,则在本步骤中判断计算出的页面A的平均停留时间的基础值是否大于预设停留时间阈值。其中,预设停留时间阈值由本领域技术人员进行设定,具体可以是90s。
S106:将页面A的停留时间的null值比重与预设会话时间阈值相乘后,与页面A的平均停留时间的基础值相加,将得到的和作为页面A的平均停留时间。
具体地,若页面A的停留时间的null值比重大于预设比重阈值,页面A的平均停留时间的基础值大于预设停留时间阈值,则计算出页面A的停留时间的null值比重与预设会话时间阈值的乘积,将计算出的乘积与页面A的平均停留时间的基础值的和作为页面A的平均停留时间。通常,包含有诸如视频类内容的页面的平均停留时间较长,这样,也就容易出现因用户一直浏览该页面而使得该页面的停留时间中大于预设会话时间阈值的个数较多,即该页面的停留时间的null值比重较大,且此时该页面的平均停留时间的基础值也会较大。因此,当页面A的停留时间的null值比重较大,且页面A的平均停留时间的基础值也较大时,表明页面A包含诸如视频类内容的可能性很大,将页面A的停留时间的null值比重与预设会话时间阈值相乘后,与页面A的平均停留时间的基础值相加,将得到的和作为页面A的平均停留时间。
例如,若预设停留时间阈值为90s,预设比重阈值为20%,统计出的页面A的停留时间的null值比重为20%,计算出的页面A的平均停留时间为120秒,预设会话时间阈值为30分钟(即1800秒),则页面A的平均停留时间=120+20%×1800=480秒。
S107:将页面A的停留时间的null值比重与预设会话时间阈值相乘后,将得到的乘积作为页面A的平均停留时间。
具体地,若页面A的停留时间的null值比重大于预设比重阈值,页面A的平均停留时间的基础值小于等于预设停留时间阈值,则计算出页面A的停留时间的null值比重与预设会话时间阈值的乘积,将计算出的乘积作为页面A的平均停留时间。如前所述,通常包含有诸如视频类内容的页面的平均停留时间较长,这样,也就容易出现因用户一直浏览该页面而使得该页面的停留 时间中大于预设会话时间阈值的个数较多,即该页面的停留时间的null值比重较大,且此时该页面的平均停留时间的基础值也会较大。若当页面A的停留时间的null值比重较大,反而页面A的平均停留时间的基础值较小,表明获取的非null值的页面A的停留时间中,可能很多是因用户手误打开页面A后,又关闭页面A的情况,为保证计算页面A的平均停留时间的准确性,可将这部分数据去除掉,也就是将页面A的停留时间的null值比重与预设会话时间阈值的乘积作为页面A的平均停留时间。
例如,若预设停留时间阈值为90s,预设比重阈值为20%,统计出的页面A的停留时间的null值比重为40%,计算出的页面A的平均停留时间为10秒,预设会话时间阈值为30分钟(即1800秒),则页面A的平均停留时间=40%×1800=560秒。
基于上述步骤S105~S107,将页面A的停留时间的null值比重与页面A的平均停留时间的基础值结合起来,进行页面A的平均停留时间的确定可以使得确定出的平均停留时间更为准确。
S108:将计算出的页面A的平均停留时间的基础值作为页面A的平均停留时间。
具体地,若计算出的页面A的停留时间的null值比重小于等于预设比重阈值,则表面出现的这些小比例的值为null的页面A的停留时间,可能是因一些用户有事离开而长时间为关闭网页,是计算页面A的平均停留时间时的干扰数据,也就是说,页面A的停留时间的null值比重较小时,表明这些null值的出现是由于一些用户打开页面A后离开未关闭页面引起的,而不是用户一直在浏览页面A的内容。因此,若计算出的页面A的停留时间的null值比重小于等于预设比重阈值,则将计算出的页面A的平均停留时间的基础值作为页面A的平均停留时间。
基于上述的统计页面平均停留时间的方法,本发明实施例的确定页面用户黏性的方法,具体包括:对于网站中待统计的页面,根据上述的统计页面平均停留时间的方法统计出该页面的平均停留时间;根据统计出的该页面的平均停留时间、以及预设的平均停留时间与黏性等级的对应关系,确定用户对该页面的黏性等级,即该页面的用户黏性等级。其中,预设的平均停留时间与黏性等级的对应关系,具体由本领域技术人员根据实际需求来设定。通常,对于网站中的一个页面,该页面的平均停留时间可以反映出用户对该页面的黏性,该页面的平均停留时间越长,用户对该页面的黏性越大、黏性等 级越高。
基于上述的统计页面平均停留时间的方法,本发明实施例提供的统计页面平均停留时间的装置的内部结构框图,如图2所示,包括:停留时间获取模块201、比重计算模块202、基础值计算模块203、平均停留时间计算模块204。
其中,停留时间获取模块201用户对于网站中待统计的页面,获取网站服务器记录的该页面的若干个停留时间;其中,大于预设会话时间阈值的该页面的停留时间以空值null表示。
比重计算模块202用于从停留时间获取模块201获取的页面的停留时间中统计出值为null的该页面的停留时间的个数,计算该个数在停留时间获取模块201获取的页面的停留时间的个数中所占的比重。
基础值计算模块203用于根据停留时间获取模块201获取的非null值的待统计的页面的停留时间,计算出该页面的平均停留时间的基础值。具体地,基础值计算模块203具体用于将停留时间获取模块201获取的非null的待统计的页面的停留时间进行排序,选取排序在预设排序区间内的该页面的停留时间后,计算出选取出的该页面的停留时间的平均值,作为该页面的平均停留时间的基础值。其中,预设的排序区间的两个端点分别为INT(m1×n)和INT(m2×n),其中,n为获取的所述页面的平均停留时间的个数,m1和m2为预设的百分比,且m1<m2;INT(m1×n)表示对m1×n取整;INT(m2×n)表示对m2×n取整。
平均停留时间计算模块204用于若判定比重计算模块202计算出的比重大于预设比重阈值,则根据比重计算模块202计算出的比重与预设会话时间阈值确定待统计的页面的平均停留时间;否则,将基础值计算模块203计算出的基础值作为待统计的页面的平均停留时间。
进一步,平均停留时间计算模块204具体包括:判断单元211和平均停留时间计算单元212。
其中,判断单元211用于若判定比重计算模块202计算出的比重大于预设比重阈值,则进一步判断基础值计算模块203计算出的基础值是否大于预设停留时间阈值,若是,则发送第一计算通知,否则发送第二计算通知;若判断比重计算模块202计算出的比重小于等于预设比重阈值,则发送第三计算通知。
平均停留时间计算单元212用于接收到判断单元211发送的第一计算通 知后,将比重计算模块202计算出的比重与预设会话时间阈值相乘后与基础值计算模块203计算出的基础值相加,得到待统计的页面的平均停留时间;以及接收到判断单元211发送的第二计算通知后,将比重计算模块202计算出的比重与预设会话时间阈值相乘,得到待统计的页面的平均停留时间;以及接收到第三计算通知后,将基础值计算模块203计算出的基础值作为待统计的页面的平均停留时间。
其中,上述的预设比重阈值具体为20%;预设会话时间阈值具体为30分钟;预设停留时间阈值具体为90秒。
基于上述的确定页面用户黏性的方法,本发明实施例提供的确定页面用户黏性的装置的内部结构框图,如图3所示,具体包括:上述的统计页面平均停留时间的装置的停留时间获取模块201、比重计算模块202、基础值计算模块203、平均停留时间计算模块204,以及网页用户黏性确定模块301。
其中,网页用户黏性确定模块301用于对于网站中待统计的页面,根据网站页面平均停留时间统计装置统计出的该页面的平均停留时间、以及预设的平均停留时间与黏性等级的对应关系,确定用户对该页面的黏性等级。
本发明的技术方案中,对于网站的待统计的页面,获取网络服务器中记录的该页面的若干个停留时间后,计算出值为null的该页面的停留时间的个数在获取的该页面的停留时间的个数中所占的比重,根据该比重与预设比重阈值的大小关系,采用不同的方式来计算该页面的平均停留时间,即当该比重大于预设比重阈值时,根据该比重与预设会话时间阈值来确定该页面的平均停留时间,当该比重小于等于预设比重阈值时,将该页面的平均停留时间的基础值作为该页面的平均停留时间。本发明考虑了网络服务器记录的值为null的页面的停留时间对页面的平均停留时间的影响,提高了页面的平均停留时间的的准确性。而且,基于统计出的页面的平均停留时间,可以确定出用户对页面的黏性等级,进而便于网站运营人员作出运营决策等。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于计算机可读取存储介质中,如:ROM/RAM、磁碟、光盘等。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

统计页面平均停留时间、确定页面用户黏性的方法和装置.pdf_第1页
第1页 / 共15页
统计页面平均停留时间、确定页面用户黏性的方法和装置.pdf_第2页
第2页 / 共15页
统计页面平均停留时间、确定页面用户黏性的方法和装置.pdf_第3页
第3页 / 共15页
点击查看更多>>
资源描述

《统计页面平均停留时间、确定页面用户黏性的方法和装置.pdf》由会员分享,可在线阅读,更多相关《统计页面平均停留时间、确定页面用户黏性的方法和装置.pdf(15页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN104111970A43申请公布日20141022CN104111970A21申请号201410250438522申请日20140606G06F17/3020060171申请人微梦创科网络科技(中国)有限公司地址100080北京市海淀区彩和坊路6号710层72发明人刘洋74专利代理机构北京市京大律师事务所11321代理人张璐方晓明54发明名称统计页面平均停留时间、确定页面用户黏性的方法和装置57摘要本发明公开了一种统计页面平均停留时间、确定网页用户黏性的方法和装置,统计页面平均停留时间的方法包括对于网站中待统计的页面,获取网站服务器记录的该页面的停留时间;其中,大于预设会话时。

2、间阈值的该页面的停留时间以空值表示;计算出值为空值的该页面的停留时间的个数在获取的该页面的停留时间的个数中所占的比重;根据获取的非空值的该页面的停留时间,计算出该页面的平均停留时间的基础值;若判定计算出的比重大于预设比重阈值,则根据该比重与预设会话时间阈值确定该页面的平均停留时间;否则将计算出的该页面的平均停留时间的基础值作为该页面的平均停留时间。应用本发明可以提高计算网站页面的平均停留时间的准确性。51INTCL权利要求书2页说明书9页附图3页19中华人民共和国国家知识产权局12发明专利申请权利要求书2页说明书9页附图3页10申请公布号CN104111970ACN104111970A1/2页。

3、21一种统计页面平均停留时间的方法,其特征在于,包括对于网站中待统计的页面,获取网站服务器记录的所述页面的若干个停留时间;其中,大于预设会话时间阈值的所述页面的停留时间以空值NULL表示;计算出值为NULL的所述页面的停留时间的个数在获取的所述页面的停留时间的个数中所占的比重;并根据获取的非NULL值的所述页面的停留时间,计算出所述页面的平均停留时间的基础值;若判定所述比重大于预设比重阈值,则根据所述比重与所述预设会话时间阈值确定所述页面的平均停留时间;否则,将所述基础值作为所述页面的平均停留时间。2如权利要求1所述的方法,其特征在于,所述若判定所述比重大于预设比重阈值,则根据所述比重与所述预。

4、设会话时间阈值确定所述页面的平均停留时间,具体包括若判定所述比重大于预设比重阈值,则进一步判断所述基础值是否大于预设停留时间阈值;若是,则将所述比重与预设会话时间阈值相乘后与所述基础值相加,得到所述页面的平均停留时间;否则,将所述比重与预设会话时间阈值相乘,得到所述页面的平均停留时间。3如权利要求1或2所述的方法,其特征在于,所述根据获取的非NULL值的所述页面的停留时间,计算出所述页面的平均停留时间的基础值,具体包括将获取的非NULL值的所述页面的停留时间进行排序,选取排序在预设的排序区间内的所述页面的停留时间后,计算出选取出的所述页面的停留时间的平均值,作为所述页面的平均停留时间的基础值。。

5、4如权利要求3所述的方法,其特征在于,所述预设的排序区间的两个端点分别为INTM1N和INTM2N,其中,N为获取的所述页面的平均停留时间的个数,M1和M2为预设的百分比,且M1M2;INTM1N表示对M1N取整;INTM2N表示对M2N取整;以及所述选取排序在预设的排序区间内的所述页面的停留时间,具体包括选取排序在第INTM1N位与第INTM2N位之间的所述页面的停留时间。5一种确定页面用户黏性的方法,其特征在于,包括对于网站中待统计的页面,根据如权利要求14任一所述的方法统计出该页面的平均停留时间;根据统计出的该页面的平均停留时间、以及预设的平均停留时间与黏性等级的对应关系,确定用户对该页。

6、面的黏性等级。6一种统计页面平均停留时间的装置,其特征在于,包括停留时间获取模块,用户对于网站中待统计的页面,获取网站服务器记录的所述页面的若干个停留时间;其中,大于预设会话时间阈值的所述页面的停留时间以空值NULL表示;比重计算模块,用于从所述停留时间获取模块获取的所述页面的停留时间中统计出值为NULL的所述页面的停留时间的个数,计算该个数在所述停留时间获取模块获取的所述页面的停留时间的个数中所占的比重;基础值计算模块,用于根据所述停留时间获取模块获取的非NULL值的所述页面的停留时间,计算出所述页面的平均停留时间的基础值;平均停留时间计算模块,用于若判定所述比重大于预设比重阈值,则根据所述。

7、比重与权利要求书CN104111970A2/2页3所述预设会话时间阈值确定所述页面的平均停留时间;否则,将所述基础值作为所述页面的平均停留时间。7如权利要求6所述的装置,其特征在于,所述平均停留时间计算模块具体包括判断单元,用于若判定所述比重大于所述预设比重阈值,则进一步判断所述基础值是否大于预设停留时间阈值,若是,则发送第一计算通知,否则发送第二计算通知;若判断所述比重小于等于所述预设比重阈值,则发送第三计算通知;平均停留时间计算单元,用于接收到第一计算通知后,将所述比重与预设会话时间阈值相乘后与所述基础值相加,得到所述页面的平均停留时间;接收到第二计算通知后,将所述比重与预设会话时间阈值相。

8、乘,得到所述页面的平均停留时间;以及接收到第三计算通知后,将所述基础值作为所述页面的平均停留时间。8如权利要求6或7所述的装置,其特征在于,所述基础值计算模块具体用于将所述停留时间获取模块获取的非NULL的所述页面的停留时间进行排序,选取排序在预设的排序区间内的所述页面的停留时间后,计算出选取出的所述页面的停留时间的平均值,作为所述页面的平均停留时间的基础值。9如权利要求8所述的装置,其特征在于,所述基础值计算模块中预设的排序区间的两个端点分别为INTM1N和INTM2N,其中,N为获取的所述页面的平均停留时间的个数,M1和M2为预设的百分比,且M1M2;INTM1N表示对M1N取整;INTM。

9、2N表示对M2N取整。10一种确定页面用户黏性的装置,其特征在于,包括如权利要求69任一所述的网站页面平均停留时间统计装置;以及网页用户黏性确定模块,用于对于网站中待统计的页面,根据所述网站页面平均停留时间统计装置统计出的该页面的平均停留时间、以及预设的平均停留时间与黏性等级的对应关系,确定用户对该页面的黏性等级。权利要求书CN104111970A1/9页4统计页面平均停留时间、确定页面用户黏性的方法和装置技术领域0001本发明涉及互联网技术领域,尤其涉及一种统计页面平均停留时间、确定页面用户黏性统计方法和装置。背景技术0002通常,一个网站中包含多个页面,网站运营人员可以在网站页面上发布想要。

10、公开的资讯,或者利用网站来提供相关的网络服务。人们可以通过网页浏览器来访问网站,获取需要的资讯或者享受网络服务。0003网站页面的停留时间通俗的讲就是用户在浏览这个网站页面时所花费的时间,在一定程度上反映了该网站页面对用户的黏性。因此,网站运营人员通常统计出一个网站页面的平均停留时间,将其作为衡量网站的性能的一个指标,来了解网站页面的内容质量,并为网站运营提供决策支持。0004在实际应用中,网络服务器对于网站的一个页面,将用户访问该页面的时间T1和访问下一个页面的时间T2的差值T2T1作为用户浏览该页面的时间,即该页面的停留时间。基于此,现有技术的计算网站的网页平均停留时间的方法是统计出该页面。

11、的每次访问的停留时间后,将该页面的每次访问的停留时间之和与该页面的访问次数的比值,作为该页面的平均停留时间。0005然而,本发明的发明人发现,根据现有方法计算的网站页面的平均停留时间不够准确;并进一步分析后发现原因在于用户行为存在较大差异,比如用户访问一个页面后,可能因为有事离开长时间未关闭该页面,而当该页面中带有视频或者难以理解的文字等时,用户也可能是因为在一直浏览该页面观看该页面的视频或者一直致力于理解其中的文字而长时间未关闭该页面,现有方法无法得知用户长时间未关闭页面是因为用户有事离开还是用户一直在浏览该页面,在计算网站页面的平均停留时间时,对于上述长时间未关闭网页的情况并不进行区分,使。

12、得计算出的网站页面的平均停留时间不够准确。发明内容0006针对上述现有技术存在的缺陷,本发明实施例提供了一种统计页面平均停留时间、确定页面用户黏性的方法和装置,用以提高网站页面平均停留时间确定的准确性,并确定用户对页面的黏性。0007本发明实施例提供了一种统计页面平均停留时间的方法,包括0008对于网站中待统计的页面,获取网站服务器记录的所述页面的若干个停留时间;其中,大于预设会话时间阈值的所述页面的停留时间以空值NULL表示;0009计算出值为NULL的所述页面的停留时间的个数在获取的所述页面的停留时间的个数中所占的比重;并根据获取的非NULL值的所述页面的停留时间,计算出所述页面的平均停留。

13、时间的基础值;0010若判定所述比重大于预设比重阈值,则根据所述比重与所述预设会话时间阈值确说明书CN104111970A2/9页5定所述页面的平均停留时间;否则,将所述基础值作为所述页面的平均停留时间。0011较佳地,所述若判定所述比重大于预设比重阈值,则根据所述比重与所述预设会话时间阈值确定所述页面的平均停留时间,具体包括0012若判定所述比重大于预设比重阈值,则进一步判断所述基础值是否大于预设停留时间阈值;若是,则将所述比重与预设会话时间阈值相乘后与所述基础值相加,得到所述页面的平均停留时间;否则,将所述比重与预设会话时间阈值相乘,得到所述页面的平均停留时间。0013较佳地,所述根据获取。

14、的非NULL值的所述页面的停留时间,计算出所述页面的平均停留时间的基础值,具体包括0014将获取的非NULL值的所述页面的停留时间进行排序,选取排序在预设的排序区间内的所述页面的停留时间后,计算出选取出的所述页面的停留时间的平均值,作为所述页面的平均停留时间的基础值。0015其中,所述预设的排序区间的两个端点分别为INTM1N和INTM2N,其中,N为获取的所述页面的平均停留时间的个数,M1和M2为预设的百分比,且M1M2;INTM1N表示对M1N取整;INTM2N表示对M2N取整;以及0016所述选取排序在预设的排序区间内的所述页面的停留时间,具体包括0017选取排序在第INTM1N位与第I。

15、NTM2N位之间的所述页面的停留时间。0018本发明实施例还提供了一种确定页面用户黏性的方法,包括0019对于网站中待统计的页面,根据上述的统计页面平均停留时间的方法统计出该页面的平均停留时间;0020根据统计出的该页面的平均停留时间、以及预设的平均停留时间与黏性等级的对应关系,确定用户对该页面的黏性等级。0021本发明实施例还提供了一种统计页面平均停留时间的装置,包括0022停留时间获取模块,用户对于网站中待统计的页面,获取网站服务器记录的所述页面的若干个停留时间;其中,大于预设会话时间阈值的所述页面的停留时间以空值NULL表示;0023比重计算模块,用于从所述停留时间获取模块获取的所述页面。

16、的停留时间中统计出值为NULL的所述页面的停留时间的个数,计算该个数在所述停留时间获取模块获取的所述页面的停留时间的个数中所占的比重;0024基础值计算模块,用于根据所述停留时间获取模块获取的非NULL值的所述页面的停留时间,计算出所述页面的平均停留时间的基础值;0025平均停留时间计算模块,用于若判定所述比重大于预设比重阈值,则根据所述比重与所述预设会话时间阈值确定所述页面的平均停留时间;否则,将所述基础值作为所述页面的平均停留时间。0026较佳地,所述平均停留时间计算模块具体包括0027判断单元,用于若判定所述比重大于所述预设比重阈值,则进一步判断所述基础值是否大于预设停留时间阈值,若是,。

17、则发送第一计算通知,否则发送第二计算通知;若判断所述比重小于等于所述预设比重阈值,则发送第三计算通知;0028平均停留时间计算单元,用于接收到第一计算通知后,将所述比重与预设会话时说明书CN104111970A3/9页6间阈值相乘后与所述基础值相加,得到所述页面的平均停留时间;接收到第二计算通知后,将所述比重与预设会话时间阈值相乘,得到所述页面的平均停留时间;以及接收到第三计算通知后,将所述基础值作为所述页面的平均停留时间。0029较佳地,所述基础值计算模块具体用于将所述停留时间获取模块获取的非NULL的所述页面的停留时间进行排序,选取排序在预设的排序区间内的所述页面的停留时间后,计算出选取出。

18、的所述页面的停留时间的平均值,作为所述页面的平均停留时间的基础值。0030其中,所述基础值计算模块中预设的排序区间的两个端点分别为INTM1N和INTM2N,其中,N为获取的所述页面的平均停留时间的个数,M1和M2为预设的百分比,且M1M2;INTM1N表示对M1N取整;INTM2N表示对M2N取整。0031本发明实施例还提供了一种确定页面用户黏性的装置,包括0032上述的网站页面平均停留时间统计装置;以及0033网页用户黏性确定模块,用于对于网站中待统计的页面,根据所述网站页面平均停留时间统计装置统计出的该页面的平均停留时间、以及预设的平均停留时间与黏性等级的对应关系,确定用户对该页面的黏性。

19、等级。0034本发明的技术方案中,对于网站的待统计的页面,获取网络服务器中记录的该页面的若干个停留时间后,计算出值为NULL的该页面的停留时间的个数在获取的该页面的停留时间的个数中所占的比重,根据该比重与预设比重阈值的大小关系,采用不同的方式来计算该页面的平均停留时间,即当该比重大于预设比重阈值时,根据该比重与预设会话时间阈值的乘积来计算该页面的平均停留时间,当该比重小于等于预设比重阈值时,根据该页面的平均停留时间的基础值计算该页面的平均停留时间。本发明考虑了网络服务器记录的值为NULL的页面的停留时间对页面的平均停留时间的影响,提高了页面的平均停留时间的的准确性。而且,基于统计出的页面的平均。

20、停留时间,可以确定出用户对页面的黏性等级,进而便于网站运营人员作出运营决策等。附图说明0035图1为本发明实施例的统计页面平均停留时间的方法流程图;0036图2为本发明实施例的统计页面平均停留时间的装置的内部结构框图;0037图3为本发明实施例的确定页面用户黏性的装置的内部结构框图。具体实施方式0038为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举出优选实施例,对本发明进一步详细说明。然而,需要说明的是,说明书中列出的许多细节仅仅是为了使读者对本发明的一个或多个方面有一个透彻的理解,即便没有这些特定的细节也可以实现本发明的这些方面。0039本申请使用的“模块”、“系统”等术语旨。

21、在包括与计算机相关的实体,例如但不限于硬件、固件、软硬件组合、软件或者执行中的软件。例如,模块可以是,但并不仅限于处理器上运行的进程、处理器、对象、可执行程序、执行的线程、程序和/或计算机。举例来说,计算设备上运行的应用程序和此计算设备都可以是模块。一个或多个模块可以位于执行中的说明书CN104111970A4/9页7一个进程和/或线程内。0040本发明的发明人发现,网络服务器在确定用户在一个页面的停留时间大于预设会话时间阈值后,便会将用户在该页面的停留时间记录为空值NULL,因此并不能对用户离开和一直在浏览网页而长时间未关闭页面的情况进行区分。而且,本发明的发明人还发现,在网络服务器记录的一。

22、个页面的停留时间中,若值为NULL的该页面的停留时间的个数在该页面的停留时间的总数中所占的比重大于一定值,比如20,则通常认为该页面中包含诸如视频类的内容。因此,本发明的发明人考虑到,对于网站的一个页面,可以将值为NULL的该页面的停留时间的个数在该页面的停留时间的总数中所占的比重,作为一个影响因素对该页面的平均停留时间进行统计,以使得计算出的平均停留时间更为准确。0041基于此,本发明的技术方案中,对于网站的一个页面,获取网络服务器中记录的该页面的若干个停留时间,计算出值为NULL的该页面的停留时间的个数在获取的该页面的停留时间的个数中所占的比重,并根据获取的非NULL值值不为NULL的该页。

23、面的停留时间,计算出该页面的平均停留时间的基础值;之后,根据计算出的比重与预设比重阈值的大小关系,计算出该页面的平均停留时间。从而,提高页面的平均停留时间的准确性。0042下面结合附图详细说明本发明的技术方案。本发明实施例提供的统计网页平均停留时间的方法的流程,如图1所示,具体包括如下步骤0043S101对于网站中待统计的页面记为页面A,获取网站服务器记录的页面A的若干个停留时间。0044具体地,网站服务器中记录有网站的页面的停留时间,对于一个待统计平均停留时间的页面A,获取网站服务器记录的页面A的若干个停留时间,具体可以是获取设定时间段内或者设定数量的网站服务器记录的页面A的停留时间。其中,。

24、大于预设会话时间阈值的页面A的停留时间以NULL空值表示。通常,预设会话时间阈值由本领域技术人员根据实际需求或经验进行设定,具体可以是20分钟、30分钟。0045例如,表1示出了获取的页面A的10个停留时间,其中预设会话时间阈值为30分钟1800秒。如表1所示,针对一次访问的页面A的停留时间,也就是针对该次访问,将访问下一个页面的时间向网络服务器发送下一个页面的请求的时间减去访问页面A的时间向网络服务器发送页面A的请求的时间,便可得到针对该次访问的页面A的停留时间。0046表1说明书CN104111970A5/9页800470048S102计算出值为NULL的页面A的停留时间的个数在获取的页面。

25、A的停留时间的个数中所占的比重,作为页面A的停留时间的NULL值比重。0049例如,若获取的页面A的停留时间如表1所示,其中值为NULL的停留时间的个数为2,则计算出的值为NULL的页面A的停留时间的个数在获取的页面A的停留时间的个数中所占的比重为20。0050S103根据获取的非NULL值的页面A的停留时间,计算出页面A的平均停留时间的基础值。0051具体地,可根据现有技术的方法,将获取的非NULL值的页面A的停留时间的平均值,作为页面A的平均停留时间的基础值。0052较优地,还可以将获取的非NULL值即值不为NULL的页面A的停留时间进行排序,选取排序在预设的排序区间内的页面A的停留时间后。

26、,计算出选取出的页面A的停留时间的平均值,作为页面A的平均停留时间的基础值。其中,预设的排序区间的两个端点分别为INTM1N和INTM2N,N为获取的页面A的平均停留时间的个数,M1和M2为预设的百分比,且M1M2;INTM1N表示对M1N取整;INTM2N表示对M2N取整。这样,选取排序在预设排序区间内的页面A的停留时间也就是选取排序在第INTM1N位与第INTM2N位之间的页面A的停留时间。M1和M2可以由本领域技术人员进行设定,M1具体可以为20,M2具体可以为80。例如,获取的非NULL值的页面A的停留时间为101个,则可确定出预设的排序区间的端点为20和80,即选取出排序第20位和第。

27、80位之间的页面A的停留时间。0053这种将排序靠前和靠后的部分停留时间排除掉的方式,可以排除一些因用户行为差异导致的干扰数据,尤其是该方式很好地排除了那些手误打开网站页面后,又立即关闭该页面的情况,较好地提高了页面平均停留时间计算的准确性。0054例如,表2是对上述表1所示的非NULL值的页面A的停留时间进行排序后的结果,根据该方式选取出排序在第3位与第6位之间的页面A的停留时间,即30S、41S、50S、57S,说明书CN104111970A6/9页9这样计算出的页面A的平均停留时间的基础值为445S。0055表200560057其中,上述步骤S102和S103并没有严格的执行顺序,也就是。

28、可以先执行S102,也可以先执行S103,还可以并行执行S102和S103。0058S104判断计算出的页面A的停留时间的NULL值比重是否大于预设比重阈值;若是,则执行步骤S105;否则,执行步骤S108。0059若在本步骤中,若判定计算出的页面A的停留时间的NULL值比重大于预设比重阈值,则可根据计算出的页面A的停留时间的NULL值比重与预设会话时间阈值确定页面A的平均停留时间,具体如下述步骤S105S107所示;若判定计算出的页面A的停留时间的NULL值比重小于等于预设比重阈值,则可将计算出的页面A的平均停留时间的基础值作为页面A的平均停留时间,具体如下述步骤S108所示。其中,预设比重。

29、阈值具体由本领域技术人员根据实际需求或经验进行设定,例如,预设比重阈值可以设定为20。0060S105判断计算出的页面A的平均停留时间的基础值是否大于预设停留时间阈值;若是,则执行步骤S106;否则,执行步骤S107。0061具体地,若判定页面A的停留时间的NULL值比重大于预设比重阈值,则在本步骤中判断计算出的页面A的平均停留时间的基础值是否大于预设停留时间阈值。其中,预设停留时间阈值由本领域技术人员进行设定,具体可以是90S。0062S106将页面A的停留时间的NULL值比重与预设会话时间阈值相乘后,与页面A的平均停留时间的基础值相加,将得到的和作为页面A的平均停留时间。0063具体地,若。

30、页面A的停留时间的NULL值比重大于预设比重阈值,页面A的平均停留时间的基础值大于预设停留时间阈值,则计算出页面A的停留时间的NULL值比重与预设会话时间阈值的乘积,将计算出的乘积与页面A的平均停留时间的基础值的和作为页面A的平均停留时间。通常,包含有诸如视频类内容的页面的平均停留时间较长,这样,也就容易出现因用户一直浏览该页面而使得该页面的停留时间中大于预设会话时间阈值的个数较多,即该页面的停留时间的NULL值比重较大,且此时该页面的平均停留时间的基础值也会较大。因此,当页面A的停留时间的NULL值比重较大,且页面A的平均停留时间的基础说明书CN104111970A7/9页10值也较大时,表。

31、明页面A包含诸如视频类内容的可能性很大,将页面A的停留时间的NULL值比重与预设会话时间阈值相乘后,与页面A的平均停留时间的基础值相加,将得到的和作为页面A的平均停留时间。0064例如,若预设停留时间阈值为90S,预设比重阈值为20,统计出的页面A的停留时间的NULL值比重为20,计算出的页面A的平均停留时间为120秒,预设会话时间阈值为30分钟即1800秒,则页面A的平均停留时间120201800480秒。0065S107将页面A的停留时间的NULL值比重与预设会话时间阈值相乘后,将得到的乘积作为页面A的平均停留时间。0066具体地,若页面A的停留时间的NULL值比重大于预设比重阈值,页面A。

32、的平均停留时间的基础值小于等于预设停留时间阈值,则计算出页面A的停留时间的NULL值比重与预设会话时间阈值的乘积,将计算出的乘积作为页面A的平均停留时间。如前所述,通常包含有诸如视频类内容的页面的平均停留时间较长,这样,也就容易出现因用户一直浏览该页面而使得该页面的停留时间中大于预设会话时间阈值的个数较多,即该页面的停留时间的NULL值比重较大,且此时该页面的平均停留时间的基础值也会较大。若当页面A的停留时间的NULL值比重较大,反而页面A的平均停留时间的基础值较小,表明获取的非NULL值的页面A的停留时间中,可能很多是因用户手误打开页面A后,又关闭页面A的情况,为保证计算页面A的平均停留时间。

33、的准确性,可将这部分数据去除掉,也就是将页面A的停留时间的NULL值比重与预设会话时间阈值的乘积作为页面A的平均停留时间。0067例如,若预设停留时间阈值为90S,预设比重阈值为20,统计出的页面A的停留时间的NULL值比重为40,计算出的页面A的平均停留时间为10秒,预设会话时间阈值为30分钟即1800秒,则页面A的平均停留时间401800560秒。0068基于上述步骤S105S107,将页面A的停留时间的NULL值比重与页面A的平均停留时间的基础值结合起来,进行页面A的平均停留时间的确定可以使得确定出的平均停留时间更为准确。0069S108将计算出的页面A的平均停留时间的基础值作为页面A的。

34、平均停留时间。0070具体地,若计算出的页面A的停留时间的NULL值比重小于等于预设比重阈值,则表面出现的这些小比例的值为NULL的页面A的停留时间,可能是因一些用户有事离开而长时间为关闭网页,是计算页面A的平均停留时间时的干扰数据,也就是说,页面A的停留时间的NULL值比重较小时,表明这些NULL值的出现是由于一些用户打开页面A后离开未关闭页面引起的,而不是用户一直在浏览页面A的内容。因此,若计算出的页面A的停留时间的NULL值比重小于等于预设比重阈值,则将计算出的页面A的平均停留时间的基础值作为页面A的平均停留时间。0071基于上述的统计页面平均停留时间的方法,本发明实施例的确定页面用户黏。

35、性的方法,具体包括对于网站中待统计的页面,根据上述的统计页面平均停留时间的方法统计出该页面的平均停留时间;根据统计出的该页面的平均停留时间、以及预设的平均停留时间与黏性等级的对应关系,确定用户对该页面的黏性等级,即该页面的用户黏性等级。其中,预设的平均停留时间与黏性等级的对应关系,具体由本领域技术人员根据实际需求来设定。通常,对于网站中的一个页面,该页面的平均停留时间可以反映出用户对该页面的黏性,该页面的平均停留时间越长,用户对该页面的黏性越大、黏性等级越高。说明书CN104111970A108/9页110072基于上述的统计页面平均停留时间的方法,本发明实施例提供的统计页面平均停留时间的装置。

36、的内部结构框图,如图2所示,包括停留时间获取模块201、比重计算模块202、基础值计算模块203、平均停留时间计算模块204。0073其中,停留时间获取模块201用户对于网站中待统计的页面,获取网站服务器记录的该页面的若干个停留时间;其中,大于预设会话时间阈值的该页面的停留时间以空值NULL表示。0074比重计算模块202用于从停留时间获取模块201获取的页面的停留时间中统计出值为NULL的该页面的停留时间的个数,计算该个数在停留时间获取模块201获取的页面的停留时间的个数中所占的比重。0075基础值计算模块203用于根据停留时间获取模块201获取的非NULL值的待统计的页面的停留时间,计算出。

37、该页面的平均停留时间的基础值。具体地,基础值计算模块203具体用于将停留时间获取模块201获取的非NULL的待统计的页面的停留时间进行排序,选取排序在预设排序区间内的该页面的停留时间后,计算出选取出的该页面的停留时间的平均值,作为该页面的平均停留时间的基础值。其中,预设的排序区间的两个端点分别为INTM1N和INTM2N,其中,N为获取的所述页面的平均停留时间的个数,M1和M2为预设的百分比,且M1M2;INTM1N表示对M1N取整;INTM2N表示对M2N取整。0076平均停留时间计算模块204用于若判定比重计算模块202计算出的比重大于预设比重阈值,则根据比重计算模块202计算出的比重与预。

38、设会话时间阈值确定待统计的页面的平均停留时间;否则,将基础值计算模块203计算出的基础值作为待统计的页面的平均停留时间。0077进一步,平均停留时间计算模块204具体包括判断单元211和平均停留时间计算单元212。0078其中,判断单元211用于若判定比重计算模块202计算出的比重大于预设比重阈值,则进一步判断基础值计算模块203计算出的基础值是否大于预设停留时间阈值,若是,则发送第一计算通知,否则发送第二计算通知;若判断比重计算模块202计算出的比重小于等于预设比重阈值,则发送第三计算通知。0079平均停留时间计算单元212用于接收到判断单元211发送的第一计算通知后,将比重计算模块202计。

39、算出的比重与预设会话时间阈值相乘后与基础值计算模块203计算出的基础值相加,得到待统计的页面的平均停留时间;以及接收到判断单元211发送的第二计算通知后,将比重计算模块202计算出的比重与预设会话时间阈值相乘,得到待统计的页面的平均停留时间;以及接收到第三计算通知后,将基础值计算模块203计算出的基础值作为待统计的页面的平均停留时间。0080其中,上述的预设比重阈值具体为20;预设会话时间阈值具体为30分钟;预设停留时间阈值具体为90秒。0081基于上述的确定页面用户黏性的方法,本发明实施例提供的确定页面用户黏性的装置的内部结构框图,如图3所示,具体包括上述的统计页面平均停留时间的装置的停留时。

40、间获取模块201、比重计算模块202、基础值计算模块203、平均停留时间计算模块204,以及网页用户黏性确定模块301。0082其中,网页用户黏性确定模块301用于对于网站中待统计的页面,根据网站页面说明书CN104111970A119/9页12平均停留时间统计装置统计出的该页面的平均停留时间、以及预设的平均停留时间与黏性等级的对应关系,确定用户对该页面的黏性等级。0083本发明的技术方案中,对于网站的待统计的页面,获取网络服务器中记录的该页面的若干个停留时间后,计算出值为NULL的该页面的停留时间的个数在获取的该页面的停留时间的个数中所占的比重,根据该比重与预设比重阈值的大小关系,采用不同的。

41、方式来计算该页面的平均停留时间,即当该比重大于预设比重阈值时,根据该比重与预设会话时间阈值来确定该页面的平均停留时间,当该比重小于等于预设比重阈值时,将该页面的平均停留时间的基础值作为该页面的平均停留时间。本发明考虑了网络服务器记录的值为NULL的页面的停留时间对页面的平均停留时间的影响,提高了页面的平均停留时间的的准确性。而且,基于统计出的页面的平均停留时间,可以确定出用户对页面的黏性等级,进而便于网站运营人员作出运营决策等。0084本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于计算机可读取存储介质中,如ROM/RAM、磁碟、光盘等。0085以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。说明书CN104111970A121/3页13图1说明书附图CN104111970A132/3页14图2说明书附图CN104111970A143/3页15图3说明书附图CN104111970A15。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1