获取网页的方法、设备和系统.pdf

上传人:柴****2 文档编号:1493044 上传时间:2018-06-18 格式:PDF 页数:21 大小:4.12MB
返回 下载 相关 举报
摘要
申请专利号:

CN201210164409.8

申请日:

2012.05.24

公开号:

CN103425699A

公开日:

2013.12.04

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20120524|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

腾讯科技(深圳)有限公司

发明人:

张凯; 徐羽; 陈德贤; 钭伟雨

地址:

518000 广东省深圳市福田区赛格科技园2栋东403室

优先权:

专利代理机构:

北京三高永信知识产权代理有限责任公司 11138

代理人:

王希刚

PDF下载: PDF下载
内容摘要

本发明公开了一种获取网页的方法、设备和系统,属于通信技术领域。所述方法包括:接收客户端的URL请求,获取所述URL请求对应的页面;根据所述客户端的显示屏幕信息对所述页面进行预处理,得到所述页面的二进制网页渲染数据和所述页面的缩略图;根据所述客户端能够显示的图片参数的信息对所述页面上的图片进行转换和压缩,得到所述页面的图片数据;将所述页面的缩略图、所述页面的二进制网页渲染数据和所述页面的图片数据返回给所述客户端,使所述客户端根据所述页面的缩略图、所述页面的二进制网页渲染数据和所述页面的图片数据对所述页面进行绘制,以实现对所述页面的浏览。

权利要求书

1.  一种获取网页的方法,其特征在于,所述方法包括:
接收客户端的统一资源定位符URL请求,获取所述URL请求对应的页面,其中,所述URL请求中包括所述客户端的显示屏幕信息和所述客户端能够显示的图片参数的信息;
根据所述客户端的显示屏幕信息对所述页面进行预处理,得到所述页面的二进制网页渲染数据和所述页面的缩略图,其中,所述二进制网页渲染数据和所述缩略图中的指定的区域一一对应;
根据所述客户端能够显示的图片参数的信息对所述页面上的图片进行转换和压缩,得到所述页面的图片数据;
将所述页面的缩略图、所述页面的二进制网页渲染数据和所述页面的图片数据返回给所述客户端,使所述客户端根据所述页面的缩略图、所述页面的二进制网页渲染数据和所述页面的图片数据对所述页面进行绘制,以实现对所述页面的浏览。

2.
  根据权利要求1所述的方法,其特征在于,所述获取所述URL请求对应的页面,包括:
获取所述URL请求对应的原始网页;
对所述原始网页进行解析,获取并存储所述原始网页中图片标签对应的图片信息,并执行所述原始网页包含的Javascript,得到所述解析后的所述URL对应的页面。

3.
  根据权利要求1所述的方法,其特征在于,所述根据所述客户端的显示屏幕信息对所述页面进行预处理,得到所述页面的二进制渲染数据和所述页面的缩略图,包括:
对所述页面进行渲染,获得所述页面的渲染数据和所述页面的原始图片;
将所述页面的渲染数据通过序列化转换为二进制数据,得到所述页面的二进制渲染数据;
根据所述客户端的显示屏幕信息,将所述页面的原始图片调整到所述客户端的显示屏幕能够显示的比例,得到所述页面的缩略图;
将所述页面的二进制渲染数据和所述缩略图中的指定的区域进行映射,使所述渲染数据和所述缩略图中的指定的区域一一对应。

4.
  根据权利要求3所述的方法,其特征在于,所述对所述页面进行渲染,获得所述页面的原始图片,包括:
根据所述客户端的显示屏幕信息,对所述页面上的文本进行排版,使得所述排版后的文本能够完整的显示在所述客户端的显示屏幕上,获得所述页面的原始图片。

5.
  根据权利要求3或4所述的方法,其特征在于,根据所述客户端的显示屏幕信息,将所述页面的原始图片调整到所述客户端的显示屏幕能够显示的比例,得到所述页面的缩略图之后,还包括:
判断所述页面的缩略图的内存大小是否超过预设值,如果是,则根据所述客户端的显示屏幕信息对所述缩略图进行切割处理,以减少所述缩略图的内存大小。

6.
  一种获取网页的方法,其特征在于,所述方法包括:
向服务器端发送统一资源定位符URL请求;
接收所述服务器端返回的所述URL对应的页面的缩略图、所述URL对应的页面的二进制渲染数据和所述URL对应的页面的图片数据;
根据所述URL对应的页面的缩略图、所述URL对应的页面的二进制渲染数据和所述URL对应的页面的图片数据,对所述URL对应的页面进行绘制,以实现对所述页面的浏览。

7.
  根据权利要求6所述的方法,其特征在于,所述根据所述URL对应的页面的缩略图、所述URL对应的页面的二进制渲染数据和所述URL对应的页面的图片数据,对所述URL对应的页面进行绘制,包括:
输出所述URL对应的页面的缩略图;
当定位所述缩略图中的指定区域时,获取所述URL对应的页面的二进制渲染数据中与所述指定区域对应的二进制渲染数据;
根据与所述指定区域对应的二进制渲染数据和所述URL对应的页面的图片数据对所述指定区域进行绘制。

8.
  一种服务器端,其特征在于,所述服务器端包括:
页面抓取模块,用于接收客户端的统一资源定位符URL请求,获取所述URL请求对应的页面,其中,所述URL请求中包括所述客户端的显示屏幕信息和所述客户端能够显示的图片参数的信息;
预处理模块,用于根据所述客户端的显示屏幕信息对所述页面进行预处理,得到所述页 面的二进制网页渲染数据和所述页面的缩略图,其中,所述二进制网页渲染数据和所述缩略图中的指定的区域一一对应;
图片处理模块,用于根据所述客户端能够显示的图片参数的信息对所述页面上的图片进行转换和压缩,得到所述页面的图片数据;
发送模块,用于将所述页面的缩略图、所述页面的二进制网页渲染数据和所述页面的图片数据返回给所述客户端,使所述客户端根据所述页面的缩略图、所述页面的二进制网页渲染数据和所述页面的图片数据对所述页面进行绘制,以实现对所述页面的浏览。

9.
  根据权利要求8所述的服务器端,其特征在于,所述页面抓取模块,包括:
获取单元,用于获取所述URL请求对应的原始网页;
解析单元,用于对所述原始网页进行解析,获取并存储所述原始网页中图片标签对应的图片信息,并执行所述原始网页包含的Javascript,得到所述解析后的所述URL对应的页面。

10.
  根据权利要求8所述的服务器端,其特征在于,所述预处理模块,包括:
渲染单元,用于对所述页面进行渲染,获得所述页面的渲染数据和所述页面的原始图片;
序列化单元,用于将所述页面的渲染数据通过序列化转换为二进制数据,得到所述页面的二进制渲染数据;
缩略图生成单元,用于根据所述客户端的显示屏幕信息,将所述页面的原始图片调整到所述客户端的显示屏幕能够显示的比例,得到所述页面的缩略图;
映射单元,用于将所述页面的二进制渲染数据和所述缩略图中的指定的区域进行映射,使所述渲染数据和所述缩略图中的指定的区域一一对应。

11.
  根据权利要求10所述的服务器端,其特征在于,所述渲染单元,包括:
原始图片生成子单元,用于根据所述客户端的显示屏幕信息,对所述页面上的文本进行排版,使得所述排版后的文本能够完整的显示在所述客户端的显示屏幕上,获得所述页面的原始图片。

12.
  根据权利要求10或11所述的服务器端,其特征在于,缩略图生成单元包括:
切割子单元,用于判断所述页面的缩略图的内存大小是否超过预设值,如果是,则根据所述客户端的显示屏幕信息对所述缩略图进行切割处理,以减少所述缩略图的内存大小。

13.
  一种客户端,其特征在于,所述客户端包括:
发送模块,用于向服务器端发送统一资源定位符URL请求;
接收模块,用于接收所述服务器端返回的所述URL对应的页面的缩略图、所述URL对应的页面的二进制渲染数据和所述URL对应的页面的图片数据;
页面绘制模块,用于根据所述URL对应的页面的缩略图、所述URL对应的页面的二进制渲染数据和所述URL对应的页面的图片数据,对所述URL对应的页面进行绘制,以实现对所述页面的浏览。

14.
  根据权利要求13所述的客户端,其特征在于,所述页面绘制模块,包括:
输出单元,用于输出所述URL对应的页面的缩略图;
获取单元,用于当定位所述缩略图中的指定区域时,获取所述URL对应的页面的二进制渲染数据中与所述指定区域对应的二进制渲染数据;
绘制单元,用于根据与所述指定区域对应的二进制渲染数据和所述URL对应的页面的图片数据对所述指定区域进行绘制。

15.
  一种获取网页的系统,其特征在于,所述系统包括:如权利要求8-12任一项所述的服务器端和如权利要求13-14任一项所述的客户端。

说明书

获取网页的方法、设备和系统
技术领域
本发明涉及通信技术领域,特别涉及一种获取网页的方法、设备和系统。
背景技术
随着3G技术的推广、以及移动电话价格和入网费用的降低,人们对于手机上网的需求,逐渐的从访问简单以文本为主的Wap网页,转向了直接访问互联网WWW网页,以获取更加丰富的内容。但是由于中低端平台手机的能力限制,对WWW网页的处理能力还不够,所以怎样才能使WWW网页显示在中低端平台的手机上是现有技术需要解决的问题。
现有技术中,在手机直接访问互联网上的WWW网页时,服务器端对WWW网页做一些转换过滤处理,例如对网页的标签及CSS(Cascading Style Sheet,级联样式表)过滤转换处理等,使得处理后的WWW网页能够在手机上显示,服务器端再将转换处理过的WWW网页返回给手机端,手机进行显示。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
现有技术中,服务器端为了使WWW网页能够在手机上显示,对WWW网页的标签和CSS做了过滤处理转换,这样虽然能够达到在手机上显示WWW网页的目的,但是过滤转换后的页面显示效果会与在PC上显示的效果差别很多,降低了用户在使用手机浏览WWW网页时的体验感。
发明内容
为了解决现有技术中WWW网页在手机上的显示效果差的问题,本发明实施例提供了一种获取网页的方法、设备和系统。所述技术方案如下:
一方面,提供了一种获取网页的方法,所述方法包括:
接收客户端的统一资源定位符URL请求,获取所述URL请求对应的页面,其中,所述URL请求中包括所述客户端的显示屏幕信息和所述客户端能够显示的图片参数的信息;
根据所述客户端的显示屏幕信息对所述页面进行预处理,得到所述页面的二进制网页渲染数据和所述页面的缩略图,其中,所述二进制网页渲染数据和所述缩略图中的指定的区域一一对应;
根据所述客户端能够显示的图片参数的信息对所述页面上的图片进行转换和压缩,得到所述页面的图片数据;
将所述页面的缩略图、所述页面的二进制网页渲染数据和所述页面的图片数据返回给所述客户端,使所述客户端根据所述页面的缩略图、所述页面的二进制网页渲染数据和所述页面的图片数据对所述页面进行绘制,以实现对所述页面的浏览。
所述获取所述URL请求对应的页面,包括:
获取所述URL请求对应的原始网页;
对所述原始网页进行解析,获取并存储所述原始网页中图片标签对应的图片信息,并执行所述原始网页包含的Javascript,得到所述解析后的所述URL对应的页面。
所述根据所述客户端的显示屏幕信息对所述页面进行预处理,得到所述页面的二进制渲染数据和所述页面的缩略图,包括:
对所述页面进行渲染,获得所述页面的渲染数据和所述页面的原始图片;
将所述页面的渲染数据通过序列化转换为二进制数据,得到所述页面的二进制渲染数据;
根据所述客户端的显示屏幕信息,将所述页面的原始图片调整到所述客户端的显示屏幕能够显示的比例,得到所述页面的缩略图;
将所述页面的二进制渲染数据和所述缩略图中的指定的区域进行映射,使所述渲染数据和所述缩略图中的指定的区域一一对应。
所述对所述页面进行渲染,获得所述页面的原始图片,包括:
根据所述客户端的显示屏幕信息,对所述页面上的文本进行排版,使得所述排版后的文本能够完整的显示在所述客户端的显示屏幕上,获得所述页面的原始图片。
根据所述客户端的显示屏幕信息,将所述页面的原始图片调整到所述客户端的显示屏幕能够显示的比例,得到所述页面的缩略图之后,还包括:
判断所述页面的缩略图的内存大小是否超过预设值,如果是,则根据所述客户端的显示屏幕信息对所述缩略图进行切割处理,以减少所述缩略图的内存大小。
另一方面,提供了一种获取网页的方法,所述方法包括:
向服务器端发送统一资源定位符URL请求;
接收所述服务器端返回的所述URL对应的页面的缩略图、所述URL对应的页面的二进制渲染数据和所述URL对应的页面的图片数据;
根据所述URL对应的页面的缩略图、所述URL对应的页面的二进制渲染数据和所述URL对应的页面的图片数据,对所述URL对应的页面进行绘制,以实现对所述页面的浏览。
所述根据所述URL对应的页面的缩略图、所述URL对应的页面的二进制渲染数据和所述URL对应的页面的图片数据,对所述URL对应的页面进行绘制,包括:
输出所述URL对应的页面的缩略图;
当定位所述缩略图中的指定区域时,获取所述URL对应的页面的二进制渲染数据中与所述指定区域对应的二进制渲染数据;
根据与所述指定区域对应的二进制渲染数据和所述URL对应的页面的图片数据对所述指定区域进行绘制。
另一方面,还提供了一种服务器端,所述服务器端包括:
页面抓取模块,用于接收客户端的统一资源定位符URL请求,获取所述URL请求对应的页面,其中,所述URL请求中包括所述客户端的显示屏幕信息和所述客户端能够显示的图片参数的信息;
预处理模块,用于根据所述客户端的显示屏幕信息对所述页面进行预处理,得到所述页面的二进制网页渲染数据和所述页面的缩略图,其中,所述二进制网页渲染数据和所述缩略图中的指定的区域一一对应;
图片处理模块,用于根据所述客户端能够显示的图片参数的信息对所述页面上的图片进行转换和压缩,得到所述页面的图片数据;
发送模块,用于将所述页面的缩略图、所述页面的二进制网页渲染数据和所述页面的图片数据返回给所述客户端,使所述客户端根据所述页面的缩略图、所述页面的二进制网页渲染数据和所述页面的图片数据对所述页面进行绘制,以实现对所述页面的浏览。
所述页面抓取模块,包括:
获取单元,用于获取所述URL请求对应的原始网页;
解析单元,用于对所述原始网页进行解析,获取并存储所述原始网页中图片标签对应的图片信息,并执行所述原始网页包含的Javascript,得到所述解析后的所述URL对应的页面。
所述预处理模块,包括:
渲染单元,用于对所述页面进行渲染,获得所述页面的渲染数据和所述页面的原始图片;
序列化单元,用于将所述页面的渲染数据通过序列化转换为二进制数据,得到所述页面的二进制渲染数据;
缩略图生成单元,用于根据所述客户端的显示屏幕信息,将所述页面的原始图片调整到所述客户端的显示屏幕能够显示的比例,得到所述页面的缩略图;
映射单元,用于将所述页面的二进制渲染数据和所述缩略图中的指定的区域进行映射, 使所述渲染数据和所述缩略图中的指定的区域一一对应。
所述渲染单元,包括:
原始图片生成子单元,用于根据所述客户端的显示屏幕信息,对所述页面上的文本进行排版,使得所述排版后的文本能够完整的显示在所述客户端的显示屏幕上,获得所述页面的原始图片。
缩略图生成单元包括:
切割子单元,用于判断所述页面的缩略图的内存大小是否超过预设值,如果是,则根据所述客户端的显示屏幕信息对所述缩略图进行切割处理,以减少所述缩略图的内存大小。
另一方面,还提供了一种客户端,所述客户端包括:
发送模块,用于向服务器端发送统一资源定位符URL请求;
接收模块,用于接收所述服务器端返回的所述URL对应的页面的缩略图、所述URL对应的页面的二进制渲染数据和所述URL对应的页面的图片数据;
页面绘制模块,用于根据所述URL对应的页面的缩略图、所述URL对应的页面的二进制渲染数据和所述URL对应的页面的图片数据,对所述URL对应的页面进行绘制,以实现对所述页面的浏览。
所述页面绘制模块,包括:
输出单元,用于输出所述URL对应的页面的缩略图;
获取单元,用于当定位所述缩略图中的指定区域时,获取所述URL对应的页面的二进制渲染数据中与所述指定区域对应的二进制渲染数据;
绘制单元,用于根据与所述指定区域对应的二进制渲染数据和所述URL对应的页面的图片数据对所述指定区域进行绘制。
另一方面,还提供了一种获取网页的系统,所述系统包括:如上所述的服务器端和如上所述的客户端。
本发明实施例提供的技术方案带来的有益效果是:将页面分解成缩略图、二进制渲染数据和图片数据,使客户端根据缩略图、二进制渲染数据和图片数据进行绘制,不需要对WWW的网页进行CSS样式过滤和标签的转换操作,可以大大提高CSS样式支持和标签支持,提供了更好的页面渲染效果,让用户舒适的阅读大页面,大大提高用户了的体验度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附 图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例1中提供的一种获取网页的方法的流程图;
图2是本发明实施例2中提供的一种获取网页的方法的流程图;
图3是本发明实施例3中提供的一种获取网页的方法的流程图;
图4是本发明实施例4中提供的一种服务器端的示意图;
图5是本发明实施例4中提供的另一种服务器端的示意图;
图6是本发明实施例5中提供的一种客户端的示意图;
图7是本发明实施例5中提供的另一种客户端的示意图;
图8是本发明实施例6中提供的一种获取网页的系统的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
实施例1
参见图1,本实施例中提供了一种获取网页的方法,所述方法包括:
101、接收客户端的URL(Uniform/Universal Resource Locator,统一资源定位符)请求,获取所述URL请求对应的页面,其中,所述URL请求中包括所述客户端的显示屏幕信息和所述客户端能够显示的图片参数的信息;
102、根据所述客户端的显示屏幕信息对所述页面进行预处理,得到所述页面的二进制网页渲染数据和所述页面的缩略图,其中,所述二进制网页渲染数据和所述缩略图中的指定的区域一一对应;
103、根据所述客户端能够显示的图片参数的信息对所述页面上的图片进行转换和压缩,得到所述页面的图片数据;
104、将所述页面的缩略图、所述页面的二进制网页渲染数据和所述页面的图片数据返回给所述客户端,使所述客户端根据所述页面的缩略图、所述页面的二进制网页渲染数据和所述页面的图片数据对所述页面进行绘制,以实现对所述页面的浏览。
本实施例的有益效果是:将页面分解成缩略图、二进制渲染数据和图片数据,使客户端根据缩略图、二进制渲染数据和图片数据进行绘制,不需要对WWW的网页进行CSS样式过滤和标签的转换操作,可以大大提高CSS样式支持和标签支持,提供了更好的页面渲染效果, 让用户舒适的阅读大页面,大大提高用户了的体验度。
实施例2
参见图2,本实施例中提供了一种获取网页的方法,所述方法包括:
201、向服务器端发送URL请求;
202、接收所述服务器端返回的所述URL对应的页面的缩略图、所述URL对应的页面的二进制渲染数据和所述URL对应的页面的图片数据;
203、根据所述URL对应的页面的缩略图、所述URL对应的页面的二进制渲染数据和所述URL对应的页面的图片数据,对所述URL对应的页面进行绘制,以实现对所述页面的浏览。
本实施例的有益效果是:服务器端将页面分解成缩略图、二进制渲染数据和图片数据,使客户端根据缩略图、二进制渲染数据和图片数据进行绘制,不需要对WWW的网页进行CSS样式过滤和标签的转换操作,可以大大提高CSS样式支持和标签支持,提供了更好的页面渲染效果,让用户舒适的阅读大页面,大大提高用户了的体验度。
实施例3
参见图3,本实施例中提供了一种获取网页的方法,包括:
301、客户端向服务器端发起URL请求。
本实施例中,客户端包括便捷式移动终端,如手机等,对此本实施例不做具体限定,本步骤中,客户端向互联网发起URL请求,请求访问WWW网页。
本步骤中,客户端在向服务器端发起URL请求时,同时会将本地的中能力信息发送给服务器,使得服务器端能够根据客户端的能力信息对页面进行相应的处理。其中客户端的能力信息包括但不限于:客户端的显示屏幕信息、所述客户端能够显示的图片参数的信息和客户端所能支持的网页等。
302、服务器端接收到客户端的URL请求后,获取该URL对应的页面。
本步骤中,服务器端接收到客户端的URL请求后,抓取该URL对应的原始网页的资源,并对原始网页进行进一步解析,以获得URL对应的页面。其中,原始网页的资源包括:Javascript,CSS(Cascading Style Sheet,级联样式表),图片等资源。
本步骤中,获得URL对应的页面包括:获取所述URL请求对应的原始网页;对所述原始网页进行解析,获取并存储所述原始网页中图片标签对应的图片信息,并执行所述原始网页包含的Javascript,得到所述解析后的URL对应的页面。
可选地,本步骤中,如果客户端不支持WWW页面的浏览,则需要将该页面转换为客户端能够支持的页面,如客户端支持wap2.0网页,则在对原始网页资源进行解析得到URL对应的页面后,还需要将该页面进一步转换为wap2.0网页。如果客户端支持WWW页面的浏览则不需要对WWW页面进行转换,对此本实施例不做具体限定。
303、服务器端根据所述客户端的显示屏幕信息对所述页面进行渲染,得到所述页面的渲染数据和所述页面的缩略图。
本步骤中,对获得的URL页面进行预处理,其中根据所述客户端的显示屏幕信息对所述页面进行预处理,得到所述页面的二进制渲染数据和所述页面的缩略图,包括:
1)对所述页面进行渲染,获得所述页面的渲染数据和所述页面的原始图片;
本步骤中将页面解析成DOM树,再进一步对DOM树进行渲染,形成渲染树,得到页面的渲染数据。其中对页面进行渲染现有技术中有多种方法,本实施例中对此不再赘述。
本步骤中,为了使用户获得良好的体验感,在对页面进行渲染时,同时根据页面生成一张原始图片,其中将页面生成图片的技术与现有技术类似,本实施例不再赘述。值的说明的是,为了避免客户端用户在浏览超过一个屏幕宽度的文本的时候进行左右滚动操作,在渲染过程中服务器端会根据客户端上报的显示屏幕信息对超过一个屏幕的文本进行文字适合屏幕排版,其中,对所述页面进行渲染,获得所述页面的原始图片,包括:根据所述客户端的显示屏幕信息,对所述页面上的文本进行排版,使得所述排版后的文本能够完整的显示在所述客户端的显示屏幕上,获得所述页面的原始图片。其中排版包括行间距的调整或是字体的调整等,对此本实施例不做具体限定。
2)将所述页面的渲染数据通过序列化转换为二进制数据,得到所述页面的二进制渲染数据;
本步骤中,将所述页面的渲染数据通过序列化转换为二进制数据,得到所述页面的二进制渲染数据,具体包括:
a)从渲染树上获取发送了URL请求的客户端所需要的Render对象。
本实施例中,获取客户端需要渲染的对象。客户端需要的渲染对象为:RenderText对象、RenderImage对象、至少一个控件Render对象、以及与发送了URL请求的客户端逻辑相关的Render对象;或者,所有渲染后的页面中的数据。
其中,与客户端逻辑相关的渲染对象具体可为RenderView对象(用于存放文档页面大小、HTML Head标签元素等),RenderBlock对象(Form表单元素)等。
通过获取客户端所需要的渲染对象,能够过滤掉其他一些不必要的Render对象,这可在 后续发送Render对象时节省流量。
b)针对获取的每一Render对象,获取该Render对象的渲染信息,以及在所述DOM树上获取该Render对象对应的DOM元素和该DOM元素的属性。
通常,Render对象至少对应一个DOM元素。
其中,Render对象的渲染信息主要为客户端在执行绘制操作时用到的样式信息,具体可包括:Render对象在屏幕上的坐标值和宽高,颜色等。
DOM元素和该DOM元素的属性具体定义可与现有技术中的定义类似,这里不再赘述。
本实施例中,获取Render对象的渲染信息,以及在所述DOM树上获取该Render对象对应的DOM元素和该DOM元素的属性,主要目的是为了绘制操作。以Render对象的渲染信息包含Render对象在屏幕上的坐标值、宽高和颜色,DOM元素的标签是<A>标签,属性为href=http://www.aa.com为例,则当手机在得到该渲染信息、DOM元素和该DOM元素的属性时,可以根据位置,颜色和文本等信息进行绘制,根据其标签属性为<a>点击该元素时进行的响应操作,并根据属性href=http://www.aa.com获知跳转的网页。
c)将获取的渲染信息、DOM元素和该DOM元素的属性进行二进制编码,得到页面的二进渲染数据。
其中可按表1所示的Tag-Length-Value(TLV)编码格式对渲染信息、DOM元素和该DOM元素的属性进行二进制编码。
表1

  Tag  Length  Value

如表1所示,Tag是指标志位使用可变长度变量,本身占用1到2个字节。如果待编码的信息(比如渲染信息、DOM元素和该DOM元素的属性)的值是从0到254的,则使用单个字节;如果值为255或者以上的,则第一个字节为0xFF,第二个字节为(该待编码的信息的值-255)。Length是指Value字段中承载的二进制流的长度。Value承载了二进制流,长度由Length字段决定,该二进制流本身可以为数字或者字符串。通过二进制编码,能够大大减少服务器端和手机之间的流量传输压力。
3)根据所述客户端的显示屏幕信息,将所述页面的原始图片调整到所述客户端的显示屏幕能够显示的比例,得到所述页面的缩略图;
在获得页面的原始图片后,由于该原始图片是根据网页的页面生成的,所以该图片可能会很大,无法完整的在客户端的显示屏幕上进行显示,需要对原始图片进行缩放处理。如对某个WWW网页处理后生成一张1009×6450的原始图片,客户端端提交上来的屏幕宽度为240, 为了让用户不需要左右翻页就可以看到网页的一个全景图,服务器端对生成的原始图片进行按比例缩放处理,则经过按比例缩放后的缩略图大小为240×(6450/(1009/240)),即240×1534大小的缩略图。
可选地,根据所述客户端的显示屏幕信息,将所述页面的原始图片调整到所述客户端的显示屏幕能够显示的比例,得到所述页面的缩略图之后,还包括:判断所述页面的缩略图的内存大小是否超过预设值,如果是,则根据所述客户端的显示屏幕信息对所述缩略图进行切割处理,以减少所述缩略图的内存大小。其中预设值可以是一个经验值也可以根据客户端的显示屏幕信息而设置,对此本实施例不做具体限定。本步骤中,在缩略图的处理上,也可以根据客户端的实际情况对缩略图大小进行切割等处理,例如有些WWW网页生成的缩略图很大,这样客户端在解压图片时需要的内存就非常大,这时服务器可以对这种大缩略图片进行一些处理,如根据移动终端的屏幕高度情况做一些图片切割处理,客户端就可以一次解压比较小的数据,其他的图片数据就可以在需要显示的时候进行解压。当然服务器端对缩略图的处理还可以根据客户端屏幕的显示信息进行图片的旋转处理、拉伸处理等,对此本实施例不做具体限定。
4)将所述页面的二进制渲染数据和所述缩略图中的指定的区域进行映射,使所述渲染数据和所述缩略图中的指定的区域一一对应。
本步骤中,在得到页面的二进制渲染数据和页面的缩略图片后,将页面的二进制渲染数据和所述缩略图中的指定的区域进行映射,使所述渲染数据和所述缩略图中的指定的区域一一对应,当在缩略图中定位一个区域时,就能映射到二进制渲染数据中相应的区域,这样当用户在选中缩略图中某一块区域进行点击放大浏览时,就可以快速的映射到二进制渲染数据中相应区域中的内容,客户端只要对该区域的渲染内容进行绘制显示就可以了。
本步骤中,可以通过坐标实现缩略图和二进制渲染数据的映射。例如网页渲染后的大小为1440*960的大小,最初生成的缩略图也是1440*960,如果客户端的上传的屏幕宽高为320*240,把1440*960的图片缩放为320*240的大小,此时缩放比例为x轴方向的缩放比例为1440/240=6,y轴方向的缩放比例为960/240=4,下发给客户端的缩略图图片就是320*240的大小,而且原始页面的大小也会下发给客户端,客户端根据缩略图的大小和原始页面的大小计算出缩放比例。当客户端点击一个例如{(10,10),(20,20)}这样一个区域时,根据上述缩放比例该区域就会映射回{(60,40),(120,80)}的区域,然后在渲染树二进制数据里面找到该区域的内容绘制就可以了显示对应区域的内容了。
304、服务器端根据所述客户端能够显示的图片参数的信息对所述页面上的图片进行转 换和压缩,得到所述页面的图片数据。
本步骤中,将WWW网页上的图片进行单独处理,在ImageInsInfo结构里面添加了sPicContent字段,将图片数据存放到里面。其中,图片数据由图片的URL地址和图片二进制数据组成。其中图片数据和页面的二进制渲染数据是通过图片的URL地址作为对应,即将渲染树的二进制数据通过图片的URL和后面的图片二进制数据关联起来,通过SRC的URL到图片数据里面去找相应的数据。这样在客户端收到页面的二进制渲染数据后,当发现RenderImage元素中含有DOM属性SRC的时候,可以通过SRC的图片URL来查找WUP包中的ImageInsInfo结构体,进而获取图片数据。
305、服务器端将所述页面的二进制网页渲染数据、所述页面的缩略图和所述页面的图片数据返回给所述客户端。
本步骤中,将页面的二进制网页渲染数据、页面的缩略图和页面的图片数据进行WUP协议组包和压缩,依次发送到客户端上。其中组包和压缩属于现有技术,本实施例对此不再赘述。
本步骤中在对页面的二进制网页渲染数据、页面的缩略图和页面的图片数据进行组包和压缩之前,还可以在页面的二进制网页渲染数据、页面的缩略图和页面的图片数据进行组包和压缩的前部或者后部增加对应的文件标识和版本号,以供识别该二进制流。
306、客户端接收所述服务器端返回的所述URL对应的页面的缩略图、所述URL对应的页面的二进制渲染数据和所述URL对应的页面的图片数据,根据所述URL对应的页面的缩略图、所述URL对应的页面的二进制渲染数据和所述URL对应的页面的图片数据,对所述URL对应的页面进行绘制,以实现对所述页面的浏览。
本步骤中,客户端依次接收服务器端返回的URL对应的页面的缩略图、二进制渲染数据和图片数据,在接收到页面的缩略图时,在显示屏幕上马上输出该缩略图,以供客户端用户浏览,用户可以根据该缩略图看到访问的WWW网页的全貌,且该缩略图中没有对标签或是CSS进行处理,显示效果与PC机上的显示效果一样,只是由于客户端显示屏幕的限制,对页面进行了缩放处理。
客户端对接收到的数据进行解压和解析,在进行解压和解析的同时完成页面的绘制操作。其中根据所述URL对应的页面的缩略图、所述URL对应的页面的二进制渲染数据和所述URL对应的页面的图片数据,对所述URL对应的页面进行绘制,包括:输出所述URL对应的页面的缩略图;当定位所述缩略图中的指定区域时,获取所述URL对应的页面的二进制渲染数据中与所述指定区域对应的二进制渲染数据;根据与所述指定区域对应的二进制渲染数据和所 述URL对应的页面的图片数据对所述指定区域进行绘制。
本步骤中,客户端在显示屏幕上输出缩略图,客户端用户可以移动光标,选择缩略图上的任意一个区域进行放大浏览,如,用户选择了缩略图上的A区域进行浏览,则客户端获得A区域的坐标,拉取对应该坐标的二进制渲染数据和图片二进制数据,根据缩放比例将A区域进行放大显示。
本实施例的有益效果是:将页面分解成缩略图、二进制渲染数据和图片数据,使客户端根据缩略图、二进制渲染数据和图片数据进行绘制,不需要对WWW的网页进行CSS样式过滤和标签的转换操作,可以大大提高CSS样式支持和标签支持,提供了更好的页面渲染效果,让用户舒适的阅读大页面,大大提高用户了的体验度。且由于缩略图进行了适合适合屏幕排版能够使用户在客户端显示屏幕上看到WWW页面的全貌,大大提高了WWW页面的浏览体验。且对页面的处理在服务器端完成,客户端不需要解析渲染部分的代码,能减少客户端程序的大小,提高机型覆盖率;客户端不需要执行渲染计算,不需要一次绘制所有的二进制渲染数据,只需绘制用户在缩略图上选择的区域,减少了客户端的执行时间和内存消耗,提高了客户端的操作流畅性,进一步提高了用户的浏览体验。
实施例4
参见图4,本实施例中提供了一种服务器端,所述服务器端包括:页面抓取模块401、预处理模块402、图片处理模块403和发送模块404。
页面抓取模块401,用于接收客户端的URL请求,获取所述URL请求对应的页面,其中,所述URL请求中包括所述客户端的显示屏幕信息和所述客户端能够显示的图片参数的信息;
预处理模块402,用于根据所述客户端的显示屏幕信息对所述页面进行预处理,得到所述页面的二进制网页渲染数据和所述页面的缩略图,其中,所述二进制网页渲染数据和所述缩略图中的指定的区域一一对应;
图片处理模块403,用于根据所述客户端能够显示的图片参数的信息对所述页面上的图片进行转换和压缩,得到所述页面的图片数据;
发送模块404,用于将所述页面的缩略图、所述页面的二进制网页渲染数据和所述页面的图片数据返回给所述客户端,使所述客户端根据所述页面的缩略图、所述页面的二进制网页渲染数据和所述页面的图片数据对所述页面进行绘制,以实现对所述页面的浏览。
参见图5,所述页面抓取模块401,包括:
获取单元401a,用于获取所述URL请求对应的原始网页;
解析单元401b,用于对所述原始网页进行解析,获取并存储所述原始网页中图片标签对应的图片信息,并执行所述原始网页包含的Javascript,得到所述解析后的所述URL对应的页面。
参见图5,所述预处理模块402,包括:
渲染单元402a,用于对所述页面进行渲染,获得所述页面的渲染数据和所述页面的原始图片;
序列化单元402b,用于将所述页面的渲染数据通过序列化转换为二进制数据,得到所述页面的二进制渲染数据;
缩略图生成单元402c,用于根据所述客户端的显示屏幕信息,将所述页面的原始图片调整到所述客户端的显示屏幕能够显示的比例,得到所述页面的缩略图;
映射单元402d,用于将所述页面的二进制渲染数据和所述缩略图中的指定的区域进行映射,使所述渲染数据和所述缩略图中的指定的区域一一对应。
其中,所述渲染单元402a,包括:
原始图片生成子单元,用于根据所述客户端的显示屏幕信息,对所述页面上的文本进行排版,使得所述排版后的文本能够完整的显示在所述客户端的显示屏幕上,获得所述页面的原始图片。
可选地,缩略图生成单元402c包括:
切割子单元,用于判断所述页面的缩略图的内存大小是否超过预设值,如果是,则根据所述客户端的显示屏幕信息对所述缩略图进行切割处理,以减少所述缩略图的内存大小。
本实施例的有益效果是:将页面分解成缩略图、二进制渲染数据和图片数据,使客户端根据缩略图、二进制渲染数据和图片数据进行绘制,不需要对WWW的网页进行CSS样式过滤和标签的转换操作,可以大大提高CSS样式支持和标签支持,提供了更好的页面渲染效果,让用户舒适的阅读大页面,大大提高用户了的体验度。
实施例5
参见图6,本实施例中提供了一种客户端,所述客户端包括:发送模块501、接收模块502和页面绘制模块503。
发送模块501,用于向服务器端发送URL请求;
接收模块502,用于接收所述服务器端返回的所述URL对应的页面的缩略图、所述URL对应的页面的二进制渲染数据和所述URL对应的页面的图片数据;
页面绘制模块503,用于根据所述URL对应的页面的缩略图、所述URL对应的页面的二进制渲染数据和所述URL对应的页面的图片数据,对所述URL对应的页面进行绘制,以实现对所述页面的浏览。
参见图7,所述页面绘制模块503,包括:
输出单元503a,用于输出所述URL对应的页面的缩略图;
获取单元503b,用于当定位所述缩略图中的指定区域时,获取所述URL对应的页面的二进制渲染数据中与所述指定区域对应的二进制渲染数据;
绘制单元503c,用于根据与所述指定区域对应的二进制渲染数据和所述URL对应的页面的图片数据对所述指定区域进行绘制。
本实施例的有益效果是:将页面分解成缩略图、二进制渲染数据和图片数据,使客户端根据缩略图、二进制渲染数据和图片数据进行绘制,不需要对WWW的网页进行CSS样式过滤和标签的转换操作,可以大大提高CSS样式支持和标签支持,提供了更好的页面渲染效果,让用户舒适的阅读大页面,大大提高用户了的体验度。
实施例6
参见图8,本实施例中提供了一种获取网页的系统,所述系统包括:如实施例4所述的服务器端400和如实施例5所述的客户端500。
本实施例的有益效果是:将页面分解成缩略图、二进制渲染数据和图片数据,使客户端根据缩略图、二进制渲染数据和图片数据进行绘制,不需要对WWW的网页进行CSS样式过滤和标签的转换操作,可以大大提高CSS样式支持和标签支持,提供了更好的页面渲染效果,让用户舒适的阅读大页面,大大提高用户了的体验度。
本实施例提供的服务器端、客户端和系统,具体可以与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
值得注意的是,上述服务器端、客户端和系统实施例中,所包括的各个模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能模块的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成, 也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

获取网页的方法、设备和系统.pdf_第1页
第1页 / 共21页
获取网页的方法、设备和系统.pdf_第2页
第2页 / 共21页
获取网页的方法、设备和系统.pdf_第3页
第3页 / 共21页
点击查看更多>>
资源描述

《获取网页的方法、设备和系统.pdf》由会员分享,可在线阅读,更多相关《获取网页的方法、设备和系统.pdf(21页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 103425699 A(43)申请公布日 2013.12.04CN103425699A*CN103425699A*(21)申请号 201210164409.8(22)申请日 2012.05.24G06F 17/30(2006.01)(71)申请人腾讯科技(深圳)有限公司地址 518000 广东省深圳市福田区赛格科技园2栋东403室(72)发明人张凯 徐羽 陈德贤 钭伟雨(74)专利代理机构北京三高永信知识产权代理有限责任公司 11138代理人王希刚(54) 发明名称获取网页的方法、设备和系统(57) 摘要本发明公开了一种获取网页的方法、设备和系统,属于通信技术领域。所。

2、述方法包括:接收客户端的URL请求,获取所述URL请求对应的页面;根据所述客户端的显示屏幕信息对所述页面进行预处理,得到所述页面的二进制网页渲染数据和所述页面的缩略图;根据所述客户端能够显示的图片参数的信息对所述页面上的图片进行转换和压缩,得到所述页面的图片数据;将所述页面的缩略图、所述页面的二进制网页渲染数据和所述页面的图片数据返回给所述客户端,使所述客户端根据所述页面的缩略图、所述页面的二进制网页渲染数据和所述页面的图片数据对所述页面进行绘制,以实现对所述页面的浏览。(51)Int.Cl.权利要求书3页 说明书11页 附图6页(19)中华人民共和国国家知识产权局(12)发明专利申请权利要求。

3、书3页 说明书11页 附图6页(10)申请公布号 CN 103425699 ACN 103425699 A1/3页21.一种获取网页的方法,其特征在于,所述方法包括:接收客户端的统一资源定位符URL请求,获取所述URL请求对应的页面,其中,所述URL请求中包括所述客户端的显示屏幕信息和所述客户端能够显示的图片参数的信息;根据所述客户端的显示屏幕信息对所述页面进行预处理,得到所述页面的二进制网页渲染数据和所述页面的缩略图,其中,所述二进制网页渲染数据和所述缩略图中的指定的区域一一对应;根据所述客户端能够显示的图片参数的信息对所述页面上的图片进行转换和压缩,得到所述页面的图片数据;将所述页面的缩略。

4、图、所述页面的二进制网页渲染数据和所述页面的图片数据返回给所述客户端,使所述客户端根据所述页面的缩略图、所述页面的二进制网页渲染数据和所述页面的图片数据对所述页面进行绘制,以实现对所述页面的浏览。2.根据权利要求1所述的方法,其特征在于,所述获取所述URL请求对应的页面,包括:获取所述URL请求对应的原始网页;对所述原始网页进行解析,获取并存储所述原始网页中图片标签对应的图片信息,并执行所述原始网页包含的Javascript,得到所述解析后的所述URL对应的页面。3.根据权利要求1所述的方法,其特征在于,所述根据所述客户端的显示屏幕信息对所述页面进行预处理,得到所述页面的二进制渲染数据和所述页。

5、面的缩略图,包括:对所述页面进行渲染,获得所述页面的渲染数据和所述页面的原始图片;将所述页面的渲染数据通过序列化转换为二进制数据,得到所述页面的二进制渲染数据;根据所述客户端的显示屏幕信息,将所述页面的原始图片调整到所述客户端的显示屏幕能够显示的比例,得到所述页面的缩略图;将所述页面的二进制渲染数据和所述缩略图中的指定的区域进行映射,使所述渲染数据和所述缩略图中的指定的区域一一对应。4.根据权利要求3所述的方法,其特征在于,所述对所述页面进行渲染,获得所述页面的原始图片,包括:根据所述客户端的显示屏幕信息,对所述页面上的文本进行排版,使得所述排版后的文本能够完整的显示在所述客户端的显示屏幕上,。

6、获得所述页面的原始图片。5.根据权利要求3或4所述的方法,其特征在于,根据所述客户端的显示屏幕信息,将所述页面的原始图片调整到所述客户端的显示屏幕能够显示的比例,得到所述页面的缩略图之后,还包括:判断所述页面的缩略图的内存大小是否超过预设值,如果是,则根据所述客户端的显示屏幕信息对所述缩略图进行切割处理,以减少所述缩略图的内存大小。6.一种获取网页的方法,其特征在于,所述方法包括:向服务器端发送统一资源定位符URL请求;接收所述服务器端返回的所述URL对应的页面的缩略图、所述URL对应的页面的二进制渲染数据和所述URL对应的页面的图片数据;根据所述URL对应的页面的缩略图、所述URL对应的页面。

7、的二进制渲染数据和所述URL权 利 要 求 书CN 103425699 A2/3页3对应的页面的图片数据,对所述URL对应的页面进行绘制,以实现对所述页面的浏览。7.根据权利要求6所述的方法,其特征在于,所述根据所述URL对应的页面的缩略图、所述URL对应的页面的二进制渲染数据和所述URL对应的页面的图片数据,对所述URL对应的页面进行绘制,包括:输出所述URL对应的页面的缩略图;当定位所述缩略图中的指定区域时,获取所述URL对应的页面的二进制渲染数据中与所述指定区域对应的二进制渲染数据;根据与所述指定区域对应的二进制渲染数据和所述URL对应的页面的图片数据对所述指定区域进行绘制。8.一种服务。

8、器端,其特征在于,所述服务器端包括:页面抓取模块,用于接收客户端的统一资源定位符URL请求,获取所述URL请求对应的页面,其中,所述URL请求中包括所述客户端的显示屏幕信息和所述客户端能够显示的图片参数的信息;预处理模块,用于根据所述客户端的显示屏幕信息对所述页面进行预处理,得到所述页面的二进制网页渲染数据和所述页面的缩略图,其中,所述二进制网页渲染数据和所述缩略图中的指定的区域一一对应;图片处理模块,用于根据所述客户端能够显示的图片参数的信息对所述页面上的图片进行转换和压缩,得到所述页面的图片数据;发送模块,用于将所述页面的缩略图、所述页面的二进制网页渲染数据和所述页面的图片数据返回给所述客。

9、户端,使所述客户端根据所述页面的缩略图、所述页面的二进制网页渲染数据和所述页面的图片数据对所述页面进行绘制,以实现对所述页面的浏览。9.根据权利要求8所述的服务器端,其特征在于,所述页面抓取模块,包括:获取单元,用于获取所述URL请求对应的原始网页;解析单元,用于对所述原始网页进行解析,获取并存储所述原始网页中图片标签对应的图片信息,并执行所述原始网页包含的Javascript,得到所述解析后的所述URL对应的页面。10.根据权利要求8所述的服务器端,其特征在于,所述预处理模块,包括:渲染单元,用于对所述页面进行渲染,获得所述页面的渲染数据和所述页面的原始图片;序列化单元,用于将所述页面的渲染。

10、数据通过序列化转换为二进制数据,得到所述页面的二进制渲染数据;缩略图生成单元,用于根据所述客户端的显示屏幕信息,将所述页面的原始图片调整到所述客户端的显示屏幕能够显示的比例,得到所述页面的缩略图;映射单元,用于将所述页面的二进制渲染数据和所述缩略图中的指定的区域进行映射,使所述渲染数据和所述缩略图中的指定的区域一一对应。11.根据权利要求10所述的服务器端,其特征在于,所述渲染单元,包括:原始图片生成子单元,用于根据所述客户端的显示屏幕信息,对所述页面上的文本进行排版,使得所述排版后的文本能够完整的显示在所述客户端的显示屏幕上,获得所述页面的原始图片。权 利 要 求 书CN 103425699。

11、 A3/3页412.根据权利要求10或11所述的服务器端,其特征在于,缩略图生成单元包括:切割子单元,用于判断所述页面的缩略图的内存大小是否超过预设值,如果是,则根据所述客户端的显示屏幕信息对所述缩略图进行切割处理,以减少所述缩略图的内存大小。13.一种客户端,其特征在于,所述客户端包括:发送模块,用于向服务器端发送统一资源定位符URL请求;接收模块,用于接收所述服务器端返回的所述URL对应的页面的缩略图、所述URL对应的页面的二进制渲染数据和所述URL对应的页面的图片数据;页面绘制模块,用于根据所述URL对应的页面的缩略图、所述URL对应的页面的二进制渲染数据和所述URL对应的页面的图片数据。

12、,对所述URL对应的页面进行绘制,以实现对所述页面的浏览。14.根据权利要求13所述的客户端,其特征在于,所述页面绘制模块,包括:输出单元,用于输出所述URL对应的页面的缩略图;获取单元,用于当定位所述缩略图中的指定区域时,获取所述URL对应的页面的二进制渲染数据中与所述指定区域对应的二进制渲染数据;绘制单元,用于根据与所述指定区域对应的二进制渲染数据和所述URL对应的页面的图片数据对所述指定区域进行绘制。15.一种获取网页的系统,其特征在于,所述系统包括:如权利要求8-12任一项所述的服务器端和如权利要求13-14任一项所述的客户端。权 利 要 求 书CN 103425699 A1/11页5。

13、获取网页的方法、 设备和系统技术领域0001 本发明涉及通信技术领域,特别涉及一种获取网页的方法、设备和系统。背景技术0002 随着3G技术的推广、以及移动电话价格和入网费用的降低,人们对于手机上网的需求,逐渐的从访问简单以文本为主的Wap网页,转向了直接访问互联网WWW网页,以获取更加丰富的内容。但是由于中低端平台手机的能力限制,对WWW网页的处理能力还不够,所以怎样才能使WWW网页显示在中低端平台的手机上是现有技术需要解决的问题。0003 现有技术中,在手机直接访问互联网上的WWW网页时,服务器端对WWW网页做一些转换过滤处理,例如对网页的标签及CSS(Cascading Style Sh。

14、eet,级联样式表)过滤转换处理等,使得处理后的WWW网页能够在手机上显示,服务器端再将转换处理过的WWW网页返回给手机端,手机进行显示。0004 在实现本发明的过程中,发明人发现现有技术至少存在以下问题:0005 现有技术中,服务器端为了使WWW网页能够在手机上显示,对WWW网页的标签和CSS做了过滤处理转换,这样虽然能够达到在手机上显示WWW网页的目的,但是过滤转换后的页面显示效果会与在PC上显示的效果差别很多,降低了用户在使用手机浏览WWW网页时的体验感。发明内容0006 为了解决现有技术中WWW网页在手机上的显示效果差的问题,本发明实施例提供了一种获取网页的方法、设备和系统。所述技术方。

15、案如下:0007 一方面,提供了一种获取网页的方法,所述方法包括:0008 接收客户端的统一资源定位符URL请求,获取所述URL请求对应的页面,其中,所述URL请求中包括所述客户端的显示屏幕信息和所述客户端能够显示的图片参数的信息;0009 根据所述客户端的显示屏幕信息对所述页面进行预处理,得到所述页面的二进制网页渲染数据和所述页面的缩略图,其中,所述二进制网页渲染数据和所述缩略图中的指定的区域一一对应;0010 根据所述客户端能够显示的图片参数的信息对所述页面上的图片进行转换和压缩,得到所述页面的图片数据;0011 将所述页面的缩略图、所述页面的二进制网页渲染数据和所述页面的图片数据返回给所。

16、述客户端,使所述客户端根据所述页面的缩略图、所述页面的二进制网页渲染数据和所述页面的图片数据对所述页面进行绘制,以实现对所述页面的浏览。0012 所述获取所述URL请求对应的页面,包括:0013 获取所述URL请求对应的原始网页;0014 对所述原始网页进行解析,获取并存储所述原始网页中图片标签对应的图片信息,并执行所述原始网页包含的Javascript,得到所述解析后的所述URL对应的页面。说 明 书CN 103425699 A2/11页60015 所述根据所述客户端的显示屏幕信息对所述页面进行预处理,得到所述页面的二进制渲染数据和所述页面的缩略图,包括:0016 对所述页面进行渲染,获得所。

17、述页面的渲染数据和所述页面的原始图片;0017 将所述页面的渲染数据通过序列化转换为二进制数据,得到所述页面的二进制渲染数据;0018 根据所述客户端的显示屏幕信息,将所述页面的原始图片调整到所述客户端的显示屏幕能够显示的比例,得到所述页面的缩略图;0019 将所述页面的二进制渲染数据和所述缩略图中的指定的区域进行映射,使所述渲染数据和所述缩略图中的指定的区域一一对应。0020 所述对所述页面进行渲染,获得所述页面的原始图片,包括:0021 根据所述客户端的显示屏幕信息,对所述页面上的文本进行排版,使得所述排版后的文本能够完整的显示在所述客户端的显示屏幕上,获得所述页面的原始图片。0022 根。

18、据所述客户端的显示屏幕信息,将所述页面的原始图片调整到所述客户端的显示屏幕能够显示的比例,得到所述页面的缩略图之后,还包括:0023 判断所述页面的缩略图的内存大小是否超过预设值,如果是,则根据所述客户端的显示屏幕信息对所述缩略图进行切割处理,以减少所述缩略图的内存大小。0024 另一方面,提供了一种获取网页的方法,所述方法包括:0025 向服务器端发送统一资源定位符URL请求;0026 接收所述服务器端返回的所述URL对应的页面的缩略图、所述URL对应的页面的二进制渲染数据和所述URL对应的页面的图片数据;0027 根据所述URL对应的页面的缩略图、所述URL对应的页面的二进制渲染数据和所述。

19、URL对应的页面的图片数据,对所述URL对应的页面进行绘制,以实现对所述页面的浏览。0028 所述根据所述URL对应的页面的缩略图、所述URL对应的页面的二进制渲染数据和所述URL对应的页面的图片数据,对所述URL对应的页面进行绘制,包括:0029 输出所述URL对应的页面的缩略图;0030 当定位所述缩略图中的指定区域时,获取所述URL对应的页面的二进制渲染数据中与所述指定区域对应的二进制渲染数据;0031 根据与所述指定区域对应的二进制渲染数据和所述URL对应的页面的图片数据对所述指定区域进行绘制。0032 另一方面,还提供了一种服务器端,所述服务器端包括:0033 页面抓取模块,用于接收。

20、客户端的统一资源定位符URL请求,获取所述URL请求对应的页面,其中,所述URL请求中包括所述客户端的显示屏幕信息和所述客户端能够显示的图片参数的信息;0034 预处理模块,用于根据所述客户端的显示屏幕信息对所述页面进行预处理,得到所述页面的二进制网页渲染数据和所述页面的缩略图,其中,所述二进制网页渲染数据和所述缩略图中的指定的区域一一对应;0035 图片处理模块,用于根据所述客户端能够显示的图片参数的信息对所述页面上的图片进行转换和压缩,得到所述页面的图片数据;说 明 书CN 103425699 A3/11页70036 发送模块,用于将所述页面的缩略图、所述页面的二进制网页渲染数据和所述页面。

21、的图片数据返回给所述客户端,使所述客户端根据所述页面的缩略图、所述页面的二进制网页渲染数据和所述页面的图片数据对所述页面进行绘制,以实现对所述页面的浏览。0037 所述页面抓取模块,包括:0038 获取单元,用于获取所述URL请求对应的原始网页;0039 解析单元,用于对所述原始网页进行解析,获取并存储所述原始网页中图片标签对应的图片信息,并执行所述原始网页包含的Javascript,得到所述解析后的所述URL对应的页面。0040 所述预处理模块,包括:0041 渲染单元,用于对所述页面进行渲染,获得所述页面的渲染数据和所述页面的原始图片;0042 序列化单元,用于将所述页面的渲染数据通过序列。

22、化转换为二进制数据,得到所述页面的二进制渲染数据;0043 缩略图生成单元,用于根据所述客户端的显示屏幕信息,将所述页面的原始图片调整到所述客户端的显示屏幕能够显示的比例,得到所述页面的缩略图;0044 映射单元,用于将所述页面的二进制渲染数据和所述缩略图中的指定的区域进行映射,使所述渲染数据和所述缩略图中的指定的区域一一对应。0045 所述渲染单元,包括:0046 原始图片生成子单元,用于根据所述客户端的显示屏幕信息,对所述页面上的文本进行排版,使得所述排版后的文本能够完整的显示在所述客户端的显示屏幕上,获得所述页面的原始图片。0047 缩略图生成单元包括:0048 切割子单元,用于判断所述。

23、页面的缩略图的内存大小是否超过预设值,如果是,则根据所述客户端的显示屏幕信息对所述缩略图进行切割处理,以减少所述缩略图的内存大小。0049 另一方面,还提供了一种客户端,所述客户端包括:0050 发送模块,用于向服务器端发送统一资源定位符URL请求;0051 接收模块,用于接收所述服务器端返回的所述URL对应的页面的缩略图、所述URL对应的页面的二进制渲染数据和所述URL对应的页面的图片数据;0052 页面绘制模块,用于根据所述URL对应的页面的缩略图、所述URL对应的页面的二进制渲染数据和所述URL对应的页面的图片数据,对所述URL对应的页面进行绘制,以实现对所述页面的浏览。0053 所述页。

24、面绘制模块,包括:0054 输出单元,用于输出所述URL对应的页面的缩略图;0055 获取单元,用于当定位所述缩略图中的指定区域时,获取所述URL对应的页面的二进制渲染数据中与所述指定区域对应的二进制渲染数据;0056 绘制单元,用于根据与所述指定区域对应的二进制渲染数据和所述URL对应的页面的图片数据对所述指定区域进行绘制。0057 另一方面,还提供了一种获取网页的系统,所述系统包括:如上所述的服务器端和说 明 书CN 103425699 A4/11页8如上所述的客户端。0058 本发明实施例提供的技术方案带来的有益效果是:将页面分解成缩略图、二进制渲染数据和图片数据,使客户端根据缩略图、二。

25、进制渲染数据和图片数据进行绘制,不需要对WWW的网页进行CSS样式过滤和标签的转换操作,可以大大提高CSS样式支持和标签支持,提供了更好的页面渲染效果,让用户舒适的阅读大页面,大大提高用户了的体验度。附图说明0059 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。0060 图1是本发明实施例1中提供的一种获取网页的方法的流程图;0061 图2是本发明实施例2中提供的一种获取网页的方法的流程图;0062 图3。

26、是本发明实施例3中提供的一种获取网页的方法的流程图;0063 图4是本发明实施例4中提供的一种服务器端的示意图;0064 图5是本发明实施例4中提供的另一种服务器端的示意图;0065 图6是本发明实施例5中提供的一种客户端的示意图;0066 图7是本发明实施例5中提供的另一种客户端的示意图;0067 图8是本发明实施例6中提供的一种获取网页的系统的示意图。具体实施方式0068 为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。0069 实施例10070 参见图1,本实施例中提供了一种获取网页的方法,所述方法包括:0071 101、接收客户端的URL(U。

27、niform/Universal Resource Locator,统一资源定位符)请求,获取所述URL请求对应的页面,其中,所述URL请求中包括所述客户端的显示屏幕信息和所述客户端能够显示的图片参数的信息;0072 102、根据所述客户端的显示屏幕信息对所述页面进行预处理,得到所述页面的二进制网页渲染数据和所述页面的缩略图,其中,所述二进制网页渲染数据和所述缩略图中的指定的区域一一对应;0073 103、根据所述客户端能够显示的图片参数的信息对所述页面上的图片进行转换和压缩,得到所述页面的图片数据;0074 104、将所述页面的缩略图、所述页面的二进制网页渲染数据和所述页面的图片数据返回给所。

28、述客户端,使所述客户端根据所述页面的缩略图、所述页面的二进制网页渲染数据和所述页面的图片数据对所述页面进行绘制,以实现对所述页面的浏览。0075 本实施例的有益效果是:将页面分解成缩略图、二进制渲染数据和图片数据,使客户端根据缩略图、二进制渲染数据和图片数据进行绘制,不需要对WWW的网页进行CSS样式过滤和标签的转换操作,可以大大提高CSS样式支持和标签支持,提供了更好的页面渲染说 明 书CN 103425699 A5/11页9效果,让用户舒适的阅读大页面,大大提高用户了的体验度。0076 实施例20077 参见图2,本实施例中提供了一种获取网页的方法,所述方法包括:0078 201、向服务器。

29、端发送URL请求;0079 202、接收所述服务器端返回的所述URL对应的页面的缩略图、所述URL对应的页面的二进制渲染数据和所述URL对应的页面的图片数据;0080 203、根据所述URL对应的页面的缩略图、所述URL对应的页面的二进制渲染数据和所述URL对应的页面的图片数据,对所述URL对应的页面进行绘制,以实现对所述页面的浏览。0081 本实施例的有益效果是:服务器端将页面分解成缩略图、二进制渲染数据和图片数据,使客户端根据缩略图、二进制渲染数据和图片数据进行绘制,不需要对WWW的网页进行CSS样式过滤和标签的转换操作,可以大大提高CSS样式支持和标签支持,提供了更好的页面渲染效果,让用。

30、户舒适的阅读大页面,大大提高用户了的体验度。0082 实施例30083 参见图3,本实施例中提供了一种获取网页的方法,包括:0084 301、客户端向服务器端发起URL请求。0085 本实施例中,客户端包括便捷式移动终端,如手机等,对此本实施例不做具体限定,本步骤中,客户端向互联网发起URL请求,请求访问WWW网页。0086 本步骤中,客户端在向服务器端发起URL请求时,同时会将本地的中能力信息发送给服务器,使得服务器端能够根据客户端的能力信息对页面进行相应的处理。其中客户端的能力信息包括但不限于:客户端的显示屏幕信息、所述客户端能够显示的图片参数的信息和客户端所能支持的网页等。0087 30。

31、2、服务器端接收到客户端的URL请求后,获取该URL对应的页面。0088 本步骤中,服务器端接收到客户端的URL请求后,抓取该URL对应的原始网页的资源,并对原始网页进行进一步解析,以获得URL对应的页面。其中,原始网页的资源包括:Javascript,CSS(Cascading Style Sheet,级联样式表),图片等资源。0089 本步骤中,获得URL对应的页面包括:获取所述URL请求对应的原始网页;对所述原始网页进行解析,获取并存储所述原始网页中图片标签对应的图片信息,并执行所述原始网页包含的Javascript,得到所述解析后的URL对应的页面。0090 可选地,本步骤中,如果客户。

32、端不支持WWW页面的浏览,则需要将该页面转换为客户端能够支持的页面,如客户端支持wap2.0网页,则在对原始网页资源进行解析得到URL对应的页面后,还需要将该页面进一步转换为wap2.0网页。如果客户端支持WWW页面的浏览则不需要对WWW页面进行转换,对此本实施例不做具体限定。0091 303、服务器端根据所述客户端的显示屏幕信息对所述页面进行渲染,得到所述页面的渲染数据和所述页面的缩略图。0092 本步骤中,对获得的URL页面进行预处理,其中根据所述客户端的显示屏幕信息对所述页面进行预处理,得到所述页面的二进制渲染数据和所述页面的缩略图,包括:0093 1)对所述页面进行渲染,获得所述页面的。

33、渲染数据和所述页面的原始图片;0094 本步骤中将页面解析成DOM树,再进一步对DOM树进行渲染,形成渲染树,得到页说 明 书CN 103425699 A6/11页10面的渲染数据。其中对页面进行渲染现有技术中有多种方法,本实施例中对此不再赘述。0095 本步骤中,为了使用户获得良好的体验感,在对页面进行渲染时,同时根据页面生成一张原始图片,其中将页面生成图片的技术与现有技术类似,本实施例不再赘述。值的说明的是,为了避免客户端用户在浏览超过一个屏幕宽度的文本的时候进行左右滚动操作,在渲染过程中服务器端会根据客户端上报的显示屏幕信息对超过一个屏幕的文本进行文字适合屏幕排版,其中,对所述页面进行渲。

34、染,获得所述页面的原始图片,包括:根据所述客户端的显示屏幕信息,对所述页面上的文本进行排版,使得所述排版后的文本能够完整的显示在所述客户端的显示屏幕上,获得所述页面的原始图片。其中排版包括行间距的调整或是字体的调整等,对此本实施例不做具体限定。0096 2)将所述页面的渲染数据通过序列化转换为二进制数据,得到所述页面的二进制渲染数据;0097 本步骤中,将所述页面的渲染数据通过序列化转换为二进制数据,得到所述页面的二进制渲染数据,具体包括:0098 a)从渲染树上获取发送了URL请求的客户端所需要的Render对象。0099 本实施例中,获取客户端需要渲染的对象。客户端需要的渲染对象为:Ren。

35、derText对象、RenderImage对象、至少一个控件Render对象、以及与发送了URL请求的客户端逻辑相关的Render对象;或者,所有渲染后的页面中的数据。0100 其中,与客户端逻辑相关的渲染对象具体可为RenderView对象(用于存放文档页面大小、HTML Head标签元素等),RenderBlock对象(Form表单元素)等。0101 通过获取客户端所需要的渲染对象,能够过滤掉其他一些不必要的Render对象,这可在后续发送Render对象时节省流量。0102 b)针对获取的每一Render对象,获取该Render对象的渲染信息,以及在所述DOM树上获取该Render对象对。

36、应的DOM元素和该DOM元素的属性。0103 通常,Render对象至少对应一个DOM元素。0104 其中,Render对象的渲染信息主要为客户端在执行绘制操作时用到的样式信息,具体可包括:Render对象在屏幕上的坐标值和宽高,颜色等。0105 DOM元素和该DOM元素的属性具体定义可与现有技术中的定义类似,这里不再赘述。0106 本实施例中,获取Render对象的渲染信息,以及在所述DOM树上获取该Render对象对应的DOM元素和该DOM元素的属性,主要目的是为了绘制操作。以Render对象的渲染信息包含Render对象在屏幕上的坐标值、宽高和颜色,DOM元素的标签是标签,属性为href=http:/为例,则当手机在得到该渲染信息、DOM元素和该DOM元素的属性时,可以根据位置,颜色和文本等信息进行绘制,根据其标签属性为点击该元素时进行的响应操作,并根据属性href=http:/获知跳转的网页。0107 c)将获取的渲染信息、DOM元素和该DOM元素的属性进行二进制编码,得到页面的二进渲染数据。0108 其中可按表1所示的Tag-Length-Value(TLV)编码格式对渲染信息、DOM元素和该DOM元素的属性进行二进制编码。0109 表1说 明 书CN 103425699 A10。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1