一种网页信息处理方法和装置技术领域
本发明涉及浏览器技术领域,特别是涉及一种网页信息处理方法和装
置。
背景技术
随着互联网的普及,互联网提供给人们越来越多的便捷,也为人们提供
各种各样的信息,用户可以通过浏览器浏览网络中各种各样的信息,也可通
过网络与其他用户进行信息交互,比如微博。
在现有技术中,用户从网络中获取信息的方法通常通过网页进行浏览。
但是现有技术中,浏览器是直接将网页中的各种内容进行渲染,然后在用户
的网页界面中进行展示展示,在该种情况下,现有技术无法将用户的个性化
信息在网页中进行展示,不符合用户的个性化需求。
发明内容
本发明所要解决的技术问题是提供一种网页信息处理方法和装置,以解
决现有技术中无法将用户的个性化信息在网页中进行展示,不符合用户的个
性化需求的问题。
为了解决上述问题,本发明公开了一种网页信息处理方法,包括:
向服务器发送网页请求,下载请求的网页信息;
解析所述网页信息对应的文档对象模型树;
查找所述文档对象模型树中各节点的目标文字信息,将所述目标文字信
息替换为用户个性化内容;
将替换后的文档对象模型进行渲染,并输出至对应网页界面中进行展
示。
优选的,所述将目标文字信息替换为用户个性化内容的步骤包括:
依据用户个性化修改映射表,该用户个性化修改映射表包括目标文字信
息与个性化内容的对应关系,与所述目标文字信息进行匹配;
将匹配的用户个性化内容替换所述目标文字信息。
优选的,进一步包括:
用户配置所述用户个性化修改映射表,改变目标文字信息与个性化内容
的对应关系和/或其中的目标文字信息、个性化内容。
优选的,所述个性化内容包括:个性化文字信息和/或个性化图片信息。
优选的,所述查找所述文档对象模型树中各节点的目标文字信息的步骤
包括:
从所述文档对象模型的根节点开始,遍历文档对象模型的各节点,获取
各节点中的目标文字信息。
优选的,所述将替换后的文档对象模型进行渲染的步骤包括:
获取所述目标文字信息在原文档对象模型树中对应的字符类型;
将所述个性化文字信息转换为所述字符类型后,进行渲染展示。
优选的,所述将替换后的文档对象模型进行渲染的步骤包括:
获取所述目标文字信息在原文档对象模型树中对应展示结构中的字体
尺寸;
将所述个性化文字信息的字体尺寸或个性化图片信息的图片尺寸调整
为所述目标文字信息的字体尺寸。
优选的,所述查找所述文档对象模型树中各节点的目标文字信息,将所
述目标文字信息替换为用户个性化内容之前还包括:
判断网页请求中的网址信息是否与替换网址库中的网址信息相匹配;
如果匹配,则进行所述将目标文字信息替换为用户个性化内容的操作;
如果不匹配,则不进行将目标文字信息替换为用户个性化内容的操作。
优选的,所述用户个性化修改映射表保存在浏览器侧;
则该方法进一步包括:
根据用户ID,将所述保存在浏览器侧的用户个性化修改映射表上传至云
端服务器进行存储。
优选的,所述用户个性化修改映射表保存在服务器侧;
则该方法进一步包括:
根据用户ID登录所述服务器,将所述保存在服务器的用户个性化修改
映射表同步至浏览器侧。
相应的,本申请还公开了一种网页信息处理装置,包括:
网页信息获取模块,用于向服务器发送网页请求,下载请求的网页信息;
解析模块,用于解析所述网页信息对应的文档对象模型树;
替换模块,用于查找所述文档对象模型树中各节点的目标文字信息,将
所述目标文字信息替换为用户个性化内容;
渲染模块,用于将替换后的文档对象模型进行渲染,并输出至对应网页
界面中进行展示。
优选的,所述替换模块包括:
匹配模块,用于依据用户个性化修改映射表,该用户个性化修改映射表
包括目标文字信息与个性化内容的对应关系,与所述目标文字信息进行匹
配;
第一替换模块,用于将匹配的用户个性化内容替换所述目标文字信息。
优选的,进一步包括:
用户配置模块,用于用户配置所述用户个性化修改映射表,改变目标文
字信息与个性化内容的对应关系和/或其中的目标文字信息、个性化内容。
优选的,所述个性化内容包括:个性化文字信息和/或个性化图片信息。
优选的,,所述替换模块包括:
节点遍历判断模块,用于从所述文档对象模型的根节点开始,遍历文档
对象模型的各节点,获取各节点中的目标文字信息
优选的,所述渲染模块包括:
字符类型获取模块,用于获取所述目标文字信息在原文档对象模型树中
对应的字符类型
第一渲染展示模块,用于将所述个性化文字信息转换为所述字符类型
后,进行渲染展示。
优选的,所述渲染模块包括:
文字尺寸获取模块,用于获取所述目标文字信息在原文档对象模型树中
对应展示结构中的字体尺寸;
第二渲染模块,用于将所述个性化文字信息的字体尺寸或个性化图片信
息的图片尺寸调整为所述目标文字信息的字体尺寸。
优选的,所述替换模块之前还包括:
网址判断模块,用于判断网页请求中的网址信息是否与替换网址库中的
网址信息相匹配;
如果匹配,则进行所述将目标文字信息替换为用户个性化内容的操作;
如果不匹配,则不进行将目标文字信息替换为用户个性化内容的操作。
优选的,所述用户个性化修改映射表保存在浏览器侧;
则还包括:
上传模块,用于根据用户ID,将所述保存在浏览器侧的用户个性化修改
映射表上传至云端服务器进行存储。
优选的,所述用户个性化修改映射表保存在服务器侧;
则进一步包括:
同步模块,用于根据用户ID登录所述服务器,将所述保存在服务器的
用户个性化修改映射表同步至浏览器侧。
与现有技术相比,本发明包括以下优点:
本发明通过截断浏览器对网页信息的文档对象模型树的直接渲染过程,
在查找文件对象模型树中各节点的目标文字信息,将所述目标文字信息替换
为用户个性化内容之后,再对文档对象模型(DOM,Document Object
Model)树进行渲染。如此可将用户的个性化信息在网页中进行展示,可适
应用户的个性化需求。
附图说明
图1是本发明实施例一种网页信息处理方法的流程示意图;
图2是本发明实施例遍历DOM树过程的流程示意图;
图3是本发明实施例一种网页信息处理装置的结构示意图;
图4是本发明一种替换模块实施例一的结构示意图;
图5是本发明一种替换模块实施例二的结构示意图;
图6是本发明一种替换模块实施例三的结构示意图;
图7是本发明一种渲染模块实施例一的结构示意图;
图8是本发明一种渲染模块实施例二的结构示意图;
图9是本发明一种网址判断模块实施例一结构示意图;
图10是本发明的上传和同步模块的实施例一结构示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图
和具体实施方式对本发明作进一步详细的说明。
本发明的核心思想之一在于,在浏览器对网页信息进行传统的处理过程
中,即将得到网页信息对应的DOM树后,直接对DOM树进行渲染这个过
程中,拦截浏览器直接对DOM树的渲染,在通过本发明的装置在DOM树
中将目标文字信息替换为用户个性化内容后再将替换后的DOM树进行渲
染。如此可将用户的个性化信息在网页中进行展示,可适应用户的个性化需
求。
下面通过实施例详细介绍本发明所述一种网页信息处理方法和装置。
参照图1,示出了本发明实施例一种网页信息处理方法的流程示意图,
具体可以包括:
步骤110,向服务器发送网页请求,下载请求的网页信息;
浏览器的主要功能是将用户选择的web资源(即网页信息)呈现出来,
它需要从服务器请求资源,并将其显示在浏览器窗口中,资源的格式通常是
HTML(超文本标记语言,Hypertext Markup Language)。用户用URI(Uniform
Resource Identifier统一资源标识符)来指定所请求资源的位置。即用户在浏
览器地址栏输入URL,浏览器则基于所述URL生成网页请求,发送至URL
对应的服务器,下载资源,即下载请求的网页信息。
步骤120,解析所述网页信息对应的文档对象模型树;
在浏览器下载得到网页信息后,则解析所述网页信息对应的DOM树,
在实际中,DOM树把HTML文档等网页信息呈现为带有元素、属性和
文本的树结构(节点树)。
DOM是一种与平台和语言无关的接口,它允许程序和脚本动态访问
和修改文档的内容、结构和类型。它定义了一系列的对象和方法对DOM
树的节点进行各种随机操作:
●Document对象:作为树的最高节点,Document对象是对整个文
档进行操作的入口。
●Element和Attr对象:这些节点对象都是网页文档某一部分的映
射,节点的定级层次恰好反映了文档的结构。
●Text对象:作为Element和Attr对象的子节点,Text对象表达了
元素或属性的文本内容。Text节点不再包含任何子节点。
DOM树中的所有节点都是从节点对象继承而来的,节点对象定义了
一些最基本的属性和方法,利用这些方法可以实现对树的遍历,同时,
根据属性还可以得知节点的名称、取值并判断其类型。
那么本发明则基于DOM树的解析规则将网页信息,实际中网页信息为
源代码,解析为DOM树。
步骤130,查找所述文档对象模型树中各节点的目标文字信息,将所述
目标文字信息替换为用户个性化内容;
在得到网页信息对应的DOM树后,本步骤则查找DOM树中各节点是
否存在目标文字信息,如果存在,则将所述目标文字信息替换为用户个性化
内容。
而在本发明的步骤110进行之前,用户可配置其个性化内容,个性化内
容可为用户将需要进行替换目标文字信息与个性化内容的对应关系,比如需
要将网页信息中的“飞机”替换为一张飞机图片,那么用户可将文字“飞机”
与本地的飞机图片进行对应,在本发明中用户将目标文字信息与个性化内容
的对应关系可构成一张用户个性化修改映射表。
优选的,所述将目标文字信息替换为用户个性化内容的步骤包括:
步骤A11,依据用户个性化修改映射表,该用户个性化修改映射表包括
目标文字信息与个性化内容的对应关系,与所述目标文字信息进行匹配;
用户个性化修改映射表即前述由用户设置的目标文字信息与待替换的
个性化内容的对应关系。
其中,所述个性化内容包括:个性化文字信息和/或个性化图片信息。
即用户可根据需求选择将目标文字信息替换为自己需求的个性化文字
信息或个性化图片信息,比如对于网页信息中的目标文字信息“女朋友”,
用户可选择将“女朋友”替换为具体人名,或者具体照片。
在本发明中,当用户选择将目标文字信息替换为个性化文字信息时,可
将待替换的个性化文字信息直接保存至个性化修改映射表中与目标文字信
息对应位置。当用户选择将目标文字信息替换为图片信息时,可在用户个性
化修改映射表中与目标文字信息对应的位置保存图片信息的存储路径,在替
换时,本发明实施例可根据路径调用图片进行替换。或者直接将图片信息保
存至用户个性化修改映射表中与目标文字信息对应的位置。
那么本发明在查找所述文档对象模型树中各节点的目标文字信息时,则
依据用户个性化修改映射表,该用户个性化修改映射表包括目标文字信息与
个性化内容的对应关系,与所述目标文字信息进行匹配,如果匹配上,则转
入步骤A12。
步骤A12,将匹配的用户个性化内容替换所述目标文字信息。
比如对于前述的目标文字信息“女朋友”被匹配上,而用户个性化修改
映射表中“女朋友”对应的个性化内容为照片A,那么即可使用照片A替换
所述目标文字信息“女朋友”。
优选的,进一步包括:
步骤A13,用户配置所述用户个性化修改映射表,改变目标文字信息与
个性化内容的对应关系和/或其中的目标文字信息、个性化内容。
如前所述,用户可根据需要配置所述用户个性化修改映射表,比如重新
修改目标文字信息与个性化内容的对应关系,比如将目标文字信息“女朋友”
对应的照片A替换为照片B,或者将对应照片A改为名字。又比如用户可
修改待替换的目标文字信息,比如将目标文字信息“女朋友”删除,比如添
加目标文字信息“汽车”,及对应的个性化内容汽车照片。
在本发明中,优选的,所述查找所述文档对象模型树中各节点的目标文
字信息的步骤包括:
步骤B11,从所述文档对象模型的根节点开始,遍历文档对象模型的各
节点,获取各节点中的目标文字信息。
DOM树是一个树状结构,其信息存储与其中的各个节点中,那么为便
于查找网页信息中的目标文字信息,则可从DOM树的根节点开始历文档对
象模型的各节点,获取各节点中的目标文字信息。
在实际中,遍历时可进行递归遍历,即参照图2,DOM树存在根节点A,
根节点A存在子节点A1,A2;节点A1存在子节点A11,A12;节点A11
存在子节点A111,A112。遍历时,对于一个节点的各子节点,一般可从左
至右子节点进行遍历,比如选择了根节点A的子节点A2,遍历完A2发现
A2不存在子节点,那么返回根节点A,根据根节点A的与子节点的对应关
系遍历子节点A1;然后遍历节点A1的子节点A12,发现A12没有子节点,
返回A1,从A1处遍历子节点A11,以此类推。
在遍历每个节点是,可用个性化修改映射表中的目标文字信息与每个节
点中的文字信息进行匹配,如果匹配上,则进入替换过程。
步骤140,将替换后的文档对象模型进行渲染,并输出至对应网页界面
中进行展示。
在将DOM树中的目标文字信息进行替换后,再对替换后的DOM树进行渲
染,渲染完毕再输出至对应网页界面中进行展示。
优选的,所述将替换后的文档对象模型进行渲染的步骤包括:
步骤C11,获取所述目标文字信息在原文档对象模型树中对应的字符类
型;
原DOM树中各节点均存在相应的属性,比如字符的字号,字符的字体
等,以在渲染时以其属性进行渲染,然后展示。那么本步骤则获取所述目标
文字信息在原文档对象模型树中对应的字符类型。
步骤C12,将所述个性化文字信息转换为所述字符类型后,进行渲染展
示。
比如目标文字信息“女朋友”在DOM树中的字体为方正姚体,如果“女
朋友”对应的个性化内容为名字时,则将所述名字转换为方正姚体,然后进
行渲染展示。
优选的,所述将替换后的文档对象模型进行渲染的步骤包括:
步骤D11,获取所述目标文字信息在原文档对象模型树中对应展示结构
中的字体尺寸;
原DOM树中各节点均存在的相应属性还包括其对应展示结构中的字体
尺寸,比如所在显示界面中的位置、宽、高等字体尺寸,那么为了不改变原
网页信息的显示结构,那么需要将替换的个性化内容调整为与原字体尺寸相
同的尺寸,以在渲染时不改变DOM树的渲染结果。
在实际中DOM树对应展示结构由相应的CSS样式结构体控制,那么本
实施例可从目标文字信息所在节点对应的CSS样式结构体中的位置,提取相
应的字体尺寸。
步骤D12,将所述个性化文字信息的字体尺寸或个性化图片信息的图片
尺寸调整为所述目标文字信息的字体尺寸。
根据前述所获得的目标文字信息的字体尺寸,将将所述个性化文字信息
的字体尺寸或个性化图片信息的图片尺寸调整为所述目标文字信息的字体
尺寸。可保证渲染得到的结果与原DOM树渲染得到的结果相同,即不改变
原网页信息的显示结构。
另外,所述查找所述文档对象模型树中各节点的目标文字信息,将所述
目标文字信息替换为用户个性化内容之前还包括:
步骤E11,判断网页请求中的网址信息是否与替换网址库中的网址信息
相匹配;
步骤E12,如果匹配,则进行所述将目标文字信息替换为用户个性化内
容的操作;
步骤E13,如果不匹配,则不进行将目标文字信息替换为用户个性化内
容的操作。
在实际中,用户可能选择在哪些网站中显示用户个性化内容,那么用户
可将这些网站的网址添加进入替换网址库中,那么对于用户请求的URL,则
将URL中的网址与替换网址库中的网址进行匹配,如果匹配上,则进行所述
将目标文字信息替换为用户个性化内容的操作;如果不匹配,则不进行将目
标文字信息替换为用户个性化内容的操作。
另外,所述用户个性化修改映射表可保存在浏览器侧;
那么本发明可进一步包括:
步骤F11,根据用户ID,将所述保存在浏览器侧的用户个性化修改映射
表上传至云端服务器进行存储。
在时实际中,浏览器可存在一种账户装置,用户在浏览器登录用户ID,
那么浏览器可与云端服务器进行交互。那么即可根据用户ID,将所述保存
在浏览器侧的用户个性化修改映射表上传至云端服务器进行存储。
那么以后,用户再以用户ID登录时,即可从云端服务器将用户个性化
修改表同步至本地。
即所述用户个性化修改映射表可保存在服务器侧;
那么本发明可进一步包括:
步骤F11,根据用户ID登录所述服务器,将所述保存在服务器的用户
个性化修改映射表同步至浏览器侧。
参照图3,其示出了本发明一种网页信息处理装置,其特征在于,包括:
网页信息获取模块310,用于向服务器发送网页请求,下载请求的网页
信息;
解析模块320,用于解析所述网页信息对应的文档对象模型树;
替换模块330,用于查找所述文档对象模型树中各节点的目标文字信息,
将所述目标文字信息替换为用户个性化内容;
渲染模块340,用于将替换后的文档对象模型进行渲染,并输出至对应
网页界面中进行展示。
优选的,参照图4所述替换模块包括:
匹配模块410,用于依据用户个性化修改映射表,该用户个性化修改映
射表包括目标文字信息与个性化内容的对应关系,与所述目标文字信息进行
匹配;
第一替换模块420,用于将匹配的用户个性化内容替换所述目标文字信
息。
优选的,参照图5,进一步包括:
用户配置模块430,用于用户配置所述用户个性化修改映射表,改变目
标文字信息与个性化内容的对应关系和/或其中的目标文字信息、个性化内
容。
优选的,所述个性化内容包括:个性化文字信息和/或个性化图片信息。
优选的,参照图6,所述替换模块包括:
节点遍历判断模块510,用于从所述文档对象模型的根节点开始,遍历
文档对象模型的各节点,获取各节点中的目标文字信息
优选的,参照图7,所述渲染模块包括:
字符类型获取模块610,用于获取所述目标文字信息在原文档对象模型
树中对应的字符类型
第一渲染展示模块620,用于将所述个性化文字信息转换为所述字符类
型后,进行渲染展示。
优选的,参照图8,所述渲染模块包括:
文字尺寸获取模710,用于获取所述目标文字信息在原文档对象模型树
中对应展示结构中的字体尺寸;
第二渲染模块720,用于将所述个性化文字信息的字体尺寸或个性化图
片信息的图片尺寸调整为所述目标文字信息的字体尺寸。
优选的,参照图9,所述替换模块之前还包括:
网址判断模,810,用于判断网页请求中的网址信息是否与替换网址库中
的网址信息相匹配;
如果匹配820,则进行所述将目标文字信息替换为用户个性化内容的操
作;
如果不匹配830,则不进行将目标文字信息替换为用户个性化内容的操
作。
优选的,参照图10,所述用户个性化修改映射表保存在浏览器侧;
则还包括:
上传模块910,用于根据用户ID,将所述保存在浏览器侧的用户个性化
修改映射表上传至云端服务器进行存储。
优选的,参照图10,所述用户个性化修改映射表保存在服务器侧;
则该进一步包括:
同步模块920,用于根据用户ID登录所述服务器,将所述保存在服务
器的用户个性化修改映射表同步至浏览器侧。
对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动
作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作
顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时
进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于
优选实施例,所涉及的动作和模块并不一定是本发明实施例所必须的。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较
简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明
的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见
即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语
仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求
或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或
计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、
或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个
其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘
存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
上述本发明实施例中的方法、装置适用于各种网络或者客户端环境中,
例如可以实现在诸如个人计算机设备之类的计算机设备中,或者可以实现在
诸如移动电话、移动通信设备、个人数字助理(PDA)等其他便携式电子设
备或者非便携式电子设备中。因此本领域技术人员要明确的是,本发明的保
护范围并不限于PC上运行浏览器中的替换功能,仅是出于描述的简洁和方
便而在本发明实施例中采用了PC上运行浏览器中的替换功能进行描述。
本发明是参照根据本发明实施例的方法、设备(装置)、和计算机程序
产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程
图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流
程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算
机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使
得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实
现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定
的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理
设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储
器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程
或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,
使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现
的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程
图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的
步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了
基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权
利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
以上对本发明所提供的一种网页信息处理方法和装置,进行了详细介
绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实
施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领
域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会
有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。