《基于多线程异步下载页面的多服务器同步方法.pdf》由会员分享,可在线阅读,更多相关《基于多线程异步下载页面的多服务器同步方法.pdf(9页珍藏版)》请在专利查询网上搜索。
1、10申请公布号CN104219271A43申请公布日20141217CN104219271A21申请号201310220524722申请日20130605H04L29/08200601G06F9/5220060171申请人北京齐尔布莱特科技有限公司地址100080北京市海淀区丹棱街3号B座10层1010室72发明人夏乃琛74专利代理机构北京市盛峰律师事务所11337代理人赵建刚54发明名称基于多线程异步下载页面的多服务器同步方法57摘要本发明提供一种基于多线程异步下载页面的多服务器同步方法,包括以下步骤基于线程创建规则创建多个下载线程;定义各个下载线程与有效页面地址的对应关系;各个下载线程通过。
2、与自身对应的有效页面地址,读取到有效页面,然后异步下载所述有效页面;各个所述下载线程通过读取配置文件,获得与有效页面地址对应的同步服务器IP和路径;各个下载线程将有效页面同步到同步服务器IP和路径所表示的同步服务器上;当任意一个下载线程执行结束时,下载线程申请处理下一个有效页面,直到没有需要处理的有效页面时,注销下载线程。在保证用户访问网站速度的同时,还能够保证各台WEB服务器的同步,从而提高了用户的访问体验。51INTCL权利要求书2页说明书5页附图1页19中华人民共和国国家知识产权局12发明专利申请权利要求书2页说明书5页附图1页10申请公布号CN104219271ACN104219271。
3、A1/2页21一种基于多线程异步下载页面的多服务器同步方法,其特征在于,包括以下步骤S1,接收配置文件的存储位置信息;S2,根据接收到的所述存储位置信息,读取所述配置文件;其中,所述配置文件已存储由一个以上需要下载的原始页面地址组成的原始页面地址列表,还存储与每个所述原始页面地址对应的一个以上同步服务器IP和路径;S3,对读取到的所述配置文件进行预处理,得到处理后的新配置文件;其中,所述新配置文件中存储由一个以上需要下载的有效页面地址组成的有效页面地址列表,还存储与每个所述有效页面地址对应的一个以上同步服务器IP和路径;S4,计算所述有效页面地址列表中存储的有效页面地址数量,然后基于线程创建规。
4、则创建多个下载线程;S5,定义各个所述下载线程与所述有效页面地址的对应关系;S6,各个所述下载线程通过与自身对应的有效页面地址,读取到有效页面,然后异步下载所述有效页面;S7,各个所述下载线程通过读取所述配置文件,获得与所述有效页面地址对应的同步服务器IP和路径;S8,各个所述下载线程将S6得到的所述有效页面同步到S7获得的同步服务器IP和路径所表示的同步服务器上;当任意一个所述下载线程执行S8结束时,所述下载线程申请处理下一个有效页面,直到没有需要处理的有效页面时,注销所述下载线程。2根据权利要求1所述的基于多线程异步下载页面的多服务器同步方法,其特征在于,S3中,对读取到的所述配置文件进行。
5、预处理,具体为对读取到的所述配置文件进行过滤操作。3根据权利要求2所述的基于多线程异步下载页面的多服务器同步方法,其特征在于,对读取到的所述配置文件进行过滤操作,具体为判断各个所述原始页面地址是否为合法的地址链接,如果存在不合法的地址链接,则删除所述不合法的地址链接;和/或判断所述配置文件中是否存在说明性文字;如果存在,则删除所述说明性文字;和/或判断所述配置文件中是否存在相同的原始页面地址与同步服务器IP和路径对应关系;如果存在,则删除重复的所述原始页面地址与同步服务器IP和路径对应关系。4根据权利要求1所述的基于多线程异步下载页面的多服务器同步方法,其特征在于,S6中,指定下载线程异步下载。
6、指定有效页面具体为所述指定下载线程向指定页面服务器发送下载请求消息;然后判断是否在预定时间间隔内收到所述指定页面服务器返回的下载响应消息,如果收到,则继续后续流程;如果没有收到,则注销所述指定下载线程。5根据权利要求1所述的基于多线程异步下载页面的多服务器同步方法,其特征在于,S8中,特定下载线程将特定有效页面同步到特定同步服务器上,具体为在前一时刻,所述特定下载线程下载所述特定有效页面地址所代表的有效页面P1;然后将所述有效页面P1以文件名X保存到所述特定同步服务器上;在当前时刻,所述特定下载线程下载所述特定有效页面地址所代表的有效页面P2;然权利要求书CN104219271A2/2页3后,。
7、首先将所述有效页面P2以文件名Y写入所述特定同步服务器上;再用所述有效页面P2替换所述有效页面P1;其中,文件名X与文件名Y不相同。6根据权利要求1所述的基于多线程异步下载页面的多服务器同步方法,其特征在于,S8,特定下载线程将特定有效页面同步到特定同步服务器上,具体为所述特定下载线程首先判断所述特定有效页面是否为只读属性;如果是,则将所述特定有效页面的只读属性改为非只读属性之后,再将非只读属性的所述特定有效页面同步到特定同步服务器上。权利要求书CN104219271A1/5页4基于多线程异步下载页面的多服务器同步方法技术领域0001本发明属于通信技术领域,具体涉及一种基于多线程异步下载页面的。
8、多服务器同步方法。背景技术0002随着IT的快速发展,网站发展迅速,网站访问量呈指数性增长,由此导致单一服务器无法承担巨大的访问量,从而导致网站访问速度降低。因此,为提高网站的访问速度,现有技术中,通常采用一个网站架设多台WEB服务器,并且,在每一台WEB服务器上运行定时静态化页面程序,通过定时静态化页面程序,将重点页面静态化,然后在每一台WEB服务器上保存静态化页面。0003上述方式存在的主要问题为由于各台WEB服务器的时间存在不一致性现象,因此,各台WEB服务器所生成的静态化页面存在页面生成时间偏差,例如在同一时刻,WEB服务器A的当前设置时间为900,而WEB服务器B的当前设置时间为90。
9、8;此时,WEB服务器A静态化900时的页面A,得到900时的页面A;而WEB服务器B静态化908时的页面A,得到908时的页面A;而900时的页面A和908时的页面A不相同。因此,在同一时刻,如果用户A和用户B同时访问该网站,则存在用户A和用户B访问到不同页面的情况,从而降低了用户的访问体验。发明内容0004针对现有技术存在的缺陷,本发明提供一种基于多线程异步下载页面的多服务器同步方法,在保证用户访问网站速度的同时,还能够保证各台WEB服务器的同步,从而提高了用户的访问体验。0005本发明采用的技术方案如下0006本发明提供一种基于多线程异步下载页面的多服务器同步方法,包括以下步骤0007S。
10、1,接收配置文件的存储位置信息;0008S2,根据接收到的所述存储位置信息,读取所述配置文件;其中,所述配置文件已存储由一个以上需要下载的原始页面地址组成的原始页面地址列表,还存储与每个所述原始页面地址对应的一个以上同步服务器IP和路径;0009S3,对读取到的所述配置文件进行预处理,得到处理后的新配置文件;其中,所述新配置文件中存储由一个以上需要下载的有效页面地址组成的有效页面地址列表,还存储与每个所述有效页面地址对应的一个以上同步服务器IP和路径;0010S4,计算所述有效页面地址列表中存储的有效页面地址数量,然后基于线程创建规则创建多个下载线程;0011S5,定义各个所述下载线程与所述有。
11、效页面地址的对应关系;0012S6,各个所述下载线程通过与自身对应的有效页面地址,读取到有效页面,然后异步下载所述有效页面;说明书CN104219271A2/5页50013S7,各个所述下载线程通过读取所述配置文件,获得与所述有效页面地址对应的同步服务器IP和路径;0014S8,各个所述下载线程将S6得到的所述有效页面同步到S7获得的同步服务器IP和路径所表示的同步服务器上;0015当任意一个所述下载线程执行S8结束时,所述下载线程申请处理下一个有效页面,直到没有需要处理的有效页面时,注销所述下载线程。0016优选的,S3中,对读取到的所述配置文件进行预处理,具体为0017对读取到的所述配置文。
12、件进行过滤操作。0018优选的,对读取到的所述配置文件进行过滤操作,具体为0019判断各个所述原始页面地址是否为合法的地址链接,如果存在不合法的地址链接,则删除所述不合法的地址链接;和/或0020判断所述配置文件中是否存在说明性文字;如果存在,则删除所述说明性文字;和/或0021判断所述配置文件中是否存在相同的原始页面地址与同步服务器IP和路径对应关系;如果存在,则删除重复的所述原始页面地址与同步服务器IP和路径对应关系。0022优选的,S6中,指定下载线程异步下载指定有效页面具体为0023所述指定下载线程向指定页面服务器发送下载请求消息;然后判断是否在预定时间间隔内收到所述指定页面服务器返回。
13、的下载响应消息,如果收到,则继续后续流程;如果没有收到,则注销所述指定下载线程。0024优选的,S8中,特定下载线程将特定有效页面同步到特定同步服务器上,具体为0025在前一时刻,所述特定下载线程下载所述特定有效页面地址所代表的有效页面P1;然后将所述有效页面P1以文件名X保存到所述特定同步服务器上;0026在当前时刻,所述特定下载线程下载所述特定有效页面地址所代表的有效页面P2;然后,首先将所述有效页面P2以文件名Y写入所述特定同步服务器上;再用所述有效页面P2替换所述有效页面P1;其中,文件名X与文件名Y不相同。0027优选的,S8,特定下载线程将特定有效页面同步到特定同步服务器上,具体为。
14、0028所述特定下载线程首先判断所述特定有效页面是否为只读属性;如果是,则将所述特定有效页面的只读属性改为非只读属性之后,再将非只读属性的所述特定有效页面同步到特定同步服务器上。0029本发明的有益效果如下0030本发明提供的基于多线程异步下载页面的多服务器同步方法,在保证用户访问网站速度的同时,还能够保证各台WEB服务器的同步,从而提高了用户的访问体验。附图说明0031图1为本发明提供的基于多线程异步下载页面的多服务器同步方法的流程示意图。具体实施方式0032以下结合附图对本发明进行详细说明说明书CN104219271A3/5页60033如图1所示,本发明提供一种基于多线程异步下载页面的多服。
15、务器同步方法,包括以下步骤0034S1,接收配置文件的存储位置信息;0035S2,根据接收到的所述存储位置信息,读取所述配置文件;其中,所述配置文件已存储由一个以上需要下载的原始页面地址组成的原始页面地址列表,还存储与每个所述原始页面地址对应的一个以上同步服务器IP和路径;0036例如原始页面地址可以为页面URL地址。配置文件可以为TXT文件,每一行为一个配置,页面URL地址和需要同步的同步服务器IP和路径之间用空格分割,各个同步服务器IP和路径用英文逗号分割。如0037HTTP/MAUTOHOMECOMCN/ASHX/BAIDU/BOOKLISTASHXCOUNT200101680120DM。
16、AUTOHOMECOMCNINCLUDEFILEBAIDUDEALERDATALISTXML,101680166DMAUTOHOMECOMCNINCLUDEFILEBAIDUDEALERDATALISTXML0038其中,HTTP/MAUTOHOMECOMCN/ASHX/BAIDU/BOOKLISTASHXCOUNT200为页面URL地址;101680120DMAUTOHOMECOMCNINCLUDEFILEBAIDUDEALERDATALISTXML为一个需要同步的服务器绝对路径;101680166DMAUTOHOMECOMCNINCLUDEFILEBAIDUDEALERDATALISTXM。
17、L为另一个需要同步的服务器绝对路径。0039S3,对读取到的所述配置文件进行预处理,得到处理后的新配置文件;其中,所述新配置文件中存储由一个以上需要下载的有效页面地址组成的有效页面地址列表,还存储与每个所述有效页面地址对应的一个以上同步服务器IP和路径;具体的,本发明中,有效页面地址和同步服务器IP和路径为一对多关系。0040实际应用中,可以利用NET内部对象STREAMREADER读取配置文件内容,然后将读取到的配置文件放入固定容器中,对配置文件进行过滤和去重操作。0041其中,过滤操作具体包括以下两种方式1判断各个原始页面地址是否为合法的地址链接,如果存在不合法的地址链接,则删除不合法的地。
18、址链接。2判断配置文件中是否存在说明性文字;如果存在,则删除说明性文字。0042去重操作具体包括以下方式判断配置文件中是否存在相同的原始页面地址与同步服务器IP和路径对应关系;如果存在,则删除重复的原始页面地址与同步服务器IP和路径对应关系。0043对于去重操作,具体还包括两种方式1原始页面地址与同步服务器IP和路径完全相同。例如配置文件记载以下两条对应关系一、页面地址HTTP/AUTOHOMECOMCN对应同步服务器1、同步服务器2和同步服务器3;二、页面地址HTTP/AUTOHOMECOMCN对应同步服务器1、同步服务器2和同步服务器3。则这两条对应关系完全相同,需要删除其中任意一条对应关。
19、系。2相同的原始页面地址对应部分相同的同步服务器IP和路径。例如配置文件记载以下两条对应关系对应1页面地址HTTP/AUTOHOMECOMCN对应同步服务器1、同步服务器2和同步服务器3;对应2页面地址HTTP/AUTOHOMECOMCN对应同步服务器2、同步服务器3和同步服务器4。由于存在相同的以下对应关系页面地址HTTP/AUTOHOMECOMCN对应同步服务器2和同步服务器3。所以,需要删除对应1或对应2中的同步服务器2和同步服务器3。0044通过上述对配置文件的预处理,可以简化后续异步下载和同步时的工作复杂度,说明书CN104219271A4/5页7简化异步下载和同步的步骤,提高异步下。
20、载和同步的效率。0045S4,计算所述有效页面地址列表中存储的有效页面地址数量,然后基于线程创建规则创建多个下载线程。本步骤中,线程创建规则可以为设置最大线程创建数,如果最大线程创建数大于有效页面地址数量,例如最大线程创建数为20个,有效页面地址数量为15个,则创建与有效页面地址数量相同的下载线程,即,需要创建15个下载线程,一个下载线程处理一个有效页面。如果最大线程创建数小于有效页面地址数量,例如最大线程创建数为15个,有效页面地址数量为20个,则创建与最大线程创建数相同的下载线程,即需要创建15个下载线程,通过15个下载线程分别处理15个有效页面,当某个下载线程处理完成一个有效页面时,再申。
21、请处理尚未处理的有效页面,直到没有需要处理的有效页面时,则注销下载线程;当所有下载线程均被注销时,整个进程结束。0046S5,定义各个所述下载线程与所述有效页面地址的对应关系;0047S6,各个所述下载线程通过与自身对应的有效页面地址,读取到有效页面,然后异步下载所述有效页面。例如如果需要下载3个有效页面,则同时开启3个下载线程,通过多线程下载页面,可以有效提高下载效率。0048本步骤中,以指定下载线程异步下载指定有效页面为例,包括指定下载线程向指定页面服务器发送下载请求消息;然后判断是否在预定时间间隔内收到所述指定页面服务器返回的下载响应消息,如果收到,则继续后续流程;如果没有收到,则携测指。
22、定页面服务器有可能发生故障,因此注销所述指定下载线程,释放资源。0049S7,各个所述下载线程通过读取所述配置文件,获得与所述有效页面地址对应的同步服务器IP和路径;0050S8,各个所述下载线程将S6得到的所述有效页面同步到S7获得的同步服务器IP和路径所表示的同步服务器上。当任意一个所述下载线程执行S8结束时,所述下载线程申请处理下一个有效页面,直到没有需要处理的有效页面时,注销所述下载线程。0051本步骤中,以特定下载线程将特定有效页面同步到特定同步服务器上为例,包括以下步骤0052由于在不同时刻,同一个页面地址所包含的页面内容可能存在不同,例如页面进行了更新操作等。因此,需要按照一定的。
23、频率,刷新特定同步服务器。下面介绍的流程即为一个刷新过程。0053在前一时刻,所述特定下载线程下载所述特定有效页面地址所代表的有效页面P1;然后将所述有效页面P1以文件名X保存到所述特定同步服务器上;0054在当前时刻,特定下载线程下载所述特定有效页面地址所代表的有效页面P2;然后,首先将所述有效页面P2以文件名Y写入所述特定同步服务器上,其中,文件名X与文件名Y不相同;再用文件Y替换文件X。由于文件写入的速度较慢,而文件替换的速度非常快,所以,本发明中,采用先写入再替换的方式更新页面,可以保证在不影响页面正常观看的前提下进行页面更新。0055综上所述,本发明提供的基于多线程异步下载页面的多服务器同步方法,首先通过多线程异步下载各个页面,然后再将下载得到的页面同步到各个服务器上,从而在保证用户访问网站速度的同时,还能够保证各台WEB服务器的同步,提高了用户的访问体验。0056以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人说明书CN104219271A5/5页8员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。说明书CN104219271A1/1页9图1说明书附图CN104219271A。