一种基于主备集群服务器的跨地区服务容灾方法及装置.pdf

上传人:GAME****980 文档编号:4754231 上传时间:2018-11-06 格式:PDF 页数:10 大小:4.86MB
返回 下载 相关 举报
摘要
申请专利号:

CN201210537422.3

申请日:

2012.12.12

公开号:

CN103036719A

公开日:

2013.04.10

当前法律状态:

撤回

有效性:

无权

法律详情:

发明专利申请公布后的视为撤回IPC(主分类):H04L 12/24申请公布日:20130410|||实质审查的生效IPC(主分类):H04L 12/24申请日:20121212|||公开

IPC分类号:

H04L12/24; H04L29/08; H04L12/703(2013.01)I

主分类号:

H04L12/24

申请人:

北京星网锐捷网络技术有限公司

发明人:

蔡昱星

地址:

100036 北京市海淀区复兴路29号中意鹏奥大厦东楼11层

优先权:

专利代理机构:

北京同达信恒知识产权代理有限公司 11291

代理人:

黄志华

PDF下载: PDF下载
内容摘要

本发明公开了一种基于主备集群服务器的跨地区服务容灾方法及装置,该方法包括:基于主备集群服务器的跨地区服务容灾装置与主备集群服务器建立连接后,监控主备集群服务器的运行状态以及链路状态;若确定主备集群服务器、链路均正常,则通知网络设备将接收到的服务请求报文发送至主备集群服务器;若确定主备集群服务器或者链路故障,则通知网络设备将接收到的服务请求报文发送至本地,并根据接收到的主备集群服务器发送的业务数据处理网络设备发送的服务请求报文;确定故障恢复后,将在故障期间自身产生的业务数据发送给主备集群服务器,通知网络设备将接收到的服务请求报文发送至主备集群服务器。该方案可以提高跨地区服务的容灾性。

权利要求书

权利要求书一种基于主备集群服务器的跨地区服务容灾方法,其特征在于,包括:每一从节点地区设置的基于主备集群服务器的跨地区服务容灾装置与主节点地区的所述主备集群服务器建立连接后,以第一设定时间周期监控所述主备集群服务器的运行状态以及与所述主备集群服务器中间的链路状态,并接收所述主备集群服务器以第二设定时间周期发送的业务数据;若确定所述主备集群服务器、所述链路均正常,则通知网络设备将接收到的来自客户端的服务请求报文发送至所述主备集群服务器;若确定所述主备集群服务器或者所述链路故障,则通知所述网络设备将接收到的来自客户端的服务请求报文发送至所述基于主备集群服务器的跨地区服务容灾装置,并根据接收到的所述主备集群服务器发送的业务数据处理所述网络设备发送的服务请求报文;以及确定所述故障恢复后,将在故障期间自身产生的业务数据发送给所述主备集群服务器,并通知所述网络设备将接收到的来自客户端的服务请求报文发送至所述主备集群服务器。如权利要求1所述的方法,其特征在于,基于主备集群服务器的跨地区服务容灾装置与所述主备集群服务器建立连接,具体包括:基于主备集群服务器的跨地区服务容灾装置向所述主备集群服务器发送携带所述主备集群服务器的虚拟集群互联网协议IP地址的连接建立请求报文;并接收所述主备集群服务器发送的携带所述基于主备集群服务器的跨地区服务容灾装置的IP地址的连接建立响应报文。如权利要求1所述的方法,其特征在于,所述第一设定时间周期大于主备服务器切换时间。如权利要求3所述的方法,其特征在于,以第一设定时间周期监控所述主备集群服务器的运行状态、与所述主备集群服务器中间的链路状态,具体包括:以所述第一设定时间周期向所述主备集群服务器发送状态监控请求报文,并监控所述主备集群服务器是否返回状态监控响应报文;或者以所述第一设定时间周期监控是否接收到所述主备集群服务器发送的状态报告报文。如权利要求1所述的方法,其特征在于,确定所述主备集群服务器或者所述链路故障,具体包括:若连续设定次数监控到所述主备集群服务器或者所述链路故障,确定所述主备集群服务器或者所述链路故障。如权利要求1所述的方法,其特征在于,确定所述故障恢复,具体包括:若第一次监控到所述故障恢复,确定所述故障恢复。一种基于主备集群服务器的跨地区服务容灾装置,其特征在于,包括状态检测单元、服务切换单元、基础服务单元和数据备份单元,其中:所述状态检测单元,用于自身所在的基于主备集群服务器的跨地区服务容灾装置与主节点地区的所述主备集群服务器建立连接后,以第一设定时间周期监控所述主备集群服务器的运行状态以及与所述主备集群服务器中间的链路状态;若确定所述主备集群服务器、所述链路均正常,则通知网络设备将接收到的来自客户端的服务请求报文发送至所述主备集群服务器;所述数据备份单元,用于接收所述主备集群服务器以第二设定时间周期发送的业务数据;以及所述状态检测单元确定所述故障恢复后,将在故障期间自身产生的业务数据发送给所述主备集群服务器;所述服务切换单元,用于若所述状态检测单元确定所述主备集群服务器或者所述链路故障后,通知所述网络设备将接收到的来自客户端的服务请求报文发送给所述基础服务单元;以及若所述状态检测单元确定所述故障恢复后,通知所述网络设备将接收到的来自客户端的服务请求报文发送至所述主备集群服务器;所述基础服务单元,用于根据接收到的所述主备集群服务器发送的业务数据处理所述网络设备发送的服务请求报文。如权利要求7所述的装置,其特征在于,所述状态检测单元,用于以第一设定时间周期监控所述主备集群服务器的运行状态、与所述主备集群服务器中间的链路状态,具体用于:以所述第一设定时间周期向所述主备集群服务器发送状态监控请求报文,并监控所述主备集群服务器是否返回状态监控响应报文;或者以所述第一设定时间周期监控是否接收到所述主备集群服务器发送的状态报告报文。如权利要求7所述的装置,其特征在于,所述状态检测单元,用于确定所述主备集群服务器或者所述链路故障,具体用于:若连续设定次数监控到所述主备集群服务器或者所述链路故障,确定所述主备集群服务器或者所述链路故障。如权利要求7所述的装置,其特征在于,所述状态检测单元,用于确定所述故障恢复,具体用于:若第一次监控到所述故障恢复,确定所述故障恢复。

说明书

说明书一种基于主备集群服务器的跨地区服务容灾方法及装置
技术领域
本发明涉及计算机技术领域,尤指一种基于主备集群服务器的跨地区服务容灾方法及装置。
背景技术
集群可以利用多台设备并行计算从而获得很高的计算速度,也可以用多台设备做备份,从而使得任何一台设备故障后整个系统还能正常运行。服务器集群是指将很多服务器集中起来进行同一种服务,在客户端看来就象只有一个服务器,一旦在服务器上安装并运行了集群服务,该服务器即可加入集群。集群化操作可以减少单点故障数量,实现集群化资源的高可用性。
目前,跨地区服务主要采取主备集群服务器部署的方案,如图1所示,将服务集中部署于主节点地区主备集群服务器,其它从节点地区统一到主节点地区进行服务请求。该方案中所有服务都由主节点的主备集群服务器集中提供,这样能够保障服务的可靠性,实现所有地区资源集中式管理,部署简单,降低部署成本,利于后期升级扩展。但是该方案容灾性较差,不能有效抵御一些突发状况,如:当主节点地区服务器机房故障、断电等导致主节点主备集群服务器完全瘫痪时,从节点地区与主节点地区之间的通讯链路中断,主节点和从节点的服务都不能正常使用。
发明内容
本发明实施例提供一种基于主备集群服务器的跨地区服务容灾方法及装置,用以解决现有技术中存在的主备集群服务器部署方案的容灾性较差的问题。
一种基于主备集群服务器的跨地区服务容灾方法,包括:
每一从节点地区设置的基于主备集群服务器的跨地区服务容灾装置与主节点地区的所述主备集群服务器建立连接后,以第一设定时间周期监控所述主备集群服务器的运行状态以及与所述主备集群服务器中间的链路状态,并接收所述主备集群服务器以第二设定时间周期发送的业务数据;
若确定所述主备集群服务器、所述链路均正常,则通知网络设备将接收到的来自客户端的服务请求报文发送至所述主备集群服务器;
若确定所述主备集群服务器或者所述链路故障,则通知所述网络设备将接收到的来自客户端的服务请求报文发送至所述基于主备集群服务器的跨地区服务容灾装置,并根据接收到的所述主备集群服务器发送的业务数据处理所述网络设备发送的服务请求报文;以及确定所述故障恢复后,将在故障期间自身产生的业务数据发送给所述主备集群服务器,并通知所述网络设备将接收到的来自客户端的服务请求报文发送至所述主备集群服务器。
一种基于主备集群服务器的跨地区服务容灾装置,包括状态检测单元、服务切换单元、基础服务单元和数据备份单元,其中:
所述状态检测单元,用于自身所在的基于主备集群服务器的跨地区服务容灾装置与主节点地区的所述主备集群服务器建立连接后,以第一设定时间周期监控所述主备集群服务器的运行状态以及与所述主备集群服务器中间的链路状态;若确定所述主备集群服务器、所述链路均正常,则通知网络设备将接收到的来自客户端的服务请求报文发送至所述主备集群服务器;
所述数据备份单元,用于接收所述主备集群服务器以第二设定时间周期发送的业务数据;以及所述状态检测单元确定所述故障恢复后,将在故障期间自身产生的业务数据发送给所述主备集群服务器;
所述服务切换单元,用于若所述状态检测单元确定所述主备集群服务器或者所述链路故障后,通知所述网络设备将接收到的来自客户端的服务请求报文发送发送给所述基础服务单元;以及若所述状态检测单元确定所述故障恢复后,通知所述网络设备将接收到的来自客户端的服务请求报文发送至所述主备集群服务器;
所述基础服务单元,用于根据接收到的所述主备集群服务器发送的业务数据处理所述网络设备发送的服务请求报文。
本发明有益效果如下:
本发明实施例提供的基于主备集群服务器的跨地区服务容灾方法及装置,该方案中每一个从节点设置的基于主备集群服务器的跨地区服务容灾设备可以监控主备集群服务器以及与主备集群服务器的链路状态,并会定时备份主备集群服务器发送的业务数据,当确定主备集群服务器或者与主备集群服务器的链路状态故障后,可以根据备份的业务数据处理接收到的来自客户端的服务请求报文,并在确定故障恢复后,将故障期间产生的业务数据发送给主备集群服务器,由主备集群服务器继续处理来自客户端的服务请求报文。一旦主备集群服务器无法处理客户端的服务请求报文,可以由本地的基于主备集群服务器的跨地区服务容灾设备继续处理客户端的服务请求报文,当故障恢复后,再由主备集群服务器继续处理,这样就可以提高跨地区服务的容灾性。
附图说明
图1为现有技术中主备集群服务器跨地区服务的部署示意图;
图2为本发明实施例中主备集群服务器跨地区服务的部署示意图;
图3为本发明实施例中基于主备集群服务器的跨地区服务容灾方法的流程图;
图4为本发明实施例中基于主备集群服务器的跨地区服务容灾装置的结构示意图。
具体实施方式
针对现有技术中存在的主备集群服务器部署方案的容灾性较差的问题,本发明实施例改变了基于主备集群服务器的跨地区服务部署方式,如图2所示,相对于图1在每个从节点地区增加了基于主备集群服务器的跨地区服务容灾装置,本发明实施例提供一种基于主备集群服务器的跨地区服务容灾方法,该方法的流程如图3所示,每一从节点地区设置的基于主备集群服务器的跨地区服务容灾装置都可单独执行步骤如下:
S20:与主节点地区的主备集群服务器建立连接。
部署主节点地区的主备集群服务器时,主备集群服务器对外提供统一的虚拟集群互联网协议(Internet Protocol,IP)地址,基于主备集群服务器的跨地区服务容灾装置对外提供的实际IP地址,且基于主备集群服器的跨地区服务容灾装置上需要配置主备集群服务器的虚拟集群IP地址,主备集群服务器出现故障时需要接管的服务,以及接管的客户端信息等等。
主备集群服务器和基于主备集群服器的跨地区服务容灾装置启动完成后,基于主备集群服器的跨地区服务容灾装置与主备集群服务器建立连接,建立连接的过程为:基于主备集群服务器的跨地区服务容灾装置向主备集群服务器发送携带主备集群服务器的虚拟集群IP地址的连接建立请求报文;并接收主备集群服务器发送的携带基于主备集群服务器的跨地区服务容灾装置的IP地址的连接建立响应报文。
S21:接收主备集群服务器以第二设定时间周期发送的业务数据。
第二设定时间周期是可以根据实际需要进行设定的,若主备集群服务器与基于主备集群服器的跨地区服务容灾装置之间的业务数据的实时性要求很高,可以将第二设定时间周期设定的小一些,例如30分钟、60分钟等等,这也就是实时同步的方式;若对实时性要求不高,可以将第二设定时间周期设定的长一些,例如24小时、36小时等等。同时可以根据实际需要选择哪些业务数据做同步,因为基于主备集群服器的跨地区服务容灾装置提供的是基础服务功能,所以可以选择性的去除不会用到的业务数据。当前已有的各种大型数据库如SQL Server,Oracle等都能够支持这种定制化的数据复制。
S22:以第一设定时间周期监控主备集群服务器的运行状态以及与主备集群服务器中间的链路状态;若确定主备集群服务器、链路均正常,则执行S23;若确定主备集群服务器或者链路故障,则执行S24。
当主备集群服务器故障、或者基于主备集群服器的跨地区服务容灾装置与主备集群服务器之间的链路故障时,都会导致主备集群服务器不能提供正常的服务,所以需要监控主备集群服务器的运行状态、以及基于主备集群服器的跨地区服务容灾装置与主备集群服务器之间的链路状态。第一设定时间周期可以根据实际需要进行设定,对故障监控的时间要求严格时,可以将第一设定时间周期设置的短一些;反之,设置的长一些。
S21与S22是同时执行的,第一设定时间周期和第二设定时间周期也是分别监控的,并没有先后之分。
S23:通知网络设备将接收到的来自客户端的服务请求报文发送至主备集群服务器。
当确定主备集群服务器、链路均正常时,可以由主节点的主备集群服务器处理客户端的服务请求报文。
网络设备可以是实现了简单网络管理协议(Simple Network Management Protocol,SNMP)的交换机等等,能够实现报文转发等功能。
S24:通知所述网络设备将接收到的来自客户端的服务请求报文发送至所述基于主备集群服务器的跨地区服务容灾装置,并根据接收到的主备集群服务器发送的业务数据处理网络设备的服务请求报文。
当确定主备集群服务器或者链路故障时,将由本从节点的基于主备集群服器的跨地区服务容灾装置来处理来自客户端的服务请求报文,同时依托于接收到的主备集群服务器发送的业务数据,实现基本服务功能的提供。
S25:确定故障恢复后,将在故障期间自身产生的业务数据发送给主备集群服务器,并通知网络设备将接收到的来自客户端的服务请求报文发送至主备集群服务器。
在确定故障恢复后,将在故障期间产生的业务数据发送给主备集群服务器,由主备集群服务器继续处理后续的来自客户端的服务请求报文,这就保证主备集群服务器数据的完整性。
该方案中每一个从节点设置的基于主备集群服务器的跨地区服务容灾设备可以监控主备集群服务器以及与主备集群服务器的链路状态,并会定时备份主备集群服务器发送的业务数据,当确定主备集群服务器或者与主备集群服务器的链路状态故障后,可以根据备份的业务数据处理接收到的来自客户端的服务请求报文,并在确定故障恢复后,将故障期间产生的业务数据发送给主备集群服务器,由主备集群服务器继续处理来自客户端的服务请求报文。一旦主备集群服务器无法处理客户端的服务请求报文,可以由本地的基于主备集群服务器的跨地区服务容灾设备继续处理客户端的服务请求报文,当故障恢复后,再由主备集群服务器继续处理,这样就可以提高跨地区服务的容灾性。
具体的,上述S22中的以第一设定时间周期监控主备集群服务器的运行状态、与主备集群服务器中间的链路状态,具体包括:以第一设定时间周期向主备集群服务器发送状态监控请求报文,并监控主备集群服务器是否返回状态监控响应报文;或者以第一设定时间周期监控是否接收到主备集群服务器发送的状态报告报文。其中,第一设定时间周期大于主备服务器切换时间。
其中,状态监控请求报文可以是服务请求报文,用来请求主备集群服务器提供当前状态,当然也可以是其他的报文;主备集群服务器发送的状态报告报文可以是心跳报文,用来主动报告自身当前的状态,当然也可以是其他的报文。
具体的,上述S24中的确定主备集群服务器或者链路故障,具体包括:若连续设定次数监控到主备集群服务器或者链路故障,确定主备集群服务器或者链路故障。
具体的,上述S25中的确定故障恢复,具体包括:若第一次监控到故障恢复,确定故障恢复。
主服务器发生故障到备服务器启动可以正常工作需要一定的时间,这段时间可以称为主备服务器切换时间,在主备服务器切换时间内,主备集群服务器不能提供服务,这是正常现象,不能判断为主备集群服务器故障,因此,第一设定时间需要大于主备服务器切换时间。
并且,探测主备集群服务器是否故障不能只监控到一次,因为若只监控到一次,若监控时间点刚好发生在主备服务器切换时间内,那么就会产生错误,所以监控到故障的次数须大于1次,建议为3次,若连续三次全部监控到故障,则说明主备集群服务器已故障。探测主备集群服务器的故障恢复正常只需要监控到一次即可。
基于同一发明构思,本发明实施例提供一种基于主备集群服务器的跨地区服务容灾装置,该装置的结构如图4所示,包括状态检测单元30、数据备份单元31、服务切换单元32和基础服务单元33其中:
上述状态检测单元30,用于自身所在的基于主备集群服务器的跨地区服务容灾装置与主节点地区的主备集群服务器建立连接后,以第一设定时间周期监控主备集群服务器的运行状态以及与主备集群服务器中间的链路状态;若确定主备集群服务器、链路均正常,则通知网络设备将接收到的来自客户端的服务请求报文发送至主备集群服务器。
上述数据备份单元31,用于接收主备集群服务器以第二设定时间周期发送的业务数据;以及状态检测单元30确定故障恢复后,将在故障期间自身产生的业务数据发送给主备集群服务器。
上述服务切换单元32,用于若状态检测单元30确定主备集群服务器或者链路故障后,通知网络设备将接收到的来自客户端的服务请求报文发送给基础服务单元;以及若状态检测单元30确定故障恢复后,通知网络设备将接收到的来自客户端的服务请求报文发送至主备集群服务器。
上述基础服务单元33,用于根据接收到的主备集群服务器发送的业务数据处理网络设备发送的服务请求报文。
具体的,上述状态检测单元30,用于以第一设定时间周期监控主备集群服务器的运行状态、与主备集群服务器中间的链路状态,具体用于:以第一设定时间周期向主备集群服务器发送状态监控请求报文,并监控主备集群服务器是否返回状态监控响应报文;或者以第一设定时间周期监控是否接收到主备集群服务器发送的状态报告报文。
具体的,上述状态检测单元30,用于确定主备集群服务器或者链路故障,具体用于:若连续设定次数监控到主备集群服务器或者链路故障,确定主备集群服务器或者链路故障。
具体的,上述状态检测单元30,用于确定故障恢复,具体用于:若第一次监控到故障恢复,确定故障恢复。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

一种基于主备集群服务器的跨地区服务容灾方法及装置.pdf_第1页
第1页 / 共10页
一种基于主备集群服务器的跨地区服务容灾方法及装置.pdf_第2页
第2页 / 共10页
一种基于主备集群服务器的跨地区服务容灾方法及装置.pdf_第3页
第3页 / 共10页
点击查看更多>>
资源描述

《一种基于主备集群服务器的跨地区服务容灾方法及装置.pdf》由会员分享,可在线阅读,更多相关《一种基于主备集群服务器的跨地区服务容灾方法及装置.pdf(10页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 103036719 A (43)申请公布日 2013.04.10 CN 103036719 A *CN103036719A* (21)申请号 201210537422.3 (22)申请日 2012.12.12 H04L 12/24(2006.01) H04L 29/08(2006.01) H04L 12/703(2013.01) (71)申请人 北京星网锐捷网络技术有限公司 地址 100036 北京市海淀区复兴路 29 号中 意鹏奥大厦东楼 11 层 (72)发明人 蔡昱星 (74)专利代理机构 北京同达信恒知识产权代理 有限公司 11291 代理人 黄志华 (54)。

2、 发明名称 一种基于主备集群服务器的跨地区服务容灾 方法及装置 (57) 摘要 本发明公开了一种基于主备集群服务器的跨 地区服务容灾方法及装置, 该方法包括 : 基于主 备集群服务器的跨地区服务容灾装置与主备集群 服务器建立连接后, 监控主备集群服务器的运行 状态以及链路状态 ; 若确定主备集群服务器、 链 路均正常, 则通知网络设备将接收到的服务请求 报文发送至主备集群服务器 ; 若确定主备集群服 务器或者链路故障, 则通知网络设备将接收到的 服务请求报文发送至本地, 并根据接收到的主备 集群服务器发送的业务数据处理网络设备发送的 服务请求报文 ; 确定故障恢复后, 将在故障期间 自身产生的。

3、业务数据发送给主备集群服务器, 通 知网络设备将接收到的服务请求报文发送至主备 集群服务器。该方案可以提高跨地区服务的容灾 性。 (51)Int.Cl. 权利要求书 2 页 说明书 5 页 附图 2 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 2 页 说明书 5 页 附图 2 页 1/2 页 2 1. 一种基于主备集群服务器的跨地区服务容灾方法, 其特征在于, 包括 : 每一从节点地区设置的基于主备集群服务器的跨地区服务容灾装置与主节点地区的 所述主备集群服务器建立连接后, 以第一设定时间周期监控所述主备集群服务器的运行状 态以及与所述主备集群服务器中间的链路状。

4、态, 并接收所述主备集群服务器以第二设定时 间周期发送的业务数据 ; 若确定所述主备集群服务器、 所述链路均正常, 则通知网络设备将接收到的来自客户 端的服务请求报文发送至所述主备集群服务器 ; 若确定所述主备集群服务器或者所述链路故障, 则通知所述网络设备将接收到的来自 客户端的服务请求报文发送至所述基于主备集群服务器的跨地区服务容灾装置, 并根据接 收到的所述主备集群服务器发送的业务数据处理所述网络设备发送的服务请求报文 ; 以及 确定所述故障恢复后, 将在故障期间自身产生的业务数据发送给所述主备集群服务器, 并 通知所述网络设备将接收到的来自客户端的服务请求报文发送至所述主备集群服务器。。

5、 2. 如权利要求 1 所述的方法, 其特征在于, 基于主备集群服务器的跨地区服务容灾装 置与所述主备集群服务器建立连接, 具体包括 : 基于主备集群服务器的跨地区服务容灾装置向所述主备集群服务器发送携带所述主 备集群服务器的虚拟集群互联网协议 IP 地址的连接建立请求报文 ; 并接收所述主备集群服务器发送的携带所述基于主备集群服务器的跨地区服务容灾 装置的 IP 地址的连接建立响应报文。 3. 如权利要求 1 所述的方法, 其特征在于, 所述第一设定时间周期大于主备服务器切 换时间。 4. 如权利要求 3 所述的方法, 其特征在于, 以第一设定时间周期监控所述主备集群服 务器的运行状态、 与。

6、所述主备集群服务器中间的链路状态, 具体包括 : 以所述第一设定时间周期向所述主备集群服务器发送状态监控请求报文, 并监控所述 主备集群服务器是否返回状态监控响应报文 ; 或者 以所述第一设定时间周期监控是否接收到所述主备集群服务器发送的状态报告报文。 5. 如权利要求 1 所述的方法, 其特征在于, 确定所述主备集群服务器或者所述链路故 障, 具体包括 : 若连续设定次数监控到所述主备集群服务器或者所述链路故障, 确定所述主备集群服 务器或者所述链路故障。 6. 如权利要求 1 所述的方法, 其特征在于, 确定所述故障恢复, 具体包括 : 若第一次监控到所述故障恢复, 确定所述故障恢复。 7。

7、. 一种基于主备集群服务器的跨地区服务容灾装置, 其特征在于, 包括状态检测单元、 服务切换单元、 基础服务单元和数据备份单元, 其中 : 所述状态检测单元, 用于自身所在的基于主备集群服务器的跨地区服务容灾装置与主 节点地区的所述主备集群服务器建立连接后, 以第一设定时间周期监控所述主备集群服务 器的运行状态以及与所述主备集群服务器中间的链路状态 ; 若确定所述主备集群服务器、 所述链路均正常, 则通知网络设备将接收到的来自客户端的服务请求报文发送至所述主备 集群服务器 ; 所述数据备份单元, 用于接收所述主备集群服务器以第二设定时间周期发送的业务数 权 利 要 求 书 CN 1030367。

8、19 A 2 2/2 页 3 据 ; 以及所述状态检测单元确定所述故障恢复后, 将在故障期间自身产生的业务数据发送 给所述主备集群服务器 ; 所述服务切换单元, 用于若所述状态检测单元确定所述主备集群服务器或者所述链路 故障后, 通知所述网络设备将接收到的来自客户端的服务请求报文发送给所述基础服务单 元 ; 以及若所述状态检测单元确定所述故障恢复后, 通知所述网络设备将接收到的来自客 户端的服务请求报文发送至所述主备集群服务器 ; 所述基础服务单元, 用于根据接收到的所述主备集群服务器发送的业务数据处理所述 网络设备发送的服务请求报文。 8. 如权利要求 7 所述的装置, 其特征在于, 所述状。

9、态检测单元, 用于以第一设定时间周 期监控所述主备集群服务器的运行状态、 与所述主备集群服务器中间的链路状态, 具体用 于 : 以所述第一设定时间周期向所述主备集群服务器发送状态监控请求报文, 并监控所述 主备集群服务器是否返回状态监控响应报文 ; 或者 以所述第一设定时间周期监控是否接收到所述主备集群服务器发送的状态报告报文。 9. 如权利要求 7 所述的装置, 其特征在于, 所述状态检测单元, 用于确定所述主备集群 服务器或者所述链路故障, 具体用于 : 若连续设定次数监控到所述主备集群服务器或者所述链路故障, 确定所述主备集群服 务器或者所述链路故障。 10. 如权利要求 7 所述的装置。

10、, 其特征在于, 所述状态检测单元, 用于确定所述故障恢 复, 具体用于 : 若第一次监控到所述故障恢复, 确定所述故障恢复。 权 利 要 求 书 CN 103036719 A 3 1/5 页 4 一种基于主备集群服务器的跨地区服务容灾方法及装置 技术领域 0001 本发明涉及计算机技术领域, 尤指一种基于主备集群服务器的跨地区服务容灾方 法及装置。 背景技术 0002 集群可以利用多台设备并行计算从而获得很高的计算速度, 也可以用多台设备做 备份, 从而使得任何一台设备故障后整个系统还能正常运行。服务器集群是指将很多服务 器集中起来进行同一种服务, 在客户端看来就象只有一个服务器, 一旦在服。

11、务器上安装并 运行了集群服务, 该服务器即可加入集群。 集群化操作可以减少单点故障数量, 实现集群化 资源的高可用性。 0003 目前, 跨地区服务主要采取主备集群服务器部署的方案, 如图 1 所示, 将服务集中 部署于主节点地区主备集群服务器, 其它从节点地区统一到主节点地区进行服务请求。该 方案中所有服务都由主节点的主备集群服务器集中提供, 这样能够保障服务的可靠性, 实 现所有地区资源集中式管理, 部署简单, 降低部署成本, 利于后期升级扩展。但是该方案容 灾性较差, 不能有效抵御一些突发状况, 如 : 当主节点地区服务器机房故障、 断电等导致主 节点主备集群服务器完全瘫痪时, 从节点地。

12、区与主节点地区之间的通讯链路中断, 主节点 和从节点的服务都不能正常使用。 发明内容 0004 本发明实施例提供一种基于主备集群服务器的跨地区服务容灾方法及装置, 用以 解决现有技术中存在的主备集群服务器部署方案的容灾性较差的问题。 0005 一种基于主备集群服务器的跨地区服务容灾方法, 包括 : 0006 每一从节点地区设置的基于主备集群服务器的跨地区服务容灾装置与主节点地 区的所述主备集群服务器建立连接后, 以第一设定时间周期监控所述主备集群服务器的运 行状态以及与所述主备集群服务器中间的链路状态, 并接收所述主备集群服务器以第二设 定时间周期发送的业务数据 ; 0007 若确定所述主备集。

13、群服务器、 所述链路均正常, 则通知网络设备将接收到的来自 客户端的服务请求报文发送至所述主备集群服务器 ; 0008 若确定所述主备集群服务器或者所述链路故障, 则通知所述网络设备将接收到的 来自客户端的服务请求报文发送至所述基于主备集群服务器的跨地区服务容灾装置, 并根 据接收到的所述主备集群服务器发送的业务数据处理所述网络设备发送的服务请求报文 ; 以及确定所述故障恢复后, 将在故障期间自身产生的业务数据发送给所述主备集群服务 器, 并通知所述网络设备将接收到的来自客户端的服务请求报文发送至所述主备集群服务 器。 0009 一种基于主备集群服务器的跨地区服务容灾装置, 包括状态检测单元、。

14、 服务切换 单元、 基础服务单元和数据备份单元, 其中 : 说 明 书 CN 103036719 A 4 2/5 页 5 0010 所述状态检测单元, 用于自身所在的基于主备集群服务器的跨地区服务容灾装置 与主节点地区的所述主备集群服务器建立连接后, 以第一设定时间周期监控所述主备集群 服务器的运行状态以及与所述主备集群服务器中间的链路状态 ; 若确定所述主备集群服务 器、 所述链路均正常, 则通知网络设备将接收到的来自客户端的服务请求报文发送至所述 主备集群服务器 ; 0011 所述数据备份单元, 用于接收所述主备集群服务器以第二设定时间周期发送的业 务数据 ; 以及所述状态检测单元确定所述。

15、故障恢复后, 将在故障期间自身产生的业务数据 发送给所述主备集群服务器 ; 0012 所述服务切换单元, 用于若所述状态检测单元确定所述主备集群服务器或者所述 链路故障后, 通知所述网络设备将接收到的来自客户端的服务请求报文发送发送给所述基 础服务单元 ; 以及若所述状态检测单元确定所述故障恢复后, 通知所述网络设备将接收到 的来自客户端的服务请求报文发送至所述主备集群服务器 ; 0013 所述基础服务单元, 用于根据接收到的所述主备集群服务器发送的业务数据处理 所述网络设备发送的服务请求报文。 0014 本发明有益效果如下 : 0015 本发明实施例提供的基于主备集群服务器的跨地区服务容灾方。

16、法及装置, 该方案 中每一个从节点设置的基于主备集群服务器的跨地区服务容灾设备可以监控主备集群服 务器以及与主备集群服务器的链路状态, 并会定时备份主备集群服务器发送的业务数据, 当确定主备集群服务器或者与主备集群服务器的链路状态故障后, 可以根据备份的业务数 据处理接收到的来自客户端的服务请求报文, 并在确定故障恢复后, 将故障期间产生的业 务数据发送给主备集群服务器, 由主备集群服务器继续处理来自客户端的服务请求报文。 一旦主备集群服务器无法处理客户端的服务请求报文, 可以由本地的基于主备集群服务器 的跨地区服务容灾设备继续处理客户端的服务请求报文, 当故障恢复后, 再由主备集群服 务器继。

17、续处理, 这样就可以提高跨地区服务的容灾性。 附图说明 0016 图 1 为现有技术中主备集群服务器跨地区服务的部署示意图 ; 0017 图 2 为本发明实施例中主备集群服务器跨地区服务的部署示意图 ; 0018 图 3 为本发明实施例中基于主备集群服务器的跨地区服务容灾方法的流程图 ; 0019 图 4 为本发明实施例中基于主备集群服务器的跨地区服务容灾装置的结构示意 图。 具体实施方式 0020 针对现有技术中存在的主备集群服务器部署方案的容灾性较差的问题, 本发明实 施例改变了基于主备集群服务器的跨地区服务部署方式, 如图2所示, 相对于图1在每个从 节点地区增加了基于主备集群服务器的跨。

18、地区服务容灾装置, 本发明实施例提供一种基于 主备集群服务器的跨地区服务容灾方法, 该方法的流程如图 3 所示, 每一从节点地区设置 的基于主备集群服务器的跨地区服务容灾装置都可单独执行步骤如下 : 0021 S20 : 与主节点地区的主备集群服务器建立连接。 说 明 书 CN 103036719 A 5 3/5 页 6 0022 部署主节点地区的主备集群服务器时, 主备集群服务器对外提供统一的虚拟集群 互联网协议 (Internet Protocol, IP) 地址, 基于主备集群服务器的跨地区服务容灾装置对 外提供的实际 IP 地址, 且基于主备集群服器的跨地区服务容灾装置上需要配置主备集。

19、群 服务器的虚拟集群 IP 地址, 主备集群服务器出现故障时需要接管的服务, 以及接管的客户 端信息等等。 0023 主备集群服务器和基于主备集群服器的跨地区服务容灾装置启动完成后, 基于主 备集群服器的跨地区服务容灾装置与主备集群服务器建立连接, 建立连接的过程为 : 基于 主备集群服务器的跨地区服务容灾装置向主备集群服务器发送携带主备集群服务器的虚 拟集群 IP 地址的连接建立请求报文 ; 并接收主备集群服务器发送的携带基于主备集群服 务器的跨地区服务容灾装置的 IP 地址的连接建立响应报文。 0024 S21 : 接收主备集群服务器以第二设定时间周期发送的业务数据。 0025 第二设定时。

20、间周期是可以根据实际需要进行设定的, 若主备集群服务器与基于主 备集群服器的跨地区服务容灾装置之间的业务数据的实时性要求很高, 可以将第二设定时 间周期设定的小一些, 例如 30 分钟、 60 分钟等等, 这也就是实时同步的方式 ; 若对实时性要 求不高, 可以将第二设定时间周期设定的长一些, 例如24小时、 36小时等等。 同时可以根据 实际需要选择哪些业务数据做同步, 因为基于主备集群服器的跨地区服务容灾装置提供的 是基础服务功能, 所以可以选择性的去除不会用到的业务数据。当前已有的各种大型数据 库如 SQL Server, Oracle 等都能够支持这种定制化的数据复制。 0026 S2。

21、2 : 以第一设定时间周期监控主备集群服务器的运行状态以及与主备集群服务 器中间的链路状态 ; 若确定主备集群服务器、 链路均正常, 则执行 S23 ; 若确定主备集群服 务器或者链路故障, 则执行 S24。 0027 当主备集群服务器故障、 或者基于主备集群服器的跨地区服务容灾装置与主备集 群服务器之间的链路故障时, 都会导致主备集群服务器不能提供正常的服务, 所以需要监 控主备集群服务器的运行状态、 以及基于主备集群服器的跨地区服务容灾装置与主备集群 服务器之间的链路状态。第一设定时间周期可以根据实际需要进行设定, 对故障监控的时 间要求严格时, 可以将第一设定时间周期设置的短一些 ; 反。

22、之, 设置的长一些。 0028 S21 与 S22 是同时执行的, 第一设定时间周期和第二设定时间周期也是分别监控 的, 并没有先后之分。 0029 S23 : 通知网络设备将接收到的来自客户端的服务请求报文发送至主备集群服务 器。 0030 当确定主备集群服务器、 链路均正常时, 可以由主节点的主备集群服务器处理客 户端的服务请求报文。 0031 网络设备可以是实现了简单网络管理协议 (Simple Network Management Protocol, SNMP) 的交换机等等, 能够实现报文转发等功能。 0032 S24 : 通知所述网络设备将接收到的来自客户端的服务请求报文发送至所述。

23、基于 主备集群服务器的跨地区服务容灾装置, 并根据接收到的主备集群服务器发送的业务数据 处理网络设备的服务请求报文。 0033 当确定主备集群服务器或者链路故障时, 将由本从节点的基于主备集群服器的跨 地区服务容灾装置来处理来自客户端的服务请求报文, 同时依托于接收到的主备集群服务 说 明 书 CN 103036719 A 6 4/5 页 7 器发送的业务数据, 实现基本服务功能的提供。 0034 S25 : 确定故障恢复后, 将在故障期间自身产生的业务数据发送给主备集群服务 器, 并通知网络设备将接收到的来自客户端的服务请求报文发送至主备集群服务器。 0035 在确定故障恢复后, 将在故障期。

24、间产生的业务数据发送给主备集群服务器, 由主 备集群服务器继续处理后续的来自客户端的服务请求报文, 这就保证主备集群服务器数据 的完整性。 0036 该方案中每一个从节点设置的基于主备集群服务器的跨地区服务容灾设备可以 监控主备集群服务器以及与主备集群服务器的链路状态, 并会定时备份主备集群服务器发 送的业务数据, 当确定主备集群服务器或者与主备集群服务器的链路状态故障后, 可以根 据备份的业务数据处理接收到的来自客户端的服务请求报文, 并在确定故障恢复后, 将故 障期间产生的业务数据发送给主备集群服务器, 由主备集群服务器继续处理来自客户端的 服务请求报文。一旦主备集群服务器无法处理客户端的。

25、服务请求报文, 可以由本地的基于 主备集群服务器的跨地区服务容灾设备继续处理客户端的服务请求报文, 当故障恢复后, 再由主备集群服务器继续处理, 这样就可以提高跨地区服务的容灾性。 0037 具体的, 上述 S22 中的以第一设定时间周期监控主备集群服务器的运行状态、 与 主备集群服务器中间的链路状态, 具体包括 : 以第一设定时间周期向主备集群服务器发送 状态监控请求报文, 并监控主备集群服务器是否返回状态监控响应报文 ; 或者以第一设定 时间周期监控是否接收到主备集群服务器发送的状态报告报文。其中, 第一设定时间周期 大于主备服务器切换时间。 0038 其中, 状态监控请求报文可以是服务请。

26、求报文, 用来请求主备集群服务器提供当 前状态, 当然也可以是其他的报文 ; 主备集群服务器发送的状态报告报文可以是心跳报文, 用来主动报告自身当前的状态, 当然也可以是其他的报文。 0039 具体的, 上述 S24 中的确定主备集群服务器或者链路故障, 具体包括 : 若连续设定 次数监控到主备集群服务器或者链路故障, 确定主备集群服务器或者链路故障。 0040 具体的, 上述 S25 中的确定故障恢复, 具体包括 : 若第一次监控到故障恢复, 确定 故障恢复。 0041 主服务器发生故障到备服务器启动可以正常工作需要一定的时间, 这段时间可以 称为主备服务器切换时间, 在主备服务器切换时间内。

27、, 主备集群服务器不能提供服务, 这是 正常现象, 不能判断为主备集群服务器故障, 因此, 第一设定时间需要大于主备服务器切换 时间。 0042 并且, 探测主备集群服务器是否故障不能只监控到一次, 因为若只监控到一次, 若 监控时间点刚好发生在主备服务器切换时间内, 那么就会产生错误, 所以监控到故障的次 数须大于1次, 建议为3次, 若连续三次全部监控到故障, 则说明主备集群服务器已故障。 探 测主备集群服务器的故障恢复正常只需要监控到一次即可。 0043 基于同一发明构思, 本发明实施例提供一种基于主备集群服务器的跨地区服务容 灾装置, 该装置的结构如图 4 所示, 包括状态检测单元 3。

28、0、 数据备份单元 31、 服务切换单元 32 和基础服务单元 33 其中 : 0044 上述状态检测单元 30, 用于自身所在的基于主备集群服务器的跨地区服务容灾装 置与主节点地区的主备集群服务器建立连接后, 以第一设定时间周期监控主备集群服务器 说 明 书 CN 103036719 A 7 5/5 页 8 的运行状态以及与主备集群服务器中间的链路状态 ; 若确定主备集群服务器、 链路均正常, 则通知网络设备将接收到的来自客户端的服务请求报文发送至主备集群服务器。 0045 上述数据备份单元 31, 用于接收主备集群服务器以第二设定时间周期发送的业务 数据 ; 以及状态检测单元 30 确定故。

29、障恢复后, 将在故障期间自身产生的业务数据发送给主 备集群服务器。 0046 上述服务切换单元 32, 用于若状态检测单元 30 确定主备集群服务器或者链路故 障后, 通知网络设备将接收到的来自客户端的服务请求报文发送给基础服务单元 ; 以及若 状态检测单元 30 确定故障恢复后, 通知网络设备将接收到的来自客户端的服务请求报文 发送至主备集群服务器。 0047 上述基础服务单元 33, 用于根据接收到的主备集群服务器发送的业务数据处理网 络设备发送的服务请求报文。 0048 具体的, 上述状态检测单元 30, 用于以第一设定时间周期监控主备集群服务器的 运行状态、 与主备集群服务器中间的链路。

30、状态, 具体用于 : 以第一设定时间周期向主备集群 服务器发送状态监控请求报文, 并监控主备集群服务器是否返回状态监控响应报文 ; 或者 以第一设定时间周期监控是否接收到主备集群服务器发送的状态报告报文。 0049 具体的, 上述状态检测单元 30, 用于确定主备集群服务器或者链路故障, 具体用 于 : 若连续设定次数监控到主备集群服务器或者链路故障, 确定主备集群服务器或者链路 故障。 0050 具体的, 上述状态检测单元 30, 用于确定故障恢复, 具体用于 : 若第一次监控到故 障恢复, 确定故障恢复。 0051 显然, 本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精 神和范围。这样, 倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围 之内, 则本发明也意图包含这些改动和变型在内。 说 明 书 CN 103036719 A 8 1/2 页 9 图 1 图 2 说 明 书 附 图 CN 103036719 A 9 2/2 页 10 图 3 图 4 说 明 书 附 图 CN 103036719 A 10 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 电学 > 电通信技术


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1