用于灾难恢复的方法和系统
技术领域
本发明涉及云计算。更确切的,本发明涉及一种用于云计算系统中灾难恢复的方法和系统。
背景技术
云计算系统要求服务的稳定性。因此,灾难恢复对云计算系统来说非常重要。对于云计算系统中的灾难恢复,应考虑到云计算系统的特点。传统环境中的灾难恢复时,数据集通常恢复到相同或相似的硬件上,可以不考虑硬件彼此间的连接限制。在云计算系统中,恢复数据时需要在云计算系统中重新分配恢复所需要的资源,包括计算资源和存储资源。现有技术中的方案在进行云计算系统的灾难恢复时通常没有考虑资源之间的互联限制,一般方式是先在云计算系统中随机分配资源,然后修改资源的连接配置,以实现互联。这样做的有效性是基于资源彼此间可以互联的假设。而在云计算系统中这种假设往往是不现实的。由于安全性和物理连接能力等方面的原因,云计算系统中的资源之间往往存在不可避免的互联限制,例如TCP/IP,SAN等连接关系。而基于云计算系统的资源动态分配特性,如果随机分配资源,将无法保证资源之间的互联关系可以满足备份的数据集的需求。
发明内容
因此,需要一种灾难恢复的方法和系统,能够在云计算系统中实现有效的灾难恢复。
本发明的说明性实施例提供了一种用于灾难恢复的方法,包括:获取目标环境的拓扑结构信息;获取源环境的拓扑结构信息;从目标环境的拓扑结构信息中寻找与源环境的拓扑结构信息匹配的资源;根据源环境的拓扑结构信息,利用找到的资源进行灾难恢复;其中拓扑结构信息包括对象之间的互联信息。
本发明的说明性实施例还提供了一种用于灾难恢复的系统,包括:获取设备,配置为获取目标环境的拓扑结构信息;以及获取源环境的拓扑结构信息;匹配设备,配置为从目标环境的拓扑结构信息中寻找与源环境的拓扑结构信息匹配的资源;恢复设备,配置为根据源环境的拓扑结构信息,利用找到的资源进行灾难恢复;其中拓扑结构信息包括对象之间的互联信息。
本发明的说明性实施例还提供了用于备份环境的方法和系统。
利用说明性实施例的方法和系统,充分考虑到资源之间的互联限制,在云计算系统中进行灾难恢复时不是随机分配资源,而是在分配资源前先有目的的选择可以的互联的资源,以此保证分配后各资源间的互联关系。
附图说明
通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。
图1表示根据本发明一实施例的云计算节点;
图2表示根据本发明一实施例的云计算环境;
图3表示根据本发明一实施例的抽象模型层;
图4a-4b分别示出了云计算系统的源环境和用于灾难恢复的目标环境的示意图;
图5示出了根据本发明一个实施例的用于灾难恢复的方法500的流程图;
图6示出了根据本发明一个实施例的用于灾难恢复的系统600的框图。
具体实施方式
下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整的传达给本领域的技术人员。
首先应当理解,尽管本公开包括关于云计算的详细描述,但其中记载的技术方案的实现却不限于云计算环境,而是能够结合现在已知或以后开发的任何其它类型的计算环境而实现。
云计算是一种服务交付模式,用于对共享的可配置计算资源池进行 方便、按需的网络访问。可配置计算资源是能够以最小的管理成本或与服务提供者进行最少的交互就能快速部署和释放的资源,例如可以是网络、网络带宽、服务器、处理、内存、存储、应用、虚拟机和服务。这种云模式可以包括至少五个特征、至少三个服务模型和至少四个部署模型。
特征包括:
按需自助式服务:云的消费者在无需与服务提供者进行人为交互的情况下能够单方面自动地按需部署诸如服务器时间和网络存储等的计算能力。
广泛的网络接入:计算能力可以通过标准机制在网络上获取,这种标准机制促进了通过不同种类的瘦客户机平台或厚客户机平台(例如移动电话、膝上型电脑、个人数字助理PDA)对云的使用。
资源池:提供者的计算资源被归入资源池并通过多租户(multi-tenant)模式服务于多重消费者,其中按需将不同的实体资源和虚拟资源动态地分配和再分配。一般情况下,消费者不能控制或甚至并不知晓所提供的资源的确切位置,但可以在较高抽象程度上指定位置(例如国家、州或数据中心),因此具有位置无关性。
迅速弹性:能够迅速、有弹性地(有时是自动地)部署计算能力,以实现快速扩展,并且能迅速释放来快速缩小。在消费者看来,用于部署的可用计算能力往往显得是无限的,并能在任意时候都能获取任意数量的计算能力。
可测量的服务:云系统通过利用适于服务类型(例如存储、处理、带宽和活跃用户帐号)的某种抽象程度的计量能力,自动地控制和优化资源效用。可以监测、控制和报告资源使用情况,为服务提供者和消费者双方提供透明度。
服务模型如下:
软件即服务(SaaS):向消费者提供的能力是使用提供者在云基础架构上运行的应用。可以通过诸如网络浏览器的瘦客户机接口(例如基于网络的电子邮件)从各种客户机设备访问应用。除了有限的特定于用户的应用配置设置外,消费者既不管理也不控制包括网络、服务器、操作系统、存储、乃至单个应用能力等的底层云基础架构。
平台即服务(PaaS):向消费者提供的能力是在云基础架构上部署消费者创建或获得的应用,这些应用利用提供者支持的程序设计语言和工具创建。消费者既不管理也不控制包括网络、服务器、操作系统或存储的底层云基础架构,但对其部署的应用具有控制权,对应用托管环境配置可能也具有控制权。
基础架构即服务(IaaS):向消费者提供的能力是消费者能够在其中部署并运行包括操作系统和应用的任意软件的处理、存储、网络和其他基础计算资源。消费者既不管理也不控制底层的云基础架构,但是对操作系统、存储和其部署的应用具有控制权,对选择的网络组件(例如主机防火墙)可能具有有限的控制权。
部署模型如下:
私有云:云基础架构单独为某个组织运行。云基础架构可以由该组织或第三方管理并且可以存在于该组织内部或外部。
共同体云:云基础架构被若干组织共享并支持有共同利害关系(例如任务使命、安全要求、政策和合规考虑)的特定共同体。共同体云可以由共同体内的多个组织或第三方管理并且可以存在于该共同体内部或外部。
公共云:云基础架构向公众或大型产业群提供并由出售云服务的组织拥有。
混合云:云基础架构由两个或更多部署模型的云(私有云、共同体云或公共云)组成,这些云依然是独特的实体,但是通过使数据和应用能够移植的标准化技术或私有技术(例如用于云之间的负载平衡的云突发流量分担技术)绑定在一起。
云计算环境是面向服务的,特点集中在无状态性、低耦合性、模块性和语意的互操作性。云计算的核心是包含互连节点网络的基础架构。
现在参考图1,其中显示了云计算节点的一个例子。图1显示的云计算节点10仅仅是适合的云计算节点的一个示例,不应对本发明实施例的功能和使用范围带来任何限制。总之,云计算节点10能够被用来实现和/或执行以上所述的任何功能。
云计算节点10具有计算机系统/服务器12,其可与众多其它通用或专用计算系统环境或配置一起操作。众所周知,适于与计算机系统/服务器12一起操作的计算系统、环境和/或配置的例子包括但不限于:个人计算 机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统﹑大型计算机系统和包括上述任意系统的分布式云计算技术环境,等等。
计算机系统/服务器12可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括执行特定的任务或者实现特定的抽象数据类型的例程、程序、目标程序、组件、逻辑、数据结构等。计算机系统/服务器12可以在通过通信网络链接的远程处理设备执行任务的分布式云计算环境中实施。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
如图1所示,云计算节点10中的计算机系统/服务器12以通用计算设备的形式表现。计算机系统/服务器12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机系统/服务器12典型地包括多种计算机系统可读介质。这些介 质可以是能够被计算机系统/服务器12访问的任意可获得的介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机系统/服务器12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图1未显示,通常称为“硬盘驱动器”)。尽管图1中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机系统/服务器12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机系统/服务器12交互的设备通信,和/或与使得该计算机系统/服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。 并且,计算机系统/服务器12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机系统/服务器12的其它模块通信。应当明白,尽管图中未示出,其它硬件和/或软件模块可以与计算机系统/服务器12一起操作,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
现在参考图2,其中显示了示例性的云计算环境50。如图所示,云计算环境50包括云计算消费者使用的本地计算设备可以与其相通信的一个或者多个云计算节点10,本地计算设备例如可以是个人数字助理(PDA)或移动电话54A,台式电脑54B、笔记本电脑54C和/或汽车计算机系统54N。云计算节点10之间可以相互通信。可以在包括但不限于如上所述的私有云、共同体云、公共云或混合云或者它们的组合的一个或者多个网络中将云计算节点10进行物理或虚拟分组(图中未显示)。这样,云的消费者无需在本地计算设备上维护资源就能请求云计算环境50提供的基础架构即服务(IaaS)、平台即服务(PaaS)和/或软件即服务(SaaS)。应当理解,图2显示的各类计算设备54A-N仅仅是示意性的,云计算节点10以及云计算环境50可以与任意类型网络上和/或网络可寻址连接的任意类型的计算设备(例如使用网络浏览器)通信。
现在参考图3,其中显示了云计算环境50(图2)提供的一组功能抽象层。首先应当理解,图3所示的组件、层以及功能都仅仅是示意性的,本发明的实施例不限于此。如图3所示,提供下列层和对应功能:
硬件和软件层60包括硬件和软件组件。硬件组件的例子包括:主机, 例如IBM
zSeries
系统;基于RISC(精简指令集计算机)体系结构的服务器,例如IBM pSeries
系统;IBM xSeries
系统;IBM BladeCenter
系统;存储设备;网络和网络组件。软件组件的例子包括:网络应用服务器软件,例如IBM WebSphere
应用服务器软件;数据库软件,例如IBM DB2
数据库软件。(IBM,zSeries,pSeries,xSeries,BladeCenter,WebSphere以及DB2是国际商业机器公司在全世界各地的注册商标)。
虚拟层62提供一个抽象层,该层可以提供下列虚拟实体的例子:虚拟服务器、虚拟存储、虚拟网络(包括虚拟私有网络)、虚拟应用和操作系统,以及虚拟客户端。
在一个示例中,管理层64可以提供下述功能:资源供应功能:提供用于在云计算环境中执行任务的计算资源和其它资源的动态获取;计量和定价功能:在云计算环境内对资源的使用进行成本跟踪,并为此提供帐单和发票。在一个例子中,该资源可以包括应用软件许可。安全功能:为云的消费者和任务提供身份认证,为数据和其它资源提供保护。用户门户功能:为消费者和系统管理员提供对云计算环境的访问。服务水平管理功能:提供云计算资源的分配和管理,以满足必需的服务水平。服务水平协议(SLA)计划和履行功能:为根据SLA预测的对云计算资源未来需求提供预先安排和供应。
工作负载层66提供云计算环境可能实现的功能的示例。在该层中,可提供的工作负载或功能的示例包括:地图绘制与导航;软件开发及生命周期管理;虚拟教室的教学提供;数据分析处理;交易处理以及高可用性管理等。高可用性管理可以在管理层64实现根据本发明实施例的云 计算系统的灾难恢复。
下面参考图4,其中图4a示出了云计算系统的源环境和用于灾难恢复的目标环境的示意图。
如图4a所示,云计算系统的源环境包括5个对象,DB服务器B、DB服务器C,Web服务器A,磁盘D以及磁盘E。根据本发明的一个实施例,公开了一种用于备份环境的方法。为了能够在云计算系统在实现有效的灾难恢复,需要识别源环境中的对象之间的互联信息,并利用源环境中的对象之间的互联信息备份源环境的拓扑结构信息。根据本发明的一个实施例,还公开了一种用于环境备份的系统,包括:识别设备,配置为识别环境中对象之间的互联信息;备份设备,配置为备份环境的拓扑结构信息,其中备份的拓扑结构信息包括对象之间的互联信息。根据本发明的一个实施例,拓扑结构信息包括源环境中的对象以及对象之间的互联信息,可以用拓扑结构图(图4a)表示。对象之间的互联信息包括:对象之间的连接类型和/或连接方式。可以利用表1的结构记录对象之间的互联信息。
对象ID属性对象ID属性
ID1{Port}ID2{Port}
ID1{Type,Capacity}ID3{Type,Capacity}
ID1{Info1,Info2,…}ID4{Info1,Info2,…}
表1
表1中:
对象ID字段:代表了每个对象的唯一标识;
属性字段:代表了对象之间的连接类型和/或连接方式。对象之间的连接类型有多种,可以是TCP/IP,SAN等。表1给出了三种示例,其中:
TCP/IP的连接属性可以用端口号{Port}来表示,表示对象通过相应的端口和其他对象相连;
SAN的连接属性可以用存储设备类型和容量的复合属性{Type,Capacity}来表示,其中存储容量可以为空,用于表示该对象是存储设备的使用者;
可能需要多种信息的复合属性{Info1,Info2,…}表示的其他连接属性。
利用上面给出的结构,图4a的源环境的对象之间的互联信息可以用表2来表示。这样,源环境的拓扑结构信息包括源环境的拓扑结构图(图4a)以及源环境中的对象之间的互联信息(表2)。
应该理解,TCP/IP和SAN是为了便于说明给出的示例,本发明不限于给出的这两种连接关系。现有技术中任何其他会造成互联限制的连接关系都适用于本发明。表1和表2的数据结构也是便于说明给出的示例,可以利用现有技术中任何其他适当的方式来记录对象之间的互联信息。
对象ID属性对象ID属性
Web服务器APort 1000DB服务器BPort 2000
DB服务器BPort 2000Web服务器APort 1000
Web服务器APort 1001DB服务器CPort 2000
DB服务器CPort 2000Web服务器APort 1001
DB服务器B{SCSI,NULL}磁盘D{SCSI,50TB}
磁盘D{SCSI,50TB}DB服务器B{SCSI,NULL}
DB服务器C{SCSI,NULL}磁盘E{SCSI,100TB}
磁盘E{SCSI,100TB}DB服务器C{SCSI,NULL}
表2
下面参见图5,其中示出了根据本发明的一个实施例的用于灾难恢复的方法500的流程图。根据本发明的用于灾难恢复的方法500从步骤502开始。
接下来,方法进入步骤504,其中获取目标环境的拓扑结构信息。根据本发明的一个实施例,拓扑结构信息除了包括对象之外,还包括对象之间的互联信息。对象之间的互联信息可以包括对象之间的拓扑连接关系,例如,连接类型和连接方式。参见图4b,其中显示了目标环境的一个示例,根据本发明的一个实施例,可以利用表1中的数据结构来记录图4b的目标环境中的对象之间的互联信息如下页表3所示。
接下来,方法进入步骤506,其中获取源环境的拓扑结构信息。仍参照图4a给出的源环境的示例,根据源环境的拓扑结构信息可以得到源环境的拓扑结构图(图4a),以及源环境中的对象之间的互联信息(表2)。应该理解,步骤504和506的次序是可以调换的。
接下来,方法进入步骤508,其中从目标环境的拓扑结构信息中寻找 与源
对象ID属性对象ID属性
A’Port 100-5000B’Port 100-5000
B’Port 100-5000A’Port 100-5000
A’Port 100-3000C’Port 100-3000
C’Port 100-3000A’Port 100-3000
C’Port 100-5000F’Port 100-5000
F’Port 100-5000C’Port 100-5000
B’Port 100-5000H’Port 100-5000
A’Port 100-5000H’Port 100-5000
… …
B’{SCSI,NULL}D’{SCSI,50TB}
D’{SCSI,50TB}B’{SCSI,NULL}
C’{SCSI,NULL}E’{SCSI,100TB}
E’{SCSI,100TB}C’{SCSI,NULL}
E’{SCSI,100TB}G’{SCSI,NULL}
G’{SCSI,NULL}C’{SCSI,NULL}
表3
环境的拓扑结构信息匹配的资源。根据本发明的一个实施例,从目标环境的拓扑结构图中寻找源环境的拓扑结构图的同构子图。可以利用现有技术中任意的子图匹配算法,例如基于Apriori的子图挖掘(AGF)算法或频繁子图挖掘(FSG)来完成上述过程。应当注意,在进行从目标环境的拓扑结构图中寻找源环境的拓扑结构图的同构子图的过程中,源环境的对象之间的互联信息是必须满足的,这样便能够从目标环境的拓扑结构信息中找到与源环境的拓扑结构信息匹配的资源。仍以图4b给出的目标环境为例,通过子图匹配,能够找到图4a给出的源环境的拓扑结构图的同构子图为对象(A’、B’、C’、D’、E’)构成的子图,根据对象之间的互联信息可以知道,该子图中源环境的对象之间的互联信息也是满足的。
接下来,方法进入步骤510,其中根据源环境的拓扑结构信息,利用找到的资源进行灾难恢复。根据本发明的一个实施例,根据源环境的拓扑结构信息在找到的同构子图中恢复源环境。仍以图4b给出的目标环境为例,Web服务器A恢复至对象A’,DB服务器B恢复至对象B’,DB服务器C恢复至对象C’,磁盘D恢复至对象D’,磁盘E恢复至对象E’。
下面参见图6,其中显示了根据本发明一个实施例的用于灾难恢复的系统600的框图。根据本发明一个实施例的用于灾难恢复的系统600包括:获取设备602,配置为获取目标环境的拓扑结构信息;以及获取源环境的拓扑结构信息;匹配设备604,配置为从目标环境的拓扑结构信息中寻找与源环境的拓扑结构信息匹配的资源;恢复设备606,配置为根据源环境的拓扑结构信息,利用找到的资源进行灾难恢复;其中拓扑结构信息包括对象之间的互联信息。
根据本发明的一个实施例,对象之间的互联信息包括对象之间的连接方式。其中拓扑结构信息用拓扑结构图表示,其中匹配设备604进一步配置为从目标环境的拓扑结构图中寻找源环境的拓扑结构图的同构子图。根据本发明的一个实施例,恢复设备606进一步配置为根据源环境的拓扑结构信息在找到的同构子图中恢复源环境。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个 连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中技术的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。