《针对存储分层的内容选择.pdf》由会员分享,可在线阅读,更多相关《针对存储分层的内容选择.pdf(26页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 104025058 A(43)申请公布日 2014.09.03CN104025058A(21)申请号 201280065670.0(22)申请日 2012.03.29G06F 12/00(2006.01)(71)申请人日立数据系统有限公司地址美国加利福尼亚州(72)发明人理查德罗杰斯 维塔利佐罗茨基阿兰G布莱恩特(74)专利代理机构北京银龙知识产权代理有限公司 11243代理人曾贤伟 杨继平(54) 发明名称针对存储分层的内容选择(57) 摘要一种用于管理系统(400)的内容在包括不允许止转功能的运行单元的存储单元(430)中的存储的方法,包括:建立存储分层规则(70。
2、2),所述存储分层规则设置用于指示什么内容适合存储在运行单元上和什么内容适合存储在止转单元上的策略,所述存储分层规则可应用于内容系统中的至少内容组,以确定在存储单元中存储的存储内容适合性和在存储单元之间的转移;以及基于所述存储分层规则、内容系统的状态和所述至少内容组的存储内容适合性,识别在存储单元之间转移的内容备选(706)。(85)PCT国际申请进入国家阶段日2014.06.30(86)PCT国际申请的申请数据PCT/US2012/031102 2012.03.29(87)PCT国际申请的公布数据WO2013/147783 EN 2013.10.03(51)Int.Cl.权利要求书3页 说明。
3、书12页 附图10页(19)中华人民共和国国家知识产权局(12)发明专利申请权利要求书3页 说明书12页 附图10页(10)申请公布号 CN 104025058 ACN 104025058 A1/3页21.一种在固定内容系统中用于管理内容的存储的方法,所述固定内容系统具有多个独立节点,用以在包括不允许止转功能的运行单元和允许止转功能的止转单元的多个存储单元中存储内容,所述方法包括:建立存储分层规则,所述存储分层规则设置用于指示什么内容适合存储在运行单元上和什么内容适合存储在止转单元上的策略,所述存储分层规则可应用于内容系统中的至少内容组,以确定在存储单元中存储的存储内容适合性和在存储单元之间的。
4、转移;监视内容系统的状态;以及基于所述存储分层规则、内容系统的状态和所述至少内容组的存储内容适合性,识别在存储单元之间转移的内容备选,所述存储单元之间转移包括在运行单元和止转单元之间的转移。2.根据权利要求1所述的方法,其中建立存储分层规则来基于规则集合评估内容,以确定所述存储内容适合性,所述规则集合包括期望使用、生存周期和内容年限和内容的一个或多个冗余备份拷贝的存在。3.根据权利要求1所述的方法,其中所述存储分层规则包括:“从不”规则,应用于要存储在从不会止转的存储单元上的内容;“仅保护拷贝”规则,应用于作为在止转单元中存储的备选的备份拷贝的内容;以及“摄取之后X时间量”规则,应用于在内容系。
5、统中驻留了可配置时间量X而足以成为要存储在止转单元上的备选的内容。4.根据权利要求1所述的方法,其中建立所述存储分层规则,使得当适合的内容所驻留的运行单元达到可配置消耗利用阈值时,仅将所述适合的内容转移到止转单元。5.根据权利要求1所述的方法,其中监视内容系统的状态包括:确定内容所驻留的运行单元是否达到用于指示允许将所述内容转移到止转单元的可配置消耗利用阈值,并确定在止转单元上是否存在从运行单元接收所述内容的可用空间。6.根据权利要求1所述的方法,还包括:基于所述识别来转移内容;以及基于针对存储内容和作为所述监视、识别和转移的结果转移内容的系统需求,管理每个止转单元的状态进入适合的上电或下电状。
6、态。7.根据权利要求1所述的方法,还包括:从多个服务计划中选择一服务计划,每个服务计划规定存储分层法则,所述存储分层法则利用存储器子系统中包括运行单元和止转单元的不同存储类别的存储单元和设置用于确定内容在不同存储类别的存储单元中存储的存储内容适合性的策略的存储分层规则的组合。8.一种用于管理内容在内容系统中的存储的装置,所述内容系统具有多个独立节点,用以在包括不允许止转功能的运行单元和允许止转功能的止转单元的多个存储单元中存储所述内容,所述装置包括处理器、内存和存储分层服务模块,所述存储分层服务模块被配置为:建立存储分层规则,所述存储分层规则设置用于指示什么内容适合存储在运行单元上权 利 要 。
7、求 书CN 104025058 A2/3页3和什么内容适合存储在止转单元上的策略,所述存储分层规则可应用于内容系统中的至少内容组,以确定在存储单元中存储的存储内容适合性和在存储单元之间的转移;监视内容系统的状态;以及基于所述存储分层规则、内容系统的状态和所述至少内容组的存储内容适合性,识别在存储单元之间转移的内容备选,所述存储单元之间转移包括在运行单元和止转单元之间的转移。9.根据权利要求8所述的装置,其中建立存储分层规则来基于规则集合评估内容,以确定所述存储内容适合性,所述规则集合包括期望使用、生存周期和内容年限和内容的一个或多个冗余备份拷贝的存在。10.根据权利要求8所述的装置,其中所述存。
8、储分层规则包括:“从不”规则,应用于要存储在从不会止转的存储单元上的内容;“仅保护拷贝”规则,应用于作为在止转单元中存储的备选的备份拷贝的内容;以及“摄取之后X时间量”规则,应用于在内容系统中驻留了可配置时间量X而足以成为要存储在止转单元上的备选的内容。11.根据权利要求8所述的装置,其中建立所述存储分层规则,使得当适合的内容所驻留的运行单元达到可配置消耗利用阈值时,仅将所述适合的内容转移到止转单元。12.根据权利要求8所述的装置,其中监视内容系统的状态包括:确定内容所驻留的运行单元是否达到用于指示允许将所述内容转移到止转单元的可配置消耗利用阈值,并确定在止转单元上是否存在从运行单元接收所述内。
9、容的可用空间。13.根据权利要求8所述的装置,还包括:转移模块,被配置为基于所述识别来转移内容;以及存储单元状态管理模块,被配置为基于针对存储内容和作为所述监视、识别和转移的结果转移内容的系统需求,管理每个止转单元的状态进入适合的上电或下电状态。14.根据权利要求8所述的装置,还包括:服务计划选择模块,被配置为提供从多个服务计划中选择一服务计划的用户接口,每个服务计划规定存储分层法则,所述存储分层法则利用存储器子系统中包括运行单元和止转单元的不同存储类别的存储单元和设置用于确定内容在不同存储类别的存储单元中存储的存储内容适合性的策略的存储分层规则的组合。15.根据权利要求8所述的装置,其中所述。
10、运行单元包含在被配置为不允许止转功能的RAID组中,其中所述止转单元包含在被配置为允许止转的RAID组中。16.根据权利要求8所述的装置,其中存储单元包括具有不同可靠性、性能或成本特性中的至少一个的不同类别的存储单元,所述装置还包括:转移模块,被配置为基于所述识别来转移内容,并基于所述内容的元数据准则,在不同类别的运行单元和止转单元之间移动内容,对象元数据准则包括“数据类型”、“自上次访问的时间”、“自摄取的时间”和“内容版本”中的一个或多个。权 利 要 求 书CN 104025058 A3/3页417.一种存储多个指令的计算机可读存储介质,所述多个指令用于控制数据处理器管理内容在内容系统中的。
11、存储,所述内容系统具有多个独立节点,用以在包括不允许止转功能的运行单元和允许止转功能的止转单元的多个存储单元中存储内容,所述多个指令包括:指令,使所述数据处理器建立存储分层规则,所述存储分层规则设置用于指示什么内容适合存储在运行单元上和什么内容适合存储在止转单元上的策略,所述存储分层规则可应用于内容系统中的至少内容组,以确定在存储单元中存储的存储内容适合性和在存储单元之间的转移;指令,使所述数据处理器监视内容系统的状态;以及指令,使所述数据处理器基于所述存储分层规则、内容系统的状态和所述至少内容组的存储内容适合性,识别在存储单元之间转移的内容备选,所述存储单元之间转移包括在运行单元和止转单元之。
12、间的转移。18.根据权利要求17所述的计算机可读存储介质,其中使所述数据处理器监视内容系统的状态的指令包括:指令,使所述数据处理器确定内容所驻留的运行单元是否达到指示允许将所述内容转移到止转单元的可配置消耗利用阈值,并确定在止转单元上是否存在从运行单元接收所述内容的可用空间。19.根据权利要求17所述的计算机可读存储介质,其中所述多个指令还包括:指令,使所述数据处理器基于所述识别来转移内容;以及指令,使所述数据处理器基于针对存储内容和作为所述监视、识别和转移的结果转移内容的系统需求,管理每个止转单元的状态进入适合的上电或下电状态。20.根据权利要求17所述的计算机可读存储介质,其中所述多个指令。
13、还包括:指令,使所述数据处理器提供从多个服务计划中选择一服务计划的用户接口,每个服务计划规定存储分层法则,所述存储分层法则利用存储器子系统中包括运行单元和止转单元的不同存储类别的存储单元和设置用于确定内容在不同存储类别的存储单元中存储的存储内容适合性的策略的存储分层规则的组合。权 利 要 求 书CN 104025058 A1/12页5针对存储分层的内容选择背景技术0001 本发明总体上涉及存储器系统,尤其涉及用于基于针对存储分层(storage tiering)的内容选择来管理内容系统中的内容存储的系统和方法。0002 固定内容系统(FCS)包含不变的数据。实际上,在后续仅有小比例的内容被访问。
14、;然而,数据仍然保留在存储介质上,这继续耗费能源。即使介质上的大量内容不被访问仍保持介质旋转会浪费能源。0003 美国专利No.8,006,111公开了止转(spin-down)的概念。在这种方式下,基于文件的活动性来确定盘驱动器的文件移动和能态。将在活动的存储器中变得不活动的文件组连续转移到各疏散的活动/不活动的盘驱动器,使得当对活动/不活动的盘驱动器的访问达到使活动/不活动的盘驱动器下电(power down)的不活动阈值时,每个活动/不活动的盘驱动器加载具有类似访问可能性的文件。关注各个盘驱动器。仅当达到不活动阈值时才移动文件。发明内容0004 本发明的示例性实施例提供了一种固定内容系统。
15、(FCS),所述固定内容系统可以是复制对象存储系统或内容平台,并且将存储介质分为两种类型,即,运行单元(RU)和止转单元(SDU)。RU被指派用于可能使用的内容,SDU包含不可能使用的内容。周期性地,FCS将会基于可配置服务计划和存储分层策略来评估内容,以识别在RU介质和SDU介质之间移动的备选。存储分层基于系统状态来指示系统行为,以优化对象移动和设备操控,使得仅当系统条件指示该需求时才执行数据移动。被监视的系统状态是对象所驻留在的RU是否达到消耗利用阈值(即,空间/存储消耗阈值),以及在SDU上是否存在针对该对象可用的空间。消耗利用阈值的示例是所消耗的存储器(例如,70的所消耗存储器可以用作。
16、缺省)。存储分层规则(STR)规定对象备选驻留于SDU或RU上的策略。在特定实施例中,该设置是“从不”、“仅保护拷贝”、或“摄取之后N天”。STR可以应用于FCS中的所有对象或对象集合。0005 在特定实施例中,在后台执行用于分层的内容识别。当识别内容时,SDU介质将会旋转(如果必要),并且移动对象。在不活动超时之后,SDU介质将会止转。如果请求FCS的内容,并且该内容驻留于SDU上,则SDU将会旋转,并将内容读取并返回请求者。在不活动超时之后,SDU介质将再次止转。0006 本发明与美国专利No.8,006,111在多个方面不同。例如,移动文件的确定不是基于单独的文件的活动性。而是,用于确立。
17、文件移动的标准包括文件年限、冗余备份拷贝的存在等。尽管美国专利No.8,006,111关注于各个盘驱动器,但是根据本发明特定实施例的解决方案包括在盘阵列中实现的功能,并且关注点在于盘驱动器集合形式的RAID组。此外,根据本发明特定实施例的解决方案将不会将内容移出活动的存储器,除非在该内容所驻留于的存储器上已经达到空间/存储消耗阈值。相反,美国专利No.8,006,111将仅在达到不活动阈值时才移动文件。0007 固定内容系统具有多个独立节点,用以在包括不允许止转功能的运行单元和允许说 明 书CN 104025058 A2/12页6止转功能的止转单元的多个存储单元中存储内容。根据本发明的一方面,。
18、一种用于管理内容的存储的方法包括:建立存储分层规则,所述存储分层规则设置用于指示什么内容适合存储在运行单元上和什么内容适合存储在止转单元上的策略,所述存储分层规则可应用于内容系统中的至少内容组,以确定在存储单元中存储的存储内容适合性和在存储单元之间的转移;监视内容系统的状态;以及基于所述存储分层规则、内容系统的状态和所述至少内容组的存储内容适合性,识别在存储单元之间转移的内容备选,所述存储单元之间转移包括在运行单元和止转单元之间的转移。0008 在一些实施例中,建立存储分层规则来基于规则集合评估内容,以确定存储内容适合性,所述规则集合包括期望使用、生存周期和内容年限和内容的一个或多个冗余备份拷。
19、贝的存在。所述存储分层规则包括:“从不”规则,应用于要存储在从不会止转的存储单元上的内容;“仅保护拷贝”规则,应用于作为在止转单元中存储的备选的备份拷贝的内容;以及“摄取之后X时间量”规则,应用于在内容系统中驻留了可配置时间量X、足以成为要存储在止转单元上的备选的内容。建立所述存储分层规则,使得当适合的内容所驻留的运行单元达到可配置消耗利用阈值时仅将所述适合的内容转移到止转单元。监视内容系统的状态包括:确定内容所驻留的运行单元是否达到用于指示允许将内容转移到止转单元的可配置消耗利用阈值,并确定在止转单元上是否存在可用的从运行单元接收所述内容的空间。0009 在特定实施例中,所述方法包括:基于所。
20、述识别来转移内容;以及基于针对存储内容和作为所述监视、识别和转移的结果转移内容的系统需求,管理每个止转单元的状态进入适合的上电或下电状态。所述方法还包括:从多个服务计划中选择一服务计划,每个服务计划规定存储分层法则,所述存储分层法则利用存储器子系统中包括运行单元和止转单元的不同存储类别的存储单元和设置用于确定内容在不同存储类别的存储单元中存储的存储内容适合性的策略的存储分层规则的组合。0010 本发明的另一方面提出一种用于管理内容在内容系统中的存储的装置,所述内容系统具有多个独立节点,用以在包括不允许止转功能的运行单元和允许止转功能的止转单元的多个存储单元中存储所述内容。所述装置包括处理器、内。
21、存和存储分层服务模块。所述存储分层服务模块被配置为:建立存储分层规则,所述存储分层规则设置用于指示什么内容适合存储在运行单元上和什么内容适合存储在止转单元上的策略,所述存储分层规则可应用于内容系统中的至少内容组,以确定在存储单元中存储的存储内容适合性和在存储单元之间的转移;监视内容系统的状态;以及基于所述存储分层规则、内容系统的状态和所述至少内容组的存储内容适合性,识别在存储单元之间转移的内容备选,所述存储单元之间转移包括在运行单元和止转单元之间的转移。0011 在一些实施例中,所述装置还包括:转移模块,被配置为基于所述识别来转移内容;和存储单元状态管理模块,被配置为基于针对存储内容和作为所述。
22、监视、识别和转移的结果转移内容的系统需求,管理每个止转单元的状态进入适合的上电或下电状态。所述装置还包括:服务计划选择模块,被配置为提供用于从多个服务计划中选择一服务计划的用户接口,每个服务计划规定存储分层法则,所述存储分层法则利用存储器子系统中包括运行单元和止转单元的不同存储类别的存储单元和设置用于确定内容在不同存储类别的存储单元中存储的存储内容适合性的策略的存储分层规则的组合。运行单元包含在被配置为不允许止转功能的RAID组中,其中止转单元包含在被配置为允许止转的RAID组中。存储说 明 书CN 104025058 A3/12页7单元包括具有不同可靠性、性能或成本特性中的至少一个的不同类别。
23、的存储单元。所述装置还包括:转移模块,被配置为基于所述识别来转移内容,并基于所述内容的元数据准则,在不同类别的运行单元和止转单元之间移动内容,对象元数据准则包括“数据类型”、“自上次访问的时间”、“自摄取的时间”和“内容版本”中的一个或多个。0012 本发明的另一方面提出一种存储多个指令的计算机可读存储介质,所述多个指令用于控制数据处理器来管理内容在内容系统中的存储,所述内容系统具有多个独立节点,用以在包括不允许止转功能的运行单元和允许止转功能的止转单元的多个存储单元中存储内容。所述多个指令包括:指令,使所述数据处理器建立存储分层规则,所述存储分层规则设置用于指示什么内容适合存储在运行单元上和。
24、什么内容适合存储在止转单元上的策略,所述存储分层规则可应用于内容系统中的至少内容组,以确定在存储单元中存储的存储内容适合性和在存储单元之间的转移;指令,使所述数据处理器监视内容系统的状态;以及指令,使所述数据处理器基于所述存储分层规则、内容系统的状态和所述至少内容组的存储内容适合性,识别在存储单元之间转移的内容备选,所述存储单元之间转移包括在运行单元和止转单元之间的转移。0013 结合特定实施例的以下详细描述,本发明的这些和其他特征和优势对于本领域技术人员来说将变得清楚。附图说明0014 图1是可以应用本发明的方法和装置的固定内容存储器存档的简化方框图。0015 图2是独立节点的冗余阵列的简化。
25、表示,其中每个节点都是对称的并且支持存档群组应用(archive cluster application)。0016 图3是在给定节点上运行的存档群组应用的不同组件的高层表示。0017 图4是具有与用于存储固定内容的基于块的存储子系统耦接的节点组的固定内容系统的简化图。0018 图5是示意性地说明具有存储分层服务(STS)模块、列出节点中的存储介质单元及其状态的存储介质状态表和存储管理器的多个实例的节点的简化图。0019 图6示出了说明用于存储分层的内容选择过程的示例。0020 图7是说明STS模块所执行的STS的流程图的示例。0021 图8示出了用于从多个服务计划中选择一服务计划的用户接口的。
26、示例,每个服务计划规定存储分层法则,所述用户接口包括:(a)用于创建服务计划并选择分层策略的屏幕截图,(b)示出当选择创建针对名称空间的服务计划时所出现的屏幕截图,和(c)示出如何改变现有名称空间上的服务计划的屏幕截图。具体实施方式0022 以下将参照形成了公开文本一部分的附图详细描述本发明,并且在其中通过例证而非限制的方法显示了可以实现本发明的示例性实施例。在附图中,贯穿多个视图,相似的数字描述基本相似的组件。另外,应当注意的是,在如以下所描述的和如在附图中所示出的,具体实施方式提供了各种示例性实施例的同时,本发明不限于本文中所描述和显示的实施例,而是可以扩展到其他实施例,如同本领域技术人员。
27、所知或将会知道的那样。在说明说 明 书CN 104025058 A4/12页8书中提及的“一个实施例”、“这个实施例”、或“这些实施例”意为本发明的至少一个实施例中包括结合实施例所描述的特定特征、结构或特点,并且在说明书中的不同位置出现的这些短语不必全部指代相同的实施例。此外,在以下具体实施方式中,为了提供对本发明透彻的理解,阐明了数个特定细节。然而,对于本领域普通技术人员来说,实现本发明并不完全需要这些特定细节。在其他环境下,众所周知的结构、材料、电路、过程和接口没有被详细描述,和/或可以以方框图的形式示出,以便不会不必要的模糊本发明。0023 此外,以下详细描述的一些部分被呈现为计算机内运。
28、行的算法和符号表达的形式。这些算法描述和符号表达是数据处理领域技术人员使用的手段,来最有效地将他们的创新实质传达给本领域其他技术人员。算法是导致所期望的结束状态或结果的一系列限定的步骤。在本发明中,为了实现有形结果,所执行的步骤需要有形量的物理操纵。虽然不是必要地,但通常来说,这些量表现为能够被存储、传送、组合、比较、和其他形式操纵的电或磁信号。主要因为通用的原因,已经证明将这些信号指代为比特(bits)、值(values)、元素(elements)、符号(symbols)、字符(characters)、术语(terms)、数(numbers)、指令(instructions)等有时是方便的。。
29、然而,应当记住,全部这些和相似术语应当与适当的物理量相关联并且只不过是用在这些量上的方便的标签。除非特别做出与以下讨论明显相反的阐述,否则应当理解为在整篇说明书中,使用诸如“处理”、“计算”、“算出”、“确定”、“显示”等术语的讨论可以包括计算机系统或其他信息处理设备的动作和过程,他们将在计算机系统的注册表和存储器中表现为物理(电子)量的数据操纵和变换为在计算机系统存储器或注册表或其他这种信息存储器、传输或显示设备中相似地表现为物理量的其他数据。0024 本发明还涉及用以执行本文中操作的装置。该装置可以是为所需目的而特定构造的,或者可以包含由一个或多个计算机程序选择性触发或重新配置的一个或多个。
30、通用计算机。这种计算机程序可以被存储在计算机可读存储器介质中,例如但不限制于光盘、磁盘、只读存储器、随机存取存储器、固态设备和驱动器、或适于存储电子信息的任何其他类型的介质。本文中所呈现的算法和显示不是固有地与任何特定计算机或其他装置相关联的。根据本文中的教导,各种通用系统都可以与程序一起使用,或者可以证实构造更专业的装置来执行所期望的方法步骤是方便的。此外,本发明不参照任何特定编程语言进行描述。将会理解的是,如本文中所描述的,多种编程语言可以被用来实现发明的教导。编程语言的指令可以由一个或多个处理设备运行,例如,中央处理单元(CPU)、处理器或控制器。0025 如同以下将更详细描述的,本发明。
31、的示例性实施例提供了用以基于针对存储分层的内容选择来管理固定内容在固定内容系统中的存储的装置、方法和计算机程序。0026 1.固定内容分布式数据存储器0027 已经发展了这种需要:对于“固定内容”的高度可用、可靠和持久方式的存档存储代替或补充传统的磁带或光学存储方案。术语“固定内容”典型的是指为了参考或其他目的,希望不进行修改而保存的任何类型的数字信息。这种固定内容的示例包括电子邮件、文档、诊断图像、检测图像、声音记录、影片和视频等等,还有许多其他示例。已经出现了传统的独立节点冗余阵列(RAIN)存储手段,作为为了存储这种固定内容信息资产而产生大型在线存档的选择架构。通过允许节点按需接入或退出。
32、群组,RAIN架构将存储器群组隔离于一个或多个节点的故障。通过在多个节点上复制数据,RAIN型存档能够自动补偿节点故障或移除。典型地,RAIN系统主要被创建为从封闭系统中的相同组件设计的硬件器件。说 明 书CN 104025058 A5/12页90028 图1显示了一个这种可扩展的基于磁盘的存档存储器管理系统。节点可以包括不同硬件,并且因此可以被认为是“异构的” (heterogeneous)。节点典型地具有至存储区域网络(SAN)中的一个或多个存储磁盘的通路,该存储磁盘可以是实际物理存储器磁盘或者虚拟存储器磁盘。在每个节点上支持的存档群组应用(并且,可选地,运行应用的下层操作系统),可以是相。
33、同的或基本上相同的。每个节点上的软件栈(可以包括操作系统)是对称的,而硬件可以是异构的。如图1所示,企业能够使用系统,产生对于许多不同类型的固定内容信息的永久存储,所述固定内容信息诸如文档、电子邮件、卫星图像、诊断图像、检测图像、声音记录、视频等等,以及其他信息。这些类型当然仅仅是示例。通过在独立服务器或者称为存储节点上复制数据,实现了高度可靠性。优选地,每个节点与其对等点(peer)对称。这样,因为优选地任何给定节点能够执行所有功能,因此任何一个节点的故障在存档的可用性上产生很少的影响。0029 如同在共同拥有的美国专利No.7,155,466中所描述的,已知在基于RAIN的存档系统中,并入。
34、在每个节点上运行的捕捉、保存、管理和检索数字资产的分布式软件应用。图2显示了一个这种系统。将单独存档的物理范围指代为群组(或系统)。典型地,群组不是单个设备,而是设备集。设备可以是同类的或异构的。典型的设备是运行诸如Linux操作系统的计算机或机器。托管在日常硬件上的基于Linux系统的群组提供了能够被扩展的存档,从几个存储器节点服务器扩展至存储数以千计的数太字节数据的许多节点。这种构架保证了存储能力能够与组织结构增长的存档需求一直并驾齐驱。0030 在诸如以上描述的存储系统中,典型地将数据随机分布在群组上,以使得一直保护存档不发生设备故障。如果磁盘或节点故障,则群组自动在维持相同数据副本的群。
35、组中的其他节点上停止作用。该手段在数据保护的角度上运作良好的同时,为群组计算的数据丢失平均时间(MTDL)可能没有所期望的高。具体来说,MTDL典型地代表计算出的在存档将丢失数据之前的时间量。在数字存档中,不希望任何数据丢失,但是由于硬件和软件组件的特性,一直都存在这种事件发生的可能性(无论多遥远)。由于对象和它们的拷贝在存档群组中随机分布,因而MTDL可能低于需求而结束,例如,如果由于在给定节点中的给定磁盘(镜像拷贝被存储在其上)意外地故障了,则所需的对象拷贝不可用。0031 如图2所示的,实现本发明的示意性群组优选地包括以下通常类型的元件:节点202、一对网络交换机204、配电单元(PDU。
36、)206、以及不中断电源(UPS)208。节点202典型地包括一个或多个日常服务器并包含CPU(例如,Intel86、适当的随机存取存储器(RAM)、一个或多个硬盘驱动器(例如,标准IDE/SATA、SCSI等)、以及两个或多个网络接口(NIC)卡。典型的节点是具有2.4GHz芯片、512MB RAM以及六(6)个200GB硬盘驱动器的2U机架式单元。然而,这并不是限制。网络交换机204典型地包括能够在节点之间点对点通信的内部交换机205和允许额外的群组访问每个节点的外部交换机207。每个交换机需要足够的端口来操作群组中所有潜在的节点。以太网或GigE交换机可以被用于这个目的。使用PDU206。
37、为所有节点和交换机供电,并且使用UPS208保护所有节点和交换机。尽管不意为限制,但是典型的群组可以被连接到网络,诸如公共互联网、企业内部互联网、或其他广域或局域网。在示例性实施例中,在企业环境内实现群组。例如,通过在站点的集体DNS命名服务器中导航可以实现。例如,群组域因此可以是现有域的新的子域。在代表性的实现中,在集体DNS服务器中将子域委托给在群组自身中的命名服务器。终端用户使用任何传统的接说 明 书CN 104025058 A6/12页10口或访问工具访问群组。例如,这样可以在任何基于IP的协议(HTTP、FTP、NFS、AFS、SMB、网页服务等)上经由API,或通过任何其他已知或以。
38、后将研发的访问方法、服务、程序或工具来实现对群组的访问。0032 客户端应用通过诸如标准UNIX文件协议,或HTTP API的一个或多个类型的外部网关访问群组。优选地通过虚拟文件系统来公开存档,该虚拟文件系统能够随意符合任何标准的面向UNIX文件协议的设施。这些包括NFS、FTP、SMB/CIFS等。0033 在一个实施例中,联网在一起(例如,经由以太网)成为群组的独立节点的冗余阵列(H-RAIN)上运行存档群组应用。给定节点的硬件可以是异构的。然而,为了得到最大可靠性,每个节点优选地运行分布式应用的实例300(可以是相同实例,或基本上相同的实例),其包括多个运行时间组件,如图3中所示。这样,。
39、虽然硬件可以是异构的,但是节点上的软件栈(至少当它涉及本发明时)是相同的。这些软件组件包括网关协议层302、访问层304、文件处理和管理层306以及内核组件层308。为了说明的目的而提出“层”的名称,如同普通技术人员将领会的,可以用其他有意义的方法来体现功能的特征。可以集成或不集成一个或多个层(或其中的组件)。一些组件可以在层之间共享。0034 网关协议层302中的网关协议提供现有应用的透明。具体来说,网关提供诸如NFS310和SMB/CIFS312的本地文件服务,以及网页服务API来建立定制应用。还提供了HTTP支持314。访问层304提供对存档的访问。具体来说,根据本发明,固定内容文件系统。
40、(FCFS)316模拟本地文件系统来提供对存档对象的完全访问。FCFS给予了应用对存档内容的直接访问,如同他们是普通文件一样。优选地,存档的内容表现为其原始格式,而将元数据公开为文件。FCFS316提供了传统观点的目录和访问权限和流程的文件级(le-level)调用,使得管理员能够以他们所熟悉的方式来规定固定内容数据。文件访问调用优选地被用户空间后台程序中断,并被路由给适当的内核元件(在层308)中,其对调用应用动态地产生适当的视图。FCFS调用优选地被存档策略约束,以辅助自主的存档管理。因此,在一个示例中,管理员或应用不能删除保存期限(给定策略)仍然有效的存档对象。0035 访问层304优选。
41、地还包括网页用户界面(UI)318和SNMP网关320。网页用户界面318优选地实现为管理员控制台,提供对文件处理和管理层306中的管理引擎322的交互访问。管理控制台318优选地是密码保护的、提供存档的动态视图的基于网页的GUI,包括存档对象和单独节点。SNMP网关320向存储管理应用提供了对管理引擎322的轻易访问,这使得他们安全地监视和控制群组动作。管理引擎监视群组动作,包括系统和策略事件。文件处理和管理层306还包括请求管理器处理324。请求管理器324协调来自外部世界(经过访问层304)的全部请求,以及来自内核组件层308中的策略管理器326的内部请求。0036 除策略管理器326以。
42、外,内核组件还包括元数据管理器328和存储管理器330的一个或多个实例。元数据管理器328优选地被安装在每个节点上。共同地,元数据管理器在群组中作为分布式数据库,用于管理所有存档对象。在给定的节点上,元数据管理器328管理存档对象的子集,其中优选地,每个对象在外部文件(“EF”,为了存储而进入存档的数据)和存档数据物理所在的内部文件(每个都是“IF”)组之间映射。相同的元数据管理器328还管理从其他节点上复制的存档对象组。这样,每个外部文件的当前状态对于数个节点上的多个元数据管理器一直都是可用的。如果发生节点故障,则其他节点上的元数据管理器继续提供对先前由故障节点管理的数据的访问。存储管理器330提供了文件系统层,对说 明 书CN 104025058 A10。