《如数据存储操作的自适应能耗管理的数据处理资源的能耗管理.pdf》由会员分享,可在线阅读,更多相关《如数据存储操作的自适应能耗管理的数据处理资源的能耗管理.pdf(33页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103279181 A(43)申请公布日 2013.09.04CN103279181A*CN103279181A*(21)申请号 201210585073.2(22)申请日 2008.08.2860/968,500 2007.08.28 US200880105016.1 2008.08.28G06F 1/32(2006.01)(71)申请人 COMMVAULT系统公司地址美国新泽西州(72)发明人马库斯S穆勒(74)专利代理机构北京万慧达知识产权代理有限公司 11111代理人白华胜 段晓玲(54) 发明名称如数据存储操作的自适应能耗管理的数据处理资源的能耗管理(57)。
2、 摘要本发明涉及一种如数据存储操作的自适应能耗管理的数据处理资源的能耗管理。本发明描述了实施节能行动的系统和方法。在一些实施例中,该系统基于来自该系统的信息制定一节能策略,并在一企业或一个或多个建筑内实施该策略,比如在一个数据存储环境内。在一些实施例中,该系统根据来自该系统的信息而增加或改动总过滤器或系统性能。(30)优先权数据(62)分案原申请数据(51)Int.Cl.权利要求书1页 说明书17页 附图14页(19)中华人民共和国国家知识产权局(12)发明专利申请权利要求书1页 说明书17页 附图14页(10)申请公布号 CN 103279181 ACN 103279181 A1/1页21.。
3、一计算系统使用的方法,用以在一个建筑内或多个建筑之间执行节能行动,其中,所述节能行动与数据处理操作有关,所述方法包括:创建或接收有关数据处理操作的信息;接收或产生有关所述建筑内至少一个数据处理组件的能耗的信息;确定一个或多个应被执行的节能行动,其中,所述将被执行的行动是基于所述信息和所述能耗信息;根据所述能耗信息和所述信息,选择或执行所述被确定的一个或多个节能行动;以及其中,所述一个或多个节能行动包括重新安排或合并在一个队列中的任务至一可用时间窗口内的另一天或一个更晚的时间。2.如权利要求1所述的方法,其中,所述计算系统包括一分级数据存储系统,其包括两个或更多数据存储单元,其中,每一数据存储单。
4、元包括一可在所述数据存储系统内执行存储操作的数据存储资源,其中,每一数据存储资源具有已知的可估计的能耗信息。3.如权利要求1所述的方法,其中,所述一个或多个节能行动包括为未来数据存储操作重组数据存储资源。4.如权利要求1所述的方法,其中,所述一个或多个节能行动包括把一个或多个数据存储任务转移至另一数据存储资源。5.如权利要求1所述的方法,其中,所述信息包括有关在所述一个或多个数据存储资源处被延迟的存储操作的信息,延迟存储操作可用的窗口的信息,以及能耗预测信息。权 利 要 求 书CN 103279181 A1/17页3如数据存储操作的自适应能耗管理的数据处理资源的能耗管理【 技术背景 】0001。
5、 节能仍然是IT专业人员与设施管理人员的愿望。例如,美国环保署(EPA)于2007年8月2日发布了一个报告,该报告警示了运营数据中心的能源损耗的增加。该报告的主要发现之一是若继续当前的趋势,美国数据中心和数据服务器的能源消耗将在2011年翻番,达到100,000,000,000千瓦每小时,每年将耗费公众和私营机构74亿美元,并且需要新增10个发电厂。0002 数据中心使用数据存储组件,其中一些组件每年消耗大量能源。数据存储操作通常依赖网络和其他复杂系统,其中,传输和其他操作在不同的地方、不同的时间、为不同的需求而发生,所有这些操作在不同的时间都消耗不同程度的能源。分级系统可被采用,其中,通过一。
6、存储管理组件,各种存储组件被相互连接,并与系统连接。一些组件可以提供对该分级结构中处于较低级别的组件过滤或控制的能力。从而,该系统可以利用这些存储管理组件来操作或“监视”该系统及其各组件。然而,许多管理组件被简单地用于管理和收集来自各组件的数据。但这些管理组件没能考量各组件的功率要求(power requirement)。根据以下详细描述,业界技术人员将意识到还存在其他问题。【 附图说明 】0003 图1A为一框图,展示了一设有一数据处理设施的建筑。0004 图1B为一框图,展示了一总系统服务器,其中一部分位于图1A所示的数据处理设施内。0005 图2为一框图,展示了一分级数据存储系统。000。
7、6 图3为一框图,展示了一存储操作单元的组件。0007 图4为一框图,展示了一总单元和数据存储单元之间的互动。0008 图5为一流程图,展示了发送一能源负荷报告实例以供一总管理器或服务器使用。0009 图6为一流程图,展示了根据一能源负载报告实施一行动(action)的程序。0010 图7A为一流程图,展示了决定一行动的程序。0011 图7B为一流程图,展示了实施一行动的程序。0012 图8为一流程图,展示了重新分配数据传送任务的程序。0013 图9为一流程图,展示了设置总电源控制过滤器的程序。0014 图10为一屏幕显示的例子,展示了用户界面的屏幕显示。0015 图11展示了数据存储装置的能。
8、耗曲线。0016 图12展示了总系统服务器所采用的,用以制定电源控制分配和数据存储任务时间安排的一个表。0017 图13为一框图,展示了一可用于实施本发明各方面的数据存储装置。0018 图14为一流程图,展示了收集数据和作出数据处理决定以降低能耗的程序。说 明 书CN 103279181 A2/17页40019 在这些图中,为便于理解和方便的目的,相同的标号和缩写指示具有相同或相似功能的元件或动作。为便于识别对任何特定元件或动作的讨论,一标号中最显著的数字是首次介绍该元件的图的编号(例如,元件810首先在图8中被介绍并讨论)。0020 【详细描述】0021 以下详细描述的是对功率敏感的系统,其。
9、在至少一个数据处理设施内,或一个或以上建筑内管理能耗。虽然本发明的各方面是针对一数据存储系统进行描述,但业界一般技术人员将意识到本发明可应用于任何数据处理组件,或位于一个或多个建筑内,比如一个校园内,的任何耗能装置。该系统可被缩放以为从几个机器到大规模国际网络的任何规模的企业提供节能。事实上,因为各机器按地理分布于不同地方,数据可以被传送并被存储于电能较便宜的地方,比如哥伦比亚河谷、冰岛、中东或世界上能够提供低价能源的其他地方。0022 举例来说,该技术与监视、控制或改变数据存储系统和它们的操作以节能的系统和方法相关。尽管结合特定的例子进行描述,以下所描述的系统可应用于并可采用任何无线或有线网。
10、络,或可存储数据以及把数据从一个点传送至另一个点的数据处理和存储系统,包括通信网络、公司网络、存储网络等。0023 举例来说,该技术提供一方法和系统,比如分级数据处理或存储系统,其通过将倾向性信息(trending information)或历史报告与从数据处理操作或/和在处理操作过程中获得的信息、或对未来操作和性能的预测数据相关联,来制定并实施节能行动。(一分级系统可以是一个包括最少两个组件的系统,其中,一个组件管理另一组件的至少一部分。)这些系统可采用灵活的存储策略(policies),并且可以在一给定期间监视操作、能耗以及数据的存储,以根据监视期间获得的结果或利用预测制定的结果,改变或重。
11、分配存储操作。该系统可在监视期间改变存储操作,或可利用获得的任何信息改变未来的存储操作。再次声明,虽然本发明的各方面是结合数据存储操作和组件来描述,其他数据处理操作和组件或任何位于一建筑内或分布于多个建筑内的耗能组件也一样适用。0024 以下为一个例子:该系统可查看安排好的未来数据存储操作及每一操作的特性,以对特定的操作进行分组或分配(例如,把能耗密集的操作分为一组(或根据需求进行分配等)。该系统可以接收一数据传输负担报告,其中,该报告显示了对于一给定样本时间,相应的进行中的存储操作数量(例如,任务的数量)和等待执行的任务数量。该系统可利用这个信息和相关的能耗数据,根据任务的类型,在一给定的时。
12、间窗口中重新分配任务,或为一后续的数据存储操作重新分配系统资源。例如,一备份操作可被要求一周执行一次,但可在一个三天的时间窗口内执行。因此,该系统可以如此安排任务以使一个小的备份操作与一个更大的备份操作一起执行,从而使一个驱动器只需被启动一次。在一些情况下,该系统可在一个数据存储操作执行时重新分配数据存储操作,并调整一个建筑中的其他组件,以将能耗尖峰(spike)最小化或保证功率低于一个阈值(比如,关闭或减少使用建筑内的环境组件,如制热或制冷)。0025 虽然“建筑”一词被用于以上的例子,任何规模的企业都可以采用本发明的各方面。实际上,在此描述的系统可以采用分层结构,其中,每一层与能耗相关。也。
13、就是说,数据存储操作(以及与那些操作相关的组件)被量化分成两个或更多独立的组,比如一低能耗层和一较高能耗层。在被移至一较高能耗层之前,至少暂时地,数据可先被存储于一较低能说 明 书CN 103279181 A3/17页5耗层。0026 例如,为避免对磁盘或磁带驱动器进行单个偶发的写操作,这些单个的写操作可被缓冲(cached)或累积(aggregated)于一位于较低能耗层的装置。然后,当累积到一个阈值时,这些写操作可被整批移至位于更高能耗层的装置,从而该磁盘或磁带驱动器只需被启动一次即可。如下更详细的描述,传统的磁盘存储中能耗最集中的方面可能是运行风扇马达以冷却磁盘驱动器,接着是运行磁盘主轴。
14、转子以驱动磁盘在磁盘驱动器内旋转。对于自动化磁带库,要求高能耗以移动机械于操作磁带,接着运行磁带驱动马达,然后运行这些库内的风扇。此处描述的系统不仅考虑了每一种数据存储装置(磁盘、磁带等)的各种功率要求,还考虑了这些装置中为帮助大规模数据存储企业运行得更有效的各组件。0027 现在描述本发明的各例子。为彻底理解和使这些例子可实施,以下描述提供了具体的细节。业界技术人员能够理解,即使没有这些细节中的许多部分,该系统也可能被实施。另外,一些习知的结构或功能可能不会被进行详细地描述,以避免对各例子的相关描述造成不必要的干扰。0028 以下描述所采用的术语应被解释为合理的最大的范围,即使其被用于该系统。
15、的特定例子的详细描述中。以下,一些术语可能被特别强调,然而,任何意图以限定的方式被解释的术语将被明显地以及具体地在该详细描述中被如此定义。0029 合适的系统0030 图1A展示了一对功率敏感的总管理器或服务器100,其与建筑102以及可选的与建筑102相似的其他建筑114和116进行通信。建筑102可以包括环境组件104,工业组件106,至少一个数据处理设施108,以及辅助组件112。环境组件104可包括制热组件、制冷组件(比如空调)、减湿器等。工业组件可以是该建筑内的任何机械或装置,尤其是大功率装置,比如工业干燥机、加热器、电解装置等。辅助组件可包括任何对该建筑内的操作不太重要或不太关键的。
16、耗能装置,比如装饰用灯、喷泉等。如此处所解释,总系统管理器100可分析历史数据并产生预测数据,通过关闭建筑102内各组件或系统元件,或降低各组件或系统元件的能耗,以为建筑102节能。0031 数据处理设施108可包括各种数据处理组件的任一种或多种,比如一个或以上服务器、电信组件、输入/输出组件等。为便于说明以下的例子,数据处理设施108包括至少一数据存储系统140,其包括各种数据存储装置的任一种或多种,比如一个或以上磁带驱动器,一个或以上磁盘驱动器等。0032 请参图1B,一框图展示了总系统服务器或管理器100,其可与一些不同的数据处理系统互动,比如数据存储系统140。(一些数据存储系统的例子。
17、将结合图3和图4进行讨论。)总管理器100可以包括一些组件,如总功率负载组件110、总命令或过滤组件120或其他总组件130,并与一索引数据库132连接以存储此处描述的数据。组件110、120和/或130接收、传送、监视或控制此处所描述的数据存储系统140中的数据处理和系统资源。进一步的,总管理器100可与该设施内其他数据处理组件互动,也可以与该建筑内或所述校园内的其他耗能组件互动。0033 如下所述,特别要提的是总负载组件110可(直接或间接)监视并收集建筑102内组件和装置的能耗数据,并可以产生该建筑内组件未来预期的功率要求。总过滤组件120允许总系统管理器100应用总节能命令于一个或以上。
18、建筑内的组件。说 明 书CN 103279181 A4/17页60034 请参图2,一框图展示了具有两层(尽管可以有更多的层)的分级数据存储系统:存储操作层210和总层250。总层250可以包括总操作单元260(与总系统管理器100相似),其中,该总操作单元260可以包括总管理器100和数据库132。存储操作层210可包括存储操作单元,比如单元220和230。根据系统的需求,单元220和230可以一直执行指定的数据存储操作,或可执行不同的数据存储操作。这些单元是逻辑分组的组件,每一单元具有具体的功率要求和操作时间安排。每一单元可以是位于一个建筑内,也可以横跨多个建筑。一个单元可以与一个或更多其。
19、他单元共享硬件。进一步的,术语“单元”是用于表示任意规模的组件和/或操作分组,从运行于一个共享服务器的单个操作到一个远远大于该操作的数据处理和存储分组,该分组包括多个服务器、数据存储装置、网络装置以及多个利用这些装置的操作,所有这些都可以分布于不同的地方。也就是说,一个“单元”是一个数据存储操作所需的一个或多个组件和/或操作的组合。0035 单元220包括数据存储操作中所用的组件,比如存储管理器221、数据库222、客户223以及主存储数据库224。单元230可包括相似的组件,比如存储管理器231、数据库232、客户233以及主存储数据库234。在这个例子中,单元230还包括媒介主体(medi。
20、a agent)235和第二数据库236。单元220和230都与总管理器261通信,提供各自的与数据存储操作相关的信息。0036 请参图3,一框图展示了一存储操作单元的组件。根据单元的用途和系统的需求,存储操作单元(比如图2所示的单元220和230)可包括以下组件的部分或全部。例如,单元300包括存储管理器310、客户320、多个媒介主体330以及多个存储装置340。存储管理器310控制媒介主体330,其中,媒介主体330至少部分地负责传送数据至存储装置340。存储管理器310包括任务主体(jobs agent)311、管理主体(management agent)312、数据库313以及界面模。
21、块314。存储管理器310与客户320通信。客户320通过数据主体(data agent)321从数据存储322访问将被系统存储的数据。该系统利用媒介主体330传输并存储数据至存储装置340,其中,媒介主体330包括数据库331。如此处所描述,一个或多个存储装置340内的功率管理软件或固件342可监视对应装置的能耗,并向总管理器提供能耗数据。0037 单元300可包括用于数据存储操作的软件和/或硬件组件及模块。单元300可以是在数据存储操作中传输数据的传输单元。除了数据传输操作中所用的操作,单元300可以执行其他存储操作(或存储管理操作)。例如,单元300可以执行创建、存储、找回和/或转移主要。
22、和次要的数据拷贝。这些数据拷贝可包括快照拷贝(snapshot copies)、备份拷贝、HSM拷贝、存档拷贝(archive copies)、连续数据复制(CDR)、虚拟机器等等。单元300还可以执行存储管理功能,这些存储管理功能可将信息推至更高层的单元,包括总管理单元。注意:各单元中的各硬件组件具有不同的功率曲线,然而相似的装置或相似类别的装置可能具有相似的功率曲线(例如,基于特定的操作和其他因素,比如使用时间和环境条件等,同样的日立牌硬盘驱动器具有相似的功率曲线)。软件/固件342可为存储装置340存储这样的功率曲线或其他能耗性能数据。0038 在一些例子中,系统根据存储策略执行存储操作。
23、以节能、避免功率尖峰或达到之前规定的节能要求(比如对于建筑102)。一“存储策略”可以是,例如,一数据结构,其包括一组在存储操作中考虑的参数选择或其他标准。存储策略直接地或间接地与功率要求相说 明 书CN 103279181 A5/17页7关,并可决定或规定各种数据存储参数,如存储位置、组件之间的关系、网络通路、可用数据管道、保留规划(retention schemes)、压缩或加密要求、优选的组件、优选的存储装置或媒体等。也就是说,一个“存储策略”可以是与能耗相关的存储参数选择。如此处所述,一执行磁盘存储操作的时间表策略或时间表可以与存储策略相结合,以提供一总体的与能耗相关的存储参数选择。如。
24、此处所讨论,存储策略可存储于存储管理器310、221、231,或可存储于总管理器100。如此处所述,之前规定的节能要求或计划(“功率要求” )提供了总管理器100所采用以保证达到一定功率要求的参数,比如保证不发生高于一阈值的能耗尖峰,在一段给定时间内平均能耗低于一阈值,每月能耗花费低于阈值,如此等等。0039 另外或作为选择之一,该系统可实施或采用时间表策略。时间表策略指定什么时候执行存储操作,执行存储操作的频繁程度,和/或其他参数。如下所述,时间表策略允许总管理器100和/或存储管理器310来决定满足所述功率要求的最优的或接近最优的执行存储操作的时间。该时间表策略也可以规定子客户的使用,其中。
25、利用一个子客户存储一种数据(比如电子邮件数据),利用另外一个子客户存储另一种数据(比如数据库数据)。在这些例子中,与特定数据类型(电子邮件、数据库等等)相关的存储操作可被分配至不同的单元。进一步的,总管理器和/或存储管理器可在一窗口内执行存储操作,以满足功率要求,比如通过累积小的存储操作以减少启动驱动器的次数,或通过把一操作移至一预测到的该建筑内能耗较低的时间段。0040 请参图4,一框图展示了总单元和数据存储单元之间的互动。总管理器100可以与数据库132和用户界面410通信,并可包括总负载组件、总过滤组件以及被配置成根据接收到的数据存储信息和历史/预测的能源使用(power usage)制。
26、定行动的其他组件。数据库132可存储存储策略、时间表策略、历史/预测功率数据、接收到的样本数据、其他存储操作信息等。用户界面410可向管理员或用户显示系统信息。用户界面的其他细节将在下面进行讨论。0041 总管理器100可推送或发送数据至管理服务器440。服务器440与数据库445及客户451、452、453的一个或多个通信,并包括主体442。数据存储服务器430发送数据至总管理器100,并包括数据主体432和数据库435。从而,客户454、455和/或456与这些服务器通信,这些服务器形成了数据处理或数据存储企业的至少一部分。0042 总管理器100可执行行动(比如重分配存储操作),并通过管。
27、理服务器将这些行动应用于数据存储系统,以满足功率要求。总管理器100从数据存储服务器430接收用于决定这些行动的信息。在这个例子中,总管理器100在数据存储系统中作为枢纽(hub),发送信息以改变数据存储操作,并监视数据存储操作以决定如何改进这些操作和功率要求。另外,或作为选择之一,本地管理器109可执行一些或所有这些操作(请参图1)。0043 图13展示了与存储装置340相似的数据存储装置1302的一个例子,其提供改进的功率效率,并可被应用于,例如,如图3所示的系统300。数据存储装置1302包括原始的高速L1缓冲存储器(cache)1304,其可快速存储数据并将其传递给L2缓冲存储器130。
28、6,其中,缓冲存储器1306可以是固态闪存“盘”或其他写缓冲存储器。这样,在被传送至非易失性L2缓冲存储器1306之前,输入的数据被快速地并初始地存储或缓存于L1缓冲存储器1304。如此,在被写入磁盘/磁带1308之前,数据可以被累积在L2缓冲存储器1306内,L2缓冲存储器可以是便宜的传统的大容量存储装置。说 明 书CN 103279181 A6/17页80044 控制器1310可执行块层虚拟化(block-level virtualization),从而,L1缓冲存储器1304和L2缓冲存储器1306可以此处描述的同步/转移策略被映射至传统存储器,把启动一个或多个磁盘驱动器的各主轴马达(s。
29、pindle motors)(或驱动磁带的马达)的需求最小化。这样,如下所述,控制器1310可直接控制一个或多个风扇马达1316和主轴马达1318以降低能耗。此外,存储装置1302还可与总系统管理器100或本地管理器109(通过通信装置1314)通信,使其可被远程控制。一个或多个传感器1320可监视,例如,数据存储装置1302内的温度。这些传感器还可监视数据存储装置内的其他操作,例如,收集有关读/写头使用马达的操作指标(metric)、磁带驱动器的搜索时间等等。接着,控制器1310可以通过通信装置把从这些传感器收集到的这些指标或其他数据传送给总管理器或本地管理器。(这些指标还可(例如,被管理器。
30、或控制器)用于产生这些被监视参数的统计数据。)能耗管理软件或固件342还可指示控制器1310收集数据存储装置1302内的这些传感数据和/或其他数据(例如,如此处所提到的功率曲线/性能),并将其报告给总系统管理器100或本地管理器109或两者(通过通信装置1314)。其他操作细节将在以下提供。0045 能耗报告及相应的行动0046 对数据存储操作和存储装置操作采样的报告或其他收集到的数据向总管理器100提供了有意义的信息。利用这些信息,总管理器100(通过负载组件110或其他类似组件)可决定将被执行的行动,以为该建筑或该等建筑节能。这些行动的部分内容可包括重新安排存储操作的时间表、重新分配数据存。
31、储操作、把操作从一个资源转移至另一资源、规定未来存储策略、设置总节能过滤器等等。0047 请参图5,一流程图展示了程序500,其提供了为总管理器或服务器准备的能源负荷报告的一个例子。在步骤510中,所述系统从运行中的数据存储操作采集能源负荷信息。例如,所述系统可采集转移任务的数量、等待任务的数量、特定媒介主体的数据流数量等等。部分或所有单元的主体可以被设置成收集并登录数据,这些数据被接着送出用于产生所述能源负荷报告。0048 各种硬件组件可提供这样的能源负荷信息,例如由数据存储装置所提供的能耗和操作数据。磁盘或磁带驱动器,例如装置1302,可在其固件342中包括要求该驱动器周期性地或根据请求信。
32、息提供该装置操作的相关信息的指令。这样的信息可以包括主轴转子和风扇被启动和关闭的时间和日期,以及其他操作被执行的时间和日期等。另外,或作为选择之一,该系统可通过一总线或通信端口(比如通用即插拔(UPP)的一部分)监视功率特性和操作,其被总系统管理器100用于制定节能决策。0049 其他监视装置和收集能源负荷数据的方法可以包括利用与网络组件连接的外部功率计量器收集装置操作和能源负荷数据并传送至本地管理器109和/或总系统管理器100。这些数据最好是精细的,处于针对具体装置组件(主轴马达、风扇马达、机械手操作等)的操作的层面,虽然它也可以在更粗的层面上被收集,例如整体装置或数据存储设施的总能耗。这。
33、样的数据可以利用已有的技术或本地公共设施来采集。通过对比一数据存储设施或一具体的装置所执行的任务或存储操作的时间表和外部获得的数据,例如来自公共设施的数据,该系统可以将装置/设施与能耗关联,以确定在一个特定的位置和/或一个特定的装置上发生的一个特定的数据存储操作消耗了多少能量。这样的能耗信息可以是很广的、很普通的数据,或可以被转换成该系统所采用的标准单位,例如能耗存储量(例如,兆说 明 书CN 103279181 A7/17页9瓦小时每GB)。总体而言,业界一般技术人员将意识到“能源负荷数据”、“能耗”等术语一般可交换使用。0050 另外,或选择之一,该系统可通过网络传送一个或多个测试包或测试。
34、文件,并将其存储于一给定数据存储装置,并使这些操作的指标被传回。例如,总系统管理器100可沿着不同的网络路径,在不同的单元或位置,传送1GB字节大小的测试文件至多个不同的数据存储资源(例如,不同的磁盘驱动器、磁带驱动器等),并要求回馈适当的指标数据。接着,总系统管理器100接收有关完成该操作需要多长时间,完成该操作的功率要求等指标。然后,这些数据可被存储于索引数据库132(和/或其他数据库)以帮助估计未来数据存储操作的功率要求。这些未来的操作可被适当地缩放。虽然不够精确,如果一个任务被简单地放大,一个100GB的任务将消耗一个1GB任务100倍(实际上会更少),那么这就是一个好的估计。申请人于。
35、2005年11月7日申请,标题为“监视存储网络的方法和系统”的美国专利第11/269,513号提供了一个包括传送一个测试包或文件以确定数据存储资源性能的过程的更多细节的例子。0051 在步骤520中,该系统产生包含部分或所有采集获得信息的报告。该报告可包含采样获得的信息,或可提供分析或利用算法针对采样获得的信息产生的信息。例如,该系统可获得一定数据,并针对这些数据执行特定的统计分析,例如确定一平均值(mean)和/或标准偏差。再者,该系统可收集各数据存储组件的能耗信息和安排好的未来的或预见的数据存储任务的信息,以预测未来能耗。0052 在步骤530中,该系统把报告发送给总管理器100。该报告可。
36、跟踪使用和与该使用相关的文件或操作。实际上,如此处所述,该系统可利用数据分类技术(和相关数据或软件主体)来监视数据存储操作,然后,这些操作可以与能源负荷信息比较,以跟踪和管理每一数据存储操作的能耗,甚至细化到单个文件或客户计算机的层面。该数据分类主体可收集并创建能源使用索引,并将这些使用与具体的装置、被管理/存储的文件等关联。另外,或选择之一,运行于一个或多个客户计算机451-456的软件主体可提供这样的数据给总系统管理器。进一步的,数据处理装置(例如存储装置340)本身可提供这样的数据给总系统管理器。0053 总的来说,可利用于2006年11月28日申请的美国专利申请第11/564,180号。
37、标题为“存储网络中分类和传送信息的系统和方法”,并于2007年8月30日公开的美国专利公开第2007-0203938号所描述的技术,以软件主体来执行并按索引存储此处收集到数据的相当一部分。在该专利申请所描述的技术下,这些主体可收集与能耗相关的数据以供总管理器100使用。这些主体可收集与能耗和相关参数有关的元数据,并将其做成索引,其中,相关参数包括存取一个文件或存储装置的频率以及一个文件与其他文件之间的关系(特别是关于特定的存储操作,比如那些作为常规存储策略一部分的定期执行的操作)。这些主体不仅可收集各组件本身的能源使用信息,还可以收集额外的信息,比如部门、建筑、工作组以及其他数据处理组件集合体。
38、(包括数据存储组件)的能源使用信息。以下将更详细地描述,该系统可结合可由第三方数据源收集获得的数据(如能源价格、天气预测或其他数据)和这些数据,来决定如何最佳地分配资源以及执行数据处理操作。0054 能源负载报告可以是综合的报告,覆盖整个系统或企业。该报告可从在该总管理器控制下的任何或所有建筑内的所有单元和存储系统采集信息。该能源负荷报告还可覆盖说 明 书CN 103279181 A8/17页10任何存储单元、组件和/或系统的组合。该能源负荷报告可为组织提供转移数据的成本。通常可基于文件大小整理文件,该系统还可提供与每一文件相关的能耗大小,可帮助确定移动或存储该数据的能耗成本。该“能耗大小”指。
39、标可被绑定于该存储策略以帮助管理该数据。如此,就一特定能耗大小阈值,该系统可针对数据采用更多节能技术。一些数据,比如财务或销售数据,可能具有高优先级并可能较不易受能耗大小指标的影响。也就是说,这些数据对一个组织可能是重要的,从而不管要求多少能耗都必须被拷贝、管理或移动。然而,其他不太重要的数据,比如日常邮件、老的数据等,可以更易受节能数据管理的影响,这样,在针对这些数据的存储策略中,能耗大小指标将发挥更大的作用。也就是说,该系统可能结合其他数据,比如该文件的优先级,分析与一文件相关的能耗,并确定分析获得的指标或值是否超过一阈值。如果是,那么该系统可执行一存储策略或节能操作(如以下对图14的描述。
40、)。当然,不同组织之间,以及同一组织内的不同组之间,数据的相对优先级和任何相关的存储策略都有可能不同。0055 该系统可以就存储特定数据需要多少能量提供回馈。例如,一系统管理员可确定每周被拷贝一次的同一大数据库具有变化的能耗指标。(这个例子可同样应用于两个或更多具有相似特征的文件,比如基于文件大小、每MB能耗等,其中,相似性可位于一特定的标准偏差范围内。)接着,还是从该报告,该管理员可确定能耗的差异与数据量大小无关,而与被采用的特定网络组件、数据类型、执行的程序等相关。这样,该管理员可修改针对该数据库的存储策略,以采用更节能的数据存储组件或程序。另外,或选择之一,该管理员可识别在该企业中哪些网。
41、络组件、数据存储组件或其他组件是不节能的,并寻求以更节能的组件替换那些组件。进一步的,该系统可自行自动地执行或向管理员建议将小数据存储任务分组,分配任务以避免活动高峰等的计划。该系统还可切换以采用更多不同的资源。可以利用已知的技术来做到这点,比如贝叶斯检验(Baysian testing),或通过实验检验以半自动化实现。0056 图6展示了一流程图,该流程图展示了执行基于所述能源负荷报告的一节能行动的程序600。在步骤610中,所述系统接收所述包含有关功率和数据存储操作信息的能源负荷报告。所述系统可接收另外三个报告的任意一个,比如以下三个例子(每一个例子在下面进行详述):(1)提供未来将执行的。
42、操作的信息的报告(具有或不具有能耗预测数据),(2)提供执行中的操作的信息的报告(例如在一给定单元中已完成、执行中以及等待中的操作数量),或(3)提供已完成操作的信息的报告(比如前一晚的操作的信息)。0057 接收到一个或多个报告后,在步骤620中,根据接收到的报告,所述系统决定将执行的行动。请参图7A,展示了一流程图,该流程图展示了决定一合适的节能行动的流程700。在步骤710中,所述系统接收一基于数据存储操作的报告。在步骤720中,该系统将该报告中的信息与功率要求及一个或多个其他信息进行比较,比如数据存储组件的能耗曲线。0058 考虑包含未来数据存储操作的所述第一个报告(1),所述系统(例如,总管理器100)分析未来任务的时间表,并比较那些任务与在那些任务中将被采用的数据存储装置的功率曲线和一个或以上功率要求。另外,或选择之一,该系统可查询该系统中千瓦每GB的平均能耗参数,例如从总系统管理器100的索引数据库132中的一个表中查询。这样的表可提供用于有关节能网络和数据存储组件的报告和决策的简单的、粗略的指标(尤其是当说 明 书CN 103279181 A10。