CN200610139923.0
2006.09.26
CN1952871A
2007.04.25
授权
有权
授权|||实质审查的生效|||公开
G06F3/06(2006.01)
G06F3/06
国际商业机器公司;
格雷戈里·T·基什; 乔纳森·W·皮克; 埃里卡·M·道森
美国纽约阿芒克
2005.09.26 US 11/235,986
北京市柳沈律师事务所
邸万奎;黄小临
公开了一种处理磁带存储系统中的多卷数据集的方法及设备。响应于对多卷数据集的写请求,通过截取并译码一组卷安装命令来捕捉该多卷数据集的信息。或者,通过从在多卷数据集的标头中列出的先前卷中监听标头信息,来捕捉该多卷数据集的信息。然后构造属于该多卷数据集的逻辑卷名链。最后,将所述逻辑卷名链存储到链数据库中。
1、 一种处理磁带存储系统中的多卷数据集的方法,所述方法包括:响应于对多卷数据集的写请求,通过截取并译码多个卷安装命令或从所述多卷数据集的标头中列出的先前卷中监听标头信息,来捕捉所述多卷数据集的信息;构造属于所述多卷数据集的逻辑卷名链;以及将所述逻辑卷名链存储到链数据库中。2、 如权利要求1所述的方法,其中,所述逻辑卷名链包括先前虚拟卷名的位置,以及所述当前虚拟卷名的位置。3、 如权利要求1所述的方法,其中,所述方法还包括:响应于对所述多卷数据集中的虚拟卷N的存取请求,如果当先前请求所述虚拟卷N时、存取所述多卷数据集中的所有虚拟卷的次数百分比大于第一高阈值,则再调用所述多卷数据集中的所有虚拟卷。4、 如权利要求3所述的方法,其中,所述方法还包括:如果当先前请求所述虚拟卷N时、随机或顺序地存取所述多卷数据集中的虚拟卷的次数百分比大于第二高阈值,则再调用所述多卷数据集中的所有虚拟卷。5、 如权利要求4所述的方法,其中,所述方法还包括:如果当先前请求所述虚拟卷N时、顺序地存取所述多卷数据集中的虚拟卷的次数百分比大于第一中阈值,则再调用所述多卷数据集中在所述虚拟卷N之后的所有虚拟卷。6、 如权利要求5所述的方法,其中,所述方法还包括:如果当先前请求所述虚拟卷N时、存取所述多卷数据集中的虚拟卷N-M-1的次数百分比大于第二中阈值,则再调用所述多卷数据集的虚拟卷N+1至2N-M。7、 如权利要求6所述的方法,其中,所述方法还包括:如果当先前请求所述虚拟卷N时、存取所述多卷数据集的虚拟卷N+1的次数百分比大于第一低阈值,则再调用所述多卷数据集的虚拟卷N+1。8、 如权利要求7所述的方法,其中,所述方法还包括:如果当先前在已安装了虚拟卷N-1之后再请求所述虚拟卷N时、存取所述多卷数据集的虚拟卷N-1的次数百分比大于第二低阈值,则再调用所述多卷数据集的虚拟卷N+1。9、 一种处理磁带存储系统中的多卷数据集的设备,所述设备包括:用于响应于对多卷数据集的写请求来捕捉所述多卷数据集中的信息的装置,所述装置通过截取并译码多个卷安装命令,或从在所述多卷数据集的标头中列出的先前卷中监听标头信息进行所述信息捕捉;用于构造属于所述多卷数据集的逻辑卷名链的装置;以及用于将所述逻辑卷名链存储到链数据库中的装置。10、 如权利要求9所述的设备,其中,所述逻辑卷名链包括先前虚拟卷名的位置,以及所述当前虚拟卷名的位置。11、 如权利要求9所述的设备,其中,所述设备还包括装置,用于响应于对所述多卷数据集中的虚拟卷N的存取请求,如果当先前请求所述虚拟卷N时、存取所述多卷数据集中的所有虚拟卷的次数百分比大于第一高阈值,则再调用所述多卷数据集中的所有虚拟卷。12、 如权利要求11所述的设备,其中,所述设备还包括装置,用于如果当先前请求所述虚拟卷N时、随机或顺序地存取所述多卷数据集中的虚拟卷的次数百分比大于第二高阈值,则再调用所述多卷数据集中的所有虚拟卷。13、 如权利要求12所述的设备,其中,所述设备还包括装置,用于如果当先前请求所述虚拟卷N时、顺序地存取所述多卷数据集中的虚拟卷的次数百分比大于第一中阈值,则再调用所述多卷数据集中所述虚拟卷N之后的所有虚拟卷。14、 如权利要求13所述的设备,其中,所述设备还包括装置,用于如果当先前请求所述虚拟卷N时、存取所述多卷数据集中的虚拟卷N-M-1的次数百分比大于第二中阈值,则再调用所述多卷数据集的虚拟卷N+1至2N-M。15、 如权利要求14所述的设备,其中,所述设备还包括装置,用于如果当先前请求所述虚拟卷N时、存取所述多卷数据集的虚拟卷N+1的次数百分比大于第一低阈值,则再调用所述多卷数据集的虚拟卷N+1。16、 如权利要求15所述的设备,其中,所述设备还包括装置,用于如果当先前在已安装虚拟卷N-1后再请求所述虚拟卷N时、存取所述多卷数据集的虚拟卷N-1的次数百分比大于第二低阈值,则再调用所述多卷数据集的虚拟卷N+1。17、 一种驻留在计算机可用介质中的计算机程序产品,用于处理磁带存储系统中的多卷数据集,所述计算机程序产品包括:用于实施前述方法权利要求中的任意一种方法的装置。
处理磁带存储系统中的 多卷数据集的方法及设备 技术领域 本发明通常涉及磁带存储系统。本发明尤其涉及具有多卷数据集的磁带存储系统。本发明还尤其涉及处理磁带存储系统中的多卷数据集的方法及设备。 背景技术 虚拟磁带服务器(VTS,virtual tape server)磁带数据集分层(stacking)产品之一,这些产品被特别设计为满足客户对管理存储在磁带上的信息的有效方式的需求。VTS系统一般包括主机接口、VTS高速缓存、以及具有多磁带设备的自动库。 VTS系统通常附于诸如大型计算机之类的主机。当主机向VTS系统写入数据集时,将该数据集写到VTS系统的虚拟卷上。如果写入虚拟卷的数据集超过了单个虚拟卷的容量,则该数据集通常可称作多卷数据集(multi-volumedataset),并可由主机写入到一系列虚拟卷中。 当主机从VTS系统读取多卷数据集中的虚拟卷时,如果该虚拟卷当前驻留在VTS高速缓存中,则能够从VTS高速缓存中取回该虚拟卷。如果该虚拟卷不驻留在VTS高速缓存中,则存储管理器确定哪个磁带包含该虚拟卷。随后将相应磁带安装到一个磁带设备上,并将该虚拟卷从磁带发送到VTS高速缓存和主机。因为磁带安装可能非常耗费时间,所以将频繁存取的虚拟卷保留在VTS高速缓存中总是可取的。 经常地,当存取多卷数据集中的虚拟卷时,一般也要存取该多卷数据集中的其它虚拟卷。如果主机中的应用将要存取多卷数据集中的所有虚拟卷,则在由主机中的应用存取它们之前将所有虚拟卷预登台(prestage)到VTS高速缓存中会是非常有利的。然而,VTS系统通常没有哪些虚拟卷属于多卷数据集的信息;因此,向VTS系统提供此类信息将是所期望的。 发明内容 根据本发明的优选实施例,响应于对多卷数据集的写请求,通过截取并译码一组卷安装命令来捕捉该多卷数据集的信息。否则,通过从多卷数据集的标头中列出的先前卷中监听标头信息,来捕捉该多卷数据集的信息。然后构造属于该多卷数据集的逻辑卷名链。最后,将该逻辑卷名链存储到链数据库中。 本发明的所有细节和优点在下面详细的说明中将会变得清楚。 附图说明 参考结合附图论述的示例实施例的详细说明,本发明本身,以及优选使用模式、进一步的目的、及其优点将得到最好理解,其中: 图1为其中能够并入本发明优选实施例的虚拟磁带服务器系统的框图; 图2说明了根据本发明优选实施例、在图1的磁带存储系统的链数据库中存储的多个逻辑卷名链;以及 图3为根据本发明优选实施例、用于在图1的磁带存储系统中执行预登台方法的高级逻辑流程图。 具体实施方式 现在参考附图,特别是图1,其描述了其中能够并入本发明优选实施例的虚拟磁带服务器(VTS)系统,。如所示,附于主机110的VTS系统100包括分布式存储管理器客户端112、分布式存储管理器服务器114、直接存取存储设备(DASD)高速缓存116、形成自动库120的一组磁带驱动118、库管理器122以及自动存储管理器管理者126。 主机110可以将数据集写入VTS系统100内的虚拟卷中。有时,数据集可以是非常大的,而且已知为多卷数据集的数据集必须写入到数个虚拟卷中。由主机110频繁存取的虚拟卷可以存储在DASD高速缓存116中,而由主机110较不频繁存取的虚拟卷可以存储在可由磁带驱动118存取的磁带144中。 分布式存储管理器客户端112将频繁存取的虚拟卷发送到DASD高速缓存116,而且分布式存储管理器服务器114在DASD高速缓存116和磁带驱动118之间移动数据。库管理器122经由来自分布式存储管理器服务器114的命令来控制存取磁带144的存取器142。 相当经常地,当多卷数据集中的一个虚拟卷由主机110内的应用存取时,同一多卷数据集中的另一虚拟卷也将由主机110内的同一应用存取。但如果该多卷数据集中的一些或所有虚拟卷并未已在DASD高速缓存116中,则必须从一个或多个磁带144再调用它们。因为安装磁带144的过程是相对费时的,所以在由主机110内的应用程序存取虚拟卷之前,尤其当该应用实际上将要存取多卷数据集中的所有虚拟卷时,将该多卷数据集的所有虚拟卷预登台(或预加载)到DASD高速缓存116会是非常有利的。 然而,VTS系统100没有虚拟卷和多卷数据集之间关系的信息。因此,在由主机110内的应用存取每个虚拟卷之前,VTS系统100不知道哪个虚拟卷对应于哪个多卷数据集。因而,VTS系统100不能将多卷数据集中的任意虚拟卷预登台到DASD高速缓存116中。此外,即使VTS系统已经获取了这种信息,并在每次请求虚拟卷时通过不断地将多卷数据集的所有相关虚拟卷再调用到DASD高速缓存116中来执行预登台,但如果主机110中的应用实际上将存取多卷数据集的仅仅少量虚拟卷,则VTS系统100也将浪费大量的资源。 为了使得VTS系统100能够智能地处理多卷数据集,第一步骤是让VTS系统100通过自动捕捉有关每个多卷数据集的某些信息来标识每个多卷数据集。VTS系统100能够通过下列两种方法中的一种来自动捕捉有关多卷数据集的信息。如果多卷数据集由具有激活的高级策略管理的主机110中的应用生成,则用于每一后续安装的库通用安装(LUM,Library Universal Mount)将包含该多卷数据集中的第一(或先前)虚拟卷的卷名作为“克隆”源虚拟卷。因此,第一种方法是截取这些克隆LUM命令,译码这些克隆LUM命令,然后构造属于多卷数据集的逻辑卷名链。该逻辑卷名链应该包括逻辑卷名链中的先前虚拟卷以及当前虚拟卷在该逻辑卷名链中的位置。一个逻辑卷名链与一个多卷数据集相关联。 第二种方法是优选为使用VTS微码,从多卷数据集标头中列出的先前逻辑卷中“监听”(snoop)全部标头构造链列表。标头构造链列表将会允许VTS系统100构造属于多卷数据集的逻辑卷名链。同样地,该逻辑卷名链应该包括该逻辑卷名链中的先前虚拟卷以及当前虚拟卷在该逻辑卷名链中的位置。 由上述两种方法之一形成的逻辑卷名链优选为存储在自动存储管理器管理者126的链数据库127中。现在参考图2,其中图示了根据本发明的优选实施例、在链数据库127中存储的多个逻辑卷名链的示例。如所示,链数据库127包括多个行,并且优选为每行仅包含一个逻辑卷名链。例如,第一行包括卷名L00001、KZ0120、ZZZ990和ABC123;第二行包括卷名BW3242、TJK098、AMND78、ADF0777、KHLK33、UYI987和EQRW38。链数据库127中还保留了有关对每个多卷数据集中的所有虚拟卷的存取次数的统计信息,并且下面将进一步详细描述这种统计信息的用处。 在VTS系统100已标识出每个多卷数据集后,VTS系统100准备好响应于对存储在VTS系统100内的任意多卷数据集的存取请求来执行预登台。现在参考图3,其中描述了根据本发明的优选实施例、用于执行预登台的方法的高级逻辑流程图。如块301所示,响应于主机110(来自图1)对虚拟卷N的存取请求,通过使用链数据库127(来自图1)来进行有关虚拟卷N是否属于多卷数据集的确定。如果虚拟卷N不属于多卷数据集,则如块302所示,再调用虚拟卷N。 然而,如果虚拟卷N属于多卷数据集,则进行有关当先前请求虚拟卷N时、存取该多卷数据集中的所有虚拟卷的次数百分比(percentage of time)的确定。如果次数百分比大于第一高阈值(例如90%),则如块303所示,如果它们还未在DASD高速缓存116(来自图1)中,则从磁带再调用该多卷数据集中的所有虚拟卷并且将其发送到DASD高速缓存116。 否则,如果次数百分比不大于第一高阈值,则进行有关当先前请求虚拟卷N时、随机或顺序地存取该多卷数据集中的虚拟卷的次数百分比的确定。如果次数百分比大于第二高阈值(例如80%),则如块304所示,如果它们还未在DASD高速缓存116中,则从磁带再调用该多卷数据集中的所有虚拟卷并则将其发送到DASD高速缓存116,。 否则,如果次数百分比不大于第二高阈值,则进行有关当先前请求虚拟卷N时、顺序地存取该多卷数据集中的虚拟卷的次数百分比的确定。如果次数百分比大于第一中阈值(例如70%),则如块305所示,如果它们还未在DASD高速缓存116中,则从磁带再调用多卷数据集中所有在虚拟卷N之后的虚拟卷,并且将其发送到DASD高速缓存116。 否则,如果次数百分比不大于第一中阈值,则进行有关当先前请求虚拟卷N时、存取该多卷数据集中的虚拟卷N-M-1的次数百分比的确定。如果次数百分比大于第二中阈值(例如60%),则如块306所示,如果它们还未在DASD高速缓存116中,则从磁带再调用多卷数据集中的虚拟卷N+1至2N-M并且将其发送到DASD高速缓存116中 否则,如果次数百分比不大于第二中阈值,则进行有关当先前请求虚拟卷N时、存取该多卷数据集中的虚拟卷N+1的次数百分比的确定。如果次数百分比大于第一低阈值(例如50%),则如块307所示,如果它不在DASD高速缓存116中,则从磁带再调用多卷数据集中的虚拟卷N+1并且将其发送到DASD高速缓存116。 否则,如果次数百分比不大于第一低阈值,则进行有关当先前在虚拟卷N-1已安装之后请求虚拟卷N时、存取该多卷数据集中的虚拟卷N-1的次数百分比。如果次数百分比大于第二低阈值(例如50%),则如块308所示,如果它不在DASD高速缓存116中,则从磁带再调用多卷数据集中虚拟卷N+1并且将其发送到DASD高速缓存116。如果该次数百分比不大于第二低阈值,则如块309所示,不执行任何预置。 如上所述,本发明提供了用于处理磁带存储系统中的多卷数据集的方法及设备。 也很重要的是要注意到,尽管以硬件上下文来描述了本发明,但是本领域技术人员应当理解,本发明的机理可以作为各种形式的程序产品分布,并且与实际用来实现此分布的信号承载介质的特定类型无关,本发明都可以等价地应用。信号承载介质的示例包括但不限于:诸如软盘或压缩盘之类的记录类型介质,以及诸如模拟或数字通信链接之类的传输类型介质。 虽然已经参考优选实施例具体示出和描述了本发明,但本领域技术人员应当理解,可以对本发明进行形式和细节上的各种修改,而不脱离本发明的精神和范围。
《处理磁带存储系统中的多卷数据集的方法及设备.pdf》由会员分享,可在线阅读,更多相关《处理磁带存储系统中的多卷数据集的方法及设备.pdf(12页珍藏版)》请在专利查询网上搜索。
公开了一种处理磁带存储系统中的多卷数据集的方法及设备。响应于对多卷数据集的写请求,通过截取并译码一组卷安装命令来捕捉该多卷数据集的信息。或者,通过从在多卷数据集的标头中列出的先前卷中监听标头信息,来捕捉该多卷数据集的信息。然后构造属于该多卷数据集的逻辑卷名链。最后,将所述逻辑卷名链存储到链数据库中。 。
copyright@ 2017-2020 zhuanlichaxun.net网站版权所有经营许可证编号:粤ICP备2021068784号-1