一种云存储环境下基于最大团模型的数据访问策略技术领域
本发明涉及云计算技术领域,具体涉及一种云存储环境下基于最大团模型的数据
访问策略。
背景技术
云存储(cloud storage)是指通过集群应用,网格技术或分布式文件系统等功能,
将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数
据存储和业务访问功能的系统。
为了实现系统的高扩展性,保证数据的高可用性和高可靠性,云存储一般采用分
布式的多副本方式来存储和管理。即将一个数据块复制多份分别存储在分布式系统的多个
节点上,以此来提高系统的可靠性,提高文件的访问速率。然而,副本在解决了云存储分布
式文件系统存储对象单点失效,容错性差,接入性能不高等问题的同时,也带来了诸多问
题。如用户获取数据需要通过访问多个节点,获取不同节点的数据块进行组装。而多副本放
置策略不同,数据块的访问代价不同,如何在最小的代价下获取完整的数据变得异常重要。
发明内容
本发明要解决的技术问题是:本发明针对以上问题,提供一种云存储环境下基于
最大团模型的数据访问策略,提供云存储环境中,分布式的多副本数据块的获取模型。保证
数据块信息完整的前提下,使得数据副本的访问总代价最小。
本发明所采用的技术方案为:
一种云存储环境下基于最大团模型的数据访问策略,所述策略根据待访问的数据
块所属的节点,定义各数据块副本的访问代价,并在此基础上,构建加权最大团模型并求
解,使得客户端在获取完整的数据块的前提下保证数据块副本的访问代价最小。
所述策略实现过程如下:
1)首先根据数据副本所在节点,建立数据副本信息库;
2)然后计算客户端获取各个数据副本的代价;
3)最后,构建最大团模型并求解,在代价最小的情况下获取完整的数据块信息。
所述策略通过记录各数据副本所属节点以及数据块的状态信息,去除不可用节点
并重新分配副本文件到其他节点,依次对数据副本进行唯一的标识处理,保证所有数据块
副本的标识唯一。
各数据块副本的访问代价,根据客户端与各数据副本节点之间的通信延时时间,
通过定义数据副本i访问代价函数f(i)如下:
其中λmax,λmin分别表示延时量化等级最大以及最小值;tmax,tmin分别表示实际节点
通信的最大,最小时间延迟。
所述最大团模型,顶点为数据副本编号,不同数据副本之间有边相连,即相同的数
据副本不可以同时出现在完整的数据块当中,顶点的权值为数据副本的访问代价。
所述策略通过启发式的算法计算最优的加权最大团,使得客户端在获取完整数据
副本的前提下,保证数据块的获取代价最小。
启发式算法(heuristic algorithm)是相对于最优化算法提出的,一个问题的最
优算法求得该问题每个实例的最优解,启发式算法是一个基于直观或经验构造的算法,在
可接受的花费(指计算时间和空间)下给出待解决组合优化问题每一个实例的一个可行解,
该可行解与最优解的偏离程度一般不能被预计。
本发明的有益效果为:
本发明为云存储提供一种多数据块副本访问模型,保证客户端获取完整数据块信
息的基础上,数据块的总访问代价最小。
附图说明
图1为最大团模型示意图。
具体实施方式
根据说明书附图,结合具体实施方式对本发明进一步说明:
实施例1:
一种云存储环境下基于最大团模型的数据访问策略,所述策略根据待访问的数据
块所属的节点,定义各数据块副本的访问代价,并在此基础上,构建加权最大团模型并求
解,使得客户端在获取完整的数据块的前提下保证数据块副本的访问代价最小。
实施例2
在实施例1的基础,本实施例所述策略实现过程如下:
1)首先根据数据副本所在节点,建立数据副本信息库;
2)然后计算客户端获取各个数据副本的代价;
3)最后,构建最大团模型并求解,在代价最小的情况下获取完整的数据块信息。
实施例3
在实施例1或2的基础,本实施例所述策略通过记录各数据副本所属节点以及数据
块的状态信息,去除不可用节点并重新分配副本文件到其他节点,依次对数据副本进行唯
一的标识处理,保证所有数据块副本的标识唯一。
实施例4
在实施例3的基础,本实施例各数据块副本的访问代价,根据客户端与各数据副本
节点之间的通信延时时间,通过定义数据副本i访问代价函数f(i)如下:
其中λmax,λmin分别表示延时量化等级最大以及最小值;tmax,tmin分别表示实际节点
通信的最大,最小时间延迟。
实施例5
如图1所示,在实施例4的基础,本实施例所述最大团模型,顶点为数据副本编号,
不同数据副本之间有边相连,即相同的数据副本不可以同时出现在完整的数据块当中,顶
点的权值为数据副本的访问代价。
图中Li表示数据副本i,ri表示数据副本的访问代价。
实施例6
在实施例5的基础,本实施例所述策略通过启发式的算法计算最优的加权最大团,
使得客户端在获取完整数据副本的前提下,保证数据块的获取代价最小。
启发式算法(heuristic algorithm)是相对于最优化算法提出的,一个问题的最
优算法求得该问题每个实例的最优解,启发式算法是一个基于直观或经验构造的算法,在
可接受的花费(指计算时间和空间)下给出待解决组合优化问题每一个实例的一个可行解,
该可行解与最优解的偏离程度一般不能被预计。
实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术
人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同
的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。