基于冗余技术的数据中心短流加速方法及系统.pdf

上传人:111****11 文档编号:1592076 上传时间:2018-06-27 格式:PDF 页数:18 大小:1.51MB
返回 下载 相关 举报
摘要
申请专利号:

CN201510196467.2

申请日:

2015.04.23

公开号:

CN104753963A

公开日:

2015.07.01

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):H04L 29/06申请日:20150423|||公开

IPC分类号:

H04L29/06; H04L12/811(2013.01)I

主分类号:

H04L29/06

申请人:

南京大学

发明人:

钱柱中; 王富广; 陆桑璐

地址:

210093江苏省南京市鼓楼区汉口路22号

优先权:

专利代理机构:

南京苏高专利商标事务所(普通合伙)32204

代理人:

许丹丹

PDF下载: PDF下载
内容摘要

本发明公开了基于冗余技术的数据中心短流加速方法和系统,方法包括周期性运行冗余流数量分配模块的步骤,和为应用程序短流分配冗余流数量,并通过路径碰撞避免方法获得路径不重叠的源端口号集合来创建原始流和对应数量的冗余流的步骤;系统包括负责选择冗余流数量的冗余流数量分配模块、负责避免原始流和冗余流之间发生路径重叠的路径碰撞避免模块、数据库,和用于向应用程序提供建立TCP流的调用接口,并根据冗余流数目调用路径碰撞避免模块获得路径不重叠的源端口号集合来创建原始流和对应数量冗余流的主模块。避免了原始流及冗余流之间发生路径重叠;并对不同大小的短流分配不同数量的冗余流,等价路径利用合理,更为高效、易部署、负载低。

权利要求书

权利要求书1.  一种基于冗余技术的数据中心短流加速方法,其特征在于包括如下步骤:周期性运行冗余流数量分配模块的步骤,包括:周期性地根据历史数据确定不同大小的短流创建冗余流的数量,并将结果存储在数据库的冗余流数量表中;为应用程序的短流分配冗余流数量,并通过路径碰撞避免方法获得路径不重叠的源端口号集合来创建原始流和对应数量的冗余流的步骤,包括:1)应用程序调用主模块提供的接口创建TCP连接时,主模块判断该TCP流的源IP地址和目的IP地址是否在同一Top-of-Rack交换机上,如是则结束,如否则进入步骤2);2)判断该TCP流的大小L是否大于短流长度阈值S,如是则结束,如否则进入步骤3);3)根据TCP流的大小L查询数据库中的冗余流数量表repNum确定要创建的冗余流的数目repNumL;4)调用路径碰撞避免模块得到路径不重叠的1+repNumL个源端口号;5)将获得的1+repNumL个源端口号分别作为1条原始流和repNumL个冗余流的源端口号,调用TCP套接字创建1+repNumL条TCP连接。2.  根据权利要求1所述的基于冗余技术的数据中心短流加速方法,其特征在于:所述通过路径碰撞避免模块得到路径不重叠的1+repNumL个源端口号的步骤包括:根据至少包括TCP流的源IP地址、目的IP地址、目的端口号和要创建的复制流的数目k=1+repNumL的输入参数来查询源端口号对应表,当源端口号对应表中存储有该输入参数对应的记录时,直接查表获得路径不重叠的1+repNumL个端口号作为原始流和冗余流的源端口号;以及当源端口号对应表中没有该输入参数对应的记录时,迭代式地通过路径侦测模块获得路径不重叠的1+repNumL个端口号作为原始流和冗余流的源端口号,并将这1+repNumL个端口号及其对应的输入参数作为一条记录存储在数据库的源端口号对应表中。3.  根据权利要求1所述的基于冗余技术的数据中心短流加速方法,其特征在于:所述通过路径碰撞避免模块得到路径不重叠的1+repNumL个源端口号的步骤包括:41)输入参数包括TCP流的源IP地址、目的IP地址、目的端口号和要创建的复制流的数目k=1+repNumL,所述复制流包括1条原始流和repNumL条冗余流,初始化源端口号集合srcPorts及其对应的路径集合Addr为空集;42)以步骤41)输入参数中的源IP地址、目的IP地址和目的端口号为主键,判断是否能够在数据库中的表IP_srcPorts中查询到相应的记录,如是,则将查询到的结果存储在源端口号集合srcPorts中,进入步骤48),如否,则进入步骤43);43)选择最小的可用端口号port作为原始流的源端口号,同时使port自减1;44)判断k是否为0,如是则进入步骤47),如否则进入步骤45);45)port以步长为1递增,通过路径侦测模块获得递增后的端口号port对应的路径addr,判断该路径addr是否属于路径集合Addr,如是则重复步骤45),如否,则进入步骤46);46)将当前的port及其对应的addr分别加入源端口号集合srcPorts和路径集合Addr中去,k=k-1,进入步骤44);47)将输入参数及其对应的源端口号集合srcPorts作为一条记录存储到数据库中的源端口号对应表IP_srcPorts中;48)输出路径不重叠的包括原始流和冗余流在内的源端口号集合srcPorts,结束。4.  根据权利要求3所述的基于冗余技术的数据中心短流加速方法,其特征在于:所述通过路径侦测模块获得端口号对应的路径的步骤包括:根据至少包括源IP地址、目的IP地址、端口号port、目的端口号的输入参数,创建一个TTL为3的报文,并发送出去获得ICMP应答报文,根据应答报文的源IP地址获得输入参数中端口号port对应的路径。5.  根据权利要求1所述的基于冗余技术的数据中心短流加速方法,其特征在于:所述周期性运行的冗余流数量分配模块的步骤,包括:61)输入参数包括历史数据的总流量Θ、历史数据中不同大小的流的数目数组π={π1,π2,…,πi,…,πs}、用于约束负载的冗余流数目的约束系数∈和短流长度阈值S;62)初始化sum为0,T为从1到S的整数的集合,以及长度为S用来存储不同大小的短流创建冗余流的数量的冗余流数量表repNum={0,0,0,0,…,0},大小为i的所有流的流量和η={π1,2*π2,…,i*πi,…,S*πs};63)在集合T中选择使最大的i赋值给L,其中p为碰撞概率,进入步骤64);64)判断当大小为L的流增加一条冗余流时,新增加的流量会不会使总的流量大于限制流量,即sum+ηL>ε*Θ是否成立,若是,则进入步骤65),否则,进入步骤66);65)从集合T中删除L,进入步骤63);66)判断数组π的第L项πL不等于零及冗余流数量表repNum中表示大小为L的流的冗余流数目repNumL小于数据中心中等价路径数目ecpNum两个条件是否同时成立,当判断结果为否时,则进入步骤67),否则进入步骤68);67)从集合T中删除L,进入步骤69);68)更新冗余流数量表repNum中表示大小为L的流的冗余流数目repNumL=repNumL+1,同时更新sum=sum+ηL,进入步骤69);69)判断集合T是否为空,若是,则进入步骤610),否则进入步骤63);610)将用来存储不同大小的短流创建冗余流的数量的冗余流数量表repNum写入数据库,结束。6.  一种基于冗余技术的数据中心短流加速系统,其特征在于,包括:主模块,用于向应用程序提供建立TCP流的调用接口;以及用于根据流的大小L查询数据库中的冗余流数量表确定要创建的冗余流的数目repNumL;以及用于调用路径碰撞避免模块得到原始流和repNumL个冗余流的源端口号集合,并调用TCP套接字创建1条原始流和repNumL条冗余流;冗余流数量分配模块,用于根据历史数据,确定不同大小的短流创建冗余流的数量,并将结果存储在数据库的冗余流数量表中;路径碰撞避免模块,用于根据至少包括TCP流的源IP地址、目的IP地址、目的端口号和要创建的复制流的数目k=1+repNumL的输入参数,获得路径不重叠的1+repNumL个端口号作为原始流和冗余流的源端口号集合;并将这1+repNumL个端口号集合及其对应的输入参数作为一条记录存储在数据库的源端口号对应表中;数据库,用于存储冗余流数量分配模块得到的冗余流数量表,和通过路径碰撞避免模块获得的对应不同输入参数的原始流和冗余流的源端口号对应表。7.  根据权利要求6所述的基于冗余技术的数据中心短流加速系统,其特征在于:所述路径碰撞避免模块HCA,用于根据至少包括TCP流的源IP地址、目的IP地址、目的端口号和要创建的复制流的数目k=1+repNumL的输入参数来查询源端口号对应表,当源端口号对应表中存储有该输入参数对应的记录时,查询源端口号对应表获得路径不重叠的1+repNumL个端口号作为原始流和冗余流的源端口号;以及当源端口号对应表中没有该输入参数对应的记录时,通过路径侦测模块获得路径不重叠的1+repNumL个端口号作为原始流和冗余流的源端口号,并将这1+repNumL个端口号及其对应的输入参数作为一条记录存储在数据库的源端口号对应表中。8.  根据权利要求7所述的基于冗余技术的数据中心短流加速系统,其特征在于:所述路径侦测模块,用于根据至少包括源IP地址、目的IP地址、端口号port、目的端口号的输入参数,创建一个TTL为3的报文,并发送出去获得ICMP应答报文,根据应答报文的源IP地址获得并返回输入参数中端口号port对应的路径。

说明书

说明书基于冗余技术的数据中心短流加速方法及系统
技术领域
本发明涉及一种数据中心的短流加速方法和系统,具体涉及一种基于冗余技术的数据中心短流加速方法和系统。
背景技术
在数据中心中,实时应用的任务大多由短流构成,这些短流完成的快慢对用户的体验有重要的影响。使用冗余技术降低短流完成时间是一种很有潜力的方法,具体方法是为每一条短流(原始流)创建一条携带相同内容的流(冗余流),应用程序使用最先完成的流的结果。在理想的情况下,这种技术可以利用数据中心的等价路径加速短流的完成。然而,由于数据中心中等价多路径协议的使用,冗余流和原始流很有可能被路由到同一条路径,这导致冗余技术加速短流的作用十分有限。另外,为每一条短流之创建一条冗余流不能有效利用数据中心中的多条等价路径。现有技术中存在的冗余流与原始流的路径碰撞以及等价路径不能充分利用等问题,带来了较大的性能损失,这些问题亟待解决。
发明内容
发明目的:为了解决现有的数据中心短流加速方法的不足,提供一种基于冗余技术的数据中心短流加速方法,同时提供一种基于冗余技术的数据中心短流加速系统。
技术方案:为解决上述技术问题,本发明提供的基于冗余技术的数据中心短流加速方法,包括如下步骤:
周期性运行冗余流数量分配模块的步骤,包括:周期性地根据历史数据确定不同大小的短流创建冗余流的数量,并将结果存储在数据库的冗余流数量表中;
为应用程序的短流分配冗余流数量,并通过路径碰撞避免方法获得路径不重叠的源端口号集合来创建原始流和对应数量的冗余流的步骤,包括:
1)应用程序调用主模块提供的接口创建TCP连接时,主模块判断该TCP流的源IP地址和目的IP地址是否在同一Top-of-Rack交换机上,如是则结束,如否则进入步骤2);
2)判断该TCP流的大小L是否大于短流长度阈值S,如是则结束,如否则进入步骤3);
3)根据TCP流的大小L查询数据库中的冗余流数量表repNum确定要创建的冗余流的数目repNumL;
4)调用路径碰撞避免模块得到路径不重叠的1+repNumL个源端口号;
5)将获得的1+repNumL个源端口号分别作为1条原始流和repNumL个冗余流的源端口号,调用TCP套接字创建1+repNumL条TCP连接。
优选的,所述通过路径碰撞避免模块得到路径不重叠的1+repNumL个源端口号的步骤包括:根据至少包括TCP流的源IP地址、目的IP地址、目的端口号和要创建的复制流的数目k=1+repNumL的输入参数来查询源端口号对应表,当源端口号对应表中存储有该输入参数对应的记录时,直接查表获得路径不重叠的1+repNumL个端口号作为原始流和冗余流的源端口号;以及当源端口号对应表中没有该输入参数对应的记录时,迭代式地通过路径侦测模块获得路径不重叠的1+repNumL个端口号作为原始流和冗余流的源端口号,并将这1+repNumL个端口号及其对应的输入参数作为一条记录存储在数据库的源端口号对应表中。具体为:
41)输入参数包括TCP流的源IP地址、目的IP地址、目的端口号和要创建的复制流的数目k=1+repNumL,所述复制流包括1条原始流和repNumL条冗余流,初始化源端口号集合srcPorts及其对应的路径集合Addr为空集;
42)以步骤41)输入参数中的源IP地址、目的IP地址和目的端口号为主键,判断是否能够在数据库中的表IP_srcPorts中查询到相应的记录,如是,则将查询到的结果存储在源端口号集合srcPorts中,进入步骤48),如否,则进入步骤43);
43)选择最小的可用端口号port作为原始流的源端口号,同时使port自减1;
44)判断k是否为0,如是则进入步骤47),如否则进入步骤45);
45)port以步长为1递增,通过路径侦测模块获得递增后的端口号port对应的路径addr,判断该路径addr是否属于路径集合Addr,如是则重复步骤45),如否,则进入步骤46);
46)将当前的port及其对应的addr分别加入源端口号集合srcPorts和路径集合Addr中去,k=k-1,进入步骤44);
47)将输入参数及其对应的源端口号集合srcPorts作为一条记录存储到数据库中的源端口号对应表IP_srcPorts中;
48)输出路径不重叠的包括原始流和冗余流在内的源端口号集合srcPorts,结束。
优选的,所述通过路径侦测模块获得端口号对应的路径的步骤包括:根据至少包括源IP地址、目的IP地址、端口号port、目的端口号的输入参数,创建一个TTL为3的报文,并发送出去获得ICMP应答报文,根据应答报文的源IP地址获得输入参数中端口号port对应的路径。
优选的,所述周期性运行的冗余流数量分配模块的步骤,包括:
61)输入参数包括历史数据的总流量Θ、历史数据中不同大小的流的数目数组π={π1,π2,…,πi,…,πs}、用于约束负载的冗余流数目的约束系数∈和短流长度阈值S;
62)初始化sum为0,T为从1到S的整数的集合,以及长度为S用来存储不同大小的短流创建冗余流的数量的冗余流数量表repNum={0,0,0,0,…,0},大小为i的所有流的流量和η={π1,2*π2,…,i*πi,…,S*πs};
63)在集合T中选择使最大的i赋值给L,其中p为碰撞概率,进入步骤64);
64)判断当大小为L的流增加一条冗余流时,新增加的流量会不会使总的流量大于限制流量,即sum+ηL>ε*Θ是否成立,若是,则进入步骤65),否则,进入步骤66);
65)从集合T中删除L,进入步骤63);
66)判断数组π的第L项πL不等于零及冗余流数量表repNum中表示大小为L的流的冗余流数目repNumL小于数据中心中等价路径数目ecpNum两个条件是否同时成立,当判断结果为否时,则进入步骤67),否则进入步骤68);
67)从集合T中删除L,进入步骤69);
68)更新冗余流数量表repNum中表示大小为L的流的冗余流数目repNumL=repNumL+1,同时更新sum=sum+ηL,进入步骤69);
69)判断集合T是否为空,若是,则进入步骤610),否则进入步骤63);
610)将用来存储不同大小的短流创建冗余流的数量的冗余流数量表repNum写入数据库,结束。
本发明同时提供的一种基于冗余技术的数据中心短流加速系统,包括:
主模块,用于向应用程序提供建立TCP流的调用接口;以及用于根据流的大小L查询数据库中的冗余流数量表确定要创建的冗余流的数目repNumL;以及用于调用路径碰撞避免模块得到原始流和repNumL个冗余流的源端口号集合,并调用TCP套接字创建1条原始流和repNumL条冗余流;
冗余流数量分配模块,用于根据历史数据,确定不同大小的短流创建冗余流的数量,并将结果存储在数据库的冗余流数量表中;
路径碰撞避免模块,用于根据至少包括TCP流的源IP地址、目的IP地址、目的端口号和要创建的复制流的数目k=1+repNumL的输入参数,获得路径不重叠的1+repNumL个端口号作为原始流和冗余流的源端口号集合;并将这1+repNumL个端口号集合及其对应的输入参数作为一条记录存储在数据库的源端口号对应表中;
数据库,用于存储冗余流数量分配模块得到的冗余流数量表,和通过路径碰撞避免模块获得的对应不同输入参数的原始流和冗余流的源端口号对应表。
优选的,所述路径碰撞避免模块HCA,用于根据至少包括TCP流的源IP地址、目的IP地址、目的端口号和要创建的复制流的数目k=1+repNumL的输入参数来查询源端口号对应表,当源端口号对应表中存储有该输入参数对应的记录时,查询源端口号对应表获得路径不重叠的1+repNumL个端口号作为原始流和冗余流的源端口号;以及当源端口号对应表中没有该输入参数对应的记录时,通过路径侦测模块获得路径不重叠的1+repNumL个端口号作为原始流和冗余流的源端口号,并将这1+repNumL个端口号及其对应的输入参数作为一条记录存储在数据库的源端口号对应表中。
优选的,上述路径侦测模块,用于根据至少包括源IP地址、目的IP地址、端口号port、目的端口号的输入参数,创建一个TTL为3的报文,并发送出去获得ICMP应答报文,根据应答报文的源IP地址获得并返回输入参数中端口号port对应的路径。
有益效果:本发明向应用程序提供接口,为应用程序的短流创建多条冗余流,一方面通过路径碰撞避免技术把冗余流和原始流路由到不同的路径,避免原始流和冗余流、及冗余流和冗余流之间发生路径重叠;另一方面通过冗余流数量分配技术,针对不同大小的短流分配不同数量的冗余流,整体而言,在控制负载的前提下最大化等价路径的使用,等价路径利用合理高效。本发明提供的基于短流路径碰撞避免和冗余流分配技术的数据中心短流加速方法和系统,相对现有技术,其主要优势包括:
1、高效:该方案能够有效避免冗余流的路径冲突,大大降低数据中心中短流的完成时间,通过仿真实验表明,相比现有技术基于简单复制的短流加速方案,本发明能够进一步对短流提速至少25%。
2、易部署:不需要修改数据中心中的交换机,以及主机的TCP/IP协议栈,可以作为应用层与套接字层之间的中间软件层,以实现为库供应用程序调用,整体易于在数据中心中部署,易实现。
3、负载低:冗余流的创建对大流的影响几乎可以忽略不计。
整体而言,本发明克服了现有的数据中心短流加速方案的不足,即冗余流与原始流的路径碰撞以及等价路径不能充分利用带来的性能损失,更为高效、易部署实现、负载低。
附图说明
图1是实施例的系统架构图;
图2是实施例中主模块SmartRep的流程图;
图3为实施例中短流路径重叠避免模块HCA的流程图;
图4为实施例中路径探测例程traceRoute的流程图;
图5为实施例中冗余流分配模块RepNumAssign的流程图。
具体实施方式
下面结合实施例对本发明做进一步的详细说明,本实施列对本发明不构成限定。
如图1所示,本实施例提供的基于冗余技术的数据中心短流加速系统,包括:
主模块SmartRep,用于向应用程序提供建立TCP流的调用接口;以及用于根据流的大小查询数据库中的冗余流数量表RepNum确定要创建的冗余流的数目repNumL;以及用于调用路径碰撞避免模块得到原始流和repNumL个冗余流的源端口号集合srcPorts,并调用TCP套接字创建1条原始流和repNumL条冗余流。
冗余流数量分配模块RepNumAssign,用于根据历史数据,确定不同大小的短流创建冗余流的数量,并将结果存储在数据库的冗余流数量表RepNum中。
路径碰撞避免模块HCA,用于根据至少包括TCP流的源IP地址、目的IP地址、目的端口号和要创建的复制流的数目k=1+repNumL的输入参数,获得路径不重叠的1+repNumL个端口号作为原始流和冗余流的源端口号集合srcPorts;并将这1+repNumL个端口号集合及其对应的输入参数作为一条记录存储在数据库的源端口号对应表IP_srcPorts中。在数据中心中,等价多路径协议通过哈希TCP流的五元组得到该流的路径。冗余流和原始流的IP地址和目的端口号是一样的,只有源端口号不同。为了避免冗余流和原始流以及冗余流和冗余流通过同一条路径,利用ICMP的差错报告报文和数据中心网络有规则的FatTree结构,可以对每对主机间的TCP流通过的路径给出预测,并通过源端口号选择,保证这些流通过不同的路径。本实施例是通过构造一个具有指定TCP五元组并且TTL为3的报文,发送出去得到ICMP应答报文,根据应答报文的IP地址识别路径;进而通过修改探测报文的源端口号,可以探测出与原始 流具有相同IP和目的端口号但是源端口号不同的流的路径,通过本方法可以找到原始流的路径,以及各个源端口对应的路径,从这些源端口中选择一个对应路径与原始流的路径不同的端口,分配给冗余流,从而获得路径不重叠的1+repNumL个端口号作为原始流和冗余流的源端口号集合srcPorts。
数据库,用于存储冗余流数量分配模块得到的冗余流数量表RepNum,和通过路径碰撞避免模块获得的对应不同输入参数的原始流和冗余流的源端口号对应表IP_srcPorts。
本实施例中,上述路径碰撞避免模块HCA,根据至少包括TCP流的源IP地址、目的IP地址、目的端口号和要创建的复制流的数目k=1+repNumL的输入参数来查询源端口号对应表IP_srcPorts,当源端口号对应表中存储有该输入参数对应的记录时,直接查表获得路径不重叠的1+repNumL个端口号作为原始流和冗余流的源端口号;以及当源端口号对应表IP_srcPorts中没有该输入参数对应的记录时,迭代式地通过路径侦测模块TraceRoute获得路径不重叠的1+repNumL个端口号作为原始流和冗余流的源端口号,并将这1+repNumL个端口号及其对应的输入参数作为一条记录存储在数据库的源端口号对应表IP_srcPorts中。
路径碰撞避免模块HCA调用路径侦测模块TraceRoute主动发送报文探测具有特定TCP五元组的流的路径,从而为冗余流选择合适的TCP源端口,避免冗余流之间以及冗余流和原始流之间的路径重叠。其中路径侦测模块TraceRoute,用于通过主动发送报文探测具有各种TCP/IP五元组的流的路径,具体为用于根据至少包括源IP地址、目的IP地址、端口号port、目的端口号的输入参数,创建一个TTL为3的报文,并发送出去获得ICMP应答报文,根据应答报文的源IP地址获得并返回输入参数中端口号port对应的路径。
本实施例提供的基于冗余技术的数据中心短流加速方法,包括:周期性运行冗余流数量分配模块的步骤,和为应用程序的短流分配冗余流数量,并通过路径碰撞避免方法获得路径不重叠的源端口号集合来创建原始流和对应数量的冗余流的步骤。
其中为应用程序的短流分配冗余流数量,并通过路径碰撞避免方法获得路径不重叠的源端口号集合来创建原始流和对应数量的冗余流的步骤,主要通过主模块SmartRep来实现,在接受应用程序创建一条TCP流的请求时,主模块SmartRep首先要检测流的两端主机是否在同一个Top-of-Rack交换机上,如果是,那么不需要为该流创建冗余流,因为该流的主机之间只有一条等价路径,创建冗余流没有意义;然后SmartRep需要判 断应用程序创建的流是否为短流,可根据实际需要设定长度阈值S,并规定大小不大于长度阈值S的流是短流,只有短流才有实施加速的必要。最后查询数据库的表repNum获得需要创建的冗余流数目repNumL,调用HCA获得原始流和repNumL条冗余流的源端口号,并使用这1+repNumL个端口号调用TCP套接字创建原始流和repNumL条冗余流。结合图2所示的主模块SmartRep的流程图可见,具体包括:
1)应用程序调用主模块提供的接口创建TCP连接时,主模块判断该TCP流的源IP地址和目的IP地址是否在同一Top-of-Rack交换机上,如是则结束,如否则进入步骤2);
2)判断该TCP流的大小L是否大于短流长度阈值S,如是则结束,如否则进入步骤3);
3)根据TCP流的大小L查询数据库中的冗余流数量表repNum确定要创建的冗余流的数目repNumL;
4)调用路径碰撞避免模块得到路径不重叠的1+repNumL个源端口号;
5)将获得的1+repNumL个源端口号分别作为1条原始流和repNumL个冗余流的源端口号,调用TCP套接字创建1+repNumL条TCP连接。
路径碰撞避免模块HCA针对三元组(srcIP,dstIP,dstPort)和要创建的冗余流的数目k=1+repNumL,计算获取原始流和冗余流的源端口号,并且保证使用这些端口号这些流的路径均不发生重叠,即迭代式地搜索可用的源端口,并返回搜索到的路径均不重叠的k个端口号。为了提高效率,本实施例提供的方法中把已经计算得到的结果保存在数据库中的源端口号对应表IP_srcPorts中,以避免重复计算。上述通过路径碰撞避免模块得到路径不重叠的k=1+repNumL个源端口号的步骤,如图3所示,具体包括:
41)输入参数包括TCP流的源IP地址、目的IP地址、目的端口号和要创建的复制流的数目k=1+repNumL,所述复制流包括1条原始流和repNumL条冗余流,初始化源端口号集合srcPorts及其对应的路径集合Addr为空集;
42)以步骤41)输入参数中的源IP地址、目的IP地址和目的端口号为主键,判断是否能够在数据库中的表IP_srcPorts中查询到相应的记录,如是,则将查询到的结果存储在源端口号集合srcPorts中,进入步骤48),如否,则进入步骤43);
43)选择最小的可用端口号port作为原始流的源端口号,同时使port自减1;
44)判断k是否为0,如是则进入步骤47),如否则进入步骤45);
45)port以步长为1递增,通过路径侦测模块获得递增后的端口号port对应的路径addr,判断该路径addr是否属于路径集合Addr,如是则重复步骤45),如否,则进入步骤46);
46)将当前的port及其对应的addr分别加入源端口号集合srcPorts和路径集合Addr中去,k=k-1,进入步骤44);
47)将输入参数及其对应的源端口号集合srcPorts作为一条记录存储到数据库中的源端口号对应表IP_srcPorts中;
48)输出路径不重叠的包括原始流和冗余流在内的源端口号集合srcPorts,结束。
本方法通过traceRoute计算k个源端口集合时,保证计算每一个端口时,它对应的路径都与之前计算的端口对应的路径不重叠。通过图3可见,一旦找到的下一个端口的路径与之前的端口对应的路径重叠,就选择下一个端口重新测试,直到找到对应路径不重叠的端口为止。
源端口对应的路径的确定由路径侦测模块TraceRoute完成,如图4所示,上述通过路径侦测模块TraceRoute获得端口号port对应的路径的步骤包括:根据至少包括源IP地址、目的IP地址、端口号port、目的端口号的输入参数,创建一个TTL为3的报文,并发送出去,当这个报文到达第三跳时,TTL变为0,第三跳交换机发送ICMP差错报文给源主机,这个差错报文包含第三跳交换机的地址信息。由于FatTree数据中心拓扑的特殊性,第三跳交换机能够确定一条路径,因此这样就可以根据获得的ICMP应答报文的源IP地址获得输入参数中端口号port对应的路径。
为每一条短流创建一条冗余流不能够利用数据中心中大量的等价路径,而为每一条原始流创建与等价路径等量的冗余流会造成很大的开销。为此,本发明对不同大小和数量的冗余流对数据中心短流完成时间的影响建模,为了充分利用数据中心中存在的多条等价路径同时保持额外负载在可以忍受的范围内,该模块建立了如下模型:
Σi=1Si*πi*xi<&epsiv;*Θ,&ForAll;i&Element;{1,2,3,...,S},xi&Element;{0,1,2,...,ecpNum-1}---(1);]]>
Σi=1Sπip1+xi---(2);]]>
其中,S是短流和长流的界限,即长度阈值,也可称为小流划分界限,也就是说当一条流的容量不大于S时,它被认为是一条短流;πi是历史数据中大小为i的流的数目;xi表示为大小为i的流创建的复制流的数目,不能超过等价路径的数目ecoNum减1;因此,不等式的左边就是因为创建冗余流引起的开销。Θ是历史数据的总流量;ε是负载约束系数,为一个小于1的数,表示把创建复制流的开销限制在一个很小的范围。
式(2)为目标函数,其中的p表示碰撞概率,通常设置为0.1。当xi的冗余流都与原始流发生路径碰撞时,此时的收益为0,否则为1。即冗余流与原始流都不发生路径碰撞时概率是(),因此总的收益的期望值是最大化这个收益等价于最小化Σi=1Sπip1+xi.]]>
通过上述建立的模型,本实施例提供了一个以历史数据为输入的离线算法,该算法在限定冗余流开销的前提下,根据历史数据中短流的大小和数量来确定某一指定大小的流应创建的冗余流数量。该算法运行于冗余流数量分配模块RepNumAssign,它每次选择x的某一项xi加1,这相当于对目标函数Σi=1Sπip1+xi=π1p1+x1+π2p1+x2+...+]]>πSp1+xS]]>中的第i项乘以p。由于p小于1,因此每次执行(xi+1)都会使得目标函数值变小,而且如果在目标函数的S项()中选择最大的一项执行(xi+1),会使得目标函数值减小的最多。
上述周期性运行冗余流数量分配模块RepNumAssign的步骤,具体如图5所示:
61)输入参数包括历史数据的总流量Θ、历史数据中不同大小的流的数目数组π={π1,π2,…,πi,…,πs}、用于约束负载的冗余流数目的约束系数∈和短流长度阈值S;
62)初始化sum为0,T为从1到S的整数的集合,以及长度为S用来存储不同大小的短流创建冗余流的数量的冗余流数量表repNum={0,0,0,0,…,0},即repNum初始化为0的集合,大小为i的所有流的流量和η={π1,2*π2,…,i*πi,…,S*πs},其中η的第L项ηL=L*πL表示大小为L的所有流的流量之和,repNum的第L项repNumL表示大小为L的流的冗余流的数目;
63)在集合T中选择使最大的i赋值给L,其中p为碰撞概率,进入步骤64);
64)判断当大小为L的流增加一条冗余流时,新增加的流量会不会使总的流量大于限制流量,即sum+ηL>ε*Θ是否成立,若是,则进入步骤65),否则,进入步骤66);
65)从集合T中删除L,进入步骤63);
66)判断数组π的第L项πL不等于零及冗余流数量表repNum中表示大小为L的流的冗余流数目repNumL小于数据中心中等价路径数目ecpNum两个条件是否同时成立,当判断结果为否时,则进入步骤67),否则进入步骤68);
67)从集合T中删除L,进入步骤69);
68)更新冗余流数量表repNum中表示大小为L的流的冗余流数目repNumL=repNumL+1,即将数组repNum的第L项repNumL加1,同时更新sum=sum+ηL,进入步骤69);
69)判断集合T是否为空,若是,则进入步骤610),否则进入步骤63);
610)将用来存储不同大小的短流创建冗余流的数量的冗余流数量表repNum写入数据库,结束。
仿真实验:
实验条件:
硬件:24核心,24Gb内存;
系统:linux系统,2.6版本内核;
仿真平台:ns-2.35;
仿真设置:数据中心网络采用Fattree结构,网络中有250个节点,运行的ECMP协议采用crc16作为哈希函数,流的发送端和接收端随机选择,流的产生时间符合指数分布,流的大小符合数据中心网络中经验性的分布函数,仿真实验在八种不同的负载下运行。
与本实施例对比的现有技术为:为每一条短流(原始流)创建一条携带相同内容的流(冗余流),应用程序使用最先完成的流的结果。
实验结果:下面的表格是本发明与现有技术的实验结果对比,其中表1是短流AFCT(Average Flow Completion Time,标准化流平均完成时间)的对比,表2是短流Tail-FCT(标准化流平均完成时间)的对比,标准化流完成时间是用真实的流完成时间除以流单独占用所有带宽资源时的完成时间得到的。从仿真实验结果来看,相比现有技术基于简单复制的短流加速方案,本发明能够进一步对短流提速至少25%(提速比例通过(现有技术AFCT-本发明AFCT)/现有技术AFCT得到)。
表1


表2

由上可见,本实施例提供的短流加速方法中,包括负责避免冗余TCP流之间发生路径重叠的HCA模块,以及负责选择最优冗余流数量的RepNumAssign模块。HCA算法通过主动发送报文探测具有各种TCP/IP五元组的流的路径信息,然后利用这些信息为冗余流选择合适的源端口,使其路径各不相同,即原始流和冗余流的路径互不重叠;同时,为了使得多条等价路径得到合理的利用,且开销尽可能小,本实施例根据历史数据对不同大小的流分配不同数量的冗余流,即通过RepNumAssign模块,对不同大小的冗余流对数据中心短流完成时间的影响建模,选择为不同大小的TCP流确定最优的冗余流数量。该方案能够有效避免冗余流的路径冲突,大大降低数据中心中短流的完成时间;另外,该方案不需要修改数据中心中的交换机,以及主机的TCP/IP协议栈,可以实现为库供应用程序调用,使其易于在数据中心中部署。
本发明具体应用途径很多,以上所述仅是本发明的优选实施方式,应当指出以上实施列对本发明不构成限定,相关工作人员在不偏离本发明技术思想的范围内,所进行的 多样变化和修改,均落在本发明的保护范围内。

基于冗余技术的数据中心短流加速方法及系统.pdf_第1页
第1页 / 共18页
基于冗余技术的数据中心短流加速方法及系统.pdf_第2页
第2页 / 共18页
基于冗余技术的数据中心短流加速方法及系统.pdf_第3页
第3页 / 共18页
点击查看更多>>
资源描述

《基于冗余技术的数据中心短流加速方法及系统.pdf》由会员分享,可在线阅读,更多相关《基于冗余技术的数据中心短流加速方法及系统.pdf(18页珍藏版)》请在专利查询网上搜索。

本发明公开了基于冗余技术的数据中心短流加速方法和系统,方法包括周期性运行冗余流数量分配模块的步骤,和为应用程序短流分配冗余流数量,并通过路径碰撞避免方法获得路径不重叠的源端口号集合来创建原始流和对应数量的冗余流的步骤;系统包括负责选择冗余流数量的冗余流数量分配模块、负责避免原始流和冗余流之间发生路径重叠的路径碰撞避免模块、数据库,和用于向应用程序提供建立TCP流的调用接口,并根据冗余流数目调用路径。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 电学 > 电通信技术


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1