《基于模拟退火算法的查询优化方法.pdf》由会员分享,可在线阅读,更多相关《基于模拟退火算法的查询优化方法.pdf(8页珍藏版)》请在专利查询网上搜索。
1、10申请公布号CN103336829A43申请公布日20131002CN103336829ACN103336829A21申请号201310282243422申请日20130705G06F17/3020060171申请人吉林大学地址130012吉林省长春市前进大街2699号72发明人姜弢宋健徐学纯贾海青74专利代理机构长春吉大专利代理有限责任公司22201代理人王立文54发明名称基于模拟退火算法的查询优化方法57摘要本发明涉及一种基于模拟退火算法的查询优化方法,是将数据查询优化过程分成建立模型,分解策略空间和优化三部分,然后引入模拟退火算法,对所有策略空间子集进行并行搜索,从每个子集中得到一个最。
2、终解,在比较最终解后得到最优解。本发明公开的模拟退火算法较其他智能优化算法能够有效避免陷入局部极值,缩减了优化时间;其次,由于使用了并行搜索,提高了模拟退火算法搜索范围,降低了模拟退火算法局部搜索特性对搜索精度的影响。与传统的局部随机搜索算法搜索到最优策略的概率比较,对提高得到最优策略的概率效果明显,提高了数据库的查询速度,缩短查询优化相对时间,以及提高得到最优策略概率。51INTCL权利要求书1页说明书5页附图1页19中华人民共和国国家知识产权局12发明专利申请权利要求书1页说明书5页附图1页10申请公布号CN103336829ACN103336829A1/1页21一种基于模拟退火算法的查询。
3、优化方法,其特征在于,包括以下步骤A、定义一个策略空间S,设S内的所有查询策略都需要N1个步骤才能够完成查询任务;B、建立基于图形结构的查询策略代价评估数学模型,设图中有N个结点,从结点II1,2,L,N到结点JJ1,2,L,N的路径为DIJ,路径表示从结点I到结点J的消耗时间即代价,代价矩阵是所求为遍历N个结点的总代价,代价函数如下式中X1,X2,L,XN为代价函数FX的一个解X1,其中XI1,2,3L,N,XJ1,2,3L,N,XIXJIJ,FX所有解组成的集合称为解空间X,模型中的结点表示查询状态,遍历一次N个结点表示采用一种查询策略完成查询任务,X1表示某一种查询策略,解空间X表示策略。
4、空间S;C、将解空间X随机分解成2个以上的子集,表示为XR1R;D、采用模拟退火算法求最优解,先设定模拟退火算法的初始参数,包括初始温度T0,温度降温因子,马氏链长度L,一般地,初始参数选取可采用下述经验值T0100,08或09,L100N,计算过程中,新解的接受概率为式中T为当前温度,降温后的温度TET;E、对所有解空间X的子集XR1R并行采用模拟退火算法进行优化,从XR中随机选取一个解作为当前解XR1,根据式1计算当前代价FXR1;F、令停止降温条件M0,通过扰动方式调换当前解XR1中任意几个元素的位置形成一个新的解XR2,根据公式1计算出新的代价FXR2,求出代价差FFXR2FXR1,新。
5、解的接受原则是,当F0时,接受XR2作为当前最优解,当F0时,给出0到1范围内的随机值,在P时,接受XR2作为当前最优解,否则抛弃XR2。在当前温度下共进行L次扰动,若扰动过程中接受了新的解,则令M1,再根据TET降低温度;G、令当前温度TTE,重复步骤F,直到在当前温度T下不再接受新的解,令M0,停止计算,此时函数收敛,求得的当前解为XR最终解,比较各个子集对应的最终解,代价最小的为最优解,该解所对应的查询策略为最优策略。权利要求书CN103336829A1/5页3基于模拟退火算法的查询优化方法技术领域0001本发明涉及一种关系数据库查询的优化方法,尤其是提高大型关系数据库多链接查询速度的优。
6、化方法。背景技术0002关系数据库是建立在数学概念基础上的一款主流数据库,能够直接的描述现实关系,存取效率较高,但是数据结构比较复杂,尤其是大型关系数据库,随着应用环境的扩大,其储存的数据种类越来越多,数量也越来越大,数据结构就变得极为复杂,在进行多链接查询时,查询效率低下。为了使大型关系数据库数据库系统能够及时响应用户操作,快速给出查询结果,往往要进行查询优化。查询优化指的是在查询语句对应的多种执行策略中选择一种能够最快给出查询结果的策略,即最优策略,执行策略也叫做查询策略,查询策略的集合称为策略空间S,查询优化过程中运用的算法称为查询优化方法。0003传统查询优化方法主要包括穷尽搜索算法和。
7、局部随机搜索算法,穷尽搜索算法通过穷尽S内的每一条查询策略寻找最优策略,该算法对储存空间的需求很大,当查询关系个数较多时,算法效率太低,变得不可行。局部随机搜索算法在搜索最优策略的过程中并不搜索整个策略空间S,而只搜索它的一个子集,这个子集是被期待包含一个最优策略或者至少包含一个接近最优的策略,所以得到最优策略的概率很低。0004近年,智能优化算法在数据库查询优化问题上得到广泛运用,如遗传算法GENETICALGORITHM,GA和粒子群算法PARTICLESWARMOPTIMIZER,PSO等。当优化问题的规模较大、搜索空间变得复杂时,多数智能算法能够搜索到近最优解,但由于算法择优保留的搜索。
8、机制,以及后期变异、交叉等操作对最优解构成成分的破坏,会使算法在近最优解附近振荡,延长了搜索时间,或陷入局部极值无法进行更广范围的搜索,降低了搜索精度。发明内容0005本发明的目的在于针对上述现有技术的不足,提供了一种适用于大型关系数据库多链接,能够缩短查询优化相对时间以及提高得到最优策略概率的一种基于模拟退火算法的查询优化方法。0006本发明将数据查询优化过程分成建立模型,分解策略空间和优化3个部分,主要思想是首先,将查询优化问题转化为求全局最优解的问题,即建立数学模型,计算查询策略给出查询结果所消耗的时间代价的函数为代价函数,查询策略为代价函数的解,策略空间S为代价函数的解空间,该模型叫做。
9、查询策略代价评估数学模型;然后,将策略空间随机分解成3个以上的子集;最后,引入模拟退火算法,对所有策略空间子集进行并行搜索,从每个子集中得到一个最终解,在比较最终解后得到最优解,该解对应的查询策略为最优策略。0007本发明的目的是通过以下技术方案实现的说明书CN103336829A2/5页40008基于模拟退火算法的查询优化方法,包括以下步骤0009A定义一个策略空间S,设S内的所有查询策略都需要N1个步骤才能够完成查询任务;0010B建立基于图形结构的查询策略代价评估数学模型,设图中有N个结点,从结点II1,2,L,N到结点JJ1,2,L,N的路径为DIJ,路径表示从结点I到结点J的消耗时间。
10、即代价,代价矩阵是所求为遍历N个结点的总代价,代价函数如下00110012式中X1,X2,L,XN为代价函数FX的一个解X1,其中XI1,2,3L,N,XJ1,2,3L,N,XIXJIJ,FX所有解组成的集合称为解空间X,模型中的结点表示查询状态,遍历一次N个结点表示采用一种查询策略完成查询任务,X1表示某一种查询策略,解空间X表示策略空间S;0013C将解空间X随机分解成2个以上的子集,表示为XR1R;0014D采用模拟退火算法求最优解,先设定模拟退火算法的初始参数,包括初始温度T0,温度降温因子,马氏链长度L,一般地,初始参数选取可采用下述经验值T0100,08或09,L100N,计算过程。
11、中,新解的接受概率为00150016式中T为当前温度,降温后的温度TET;0017E对所有解空间X的子集XR1R并行采用模拟退火算法进行优化,从XR中随机选取一个解作为当前解XR1,根据式1计算当前代价FXR1;0018F令停止降温条件M0,通过扰动方式调换当前解XR1中任意几个元素的位置形成一个新的解XR2,根据公式1计算出新的代价FXR2,求出代价差FFXR2FXR1,新解的接受原则是,当F0时,接受XR2作为当前最优解,当F0时,给出0到1范围内的随机值,在P时,接受XR2作为当前最优解,否则抛弃XR2。在当前温度下共进行L次扰动,若扰动过程中接受了新的解,则令M1,再根据TET降低温度。
12、;0019G令当前温度TTE,重复步骤F,直到在当前温度T下不再接受新的解,令M0,停止计算,此时函数收敛,求得的当前解为XR最终解,比较各个子集对应的最终解,代价最小的为最优解,该解所对应的查询策略为最优策略。0020有益效果经试验,本发明公开的模拟退火算法较其他智能优化算法能够有效避免陷入局部极值,缩减了优化时间;其次,由于使用了并行搜索,提高了模拟退火算法搜索范围,降低了模拟退火算法局部搜索特性对搜索精度的影响。本发明公开的基于模拟退火算法的查询优化方法适用于大型数据库的查询优化,图1展示了基于模拟退火算法的查询优化方法收敛曲线,图2展示了模拟退火算法与传统的局部随机搜索算法搜索到最优策。
13、略说明书CN103336829A3/5页5的概率比较,从图中可以看出本发明对提高得到最优策略的概率的效果明显,而好的查询策略能够提高数据查询速度,本发明能够提高数据库的查询速度,缩短查询优化相对时间,以及提高得到最优策略概率。附图说明0021图1基于模拟退火算法的查询优化方法收敛曲线图0022图2模拟退火算法与传统查询优化算法搜索到最优策略的概率比较图具体实施方式0023下面结合附图对本发明作进一步的详细说明0024基于模拟退火算法的查询优化方法,是在大型数据库多条件复杂查询情况下对查询语句进行优化。主要通过比较查询语句对应的多种查询策略在执行过程中消耗的时间大小,找到消耗时间最小的查询策略,。
14、即最优策略,本发明能够提高得到最优策略的概率,从而提高系统的查询速度。0025基于模拟退火算法的查询优化算法,包括以下步骤0026A定义一个策略空间S,设S内的所有查询策略都需要N1个步骤才能够完成查询任务;0027B建立基于图形结构的查询策略代价评估数学模型,设图中有N个结点,从结点II1,2,L,N到结点JJ1,2,L,N的路径为DIJ,路径表示从结点I到结点J的消耗时间即代价,代价矩阵是所求为遍历N个结点的总代价,代价函数如下00280029式中X1,X2,L,XN为代价函数FX的一个解X1,其中XI1,2,3L,N,XJ1,2,3L,N,XIXJIJ,FX所有解组成的集合称为解空间X,。
15、模型中的结点表示查询状态,遍历一次N个结点表示采用一种查询策略完成查询任务,X1表示某一种查询策略,解空间X表示策略空间S;0030C将解空间X随机分解成2个以上的子集,表示为XR1R;0031D采用模拟退火算法求最优解,先设定模拟退火算法的初始参数,包括初始温度T0,温度降温因子,马氏链长度L,一般地,初始参数选取可采用下述经验值T0100,08或09,L100N,计算过程中,新解的接受概率为00320033式中T为当前温度,降温后的温度TET;0034E、对所有解空间X的子集XR1R并行采用模拟退火算法进行优化,从XR中随机选取一个解作为当前解XR1,根据式1计算当前代价FXR1;说明书C。
16、N103336829A4/5页60035F、令停止降温条件M0,通过扰动方式调换当前解XR1中任意几个元素的位置形成一个新的解XR2,根据公式1计算出新的代价FXR2,求出代价差FFXR2FXR1,新解的接受原则是,当F0时,接受XR2作为当前最优解,当F0时,给出0到1范围内的随机值,在P时,接受XR2作为当前最优解,否则抛弃XR2。在当前温度下共进行L次扰动,若扰动过程中接受了新的解,则令M1,再根据TET降低温度;0036G、令当前温度TTE,重复步骤F,直到在当前温度T下不再接受新的解,令M0,停止计算,此时函数收敛,求得的当前解为XR最终解,比较各个子集对应的最终解,代价最小的为最优。
17、解,该解所对应的查询策略为最优策略。0037实施例0038基于模拟退火算法的数据库查询优化算法,以对一条需要8个步骤完成查询任务的查询命令进行查询优化为例包括以下步骤0039A定义一个策略空间S,设S内的所有查询策略都需要8个步骤能够完成查询任务;0040B建立基于图形结构的查询策略代价评估数学模型,设图中有9个结点,从结点II1,2,L,9到结点JJ1,2,L,9的路径为DIJ,路径表示从结点I到结点J的消耗时间即代价,代价矩阵是所求为遍历9个结点的总代价,将N9带入公式1中得到的代价函数为00410042式中X1,X2,L,X9为代价函数FX的一个解X1,其中XI1,2,3L,9,XJ1,。
18、2,3L,9,XIXJIJ,所有解组成的集合称为解空间X,经过计算统计本例中共有362880个解,其中最优解为25855;0043C本例中将解空间X随机分解成了3个子集,表示为XR1R3;0044D采用模拟退火算法求最优解,先设定模拟退火算法的初始参数,初始温度T0100,温度衰减因子取08,马氏链长度为L900,根据公式2计算新解的接受概率为,降温后的温度TE08T,;0045E对3个子集X1,X2,X3并行采用模拟退火算法进行优化,从3个子集中随机选取一个解作为这个子集的当前解XR1,根据式1计算当前代价FXR1,本例中以子集X1示范,当前解XR10046X1111746,1677,157。
19、11,8433,9408,9518,16771,64900047初始代价FX179754;0048F令停止降温条件M0,通过扰动方式调换当前解X11中任意几个元素的位置形成一个新的解X12,本例中生成的新解为0049X125937,2025,7810,910,15779,13148,10593,66560050新代价为FX262858,求出代价差F16896,此时F0,接受X2作说明书CN103336829A5/5页7为当前最优解,若F0时,给出0到1范围内的随机值R,在PR时,接受X12作为当前最优解,否则抛弃X12。在当前温度下共进行900次扰动,若扰动过程中接受了新的解,则令M1,再根据。
20、TE08T降低温度;0051G令当前温度TTE,重复步骤F,直到在当前温度T下不再接受新的解,令M0,停止计算,此时函数收敛,本例子集X1共降温9次,最后T134218,最终解为25855,其它子集X2和X3分别降温9次和11次,最终解分别为29845和26083,则最优解为25855,其所对应的查询策略为最优策略。0052采用上述方法对9结点查询命令进行查询优化,图1是运用本发明搜索最优策略的收敛曲线,图2是本发明与传统查询优化算法在不同解结点的情况下搜索到最优策略的概率比较,可以看到本发明得到最优策略的概率明显高于传统查询优化算法。说明书CN103336829A1/1页8图1图2说明书附图CN103336829A。