太阳能海水淡化问题的区间支持向量机模型及优化设计技术领域
本专利属于海水淡化领域,具体涉及一种关于海水淡化产水率和成本的两目
标支持向量机回归分析与区间多目标进化优化的内容,可用于解决具有区间不确
定性的数据回归于区间多目标优化问题。
背景技术
随着人口的增长和经济发展,淡水和常规能源出现短缺,对于提高太阳能海
水淡化率、降低淡水成本的研究,越来越引起国内外学者的关注。对于太阳能海
水淡化问题的优化,首先要建立淡水产水率、产水成本与热空气温度等输入变量
的回归模型。目前,已有的回归方式有多项式回归、径向基函数、神经网络,以
及支持向量机等。在论文“中空纤维空气隙式膜蒸馏海水淡化过程的性能模拟与
优化”中,利用响应曲面法,模拟标准海水对中空纤维空气隙式膜蒸馏海水淡化
过程的影响因子,并对膜通量指标进行了优化,通过面向中心复合设计法实现了
基于热料液进水温度、冷凝液进水温度和料液流量的实验优化设计,并建立了响
应值与影响因子之间的二次多项式回归模型;在论文“Modelingandgenetic
algorithm-basedmulti-objectiveoptimizationoftheMED-TVCdesalinationsystem”
中,针对多效蒸馏热压缩海水淡化系统,采用响应面和最小二乘法,构建全年总
费用、增益输入比,以及淡水流量的代理模型,并应用遗传算法,优化上述三个
目标。在论文“Variousapproachesinoptimizationofmultieffectsdistillation
desalinationsystemsusingahybridmeta-heuristicoptimizationtool”中,针对基于
热蒸汽压缩机的多级蒸馏海水淡化系统,分别采用能量、火用分析和总收入,建
立该系统的热力学和经济学模型,并利用由遗传算法和模拟退火形成的混合算法,
优化上述模型。
优化海水淡化系统的有效途径是提高能源的利用效率、降低淡化成本,针对
海水淡化中不同的目标,也会有不同的优化模型。在论文“反渗透海水淡化系统
的优化设计”中,对反渗透海水淡化过程的设计进行了研究。首先针对过程的每
个单元,给出了单元操作模型和相关的经济模型;然后,通过一定的变量将这些
模型相互关联,并组成系统模型;最后,以年费用最小为目标函数、过程热力学、
设备选型、设计要求等为约束,优化反渗透海水淡化系统;在论文“新型太阳能
海水淡化装置工作原理及性能优化”中,为了提高装置的性能,以单位淡水产量
所消耗的功耗最小为目标函数,建立了装置性能参数优化的数学模型,得到了最
优的蒸发温度装置功耗随蒸发温度的变化规律。在论文“Multi-objective
optimizationofamembranedistillationsystemfordesalinationofseawater”中,
Sharma和Rangaiah通过最大化产水率和最小化能源消耗,优化膜蒸馏海水淡化
系统。在论文“Multi-objectivedesignofreverseosmosisplantsintergratedwith
solarrankinecyclesandthermalenergystorage”中,通过考虑给定供水需求条件下
的成本和环境影响,建立集成系统的多目标混合整数非线性规划模型,并采用ε
约束法,求解上述模型。
同时,在专利CN102163249A中,提出了利用交互式进化优化方法用于解
决窗帘设计的GUI平台设计,在人机交互过程中,为用户提供多种个体评价、
精确值评价和自动评价,在进化过程中,支持在不同进化代之间使用不同的编码
方式和相应的进化算法,方便用户在不同的区域内搜索窗帘方案。
上述技术成果为海水淡化问题模型的建立、运行工况的优化提供了切实可行
的方法,但是应当指出的是,现有的方法仍然存在如下的不足:(1)目前,海水
淡化实验主要测量的变量有,热空气的温度,环境温度,干空气的流量,蒸发器
出口温度与含湿量,冷凝器出口温度与含湿量,由于内部数学关系复杂,且输出
的淡水产等具有一定的不确定性,针对这种多输入变量与不确定输出变量之间的
关系,至今很少有建立海水淡化问题的不确定回归模型;(2)已有的方法都是建
立海水淡化问题的确定单(多)目标优化模型,并采用确定优化方法进行求解,
鉴于该问题具有一定的不确定性,且具有相互冲突的输出目标,有必要构建其不
确定多目标优化模型,并采用不确定进化优化方法求解;(3)在海水淡化不确定
回归和优化过程中,存在着一些参数的设置和结果的输出,对于不熟悉程序代码
的人员,很难对其进行修改。因此,建立可视化的GUI平台,是必不可少的。
发明内容
本发明的目的是针对上述问题,设计一个有关太阳能海水淡化的不确定回归
和优化的GUI平台,来建立热空气温度等输入变量与海水淡化率和成本两个目
标之间的区间回归模型,并且对热空气温度等输入变量进行优化。
本发明所要解决的技术问题包括:(1)如何将原始输出数据进行区间化,建
立区间回归模型;(2)如何同时优化相互冲突的两个不确定目标,以得到最优运
行工况集;(3)如何方便的设置参数与显示输出结果。
本发明技术的解决方案是:首先,充分利用原始数据信息,将具有相同输入
数据的最大输出值作为输出上界,将最小输出值作为下界,从而实现数据的区间
化;其次,在LibSVM工具箱内置n-fold交叉检验模型,通过设置交叉检验步长
-v等参数,可以通过寻优的方式得到最优参数;然后,建立基于产水率和成本的
区间两目标优化模型,以随机产生热空气温度等输入数据为初始种群,利用构建
的区间回归模型,得到具有区间性的两目标输出,并采用基于区间占优的
IP-MOEA算法,寻找输入变量的最优解集;最后,搭建海水淡化实验的GUI平
台,将设置参数做成输入对话框,结果显示为输出图形界面。其特征在于:
(1)建立基于LibSVM工具箱的太阳能海水淡化区间回归模型
太阳能海水淡化实验主要涉及以下参数:热空气的温度、冷却水的温度、热
空气流速、干空气的、蒸发器出口温度、蒸发器出口含湿量、冷凝器出口温度、
冷凝器出口含湿量。由于内部关系复杂,不容易利用已有的数学模型去构建其映
射关系,利用LibSVM工具箱可以方便、快捷的建立淡化率与其他变量的区间回
归模型。
构建太阳能海水淡化区间回归模型有以下几个步骤:
Step1:通过海水淡化实验,获得原始数据,构成训练集数据与测试集数据;
Step2:将训练集输出数据区间化,分别获得区间上界和下界;
Step3:将训练集数据进行归一化处理;
Step4:设置LibSVM工具箱中的惩罚函数-c、gamma函数-g、核函数类型-t、
n-fold交互检验模型-v和SVR模型类型-s五项的循环步长;
Step5:通过svmtrain计算交叉检验的误差,将最小误差情况下的-c、-g、-t、
-s参数分别存储到best_c、best_g、best_t、best_s中;
Step6:将best_c、best_g、best_t、best_s,具有区间性的训练集数据设置到
svmtrain中,训练得到最优上界模型model_up、最优下界模型model_down;
Step7:将训练集数据分别与最优上界模型model_up,最优下界模型
model_down设置到svmpredict中,分别输出回归预测的上界与下界;
Step8:同理,将测试集数据分别与最优上界模型model_up,最优下界模型
model_down设置到svmpredict中,分别输出回归预测的上界与下界。
(2)基于IP-MOEA的海水淡化优化设计
对于太阳能海水淡化问题,维持干空气流量、热空气流速,以及环境热空气
温度不变的情况下,装置的淡水产率主要取决于湿空气通过冷凝器前后的含湿量
差值;产水成本主要由冷凝器的功率产生,因此,采用蒸汽通过冷凝器前后的温
度表示成本,更为直观、且易于测量。在太阳能海水淡化问题中,由于环境等不
确定性因素的影响,使得淡水产率和产水成本具有一定的不确定性,由此,建立
太阳能海水淡化问题的区间两目标优化模型,并采用一种有效解决区间多目标优
化问题的进化优化方法IP-MOEA算法进行求解。
优化问题如式(1)所示:
minf(x)=(1/f1(x),f2(x)),(1)
其中x=(x1,x2,x3,x4)∈X,x1为冷凝器前后的含湿量差值,x2为干空气的流量,
x3为热空气的流速,x4为热空气的温度,f1(x)为海水淡化产率,f2(x)为海水
淡化成本,如式(2)所示:
1/f1(x)=[1/svmpredict(model1_up),1/svmpredict(model1_down)],
f2(x)=[svmpredict(model2_down),svmpredict(model2_up)],
(2)
其中,svmpredict()为支持向量机回归函数,modeli_down和modeli_up分别为
训练得到的第i个目标的下界和上界最优回归模型。
(3)构建基于MatlabGUI的海水淡化区间回归和优化设计平台
基于GUI界面的海水淡化区间回归和优化平台的主要功能是,实现人机交
互,可以在平台上设置优化过程参数,触发实验进程,显示区间回归中的寻优参
数,输出训练集、测试集的淡水产率、产水成本的回归曲线与原始数据对比图、
优化后的产率-成本前沿图,输出最优解集与其目标值的EXCEL表格。
上述技术方案具有如下创新点:
(1)区间输出的设计。由于海水淡化过程中,输出结果存在不确定性,故
将输出表示为区间值更为客观、可靠。在设置区间输出时,考虑原始数据的信息,
将大量相同输入数据的最大输出值作为区间输出的上界,最小输出值作为区间输
出的下界。对于不存在相同输入数据的情况,将原始输出数据加上高斯扰动作为
输出上界,减去高斯扰动作为输出下界。通过上述方法,可以得到更为客观的区
间数输出。
(2)区间回归模型的建立。通过海水淡化实验可以得到输入输出数据,但
是没有确切的数学模型去描述输入与输出的关系。本发明基于LibSVM工具箱,
通过建立了一种多分类的网络,将输出数据作为分类标签,输入数据分类属性,
从而建立区间支持向量机模型,建立了输入与输出数据之间的联系。
(3)区间多目标优化模型的构建。在海水淡化过程中,除了考虑海水的淡
化率,还要考虑到海水淡化的成本问题。因为,当海水淡化率增加时,海水淡化
成本也随之增加,所以在考虑产率的同时,也必须考虑到成本的限制。因此,海
水淡化过程中存在着关于产率和成本的两目标优化问题。本发明利用基于区间占
优的IP-MOEA算法求解上述两目标优化问题,寻找运行工况的最优解集。
(4)可视化人机交互界面的设计。本发明在不确定数据回归和区间多目标
优化过程中,涉及大量的参数设置与输出结果,通过设计交互界面,可以方便直
观的设置参数,显示内部寻优结果,并且输出回归和优化结果。
附图说明
图1为太阳能海水淡化问题的区间支持向量机模型及优化设计的流程图;
图2为IP-MOEA算法流程图
图3为基于MatlabGUI的太阳能海水淡化区间回归和优化平台;
图4为GUI平台的区间回归图像显示模块;
图5为GUI平台的区间多目标优化图像显示模块;
图6为最优解集与目标值的EXCEL表格;
图7为GUI平台的寻参显示模块;
图8为GUI平台的优化参数设置模块;
图9为GUI平台的控制按钮模块。
具体实施措施
下面结合具体附图和实例对本发明所提方法的实施方式进行详细说明。
1.建立基于LibSVM的太阳能海水淡化区间回归模型
(1)训练集与测试集的选取
在海水淡化实验中,可以得到实验数据,为了在回归过程中训练模型,取三
分之二的实验数据作为训练集样本,将剩下的数据作为测试集样本检测回归模型。
(2)输出数据的区间化
为了真实反映工程实际中的不确定性,本发明采用区间表示输出,这就需要
将实验得到的确定输出区间化。具体来讲,针对大量的具有相同输入的数据时,
将输出最大值作为输出区间上界、最小值作为输出区间下界,对于不具有相同输
入的数据时,将原始输出加上平均区间半径与高斯扰动的乘积作为输出区间上界、
原始输出减去平均区间半径与高斯扰动的乘积作为区间下界。具体方式如式(3)
所示。
具有相同输入的数据:
上界=原始输出最大值,(3)
下课=原始输出最小值.
不具有相同输入的数据:
上界=原始输出+|平均区间半径*高斯扰动|,(4)
下界=原始输出-|平均区间半径*高斯扰动|.
(3)支持向量机种类的选取
LibSVM工具箱提供五种支持向量机模型,分别是c-SVC、v-SVC、one-class
SVM、ε-SVR、v-SVR,由-s参数进行设置。其中前三种模型用于分类问题,后
两种模型用于回归问题。本发明采用了后两种模型即ε-SVR,v-SVR进行海水淡
化的区间回归模型的建立。
其中,ε-SVR(ε-SupportVectorRegression)的模型为:
min w , b , ξ , ξ * 1 2 w T w + C Σ i = 1 l ξ i + C Σ i = 1 l ξ i * ]]>
subjecttowTφ(xi)+b-zi≤ε+ξi,(5)
z i - w T φ ( x i ) - b ≤ ϵ + ξ i * , ]]>
ξ i , ξ i * ≥ o , i = 1 , 2 , ... , l , ]]>
其中,ξi和是松弛变量,C是罚函数系数,w是分类超平面法向量,b是分类
超平面的常数项,φ(xi)是xi经过变换到高维空间的映射,ε是不敏感函数,zi是
输出变量。
ν-SVR(ν-SupportVectorRegression)的模型为
min w , b , ξ , ξ * , ϵ 1 2 w T w + C ( υ ϵ + 1 l Σ i = 1 l ( ξ i + ξ i * ) ) ]]>
subjecttowTφ(xi)+b-zi≤ε+ξi,(6)
z i - w T φ ( x i ) - b ≤ ϵ + ξ i * , ]]>
ξ i , ξ i * ≥ o , i = 1 , 2 , ... , l , ϵ ≥ 0 , ]]>
其中,ξi和是松弛变量,C是罚函数系数,w是分类超平面法向量,b是分类
超平面的常数项,φ(xi)是xi经过变换到高维空间的映射,ε是不敏感函数,zi是
输出变量。υ可以控制支持向量的个数。
在选择SVR类型时,采用寻优的方式进行选择。
(4)支持向量机核函数的选取
选择不同的核函数,可以生成不同的支持向量机,常用的核函数有以下四种:
a.线性核函数K(x,y)=x·y;
b.多项式核函数K(x,y)=[(x·y)+1]d;
c.径向基函数K(x,y)=exp(-|x-y|^2/d^2);
d.二层神经网络核函数K(x,y)=tanh(a(x·y)+b)。
其中,K就是核函数,其作用在于将低维度线性不可分样本向高维线性可分
样本作映射。
本发明专利在设置核函数类型时,同样采用寻优方式,寻找最优核函数类型。
(5)区间回归模型的构建
构建海水淡化区间回归模型有以下几个步骤:
Step1:通过海水淡化实验,获得原始数据,构成训练集数据与测试集数据;
Step2:将训练集输出数据区间化,分别获得区间上界和下界;
Step3:将训练集数据进行归一化处理;
Step4:设置LibSVM工具箱中的惩罚函数-c、gamma函数-g、核函数类型-t、
n-fold交互检验模型-v和SVR模型类型-s五项的循环步长;
Step5:通过svmtrain计算交叉检验的误差,将最小误差情况下的-c、-g、-t、
-s参数分别存储到best_c、best_g、best_t、best_s中;
Step6:将best_c、best_g、best_t、best_s,具有区间性的训练集数据设置到
svmtrain中,训练得到最优上界模型model_up、最优下界模型model_down;
Step7:将训练集数据分别与最优上界模型model_up,最优下界模型
model_down设置到svmpredict中,分别输出回归预测的上界与下界;
Step8:同理,将测试集数据分别与最优上界模型model_up,最优下界模型
model_down设置到svmpredict中,分别输出回归预测的上界与下界。
2.基于IP-MOEA的海水淡化优化模型
(1)太阳能海水淡化的区间多目标优化模型
对于太阳能海水淡化问题,在维持干空气流量、热空气流速,以及环境热空
气温度不变的情况下,装置的淡水产率主要取决于湿空气通过冷凝器前后的含湿
量差值;产水成本主要由冷凝器的功率产生,因此,采用蒸汽通过冷凝器前后的
温度表示成本,更为直观、且易于测量。在太阳能海水淡化问题中,由于环境等
不确定性因素的影响,使得淡水产率和产水成本具有一定的不确定性,由此,建
立太阳能海水淡化问题的区间两目标优化模型,并采用一种有效解决区间多目标
优化问题的进化优化方法IP-MOEA算法进行求解。
优化问题如式(7)所示:
minf(x)=(1/f1(x),f2(x)),(7)
其中x=(x1,x2,x3,x4)∈X,x1为冷凝器前后的含湿量差值,x2为干空气的流量,
x3为热空气的流速,x4为热空气的温度,f1(x)为海水淡化产率,f2(x)为海水
淡化成本,如式(8)所示:
1/f1(x)=[1/svmpredict(model1_up),1/svmpredict(model1_down)],(8)
f2(x)=[svmpredict(model2_down),svmpredict(model2_up)],
其中,svmpredict()为支持向量机回归函数,modeli_down和modeli_up分别为
训练得到的第i个目标的下界和上界最优回归模型。
(2)IP-MOEA算法
考虑如下区间参数多目标最小化问题:
minf(x,c)=(f1(x,c),f2(x,c),…,fm(x,c)),
s . t . x ∈ S ⊆ R n , - - - ( 9 ) ]]>
c = ( c 1 , c 2 , ... , c l ) T , c k = [ c ‾ k , c ‾ k ] , k = 1 , 2 , ... , l , ]]>
其中,x为n维决策变量,S为x的决策空间;fi(x,c),i=1,2,…,m,为第i个含
有区间参数的目标函数,c为区间向量参数,其中,ck为c的第k个分量,ck和
分别为ck的下限和上限。
为了定义基于区间的占优关系,Limbourg和Aponte首先定义2个区间的序
关系。
考虑问题(9)的2个解x1和x2,其对应的第i个目标函数值分别为fi(x1,c)和
fi(x2,c),i=1,2,…,m。给出的区间序关系定义如下:称fi(x1,c)在区间意义下小
于fi(x2,c),记为fi(x1,c)<INfi(x2,c),当且仅当fi(x1,c)的下限和上限均分别不
大于fi(x2,c)的下限和上限,且这2个区间不相等,即:
f i ( x 1 , c ) < I N f i ( x 2 , c ) ⇔ f i ‾ ( x 1 , c ) ≤ f i ‾ ( x 2 , c ) ^ f ‾ i ( x 1 , c ) ≤ f ‾ i ( x 2 , c ) ^ f i ( x 1 , c ) ≠ f i ( x 2 , c ) , - - - ( 10 ) ]]>
当fi(x1,c)<INfi(x2,c)和fi(x2,c)<INfi(x1,c)均不成立时,称fi(x1,c)在区间意义
下与fi(x2,c)不可比,记为fi(x1,c)||fi(x2,c)。
然后,基于上述区间序关系,他们进一步定义解的如下区间占优关系:称x1
区间占优x2,记为x1>IPx2,当且仅当x1的任一目标函数区间,均在区间意义下
小于x2相应的目标函数区间,或者与x2相应的目标函数区间不可比,且至少存
在x1的一个目标函数区间,在区间意义下大于x2相应的目标函数区间,即:
如果x1既不区间占优x2,且x2也不区间占优x1,则称x1和x2是互不区间占
优的,记为x1||IPx2。
IP-MOEA算法的基本思想是:采用NSGA-Ⅱ范式,实现种群的进化,在比
较不同进化个体的占优关系时,利用上述基于区间的占优关系,代替传统的
Pareto占优关系,得到具有不同序值的非被占优个体。具体步骤如下:
Step1:初始化规模为N的种群P(0);取进化代数t=0;
Step2:用规模为2的锦标赛选择、交叉和变异等遗传操作,生成相同规模的子
代种群Q(t);
Step3:合并种群P(t)和Q(t),并记作R(t);
Step4:采用基于区间占优可信度下界的占优关系,求取R(t)中个体的序值;计
算具有相同序值的个体的拥挤度;选取前N个优势个体,构成下一代种群P(t+1);
Step5:判定算法终止条件是否满足,如果是,输出最优解集;否则,令t=t+1,
转步骤2。
IP-MOEA算法的流程图如图2所示。
3.构建基于MatlabGUI的海水淡化区间回归和优化设计平台
为了便于设置参数和显示输出结果,本发明专利最后通过可视化的海水淡化
区间回归和优化设计平台来实现。GUI平台主要包括图像输出显示模块、LibSVM
工具箱参数寻优显示模块、优化参数设置模块和控制按钮模块,如图3所示。
图像输出显示模块的功能是输出回归与优化后的图像,分为回归图像显示模
块和优化图像显示模块。回归图像显示模块包括训练集中产率变化曲线图,训练
集中成本变化曲线图,测试集中产率变化曲线图,测试集中成本变化曲线。如图
4所示。优化图像显示模块为最优解集的产率-成本前沿面图,如图5所示。输出
最优解集与目标值的Excel表格,如图6所示。
寻优参数显示模块的功能是显示LibSVM工具箱的寻优参数,分为产率与成
本两个方面的参数显示。其中,产率方面包括最优上下界惩罚参数-c参数的显示、
最优上下界gamma函数-g参数的显示、最优上下界核函数-t参数的显示和最优
上下界SVR类型-s参数的显示。同样,成本方面包括最优上下界惩罚参数-c参
数的显示、最优上下界gamma函数-g参数的显示、最优上下界核函数-t参数的
显示和最优上下界SVR类型-s参数的显示。如图7所示。
优化参数设置模块的功能是设置优化过程必要的参数,包括进化代数、实验
次数、种群数量、锦标赛选择规模、交叉概率、变异概率,以及交叉和变异分布
指数等。如图8所示。
控制按钮模块的功能是触发实验进程。其中,打开文件按钮的功能是打开实
验数据,并且加载数据;回归按钮的功能是触发回归程序;优化按钮的功能是触
发回归程序,前提是在优化参数设置模块中设置所有参数;**按钮的功能是为新
程序提供触发按钮;清空按钮的功能是重置所有优化参数设置、重置寻优参数显
示;退出按钮的功能是退出海水淡化GUI平台。如图9所示。