一种基于样本相似度加权的电站设备自适应建模方法技术领域
本发明属于数据驱动建模技术领域,具体是涉及一种基于样本相似度加权的电站
设备自适应建模方法。
背景技术
近年来,国家对火电机组推行“上大压小”政策,据中电联初步统计,截止2014年
底,全国30万千瓦及以上火电机组比例达到77.7%,比2013年提高近1.4%。随着现代火电
机组单机容量和参数的不断提高,火电系统本体和热工过程也变得越来越复杂,对热工过
程建立精确的全局模型是优化控制系统的基础,对热工过程建模提出了更高的要求。
在电站实际运行过程中,设备存在积灰磨损腐蚀等情况,其性能会随时间发生变
化,设备性能的变化使得利用有限数据集所建立的静态模型与实际过程特性之间产生偏
差,而且这些偏差会随着时间的变化不断放大,最终使得模型无法反映过程对象的当前特
性。因此需要考虑模型的自适应机制。
针对热工对象的自适应机制往往考虑到样本的时效性,即以时间作为加权因子,
离当前时间最近的样本权重最高,距离当前时间越久远样本权重越低。但是考虑到热工对
象工况变化范围较大,单纯以时间作为加权因子无法保证样本的多样性,导致模型的适用
范围无法保证。
发明内容
发明目的:为了克服现有技术中存在的不足,本发明提供一种基于样本相似度加
权的电站设备自适应建模方法,以电站历史数据库中对象过程数据为主,结合对象现场试
验数据,建立设备模型;根据建模样本的相似度将样本划分为不同的工况,根据时间为各工
况内样本分配权重,剔除样本,兼顾建模样本的时效性和多样性,使得模型具有自学习能
力,同时保证模型的适用范围广。
技术方案:为实现上述目的,本发明提供一种基于样本相似度加权的电站设备自
适应建模方法,包括以下步骤:
1)建模变量选择
设备输出量的变化是由于输入条件发生变化或设备本身性能导致的,建立设备模
型需要根据设备机理分析结果,同时结合现场测点条件,以能够反映设备性能的变量作为
模型的输出变量,选择影响该输出变量的其他外部变量作为模型输入变量,以保证模型的
完善性;
2)建模样本获取
建模样本的获取有两个来源,一是通过现场试验获取试验数据,二是从对象历史
数据库中获取过程数据;从对象设备历史数据库中导出步骤1)中选出的变量数据作为建模
样本,将试验数据也加入建模样本中,组成建模样本库D;
![]()
式(I)中:i=1…N,j=1…K,xi代表步骤1)中选出的建模输入变量,yj代表步骤1)
中选出的建模输出变量;
3)建模样本权重分配
根据步骤2)得到建模样本后,综合考虑到样本的时效性和多样性,给样本划分工
况和分配权重,作为后续样本更新的依据;
4)建模样本更新
当新样本到来时,计算该样本与各工况中心的欧氏距离,若对于所有工况中心,新
样本距离都大于阈值D,则认为新样本为全新的工况,该工况的工况中心为该新样本;否则,
将新样本加入与其距离最近的工况中,为其分配权重,同时剔除掉该工况中权重最低的样
本;
5)设备自适应模型建立
根据前面的步骤得到建模样本及其权重后,利用机器学习算法建立设备特性模
型。
所述的步骤3)包括以下步骤:
3a)分配初始权重
考虑到试验数据准确性和可信度高,在这里给建模样本中的试验数据分配较高的
初始权重α,给建模样本中的过程数据分配相对较低的初始权重β;这里α,β∈[1,2]且α>β;
3b)计算样本相似度
根据建模样本的输入变量计算各样本之间的欧氏距离dij;
![]()
式(II)中:xi,xj分别为第i和第j条建模样本的输入变量;
当两样本欧氏距离小于预设的距离阈值D时,认为样本属于同一工况下样本,这里
D∈[5,20];在这一步骤中将样本分为许多不同的工况;计算每一工况中样本输入变量均
值,构成工况中心
其中,i=1…N,
代表第k个工况输入变量的算术
平均值;
3c)加入遗忘因子
设备性能随时间逐渐下降,以往数据反映出的设备特性与当前设备实际特性存在
差异,因此需要在样本初始权重的基础上加入遗忘因子δ,δ∈(0.01,1),使得样本权重随时
间逐渐降低;令加入遗忘因子后的样本权重为κ,对于试验数据,其权重κ=α·δt,对于过程
数据,其权重κ=β·δt;其中t代表建模样本出现时刻据当前时刻的天数,建模样本距当前
时间越久远,其权重越低。
所述的步骤5)包括以下步骤:
5a)建立模型并验证模型准确性
利用已有的建模样本和选定的机器学习算法建立设备特性模型,计算模型对样本
的均方误差,若均方误差大于预设的误差上限θ或者模型输入输出的关系性与机理分析结
果不符,则需要更换机器学习算法重新建模;
5b)判断是否重构模型
计算模型对新样本的相对误差ε,若误差大于预设的相对误差上限σ则利用新的建
模样本库重新训练模型,否则无需重新训练模型;
其中,ε=(y-Y)/y,式中:Y为模型输出值,y为实际值。
有益效果:与现有技术相比,本发明的一种基于样本相似度加权的电站设备自适
应建模方法,能够有效克服由于电站设备自身性能下降导致的模型失效现象,在考虑样本
相似性的基础上根据遗忘因子剔除样本,保证了样本的多样性和时效性,使得模型具有自
学习能力,能够始终维持较高的预测精度,并且保证了模型具有较大的适用范围。
附图说明
图1是自适应建模方法流程图;
图2是模型相对误差图;
图3是模型得到的进口SO2浓度与效率变化量关系图;
图4是模型得到的浆液pH与效率变化量关系图;
图5是模型得到的初始脱硫率与效率变化量关系图;
图6是模型得到的进口烟气流量与效率变化量关系图。
具体实施方式
下面结合附图和具体实施例对本发明作更进一步的说明。
本发明为解决电站设备建模问题,提出一种基于数据驱动的自适应建模方法,如
图1所示,该方法包括以下步骤:结合机理分析与现场实际测点情况选取建模输入输出变
量;收集现场试验数据,扫描对象过程数据,加入建模样本库中,并为其分配权重;利用机器
学习算法建立模型,当新样本到来时,将新样本加入建模样本库中,并更新样本权重;监测
模型对新样本的预测精度,当预测精度低于设定的精度时,利用更新后的样本库重构模型。
下面以某火电机组脱硫系统浆液循环泵为例来介绍一种基于数据驱动的电站设
备自适应建模方法的具体实施步骤。考虑到浆液循环泵本身存在磨损和腐蚀,其性能会随
时间逐渐下降,导致其输送浆液能力下降,影响系统的脱硫率。
整个自适应建模过程主要有建模变量选择,建模样本获取,建模样本权重分配,建
模样本更新,自适应模型建立5个核心部分。结合图1所示流程,步骤如下:
(1)建模变量选择
脱硫系统浆液循环泵的主要作用是将石灰石浆液输送到吸收塔喷淋层,吸收烟气
中的SO2,因此对于浆液循环泵性能的考察主要是其输送浆液的能力,由于现场没有直接的
浆液测点,在这里以浆液循环泵组合变化后系统脱硫率的变化来反应其输送浆液的能力。
以泵组合变化前后脱硫率的变化量为输出变量,影响脱硫率变化的其他因素作为输出变
量,这里选择吸收塔进口烟气量,吸收塔进口SO2浓度,浆液pH,泵组合变化前的脱硫率作为
输入变量。
(2)建模样本获取
由于对象机组脱硫系统没有现场试验记录,因此在这里导出对象机组近两年的过
程数据,从中选取泵组合变化前的模型输入变量数据及泵组合变化后建模输出变量数据,
加入建模样本库中。
(3)建模样本权重分配;
设置从过程数据中得到的建模样本初始权重为β=1,距离阈值D=10,遗忘因子δ
=0.9,则建模样本权重κ=0.9t,其中t代表建模样本出现时刻据当前时刻的天数。
(4)建模样本更新;
当新样本到来时,计算该样本与各工况中心的欧氏距离,将其分配到相应的工况
中,并按照步骤(3)为其分配权重,剔除该工况中权重最低的样本。
(5)设备自适应模型建立;
对象机组脱硫系统配备A,B,C三台浆液循环泵,由于现场线路安全性和环保要求
的限制,现场浆液循环泵组合有ABC,AB,BC三种,即模型工况可分为ABC泵到AB泵,ABC泵到
BC泵,AB泵到ABC泵,BC泵到ABC泵四种工况。
针对上面提到的四种工况,利用机器学习算法分别建立其模型。考虑到建模样本
数量较少,同时我们希望模型适用范围大,在这里我们选择适合小样本建模,同时具有良好
泛化能力的LSSVM算法建立各工况模型。以AB至ABC泵工况为例,模型预测值与实际值相对
误差如图2所示,模型得到的输入输出关系如图3-6所示。图3是模型得到的进口SO2浓度与
效率变化量关系图;图4是模型得到的浆液pH与效率变化量关系图;图5是模型得到的初始
脱硫率与效率变化量关系图;图6是模型得到的进口烟气流量与效率变化量关系图。设定模
型相对误差限σ=±2%,当模型得到的泵组合变化前后脱硫率变量与现场实际脱硫率变化
相对误差超过±2%时,使用更新后的样本库重构模型。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的技术人员来
说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为
本发明的保护范围。