说明书一种汽轮机组稳态运行数据筛选方法
技术领域
本发明涉及汽轮机组运行数据分析技术领域,具体涉及一种汽轮机组稳态运 行数据筛选方法,适用于分析和计算机组的性能指标时原始数据的筛选。
背景技术
随着现代信息技术,特别是计算机网络技术的快速发展,大型火力发电厂普 遍建成了以DCS(Distributed Control System分布式控制系统,简称DCS)、 SIS(Supervisory Information System in plant level厂级监控信息系统, 简称SIS)和MIS(Management Information System管理信息系统,简称MIS) 等为核心的信息化平台,所获取的海量数据信息对于汽轮机组性能评价、能耗跟 踪监测等具有重要的价值。但受电网调度、机组自身扰动等因素影响,数据库中 不可避免的混杂着大量的非稳态运行数据,并且规律性不强。而汽轮机组相关性 能指标计算方法,一般均是针对设备在一个稳定的连续运行时间区间而言的,对 主要运行参数的波动及持续时间都有较为严格的要求。
数据库中运行数据是一种典型的按时间排列的有序样本,在提取稳态运行数 据时,其顺序不能被打乱。这一问题传统上通常采用的算法是Fisher聚类等算 法,但该算法本身涉及递推,使得当分段数较多的情况下计算量迅速增大,计算 时间较长,因此一般更适用于小样本、分段数较少的场合。而汽轮机组运行数据 量较大,即便按照1分钟存储间隔推算,每天的存储的样本数据量也多达上千条, 特别是当有序样本(如某一天运行数据)中无法提取出满足一定时长要求的稳态 运行数据时,理论上需要的最优分段数可能会极大,这时直接应用Fisher聚类 算法对汽轮机组运行数据进行分段,所消耗的计算资源是巨大的,很难满足汽轮 机组性能指标在线分析计算的需求。
如何客观、快速准确的从海量的机组运行数据中提取机组稳态运行数据,是 下一步对设备性能指标进行计算分析所需要解决的一个关键问题。
发明内容
针对现有技术在提取机组稳态运行数据时存在的计算量大和计算时间长等 不足,本发明提供了一种汽轮机组稳态运行数据筛选方法。
为解决以上技术问题,本发明的技术方案为:
一种汽轮机组单参数稳态运行数据筛选方法,其包括以下步骤:
(a)获取数据样本S={s1,s2,…,sn},确定数据样本S的稳态运行最短持续 时长tp和汽轮机组任一运行参数P1的最大允许偏差值σ1;计算稳态运行最短持 续时长tp内包含的采样数据个数dn。
(b)设定检索参数初值,令m=1,k=dn,t=0,其中m、k和t均为检索参 数。
(c)若m+k-1≤n成立,则执行步骤(d);若m+k-1≤n不成立,则判定 数据样本S中数据个数不足,检索结束。
(d)选定数据子样本Sm,m+k-1={sm,sm+1,sm+2,…,sm+k-1},计算数据子样本均值 计算数据子样本Sm,m+k-1内各数据si与均值间的欧氏距离δi,其中 i=m,m+1,…,m+k-1。
(e)若δi≤σ1成立,则执行步骤(f);
若δi≤σ1不成立,则判断检索参数t=1是否成立;若t=1成立,则执行步骤 (g);若t=1不成立,则判断m+k≤n是否成立;若m+k≤n成立,则令检索 参数m自加一,t=0,返回步骤(d);若m+k≤n不成立,则检索结束。
(f)令检索参数k自加一,t=1;判断m+k-1≤n是否成立,若m+k-1≤n 成立则返回步骤(d);若m+k-1≤n不成立则执行步骤(g)。
(g)提取稳态运行数据疑似样本Sm,m+k-2={sm,sm+1,sm+2,…,sm+k-2},对所述 稳态运行数据疑似样本Sm,m+k-2进行曲线拟合并计算曲线的斜率a;若|a|≤ε成 立,则判定所述稳态运行数据疑似样本Sm,m+k-2为稳态运行数据样本,提取稳态 运行数据样本Sm,m+k-2,执行步骤(h);若|a|≤ε不成立,则判定所述稳态运行 数据疑似样本Sm,m+k-2为非稳态运行数据样本,执行步骤(h);其中,ε为稳定 度参量。
(h)令检索参数m=m+k-1,t=0,k=dn;返回步骤(c)。
具体的,步骤(a)中稳态运行最短持续时长tp内包含的采样数据个数dn的 计算方法为:若tp/ti为整数,则采样数据个数dn的计算见公式1;若tp/ti不是 整数,则采样数据个数dn的计算见公式2。
dn=1+tp/ti (1)
其中,tp为数据样本S={s1,s2,…,sn}的稳态运行最短持续时长,ti为数据采 样间隔时间。
一种汽轮机组多参数稳态运行数据筛选方法,包括以下步骤:
(I)除汽轮机组第一运行参数P1外,再选取一个以上汽轮机组运行参数Pj并 确定各个所述汽轮机组运行参数Pj的最大允许偏差值σj,其中,j=2,3,…,m, m为待稳定的汽轮机组运行参数的数量。
(II)执行步骤(a)~(h)以提取汽轮机组第一运行参数P1的稳态运行数据 样本SP1;令j=2。
(III)令汽轮机组第一运行参数P1的稳态运行数据样本SP1为数据样本S,执 行步骤(a)~(h)以提取汽轮机组第j运行参数Pj的稳态运行数据样本SPj;令 j自加一。
(IV)若j≤m成立,则令汽轮机组第j运行参数Pj的稳态运行数据样本SPj为数据样本S,返回步骤(III);若j≤m不成立,则检索结束。
本发明的有益效果:执行本发明技术方案步骤(a)~(h)能够从海量运行 数据中提取出汽轮机组单参数稳态运行数据,执行本发明技术方案步骤(I)~(IV) 能够从海量运行数据中提取出汽轮机组多参数稳态运行数据。本发明技术方案简 洁,计算和提取汽轮机组稳态运行数据的误差较小,能够对汽轮机组的单稳态运 行参数或多稳态运行参数进行有效的数据提取,适用于各类汽轮机组的运行状态 分析,具有较大的推广和利用价值。
附图说明
图1为本发明中汽轮机组单参数稳态运行数据筛选方法的流程图。
图2为实施例某电厂600MW机组某日的运行数据图。
具体实施方式
下面结合附图对本发明作进一步说明。
提取图2所示某电厂600MW汽轮机组某日运行数据中的电负荷参数的稳定运 行数据。其中,数据样本S即图2所示某电厂600MW机组某日运行数据中的电负 荷参数的稳定运行数据,数据样本S的稳态运行最短持续时长tp=60min,电负 荷的最大允许偏差值σ1=10MW,数据采样间隔时间ti=1min,稳态运行最短持 续时长tp内包含的采样数据个数dn=61。根据图1,实施例的汽轮机组的电负荷 稳态运行数据筛选方法为:
(a)获取数据样本S={s1,s2,…,sn},确定数据样本S的稳态运行最短持续 时长tp=60min和汽轮机组电负荷参数P1的最大允许偏差值σ1=10MW;计算稳 态运行最短持续时长tp内包含的采样数据个数dn=61。
步骤(a)中稳态运行最短持续时长tp内包含的采样数据个数dn的计算方法 为:若tp/ti为整数,则采样数据个数dn的计算见公式1;若tp/ti不是整数,则 采样数据个数dn的计算见公式2。
dn=1+tp/ti (1)
其中,tp为数据样本S={s1,s2,…,sn}的稳态运行最短持续时长,ti为数据采 样间隔时间。
(b)设定检索参数初值,令m=1,k=dn,t=0,其中m、k和t均为检索参 数。
(c)若m+k-1≤n成立,则执行步骤(d);若m+k-1≤n不成立,则判定 数据样本S中数据个数不足,检索结束。
(d)选定数据子样本Sm,m+k-1={sm,sm+1,sm+2,…,sm+k-1},计算数据子样本均值 (计算方法见公式3),计算数据子样本Sm,m+k-1内各数据si与均值间的欧氏距离δi(计算方法见公式4),其中i=m,m+1,…,m+k-1。
s ‾ m , m + k - 1 = 1 k Σ i = 1 m + k - 1 s i - - - ( 3 ) ]]>
δ i = | s i - s ‾ m , m + k - 1 | - - - ( 4 ) ]]>
(e)若δi≤σ1成立,则执行步骤(f)。
若δi≤σ1不成立,则判断检索参数t=1是否成立;若t=1成立,则执行步骤 (g);若t=1不成立,则判断m+k≤n是否成立;若m+k≤n成立,则令检索 参数m=m+1,t=0,返回步骤(d);若m+k≤n不成立,则检索结束。
(f)令检索参数k=k+1,t=1;判断m+k-1≤n是否成立,若m+k-1≤n成立 则返回步骤(d);若m+k-1≤n不成立则执行步骤(g)。
(g)提取稳态运行数据疑似样本Sm,m+k-2={sm,sm+1,sm+2,…,sm+k-2},对所述 稳态运行数据疑似样本Sm,m+k-2进行一次曲线拟合并计算曲线的斜率a;若|a|≤ε 成立,则判定所述稳态运行数据疑似样本Sm,m+k-2为稳态运行数据样本,提取稳 态运行数据样本Sm,m+k-2,执行步骤(h);若|a|≤ε不成立,则判定所述稳态运 行数据疑似样本Sm,m+k-2为非稳态运行数据样本,执行步骤(h)。其中,ε为稳 定度参量,本实施例中ε=0.2。
(h)令检索参数m=m+k-1,t=0,k=dn;返回步骤(c)。
经计算,得到实施例的汽轮机组数据样本S(如图2所示)中符合电负荷参 数稳定要求的时间段有2段,分别是:
4:38~5:46,平均电负荷362.76MW,最大偏差σ1=2.70MW,实际的稳定度 参量ε=0.1435;
14:46~15:52,平均电负荷537.82MW,最大偏差σ1=4.04MW,实际的稳定 度参量ε=0.0649。
以上所述实施方式仅为本发明的优选实施例,而并非本发明可行实施的穷 举。对于本领域一般技术人员而言,在不背离本发明原理和精神的前提下对其所 作出的任何显而易见的改动,都应当被认为包含在本发明的权利要求保护范围之 内。