一种流程工业过程工艺参数的确定方法
技术领域
本发明涉及一种基于数据驱动的流程工业过程工艺参数的确定方法。
背景技术
流程工业生产过程普遍具有多变量、非线性、强耦合等特点,产品质量随生产条件变化而变化,如受到原料成分、运行工况、设备状态等多种不确定因素的干扰,且运行过程往往具有动态特性,难以用机理模型来准确描述。同时,由于其生产工艺过程非常复杂,国内流程工业生产的产品质量与国外同类产品相比存在较大差距,主要表现为产品质量不稳定、寿命低、废品率高等。
产品质量的控制归根结底还是工艺参数的设定问题,即根据产品的质量指标逆推工艺参数。
当前,国内各大流程工业生产过程中,工艺参数的调整主要靠人工经验,采用穷举试凑的方法进行参数设定,当工况变化频繁时,仅依靠人工经验难于及时准确地调整工艺参数,造成产品质量得不到有效的控制,浪费严重,且易出现废品。
采用一种合理的方法来优化过程工艺参数并进行设定,是解决产品质量合理控制的关键问题所在。
流程工业在长期的生产过程中会积累了大量的生产数据,目前,大量的新型仪表、网络化仪表和传感技术在工业生产中的广泛应用,获取了大量实际生产过程中的实时数据,这些数据蕴含了生产过程中的各种规律,可以利用数据驱动技术,从大量的数据中获取工艺参数与产品质量之间的定量关系,进而实现系统的预报、监控、诊断和优化等各种期望功能。
发明内容
本发明需要解决的技术问题就在于克服现有技术的缺陷,提供一种基于数据驱动的流程工业过程工艺参数的确定方法,它能够有效地提高生产产品合格率,降低生产成本。
为解决上述问题,本发明采用如下技术方案:
本发明提供了一种基于数据驱动的流程工业过程工艺参数的确定方法,所述方法包括下列步骤:
1)质量建模:根据实际生产过程中采集的生产数据,以过程工艺参数为输入、产品质量为输出建立质量模型;
2)规则抽取:根据实际生产过程中采集的生产数据,利用规则抽取的方法从数据中提取输入与输出之间的对应规则,形成规则库;
3)工艺参数优化:利用优化方法根据给定的质量指标,找到给定质量指标对应的规则,并在规则范围内初始化过程工艺参数,将初始化的参数作为质量模型的输入,预测产品质量,计算与质量指标的误差,根据误差,利用优化方法对工艺参数进行修正,在修正过程中以规则作为约束条件,保证修正后的参数仍然在规则范围内,通过优化修正,找到一组最优的参数,使模型的预测值和质量指标的误差最小。
所述质量建模采用神经网络、支持向量机、最小二乘、片最小二乘、核偏最小二乘、或核岭回归方法。
所述规则抽取采用决策树、神经网络规则抽取、或支持向量机规则抽取方法。
工艺参数优化采用粒子群优化、蚁群优化、鱼群优化、遗传算法、或免疫算法。
本发明的优点在于: 本发明采用数据驱动技术,采用优化方法,寻优速度快,操作简单;使产品的质量指标快速处于目标值范围内的最佳位置。
每次寻优得到的结果可以利用质量模型对产品质量进行离线预测,避免了人工每调整一次参数都需在线验证,以致造成大量的废品;而且,在优化过程中,利用规则对参数进行了约束,确保了寻优得到的参数符合生产实际。本发明可以用计算机语言编成可视化软件,只需在软件界面上给定质量指标,便很快可以得到所需要的过程工艺参数值,使得过程工艺参数的优化确定更加方便和快捷。
本发明适用范围广,可推广到煤化工、石化、冶金等流程工业中,解决了生产过程中工艺参数设定的经验性和尝试性问题,不仅节能降耗,且对稳定产品质量,提高生产效率具有重要意义。
附图说明
图1为本发明技术路线图。
图2为神经网络质量模型预测仿真结果图。
图3 为决策树图。
图4为BP神经网络结构图。
图5为决策树结构图。
图6为粒子移动原理图。
具体实施方式
实施例1 基于数据驱动的流程工业过程工艺参数的确定方法
技术路线图如图1所示,具体步骤为:
第 1 步,建立质量模型提取方法:首先对已有的生产数据进行归一化处理,消除不同量纲的影响,利用生产过程中提取的数据建立质量模型,并利用规则抽取的方法提取工艺参数与质量指标之间的规则知识,形成规则库;
第 2 步,设定质量目标值、算法参数的初始值和过程工艺参数的初始值:工艺参数在初始化时,先根据给定的质量目标值找到其对应的规则,然后将工艺参数初始化在规则的范围内,缩减寻优空间,加快寻优速度;
第 3 步,质量模型:利用质量模型,根据优化后的工艺参数预测产品质量;
第 4 步,计算产品质量:根据预测的产品质量,计算与给定的质量目标值的误差,并以此作为优化的评价指标,误差越小,证明与目标值越接近;
第 5 步,判断产品质量是否满足要求:将误差值与给定的阈值进行对比,若小于阈值,满足要求,则停止优化,其对应的过程参数值为最优值,得到过程工艺参数值,获取产品质量实测值,转至第8步;
若大于阈值,不满足要求,转至第6 步;
第 6 步,采用优化方法寻优:根据优化方法,对过程工艺参数进行优化更新;得到新的工艺参数值;
第 7 步,判断新的过程工艺参数值是否在规则范围内?若在规则范围内,则转至3 步;
否则,按规则修正控制参数,使过程工艺参数限定在规则的范围内,转至3 步;
第 8 步,计算实测值与目标值误差:利用实测值与目标值进行比较,若其误差在给定的允许误差精度范围之内,满足要求,则说明过程工艺参数可用,结束;若其误差超出了给定的允许误差精度,则对质量模型和规则进行修正,获得新的质量模型和规则,转至2 步。
实施例2 仿真实验
为了验证本发明方法的有效性,对本发明中的工艺参数的优化确定方法进行仿真实验。
该仿真实验以某钢铁企业带钢热镀锌生产过程为例,根据给定的质量指标,来优化确定工艺参数。
工艺参数包括:气刀压力p、气刀到带钢的距离d及机组速度v,目标产品质量为锌层重量w。
在生产过程中,一般通过调节p、d、v这三个工艺参数来控制带钢上面的锌层重量w。
当生产一个指定的锌层重量时,需要同时调节这三个参数,目前主要靠人工经验操作,导致锌层重量无法准确快速的得到控制,出现废品。
本实施例选取1000组带钢热镀锌生产数据,首先对数据进行归一化处理,即:
为归一化后的数据,为数据中最小值,为数据中最大值,为当前的数据。
利用800组数据建立神经网络质量模型,并利用其余200组数据进行预测验证。
预测均方根误差达到0.065,精度达到94.5%,
神经网络质量模型预测仿真结果图如图2所示。
实施例3 决策树提取规则
同样,采用相同的数据,利用决策树提取规则,其余200组数据对模型进行验证。
这里首先要对锌层重量数据进行分类,根据对锌层重量的不同要求,将锌层重量分成3个类别,即115 < w ≤146(1类)、80 ≤w <115(2类)、48 ≤w <80(3类),并将这3个类别作为决策树的根节点,而输入属性p、d、v则作为树的叶子节点。
图3为得到的决策树,其对应的规则为:
规则精度达到94.34%。
若要给带钢表面镀60 g/m2锌层重量时,可以发现该锌层重量对应于规则4,即约束了工艺参数取值范围。
实施例4 粒子群优化方法
利用粒子群优化的方法,首先确定种群的个数为50,迭代次数为150,在规则范围内初始化粒子的位置Xi= (p,v,d)(即工艺参数)和速度,给定误差在±0.5g/m2范围内,锌层重量以60g/m2作为给定值,利用神经网络质量模型预测每个粒子对应的锌层重量,并与给定的进行对比,若其中某个粒子的误差在±0.5g/m2范围内,则该粒子的位置即是所求的工艺参数;若不满足要求,则粒子进行迭代,更新粒子的位置和速度,并利用规则约束粒子的位置,直到满足要求或达到规定的精度。通过多次迭代优化,得到的结果是:,,,在规则范围内,锌层重量为60g/m2,完全满足要求。
实施例5 BP神经网络法
BP神经网络结构如图4所示,神经网络一般分为输入层1、隐含层2、输出层3,图1中显示只有一个隐含层。为了不失一般性,这里假设有h个隐含层,P个训练样本,即P个输入输出对,(k=1,2,…,P)。其中,为第k个样本输入向量:,“1”表示第一层,n为输入样本的维数,即输入层中的神经元个数;为第k个样本的期望输出向量:,m为输出向量的维数,即输出层中的神经元个数。
输出层和隐含层的激活函数这里以S型激活函数为例。
S型激活函数:
对于第k个样本,第h层网络的第i个神经元的输出值由工作信号的正向传播过程可得:
(1.1)
(1.2)
其中,为第h-1层第j个神经元的输出值,为第h层的第i个神经元和第h-1层第j个神经元的连接权值,为第h层的第i个神经元的阈值。
从网络的输入层到隐含层,再到输出层,用公式(1.1)、(1.2)可以依次求出各神经元的输出值。
下面给出BP算法数学表达式的推导过程。为方便解释,以下说明都以第k个样本为例。
输出层第k个样本的期望输出与实际输出的均方误差为:
(1.3)
在修改、时,、和的负梯度方向有关,即:
为了提高神经网络的学习能力,在网络训练中加入学习速率,即:
(1.4)
(1.5)
在实际的学习过程中,学习速率对学习过程的影响很大。是按梯度搜索的步长。
因此,权值修正公式为:
(1.6)
阈值修正公式为:
(1.7)
其中,t为修正次数。
由式(1.1),(1.2),(1.3)可得到:,
由式(1.1),(1.2),从而有:
则
(1.8)
(1.9)
由式(1.1),(1.2),(13)可知
(1.10)
现分层考虑,求出
(1)输出层
如果h=H,则说明是输出层H的输出。
由式(1.3):,其中是期望值,即常数,故有:
(1.11)
根据式(1.10)和式(1.11),有
(1.12)
(2)隐含层
如果h<H,则该层是隐含层,这时应考虑上一层对它的作用。
由式(1.2),,可得时,,
从而有
结合式(1.10)有:
以三层网络为例 (即最后一层为输出层,且只有一层隐含层)
记
输出层的权值、阈值修正公式:
(1.13)
(1.14)
中间隐含层的权值、阈值修正公式:
(1.15)
(1.16)
以上得到的四个公式(1.13),(1.14),(1.15),(1.16),是BP算法实现过程中的四个重要公式。
所述规则抽取采用决策树方法,其他规则抽取方法也同样可以提取规则,如神经网络规则抽取、支持向量机规则抽取等。
实施例6 决策树方法
决策树算法是利用信息增益作为属性的选择标准,选择信息增益最大的属性产生决策树结点,以使得在对每一个非叶结点进行测试时,能获得关于被测试记录最大的类别信息。由该属性的不同取值建立分支,再对各分支的子集递归调用该方法建立决策树结点的分支,直到所有了集仅包含同一类别的数据为止,最后得到一棵决策树,从决策树中我就可以得到规则,决策树的形式如图5所示。
设X是训练数据样本的集合,共n个样本,m个类别,学习的目的就是将n个训练样本分为m类,记为,设第i类的训练样本个数为,一个样本属于i类的概率为,则该样本X分类所需的期望信息由下式给出:
(2.1)
设属性A具有v个不同的取值,在情况下属于第i类的实例个数为,,即为测试属性A的取值为时属于第i类的概率,记为时的实例集,则训练样本集对属性A的其期望信息为:
(2.2)
测试属性A长出的每个叶节点对于分类信息的信息熵为
(2.3)
属性A上分支将获得的信息增益为:
(2.4)
越大,说明选择测试属性A对于分类提供的信息越大,因此,根据的作为测试属性的选择标准分割训练样本,得到成决策树,最后将决策树转化成规则。
所述工艺参数优化采用粒子群优化(Particle Swarm Optimization, PSO)方法,结合质量模型和决策树得到的规则实现工艺参数的优化,其他优化方法也同样可以适用于本专利,如蚁群算法、鱼群算法、遗传算法等。
实施例7 粒子群优化法
PSO算法中,每个优化问题的潜在解是搜索空间中的一只鸟,称之为“粒子”,即每个粒子的位置就是一个潜在的解。粒子个数称为种群规模m,第i个粒子在d维空间的位置表示为,(i=1,2,…,m),速度决定粒子搜索空间单位迭代次数的位移。计算每一个粒子的,适应度函数一般由实际问题中被优化的函数决定。根据每一个粒子的,更新每个粒子的和。这里的是否“最优”是由具体的优化问题决定:若该问题求最大值,则粒子适应度越大为最优;反之,若该问题求最小值,则粒子适应度越小为最优。粒子通过动态跟踪个体极值和全局最值来更新其速度和位置。粒子根据以下公式来更新其速度和位置:
(3.1)
(3.2)
式中i为第i个粒子,j=1,2,…,d。c1、c2是学习因子,即分别调节向全局最好粒子和个体最好粒子方向飞行的最大步长,若太小,则粒子可能远离目标区域,若太大,则会导致突然向目标区域飞去,或飞过目标区域。t为迭代次数,rand()为均匀分布在(0-1)之间的随机数。在更新过程中,粒子在每一维飞行的速度不能超过算法设定的最大速度,即,否则或=。设置较大的可以保证粒子种群的全局搜索能力,较小则种群的局部搜索能力加强。同时,粒子每一维的坐标也被限制在允许范围内。
粒子的移动原理如图6所示。
利用粒子群优化工艺参数的具体步骤如下:
1) 给定质量指标T和优化精度E,以工艺参数作为粒子的位置,初始化粒子个数m、每个粒子的速度V、位置X、速度最大值,最大循环迭代次数;
2) 初始化个体极值位置、全局极值位置,个体极值,全局极值;
3) 以粒子的位置为输入,利用前面建立的质量模型计算每个粒子对应的质量Y,并与质量指标T对比,计算出粒子的适应度;
4) 通过比较得出、、、。以求最小值为例:
若<, =, =;否则,、不变;
若<, =, =;否则,、不变。
5) 更新每个粒子的位置和速度;
根据式(3.1)、式(3.2)更新粒子的速度和位置,并且考虑更新后的速度和位置是否在限定的范围内。
考虑速度:若,则;
若,则;
否则不变。
同时,为了考虑工艺参数在每次寻优过程中都在规则的范围内,本专利首先根据给定质量指标T找到对应的规则,即得到工艺参数的范围,设某一参数的范围为[,],则按如下方式约束:
若,则;
若,则;
否则不变。
6) 比较次数是否达到最大迭代次数或预设精度。若满足预设精度,即,算法收敛,最后一次迭代的、就是我们所求的最优值位置和最优值;否则返回步骤3),算法继续迭代。
最后应说明的是:显然,上述实施例仅仅是为清楚地说明本发明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明的保护范围之中。