《基于RRELIEFF变量选择的生产过程主导变量精简化软测量方法.pdf》由会员分享,可在线阅读,更多相关《基于RRELIEFF变量选择的生产过程主导变量精简化软测量方法.pdf(14页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103033213 A(43)申请公布日 2013.04.10CN103033213A*CN103033213A*(21)申请号 201210551613.5(22)申请日 2012.12.18G01D 21/00(2006.01)(71)申请人重庆科技学院地址 401331 重庆市沙坪坝区虎溪大学城重庆科技学院电气与信息工程学院(72)发明人李太福 颜克胜 苏盈盈 姚立忠胡文金 王美丹(74)专利代理机构重庆为信知识产权代理事务所(普通合伙) 50216代理人余锦曦(54) 发明名称基于RReliefF变量选择的生产过程主导变量精简化软测量方法(57) 摘要本发明公。
2、开了一种基于RReliefF变量选择的生产过程主导变量精简化软测量方法,其特征在于按如下步骤进行:一,确定与主导变量可能相关的n个原始辅助变量,采集n个原始辅助变量和主导变量取值数据并组成样本集;二,利用RReliefF算法分别计算n个原始辅助变量的权重值;三,组成原始辅助变量序列;四,建模并根据最小均方误差MSE确定最佳辅助变量;五,得到精简化软测量模型。本发明能够在建模效果最好的基础上找出含辅助变量个数最少的辅助变量集对主导变量进行建模,实现对主导变量精简化的软测量。(51)Int.Cl.权利要求书2页 说明书8页 附图3页(19)中华人民共和国国家知识产权局(12)发明专利申请权利要求书。
3、 2 页 说明书 8 页 附图 3 页1/2页21.一种基于RReliefF变量选择的生产过程主导变量精简化软测量方法,其特征在于按如下步骤进行:步骤一:确定与主导变量可能相关的n个原始辅助变量,采集n个原始辅助变量和主导变量的取值,组成样本集,样本集大小为m,样本大小为n+1;步骤二:利用RReliefF算法分别计算n个原始辅助变量的权重值;步骤三:n个原始辅助变量组成原始辅助变量序列;步骤四:确定最佳辅助变量集,包括以下步骤:第一步,设定循环次数N=n;第二步,随机从样本集中选择p个样本作为训练样本,剩下的m-p个样本作为检验样本;第三步,根据所述训练样本,利用BP神经网络建立原始辅助变量。
4、序列中所包含变量的非线性模型;第四步,将所述检验样本的原始辅助变量值输入至所述非线性模型,得到m-p个检验样本对应的主导变量预测值;第五步,计算m-p个检验样本主导变量预测值的均方误差MSE;第六步,删除当前原始辅助变量序列中权重值最小的原始辅助变量,组成新的原始辅助变量序列;设定N=N-1,判断此时N是否为0:如果N0,则回到第三步;如果N=0,则最小的MSE对应原始辅助变量序列即为最佳辅助变量集;步骤五:最佳辅助变量集在步骤四中对应的非线性模型即为精简化软测量模型。2.根据权利要求1所述的基于RReliefF变量选择的生产过程主导变量精简化软测量方法,其特征在于:利用RReliefF算法计。
5、算n个原始辅助变量中任一原始辅助变量A的权重值按如下步骤进行:(一)从样本集中选出某个样本Di,从剩余的m-1个样本中选出离该样本Di距离最近的k个样本,其中1im;(二)计算在所述样本Di主导变量取值P0条件下的权重集ndC,按下式进行:其中,P0表示所述样本Di的主导变量P的取值,Pi(1ik)是所述k个样本中第i个样本的主导变量值,Pmax和Pmin分别是m个样本中主导变量的最大值和最小值;(三)计算在所述样本Di原始辅助变量A条件下的权重集ndAA,按下式进行:其中,A0表示所述样本Di的原始辅助变量A的取值,Ai(1ik)是所述k个样本中第i个样本内原始辅助变量A的取值,Amax和A。
6、min分别是m个样本中原始辅助变量A的最大值和最小值;(四)计算在所述样本Di主导变量取值P0和原始辅助变量A条件下的权重集ndC&dAA:权 利 要 求 书CN 103033213 A2/2页3(五)重复(一)、(二)、(三)、(四),总共重复m-1次,每次选择不同的样本;共得到m个ndC、m个ndAA、m个ndC&dAA;(六)分别计算NdC、NdAA与NdC&dAA;其中,NdC是m个ndC之和;NdAA是m个ndAA之和;NdC&dAA是m个ndC&dAA之和;(七)用下式计算原始辅助变量A的权重值WA:WA:=NdC&dAA/NdC-(NdAA-NdC&dAA)/(m-NdC)3.根。
7、据权利要求1所述的基于RReliefF变量选择的生产过程主导变量精简化软测量方法,其特征在于:在利用BP神经网络建立原始辅助变量序列中所包含变量的非线性模型的过程中,输入层的节点个数等于当前原始辅助变量序列中所包含的变量个数,隐含层的节点个数通过交互验证法确定,输出层的节点个数为1,其中,隐含层的传递函数为:输出层的传递函数为:purelin(x)=x。权 利 要 求 书CN 103033213 A1/8页4基于 RReliefF 变量选择的生产过程主导变量精简化软测量方法技术领域0001 本发明属于软测量技术领域,具体涉及一种基于RReliefF变量选择的生成过程主导变量精简化软测量方法。背。
8、景技术0002 到目前为止,在实际生产过程中,存在着许多因为技术或经济原因无法直接测量的变量,在这种情况下,软测量技术应运而生。软测量就是依据可测、易测的过程变量(称为辅助变量)与难以直接检测的待测变量(称为主导变量)的数学关系,根据某种最优准则,采用各种计算方法,用软件实现对待测变量的测量或估计。软测量技术是目前研究的一个热点,例如中国专利(专利号:200410017533.7)就提出了一种基于支持向量机的软测量建模方法。0003 在软测量过程中,辅助变量的选择是第一步。在大多数实际生产过程中,人们经常不能确定哪个辅助变量与主导变量相关,或有多大程度的相关,因而导致参与计算的辅助变量数量众多。
9、。将众多辅助变量通过计算,实现对主导变量的软测量,会带来庞大的计算量,不仅耗时耗力,并且得到的软测量结果也并不一定是最好的,这是在生成过程中不希望看到的事情。如何利用最少的辅助变量集对主导变量实现效果最好的的软测量,成为人们追求的目标。发明内容0004 本发明的目的在于提供一种基于RReliefF变量选择的生成过程主导变量精简化软测量方法,能够在建模效果最佳的准则上找出含辅助变量个数最少的辅助变量集对主导变量进行建模,实现对主导变量精简化的软测量。0005 本发明的技术方案如下:一种基于RReliefF变量选择的生产过程主导变量精简化软测量方法,其关键在于按如下步骤进行:0006 步骤一:确定。
10、与主导变量可能相关的n个原始辅助变量,采集n个原始辅助变量和主导变量的取值,组成样本集,样本集大小为m,样本大小为n+1;0007 所述样每个样本中,包含有一个主导变量和n个原始辅助变量共n+1个变量的取值。0008 步骤二:利用RReliefF算法分别计算n个原始辅助变量的权重值;0009 利用RReliefF算法计算n个原始辅助变量中任一原始辅助变量A的权重值按如下步骤进行:0010 (一)从样本集中选出某个样本Di,从剩余的m-1个样本中选出离该样本Di距离最近的k个样本,其中1im;k的值一般取10-20为宜。所述距离指欧式距离。0011 (二)计算在所述样本Di主导变量取值P0条件下。
11、的权重集ndC,按下式进行:说 明 书CN 103033213 A2/8页50012 0013 其中,P0表示所述样本Di的主导变量P的取值,Pi(1ik)是所述k个样本中第i个样本的主导变量值,Pmax和Pmin分别是m个样本中主导变量的最大值和最小值;0014 (三)计算在所述样本Di原始辅助变量A条件下的权重集ndAA,按下式进行:0015 0016 其中,A0表示所述样本Di的原始辅助变量A的取值,Ai(1ik)是所述k个样本中第i个样本内原始辅助变量A的取值,Amax和Amin分别是m个样本中原始辅助变量A的最大值和最小值;0017 (四)计算在所述样本Di主导变量取值P0和原始辅助。
12、变量A条件下的权重集ndC&dAA:0018 0019 (五)重复(一)、(二)、(三)、(四),总共重复m-1次,每次选择不同的样本;共得到m个ndC、m个ndAA、m个ndC&dAA;0020 (六)分别计算NdC、NdAA与NdC&dAA;0021 其中,NdC是m个ndC之和;NdAA是m个ndAA之和;NdC&dAA是m个ndC&dAA之和;0022 (七)用下式计算原始辅助变量A的权重值WA:0023 WA:=NdC&dAA/NdC-(NdAA-NdC&dAA)/(m-NdC)0024 所有n个原始辅助变量的权重值按原始辅助变量A的权重值计算方法计算得到。0025 步骤三:n个原始。
13、辅助变量组成原始辅助变量序列;0026 步骤四:确定最佳辅助变量集,包括以下步骤:0027 第一步,设定循环次数N=n;0028 第二步,随机从样本集中选择p个样本作为训练样本,剩下的m-p个样本作为检验样本;所述训练样本个数p一般选取总样本数m的1/4左右为宜。0029 第三步,根据所述训练样本,利用BP神经网络建立原始辅助变量序列中所包含变量的非线性模型;0030 建模过程中,BP神经网络输入层的节点个数等于当前原始辅助变量序列中所包含的变量个数,隐含层的节点个数通过交互验证法确定,输出层的节点个数为1,其中,隐含层的传递函数为:输出层的传递函数为:purelin(x)=x。0031 第四。
14、步,将所述检验样本的原始辅助变量值输入至所述非线性模型,得到m-p个检验样本对应的主导变量预测值;0032 第五步,计算m-p个检验样本主导变量预测值的均方误差MSE;说 明 书CN 103033213 A3/8页60033 均方误差MSE按下式计算:0034 0035 上式中,Pt表示所述m-p个检验样本中第t个样本的主导变量值,PCt表示所述m-p个检验样本中第t个样本的主导变量预测值;0036 第六步,删除当前原始辅助变量序列中权重值最小的原始辅助变量,组成新的原始辅助变量序列;设定N=N-1,判断此时N是否为0:0037 如果N0,则回到第三步;0038 如果N=0,则最小的MSE对应。
15、原始辅助变量序列即为最佳辅助变量集;0039 步骤五:最佳辅助变量集在步骤四中对应的非线性模型即为精简化软测量模型。0040 得到精简化软测量模型后,在以后的生产过程中,只需要测量最佳辅助变量集中辅助变量的值,代入精简化软测量模型,就可以得到主导变量的值。0041 本发明的显著效果:在众多原始辅助变量中,找出与主导变量具有关键作用的关键辅助变量,实现了利用含辅助变量个数最少的辅助变量集对主导变量实现效果最好的软测量,节约了人力物力财力,并大大提高了测量的效率。附图说明0042 图1是本发明的流程图;0043 图2是本发明中确定最佳辅助变量集的流程图;0044 图3是实施例1中的电池化成工艺流程。
16、图。具体实施方式0045 下面结合附图和实施例对本发明作进一步说明:0046 实施例1:0047 如图1,一种基于RReliefF变量选择的生产过程主导变量精简化软测量方法,按如下步骤进行:0048 步骤一:确定与主导变量可能相关的n个原始辅助变量,采集n个原始辅助变量和主导变量的取值,组成样本集,样本集大小为m,样本大小为n+1;0049 所述样每个样本中,包含有一个主导变量和n个原始辅助变量共n+1个变量的取值。0050 步骤二:利用RReliefF算法分别计算n个原始辅助变量的权重值;0051 利用RReliefF算法计算n个原始辅助变量中任一原始辅助变量A的权重值按如下步骤进行:005。
17、2 (一)从样本集中选出某个样本Di,从剩余的m-1个样本中选出离该样本Di距离最近的k个样本,其中1im;0053 (二)计算在所述样本Di主导变量取值P0条件下的权重集ndC,按下式进行:说 明 书CN 103033213 A4/8页70054 0055 其中,P0表示所述样本Di的主导变量P的取值,Pi(1ik)是所述k个样本中第i个样本的主导变量值,Pmax和Pmin分别是m个样本中主导变量的最大值和最小值;0056 (三)计算在所述样本Di原始辅助变量A条件下的权重集ndAA,按下式进行:0057 0058 其中,A0表示所述样本Di的原始辅助变量A的取值,Ai(1ik)是所述k个样。
18、本中第i个样本内原始辅助变量A的取值,Amax和Amin分别是m个样本中原始辅助变量A的最大值和最小值;0059 (四)计算在所述样本Di主导变量取值P0和原始辅助变量A条件下的权重集ndC&dAA:0060 0061 (五)重复(一)、(二)、(三)、(四),总共重复m-1次,每次选择不同的样本;共得到m个ndC、m个ndAA、m个ndC&dAA;0062 (六)分别计算NdC、NdAA与NdC&dAA;0063 其中,NdC是m个ndC之和;NdAA是m个ndAA之和;NdC&dAA是m个ndC&dAA之和;0064 (七)用下式计算原始辅助变量A的权重值WA:0065 WA:=NdC&d。
19、AA/NdC-(NdAA-NdC&dAA)/(m-NdC)0066 所有n个原始辅助变量的权重值按原始辅助变量A的权重值计算方法计算得到。0067 步骤三:n个原始辅助变量组成原始辅助变量序列;0068 步骤四:确定最佳辅助变量集,如图2所示,包括以下步骤:0069 第一步,设定循环次数N=n;0070 第二步,随机从样本集中选择p个样本作为训练样本,剩下的m-p个样本作为检验样本;0071 第三步,根据所述训练样本,利用BP神经网络建立原始辅助变量序列中所包含变量的非线性模型;0072 建模过程中,BP神经网络输入层的节点个数等于当前原始辅助变量序列中所包含的变量个数,隐含层的节点个数通过交。
20、互验证法确定,输出层的节点个数为1,其中,隐含层的传递函数为:输出层的传递函数为:purelin(x)=x。0073 第四步,将所述检验样本的原始辅助变量值输入至所述非线性模型,得到m-p个检验样本对应的主导变量预测值;0074 第五步,计算m-p个检验样本主导变量预测值的均方误差MSE;说 明 书CN 103033213 A5/8页80075 均方误差MSE按下式计算:0076 0077 上式中,Pt表示所述m-p个检验样本中第t个样本的主导变量值,PCt表示所述m-p个检验样本中第t个样本的主导变量预测值;0078 第六步,删除当前原始辅助变量序列中权重值最小的原始辅助变量,组成新的原始辅。
21、助变量序列;设定N=N-1,判断此时N是否为0:0079 如果N0,则回到第三步;0080 如果N=0,则最小的MSE对应原始辅助变量序列即为最佳辅助变量集;0081 步骤五:最佳辅助变量集在步骤四中对应的非线性模型即为精简化软测量模型。0082 得到精简化软测量模型后,在以后的生产过程中,只需要测量最佳辅助变量集中辅助变量的值,代入精简化软测量模型,就可以得到主导变量的值。0083 以推导铅酸蓄电池生产过程中的容量放电终止电压为例,在电池生产过程中,电池化成的工艺图如图3所示,电池化成要经过六个阶段的充放电以后再进行容量放电检验,而容量放电检测中涉及到测量10小时率放电终止电压。0084 我。
22、们确定主导变量为10h率放电终止电压,选择电池电导、充电8h电池电压、充电31h电池电压、充电26h电池电压、化成放电0h电池电压、化成放电6h终止电压、充电6h电池电压、充电32h电池电压作为原始辅助变量。0085 按步骤一,收集到主导变量和8个原始辅助变量的样本集,样本大小为9,样本集大小为172,即有172个大小为9的样本,见表1:0086 表1样本集说 明 书CN 103033213 A6/8页90087 0088 续表10089 说 明 书CN 103033213 A7/8页100090 0091 利用RReliefF算法得到8个原始辅助变量的权重值依次为:0092 0093 从样本。
23、集中随机选取130个样本作为训练样本,剩下的42个为检验样本。依次删除原始辅助变量序列中权重值最小的原始辅助变量,利用BP神经网络建立非线性模型后,计算得到的检验样本的均方误差MSE,下表依次列出了原始辅助变量序列中变量个数为8、7、6、5、4、3、2和1时检验样本的均方误差MSE:0094 0095 均方误差0.0011对应的原始辅助变量序列即为最佳辅助变量集,对应的非线性模型即为精简化软测量模型。0096 本实施例中的最佳辅助变量集包括:电池电导、化成放电6h终止电压、充电8h电池电压、充电26h电池电压、化成放电0h电池电压。在建立精简化软测量模型中,BP神经网络的输入层节点为上述五个最佳辅助变量值,经过交互验证法确定BP神经网络的隐含层节点数为11个。0097 从而得到本例的精简化软测量模型:BP神经网络隐含层第i个神经元输出i=1,2,11,0098 输出层神经元输出k=1,其中,说 明 书CN 103033213 A10。