轧制工艺的学习控制装置.pdf

摘要
申请专利号：	CN201480075773.4	申请日：	2014.02.17
公开号：	CN106030424A	公开日：	2016.10.12
当前法律状态：	授权	有效性：	有权
法律详情：	授权\|\|\|实质审查的生效IPC(主分类):G05B 13/02申请日:20140217\|\|\|公开
IPC分类号：	G05B13/02; B21B37/00; G06N3/00; G06N3/08	主分类号：	G05B13/02
申请人：	东芝三菱电机产业系统株式会社
发明人：	久保直博
地址：	日本东京
优先权：
专利代理机构：	上海专利商标事务所有限公司 31100	代理人：	万捷
PDF下载：	PDF下载

内容摘要

基于实际值与实际值再计算值间的偏差来算出学习系数的瞬时值，再由瞬时值算出学习系数的更新值。将算出的更新值记录至该轧制条件相应的基本单元。在设定计算时，从学习系数的新近度、饱和度及稳定度的各评价结果满足基准的基本单元中，选定在以轧制条件为坐标轴的空间中在空间距离上距下一轧制条件相应的目标基本单元较近的预定个数的附近基本单元。然后，通过使用所选定的附近基本单元中的学习系数的代表值来进行多项式插值，从而算出目标基本单元中的学习系数的推定值。然后，将对象基本单元中的学习系数的最新更新值用推定值来校正，并定为下一轧制条件下的学习系数的使用值。

权利要求书

1.一种轧制工序的学习控制装置，具有由区分轧制条件的多个基本单元
构成的数据库，利用所述数据库来管理轧制工艺的设定计算中所使用的模型
公式的学习系数，该轧制工序的学习控制装置的特征在于，包括：
瞬时值计算记录单元，其基于所述轧制工艺中测量出的实际值与利用所
述模型公式计算出的实际值再计算值间的偏差来计算出所述学习系数的瞬时
值，对该轧制条件相应的基本单元将所述瞬时值与学习日期一同进行记录；
更新值计算记录单元，其基于所述瞬时值和所述学习系数在该轧制条件
下的前次值来计算出所述学习系数的更新值，对该轧制条件相应的基本单元
将所述更新值与学习日期一同进行记录；
新近度评价单元，其基于所述数据库中存储的所述更新值的历史信息，
对多个所述基本单元的每个分别评价所述学习系数的新近度；
饱和度评价单元，其基于所述数据库中存储的所述更新值的历史信息，
对多个所述基本单元的每个分别评价所述学习系数的饱和度；
稳定度评价单元，其基于所述数据库中存储的所述瞬时值的历史信息，
对多个所述基本单元的每个分别评价所述学习系数的稳定度；
附近基本单元选定单元，其从所述新近度、所述饱和度及所述稳定度的
各评价结果满足基准的基本单元中，选定在以轧制条件为坐标轴的空间中距
下一轧制条件相应的对象基本单元空间距离近的预定个数的附近基本单元；
推定值计算单元，其决定所选定的所述预定个数的附近基本单元中的所
述学习系数各自的代表值，并基于所述对象基本单元的坐标和所选定的所述
预定个数的附近基本单元的坐标及所述代表值，通过多项式插值计算出所述
对象基本单元中的所述学习系数的推定值；以及
使用值决定单元，其利用所述推定值对所述对象基本单元中的所述学习
系数的最新更新值进行校正，并定为下一轧制条件下的所述学习系数的使用
值。
2.如权利要求1所述的轧制工序的学习控制装置，其特征在于，
所述使用值决定单元包括：
通过所述最新更新值与所述推定值的加权平均来算出所述使用值的单
元；以及
按照对所述对象基本单元的所述新近度、所述饱和度及所述稳定度的评
价结果越高则所述最新更新值的权重越大，而所述评价结果越低则所述推定
值的权重越大的方式，来根据所述评价结果改变所述加权平均的加权系数的
单元。
3.如权利要求1或2所述的轧制工序的学习控制装置，其特征在于，
所述数据库包括共用基本单元的第一分层表和第二分层表，
所述瞬时值计算记录单元构成为，将所述瞬时值记录至所述第一分层
表，
所述更新值计算记录单元构成为，将所述更新值记录至所述第二分层
表。
4.如权利要求3所述的轧制工序的学习控制装置，其特征在于，
所述数据库还包括与所述第一分层表及所述第二分层表共用基本单元的
第三分层表、第四分层表和第五分层表，
所述新近度评价单元构成为，将所述新近度的评价结果记录至所述第三
分层表；
所述饱和度评价单元构成为，将所述饱和度的评价结果记录至所述第四
分层表；以及
所述稳定度评价单元构成为，将所述稳定度的评价结果记录至所述第五
分层表。

说明书

轧制工艺的学习控制装置

技术领域

本发明涉及在轧制工艺的控制中基于实际数据来算出预测轧制现象的模
型公式的学习系数以对每个轧制条件进行管理的学习控制装置。

背景技术

轧制工艺的控制是指，进行轧制使得制造完成后的轧制材料成为所期望
的尺寸和温度。轧制工艺控制，一般由设定控制和时序控制组成。在设定控
制中，通过模型公式来预测轧制现象，从而决定轧制速度、冷却水的水量以
及轧制机的辊间隙等轧制设备的机器设定值，以使轧制材料成为所期望的尺
寸和温度。但是，模型公式不能完全表现轧制工艺中产生的物理现象。另
外，出于减轻计算负荷、调整便利性等理由，而表示模型的计算式得到简
化。因此，通过传感器测量出的实际值与用模型公式计算出的预测值之间发
生偏差。于是，在现有的轧制工艺的设定控制中，为了谋求轧制现象的预测
精度的提高和稳定，在模型公式中设置学习系数，进行基于实际数据自动调
整此学习系数的学习控制。实际数据中包含完工温度和轧制负荷，这些实际
数据针对设定计算的目标点而被收集。

在此，对一般的轧制工艺的学习控制的概要进行说明。学习控制由多个
处理组成，其中之一是实际值再计算处理。在实际值再计算处理中，使用模
型公式算出基于实际数据的模型预测值。一般将算出的模型预测值称作实际
值再计算值。实际值再计算值与实际数据中所包含的实际值进行比较，算出
实际值再计算值相对于实际值的误差，即模型误差。例如，就轧制机的轧辊
间隙的设定控制而言，将负荷基本单元中测量出的轧制负荷的实际值与用模
型公式根据实际数据计算出的轧制负荷的实际值再计算值进行比较，算出轧
制负荷的模型误差。

然后，基于模型误差算出学习系数。此时算出的学习系数叫做学习系数
的瞬时值。但是，因为模型误差是由简化构建模型公式时所忽视的因素中的
何种因素所引起是未知的，另外学习所使用的实际数据本身也包含有外部干
扰或误差，所以不能将根据模型误差算出的学习系数的瞬时值直接应用于下
一轧制材料。于是，使学习系数的瞬时值通过平滑滤波器。对学习系数的瞬
时值进行滤波后得到的值被用作学习系数的更新值。

下式是由学习系数的瞬时值来算出更新值的平滑滤波器的表达式的具体
例。通过将学习系数的瞬时值与学习系数的前次值(更新值的前次值)之间
的偏差乘以更新增益，所得乘积再与学习系数的前次值相加，从而算出学习
系数的更新值。

Znew＝Zuse＊(1-α)+Zcur＊α

在此，Znew：学习系数更新值

Zcur：学习系数(瞬时值)

Zuse：学习系数(前次值)

α：学习系数更新增益(滤波器的时间常数)

算出的学习系数的更新值，一般被记录至分层表。分层是，用于区分轧
制材料的厚度、宽度、应变、应变速度、温度等轧制条件的概念。例如，当
区分m个厚度、区分n个宽度时，分层表由m×n个基本单元构成。每次该材
料的轧制结束时算出学习系数的更新值，记录在与该材料的轧制条件一致的
基本单元中。通过将分层表用于学习系数的记录，能够恰当地管理依每个轧
制条件而不同的学习系数，轧制现象的预测精度得到提高。即，使用了分层
表的学习控制是，用于确保模型公式的轧制现象的预测精度、确保成品的质
量精度和轧制的稳定性的重要功能。

但是，使用了分层表的学习控制也存在问题。通过在分层表中管理学习
系数，学习系数被管理于分层表内相应的一个基本单元中，在每个相应的基
本单元中进行平滑化和更新。因此，一个基本单元的学习系数变饱和需要多
个轧制机会(轧制根数)。另外，由于只要轧制条件略微不同就要选择不同
的基本单元号码，学习系数会关于不同的基本单元而被重新更新。因此，就
构成分层表的所有的基本单元，每个基本单元都需要多个轧制机会。

作为减少所需轧制机会的一方案，考虑在更新一个基本单元的学习系数
时同时也更新相邻的基本单元的学习系数的方法。在此学习方法中，如下式
所示，对于该轧制条件所对应的该基本单元(i,j)用与前述方法相同的方法
来计算学习系数。再者，(i,j)示出了分层表中的该基本单元的坐标。

Znew(i,j)＝Zuse(i,j)＊(1-α)+Zcur(i,j)＊α

在此，Znew(i,j)：该基本单元的学习系数更新值

Zcur(i,j)：该基本单元的学习系数(瞬时值)

Zuse(i,j)：该基本单元的学习系数(前次值)

α：该基本单元的学习系数更新增益(滤波器的时间常数)

对于相邻的基本单元(p,q)，用下式计算学习系数。再者，(p,q)表
示分层表中相邻的基本单元的坐标，其中包含(i-1,j)、(i,j-1)、(i+1,j)
以及(i+1,j)。

Znew(p,q)＝Zuse(p,q)＊(1-α’)+Zcur(i,j)＊α’

在此，Znew(p,q)：相邻的基本单元的学习系数更新值

Zcur(i,j)：该材料基本单元的学习系数(瞬时值)

Zuse(p,q)：相邻的基本单元的学习系数(前次值)

α’：相邻的基本单元的学习系数更新增益(滤波器的时间常数)

根据此学习方法，能够用尽可能少的轧制机会使相邻的基本单元的学习
系数饱和。然而，虽然相邻的基本单元在进行学习，但离该基本单元稍远的
基本单元的学习系数不能得到更新。即，用此学习方法，关于减少轧制机会
只能获得有限的效果。另外，当该基本单元的学习系数不稳定、每次更新大
幅变动时，相邻的基本单元的学习系数也会受其影响。

并且，使用了分层表的学习控制还存在上述问题之外的别的问题。该问
题是，由于基本单元被细分化所以难以追随轧制工艺经时间变化而发生的变
化。当某个基本单元所对应的轧制条件下暂无轧制时，该暂无轧制期间轧制
工艺有可能发生变化。在此所称的轧制工艺的变化，既包含热轧中的温度等
级的变化等主动的变化，也包含设备的劣化等被动的变化。若轧制工艺变
化，则真正的学习系数也产生变化。因此，当分层表中所记录的学习系数的
更新值维持旧值不变时，此值有可能不恰当。当将不恰当的学习系数应用于
模型公式时，模型预测值所包含的误差会变大，会降低机器设定值的精度。

如上所述，使用了现有一般所用的分层表的学习控制有种种问题。另一
方面，使用了分层表的学习控制，还存在以下专利文献1、2所开示的方案。

专利文献1所公开的方案为，将模型与现象间的偏差中所包含的因时间
序列性变动造成的偏差作为时间序列学习系数来分离的方法。将该轧制条件
所对应的时间系数分为依存于轧制现象的分组学习系数和依存于时间变化的
时间序列学习系数来进行计算，再基于这两种学习系数来修正模型预测值，
从而提高模型预测值的精度。具体而言，基于根据模型误差计算出的学习系
数的瞬时值和与该轧制条件下的轧制现象相关的学习系数的使用值，用平滑
滤波器算出时间序列学习系数的更新值。然后，基于学习系数的瞬时值减去
时间序列学习系数的更新值之后所剩的值，用平滑滤波器算出与该轧制条件
下的轧制现象相关的学习系数的更新值。

根据专利文献1中提出的学习方法，能够将因工艺流水线的时间序列性
变动而产生的偏差作为时间序列学习系数来提取出。但是，在该学习方法
中，依存于轧制现象的分组学习系数也是对每个基本单元进行计算的。因
此，即使由于在某轧制条件暂不进行轧制的期间轧制工艺有变化，而使该轧
制条件下的模型与现象间的偏离产生了变动，该变动也不反映至该轧制条件
的基本单元所记录的学习系数。从而，在轧制工艺变化后该轧制条件下的第
一次轧制中，无法获得模型与现象间的偏差得到了恰当修正的学习系数。

专利文献2所公开的技术方案为，对于轧制材料的区分所对应的每个批
次(基本单元)分别记录模型公式的学习项的方法，在该方法中，批次每当
发生变化，就对下一批次所对应的学习项的熟练度进行判定，当熟练度低于
基准时，使用熟练度高的其他的批次的学习项来校正下一批次的学习项。具
体而言，以下一批次的学习项的学习次数是否在基准次数以上，以及下一批
次所对应的学习项的最近的预定次的标准差是否在基准值以上为基准，来判
定下一批次的学习项的熟练度。然后，当熟练度低于基准时，基于表上与该
批次相邻的各批次的学习项以及根据其熟练度而定的校正系数，用平滑化滤
波器进行该批次的学习项的校正。

根据专利文献2中提出的学习方法，即使下一批次的学习项未熟练，也
能够使用相邻的已熟练的批次的学习项来优化未熟练的批次的学习项。但
是，相邻批次的学习项不一定比下一批次的学习项熟练。当下一批次的学习
项未熟练、相邻批次的学习项也未熟练时，关于下一批次必须基于未熟练的
学习项来进行设定计算。另外，当相邻批次的学习项不稳定、即每次更新其
值都大幅变化时，使用其校正的下一批次的学习项也会不稳定。并且，当由
于暂时不进行轧制的期间的轧制工艺发生变化而使相邻批次的学习项的精度
随时间发生劣化时，使用相邻批次的学习项进行校正的下一批次的学习项的
精度也会变低。

现有技术文献

专利文献

专利文献1：日本专利第2839746号公报

专利文献2：日本专利公开2000-263110号公报

发明内容

本发明所要解决的技术问题

如上所述，即使是专利文献1、2中所提出的学习方法，也不能解决所有
上述问题。即，学习系数的饱和度低时的问题(饱和度的问题)，学习系数
不稳定、变动大时的问题(稳定度的问题)，以及由于暂不进行轧制的期间
的轧制工艺发生变化而使学习系数变旧的问题(新近度(recency)的问
题)，目前不能说得到了充分的解决。

本发明是鉴于上述问题而提出的，其目的在于，在每个轧制条件下对设
定计算所用的模型公式的学习系数进行学习并管理的学习控制装置中，能在
各轧制条件下得到饱和度、稳定度、新近度全均得到满足的学习系数。

解决技术问题所采用的技术方案

本发明所涉及的学习控制装置具有由区分轧制条件的多个基本单元构成
的数据库，利用数据库来管理轧制工艺的设定计算所使用的模型公式的学习
系数，为了达成上述目的，其构成如下。

本发明所涉及的学习控制装置包括瞬时值计算记录单元和更新值计算记
录单元，来作为将学习系数计算出并记录至数据库的单元。瞬时值计算记录
单元构成为，基于轧制工艺中测量出的实际值与用模型公式算出的实际值再
计算值间的偏差来算出学习系数的瞬时值，然后对该轧制条件相应的基本单
元将算出的瞬时值与学习日期一同进行记录。通过瞬时值计算记录单元的上
述构成，在数据库中对于每个基本单元记录瞬时值的历史信息。更新值计算
记录单元构成为，基于瞬时值计算单元所算出的学习系数的瞬时值和学习系
数在该轧制条件下的前次值来算出学习系数的更新值，然后对该轧制条件相
应的基本单元将算出的更新值与学习日期一同进行记录。通过更新值计算记
录单元的上述结构，在数据库中对于每个基本单元记录更新值的历史信息。

再者，当通过基本单元区分的轧制条件为两项时，也可以将瞬时值和更
新值各自的历史信息用分层表进行管理。即，也可以将数据库构成为包括共
用基本单元的第一分层表和第二分层表，对第一分层表记录瞬时值计算记录
单元的瞬时值，对第二分层表记录更新值计算记录单元的更新值。

本发明所涉及的学习控制装置包括：评价学习系数的新近度的新近度评
价单元、评价学习系数的饱和度的饱和度评价单元、以及评价学习系数的稳
定度的稳定度评价单元。新近度评价单元构成为，基于数据库中记录的更新
值的历史信息，对于多个基本单元的每个分别评价学习系数的新近度。饱和
度评价单元构成为，基于数据库中记录的更新值的历史信息，对于多个基本
单元的每一个分别评价学习系数的饱和度。稳定度评价单元构成为，基于数
据库中记录的瞬时值的历史信息，对于多个基本单元的每一个分别评价学习
系数的稳定度。

再者，与瞬时值和更新值的各历史信息一样，也可以对新近度、饱和度
以及稳定度各自的评级结果用分层表进行管理。在这种情况下，数据库可以
构成为，还包括与第一分层表及第二分层表共用基本单元的第三至第五分层
表。然后，对第三分层表记录新近度评价单元的新近度评价结果，对第四分
层表记录饱和度评价单元的饱和度评价结果，对第五分层表记录稳定性评价
单元的稳定度评价结果即可。

本发明所涉及的学习控制装置还包括：附近基本单元选定单元、推定值
计算单元，以及使用值决定单元。附近基本单元选定单元构成为，从新近
度、饱和度以及稳定度各自的评价结果满足基准的基本单元中，选定在以轧
制条件为坐标轴的空间中距下一轧制条件相应的目标基本单元空间距离近的
预定个数的附近基本单元。推定值计算单元构成为，决定所选定的预定个数
的附近基本单元中的学习系数的代表值，并基于对象基本单元的坐标和所选
定的预定个数的附近基本单元的坐标及代表值，通过多项式插值计算出对象
基本单元中的学习系数的推定值。此外，使用值决定单元构成为，利用推定
值对对象基本单元中的学习系数的最新更新值进行校正，并定为下一轧制条
件下的学习系数的使用值。

优选地，使用值决定单元构成为，通过最新更新值与推定值的加权平均
来计算出使用值。按照对对象基本单元的新近度、饱和度以及稳定度的评价
结果越高则最新更新值的权重越大，而评价结果越低则推定值的权重越大的
方式，根据评价结果来改变加权平均的加权系数。

发明效果

根据如上所述构成的本发明的学习控制装置，能够对下一轧制材料的轧
制条件相应的基本单元应用最新的、饱和度高、稳定度高的学习系数。由
此，能够提高设定控制中的模型预测值的精度，进而改善成品质量的精度以
及操作的稳定性。

附图说明

图1是示出根据本发明实施方式的轧制工艺的学习控制装置的结构和处
理流程的图。

图2是说明学习系数的推定值的计算方法的图。

具体实施方式

下文，参照附图，说明本发明的实施方式。

图1中示出本实施方式所涉及的轧制工艺的学习控制装置的结构和处理
流程。本学习控制装置1包括学习装置10、存储装置20以及设定计算装置
30。学习装置10是基于轧制工艺的实际数据来学习设定计算中所用的模型公
式的学习系数的装置。存储设备20是将模型公式的学习系数及与其相关联的
信息存储至数据库的装置。此数据库由区分轧制条件的多个基本单元构成。
更具体而言，由共用基本单元的五个分层表21、22、23、24、25构成。再
者，共用基本单元是指，若表之间基本单元的坐标相同则相应的轧制条件也
相同，坐标相同的基本单元在表之间相互关联。在本实施例中，轧制条件为
轧制材料的厚度和宽度这两项，各分层表使用以厚度和宽度为轴的表。当厚
度号码为“i”、宽度号码为“j”时，(i，j)为各分层表中基本单元的坐
标。设定计算装置30是用数据库中所存储的学习系数来计算模型预测值，基
于模型预测值决定轧制装置的机器设定值的装置。

首先，详细说明学习装置10。处理单元11基于轧制工艺的实际数据来进
行模型预测值的实际值再计算。处理单元12基于处理单元11所算出的实际
值再计算值与包含在实际数据中的实际值之间的模型误差来算出学习系数的
瞬时值。处理部13通过使处理单元12所算出的学习系数的瞬时值通过平滑
滤波器来算出学习系数的更新值。学习系数的瞬时值和更新值的计算方法与
在“背景技术”中说明的现有的学习控制的内容相同。

本学习控制装置在一根轧制材料的轧制完成之后，将学习系数的瞬时值
和更新值分别记录至该材料的轧制条件相应的基本单元。具体而言，学习系
数的瞬时值被记录至第一分层表21。处理单元12从构成第一分层表21的多
个基本单元中选择该轧制条件相应的基本单元。然后，通过对所选择的基本
单元将算出的瞬时值按时间顺序记录，使瞬时值的历史信息存储至第一分层
表21。更具体而言，在第一分层表21中，对每个基本单元都关于过去N根轧
制材料将学习系数的瞬时值与学习日期一同存储为历史信息。存储的信息从
新的信息开始编号。即，将新存储的信息作为第1条，每次追加信息时将第i
条信息重新编号为第i+1条。另外，若追加信息时已存储了N根轧制材料的
信息，则丢弃最旧的第N条信息，将第N-1条信息重新编号为第N条。

学习系数的更新值被记录至第二分层表22。处理单元13从构成第二分层
表22的多个基本单元中选择该轧制条件相应的基本单元。然后，通过对所选
择的基本单元将算出的更新值按时间顺序记录，使更新值的历史信息存储至
第二分层表22。更具体而言，在第二分层表22中，对每个基本单元都关于过
去M个轧制材料将学习系数的更新值与学习日期一同存储为历史信息。存储
的信息与关于学习系数的瞬时值的历史信息同样地，从新的信息开始编号。
即，将新存储的信息作为第1条，将第i条信息重新编号为第i+1条，若已
存储了M个轧制材料的信息，则丢弃最旧的第M条信息，将第M-1条信息重
新编号为第M条。

本学习控制装置在更新学习系数的更新值和瞬时值各自的历史信息之
后，关于学习系数进行三个评价。第一个评价是学习系数的新近度的评价，
此评价对所有的基本单元进行。第二个评价是学习系数的饱和度的评价，此
评价对该材料的轧制条件所对应的该基本单元、即本次处理中进行历史纪录
更新的基本单元进行。第三个评价是学习系数的稳定度的评价，此评价对该
基本单元进行。

学习系数的新近度评价由处理单元14进行。处理单元14基于第二分层
表22所存储的学习系数的更新值的历史信息，来评价第二分层表22的各基
本单元的学习系数的更新值是新的。若各基本单元的更新是在一定日期之后
进行的，则可判断此学习系数的更新值是新的。下式用于此判断。

ε(k,l)＜εtime

在此，(k,l)：基本单元的坐标(其中，k,l是所有轧制条件的组合)

ε(k,l)：该材料的学习系数的更新日期与基本单元(k,l)的更新日期
之间的时间差

εtime：新近度的判定基准值

当满足上式时，处理单元14判断基本单元(k,l)存储的学习系数的更新
值是最新的，并使FCZtime(k,l)为1。当不满足上式时，处理单元14判断基
本单元(k,l)存储的学习系数的更新值不是最新的，并使FCZtime(k,l)为0。
再者，FCZtime(k,l)是表示学习系数的更新值的新近度评价结果的数值，若
值为1则意味着是最新的，若值为0则意味着不是最新的。处理单元14对所
有基本单元进行基于上式的判断。

由处理单元14为每个基本单元决定的新近度评价值FCZtime(k,l)被记录
至第三分层表23的对应的基本单元。

学习系数的饱和度评价由处理单元15进行。处理单元15基于第二分层
表22所存储的学习系数的更新值的历史信息，对于该基本单元评价其学习系
数的更新值是饱和的。关于学习系数的更新值的第1条至第m条(m≤M)的
值，将第m条的值减去第m-1条的值、第i条的值减去第i-1条的值、第2
条的值减去第1条的值来算出各个学习系数的更新值的变化量，若更新值的
变化量向0收敛了，则可判断该基本单元的学习系数的更新值是饱和的。下
式用于此判断。

CZmdf(r,s)＜εmdf

在此，(r,s)：该基本单元的坐标

CZmdf(r,s)：该基本单元的学习系数的更新值的变化量的平均值

εmdf：饱和度的判定基准值

更新值的变化量的平均值CZmdf(r,s)通过下式算出。

$<mrow> <mi>C</mi> <mi>Z</mi> <mi>m</mi> <mi>d</mi> <mi>f</mi> <mrow> <mo>(</mo> <mi>r</mi> <mo>,</mo> <mi>s</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <munderover> <mo>Σ</mo> <mrow> <mi>i</mi> <mo>=</mo> <mi>m</mi> </mrow> <mn>2</mn> </munderover> <mrow> <mo>{</mo> <mfrac> <mrow> <mo>|</mo> <mi>Z</mi> <mi>m</mi> <mi>d</mi> <mi>f</mi> <mrow> <mo>(</mo> <mi>r</mi> <mo>,</mo> <mi>s</mi> <mo>)</mo> </mrow> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>-</mo> <mi>Z</mi> <mi>m</mi> <mi>d</mi> <mi>f</mi> <mrow> <mo>(</mo> <mi>r</mi> <mo>,</mo> <mi>s</mi> <mo>)</mo> </mrow> <mrow> <mo>(</mo> <mi>i</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>|</mo> </mrow> <mrow> <mo>|</mo> <mi>Z</mi> <mi>m</mi> <mi>d</mi> <mi>f</mi> <mrow> <mo>(</mo> <mi>r</mi> <mo>,</mo> <mi>s</mi> <mo>)</mo> </mrow> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>|</mo> </mrow> </mfrac> <mo>}</mo> </mrow> </mrow> <mi>m</mi> </mfrac> <mn>...</mn> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>$

在此，Zmdf(r,s)(i)：学习系数的更新值的第i条的存储值

当满足上式时，处理单元15判断该基本单元(r,s)存储的学习系数的更
新值是饱和的，并使FCZmdf(r,s)为1。当不满足上式时，处理单元15判断
该基本单元(r,s)存储的学习系数的更新值不饱和，并使FCZmdf(r,s)为0。
另外，当M＜m时，处理单元15使FCZmdf(r,s)为0。再者，FCZmdf(r,s)是
表示学习系数的更新值的饱和度评价结果的数值，若值为1则意味着是饱和
的，若值为0则意味着不饱和。

由处理单元15决定的饱和度评价值FCZmdf(r,s)被记录至第四分层表24
的该基本单元(r,s)。

学习系数的稳定度评价由处理单元16进行。处理单元16基于第一分层
表21所存储的学习系数的瞬时值的历史信息，对于该基本单元评价其学习系
数的瞬时值是稳定的。关于学习系数的瞬时值的第1条至第n条(n≤N)的
值，若其变动量小，则可判断该单元的学习系数的瞬时值是稳定的。下式用
于此判断。

CZcur(r,s)＜εcur

在此，(r,s)：该基本单元的坐标

CZcur(r,s)：该基本单元的学习系数的瞬时值的变化量的标准差

εcur：稳定度的判定基准值

瞬时值的变化量的标准差CZcur(r,s)通过下式算出。

$<mrow> <mi>C</mi> <mi>Z</mi> <mi>c</mi> <mi>u</mi> <mi>r</mi> <mrow> <mo>(</mo> <mi>r</mi> <mo>,</mo> <mi>s</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <munderover> <mo>Σ</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msup> <mrow> <mo>{</mo> <mi>Z</mi> <mi>c</mi> <mi>u</mi> <mi>r</mi> <mrow> <mo>(</mo> <mi>r</mi> <mo>,</mo> <mi>s</mi> <mo>)</mo> </mrow> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>-</mo> <munderover> <mo>Σ</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <mfrac> <mrow> <mi>Z</mi> <mi>c</mi> <mi>u</mi> <mi>r</mi> <mrow> <mo>(</mo> <mi>r</mi> <mo>,</mo> <mi>s</mi> <mo>)</mo> </mrow> <mrow> <mo>(</mo> <mi>j</mi> <mo>)</mo> </mrow> </mrow> <mi>n</mi> </mfrac> <mo>}</mo> </mrow> <mn>2</mn> </msup> </mrow> <mi>n</mi> </mfrac> <mn>...</mn> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>$

在此，Zcur(r,s)(i)：学习系数的瞬时值的第i条的存储值

当满足上式时，处理单元16判断该基本单元(r,s)存储的学习系数的瞬
时值是稳定的，并使FCZcur(r,s)为1。当不满足上式时，处理单元16判断
该基本单元(r,s)存储的学习系数的瞬时值是不稳定的，并使FCZcur(r,s)为
0。另外，当N＜n时，处理单元16使FCZcur(r,s)为0。再者，FCZcur(r,s)
是表示学习系数的瞬时值的稳定度评价结果的数值，若值为1则意味着是稳
定的，若值为0则意味着是不稳定的。

由处理单元16决定的稳定度评价值FCZcur(r,s)被记录至第五分层表25
的该基本单元(r,s)。

通过以上处理，关于该材料的轧制条件相应的基本单元，学习系数的瞬
时值和更新值得以存储。并且，关于所有基本单元，学习系数的新近度得到
评价，另外，关于该基本单元，学习系数的饱和度及稳定度得到评价，这些
评价值也再被存储至对应的基本单元。

接着，详细说明设定计算装置30。设定计算装置30对下一材料的轧制条
件相应的基本单元、即作为使用了模型公式的模型预测目标的目标基本单
元，利用两种方法求得学习系数，并根据该学习系数算出下一材料轧制时应
用的学习系数的使用值。一种方法是，从第二分层表22中所存储的学习系数
的更新值的历史信息检索并读取出下一材料的轧制条件相应的基本单元的最
新的更新值的方法。根据此方法的处理由处理单元33进行。在此，将下一材
料的基本单元的坐标记为(t,u)，将由处理单元33读出的学习系数的更新值
记为Zmod(t,u)。

另一种方法是，使用下一材料的基本单元的附近基本单元的学习系数算
出下一材料的基本单元中的学习系数的推定值的方法。根据此方法的处理由
处理单元31、32进行。具体而言，首先，处理单元31从下一材料的基本单
元附近的基本单元中选定满足预定条件的基本单元。预定条件为以下三个条
件：

1)使用较新的数据得到了学习更新。

2)学习系数的更新值是饱和的。

3)学习系数的瞬时值是稳定的。

处理单元31选择在第三分层表23、第四分层表24以及第五分层表25中
评价结果都被判定为1的基本单元。然后，从所选择的基本单元中，按顺序
提取出三个在空间距离上距下一材料相应的基本单元(t,u)较近的基本单元。
在此，将所选择的三个基本单元记作基本单元A(ta,ua)、基本单元B
(tb,ub)、基本单元C(tc,uc)。

处理单元32对处理单元31所选择的基本单元A(ta,ua)、基本单元B
(tb,ub)、基本单元C(tc,uc)，基于第一分层表21中所存储的瞬时值的历史
信息，算出代表K个最新的瞬时值的代表值(例如，K个最新的瞬时值的平均
值或中值、或从K个最新的瞬时值除去最大值和最小值后的K-2个瞬时值的
平均值或中值等)。在此，将基本单元A(ta,ua)的代表值记作
Zestm(ta,ua)，基本单元B(tb,ub)的代表值记作Zestm(tb,ub)，基本单元C
(tc,uc)的代表值记作Zestm(tc,uc)。

处理单元32用这三个学习系数的代表值来确定所选择的基本单元A
(ta,ua)、基本单元B(tb,ub)、基本单元C(tc,uc)的各坐标与其各代表值之
间成立的一次多项式。即，如图2中所示，以作为轧制条件的宽度及厚度和
学习系数为各坐标轴的三维空间中，求通过坐标分别为
(ta,ua,Zestm(ta,ua))、(tb,ub,Zestm(tb,ub))、(tc,uc,Zestm(tc,uc))的
三个点的平面。此平面可通过满足下式而求得。

Zestm(t,u)＝a＊t+b＊u+c

在此，上述平面的表达式的系数a、b、c可通过满足以下条件来计算。

Zestm(ta,ua)＝a＊ta+b＊ua+c

Zestm(tb,ub)＝a＊tb+b＊ub+c

Zestm(tc,uc)＝a＊tc+b＊uc+c

在由上式确定的平面上学习系数的新近度、饱和度及稳定度的各基准得
到满足，这一点通过经验可得到确认。处理单元32对下一材料相应的基本单
元(t,u)，通过使用上式来进行多项式插值，从而计算出学习系数，由此，算
出满足新近度、饱和度及稳定度的学习系数的推定值。在此，将由处理单元
34计算出的学习系数的推定值记为Zestm(t,u)。

通过以上步骤，关于下一材料相应的基本单元(t,u)，获得了学习系数的
更新值Zmod(t,u)和学习系数的推定值Zestm(t,u)。处理单元35基于这两个
学习系数来算出下一材料的轧制条件下的学习系数的使用值。更具体而言，
通过按照以下的加权平均的表达式用学习系数的推定值Zestm(t,u)来校正学
习系数的更新值Zmod(t,u)，从而决定学习系数的使用值。

Zuse(t,u)＝β＊Zmod(t,u)+(1-β)＊Zestm(t,u)

在此，Zuse(t,u)：学习系数的使用值。

β：加权系数(0≤β≤1)

若学习系数的更新值Zmod(t,u)的新近度、饱和度、稳定度良好，则处理
单元35通过增大加权系数β的值来对学习系数的更新值Zmod(t,u)进行加
权。相反，若学习系数的估计值Zestm(t,u)的新近度、饱和度、稳定度良
好，则通过减小加权系数β的值来对学习系数的估计值Zestm(t,u)进行加
权。加权系数β的决定方法的例子如下所示。

β＝1.0(当更新值Zmod(t,u)同时满足了新近度、饱和度、稳定度时)

β＝0.6(当更新值Zmod(t,u)满足了新近度、饱和度、稳定度中的两个时)

β＝0.4(当更新值Zmod(t,u)满足了新近度、饱和度、稳定度中的一个时)

β＝0.0(当更新值Zmod(t,u)没满足新近度、饱和度、稳定度中的任何一个
时)

处理单元36根据由处理单元35算出的学习系数的使用值来校正模型公
式。由此，力图提高基于模型公式的预测计算精度。然后，使用校正后的模
型公式进行设定计算，以决定轧制装置的机器设定值。通过根据由此而定的
设定值来扫描各机器，能够改善成品质量的精度以及操作的稳定性。

以上对本发明的实施方式进行了说明。然而，本发明并不限定于上述实
施方式，可以在不脱离本发明宗旨的前提下作出各种改变。例如，由基本单
元区分的轧制条件可以超过两项。虽然在上述实施方式中轧制条件为宽度和
厚度这两项，但也可以使轧制条件为三项以上、通过三维以上的多维数据库
来管理学习系数。若轧制条件为三项，则可以通过在以轧制条件为轴的三维
空间中从满足了新近度、饱和度及稳定度的基本单元中按顺序提取出四个在
空间距离上距对象基本单元较近的基本单元，再用多项式插值来算出对象基
本单元中的学习系数的推定值。

再者，在上述实施方式中，处理单元12相当于瞬时值计算记录单元，处
理单元13相当于更新值计算记录单元，处理单元14相当于新近度评价单
元，处理单元15相当于饱和度评价单元，处理单元16相当于稳定度评价单
元。另外，处理单元31相当于附近基本单元选定单元，处理单元32相当于
推定值计算单元，处理单元34、35相当于使用值决定单元。在构成本学习控
制装置1的计算机的存储器中，各处理单元所对应的例程作为一个程序来进
行存储。通过由计算机的处理器执行该程序，从而计算机起到各处理单元的
功能。

标号说明

1...学习控制装置

10...学习装置

20...存储装置(数据库)

21、22、23、24、25...分层表

30...设定计算装置