用于技术系统的计算机辅助分析的方法.pdf

上传人:a2 文档编号:1036147 上传时间:2018-03-27 格式:PDF 页数:14 大小:606.25KB
返回 下载 相关 举报
摘要
申请专利号:

CN201110201748.4

申请日:

2011.07.19

公开号:

CN102339347A

公开日:

2012.02.01

当前法律状态:

撤回

有效性:

无权

法律详情:

发明专利申请公布后的视为撤回IPC(主分类):G06F 17/50申请公布日:20120201|||实质审查的生效IPC(主分类):G06F 17/50申请日:20110719|||公开

IPC分类号:

G06F17/50

主分类号:

G06F17/50

申请人:

西门子公司

发明人:

M. 卡林金; B. 兰; A. 洛吉诺夫

地址:

德国慕尼黑

优先权:

2010.07.19 RU 2010130189

专利代理机构:

中国专利代理(香港)有限公司 72001

代理人:

王岳;卢江

PDF下载: PDF下载
内容摘要

本发明涉及一种用于技术系统的计算机辅助分析的方法,其中技术系统由包括多个案例的案例库描述,其中每个案例包括状态向量,状态向量指示技术系统的操作状态,多个类之中的类被分配给每个案例,每个类指示技术系统的操作状况。在第一,通过针对每个案例根据案例库中的一个或多个相邻案例的类提取局部信息向量,处理案例库中的每个案例,相邻案例与根据邻近性测量标准处理的案例相似。在本发明的第二步骤中,基于案例库中的案例的提取的局部信息向量执行分类的机器学习,导致学习的自适应函数,自适应函数提供依赖于针对案例提取的局部信息向量的类。

权利要求书

1: 一种用于技术系统 (GT) 的计算机辅助分析的方法, 所述技术系统 (GT) 由包括多 个案例 (C) 的案例库 (CB) 描述, 其中每个案例 (C) 包括具有多个属性的状态向量 (SV), 所 述状态向量 (SV) 指示技术系统 (GT) 的操作状态, 并且其中多个类 (CL,CL1,CL2) 之中的类 (CL,CL1,CL2) 被分配给每个案例 (C), 每个类 (CL,CL1,CL2) 指示所述技术系统 (GT) 的操 作状况, 所述方法包括下述步骤 : i) 通 过 针 对 每 个 案 例 (C) 根 据 案 例 库 (CB) 中 的 一 个 或 多 个 相 邻 案 例 (NC) 的 类 (CL,CL1,CL2) 提取局部信息向量 (LI), 处理案例库 (CB) 中的每个案例 (C), 所述相邻案例 (NC) 与根据邻近性测量标准处理的案例 (C) 相似 ; ii) 基于案例库 (CB) 中的案例 (C) 的所述提取的局部信息向量 (LI) 的分类的机器学 习, 导致学习的自适应函数 (AF), 该自适应函数 (AF) 提供依赖于针对案例 (C) 提取的局部 信息向量 (LI) 的类 (CL,CL1,CL2)。
2: 根据权利要求 1 所述的方法, 其中由案例库 (CB) 描述的技术系统 (GT) 是涡轮机, 具体地讲, 是用于发电的燃气涡轮机。
3: 根据权利要求 1 或 2 所述的方法, 其中状态向量 (SV) 的所述多个属性包括传感器 数据 (SD) 和 / 或技术系统 (GT) 的一项或多项规格和 / 或从传感器数据 (SD) 提取的特征。
4: 根据前面权利要求之一所述的方法, 其中步骤 i) 中使用的邻近性测量标准代表两 个案例的状态向量 (SV) 之间的距离, 从所述状态向量 (SV) 的多个属性获得所述距离。
5: 根据权利要求 4 所述的方法, 其中案例库 (CB) 之中的至少一个案例 (C) 的局部 信息向量 (LI) 包括所述多个类 (CL,CL1,CL2) 中的每个类 (CL,CL1,CL2) 的条目, 其中 类 (CL,CL1,CL2) 的条目是所述至少一个案例 (C) 的状态向量 (SV) 和在所述条目的类 (CL,CL1,CL2) 中分类的案例的状态向量之间的最小距离。
6: 根据前面权利要求之一所述的方法, 其中案例库 (CB) 之中的至少一个案例 (C) 的 局部信息向量 (LI) 包括所述多个类 (CL,CL1,CL2) 中的每个类 (CL,CL1,CL2) 的条目, 其中 对于与所述至少一个案例 (C) 最相似的相邻案例 (NC) 的类而言所述条目是一, 而其中否则 所述条目是零。
7: 根据前面权利要求之一所述的方法, 其中与正在处理的案例 (C) 最相似的预定数 量的案例 (NC) 在步骤 i) 中用作所述一个或多个相邻案例 (NC)。
8: 根据权利要求 7 所述的方法, 其中案例库 (CB) 之中的至少一个案例 (C) 的局部信 息向量 (LI) 包括下面的向量之一 : - 包括所述预定数量的案例 (NC) 中的每个案例 (NC) 的条目的向量, 其中所述条目是分 配给所述条目的案例 (C) 的类 (CL,CL1,CL2) ; - 包括所述多个类 (CL,CL1,CL2) 中的每个类 (CL,CL1,CL2) 的条目的向量, 其中所述条 目是所述预定数量的案例 (NC) 之中在所述条目的类中分类的案例 (NC) 的计数。
9: 根据前面权利要求之一所述的方法, 结合权利要求 4 和 7, 其中案例库 (CB) 之中 的至少一个案例 (C) 的局部信息向量 (LI) 包括所述多个类 (CL,CL1,CL2) 中的每个类 (CL,CL1,CL2) 的条目, 其中所述条目包括所述预定数量的案例 (NC) 之中在所述条目的类 (CL,CL1,CL2) 中分类的案例 (NC) 的权重因数的总和, 每个权重因数是所述预定数量的案 例 (NC) 之中在所述条目的类 (CL,CL1,CL2) 中分类的各案例 (NC) 的状态向量和所述至少 一个案例 (C) 的状态向量 (SV) 之间的距离的倒数。 2
10: 根据前面权利要求之一所述的方法, 其中步骤 ii) 中的机器学习包括下面学习方 法中的一种或多种 : - 学习人工神经网络, 具体地讲, 多层感知 ; - 基于决策树进行学习, 具体地讲, 基于分类回归树进行学习 ; - 使用遗传规划基于分类规则进行学习。
11: 根据前面权利要求之一所述的方法, 其中所述多个类 (CL,CL1,CL2) 包括两个类, 一个类 (CL1) 指示技术系统 (GT) 的正常操作状况, 而另一个类 (CL2) 指示技术系统 (GT) 的异常操作状况。
12: 根据前面权利要求之一所述的方法, 其中提供指示技术系统 (GT) 的不同操 作体系的几个案例库 (CB), 通过权利要求 1 的步骤 i) 和 ii) 分开地处理每个案例库 (CB,CB1,CB2)。
13: 根据权利要求 12 所述的方法, 结合权利要求 2, 其中一个操作体系指示涡轮机的 起始阶段, 而另一操作体系指示在起始阶段之后的涡轮机的操作。
14: 一种用于技术系统 (GT) 的计算机辅助诊断的方法, 其中按照通过根据前面权利 要求之一所述的方法学习的分类对包括指示技术系统 (GT) 的操作期间技术系统 (GT) 的当 前操作状态的状态向量 (SV) 的未分类的案例 (UC) 分类, 其中为了应用该分类, 针对该未分 类的案例提取局部信息向量 (LI)。
15: 根据权利要求 14 所述的方法, 其中在所述案例 (NV) 已被分类之后把未分类的案 例 (UC) 添加到案例库 (CB)。
16: 根据权利要求 14 或 15 所述的方法, 结合根据权利要求 12 学习的分类, 其中在技 术系统 (GT) 的操作期间检测技术系统 (GT) 的操作体系, 并且按照检测的操作体系的案例 库 (CB) 的学习的分类对未分类的案例 (UC) 分类。
17: 一种技术系统, 其中布置所述技术系统 (GT) 从而在技术系统 (GT) 的操作期间执 行根据权利要求 14 至 16 之一所述的用于诊断的方法。
18: 一种计算机程序产品, 可直接载入到数字计算机的内部存储器中, 包括用于当在 计算机上运行所述产品时执行根据权利要求 1 至 16 之一所述的方法的软件代码部分。

说明书


用于技术系统的计算机辅助分析的方法

    技术领域 本发明涉及一种用于技术系统的计算机辅助分析的方法和一种用于技术系统的 计算机辅助诊断的方法。另外, 本发明涉及一种技术系统和一种计算机程序产品。
     背景技术 在技术系统 ( 像是用于发电的涡轮机, 特别地, 燃气涡轮机 ) 中, 极为重要的是, 在 早期阶段检测故障或缺陷从而在涡轮机失灵之前能够替换零件。传统上, 技术系统的操作 者在固定间隔执行预防性维护工作以便避免潜在的系统失灵。
     近来, 技术系统 ( 特别地, 燃气涡轮机 ) 的制造商使用计算机辅助状况监控方法, 其中采用智能数据分析系统评估技术系统的操作并在系统完全失灵之前检测故障和缺陷。 为了执行这种状况监控, 许多传感器被安装在技术系统中, 这些传感器收集系统的操作数 据并把这种数据发送给监控中心。在监控中心, 由操作员在基于规则的专家系统的帮助下 预处理并分析传感器数据。然而, 基于规则的专家系统具有一些缺点。这种系统的可维护
     性差。由于技术系统的复杂结构和大量的传感器信息, 用于监控系统的状况的规则的数量 通常很大。另外, 新规则必须由工程师手工添加。这通常是非常令人疲倦的过程, 因为必须 避免与其它规则的各种矛盾和冗余。此外, 基于规则的专家系统的结果经常不是很精确。 发明内容
     本发明的目的在于提供一种用于技术系统的计算机辅助分析的方法, 基于该方 法, 能够提供技术系统的良好而精确的诊断。
     这个目的由独立专利权利要求解决。本发明的优选实施例描述于从属权利要求 中。
     本发明的方法能够实现技术系统的计算机辅助分析, 所述技术系统由包括多个案 例的案例库 (case base) 描述, 其中每个案例包括具有多个属性的状态向量, 所述状态向量 指示技术系统的操作状态, 并且其中多个类 (class) 之中的类被分配给每个案例, 每个类指 示所述技术系统的操作状况。因此, 用于描述该技术系统的案例库形成指示已知和 / 或以 前的测量或感测的操作状态的数字数据的储存库。 这些操作状态可由技术系统中所包括的 各传感器检测或者可指示该系统的特定技术参数。
     本发明的方法包括步骤 i), 其中通过针对每个案例根据案例库中的一个或多个 相邻案例的类提取局部信息向量, 处理案例库中的每个案例, 所述相邻案例与根据邻近 性测量标准 (neighborhood measure)处理的案例相似。在步骤 ii) 中, 通过基于案例 库中的案例的所述提取的局部信息向量的机器学习来学习分类, 导致学习的自适应函数 (adaptation function) , 该自适应函数提供依赖于针对案例提取的局部信息向量的类。 应 该在本发明的上下文中广泛地解释术语 “状态向量” 和 “局部信息向量” 。即, 这种向量可仅 包括单个条目 (entry) , 且因此形成标量值。
     本发明的思想基于从常规案例式推理已知的相邻案例的提取与基于相邻案例的类学习自适应函数的机器学习方法的组合。 结果, 提供了学习的分类, 该学习的分类适应于 用于描述技术系统的特定案例库。 因此, 该分析方法很好地适应于所考虑的技术系统, 从而 提供了良好的分类结果, 并因此提供了技术系统的操作状况的良好评估。
     本发明的方法可用于分析不同的技术系统。在优选实施例中, 由案例库描述的技 术系统是涡轮机, 具体地讲, 是用于发电的燃气涡轮机。在这种涡轮机中, 指示操作状态的 状态向量的属性可例如包括 : 在操作期间涡轮机中的温度的分布和 / 或在涡轮机中的各种 位置发生的气压和 / 或涡轮机中的振动和 / 或燃气的消耗量和 / 或涡轮机的产生的电力和 / 或涡轮机的效率等。通常, 状态向量的所述多个属性可包括 : 由对应技术系统中的传感器 检测的传感器数据和 / 或技术系统的一项或多项 ( 已知 ) 规格和 / 或从传感器数据提取的 特征。这些特征可以是通过已知统计或机器学习技术从原始传感器数据获得的高级特征。
     在本发明的另一优选实施例中, 步骤 i) 中使用的邻近性测量标准代表两个案例 的状态向量之间的距离, 从所述状态向量的多个属性获得所述距离。
     在本发明的方法的步骤 i) 中提取的局部信息向量基于相邻案例的类。存在几种 定义合适的局部信息向量的可能性。在本发明的一个实施例中, 案例库之中的至少一个案 例 ( 具体地讲, 每个案例 ) 的局部信息向量包括所述多个类中的每个类的条目, 其中类的条 目是所述至少一个案例的状态向量和在所述条目的类中分类的案例的状态向量之间的最 小距离。在另一实施例中, 案例库之中的至少一个案例 ( 具体地讲, 每个案例 ) 的局部信息 向量包括所述多个类中的每个类的条目, 其中对于根据邻近性测量标准与所述至少一个案 例最相似的相邻案例的类而言所述条目是一, 而其中否则所述条目是零。
     在本发明的另一实施例中, 与正在处理的案例最相似的预定数量的案例在步骤 i) 中用作所述一个或多个相邻案例。这个实施例指示公知的 k 个最近邻居 (neighbor) 的方 法。在这个实施例的优选变型中, 案例库之中的至少一个案例 ( 具体地讲, 每个案例 ) 的局 部信息向量包括下面的向量之一 : - 包括所述预定数量的案例中的每个案例的条目的向量, 其中所述条目是分配给所述 条目的案例的类 ; - 包括所述多个类中的每个类的条目的向量, 其中所述条目是所述预定数量的案例之 中在所述条目的类中分类的案例的计数。
     在本发明的另一变型中, 案例库之中的至少一个案例 ( 具体地讲, 每个案例 ) 的局 部信息向量包括所述多个类中的每个类的条目, 其中所述条目包括所述预定数量的案例之 中在所述条目的类中分类的案例的权重因数的总和, 每个权重因数是所述预定数量的状态 向量之中在所述条目的类中分类的各案例的状态向量和所述至少一个案例的状态向量之 间的距离的倒数 (reciprocal) 。
     在本发明的方法的步骤 ii) 中可使用不同的机器学习方法。在优选实施例中, 应 用下面学习方法中的一种或多种 : - 学习人工神经网络, 具体地讲, 多层感知 ; - 基于决策树进行学习, 具体地讲, 基于分类回归树进行学习 ; - 使用遗传规划基于分类规则进行学习。
     以上学习方法在本领域中是公知的, 因此不对其进行详细描述。
     如上所述, 在本发明的方法中使用的所述多个类指示技术系统的操作状况。根据特定系统可定义不同的操作状况。 在优选实施例中, 所述多个类包括两个类, 一个类指示技 术系统的正常操作状况, 而另一个类指示技术系统的异常操作状况。
     在本发明的另一变型中, 提供指示技术系统的不同操作体系 (regime) 的几个案例 库, 通过根据本发明的步骤 i) 和 ii) 分开地处理每个案例库。结果, 技术系统的分析适应 于不同操作环境, 导致更精确的分析。 在技术系统是涡轮机的优选实施例中, 一个操作体系 指示涡轮机的起始阶段, 而另一操作体系指示在起始阶段之后的涡轮机的操作。这两种体 系的案例库通常非常不同, 从而通过分开地处理这些体系能够实现更好的结果。
     上述用于分析技术系统的方法提供具有可用于技术系统的诊断的自适应函数的 形式的学习的分类。 因此, 本发明也涉及用于技术系统的计算机辅助诊断的方法, 其中按照 通过本发明的分析方法学习的分类对包括指示技术系统的操作期间技术系统的当前操作 状态的状态向量的未分类的案例分类, 其中为了应用该分类, 通过使用在该分类的学习阶 段期间还已使用的合适的提取方法针对该未分类的案例提取局部信息向量。
     在这种方法的优选实施例中, 在所述案例已被分类之后把未分类的案例添加到案 例库。因此, 通过在技术系统的操作期间发生的新分类的案例持续更新案例库。因此, 案例 库持续增长, 从而有益地按照规则间隔重复分类的上述学习以便使分析适应于案例库中的 新案例。 在本发明的另一实施例中, 用于技术系统的诊断的方法与针对不同操作体系学习 的分类结合。 在这种实施例中, 在技术系统的操作期间检测技术系统的操作体系, 并且按照 检测的操作体系的案例库的学习的分类对未分类的案例分类。
     除了上述方法之外, 本发明还涉及一种技术系统, 其中布置所述技术系统从而在 技术系统的操作期间执行以上用于诊断的方法。
     另外, 本发明涉及一种可直接载入到数字计算机的内部存储器中的计算机程序产 品, 该计算机程序产品包括软件代码部分, 用于当在计算机上运行所述产品时执行用于分 析技术系统的本发明的方法或用于技术系统的诊断的本发明的方法。
     附图说明
     现在将参照附图描述本发明的实施例, 其中 图 1 显示示图, 表示基于根据本发明实施例学习的分类的技术系统的诊断的步骤 ; 图 2 是表示根据本发明实施例用于学习分类的步骤的示图 ; 图 3 是表示基于图 2 中学习的分类的新案例的诊断的步骤的示图 ; 以及 图 4 表示用于测试根据本发明的分类方法的数据集。 具体实施方式
     本发明的方法涉及技术系统的分析。这种方法的结果是学习的分类, 该学习的分 类用于对测量或检测的技术系统的操作状态分类, 由此导致一种在技术系统的操作期间用 于技术系统的诊断的方法。 图 1 显示应用于燃气涡轮机 GT 的这种诊断的方法的实施例。 首 先, 以预定时间间隔收集在燃气涡轮机的操作期间的对应传感器数据 SD。这种原始时间序 列传感器数据在下一步骤中被变换成高级区别特征, 导致以预定时间间隔描述技术系统的 操作状态的状态向量 SV。每个状态向量形成将要根据该诊断方法进行分类的 ( 未分类的 )案例。为了从传感器数据 SD 提取具有状态向量 SV 的形式的特征, 可以使用任何公知的统 计或机器学习技术。
     在已提取该高级特征之后, 检测燃气涡轮机 GT 的操作体系。这种操作体系描述操 作燃气涡轮机 GT 的操作环境。典型操作环境是燃气涡轮机的起始阶段以及燃气涡轮机的 正常操作环境或其它体系。体系检测的步骤由图 1 中的 RD 指示。任何已知的用于模式识 别的方法可用于从状态向量 SV 检测体系。具体地讲, 机器学习分类技术 ( 像是神经网络、 支持向量机或决策树 ) 可用于确定燃气涡轮机 GT 的当前操作体系。对于每个体系, 存在案 例式专家系统, 其中两个案例式专家系统 CE1 和 CE2 显示在图 1 中。案例式专家系统 CE1 指示燃气涡轮机 GT 的起始体系, 而案例式专家系统 CE2 指示燃气涡轮机 GT 的正常操作体 系。 每个案例式专家系统形成关于指示具有已知的类的以前测量的操作状态的案例的训练 数据而学习的学习分类, 在对应的案例式专家系统的体系中检测所述操作状态。 因此, 对于 每个专家系统, 各个体系中的分类的案例的对应案例库用于学习分类。以下将更详细地描 述学习对应分类的方法。
     在图 1 显示的实施例中, 所有案例式专家系统的分类基于两个类, 即由 CL1 指示的 用于燃气涡轮机的正常行为的类和指示为 CL2 的用于燃气涡轮机的异常行为的类。异常行 为是指指示在燃气涡轮机的操作中可能存在故障的行为。基于在步骤 RD 中检测的体系的 案例式专家系统, 在图 1 的诊断步骤 D 中确定状态向量 SV 的类。结果, 确定燃气涡轮机 GT 的状态向量 SV 指示根据类 CL1 的正常行为还是根据类 CL2 的异常行为。在检测到异常行 为的情况下, 可启动相应对策, 例如, 可输出警报或者可启动燃气涡轮机的技术检查。 在下面, 参照图 2 详细描述如图 1 中所示用于学习对应案例式专家系统的方法。 该方法使用所谓案例式推理 (cased-based reasoning) 的特征, 其中作为训练数据的多个 案例的案例库用于推理 ( 即, 推导 ) 作为在图 1 的方案中在燃气涡轮机 GT 的操作期间检 测的状态向量 SV 的新案例的类。通常, 存在涉及案例式推理的现有技术中已知的几种方 法。文件 [1] 提出了一种混合法, 该方法组合案例式推理和神经网络 ( 即, 径向基网络 ) 以便预测大洋水的热结构。这种方法涉及回归问题。在学习阶段, 对于每个案例关于检索 的邻居 ( 即, 相似案例 ) 训练径向基网络。在测试阶段, 径向基网络用作从最近邻居的解 (solution) 获得最具代表性的解的函数。如下面所描述的本发明的方法与文件 [1] 的方法 具有相似性。然而, 与文件 [1] 相反, 使用本发明的方法以便学习分类并且本发明的方法基 于不同的自适应模型。
     如图 2 中所示, 如下面所描述的方法使用包括多个案例 C 的案例库 CB, 每个案例 包括指示将要研究的技术系统 ( 例如, 如图 1 中所示的燃气涡轮机 GT) 的测量的操作状态 的对应状态向量 SV。换句话说, 案例 x 由 l 维空间 <α 1(x ),α 2(x ),…α l (x ),> 中的状态向 量或点表示。这里, l 是属性的数量, 每个属性形成案例库 CB 中所包括的状态向量的条目。 对于案例库 CB 中的每个案例, 由变量 c (x ) 表示的类 CL 被分配给这个案例。这个类属于可 能的类的集合 c 1,c 2,… ,c m , 其中 m 是可能的类的总数。在图 1 显示的学习方法中, 对于案 neigh neigh neigh 例库 CB 中的每个案例, 从案例库检索 k 个最近邻居 x 1 , x2 ,… , xk ( 即, 案例库中 neigh 与当前正在处理的案例最相似的 k 个案例 )。根据以上表示法, x1 是最近的相邻案例, neigh neigh x2 是第二最近的相邻案例, 而 xk 是最远的相邻案例。为了描述案例之间的相似性或 邻近性, 定义由某一度量 (metric) ( 例如, 欧几里得度量 ) 测量的距离。两个案例之间的距
     离越小, 两个案例之间的邻近性和相似性越高。
     在本文描述的实施例中, 使用下面的距离作为邻近性测量标准以便描述案例 x 和 neigh 案例 x i 之间的相似性 : 。
     根据以上方程, 基于两个案例的属性的欧几里得距离用于描述两个案例的相似性。 在不使用用于学习分类的方法的常规方法中, 使用如以上所述从案例库检索的 k 个最近邻居以便确定还未分类的新案例的类。 为此, 对于未分类的新案例c (x ), 检索的案例 neigh neigh c (x i ) 和与它们的距离d (x , xi ) 用于预测c (x ), 即对未分类的案例分类。 如果找到完 neigh neigh 全相同的案例 x j , 即如果 d (x , xj )=0, 则通常如下设置新案例的类 : c (x )= c(x jneigh )。 然而, 如果如绝大多数情况下那样没有找到准确的匹配, 则能够使用针对新案例 c (x ) 检索 的 k 个最近邻居通过下面的常规自适应策略检索这个类 : - 常规的最近邻居规则 :
     , 其中, 如果 i =j 则 δ (i ,j )=1, 而如果 i ≠ j 则 δ (i ,j )=0, - 常规的多数表决 (majority voting) 规则 :,- 常规的加权多数表决 :。然而, 以上常规策略取决于使用的数据集, 在可以充分地应用于不同数据集的意 义上, 没有常规方法是通用的。与之相反, 本发明的思想不是固定自适应策略, 而是针对具 有形成训练数据的对应案例库的形式的每个数据集自适应地学习自适应策略。 根据下面描 述的实施例, 使用三种不同的机器学习算法以便基于案例库 CB 学习分类。为了应用该学习 方法, 在图 2 显示的第一步骤 S1 中, 在案例库 CB 中针对每个案例检索基于以上距离的对应 最近相邻案例 NC。对于针对每个案例获得的最近邻居的每个集合, 确定对应的局部信息向 量 LI, 基于该局部信息向量 LI 执行学习方法。根据不同的实施例, 可以通过不同的方法提 取局部信息向量 LI。根据本发明可使用的局部信息向量的例子如下 : - 基于邻居的类并如下定义的局部信息向量 :
     8102339347 A CN 102339360说明书。6/9 页这个信息向量包括案例 x 的 k 个最近邻居中的每个邻居的条目, 其中该条目代表 各个最近邻居的类。
     - 基于最小距离并如下定义的局部信息向量 :
     。
     这个信息向量包括每个可能的类的条目, X i 是分配给类 c i 的案例库的所有案例的 - 基于最近邻居并如下定义的局部信息向量 : 。集合。
     这个向量具有每个可能的类的条目, 其中非零元素的索引 (index) 等于与针对其 检索局部信息的案例最相似的相邻案例的类。例如, 如果一共存在四个类并且对于某个案 例而言最相似的案例的类为二, 则以上向量将会看起来如下 : [0,1,0,0]。这种策略类似于 常规的最近邻居规则。
     - 基于多数并如下定义的局部信息向量 :
     。 这个局部信息向量具有每个可能的类的条目, 其中该条目表示分配给各个类的最 近邻居的案例的计数。
     - 基于加权多数并如下定义的局部信息向量 :
     。 这个向量包括每个可能的类的条目, 其中每个条目是在各个类中分类的相邻案例 的权重因数的总和, 每个相邻案例的权重因数定义为以上定义的距离 d (x , xineigh ) 的倒数。 这种策略类似于常规加权多数规则。
     在如图 2 中所示已提取局部信息 LI 之后, 在步骤 S2 中使用合适的机器学习方法 以便学习案例自适应函数 AF, 其中学习的自适应函数提供依赖于局部信息向量并因此依赖 于已针对其提取局部信息向量的案例的类。
     在下面, 将描述根据本发明可使用的三种机器学习方法。这些机器学习方法本身 是公知的, 从而将不会详细解释这些方法。
     作为第一机器学习方法, 可使用人工神经网络, 具体地讲, 可使用前馈神经网 络。这些网络是在许多领域具有成功应用的仿生函数逼近算法 (biologically inspired
     function approximation algorithm) 。 在本发明的一个实施例中, 基本的多层感知模型用 作包括一系列函数变换的神经网络。多层感知包括输入层、 输出层和多个隐藏层。在本发 明的一种实现方式中, 使用在第一隐藏层中具有 H 个 sigmoid(S形) 单元、 在第二隐藏层 中具有 L 个 sigmoid 单元以及具有单个线性输出单元的网络, 它能够由下面的函数 f(x) 描 述:。
     根据这个函数, 对于给定案例 x, 输出对应的类 f(x) 。在以上公式中, w 是网络可 调整参数 ( 权重 ) 的集合, σ 是 sigmoid 激活函数, 它定义为如下 : 。以上术语 α j(x) 指示案例 x 的局部信息向量的对应条目。
     在本发明的另一实施例中, 决策树用于自适应函数的机器学习。决策树本身是已 知的。在本发明的变型中, 所谓的分类回归树 ( 缩写为 CART) 用于学习自适应函数。在文 件 [2] 中详细描述了 CART 决策树。CART 决策树与其它决策树算法的主要差别在于数据的 二元分割。根据这种树, 更缓慢地分割数据, 允许对相同属性的重复分割, 因此与常规的决 策树相比导致 CART 决策树的更好的性能。
     在本发明的另一实施例中, 通过使用遗传规划 (genetic programming) 基于分类 规则学习自适应函数。在这种方法中, 在遗传算法的搜索能力的帮助下获得符号规则。在 文件 [3] 中存在对这种学习方法的描述。通过这种方法学习的规则表示为对属性的约束的 联合 (conjunction) 。规则的例子可看起来如下 :
     。 这里, A1 、 A 4 和 A 10 是对应局部信息向量 LI 的属性, class1 是预测的类。在学习阶 段期间, 使用遗传算法学习每个类的一个规则以调整数值边界和对属性的约束的数量。
     在如图 2 中所示已学习自适应函数 AF 之后, 在对应案例式专家系统中 ( 例如, 在 图 1 显示的案例式专家系统 CE1 或 CE2 中 ) 使用这个函数。图 3 显示学习的自适应函数 AF 如何应用于代表例如图 1 中显示的燃气涡轮机 GT 的状态向量 SV 的新的未分类的案例 UC。 首先, 通过使用对应的最近相邻案例 NC 在步骤 S1’ 中针对新案例 UC 提取对应的局部信息 向量 LI。这个局部信息向量 LI 在步骤 S2’ 中用作学习的自适应函数 AF 的输入, 因此导致 具有新案例的类的输出的形式的对新案例的诊断 D。
     基于上述具有神经网络、 CART 决策树或遗传规则的形式的机器学习以及基于上述 不同的局部信息向量 LI, 已由发明者针对不同数据集测试了本发明的对应实施例。用于测 试的数据集的一个例子包括位于矩形点阵的 400 个数据点。图 4 显示这个数据集的结构。 该数据集包括两个类, 即黑圆圈 B 和白圆圈 W。每个白点由黑点包围, 反之亦然。邻近性测
     量标准是如图 4 中所示的点阵中的两个点之间的距离。把本发明的方法与常规的自适应策 略 ( 即, 最近邻居规则、 多数表决规则和加权多数表决规则 ) 进行比较。对于这个数据集, 这些策略具有较差的性能。与之相反, 基于本发明实施例的自适应函数的学习导致良好的 结果。
     为了验证这些方法, 使用平均准确性测量。准确性计算为 : 正确预测的值的数量 ( 例如, 二元分类的准确正样例 (true positive) 和准确负样例的总和 ) 除以案例的总体数 量。使用交叉验证技术, 其中 80% 的数据用于训练, 而 20% 的数据用于测试。各个算法执行 五次。在预先执行数据集点的随机排列的情况下把实验重复 100 次。计算所有次执行的平 均准确性和标准偏差。与常规方法相比的本发明的实施例的结果显示在下面的表中 :。在表的左部给出本发明的实施例的结果, 在表的最后一列给出常规方法的对应结 果。对于不具有对应的常规策略的那些自适应策略, 在最后一列中不包括任何数字。显然, 对于每个学习方法以及对于每个类型的局部信息, 基于本发明的方法导致比常规方法的准 确性好得多的准确性。
     如前面所描述的本发明具有很多优点。具体地讲, 分类适当地适应于用于学习自 适应函数的案例库中的训练数据。本发明的方法组合了两种不同方法 ( 即, 用于提取局部 信息向量的案例式推理和具有神经网络或决策树或遗传规则的形式的基于模型的分类 ) 的优点。对于不同种类的训练数据, 这种组合工作良好。
     本发明的方法能够适应于技术系统的改变的环境, 例如, 涡轮机的零件随时间而 劣化并且新的装备也可以安装在涡轮机上。通过更新案例库并重复自适应函数的学习, 能 够考虑这些改变。结果, 如果环境改变, 则学习的自适应知识将会不同并且适合当前情况。 与常规的基于规则的系统相比, 根据本发明的方法的维护简单得多。 具体地讲, 在技术系统 的操作期间能够自动产生新案例, 并且能够容易地把新案例添加到已经存在的案例库。
     另外, 本发明的方法具有处理遗漏输入的能力。如果一个案例式专家系统用于具 有不同配置的技术系统, 则可能出现遗漏输入。 某一装备可能安装在一个技术系统上, 而在 其它技术系统上可能没有这一装备。与基于规则的专家系统相反, 基于本发明的案例式专 家系统能够容易地处理这种遗漏输入。
     文献 [1] Corchado J. M., Lees B., Fyfe C., Rees N. and Aiken J. (1998), Neuro-Adaptation Method for a Case Based Reason-ing System, International Joint Conference on Neural Networks, Anchorage, Alaska, USA. May 4-9. [2] Breiman et al., 1984, Classification and regression trees, Wadsworth, Belmont, pp. 1-58.
     [3] Bojarczuk et al., Discovering comprehensible classifica-tion rules using genetic programming: a case study in a medical domain, in: Proceedings of the GECCO'99, Morgan Kaufmann, San Francisco, 1999, pp. 953-958.

用于技术系统的计算机辅助分析的方法.pdf_第1页
第1页 / 共14页
用于技术系统的计算机辅助分析的方法.pdf_第2页
第2页 / 共14页
用于技术系统的计算机辅助分析的方法.pdf_第3页
第3页 / 共14页
点击查看更多>>
资源描述

《用于技术系统的计算机辅助分析的方法.pdf》由会员分享,可在线阅读,更多相关《用于技术系统的计算机辅助分析的方法.pdf(14页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN102339347A43申请公布日20120201CN102339347ACN102339347A21申请号201110201748422申请日20110719201013018920100719RUG06F17/5020060171申请人西门子公司地址德国慕尼黑72发明人M卡林金B兰A洛吉诺夫74专利代理机构中国专利代理香港有限公司72001代理人王岳卢江54发明名称用于技术系统的计算机辅助分析的方法57摘要本发明涉及一种用于技术系统的计算机辅助分析的方法,其中技术系统由包括多个案例的案例库描述,其中每个案例包括状态向量,状态向量指示技术系统的操作状态,多个类之中的类被分配。

2、给每个案例,每个类指示技术系统的操作状况。在第一,通过针对每个案例根据案例库中的一个或多个相邻案例的类提取局部信息向量,处理案例库中的每个案例,相邻案例与根据邻近性测量标准处理的案例相似。在本发明的第二步骤中,基于案例库中的案例的提取的局部信息向量执行分类的机器学习,导致学习的自适应函数,自适应函数提供依赖于针对案例提取的局部信息向量的类。30优先权数据51INTCL19中华人民共和国国家知识产权局12发明专利申请权利要求书2页说明书9页附图2页CN102339360A1/2页21一种用于技术系统GT的计算机辅助分析的方法,所述技术系统GT由包括多个案例C的案例库CB描述,其中每个案例C包括具。

3、有多个属性的状态向量SV,所述状态向量SV指示技术系统GT的操作状态,并且其中多个类CL,CL1,CL2之中的类CL,CL1,CL2被分配给每个案例C,每个类CL,CL1,CL2指示所述技术系统GT的操作状况,所述方法包括下述步骤I通过针对每个案例C根据案例库CB中的一个或多个相邻案例NC的类CL,CL1,CL2提取局部信息向量LI,处理案例库CB中的每个案例C,所述相邻案例NC与根据邻近性测量标准处理的案例C相似;II基于案例库CB中的案例C的所述提取的局部信息向量LI的分类的机器学习,导致学习的自适应函数AF,该自适应函数AF提供依赖于针对案例C提取的局部信息向量LI的类CL,CL1,CL。

4、2。2根据权利要求1所述的方法,其中由案例库CB描述的技术系统GT是涡轮机,具体地讲,是用于发电的燃气涡轮机。3根据权利要求1或2所述的方法,其中状态向量SV的所述多个属性包括传感器数据SD和/或技术系统GT的一项或多项规格和/或从传感器数据SD提取的特征。4根据前面权利要求之一所述的方法,其中步骤I中使用的邻近性测量标准代表两个案例的状态向量SV之间的距离,从所述状态向量SV的多个属性获得所述距离。5根据权利要求4所述的方法,其中案例库CB之中的至少一个案例C的局部信息向量LI包括所述多个类CL,CL1,CL2中的每个类CL,CL1,CL2的条目,其中类CL,CL1,CL2的条目是所述至少一。

5、个案例C的状态向量SV和在所述条目的类CL,CL1,CL2中分类的案例的状态向量之间的最小距离。6根据前面权利要求之一所述的方法,其中案例库CB之中的至少一个案例C的局部信息向量LI包括所述多个类CL,CL1,CL2中的每个类CL,CL1,CL2的条目,其中对于与所述至少一个案例C最相似的相邻案例NC的类而言所述条目是一,而其中否则所述条目是零。7根据前面权利要求之一所述的方法,其中与正在处理的案例C最相似的预定数量的案例NC在步骤I中用作所述一个或多个相邻案例NC。8根据权利要求7所述的方法,其中案例库CB之中的至少一个案例C的局部信息向量LI包括下面的向量之一包括所述预定数量的案例NC中的。

6、每个案例NC的条目的向量,其中所述条目是分配给所述条目的案例C的类CL,CL1,CL2;包括所述多个类CL,CL1,CL2中的每个类CL,CL1,CL2的条目的向量,其中所述条目是所述预定数量的案例NC之中在所述条目的类中分类的案例NC的计数。9根据前面权利要求之一所述的方法,结合权利要求4和7,其中案例库CB之中的至少一个案例C的局部信息向量LI包括所述多个类CL,CL1,CL2中的每个类CL,CL1,CL2的条目,其中所述条目包括所述预定数量的案例NC之中在所述条目的类CL,CL1,CL2中分类的案例NC的权重因数的总和,每个权重因数是所述预定数量的案例NC之中在所述条目的类CL,CL1,。

7、CL2中分类的各案例NC的状态向量和所述至少一个案例C的状态向量SV之间的距离的倒数。权利要求书CN102339347ACN102339360A2/2页310根据前面权利要求之一所述的方法,其中步骤II中的机器学习包括下面学习方法中的一种或多种学习人工神经网络,具体地讲,多层感知;基于决策树进行学习,具体地讲,基于分类回归树进行学习;使用遗传规划基于分类规则进行学习。11根据前面权利要求之一所述的方法,其中所述多个类CL,CL1,CL2包括两个类,一个类CL1指示技术系统GT的正常操作状况,而另一个类CL2指示技术系统GT的异常操作状况。12根据前面权利要求之一所述的方法,其中提供指示技术系统。

8、GT的不同操作体系的几个案例库CB,通过权利要求1的步骤I和II分开地处理每个案例库CB,CB1,CB2。13根据权利要求12所述的方法,结合权利要求2,其中一个操作体系指示涡轮机的起始阶段,而另一操作体系指示在起始阶段之后的涡轮机的操作。14一种用于技术系统GT的计算机辅助诊断的方法,其中按照通过根据前面权利要求之一所述的方法学习的分类对包括指示技术系统GT的操作期间技术系统GT的当前操作状态的状态向量SV的未分类的案例UC分类,其中为了应用该分类,针对该未分类的案例提取局部信息向量LI。15根据权利要求14所述的方法,其中在所述案例NV已被分类之后把未分类的案例UC添加到案例库CB。16根。

9、据权利要求14或15所述的方法,结合根据权利要求12学习的分类,其中在技术系统GT的操作期间检测技术系统GT的操作体系,并且按照检测的操作体系的案例库CB的学习的分类对未分类的案例UC分类。17一种技术系统,其中布置所述技术系统GT从而在技术系统GT的操作期间执行根据权利要求14至16之一所述的用于诊断的方法。18一种计算机程序产品,可直接载入到数字计算机的内部存储器中,包括用于当在计算机上运行所述产品时执行根据权利要求1至16之一所述的方法的软件代码部分。权利要求书CN102339347ACN102339360A1/9页4用于技术系统的计算机辅助分析的方法技术领域0001本发明涉及一种用于技。

10、术系统的计算机辅助分析的方法和一种用于技术系统的计算机辅助诊断的方法。另外,本发明涉及一种技术系统和一种计算机程序产品。背景技术0002在技术系统像是用于发电的涡轮机,特别地,燃气涡轮机中,极为重要的是,在早期阶段检测故障或缺陷从而在涡轮机失灵之前能够替换零件。传统上,技术系统的操作者在固定间隔执行预防性维护工作以便避免潜在的系统失灵。0003近来,技术系统特别地,燃气涡轮机的制造商使用计算机辅助状况监控方法,其中采用智能数据分析系统评估技术系统的操作并在系统完全失灵之前检测故障和缺陷。为了执行这种状况监控,许多传感器被安装在技术系统中,这些传感器收集系统的操作数据并把这种数据发送给监控中心。。

11、在监控中心,由操作员在基于规则的专家系统的帮助下预处理并分析传感器数据。然而,基于规则的专家系统具有一些缺点。这种系统的可维护性差。由于技术系统的复杂结构和大量的传感器信息,用于监控系统的状况的规则的数量通常很大。另外,新规则必须由工程师手工添加。这通常是非常令人疲倦的过程,因为必须避免与其它规则的各种矛盾和冗余。此外,基于规则的专家系统的结果经常不是很精确。发明内容0004本发明的目的在于提供一种用于技术系统的计算机辅助分析的方法,基于该方法,能够提供技术系统的良好而精确的诊断。0005这个目的由独立专利权利要求解决。本发明的优选实施例描述于从属权利要求中。0006本发明的方法能够实现技术系。

12、统的计算机辅助分析,所述技术系统由包括多个案例的案例库(CASEBASE)描述,其中每个案例包括具有多个属性的状态向量,所述状态向量指示技术系统的操作状态,并且其中多个类(CLASS)之中的类被分配给每个案例,每个类指示所述技术系统的操作状况。因此,用于描述该技术系统的案例库形成指示已知和/或以前的测量或感测的操作状态的数字数据的储存库。这些操作状态可由技术系统中所包括的各传感器检测或者可指示该系统的特定技术参数。0007本发明的方法包括步骤I,其中通过针对每个案例根据案例库中的一个或多个相邻案例的类提取局部信息向量,处理案例库中的每个案例,所述相邻案例与根据邻近性测量标准(NEIGHBORH。

13、OODMEASURE)处理的案例相似。在步骤II中,通过基于案例库中的案例的所述提取的局部信息向量的机器学习来学习分类,导致学习的自适应函数(ADAPTATIONFUNCTION),该自适应函数提供依赖于针对案例提取的局部信息向量的类。应该在本发明的上下文中广泛地解释术语“状态向量”和“局部信息向量”。即,这种向量可仅包括单个条目(ENTRY),且因此形成标量值。0008本发明的思想基于从常规案例式推理已知的相邻案例的提取与基于相邻案例的说明书CN102339347ACN102339360A2/9页5类学习自适应函数的机器学习方法的组合。结果,提供了学习的分类,该学习的分类适应于用于描述技术系。

14、统的特定案例库。因此,该分析方法很好地适应于所考虑的技术系统,从而提供了良好的分类结果,并因此提供了技术系统的操作状况的良好评估。0009本发明的方法可用于分析不同的技术系统。在优选实施例中,由案例库描述的技术系统是涡轮机,具体地讲,是用于发电的燃气涡轮机。在这种涡轮机中,指示操作状态的状态向量的属性可例如包括在操作期间涡轮机中的温度的分布和/或在涡轮机中的各种位置发生的气压和/或涡轮机中的振动和/或燃气的消耗量和/或涡轮机的产生的电力和/或涡轮机的效率等。通常,状态向量的所述多个属性可包括由对应技术系统中的传感器检测的传感器数据和/或技术系统的一项或多项已知规格和/或从传感器数据提取的特征。。

15、这些特征可以是通过已知统计或机器学习技术从原始传感器数据获得的高级特征。0010在本发明的另一优选实施例中,步骤I中使用的邻近性测量标准代表两个案例的状态向量之间的距离,从所述状态向量的多个属性获得所述距离。0011在本发明的方法的步骤I中提取的局部信息向量基于相邻案例的类。存在几种定义合适的局部信息向量的可能性。在本发明的一个实施例中,案例库之中的至少一个案例具体地讲,每个案例的局部信息向量包括所述多个类中的每个类的条目,其中类的条目是所述至少一个案例的状态向量和在所述条目的类中分类的案例的状态向量之间的最小距离。在另一实施例中,案例库之中的至少一个案例具体地讲,每个案例的局部信息向量包括所。

16、述多个类中的每个类的条目,其中对于根据邻近性测量标准与所述至少一个案例最相似的相邻案例的类而言所述条目是一,而其中否则所述条目是零。0012在本发明的另一实施例中,与正在处理的案例最相似的预定数量的案例在步骤I中用作所述一个或多个相邻案例。这个实施例指示公知的K个最近邻居(NEIGHBOR)的方法。在这个实施例的优选变型中,案例库之中的至少一个案例具体地讲,每个案例的局部信息向量包括下面的向量之一包括所述预定数量的案例中的每个案例的条目的向量,其中所述条目是分配给所述条目的案例的类;包括所述多个类中的每个类的条目的向量,其中所述条目是所述预定数量的案例之中在所述条目的类中分类的案例的计数。00。

17、13在本发明的另一变型中,案例库之中的至少一个案例具体地讲,每个案例的局部信息向量包括所述多个类中的每个类的条目,其中所述条目包括所述预定数量的案例之中在所述条目的类中分类的案例的权重因数的总和,每个权重因数是所述预定数量的状态向量之中在所述条目的类中分类的各案例的状态向量和所述至少一个案例的状态向量之间的距离的倒数(RECIPROCAL)。0014在本发明的方法的步骤II中可使用不同的机器学习方法。在优选实施例中,应用下面学习方法中的一种或多种学习人工神经网络,具体地讲,多层感知;基于决策树进行学习,具体地讲,基于分类回归树进行学习;使用遗传规划基于分类规则进行学习。0015以上学习方法在本。

18、领域中是公知的,因此不对其进行详细描述。0016如上所述,在本发明的方法中使用的所述多个类指示技术系统的操作状况。根据说明书CN102339347ACN102339360A3/9页6特定系统可定义不同的操作状况。在优选实施例中,所述多个类包括两个类,一个类指示技术系统的正常操作状况,而另一个类指示技术系统的异常操作状况。0017在本发明的另一变型中,提供指示技术系统的不同操作体系(REGIME)的几个案例库,通过根据本发明的步骤I和II分开地处理每个案例库。结果,技术系统的分析适应于不同操作环境,导致更精确的分析。在技术系统是涡轮机的优选实施例中,一个操作体系指示涡轮机的起始阶段,而另一操作体。

19、系指示在起始阶段之后的涡轮机的操作。这两种体系的案例库通常非常不同,从而通过分开地处理这些体系能够实现更好的结果。0018上述用于分析技术系统的方法提供具有可用于技术系统的诊断的自适应函数的形式的学习的分类。因此,本发明也涉及用于技术系统的计算机辅助诊断的方法,其中按照通过本发明的分析方法学习的分类对包括指示技术系统的操作期间技术系统的当前操作状态的状态向量的未分类的案例分类,其中为了应用该分类,通过使用在该分类的学习阶段期间还已使用的合适的提取方法针对该未分类的案例提取局部信息向量。0019在这种方法的优选实施例中,在所述案例已被分类之后把未分类的案例添加到案例库。因此,通过在技术系统的操作。

20、期间发生的新分类的案例持续更新案例库。因此,案例库持续增长,从而有益地按照规则间隔重复分类的上述学习以便使分析适应于案例库中的新案例。0020在本发明的另一实施例中,用于技术系统的诊断的方法与针对不同操作体系学习的分类结合。在这种实施例中,在技术系统的操作期间检测技术系统的操作体系,并且按照检测的操作体系的案例库的学习的分类对未分类的案例分类。0021除了上述方法之外,本发明还涉及一种技术系统,其中布置所述技术系统从而在技术系统的操作期间执行以上用于诊断的方法。0022另外,本发明涉及一种可直接载入到数字计算机的内部存储器中的计算机程序产品,该计算机程序产品包括软件代码部分,用于当在计算机上运。

21、行所述产品时执行用于分析技术系统的本发明的方法或用于技术系统的诊断的本发明的方法。附图说明0023现在将参照附图描述本发明的实施例,其中图1显示示图,表示基于根据本发明实施例学习的分类的技术系统的诊断的步骤;图2是表示根据本发明实施例用于学习分类的步骤的示图;图3是表示基于图2中学习的分类的新案例的诊断的步骤的示图;以及图4表示用于测试根据本发明的分类方法的数据集。具体实施方式0024本发明的方法涉及技术系统的分析。这种方法的结果是学习的分类,该学习的分类用于对测量或检测的技术系统的操作状态分类,由此导致一种在技术系统的操作期间用于技术系统的诊断的方法。图1显示应用于燃气涡轮机GT的这种诊断的。

22、方法的实施例。首先,以预定时间间隔收集在燃气涡轮机的操作期间的对应传感器数据SD。这种原始时间序列传感器数据在下一步骤中被变换成高级区别特征,导致以预定时间间隔描述技术系统的操作状态的状态向量SV。每个状态向量形成将要根据该诊断方法进行分类的未分类的说明书CN102339347ACN102339360A4/9页7案例。为了从传感器数据SD提取具有状态向量SV的形式的特征,可以使用任何公知的统计或机器学习技术。0025在已提取该高级特征之后,检测燃气涡轮机GT的操作体系。这种操作体系描述操作燃气涡轮机GT的操作环境。典型操作环境是燃气涡轮机的起始阶段以及燃气涡轮机的正常操作环境或其它体系。体系检。

23、测的步骤由图1中的RD指示。任何已知的用于模式识别的方法可用于从状态向量SV检测体系。具体地讲,机器学习分类技术像是神经网络、支持向量机或决策树可用于确定燃气涡轮机GT的当前操作体系。对于每个体系,存在案例式专家系统,其中两个案例式专家系统CE1和CE2显示在图1中。案例式专家系统CE1指示燃气涡轮机GT的起始体系,而案例式专家系统CE2指示燃气涡轮机GT的正常操作体系。每个案例式专家系统形成关于指示具有已知的类的以前测量的操作状态的案例的训练数据而学习的学习分类,在对应的案例式专家系统的体系中检测所述操作状态。因此,对于每个专家系统,各个体系中的分类的案例的对应案例库用于学习分类。以下将更详。

24、细地描述学习对应分类的方法。0026在图1显示的实施例中,所有案例式专家系统的分类基于两个类,即由CL1指示的用于燃气涡轮机的正常行为的类和指示为CL2的用于燃气涡轮机的异常行为的类。异常行为是指指示在燃气涡轮机的操作中可能存在故障的行为。基于在步骤RD中检测的体系的案例式专家系统,在图1的诊断步骤D中确定状态向量SV的类。结果,确定燃气涡轮机GT的状态向量SV指示根据类CL1的正常行为还是根据类CL2的异常行为。在检测到异常行为的情况下,可启动相应对策,例如,可输出警报或者可启动燃气涡轮机的技术检查。0027在下面,参照图2详细描述如图1中所示用于学习对应案例式专家系统的方法。该方法使用所谓。

25、案例式推理(CASEDBASEDREASONING)的特征,其中作为训练数据的多个案例的案例库用于推理即,推导作为在图1的方案中在燃气涡轮机GT的操作期间检测的状态向量SV的新案例的类。通常,存在涉及案例式推理的现有技术中已知的几种方法。文件1提出了一种混合法,该方法组合案例式推理和神经网络即,径向基网络以便预测大洋水的热结构。这种方法涉及回归问题。在学习阶段,对于每个案例关于检索的邻居即,相似案例训练径向基网络。在测试阶段,径向基网络用作从最近邻居的解(SOLUTION)获得最具代表性的解的函数。如下面所描述的本发明的方法与文件1的方法具有相似性。然而,与文件1相反,使用本发明的方法以便学习。

26、分类并且本发明的方法基于不同的自适应模型。0028如图2中所示,如下面所描述的方法使用包括多个案例C的案例库CB,每个案例包括指示将要研究的技术系统例如,如图1中所示的燃气涡轮机GT的测量的操作状态的对应状态向量SV。换句话说,案例X由L维空间中的状态向量或点表示。这里,L是属性的数量,每个属性形成案例库CB中所包括的状态向量的条目。对于案例库CB中的每个案例,由变量CX表示的类CL被分配给这个案例。这个类属于可能的类的集合C1,C2,CM,其中M是可能的类的总数。在图1显示的学习方法中,对于案例库CB中的每个案例,从案例库检索K个最近邻居X1NEIGH,X2NEIGH,XKNEIGH即,案例。

27、库中与当前正在处理的案例最相似的K个案例。根据以上表示法,X1NEIGH是最近的相邻案例,X2NEIGH是第二最近的相邻案例,而XKNEIGH是最远的相邻案例。为了描述案例之间的相似性或邻近性,定义由某一度量(METRIC)例如,欧几里得度量测量的距离。两个案例之间的距说明书CN102339347ACN102339360A5/9页8离越小,两个案例之间的邻近性和相似性越高。0029在本文描述的实施例中,使用下面的距离作为邻近性测量标准以便描述案例X和案例XINEIGH之间的相似性。0030根据以上方程,基于两个案例的属性的欧几里得距离用于描述两个案例的相似性。0031在不使用用于学习分类的方法。

28、的常规方法中,使用如以上所述从案例库检索的K个最近邻居以便确定还未分类的新案例的类。为此,对于未分类的新案例CX,检索的案例CXINEIGH和与它们的距离DX,XINEIGH用于预测CX,即对未分类的案例分类。如果找到完全相同的案例XJNEIGH,即如果DX,XJNEIGH0,则通常如下设置新案例的类CXCXJNEIGH。然而,如果如绝大多数情况下那样没有找到准确的匹配,则能够使用针对新案例CX检索的K个最近邻居通过下面的常规自适应策略检索这个类常规的最近邻居规则,其中,如果IJ则I,J1,而如果IJ则I,J0,常规的多数表决(MAJORITYVOTING)规则,常规的加权多数表决。0032然。

29、而,以上常规策略取决于使用的数据集,在可以充分地应用于不同数据集的意义上,没有常规方法是通用的。与之相反,本发明的思想不是固定自适应策略,而是针对具有形成训练数据的对应案例库的形式的每个数据集自适应地学习自适应策略。根据下面描述的实施例,使用三种不同的机器学习算法以便基于案例库CB学习分类。为了应用该学习方法,在图2显示的第一步骤S1中,在案例库CB中针对每个案例检索基于以上距离的对应最近相邻案例NC。对于针对每个案例获得的最近邻居的每个集合,确定对应的局部信息向量LI,基于该局部信息向量LI执行学习方法。根据不同的实施例,可以通过不同的方法提取局部信息向量LI。根据本发明可使用的局部信息向量。

30、的例子如下基于邻居的类并如下定义的局部信息向量说明书CN102339347ACN102339360A6/9页9。0033这个信息向量包括案例X的K个最近邻居中的每个邻居的条目,其中该条目代表各个最近邻居的类。0034基于最小距离并如下定义的局部信息向量。0035这个信息向量包括每个可能的类的条目,XI是分配给类CI的案例库的所有案例的集合。0036基于最近邻居并如下定义的局部信息向量。0037这个向量具有每个可能的类的条目,其中非零元素的索引(INDEX)等于与针对其检索局部信息的案例最相似的相邻案例的类。例如,如果一共存在四个类并且对于某个案例而言最相似的案例的类为二,则以上向量将会看起来如。

31、下0,1,0,0。这种策略类似于常规的最近邻居规则。0038基于多数并如下定义的局部信息向量。0039这个局部信息向量具有每个可能的类的条目,其中该条目表示分配给各个类的最近邻居的案例的计数。0040基于加权多数并如下定义的局部信息向量。0041这个向量包括每个可能的类的条目,其中每个条目是在各个类中分类的相邻案例的权重因数的总和,每个相邻案例的权重因数定义为以上定义的距离DX,XINEIGH的倒数。这种策略类似于常规加权多数规则。0042在如图2中所示已提取局部信息LI之后,在步骤S2中使用合适的机器学习方法以便学习案例自适应函数AF,其中学习的自适应函数提供依赖于局部信息向量并因此依赖于已。

32、针对其提取局部信息向量的案例的类。0043在下面,将描述根据本发明可使用的三种机器学习方法。这些机器学习方法本身是公知的,从而将不会详细解释这些方法。0044作为第一机器学习方法,可使用人工神经网络,具体地讲,可使用前馈神经网络。这些网络是在许多领域具有成功应用的仿生函数逼近算法(BIOLOGICALLYINSPIRED说明书CN102339347ACN102339360A7/9页10FUNCTIONAPPROXIMATIONALGORITHM)。在本发明的一个实施例中,基本的多层感知模型用作包括一系列函数变换的神经网络。多层感知包括输入层、输出层和多个隐藏层。在本发明的一种实现方式中,使用在。

33、第一隐藏层中具有H个SIGMOID(形)单元、在第二隐藏层中具有L个SIGMOID单元以及具有单个线性输出单元的网络,它能够由下面的函数FX描述。0045根据这个函数,对于给定案例X,输出对应的类FX。在以上公式中,W是网络可调整参数权重的集合,是SIGMOID激活函数,它定义为如下。0046以上术语JX指示案例X的局部信息向量的对应条目。0047在本发明的另一实施例中,决策树用于自适应函数的机器学习。决策树本身是已知的。在本发明的变型中,所谓的分类回归树缩写为CART用于学习自适应函数。在文件2中详细描述了CART决策树。CART决策树与其它决策树算法的主要差别在于数据的二元分割。根据这种树。

34、,更缓慢地分割数据,允许对相同属性的重复分割,因此与常规的决策树相比导致CART决策树的更好的性能。0048在本发明的另一实施例中,通过使用遗传规划(GENETICPROGRAMMING)基于分类规则学习自适应函数。在这种方法中,在遗传算法的搜索能力的帮助下获得符号规则。在文件3中存在对这种学习方法的描述。通过这种方法学习的规则表示为对属性的约束的联合(CONJUNCTION)。规则的例子可看起来如下。0049这里,A1、A4和A10是对应局部信息向量LI的属性,CLASS1是预测的类。在学习阶段期间,使用遗传算法学习每个类的一个规则以调整数值边界和对属性的约束的数量。0050在如图2中所示已。

35、学习自适应函数AF之后,在对应案例式专家系统中例如,在图1显示的案例式专家系统CE1或CE2中使用这个函数。图3显示学习的自适应函数AF如何应用于代表例如图1中显示的燃气涡轮机GT的状态向量SV的新的未分类的案例UC。首先,通过使用对应的最近相邻案例NC在步骤S1中针对新案例UC提取对应的局部信息向量LI。这个局部信息向量LI在步骤S2中用作学习的自适应函数AF的输入,因此导致具有新案例的类的输出的形式的对新案例的诊断D。0051基于上述具有神经网络、CART决策树或遗传规则的形式的机器学习以及基于上述不同的局部信息向量LI,已由发明者针对不同数据集测试了本发明的对应实施例。用于测试的数据集的。

36、一个例子包括位于矩形点阵的400个数据点。图4显示这个数据集的结构。该数据集包括两个类,即黑圆圈B和白圆圈W。每个白点由黑点包围,反之亦然。邻近性测说明书CN102339347ACN102339360A8/9页11量标准是如图4中所示的点阵中的两个点之间的距离。把本发明的方法与常规的自适应策略即,最近邻居规则、多数表决规则和加权多数表决规则进行比较。对于这个数据集,这些策略具有较差的性能。与之相反,基于本发明实施例的自适应函数的学习导致良好的结果。0052为了验证这些方法,使用平均准确性测量。准确性计算为正确预测的值的数量例如,二元分类的准确正样例(TRUEPOSITIVE)和准确负样例的总和。

37、除以案例的总体数量。使用交叉验证技术,其中80的数据用于训练,而20的数据用于测试。各个算法执行五次。在预先执行数据集点的随机排列的情况下把实验重复100次。计算所有次执行的平均准确性和标准偏差。与常规方法相比的本发明的实施例的结果显示在下面的表中。0053在表的左部给出本发明的实施例的结果,在表的最后一列给出常规方法的对应结果。对于不具有对应的常规策略的那些自适应策略,在最后一列中不包括任何数字。显然,对于每个学习方法以及对于每个类型的局部信息,基于本发明的方法导致比常规方法的准确性好得多的准确性。0054如前面所描述的本发明具有很多优点。具体地讲,分类适当地适应于用于学习自适应函数的案例库。

38、中的训练数据。本发明的方法组合了两种不同方法即,用于提取局部信息向量的案例式推理和具有神经网络或决策树或遗传规则的形式的基于模型的分类的优点。对于不同种类的训练数据,这种组合工作良好。0055本发明的方法能够适应于技术系统的改变的环境,例如,涡轮机的零件随时间而劣化并且新的装备也可以安装在涡轮机上。通过更新案例库并重复自适应函数的学习,能够考虑这些改变。结果,如果环境改变,则学习的自适应知识将会不同并且适合当前情况。与常规的基于规则的系统相比,根据本发明的方法的维护简单得多。具体地讲,在技术系统的操作期间能够自动产生新案例,并且能够容易地把新案例添加到已经存在的案例库。0056另外,本发明的方。

39、法具有处理遗漏输入的能力。如果一个案例式专家系统用于具有不同配置的技术系统,则可能出现遗漏输入。某一装备可能安装在一个技术系统上,而在其它技术系统上可能没有这一装备。与基于规则的专家系统相反,基于本发明的案例式专家系统能够容易地处理这种遗漏输入。0057文献1CORCHADOJM,LEESB,FYFEC,REESNANDAIKENJ1998,NEUROADAPTATIONMETHODFORACASEBASEDREASONINGSYSTEM,INTERNATIONALJOINTCONFERENCEONNEURALNETWORKS,ANCHORAGE,ALASKA,USAMAY492BREIMAN。

40、ETAL,1984,CLASSIFICATIONANDREGRESSIONTREES,WADSWORTH,BELMONT,PP158说明书CN102339347ACN102339360A9/9页123BOJARCZUKETAL,DISCOVERINGCOMPREHENSIBLECLASSIFICATIONRULESUSINGGENETICPROGRAMMINGACASESTUDYINAMEDICALDOMAIN,INPROCEEDINGSOFTHEGECCO99,MORGANKAUFMANN,SANFRANCISCO,1999,PP953958说明书CN102339347ACN102339360A1/2页13图1图2图3说明书附图CN102339347ACN102339360A2/2页14图4说明书附图CN102339347A。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1