《基于聚类特征树的变压器无监督运行状态识别方法.pdf》由会员分享,可在线阅读,更多相关《基于聚类特征树的变压器无监督运行状态识别方法.pdf(9页珍藏版)》请在专利查询网上搜索。
1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010795750.8 (22)申请日 2020.08.10 (71)申请人 贵州电网有限责任公司 地址 550000 贵州省贵阳市南明区滨河路 17号 (72)发明人 魏星陈奂桂昌乾许朝萍 覃义荣杨昌友杨皓刘君 石鹏昌张显文张宇红詹乐贵 廖文彪潘雄峰赵辉王帅 郑小波王龙郑文颜世强 邓华张旭沈正康杨小军 李姜娴王志甫赵胜谢菲 杨锴刘佳杨昌碑 (74)专利代理机构 成都玖和知识产权代理事务 所(普通合伙) 51238 代理人 胡琳梅 (51)Int.Cl. G06K 9/62。
2、(2006.01) G06Q 50/06(2012.01) (54)发明名称 一种基于聚类特征树的变压器无监督运行 状态识别方法 (57)摘要 本发明公开了一种基于聚类特征树的变压 器无监督运行状态识别方法, 用于表征变压器的 实时运行状态。 该方法是根据变压器在线监测数 据进行聚类特征树建模, 发掘变压器稳定运行时 的状态模式和特征; 然后对当前时刻在线监测数 据进行分析计算; 最后匹配状态模式和特征并给 出运行状态的识别结果。 该方法可以辅助电网短 期运行和在线调度决策, 进一步提升电力企业设 备精益管理的水平, 为检修运维方式提供数据支 撑。 权利要求书2页 说明书5页 附图1页 CN 。
3、112132173 A 2020.12.25 CN 112132173 A 1.一种基于聚类特征树的变压器无监督运行状态识别方法, 其特征在于: 所述方法包 括: 根据变压器在线监测数据进行聚类特征树建模, 发掘变压器稳定运行时的状态模式和 特征; 对当前时刻在线监测数据进行分析计算; 匹配状态模式和特征并给出运行状态的识别结果。 2.根据权利要求1所述的一种基于聚类特征树的变压器无监督运行状态识别方法, 其 特征在于: 所述聚类特征数建模包括以下步骤: 步骤S21: 根据变压器稳定运行时的历史在线监测数据进行Birch层次聚类, 构建聚类 特征树, 选择最能表征变压器运行状态的在线监测油中溶。
4、解气体来构建训练集; 步骤S22: 从训练集依次读入样本, 从根节点依次往下到内部节点再到叶节点进行访 问, 将样本点不断放入节点中的元组, 设置元组半径r, 每新读入一个样本, 计算该样本与各 个节点中各元组集合的豪斯多夫距离dH, 如dHr, 则加入该元组, 否则设置新元组放置该样 本, 不断重复上述过程, 直到所有样本都被放置在聚类特征树节点中的元组, 每个节点就是 一个聚类的簇, 记录每个簇的中心向量。 3.根据权利要求2所述的一种基于聚类特征树的变压器无监督运行状态识别方法, 其 特征在于: 所述豪斯多夫距离的计算公式如下: dH(A,B)max(dh(A,B),dh(B,A); 其。
5、中,A和B表示两个集合, a和b分别是两个集合中的样本 点。 4.根据权利要求2或3所述的一种基于聚类特征树的变压器无监督运行状态识别方法, 其特征在于: 根据Birch聚类特征树的聚类结果标记变压器稳定状态模式, 标记步骤如下: 剔除聚类结果中离群样本组成的簇; 聚类结果中由稀疏数据组成的节点簇的状态模式 不足以代表整体样本的模式特征, 将这些稀疏数据簇作为离群样本剔除, 只考虑稠密数据 的簇, 其中, 稀疏数据指节点中所有元组样本总数量少于所有簇的平均样本量; 根据剔除离群样本后的簇中的样本范围来标记稳定模式域。 5.根据权利要求4所述的一种基于聚类特征树的变压器无监督运行状态识别方法, 。
6、其 特征在于: 剔除后剩余n个簇C1、 C2、 , Cn, 分别计算n个簇样本集合之间的平均距离davg, 如C1与C2之间的平均距离davg(C1,C2)的计算公式如下: 其中, 欧式距离d(c1i,c2j)|c1i-c2j|2; i和j分别表示C1、 C2簇的第i和第j个样本, 以 此类推, 将n个簇的中心计算平均值作为稳定模式簇的质心, dmean为半径画圆, 该范围标记 为稳定模式域, 其中, dmean等于n个簇样本集合之间的平均距离之和除以n。 6.根据权利要求5所述的一种基于聚类特征树的变压器无监督运行状态识别方法, 其 特征在于: 识别变压器运行状态是根据稳定模式域识别当前变压。
7、器运行状态, 通过计算当 前时刻在线监测数据样本与稳定模式域中质心的欧式距离d, 如果ddmean, 则将此时的变 压器运行状态识别为正常, 否则标记为异常。 权利要求书 1/2 页 2 CN 112132173 A 2 7.一种计算机装置, 包括存储器、 处理器及储存在存储器上并能够在处理器上运行的 计算机程序, 其特征在于: 所述处理器执行所述计算机程序时实现如权利要求1-6任一项所 述的方法。 8.一种计算机可读存储介质, 其上储存有计算机程序, 其特征在于: 所述计算机程序被 处理器执行时实现如权利要求1-6任一项所述的方法。 权利要求书 2/2 页 3 CN 112132173 A 。
8、3 一种基于聚类特征树的变压器无监督运行状态识别方法 技术领域 0001 本发明涉及电力设备状态监测与故障诊断技术领域, 特别涉及一种基于聚类特征 树的变压器无监督运行状态识别方法。 背景技术 0002 变压器作为电力系统中重要的电气设备之一, 它一旦发生事故, 所需的修复时间 较长, 造成的影响也比较严重。 随着我国电力工业的徐速发展, 电网规模不断扩大, 电力变 压器的单机容量和安装容量随之不断增加, 电压等级也在不断地提高。 一般而言, 容量越 大, 电压等级越高, 变压器故障造成的损失也就越大。 变压器是电力系统的核心元件, 其运 行状态时评估整个系统可靠性的重要指标, 为保障其平稳运。
9、行, 有必要对变压器的实时运 行状态进行有效识别。 发明内容 0003 有鉴于此, 本发明的第一方面的目的是提供一种基于聚类特征树的变压器无监督 运行状态识别方法。 0004 本发明的第一方面的目的是通过以下技术方案实现的: 0005 一种基于聚类特征树的变压器无监督运行状态识别方法, 其特征在于: 所述方法 包括: 0006 根据变压器在线监测数据进行聚类特征树建模, 发掘变压器稳定运行时的状态模 式和特征; 0007 对当前时刻在线监测数据进行分析计算; 0008 匹配状态模式和特征并给出运行状态的识别结果。 0009 特别地, 所述聚类特征数建模包括以下步骤: 0010 步骤S21: 根。
10、据变压器稳定运行时的历史在线监测数据进行Birch层次聚类, 构建 聚类特征树, 选择最能表征变压器运行状态的在线监测油中溶解气体来构建训练集; 0011 步骤S22: 从训练集依次读入样本, 从根节点依次往下到内部节点再到叶节点进行 访问, 将样本点不断放入节点中的元组, 设置元组半径r, 每新读入一个样本, 计算该样本与 各个节点中各元组集合的豪斯多夫距离dH, 如dHr, 则加入该元组, 否则设置新元组放置该 样本, 不断重复上述过程, 直到所有样本都被放置在聚类特征树节点中的元组, 每个节点就 是一个聚类的簇, 记录每个簇的中心向量. 0012 特别地, 所述豪斯多夫距离计算公式如下:。
11、 0013 dH(A,B)max(dh(A,B),dh(B,A); 0014其中,A和B表示两个集合, a和b分别是两个集合中的样 本点。 0015 特别地, 根据Birch聚类特征树的聚类结果标记变压器稳定状态模式, 标记步骤如 下: 说明书 1/5 页 4 CN 112132173 A 4 0016 剔除聚类结果中离群样本组成的簇; 聚类结果中由稀疏数据组成的节点簇的状态 模式不足以代表整体样本的模式特征, 将这些稀疏数据簇作为离群样本剔除, 只考虑稠密 数据的簇, 其中, 稀疏数据指节点中所有元组样本总数量少于所有簇的平均样本量; 0017 根据剔除离群样本后的簇中的样本范围来标记稳定模。
12、式域。 0018 特别地, 剔除后剩余n个簇C1、 C2、 , Cn, 分别计算n个簇样本集合之间的平均距 离davg, 如C1计与C2之间的平均距离davg(C1,C2)的计算公式如下: 0019 0020 其中, 欧式距离d(c1i,c2j)|c1i-c2j|2; i和j分别表示C1、 C2簇的第i和第j个样 本, 以此类推, 将n个簇的中心计算平均值作为稳定模式簇的质心, dmean为半径画圆, 该范围 标记为稳定模式域, 其中, dmean等于n个簇样本集合之间的平均距离之和除以n。 0021 特别地, 识别变压器运行状态是根据稳定模式域识别当前变压器运行状态, 通过 计算当前时刻在线。
13、监测数据样本与稳定模式域中质心的欧式距离d, 如果ddmean, 则将此 时的变压器运行状态识别为正常, 否则标记为异常。 0022 本发明的第二方面的目的是提供一种计算机装置, 包括存储器、 处理器及储存在 存储器上并能够在处理器上运行的计算机程序, 所述处理器执行所述计算机程序时实现如 前所述的方法。 0023 本发明的第三方面的目的是提供一种计算机可读存储介质, 其上储存有计算机程 序, 所述计算机程序被处理器执行时实现如前所述的方法。 0024 本发明的有益效果是: 本发明的方法研究了变压器在电网运行中的无监督状态识 别模型, 用于表征变压器的实时运行状态。 首先, 根据历史在线监测数。
14、据建立变压器运行状 态识别模型, 然后根据模型对实时运行状态进行识别。 该方法能有效识别和表征变压器运 行状态, 有助于提前发现设备异常, 采取个性化、 差异化特巡特维等处置措施, 可以辅助电 网短期运行和在线调度决策, 进一步提升电力企业设备精益管理的水平, 为检修运维方式 提供数据支撑。 0025 本发明的其他优点、 目标和特征在某种程度上将在随后的说明书中进行阐述, 并 且在某种程度上, 基于对下文的考察研究对本领域技术人员而言将是显而易见的, 或者可 以从本发明的实践中得到教导。 本发明的目标和其他优点可以通过下面的说明书和前述的 权利要求书来实现和获得。 附图说明 0026 为了使本。
15、发明的目的、 技术方案和优点更加清楚, 下面将结合附图对本发明作进 一步的详细描述, 其中: 0027 图1为本发明的方法流程示意图; 0028 图2为聚类特征树的示意图。 具体实施方式 0029 以下将参照附图, 对本发明的优选实施例进行详细的描述。 应当理解, 优选实施例 仅为了说明本发明, 而不是为了限制本发明的保护范围。 说明书 2/5 页 5 CN 112132173 A 5 0030 本实施例提供了一种基于聚类特征树的变压器无监督运行状态识别方法, 方法包 括: 0031 (1)根据变压器在线监测数据进行聚类特征树建模, 发掘变压器稳定运行时的状 态模式和特征; 0032 本实施例。
16、中, 聚类特征数建模包括以下步骤: 0033 步骤S21: 根据变压器稳定运行时的历史在线监测数据进行Birch层次聚类, 构建 聚类特征树, 选择最能表征变压器运行状态的在线监测油中溶解气体来构建训练集; 0034 表1训练集(部分) 0035 时间H2CH4C2H6C2H4C2H2COCO2O2N2总烃 2015-10-28 03:38:165.6000.30.3111378.739900.6 2015-10-28 15:38:165.6000.30.3111378.739900.6 2015-10-28 19:38:036.300.80.50.4112.5383.540401.7 201。
17、5-10-28 23:38:206.800.60.30.3114387.5408.801.2 2015-10-29 03:38:027.1000.20.6112.5382.7404.400.8 0036 步骤S22: 从训练集依次读入样本, 从根节点依次往下到内部节点再到叶节点进行 访问, 将样本点不断放入节点中的元组, 设置元组半径r, 每新读入一个样本, 计算该样本与 各个节点中各元组集合的豪斯多夫距离dH, 如dHr, 则加入该元组, 否则设置新元组放置该 样本, 不断重复上述过程, 直到所有样本都被放置在聚类特征树节点中的元组, 每个节点就 是一个聚类的簇, 记录每个簇的中心向量, 豪。
18、斯多夫距离计算公式如下: 0037 dH(A,B)max(dh(A,B),dh(B,A); 0038其中,A和B表示两个集合, a和b分别是两个集合中的样 本点。 0039 聚类特征树如图2中所示。 0040 (2)标记变压器稳定状态模式; 0041 根据Birch聚类特征树的聚类结果标记变压器稳定状态模式, 标记步骤如下: 0042 a.剔除聚类结果中离群样本组成的簇; 聚类结果中由稀疏数据组成的节点簇的状 态模式不足以代表整体样本的模式特征, 将这些稀疏数据簇作为离群样本剔除, 只考虑稠 密数据的簇, 其中, 稀疏数据指节点中所有元组样本总数量少于所有簇的平均样本量; 0043 b.根据剔。
19、除离群样本后的簇中的样本范围来标记稳定模式域。 0044 剔除后剩余n个簇C1、 C2、 , Cn, 分别计算n个簇样本集合之间的平均距离davg, 如C1计与C2之间的平均距离davg(C1,C2)的计算公式如下: 0045 0046 其中, 欧式距离d(c1i,c2j)|c1i-c2j|2; i和j分别表示C1、 C2簇的第i和第j个样 本, 以此类推, 将n个簇的中心计算平均值作为稳定模式簇的质心, dmean为半径画圆, 该范围 标记为稳定模式域, 其中, dmean等于n个簇样本集合之间的平均距离之和除以n。 0047 举例说明上述计算过程, 如剔除后剩余三个簇C1、 C2、 C3,。
20、 分别计算三个簇样本集 合之间的平均距离davg(C1,C2)、 davg(C2,C3)、 davg(C1,C3), 计算公式如下: 说明书 3/5 页 6 CN 112132173 A 6 0048 0049 其中, 欧式距离d(c1i,c2j)|c1i-c2j|2; i和j分别表示C1、 C2簇的第i和第j个样 本。 将三个簇的中心计算平均值作为稳定模式簇的质心, dmean为半径画圆, 该范围标记为稳 定模式域。 其中, 0050 0051 (3)对当前时刻在线监测数据进行距离计算, 匹配状态模式和特征并给出运行状 态的识别结果。 分析计算主要指当前时刻数据与稳定状态模式质心的距离d的计。
21、算。 通过计 算当前时刻在线监测数据样本与稳定模式域中质心center的欧式距离d, 识别变压器运行 状态是根据稳定模式域识别当前变压器运行状态, 计算如下: 0052 d(X,Center)|X-Center|2 0053 其中,X表示当前时刻在线监测数据向量, Center表示稳定模式域的质心向量。 0054 如果ddmean, 则将此时的变压器运行状态识别为正常, 否则标记为异常。 0055 流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为, 表示包括 一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、 片段或部 分, 并且本发明的优选实施方式的范围包括另。
22、外的实现, 其中可以不按所示出或讨论的顺 序, 包括根据所涉及的功能按基本同时的方式或按相反的顺序, 来执行功能, 这应被本发明 的实施例所属技术领域的技术人员所理解。 0056 在流程图中表示或在此以其他方式描述的逻辑和/或步骤, 例如, 可以被认为是用 于实现逻辑功能的可执行指令的定序列表, 可以具体实现在任何计算机可读介质中, 以供 指令执行系统、 装置或设备(如基于计算机的系统、 包括处理器的系统或其他可以从指令执 行系统、 装置或设备取指令并执行指令的系统)使用, 或结合这些指令执行系统、 装置或设 备而使用。 就本说明书而言, 计算机可读介质可以是任何可以包含、 存储、 通信、 传。
23、播或传 输程序以供指令执行系统、 装置或设备或结合这些指令执行系统、 装置或设备而使用的装 置。 计算机可读介质的更具体的示例(非穷尽性列表)包括以下: 具有一个或多个布线的电 连接部(电子装置), 便携式计算机盘盒(磁装置), 随机存取存储器(RAM), 只读存储器 (ROM), 可擦除可编辑只读存储器(EPROM或闪速存储器), 光纤装置, 以及便携式光盘只读存 储器(CDROM)。 另外, 计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的 介质, 因为可以例如通过对纸或其他介质进行光学扫描, 接着进行编辑、 解译或必要时以其 他合适方式进行处理来以电子方式获得所述程序, 然后。
24、将其存储在计算机存储器中。 0057 应当理解, 本发明的各部分可以用硬件、 软件、 固件或它们的组合来实现。 在上述 实施方式中, 多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件 或固件来实现。 例如, 如果用硬件来实现, 和在另一实施方式中一样, 可用本领域公知的下 列技术中的任一项或他们的组合来实现: 具有用于对数据信号实现逻辑功能的逻辑门电路 的离散逻辑电路, 具有合适的组合逻辑门电路的专用集成电路, 可编程门阵列(PGA), 现场 可编程门阵列(FPGA)等。 0058 本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步 骤是可以通过程序来指令相。
25、关的硬件完成, 述的程序可以存储于一种计算机可读存储介质 说明书 4/5 页 7 CN 112132173 A 7 中, 该程序在执行时, 包括方法实施例的步骤之一或其组合。 0059 此外, 在本发明各个实施例中的各功能单元可以集成在一个处理模块中, 也可以 是各个单元单独物理存在, 也可以两个或两个以上单元集成在一个模块中。 上述集成的模 块既可以采用硬件的形式实现, 也可以采用软件功能模块的形式实现。 所述集成的模块如 果以软件功能模块的形式实现并作为独立的产品销售或使用时, 也可以存储在一个计算机 可读取存储介质中。 0060 上述提到的存储介质可以是只读存储器, 磁盘或光盘等。 0061 最后说明的是, 以上实施例仅用以说明本发明的技术方案而非限制, 尽管参照较 佳实施例对本发明进行了详细说明, 本领域的普通技术人员应当理解, 可以对本发明的技 术方案进行修改或者等同替换, 而不脱离本技术方案的宗旨和范围, 其均应涵盖在本发明 的权利要求范围当中。 说明书 5/5 页 8 CN 112132173 A 8 图1 图2 说明书附图 1/1 页 9 CN 112132173 A 9 。