一种基于数据挖掘的采集故障预警系统的方法技术领域
本发明涉及工程实践领域、数据处理技术领域,尤其是一种基于数据挖掘的采集
故障预警系统的方法。
背景技术
电力用户用电信息采集系统的全覆盖使得每天生成大量的系统运行日志与故障
日志,但由于缺乏相应的数据挖掘算法和工具,导致该部分数据未能得到充分、有效地利
用。通过利用数据挖掘技术对用电信息采集系统所存储的海量运行日志与故障日志数据进
行分析,设计一个采集系统故障智能预警系统,该系统包括核心数据挖掘算法、技术架构以
及业务流程。该系统通过对数据的智能分析,确定故障类型,指导系统维护人员进行针对性
故障排查,提高故障定位的精确性,有效提高系统维护的工作效率。该系统为保障用电信息
采集系统的稳定运行,建设坚强智能电网提供有力支撑。
发明内容
本发明的目的在于提供一种基于数据挖掘的采集系统故障预警方法,将数据挖掘
算法巧妙的应用在采集系统故障处理和预警中,从而达到及时高效地排查采集系统故障的
作用。
为实现上述目的,本发明的技术方案是:一种基于数据挖掘的采集故障预警系统
的方法,包括如下步骤,
S1:根据积累的故障数据进行数据处理,建立分类器;
S2:利用分类器对实时数据流进行处理,分析出故障类型;
S3:建立专家知识库;
S4:根据故障类型和专家知识库的比对得到结果,结合维护人员的反馈,建立一套反馈
机制,把反馈结果和本次故障数据应用在分类器的建立上。
在本发明一实施例中,所述步骤S1具体实现如下,
S11:对历史故障数据进行整理,建立故障数据库用来保存故障数据,对数据进行预处
理,除去噪音数据,为下一步做准备;
S12:对数据进行异常点检测,利用利群检测算法、统计学方法、基于距离的方法、基于
密度的局部离群点方法或基于偏差的方法进行检测;
S13:利用步骤S12处理后的数据进行分类器的建立,应用决策树归纳算法,采用增益率
作为分裂准则,对采集系统最近5年的数据采取交叉验证的策略,随机选择2/3用于训练决
策树,剩余部分用于测试。
在本发明一实施例中,所述步骤S2具体实现如下,
S21:用电信息采集系统捕捉系统故障的实时数据;
S22:对实时数据进行实时监测,主要进行故障数据的筛选,接着利用分类器对故障数
据进行分类,得到故障的类型,发出带有故障类型的警报,若诊断不出故障类型,则发出不
确定故障类型的警报;
S23:根据故障类型的分类结果进行专家知识库的匹配,找到故障原因以及相应的故障
处理建议,提供给维护人员参考;
S24:维护人员进行现场维护,根据维护现场的结果对故障信息进行一个反馈,最终将
此次故障转入故障数据库并把维修经验总结到专家知识库。
在本发明一实施例中,所述步骤S22中,故障的类型包括:互感器故障、电能表故
障、电能量采集终端故障、网络通信故障、主站故障、其他故障。
相较于现有技术,本发明具有以下有益效果:
本发明基于数据挖掘的采集故障预警的方法通过利用异常点检测以及决策树分类技
术设计数据挖掘模块,提出建立专家知识数据库以及自适应的学习系统的模块,不断地优
化和更新系统,从而提供一个高效、完善的故障预警处理系统。该系统智能快速,能够准确
地排给出运行故障类型,为采集故障的维护提供技术保障,提高了解决故障的效率。
附图说明
图1为本发明实施例提供的一种基于数据挖掘采集故障系统方法分类器构建的流
程图。
图2为本发明实施例提供的一种基于数据挖掘采集故障系统方法整体系统用例
图。
具体实施方式
下面结合附图,对本发明的技术方案进行具体说明。
如图1所示,本发明的一种基于数据挖掘的采集故障预警系统的方法,包括如下步
骤,
S1:根据积累的故障数据进行数据处理,建立分类器;
S2:利用分类器对实时数据流进行处理,分析出故障类型;
S3:建立专家知识库(根据系统运行维护专家和一线运行维护人员先验经验建立);
S4:根据故障类型和专家知识库的比对得到结果,结合维护人员的反馈,建立一套反馈
机制,把反馈结果和本次故障数据应用在分类器的建立上。
所述步骤S1具体实现如下,
S11:对历史故障数据进行整理,建立故障数据库用来保存故障数据,对数据进行预处
理,除去噪音数据,为下一步做准备;
S12:对数据进行异常点检测,利用利群检测算法、统计学方法、基于距离的方法、基于
密度的局部离群点方法或基于偏差的方法进行检测;
S13:利用步骤S12处理后的数据进行分类器的建立,应用决策树归纳算法,采用增益率
作为分裂准则,对采集系统最近5年的数据采取交叉验证的策略,随机选择2/3用于训练决
策树,剩余部分用于测试。
所述步骤S2具体实现如下,
S21:用电信息采集系统捕捉系统故障的实时数据;
S22:对实时数据进行实时监测,主要进行故障数据的筛选,接着利用分类器对故障数
据进行分类,得到故障的类型,发出带有故障类型的警报,若诊断不出故障类型,则发出不
确定故障类型的警报;
S23:根据故障类型的分类结果进行专家知识库的匹配,找到故障原因以及相应的故障
处理建议,提供给维护人员参考;
S24:维护人员进行现场维护,根据维护现场的结果对故障信息进行一个反馈,最终将
此次故障转入故障数据库并把维修经验总结到专家知识库。
所述步骤S22中,故障的类型包括:互感器故障、电能表故障、电能量采集终端故
障、网络通信故障、主站故障、其他故障。
以下为本发明的具体实施过程。
本发明实施例提供一种基于数据挖掘采集故障系统方法。如图2所示,该方法主要
包括如下步骤:
步骤1、故障类型分类器的建立。
本步骤具体通过如下三个步骤来实现:
1)对历史故障数据进行整理,建立故障数据库用来保存这些故障数据,对数据进行预
处理,除去噪音数据,为下一步做准备;
2)对数据进行异常点检测,可以利用利群检测算法(统计学方法、基于距离的方法、基
于密度的局部离群点方法、基于偏差的方法)进行检测。
3)利用上述清洁的数据进行分类器的建立,应用决策树归纳算法,采用增益率作
为分裂准则,对采集系统最近5年的数据采取交叉验证的策略,随机选择2/3用于训练决策
树,剩余部分用于测试。
步骤2、对实时数据进行处理,利用分类器进行分类,得到分类结果并查询专家知
识库,分析此分类结果给出故障原因和处理建议,接着维护人员进行故障的维护,把维护结
果和出现的问题进行反馈,把此次故障转入故障数据库以及知识数据库。
本步骤具体通过如下三个步骤来实现:
1)用电信息采集系统捕捉系统故障的实时数据。
2)对实时数据进行实时监测,主要进行故障数据的筛选,接着利用分类器对故障
数据进行分类,得到故障的类型,发出带有故障类型的警报,如果诊断不出故障类型,则发
出不确定故障类型的警报;
3)根据故障类型的分类结果进行专家知识库的匹配,找到故障原因以及相应的故障处
理建议,提供给维护人员参考。
4)维护人员进行现场维护,根据维护现场的结果对故障信息进行一个反馈,最终
把这次故障转入故障数据库并把维修经验总结到专家知识数据库。
本发明实施例的上述方案,通过将温度作为电力负荷数据的刻画指标,将电力负
荷数据的预测与温度有效的联系了起来,同时,在处理过程中,没有破坏数据的原始性;另
外,针对数据集不充分的缺陷,设置边际增量加以补充;而对于传统的将负荷转化为时间序
列处理中,无法进行中长期预测的问题,本方案得到了很好的解决。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例可
以通过软件实现,也可以借助软件以及必要的通用硬件平台的方式来实现。基于这样的理
解,上述实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个
非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算
机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,
任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,
都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范
围为准。