基于Apriori算法及方差分析的电力故障原因相关度分析
基于 Apriori 算法及方差分析的电力故障原因
相关度分析
0.引言
电力系统在空间上的广域分布,导致电力事故的发生是不可避免的,事故数据的收集、分
析很难全面、系统地进行。分析 2003 年~2015 年中国南方电网电力生产事故,目前同类事故
重复现象比较普遍。采用故障树分析法无法确定导致事故发生的上下级原因之间的相关度,不
能确定主要的事故防范措施;另一方面,故障树分析法缺乏对事故分析结果的系统应用,要想
全面查找到各个根本原因间的逻辑关系,十分困难,不能建立多方面、多维度防范措施,无法
真正达到事故预防目的。利用基于 Apriori 算法及方差分析的故障树上下级原因相关度分析方
法,分析事故上下级原因的相关度可以有针对性地对事故进行防范,降低事故发生概率,减少
事故的发生。
Apriori 算法是一种最有影响的挖掘布尔关联规则频繁项集合的算法。Apriori 算法通过查
找事务数据库中所有支持度大于最小支持度的频繁项集。将 Apriori 算法利用于事故树上下级
原因分析,得出的频繁项集合的支持度便是事故树上下级原因之间的相关度,此时最小支持度
应该设定为零;另外,Apriori 算法还可以在频繁项集合中产生所有大于等于最小可信度的关联
规则,即可分析同级原因的关联规则。
对于电网发生的电力事故来说,在某一个确定的时间段上,电力安全生产管理水平是趋于
一个稳定的程度,则对应的电力生产事故发生的可能性也是趋于一个确定的值。因此,在一个
确定的时间段内发生的电力生产事故的次数服从正态分布,也就是说在这段时间内导致电力生
产事故发生的直接原因事件出现的次数成正态分布。
方差分析法是一种常用的统计方法,方差分析就是将总的方差分解为各个方差的成分,然
后利用显著性检验法进行分析判断和做出适当的结论。对需要进行分析的因素进行方差分析,
若分析结果落入拒绝域,说明下级因素对上级因素没有显著影响;若分析结果落在拒绝域外,
则说明有显著的影响。分析得出存在显著影响的因素,可以针对性地对事故进行防范,降低事
故发生的概率。
1. Apriori 算法
1.1 概述
Apriori 算法是一种以概率为基础的具有影响的挖掘布尔型关联规则频繁项集合的算法。同
时,Apriori 算法是第一个关联规则挖掘算法,也是最为经典的算法。Apriori 算法利用逐步检
索的迭代方法寻找出某数据库中项集合的密切联系,通过这种密切联系来形成规则。Apriori 算
法中包含了几个重要的概念,其中项集(Itemset)就是项的集合,包含 K个项的集合为 k项
集;项集合出现的频率表示在某数据库中,包含项集合的个数,称为项集合的频率。通过制定
的最小支持度,如若某项集合满足最小支持度,则称它为频繁项集。
Apriori “算法是一个基于频集理论递推的方法,它利用 频繁项集的所有非空子集必定是频
”繁的,非频繁项集的所有超级必定是非频繁的 这一性质来实现。其根本原理是:通过查找数
据库中的所有数据项,从而得到一个大项集 L1,如果大项集 L1 为非空,根据此大项集得到一
个候选项集合 C1,然后对该数据库中的每一个数据项数据项 t,求出t在C1 中的全部子集 Ct。
子集 Ct 中的每一个的候选项集 c,令c加l。当扫描该数据库一遍后,筛选出候选项集合 C1 中
所有计数大于或等于最小支持度的项集组成频繁项集合。
1.2 Apriori 算法步骤
Apriori 算法的挖掘任务分为以下问题:
(1)找出某数据库中所有支持度大于或等于最小支持度的候选项集。具有最小支持度的
候选项集称为频繁项目集。
(2)在频繁项集合中产生所有大于等于最小可信度的关联规则。
1.2.1 具体步骤
首先确定在该数据下的最小支持度。
Apriori 算法采用了候选项集合的概念,通过查找数据库中的所有数据项,得到一个大项集
L1,根据大项集得到候选项集,若候选项集的支持度大于或等于最小支持度,则该项集合为频
繁项集合(Large Itemset)。此支持度为频繁项集合的概率。
假设一个简单事务数据库 D的模型,数据库 D的数据如图1所示的事故树。分别求取一级
原因 A、B、C与事故之间的关联程度,二级原因 A1、B1、C1 分别与一级原因 A、B、C的关
联程度,三级原因 A11、B11、B12、C11 分别与二级原因 A1、B1、C1 的关联程度,四级原因
B111 与三级原因 B11 的关联程度,须从数据库中计及事故的次数以及各原因的次数。
表1中:001 D010�代表 10 个电网事故故障树编号,A、B、C、D、E分别代表事故一级
原因。
若要求取一级原因与事故之间的额关联程度首先通过扫描数据库 D,生成项集,见表2。
其次利用 Apriori 算法对数据库中的项集进行扫描,计数每个项集在数据库中的次数,即
在每一次迭代过程中,Apriori 算法都产生了一个大项集,然后计算每一个候选项集所出现的次
数,最后在预先给定的最小支持度 s=0%的基础上确定大项集。
对上表所示的各个项集进行计数,通过扫描数据库 D中的数据得出表 3所示的计数次数并
求出其支持度。 由于某种事故原因导致事故发生是存在可能性的,尽管有些导致事故发生
的概率很小,但是最终却不可避免,所以在此设定最小支持度为 s=0%,即出现的事故原因都
应该纳入考虑范围。
发掘大项集,也就是支持度大于预先给定的最小支持度的项的集合。
在第一次迭代的第一步中,所有单个项都作为候选集。接着计算每一个候选集的出现次
数,然后在最小支持度 s的基础上选择频繁项集。表 3所示的 S分别代表该项集的支持度即上
下级原因之间的相关程度。
1.2.2 具体实例
分析某 110kV 八所站1#主变因遭受雷击,造成中压侧 B相线圈损坏示例,其故障树如图2
所示。
由上述事故树分析得出该事故是由一级原因环境因素、物的因素-物理性危险和有害因
素,二级原因自然因素、制造质量不良、设备缺陷、规划设计不周和三级原因雷击、工艺缺
陷、绝缘不良、绝缘配合不当引起的。
利用 Apriori 算法对 2003~2015 年2046 个事故树进行扫描计数,统计到以上原因的次数和
最小支持度见表4。
如图3所示,相关度的计算结果在事故树模型的基础上表示出来,可以直观地看到各级故
障原因之间的相关程度。通过进一步的计算便可以得出底层原因对该次事故的影响程度。
2.方差分析
在实际问题的研究过程中,影响某一事物的因素往往很多。其中每一个因素的改变都有可
能影响产品的数量和质量,并且有些因素影响大,有些因素影响小,所以要找出对产品数量和
质量影响显著的那些因素。方差分析是检验各因素对实验结果影响程度的一种有效方法。
摘要:
展开>>
收起<<
基于Apriori算法及方差分析的电力故障原因相关度分析 0.引言 电力系统在空间上的广域分布,导致电力事故的发生是不可避免的,事故数据的收集、分析很难全面、系统地进行。分析2003年~2015年中国南方电网电力生产事故,目前同类事故重复现象比较普遍。采用故障树分析法无法确定导致事故发生的上下级原因之间的相关度,不能确定主要的事故防范措施;另一方面,故障树分析法缺乏对事故分析结果的系统应用,要想全面查找到各个根本原因间的逻辑关系,十分困难,不能建立多方面、多维度防范措施,无法真正达到事故预防目的。利用基于Apriori算法及方差分析的故障树上下级原因相关度分析方法,分析事故上下级原因的相关...
相关推荐
-
立式打蛋机设计(全套CAD图纸+说明书+三维设计)
2022-10-19 458 -
全自动打捆机(机械毕业设计+说明书+全套CAD)
2022-11-06 231 -
输出轴的数控工艺及主要工装设计(机械毕业设计+说明书+全套CAD)
2022-11-07 461 -
爬楼梯智能轮椅设计(机械毕业设计+说明书+全套CAD)
2022-11-20 232 -
红枣去核机的机构设计
2022-11-23 336 -
枕式包装机设计(机械毕业设计+说明书+全套CAD)
2022-11-25 701 -
自动盖章机(机械毕业设计+说明书+CAD)
2022-12-15 999+ -
挂轮架加工工艺与工装设计(机械毕业设计+说明书+全套CAD)
2023-01-16 501 -
下肢康复机器人踝关节驱动系统-设计
2023-10-07 185 -
粒状巧克力糖包装机设计-包含SW设计-机械毕业设计资料-机械毕业设计
2024-09-30 188
作者:闻远设计
分类:其它行业资料
价格:5光币
属性:5 页
大小:18.03KB
格式:DOCX
时间:2025-03-22

