一种变电站作业违章的自动分类方法及系统

2022-09-08 00:38:01 来源：中国专利 TAG：

1.本发明涉及作业违章分类技术领域，特别是涉及一种变电站作业违章的自动分类方法及系统。

背景技术：

2.在电力行业中，安全是一切工作的基础，也是电力行业科技进步的最重要标志之一。电力安全生产的重要性是由电力生产客观规律和生产特性及社会作用共同决定的，因此安全也是电力行业中一个永恒不变的主题。安全既是电网作业人员生命和健康的基础保障,也是企业生存发展的最有力支撑,更是社会稳定经济发展的前提条件。对电力企业来说,安全就是生命和效益,安全是一切工作的重中之重。安全事故、现场违章记录、检查审计问题等各类安全监督资料，是安全生产的第一手资料，是安全生产的指导依据。全面研究供电企业的历史安全数据，不仅可以降低事故发生的概率，而且可以提高安全生产水平，具有重要的现实意义。利用人工智能技术对历史安全数据进行深度挖掘，提取出安全风险典型问题。基于安全风险典型问题，并且对其进行智能分类，给安全监察工作提供了极大地便利和数据支撑。基于历史典型安全事故问题，构建安全事故问题风险库，建立智能预警方案，对供电企业安全状况进行动态评价和预警。因此，违章问题的智能分类对电网的安全建设，安全运行有着非常重要的意义。

技术实现要素：

3.本发明的目的是提供一种变电站作业违章的自动分类方法及系统，能够对变电站作业的违章行为进行分类，为电网的安全建设提供数据支撑。
4.为实现上述目的，本发明提供了如下方案：
5.一种变电站作业违章的自动分类方法，包括：
6.获取变电站作业的行为数据；所述行为数据包括自然实体词向量和社会实体词向量；
7.将所述自然实体词向量输入到第一违章分类模型中，得到第一分类结果；所述第一违章分类模型是利用历史自然实体词向量，对双向长短期记忆网络进行训练得到的；
8.将所述社会实体词向量输入到第二违章分类模型中，得到第二分类结果；所述第二违章分类模型是利用历史社会实体词向量，对双向长短期记忆网络进行训练得到的；
9.根据所述第一分类结果和所述第二分类结果，利用dempster法则确定违章类别。
10.可选的，所述自然实体词向量用于表述变电站作业行为的设备、工器具、设施、故障、操作和动作；
11.所述社会实体词向量用于表述变电站作业行为的时间、地点、操作员姓名和组织机构。
12.可选的，在获取变电站作业的行为数据之前，还包括：
13.获取历史自然实体词向量；
14.以所述历史自然实体词向量为输入，以历史行为的类别为期望输出，对双向长短期记忆网络进行训练，得到第一违章分类模型。
15.可选的，在获取变电站作业的行为数据之前，还包括：
16.获取历史社会实体词向量；
17.以所述历史社会实体词向量为输入，以历史行为的类别为期望输出，对双向长短期记忆网络进行训练，得到第二违章分类模型。
18.可选的，所述根据所述第一分类结果和所述第二分类结果，利用dempster法则确定违章类别，具体包括：
19.构建违章类型完备集合；
20.确定所述违章类型完备集合的幂集；所述幂集包括所述违章类型完备集合，以及所述违章类型完备集合中任意两个种类交集；
21.根据所述第一分类结果和所述第二分类结果，采用公式确定所述幂集中每个焦元的冲突系数；所述第一分类结果包括变电站作业行为是每种违章类别的第一概率；所述第二分类结果包括变电站作业行为是每种违章类别的第二概率；其中，k表示冲突系数；f1(a
p
)和f2(bq)分别表示违章类别a
p
的第一概率和违章类别bq第二概率；φ表示非违章行为；焦元a
p
∩bq表示违章类别的第一概率和违章类别的交集；
22.确定冲突系数小于预设冲突系数的焦元为可识别焦元；
23.基于dempster合成规则，利用公式确定确定每个所述可识别焦元的基本可信度分配值；其中，表示焦元a
p
∩bq的基本可信度分配值；c表示融合结果；
24.确定基本可信度分配值最大的可识别焦元所对应类别为变电站作业行为的违章类别。
25.一种变电站作业违章的自动分类系统，包括：
26.行为数据获取模块，用于获取变电站作业的行为数据；所述行为数据包括自然实体词向量和社会实体词向量；
27.第一分类模块，用于将所述自然实体词向量输入到第一违章分类模型中，得到第一分类结果；所述第一违章分类模型是利用历史自然实体词向量，对双向长短期记忆网络进行训练得到的；
28.第二分类模块，用于将所述社会实体词向量输入到第二违章分类模型中，得到第二分类结果；所述第二违章分类模型是利用历史社会实体词向量，对双向长短期记忆网络进行训练得到的；
29.第三分类模块，用于根据所述第一分类结果和所述第二分类结果，利用dempster法则确定违章类别。
30.可选的，
31.所述自然实体词向量用于表述变电站作业行为的设备、工器具、设施、故障、操作和动作；
32.所述社会实体词向量用于表述变电站作业行为的时间、地点、操作员姓名和组织机构。
33.可选的，在获取变电站作业的行为数据之前，还包括：
34.历史自然实体词向量获取模块，用于获取历史自然实体词向量；
35.第一训练模块，用于以所述历史自然实体词向量为输入，以历史行为的类别为期望输出，对双向长短期记忆网络进行训练，得到第一违章分类模型。
36.可选的，在获取变电站作业的行为数据之前，还包括：
37.历史社会实体词向量获取模块，用于获取历史社会实体词向量；
38.第二训练模块，用于以所述历史社会实体词向量为输入，以历史行为的类别为期望输出，对双向长短期记忆网络进行训练，得到第二违章分类模型。
39.可选的，所述第三分类模块包括：
40.违章类型完备集合构建单元，用于构建违章类型完备集合；
41.幂集确定单元，用于确定所述违章类型完备集合的幂集；所述幂集包括所述违章类型完备集合，以及所述违章类型完备集合中任意两个种类交集；
42.冲突系数计算单元，用于根据所述第一分类结果和所述第二分类结果，采用公式确定所述幂集中每个焦元的冲突系数；所述第一分类结果包括变电站作业行为是每种违章类别的第一概率；所述第二分类结果包括变电站作业行为是每种违章类别的第二概率；其中，k表示冲突系数；f1(a
p
)和f2(bq)分别表示违章类别a
p
的第一概率和违章类别bq第二概率；φ表示非违章行为；焦元a
p
∩bq表示违章类别的第一概率和违章类别的交集；
43.可识别焦元确定单元，用于确定冲突系数小于预设冲突系数的焦元为可识别焦元；
44.基本可信度分配值确定单元，用于基于dempster合成规则，利用公式确定确定每个所述可识别焦元的基本可信度分配值；其中，表示焦元a
p
∩bq的基本可信度分配值；c表示融合结果；
45.违章类别确定单元，用于确定基本可信度分配值最大的可识别焦元所对应类别为变电站作业行为的违章类别。
46.根据本发明提供的具体实施例，本发明公开了以下技术效果：
47.本发明提供了一种变电站作业违章的自动分类方法及系统，获取变电站作业的行为数据；将自然实体词向量输入到第一违章分类模型中，得到第一分类结果；将社会实体词向量输入到第二违章分类模型中，得到第二分类结果；根据第一分类结果和第二分类结果，利用dempster法则确定违章行为的类别。针对传统的违章分类问题，多是解决单一的违章分类，然而实际情况中，每次表象可能是存在若干种违章分类的情况，本发明通过训练第一
违章分类模型和第二违章分类模型，并对两个分类模型的分类结果进行融合，能够对变电站作业的违章行为进行分类(分类结果为一种或多种)，提高了违章行为分类的合理性，为电网的安全建设提供数据支撑。
附图说明
48.为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
49.图1为本发明实施例中变电站作业违章的自动分类方法流程图。
具体实施方式
50.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
51.本发明的目的是提供一种变电站作业违章的自动分类方法及系统，能够对变电站作业的违章行为进行分类，为电网的安全建设提供数据支撑。
52.为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。
53.如图1，本发明提供了一种变电站作业违章的自动分类方法，包括：
54.获取变电站作业的行为数据；行为数据包括自然实体词向量和社会实体词向量；自然实体词向量用于表述变电站作业行为的设备、工器具、设施、故障、操作和动作；社会实体词向量用于表述变电站作业行为的时间、地点、操作员姓名和组织机构。
55.将自然实体词向量输入到第一违章分类模型中，得到第一分类结果；第一违章分类模型是利用历史自然实体词向量，对双向长短期记忆网络进行训练得到的；
56.将社会实体词向量输入到第二违章分类模型中，得到第二分类结果；第二违章分类模型是利用历史社会实体词向量，对双向长短期记忆网络进行训练得到的；
57.根据第一分类结果和第二分类结果，利用dempster法则确定违章类别。
58.在获取变电站作业的行为数据之前，还包括：
59.获取历史自然实体词向量；
60.以历史自然实体词向量为输入，以历史行为的类别为期望输出，对双向长短期记忆网络进行训练，得到第一违章分类模型。
61.获取历史社会实体词向量；
62.以历史社会实体词向量为输入，以历史行为的类别为期望输出，对双向长短期记忆网络进行训练，得到第二违章分类模型。
63.其中，根据第一分类结果和第二分类结果，利用dempster法则确定违章类别，具体包括：
64.构建违章类型完备集合；
65.确定违章类型完备集合的幂集；幂集包括违章类型完备集合，以及违章类型完备集合中任意两个种类交集；
66.根据第一分类结果和第二分类结果，采用公式确定幂集中每个焦元的冲突系数；第一分类结果包括变电站作业行为是每种违章类别的第一概率；第二分类结果包括变电站作业行为是每种违章类别的第二概率；其中，k表示冲突系数；f1(a
p
)和f2(bq)分别表示违章类别a
p
的第一概率和违章类别bq第二概率；φ表示非违章行为；焦元a
p
∩bq表示违章类别的第一概率和违章类别的交集；
67.确定冲突系数小于预设冲突系数的焦元为可识别焦元；
68.基于dempster合成规则，利用公式确定确定每个可识别焦元的基本可信度分配值；其中，表示焦元a
p
∩bq的基本可信度分配值；c表示融合结果；
69.确定基本可信度分配值最大的可识别焦元所对应类别为变电站作业行为的违章类别。
70.具体的，本发明包括以下步骤：
71.第一步，违章记录样本收集，针对每次违章，记录其违章表象；
72.第二步，人工违章数据标定，通过人工将搜集到的违章记录样本收集进行分类，并依据违章的表象进行手动标定，将每条违章记录归属于不同的分类；形成违章表象(违章描述)到违章分类的映射样本集；
73.第三步，违章表象知识实体标识，知识实体是指的可以是现实世界中的事物，比如人、地名、公司等，知识实体分类如表1所示：
74.表1知识实体分类表
75.序号类别举例1设备变压器2工器具螺丝刀、梯子、安全帽3设施变电站4故障短路5操作合闸6动作开、爬上7人名张三8时间某年某月某日9地点某市10组织机构xx供电局
76.第四步，构建知识实体库，形成知识实体词向量；
77.第五步，构建基于双向长短期记忆网络的双实体识别模型，利用双向长短期记忆网络(bi-lstm)将违章表象描述的文档进行知识实体的提取，bi-lstm的倒数第二层单元数
量为违章类型数量，网络的输出层选用softmax函数。模型1形成的是1-6类实体词汇对于违章类别的映射，该模型描述的是行业知识与违章类型之间的关系，模型2形成的是7-9对违章类别的映射，该模型描述的是该地点、时间、组织与违章类型之间的关系。
78.5.1训练模型：模型1的训练输入是每条违章记录中的实体类型为1-6类的实体词向量，训练输出是违章类型；模型2的训练输入是每条违章记录中的实体类型为7-9类的实体词向量，训练输出是违章类型；选取80％的违章样本进行训练。
79.5.2模型验证：选取20％的违章样本进行验证，验证识别准确率。
80.第六步，违章分类应用中，由安全监察人员记录违章表象；
81.第七步，获取违章类型概率：将违章表象输入模型1和模型2，去掉softmax层的，观测倒数第二层各单元的输出，该层的输出为违章表象对应各类违章的概率；
82.第八步，信息融合，融合模型1和模型2的判断结果，形成最终违章分类判据：
83.8.1所有可能出现的违章类型形成的完备集合用θ来表示，且θ中的所有元素存在互斥关系，表示为：
[0084][0085]
其中θj为第j种违章；此处θ是单一分类的集合，例如：两票违章、工器具违章或管理人员违章等。
[0086]
8.2构建幂集2
θ
，表示为：
[0087][0088]
在诊断框架θ中，它的任意子集a都对应着违章分类框架的答案，其中的任意元素为焦元；焦元指的是信度函数非零的证据集合。此处幂集2
θ
是可能出现的违章的集合。其中，φ表示无违章，θ1至均表示单一违章，θ1∪θ2是两者同时发生，例如在两票违章的同时存在工器具违章，以此类推。
[0089]
8.3利用双信度函数dempster法则，对模型1和模型2的结果进行融合，计算出一个新的基本信任分配函数，即证据的合成。假设两个模型获得证据，f1和f2为基本信任分配的概率(此概率是第七步得到的)，a
p
和bq为两个违章分类的焦元。其中，a
p
和bq均表示违章种类，此处是两种独立模型的证据同时汇集到c中，因此c是一个违章判定的子集(来自于2
θ
)。a的是来自模型1的判定，b是来自模型2的判定，两者合成后的结果为c。
[0090]
根据dempster合成规则，a
p
∩bq的基本可信度分配为：
[0091][0092]
其中冲突系数k为：
[0093][0094]
k表示证据间的冲突程度，其值越大说明证据之间的冲突越大。当k≈1时，证据是矛盾的，可以认定该违章证据分困难。
[0095]
8.4违章分类选取：选取最大值的焦元为最终违章分类的结果。因为
所有2
θ
中的子集都会有一个合成的结果，因此选择计算出的最大值作为最终的违章分类判定结果。表2为部分识别结果。
[0096]
表2部分识别结果示例表
[0097][0098]
下面是表2的组合计算过程：
[0099]
1)首先计算冲突系数k：
[0100][0101]
此处，m1(.)表示第一概率；m2(.)表示第一概率；b和c表示不同违章种类；
[0102]
2)计算关于各组合的基本可信度分配值：
[0103]
违章种类为“两”的基本可信度分配值：
[0104][0105]
违章种类为“工”的基本可信度分配值：
[0106][0107]
违章种类为“管”的基本可信度分配值：
[0108][0109]
违章种类为“{两，工}”的基本可信度分配值：
[0110][0111]
违章种类为{两，工，管}的基本可信度分配值：
[0112][0113]
此外，本发明还提供了一种变电站作业违章的自动分类系统，包括：
[0114]
行为数据获取模块，用于获取变电站作业的行为数据；行为数据包括自然实体词向量和社会实体词向量；自然实体词向量用于表述变电站作业行为的设备、工器具、设施、故障、操作和动作；社会实体词向量用于表述变电站作业行为的时间、地点、操作员姓名和组织机构。
[0115]
第一分类模块，用于将自然实体词向量输入到第一违章分类模型中，得到第一分类结果；第一违章分类模型是利用历史自然实体词向量，对双向长短期记忆网络进行训练得到的；
[0116]
第二分类模块，用于将社会实体词向量输入到第二违章分类模型中，得到第二分类结果；第二违章分类模型是利用历史社会实体词向量，对双向长短期记忆网络进行训练得到的；
[0117]
第三分类模块，用于根据第一分类结果和第二分类结果，利用dempster法则确定违章类别。
[0118]
历史自然实体词向量获取模块，用于获取历史自然实体词向量；
[0119]
第一训练模块，用于以历史自然实体词向量为输入，以历史行为的类别为期望输出，对双向长短期记忆网络进行训练，得到第一违章分类模型。
[0120]
历史社会实体词向量获取模块，用于获取历史社会实体词向量；
[0121]
第二训练模块，用于以历史社会实体词向量为输入，以历史行为的类别为期望输出，对双向长短期记忆网络进行训练，得到第二违章分类模型。
[0122]
其中，第三分类模块包括：
[0123]
违章类型完备集合构建单元，用于构建违章类型完备集合；
[0124]
幂集确定单元，用于确定违章类型完备集合的幂集；幂集包括违章类型完备集合，以及违章类型完备集合中任意两个种类交集；
[0125]
冲突系数计算单元，用于根据第一分类结果和第二分类结果，采用公式确定幂集中每个焦元的冲突系数；第一分类结果包括变电站作业行为是每种违章类别的第一概率；第二分类结果包括变电站作业行为是每种违章类别的第二概率；其中，k表示冲突系数；f1(a
p
)和f2(bq)分别表示违章类别a
p
的第一概率和违章类别bq第二概率；φ表示非违章行为；焦元a
p
∩bq表示违章类别的第一概率和违章类别的交集；
[0126]
可识别焦元确定单元，用于确定冲突系数小于预设冲突系数的焦元为可识别焦元；
[0127]
基本可信度分配值确定单元，用于基于dempster合成规则，利用公式确定确定每个可识别焦元的基本可信度分配值；其中，表示焦元a
p
∩bq的基本可信度分配值；c表示融合结果；
[0128]
违章类别确定单元，用于确定基本可信度分配值最大的可识别焦元所对应类别为变电站作业行为的违章类别。
[0129]
本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。
[0130]
本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处。综上，本说明书内容不应理解为对本发明的限制。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：基于设备维护的过程跟踪方法、装置、设备及存储介质与流程

一种变电站作业违章的自动分类方法及系统

相关文献

最热文献