基于事理图谱的化工异常事件检测方法及系统与流程

2022-03-09 07:50:23 来源：中国专利 TAG：

1.本发明涉及化工异常事件检测技术领域，特别是涉及基于事理图谱的化工异常事件检测方法及系统。

背景技术：

2.本部分的陈述仅仅是提到了与本发明相关的背景技术，并不必然构成现有技术。
3.化工生产过程具有易燃易爆、副产毒性强、工艺风险高等特性，往往生产过程中的一个“微小”失误事件，即可能演化成火灾、爆炸、中毒等重大事故。海因里希法则认为任何事故的发生都不是一个孤立的事件，而是一系列事件相继发生的结果。这些“小事件”频繁发生在生产现场却常常被人忽视，当这些不安全因素产生汇聚时，将会引发更大的事件、甚至事故，严重时可能造成灾难性的后果，如重大经济损失、人员伤亡、环境污染，甚至会波及到相邻工厂，引发多米诺效应。因此，如果能够准确发现可能演化为事故的异常事件，并能正确分析其可能的事故演化态势，将在保障生产安全、降低事故发生概率等方面具有重要意义。
4.对化工异常事件的分析和判定往往借助专家经验。当化工生产过程发生异常事件时，专家根据历史相似事件的处置经验，对异常事件进行分析和演化趋势判定，从而形成异常事件处置方案。此类方法，由于现场环境复杂性，事件演化的多样性和专家经验的差异，给方案的形成带来很大的不确定性风险。如何能将历史事故的处置经验形成可复用的专家知识，借助于信息技术与人工智能方法进行全面分析和判定，是分析当前事故隐患、发现异常事件的可能事故演化的重要途径。
5.已有的异常事件检测和分析方法多是基于事故分析模型的，如故障树分析(fta)、事件树分析(eta)、蝴蝶结分析法(bow-tie)、危险与可操作性分析法(hazop)等，这些分析法或是基于单个事故的成因分析或是基于某个装置、设备的安全分析结果——难以形成大量历史案例的归类和汇总。因此，无论是基于贝叶斯网络、随机网络、神经网络等技术发现的异常事件检测、事故推演和情景分析，都仅仅只是以事故为单位的检索和分析，没有形成事故的汇聚分析，因而，不能充分表达多源信息的事件，也难以充分挖掘相似事件的隐含信息，构建的场景不能够全面捕获历史案例的变化和演化，因而对异常事件的检测和演化分析中存在准确性和完整性不足的问题。
6.除多数基于事故分析模型方法外，还存在基于图谱构建模型。例如：中国发明专利，公开号cn110968699a-一种基于事理推荐的逻辑图谱构建及预警方法和装置和中国发明专利，公开号cn108052576a-一种事理知识图谱构建方法及系统等。
7.中国发明专利，公开号cn110968699a-一种基于事理推荐的逻辑图谱构建及预警方法和装置，该专利在构建图谱方面：根据指定的事件之间的逻辑关系类型进行事理抽取，根据事件抽取结果建立事理图谱。所述事理图谱优点既关注事件外部之间的演化逻辑关系，又关注事件本身丰富的属性信息。但该专利缺少事件抽象层面的顶层结构设计，只是事故案例的图谱。
8.中国发明专利，公开号cn108052576a-一种事理知识图谱构建方法及系统，该专利构建事理知识图谱由宏观事件层、微观知识层和事理知识本体层构成，虽然采用了本体、微观、宏观的分层结构化网络关系，但是构建的事理图谱在本体层、微观层和事件层是相互分离，信息不连通难以发现事件间深层次的共性。

技术实现要素：

9.为了解决现有技术的不足，本发明提供了基于事理图谱的化工异常事件检测方法及系统；提出基于事理图谱的异常事件检测，通过事理图谱的概念图谱抽象技术汇聚相似事件，通过案例图谱形成每个事故案例的具体成因和演化表达，既而不仅能够发现异常事件的共性信息，又能表示不同案例的个性变化形式，为能准确检测异常事件的历史共性和不同情景演化提供了基础知识组织形式。基于此历史事故案例的知识组织形式，本发明提供一种融合整体事故演化的过程关系的异常事件检测方法，可以更加准确的预测事故发生的类型，并快速进行对其提供应急处置方案。
10.第一方面，本发明提供了基于事理图谱的化工异常事件检测方法；
11.基于事理图谱的化工异常事件检测方法，包括：
12.获取待检测的化工事故报告；
13.对待检测的化工事故报告进行预处理，得到待检测化工事故报告的文本向量；
14.根据待检测化工事故报告的文本向量和训练后的图注意力网络模型，确定待检测化工事故报告对应的事故类型和案例类型；
15.其中，所述图注意力网络模型，是基于事理图谱训练得到的。
16.第二方面，本发明提供了基于事理图谱的化工异常事件检测系统；
17.基于事理图谱的化工异常事件检测系统，包括：
18.获取模块，其被配置为：获取待检测的化工事故报告；
19.预处理模块，其被配置为：对待检测的化工事故报告进行预处理，得到待检测化工事故报告的文本向量；
20.预测模块，其被配置为：根据待检测化工事故报告的文本向量和训练后的图注意力网络模型，确定待检测化工事故报告对应的事故类型和案例类型；
21.其中，所述图注意力网络模型，是基于事理图谱训练得到的。
22.第三方面，本发明还提供了一种电子设备，包括：
23.存储器，用于非暂时性存储计算机可读指令；以及
24.处理器，用于运行所述计算机可读指令，
25.其中，所述计算机可读指令被所述处理器运行时，执行上述第一方面所述的方法。
26.第四方面，本发明还提供了一种存储介质，非暂时性地存储计算机可读指令，其中，当所述非暂时性计算机可读指令由计算机执行时，执行第一方面所述方法的指令。
27.第五方面，本发明还提供了一种计算机程序产品，包括计算机程序，所述计算机程序当在一个或多个处理器上运行的时候用于实现上述第一方面所述的方法。
28.与现有技术相比，本发明的有益效果是：
29.1、该方法根据专家经验，设计一个描述了化工事件之间的演化规律和模式的事理图谱。此图谱为后续化工事理演化、异常事件检测提供基础；
30.2、基于gat的融合图模型，在进行化工事故演化推理的同时考虑了图节点事件之间的顺承、因果、条件和上下位等事理逻辑关系，为后续的检索、演化推理、分类决策提供优质数据基础，提高了分类的准确率；
31.3、该方法充分挖掘数据中的隐含信息，高效的表达多元信息事件和敏感信息，有助于增强化工异常事件的表示以及融合周围节点信息的潜力；
32.4、该模型对于给定异常事件做到高效匹配事理图谱节点，快速准确提供异常事件相近历史案例，为其后续提供演化分析和应急处置提供基础。
33.5、本专利在事件演化结构的基础上，构建既包含事件演化关系又包含事件抽象关系的分层事理图谱网络结构；同时，本专利在检索方面，采用关联事件结构关系的向量化表示，能够实现基于历史共性事件完成对当前异常事件语义检索。
34.6、本专利采用的相互关联的分层结构——概念事理层与案例事理层之间的连线代表着事件的抽象与泛化关系，代表概念事理网络层节点是案例事理网络层节点的更抽象的语义表示，概念事理网络层节点能够泛化成任意案例事理网络层节点。概念事理网络层与案例事理网络层间语义对齐有效发现不同事件间深层次的共性，进而能够发现的事件本质联系及知识。
附图说明
35.构成本发明的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。
36.图1是本发明所提出的描述了事件之间的演化规律和模式的化工事理图谱。
37.图2是本发明中提出基于事理图谱的化工异常事件的检测方法与系统。
具体实施方式
38.应该指出，以下详细说明都是示例性的，旨在对本发明提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
39.需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本发明的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
40.另外，为了便于清楚描述本发明实施例的技术方案，在本发明实施例中，采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。本领域技术人员可以理解“第一”、“第二”字样并不对数量和执行次序进行限定，并且“第一”、“第二”等字样也并不限定一定不同。
41.在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。
42.本实施例所有数据的获取都在符合法律法规和用户同意的基础上，对数据的合法应用。
43.实施例一
44.本实施例提供了基于事理图谱的化工异常事件检测方法；
45.如图2所示，基于事理图谱的化工异常事件检测方法，包括：
46.s101：获取待检测的化工事故报告；
47.s102：对待检测的化工事故报告进行预处理，得到待检测化工事故报告的文本向量；
48.s103：根据待检测化工事故报告的文本向量和训练后的图注意力网络模型，确定待检测化工事故报告对应的事故类型和案例类型；
49.其中，所述图注意力网络模型，是基于事理图谱训练得到的。
50.进一步地，s101：获取待检测的化工事故报告；其中，待检测的化工事故报告至少包括：事故报告标题、事故报告描述信息(事故的时间、地点、起因以及事故所造成人员伤亡、财产损失等)。
51.进一步地，s102：对待检测的化工事故报告进行预处理，得到待检测化工事故报告的文本向量；具体包括：
52.对待检测的化工事故报告进行分词处理；
53.对分词处理结果，进行去掉停用词处理；
54.对去掉停用词的处理结果，进行词干提取处理，得到若干个词干；
55.对于提取的每个词干，生成每个词干向量；
56.求取所有词干向量的平均值，将所述平均值作为待检测化工事故报告的文本向量。
57.示例性地，所述词干提取，采用hanlp分词工具。
58.hanlp是由一系列模型与算法组成的java工具包，目标是普及自然语言处理在生产环境中的应用。hanlp具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。
59.示例性地，所述对于提取的每个词干，生成每个词干向量；采用word2vec来实现。
60.示例性地，首先对于匹配事件经过数据清理、分词、去停词、提取词干等预处理后，就可以使用word2vec工具包进行处理，从而得到表征每个词语的给定维数的向量。然后进一步计算文本的向量，可用文本中词语的向量的平均值来表征该事件文本的向量。
61.考虑到危化品专用名词的构成特征，自定义领域词库信息，采用最大化匹配模式，使用jieba中文分词工具，基于领域词典与通用词典混合模式对词进行自动抽取方法，对面向文本的分词提取方法进行设计与实现。
62.在采用gat模型进行周围节点融合时，利用构建好的事理图谱，经行分词、去停词、提取词干，将分出的词进行word2vec得到128维度向量，采用这些词向量的平均值来表征该事件文本的向量。
63.进一步地，所述图注意力网络模型，包括：依次连接的第一图注意力网络和第二图注意力网络。
64.示例性地，所述第一图注意力网络和第二图注意力网络，均采用图注意力网络gat来实现。gat的英文全称为graph attention network。
65.进一步地，如图1所示，所述事理图谱，获取过程包括：
66.构建训练集和测试集；所述训练集和测试集，均包括m个已知事故类型和每类事故
所包含的若干种案例类型；
67.根据每个事故类型，和每个事故类型对应的若干种案例类型，构建每个事故类型对应的子图，得到案例事理网络层；
68.对所有的父节点，按照致灾因子、承灾体、事故类型和事故后果的事故链路线，结合事故发生的因果关系以及事故演化过程进行连线，得到概念事理网络层；
69.案例事理网络层和概念事理网络层合并后，得到事理图谱。
70.进一步地，构建子图的过程中，将每个事故类型作为父节点，将当前事故类型所对应的所有案例类型作为子节点，根据父节点与子节点之间是否存在包含关系进行连线。
71.示例性地，本发明的方案如图2所示，事理图谱构建。结构上，事理图谱是一个有向有环图，其中节点代表事件，有向边代表事件之间的顺承、因果、条件和上下位等事理逻辑关系。
72.事理图谱采用分层网络结构：
73.第一层为概念事理网络层，其中每个节点为通过m个事故报告的事件节点高度抽象出的事故节点事件，节点之间的连线代表事故之间的演化关系。
74.第二层为案例事理网络层，其中每个节点为事故报告抽象出的案例事件的节点或者案例故障树事件节点，节点之间的连线代表该事故中事件之间的演化关系。
75.第一层网络节点与第二层网络节点之间的连线代表着事件的抽象与泛化关系，代表第一层网络节点是第二层网络节点的更抽象的语义表示，第一层网络节点能够泛化成任意第二层网络节点。
76.概念事理网络层的构建。本发明基于事理图谱相关理论及前人对事故链模型的相关研究，按照致灾因子
→
承灾体
→
事故类型
→
事故后果的事故链路线，结合事故发生的因果关系及事故演化过程建立了一般性的化工领域事理图谱网络模型，并依据历史化工事故数据以及实际调研进一步完善了该模型。
77.案例事理网络层构建。通过网络爬虫对相关化工领域事故报告网站进行数据爬取，共获取到事故分析报告1661篇，对事故分析报告进行筛选之后，得到储罐类事故报告165篇。对爬取的事故案例按照事故的演化关系进行事件抽取，用来描述事件的叙述链，然后在此基础上构建事故的事理图谱。
78.概念事理网络层与案例事理网络层间语义对齐。本发明采用众包方式对文本事故报告子事件文本与概念事理图谱节点、典型案例逻辑树节点与概念事理图谱节点进行知识标注，标注人员可以选中某实体对其进行标注，标注的知识在多个数据源中互联互通。若待标注的知识已存在于知识库中，则智能提示补全，节约标注时间，提高标注效率，保证标注的统一性。
79.进一步地，训练后的图注意力网络模型，具体训练过程包括：
80.获取m个已知事故类型和每类事故所包含的若干种案例类型；其中，m为正整数；
81.对每个事故类型构建子图，得到m个子图；
82.对每个事故类型下的事故报告进行向量提取，得到若干个文本向量；
83.将m个子图和每个子图对应的若干个文本向量，共同输入到第一图注意力网络中，得到m个父节点的第一向量；
84.将m个父节点的第一向量、概念事理网络层中m个父节点以及m个父节点之间的连
接关系，共同输入到第二图注意力网络中，得到m个父节点的第二向量；
85.将测试集中的报告文本向量与m个父节点的第二向量进行张量分解，进行向量相似度比较，对第一图注意力网络和第二图注意力网络进行优化，得到训练后的图注意力网络模型。
86.进一步地，s103：根据待检测化工事故报告的文本向量和训练后的图注意力网络模型，确定待检测化工事故报告对应的事故类型和案例类型；具体包括：
87.将待检测化工事故报告的文本向量，和待检测化工事故报告的子图，输入到训练后的图注意力网络模型中，得到待检测化工事故报告的预测向量；
88.将待检测化工事故报告的预测向量与m个父节点的第二向量，进行相似度比较，得出最高相似度节点a对应的事故报告类型，为待检测化工事故报告的事故类型；
89.将待检测化工事故报告的文本向量与最高相似度节点a下所有案例节点的的文本向量进行相似度比较，得出最高相似度案例节点b对应的案例类型，为为待检测化工事故报告的案例类型。
90.通过设计一个描述了事件之间的演化规律和模式的事理图谱，能够在事理演化推演的过程中同时考虑到事件之间的顺承、因果、条件和上下位等事理逻辑关系，保证了异常事件检测的准确性；
91.基于gat模型，实现特定化工异常事件的检测和事件演化推理，经由元数据进行embedding，通过gat深度网络模型融合周围事件的事理逻辑关系，构建新兴的异常事件检测模型。
92.示例性地，第一图注意力网络的工作原理是：
93.提取事理图谱中165个父节点以及这些节点的下的化工事故案例，形成165个子图，对每个子图进行gat操作：
94.假设某父节点下包含n个节点，每个节点的特征向量为hi，维度是f，如下所示：
95.h＝{h1,h2,...,hn}，h1∈rfꢀꢀꢀ
(1)
96.对节点特征向量h进行线性变换，可以得到新的特征向量h'i，维度是f'，如下所示，w为线性变换的矩阵：
97.hi'＝whi，w∈r
f'
×fꢀꢀꢀ
(2)
98.h'＝{h'1,h'2,...,h'n}，h'i∈rfꢀꢀꢀ
(3)
99.节点j是节点i的邻居，则可以使用attention机制计算节点j对于节点i的重要性，即attention score：
100.e
ij
＝attention(whi,whj)
ꢀꢀꢀ
(4)
[0101][0102]
gat具体的attention做法如下，把节点i、j的特征向量h'i、h'j拼接在一起，然后和一个2f'维的向量a计算内积。激活函数采用leakyrelu，公式如下：
[0103]
[0104]
k个attention的输出与线上的次数相乘。
[0105][0106]
β是h1节点与周围节点之间连接线上的数值
[0107]
经过gat后提取出代表标准图上165节点的128维向量。
[0108]
将经过第一图注意力网络gat生成融合周围节点信息的165个标准节点的128维向量提取出来作为概念事理网络层上165个节点的特征向量。
[0109]
在生成的事理图谱上，经过第二图注意力网络再次进行处理，生成考虑到事件之间的顺承、因果、条件和上下位等事理逻辑关系新的128维向量。
[0110]
对于新来的事故报告，采取分词、去掉停用词、提取词干，对于每一个词经过word2vec生成128向量，对于一个新的化工事故报告，用文本中词语的向量的平均值来表征新来的事故报告文本的向量。
[0111]
生成新来的事故报告文本的向量与生成的165个向量进行张量分解，进行多维度的向量相似度比较，对于产生的loss重新回传两层gat，优化网络。
[0112]
根据训练好的模型预测，一则事故报告的属于标准图的那个节点。采用相似度计算：让新来的事故报告文本的向量与该节点下所有案例节点计算。得到与之匹配度最高的案例，得到它的演变出来方法。
[0113]
实施例二
[0114]
本实施例提供了基于事理图谱的化工异常事件检测系统；
[0115]
基于事理图谱的化工异常事件检测系统，包括：
[0116]
获取模块，其被配置为：获取待检测的化工事故报告；
[0117]
预处理模块，其被配置为：对待检测的化工事故报告进行预处理，得到待检测化工事故报告的文本向量；
[0118]
预测模块，其被配置为：根据待检测化工事故报告的文本向量和训练后的图注意力网络模型，确定待检测化工事故报告对应的事故类型和案例类型；
[0119]
其中，所述图注意力网络模型，是基于事理图谱训练得到的。
[0120]
此处需要说明的是，上述获取模块、预处理模块和预测模块对应于实施例一中的步骤s101至s103，上述模块与对应的步骤所实现的示例和应用场景相同，但不限于上述实施例一所公开的内容。需要说明的是，上述模块作为系统的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
[0121]
上述实施例中对各个实施例的描述各有侧重，某个实施例中没有详述的部分可以参见其他实施例的相关描述。
[0122]
所提出的系统，可以通过其他的方式实现。例如以上所描述的系统实施例仅仅是示意性的，例如上述模块的划分，仅仅为一种逻辑功能划分，实际实现时，可以有另外的划分方式，例如多个模块可以结合或者可以集成到另外一个系统，或一些特征可以忽略，或不执行。
[0123]
实施例三
[0124]
本实施例还提供了一种电子设备，包括：一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序；其中，处理器与存储器连接，上述一个或多个计算机程序被存
储在存储器中，当电子设备运行时，该处理器执行该存储器存储的一个或多个计算机程序，以使电子设备执行上述实施例一所述的方法。
[0125]
应理解，本实施例中，处理器可以是中央处理单元cpu，处理器还可以是其他通用处理器、数字信号处理器dsp、专用集成电路asic，现成可编程门阵列fpga或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0126]
存储器可以包括只读存储器和随机存取存储器，并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如，存储器还可以存储设备类型的信息。
[0127]
在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。
[0128]
实施例一中的方法可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。为避免重复，这里不再详细描述。
[0129]
本领域普通技术人员可以意识到，结合本实施例描述的各示例的单元及算法步骤，能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。
[0130]
实施例四
[0131]
本实施例还提供了一种计算机可读存储介质，用于存储计算机指令，所述计算机指令被处理器执行时，完成实施例一所述的方法。
[0132]
以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种二维码处理方法、系统、存储介质及电子设备与流程

基于事理图谱的化工异常事件检测方法及系统与流程

相关文献

最热文献