一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

顾及时空过程与成灾机理的自然灾害知识超图构建方法

2023-01-17 12:44:17 来源:中国专利 TAG:


1.本发明涉及灾害大数据挖掘和地学知识建模技术领域,尤其是涉及顾及时空过程与成灾机理的自然灾害知识超图构建方法。


背景技术:

2.目前,自然灾害监测方法主要包括地质监测、遥感监测、“空-天-地”一体化监测等,其为自然灾害隐患监测和预测预警等提供了高精度多源监测的大数据,在人类防灾减灾和应急管理方面发挥了重要作用。但是,自然灾害具有时空演变的隐蔽性、突发性、不确定性,以及致灾条件不清,内部结构认知不足,变形破裂过程和成灾机理不明等复杂特点。而且,日积月累的海量自然灾害监测数据数据量大、来源广泛、结构复杂,但是只有很少一部分能够为自然灾害监测与预测分析提供有用的知识。因此,构建自然灾害领域知识体系和知识库,查清其致灾因子、孕灾环境、承灾体等机理知识和相互关系,有利于掌握自然灾害隐患底数,提高自然灾害早期监测和预报预警能力。
3.目前,通常采用关系数据库进行自然灾害信息的表达、存储与查询。此方法便于用户理解,但其数据查询只是一个用于限定数据库中某些区域的执行代码,无法获取自然灾害知识。部分学者探索了基于知识图谱的自然灾害知识表达,按照知识图谱的知识表示和组织管理方式,节点代表自然灾害实体,边代表自然灾害实体的属性及其之间的关系,构建自然灾害知识网状结构,形成机器可回溯、可理解、可解释、可计算的事实型自然灾害知识库。然而,自然灾害复杂多样的地质环境、外界诱发因素、独特的时空演化过程以及成灾机理等知识,特别是致灾因子、孕灾环境、承灾体之间复杂的多元关系,无法采用通用的知识图谱表达模型进行表达。此外,知识图谱采用三元组的形式存储数据,过分简化了现实世界中地理空间数据和自然灾害知识的复杂性、知识单元之间的复杂关系,难以表达自然灾害的成灾机理和时空演变过程。


技术实现要素:

4.本发明的目的在于提供自然灾害知识超图构建方法,首先,研究了顾及时空过程与成灾机理的自然灾害知识表达模型,对自然灾害事件概念性实体与关系进行建模,实现自然灾害基础属性特征、过程性知识和机理性知识的表达;然后,构建了“以时空为框架,以对象为核心”,揭示“状态-过程”时空演化过程和“规则特征-致灾模式”成灾机理的层次化自然灾害知识表示模型;最后,考虑了组成自然灾害的不同实体及其层级结构,顾及自然灾害不断演化发展的动态特性以及发展变化中形成的机理知识,构建了面向超图理论的自然灾害领域知识超图模型,从深度、广度和粒度三个方面刻画自然灾害知识单元及其语义关系。
5.为实现上述目的,本发明的顾及时空过程与成灾机理的自然灾害知识超图构建方法,具体包括如下步骤:步骤1:分析自然灾害的致灾因子、孕灾环境和承灾体三元素的特征和关联关系,
以及三元素在自然灾害时空发展过程中各阶段发挥的机理作用,凝练自然灾害的时空框架,构建自然灾害知识体系;步骤2:基于自然灾害知识体系,采用自顶向下和自底向上相结合的方式,分析自然灾害实体间的关系对成灾机理和时空发展过程的表达,抽象出层次化的自然灾害知识表达模型,包括概念层、要素层、规则层、模式层和实例层,并建立概念层和实例层两者之间的映射;步骤3:在结构化、半结构化、非结构化的数据源基础上,采用深度学习模型并辅以人工校正实现自然灾害实体与关系的抽取,并进行实体对齐与知识融合;步骤4:基于层次化的自然灾害知识表达模型和知识超图理论方法,进行概念层、要素层、规则层、模式层和实例层的自然灾害实体、实体的属性特征、以及各层之间的联系和映射的超边表示,实现基于超图的自然灾害实体与超关系知识表达以及自然灾害实例表达;步骤5:采用步骤1至步骤4对具体自然灾害事件进行分析,并基于typedb知识超图可视化平台,形成自然灾害知识超图。
6.进一步的,步骤3中选用crf、word2vec-bilstm-crf、bert-bilstm-crf模型对自然灾害实体抽取,选用cnn、attention-bilstm、transformer模型对自然灾害关系抽取,并加以人工辅助的方式得到自然灾害知识抽取结果。
7.进一步的,步骤3中采用词向量相似度判断自然灾害实体间对象名称、属性和时空发展过程之间的相似性,然后根据相似性进行实体对齐和知识融合。
8.进一步的,步骤4中基于超图的自然灾害实体知识表达具体包括自然灾害的概念层、要素层、规则层、模式层和实例层的建模;自然灾害的概念层建模的形式化表示:自然灾害的概念层建模的形式化表示:自然灾害的概念层建模的形式化表示:式中,v表示自然灾害事件的顶点集,表示外界致灾因子的顶点集,表示孕灾环境的顶点集,表示承灾体的顶点集;e表示自然灾害事件的超边集,为外界致灾因子超边,为孕灾环境超边,为承灾体超边;表示处于概念等级的超边,由超边所包含的实体组成,代表自然灾害知识体系的三个层次超边概念知识;表示自然灾害知识体系中所包含的实体;自然灾害的要素层建模的形式化表示为:式中,超边表示在某一特定时空状态下,自然灾害所受到的外界致灾因子的破坏、内在孕灾环境的变化和对承灾体造成的威胁;指自然灾害时空发展过程所处的状态,包括萌芽阶段、初始阶段、发展阶段和破坏阶段;
自然灾害的规则层建模的形式化表示为:式中,是单个要素层实体规则的超边,表示自然灾害要素的第i个规则;自然灾害的模式层建模的形式化表示为:式中,超边表示自然灾害的致灾模式,表示致灾模式的规则,指自然灾害时空发展过程所处的状态;自然灾害的实例层建模的形式化表达为:式中,表示第j条的自然灾害事件。
9.进一步的,步骤4中基于超图的自然灾害超关系表达具体包括sub关系、变化关系、包含关系、推理关系、属性关系和实例层语义关系;sub关系的形式化表示为:式中,和是自然灾害概念层中超边的上下级;表示自然灾害概念层中超边所包含的第n条子超边。
10.变化关系的形式化表示为:式中,指变化关系超边,某状态下的自然灾害实体在与其相邻的下一个时空发展状态下的自然灾害实体之前发生;包含关系的形式化表示为:式中,表示关系超边;推理关系在规则层和模式层之间展开,由多个规则节点确定唯一的致灾模式;属性关系的形式化表示为:式中,表示实例的属性超边,包含自然灾害事件e中属于该实例的事件内容;实例层语义关系的形式化表示为:式中,表示两个自然灾害事件之间的语义关系超边。
11.综上,本发明采用上述方法,具有如下优势:1)本发明模型考虑了组成自然灾害的不同实体及其层级结构,顾及自然灾害不断演化发展的动态特性以及发展变化中形成的机理知识,“以时空为框架,以对象为核心”揭示“状态-过程”时空演化和“规则特征-致灾模式”成灾机理的层次化自然灾害知识,搭建自然灾害数据向自然灾害知识超图映射的桥梁。2)本发明的自然灾害知识超图不仅能够继承现有知识图谱结构简单的优势,而且能够表达自然灾害致灾因子、孕灾环境、承灾体等复杂知识之间的多元复杂关系问题,在灾害领域具有较好的通用性,也能够在实际应用场景中,为自然灾害灾害管理和决策提供知识支撑。
附图说明
12.图1为本发明的整体流程;图2为本发明中滑坡知识超图构建技术流程;图3为本发明中滑坡知识体系;图4为本发明中滑坡知识概念模型;图5为本发明中基于超图的滑坡概念知识表达;图6为本发明中基于超图的滑坡实例知识表达;图7为本发明中基于超图的滑坡概念层与实例层的映射。
具体实施方式
13.以下结合附图和实施例对本发明的技术方案作进一步说明。
14.本发明的整体流程如图1所示。下面以滑坡灾害对本发明方法进行详细阐述,滑坡知识超图构建技术流程如图2所示,其具体分析过程见下文。
15.步骤1:如图3所示,分析滑坡的致灾因子、孕灾环境和承灾体三元素的特征和关联关系,以及三元素在滑坡时空发展过程中各阶段发挥的机理作用,凝练滑坡的时空框架,构建滑坡知识体系。
16.步骤2:如图4所示,基于滑坡知识体系,采用自顶向下和自底向上相结合的方式,分析实体间的关系对成灾机理和过程状态的表达,构建滑坡知识概念模型,抽象出层次化的滑坡知识表示模型,即概念层、要素层、规则层、模式层和实例层,建立概念模型(概念层)和实例模型(实例层)两者之间的映射,从深度、广度和粒度三个方面刻画滑坡知识的基本单元和关联关系。
17.步骤3:基于滑坡数据库、专著和文献、网页文本等结构化、半结构化、非结构化数据源,采用规则模型、机器学习与深度学习相结合的方式,辅以人工校正实现滑坡知识(实体 关系)抽取,得到结构化的滑坡知识抽取结果,并进行实体对齐与知识融合。
18.步骤4:如图5所示,基于层次化的滑坡知识表示模型和知识超图理论方法,进行概念层、要素层、规则层、模式层的滑坡实体、滑坡实体的属性特征(如基本属性特征、规则特征),以及各层之间的联系和映射的超边表示,实现基于超图的滑坡实体与超关系知识表达。如图6所示,基于层次化的滑坡知识表示模型和知识超图理论方法,实现实例层的滑坡实体、实体的属性特征及其之间的联系和映射的超边表示,实现基于超图的滑坡实例表达。
19.步骤5:如图7所示,采用步骤1至步骤4对滑坡事件进行具体分析,并基于typedb知识超图可视化平台,形成滑坡知识超图。
20.作为一种优选的技术方案,步骤1中滑坡事件组成对象分为致灾因子、孕灾环境和承灾体。致灾因子是导致滑坡发生的各种外界因素,包括自然因素和人为因素。孕灾环境是孕育产生滑坡的深层地质条件和地表地形地貌,是滑坡的内在控制因素。承灾体是被各种滑坡致灾因子和孕灾环境作用的对象,是人类社会和生态环境的集合。滑坡发生是在内外动力耦合协同作用下的结果,根据所属对象的不同,可以分为地质变形、地层岩性、地貌特征等。需要说明的是,不同对象可以借鉴相关领域分类方法,依据实际需要进行更加详细的类型划分。
21.作为本发明一种优选的技术方案,步骤1中滑坡时空发展过程包括4个状态阶段,分别为:初始变形阶段、等速变形阶段、加速变形阶段和破坏堆积阶段。
22.初始变形阶段:坡体变形初期,变形从无到有,后缘开始出现断续裂缝,变形曲线表现出相对较大的斜率,但随着时间的延续,变形曲线斜率有所减缓,表现出减速变形的特征。
23.等速变形阶段:在初始变形的基础上,在重力作用下和其他因素影响下,后缘裂隙贯通,黄土斜坡基本上以相近的速率继续变形,因受到外界因素的干扰,监测曲线会有所波动,但此阶段的宏观变形速率基本保持不变。
24.加速变形阶段:当斜坡体变形发展到一定阶段后,滑动面基本贯通,局部坍塌,变形速度加快,变形速率会呈现出不断加速增长的趋势,直至坡体整体失稳之前,变形曲线近于陡立,在此阶段,黄土基岩滑坡表现出的切线角比黄土内滑坡的切线角小。
25.破坏堆积阶段:当斜坡变形加速到一定程度后,整体急速下滑,加速滑动,在重力势能的作用下,滑体克服基底摩擦阻力向坡脚运动,滑速减慢,并堆积在一定范围内,形成新的地貌。
26.作为一种优选的技术方案,步骤2中滑坡实体间的关系对成灾机理和过程状态的表达包括三种类型,分别为事实型知识、时空过程知识、规则与机理知识。
27.事实型知识:包括组成滑坡的不同对象及其层级结构的概念型知识和实例型知识。
28.时空过程知识:通过要素层滑坡因素的演化过程及其在整个滑坡演化过程的不同状态,实现基于“状态-过程”的滑坡时空演化过程知识的表达,以四个演变阶段为状态划分的基本条件,刻画黄土滑坡致灾因子、孕灾环境、承灾体等滑坡因素在不同阶段的时空特征,以及易发生滑坡的过程性知识。
29.规则与机理知识:借助规则层(条件节点)和模式层(结果节点)的“条件-结果”抽象化知识表达,建立起滑坡多个规则性特征与唯一致灾模式之间的连接,实现滑坡发展变化中形成机理知识的完整表达。如图4所示,是基于“状态-过程”和“条件-结果”的抽象化知识表示,最内侧为滑坡概念层,通过关系传递到要素层,在要素层展示了不同状态下滑坡因素的动态演化过程,再从要素层到规则层得到滑坡的一系列规则特征。最外侧是模式层,通过基于“条件-结果”的规则知识表示方法建立起滑坡多个规则性特征与唯一致灾模式之间的连接。
30.作为一种优选的技术方案,步骤3中滑坡知识抽取的数据源包括三种类型,分为结构化数据、半结构化数据和非结构化数据。
31.结构化数据:主要来源于“天-空-地-内”监测手段解译的滑坡关系型数据库、影像
解译数据库和公开的滑坡数据库,可转化为csv格式的结构化数据直接存储到知识超图中。其中,关系型数据库通过二维表格对数字、符号等定量数据进行表示和存储,表格每一行代表一个滑坡事件,每一列代表滑坡事件的属性特征,同类型实体具有相同数量和种类的属性;影像解译数据库主要包含滑坡点位数据,此类数据滑坡事件数量多,但属性信息不够详细,只包含滑坡发生的时空信息(发生时间、发生位置)和滑坡的基础属性(长、宽、体积等);公开的滑坡数据库不仅包括政府网站上全球、全国大范围的数据,还包括学者构建的区域滑坡数据集。
32.半结构化数据:主要指新闻网站、气象网站和社交媒体等网站灾情数据,通常表现为xml文档、json文档等,通过解析xml文档、json文档,可转化为csv格式的结构化数据直接存储到知识超图中。
33.非结构化数据:主要以滑坡发生的地质环境、影响滑坡的气象变化和人为加卸载边坡变化等文字记录,滑坡实况照片、地图资料、卫星图像等图片,以及滑坡点监测录像等音视频的表达形式。针对该类型数据,优先选取质量较高的文本数据,并通过自动抽取的深度学习方法加人工审核的方式对文本中滑坡知识进行抽取,实现非结构化数据向结构化数据的转变。
34.非结构化数据的滑坡知识抽取的具体步骤包括:s1、构建中文文本(期刊文献、灾害报告等)滑坡事件信息标注语料库,标注的内容包括描述滑坡对象的名称、时间、位置、属性和行为信息要素。
35.s2、依据标注语料库,采用crf和bilstm-crf两种主流的知识抽取模型和word2vec、bert两种预训练向量模型,实现文本中滑坡实体与属性信息的自动抽取,利用crf学习转移特征的优势做输出信息的标签预测,进而完成对滑坡实体和属性特征值的抽取。
36.s3、依据标注语料库,选用crf、word2vec-bilstm-crf、bert-bilstm-crf模型对实体抽取,选用cnn、attention-bilstm、transformer 模型对关系抽取,其结果评价如表1所示。
37.表1 滑坡知识抽取评价结果注:准确率p表示预测正确的正例数据占预测为正例数据的比例;召回率r表示预测为正确的正例数据占实际为正例数据的比例;度量值f1=2*p*r/(p r),用于衡量准确率与召回率。
38.s4、通过计算词向量之间余弦相似度实现滑坡实体的对齐,进行滑坡知识融合。使用word2vec预训练向量模型生成滑坡实体的词向量,对模型进行微调,定义词组维数为100维,通过以下公式,衡量同类型标记下任意两实体之间的余弦相似度,余弦相似度的取值结果在0到1之间,结果越接近1,两实体的相似度越高。当余弦相似度大于阈值时,认为它们是
同一个滑坡实体,进行合并操作,并以人工辅助手段控制融合的精度。
39.式中,为经预训练向量模型处理的两滑坡实体的向量表示。
40.作为一种优选的技术方案,步骤4中基于超图理论的概念层、要素层、规则层、模式层与实例层的滑坡实体建模,各层建模过程具体如下。
41.概念层建模:滑坡的概念知识都表达在概念层中,滑坡知识体系的因素分为超边和实体,超边由属于该超边的实体组成。可形式化表示:和实体,超边由属于该超边的实体组成。可形式化表示:和实体,超边由属于该超边的实体组成。可形式化表示:式中,v表示滑坡事件的顶点集,表示致灾因子h的顶点集,表示孕灾环境p的顶点集,表示承灾体s的顶点集;e表示滑坡事件的超边集,为滑坡致灾因子超边,为滑坡孕灾环境超边,为滑坡承灾体超边;表示处于概念等级的超边,由超边所包含的实体组成,代表滑坡知识体系的三个层次超边概念知识;表示滑坡知识体系中所包含的实体。
42.要素层建模:要素层强调时空过程及其过程中滑坡因素产生的相互作用机制,侧重于基于“状态-过程”的时空知识表示。在粒度最细的概念实体上,叠加状态知识,表达“状态-过程”的要素层,蕴含丰富的时空状态信息,形式化表示为:式中,超边表示在某一特定时空状态下,滑坡所受到的外界致灾因子的破坏、内在孕灾环境的变化和对承灾体造成的威胁;指滑坡事件时空发展过程所处的状态,用于揭示同一滑坡因素不同阶段的动态变化以及在特定的状态下识别滑坡所需的滑坡因素,包括萌芽阶段、初始阶段、发展阶段和破坏阶段。
43.规则层建模:规则层实体通过对要素层实体的取值范围、类型及组合方式进行约束表达,规则层形式化表示为:式中,是单个要素层实体规则的超边,表示滑坡事件要素的第i个规则。
44.模式层建模:模式层实体由多个规则层实体共同作用的结果,基于规则进行推理得到滑坡的致灾模式。由多个状态下不同滑坡因素的不同规则可推理得到唯一确定的致灾模式,规则是条件,由n个条件得到唯一致灾模式的结果。
45.式中,超边表示滑坡事件的致灾模式,表示致灾模式的规则,指滑坡事件时空发展过程所处的状态。
46.实例层建模:实例层指滑坡事件,表示具体滑坡事件的属性和事件内容,不仅包括致灾因子、孕灾环境和承灾体所处的阶段规则特征属性,还包括时间属性、空间属性、灾害强度和灾害频率等自身属性特征。实例层的灾害事件形式化表达为:式中,表示第j个滑坡事件。
47.对于某一滑坡事件,其属性特征可形式化的表示为:式中,为规则性特征,为滑坡基本属性特征,表示由规则性特征和滑坡基本属性特征构成的超边。
48.作为一种优选的技术方案,步骤4中基于超图理论的滑坡超关系建模,包括sub关系、变化关系、包含关系、推理关系、属性关系和实例层语义关系。
49.sub关系:是指具有共同属性的不同超边之间的层次分类,表示上下级超边之间的逻辑层次分类结构。sub关系形式化表示为:式中,和是滑坡概念层中超边的上下级;表示自然灾害概念层中超边所包含的第n条子超边。
50.变化关系:是指要素层中多个连续的状态下要素之间的关系,除描述滑坡的时空演化过程外,还可用来揭示滑坡发生的机理节点表示过程知识。变化关系形式化表示为:式中,指变化关系超边,某状态下的滑坡实体在与其相邻的下一个时间发展状态下的滑坡实体之前发生。
51.包含关系:滑坡要素层和规则层之间为包含关系,规则层是要素层实体的规则性知识总结。对于某一要素层实体,可形成一个规则超边,包含属于该实体的规则层实体。包含关系形式化表示为:式中,表示包含关系。
52.推理关系:在规则层和模式层之间展开,由多个规则节点确定唯一的致灾模式。本方案提出基于“规则-模式”的规则知识表示方法,借助“条件”复合节点,实现滑坡知识超图中规则知识的完整表达。
53.属性关系:滑坡事件包含该事件的各实体内容,与滑坡事件的属性特征
之间存在属性关系,包括数据属性和对象属性。属性关系用于连接要素层和实例层,形式化表示为:式中,表示实例的属性超边,包含滑坡事件e中属于该实例的事件内容;与要素层中的相应实体节点同名。
54.实例层语义关系:实例层中,许多滑坡事件,特别是等级高、强度大的滑坡发生以后,常常诱发出一连串的其他灾害,原生灾害事件与次生灾害事件之间存在引发、群发等语义关系。实例层语义关系形式化表示为:式中,表示两个滑坡事件之间的语义关系超边。
55.作为一种优选的技术方案,步骤5以“党川2#”滑坡为例,滑坡知识超图概念层实现了对滑坡概念实体的知识表示建模,不同超边由其所包含的概念实体组成,低层次的超边由高层次的超边所包含,是对滑坡知识的高度总结(图5)。实例层和概念层模型添加了系统化的“党川2#”滑坡实例(图6)。概念知识与实例知识的映射包括“党川2#”滑坡事件实体与模式层致灾模式实体之间建立映射关系,“党川2#”滑坡事件特征值与要素层的状态实体建立映射关系,“党川2#”滑坡事件的各个特征值节点对应唯一的滑坡状态,映射到相应的要素层状态节点,从零散具体的知识映射到系统抽象的知识,进而表达“党川2#”滑坡实例的动态演化过程和成灾机理(图7)。
56.以上是本发明的具体实施方式,但本发明的保护范围不应局限于此。任何熟悉本领域的技术人员在本发明所揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内,因此本发明的保护范围应以权利要求书所限定的保护范围为准。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献