一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

地质灾害事理图谱的构建方法、系统、装置和存储介质与流程

2021-12-07 21:03:00 来源:中国专利 TAG:


1.本发明涉及图谱构建技术领域,尤其是一种地质灾害事理图谱的构建方法、系统、装置和存储介质。


背景技术:

2.相关技术中,地质灾害是当前最严重的自然灾害之一,直接或间接地危害人类生命财产安全,对经济,资源和环境都造成极大的破坏。每年因地质灾害造成的损失极其严重。近些年,随着对地质灾害预警方式的重视,防治和应急工作也在不断改变。在地质灾害频发的时间段,几乎每天都能在互联网上看到关于地质灾害的新闻报道。这些报道中蕴含了丰富的地质灾害事件描述文本,可以作为实时事件信息的重要数据来源,与传统的信息采集方式形成互补。然而互联网文本信息相对比较零散,因而不能全面地反映地质灾害事件的状况。


技术实现要素:

3.本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种地质灾害事理图谱的构建方法、系统、装置和存储介质,能够使互联网文本信息有效反应地质灾害事件的状况。
4.一方面,本发明实施例提供了一种地质灾害事理图谱的构建方法,包括以下步骤:
5.构建地质灾害事理图谱的模式层;
6.获取若干个地质灾害文本;
7.根据所述模式层从所述地质灾害文本中抽取地质灾害事件;
8.根据所述地质灾害事件从所述地质灾害文本中抽取地质灾害事件关系;
9.根据抽取到的地质灾害事件和抽取到的地质灾害事件关系融合多个地质灾害事件,得到地质灾害事理图谱。
10.在一些实施例中,所述构建地质灾害事理图谱的模式层,包括:
11.通过预先设置的事件定义信息构建地质灾害事理图谱的模式层;
12.其中,所述预先设置的事件定义信息包括地质灾害事件类型的定义信息、不同类型的地质灾害事件触发词和事件元素角色的定义信息、事件关系的定义信息。
13.在一些实施例中,所述根据所述模式层从所述地质灾害文本中抽取地质灾害事件这一步骤,包括地质灾害事件检测步骤和事件元素抽取步骤;
14.其中,所述地质灾害事件检测步骤,包括:
15.从所述地质灾害文本中识别出包含所述不同类型的地质灾害事件触发词和事件元素角色的定义信息的文本句;
16.根据所述地质灾害事件类型的定义信息判断所述文本句中的事件类型;
17.所述事件元素抽取步骤,包括:
18.确定完成所述地质灾害事件检测步骤,在所述文本句中抽取事件元素。
19.在一些实施例中,通过中文事件检测模型执行所述地质灾害事件检测步骤,所述中文事件检测模型为基于字级别搭建的事件检测模型,所述中文事件检测模型内设有词汇特征,所述中文事件检测模型包括特征表示层、序列特征建模层和条件随机场层。
20.在一些实施例中,所述特征表示层内设有事件类型特征和相对距离特征,所述事件元素抽取步骤在设有事件类型特征和相对距离特征的特征表示层中执行。
21.在一些实施例中,所述抽取地质灾害事件关系这一步骤,包括抽取显式关系步骤和抽取隐式关系步骤;
22.所述抽取显式关系步骤,包括:
23.获取所述地质灾害文本中关系提示词和句法模式;
24.根据所述关系提示词和所述句法模式抽取地质灾害事件的因果关系、顺承关系和并列关系;
25.所述抽取隐式关系步骤,包括:
26.提取所述地质灾害文本中的事件语义信息;
27.根据事件语义信息对不同事件进行分类;
28.根据分类结果抽取所述地质灾害文本中的隐式关系。
29.在一些实施例中,通过关系抽取模型执行所述抽取隐式关系步骤,所述关系抽取模型包括语言表示模型、双向长短时记忆网络模型和注意力模型。
30.另一方面,本发明实施例提供了一种地质灾害事理图谱的构建系统,包括:
31.构建模块,用于构建地质灾害事理图谱的模式层;
32.获取模块,用于获取若干个地质灾害文本;
33.第一抽取模块,用于根据所述模式层从所述地质灾害文本中抽取地质灾害事件;
34.第二抽取模块,用于根据所述地质灾害事件从所述地质灾害文本中抽取地质灾害事件关系;
35.融合模块,用于根据抽取到的地质灾害事件和抽取到的地质灾害事件关系融合多个地质灾害事件,得到地质灾害事理图谱。
36.另一方面,本发明实施例提供了一种地质灾害事理图谱的构建装置,包括:
37.至少一个存储器,用于存储程序;
38.至少一个处理器,用于加载所述程序以执行上述的地质灾害事理图谱的构建方法。
39.另一方面,本发明实施例提供了一种存储介质,其中存储有计算机可执行的程序,所述计算机可执行的程序被处理器执行时用于实现上述的地质灾害事理图谱的构建方法。
40.本发明实施例提供的一种地质灾害事理图谱的构建方法,具有如下有益效果:
41.本实施例通过构建的地质灾害事理图谱的模式层从获取的地质灾害文本中抽取地质灾害事件,以及地质灾害事件关系,然后根据抽取到的地质灾害事件和抽取到的地质灾害事件关系融合多个地质灾害事件后,得到地质灾害事理图谱,从而将互联网上零散的地质灾害信息整理在一个地质灾害事理图谱内,以通过该地质灾害事理图谱更全面地反映地质灾害事件的状况。
42.本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
43.下面结合附图和实施例对本发明做进一步的说明,其中:
44.图1为本发明实施例的一种地质灾害事理图谱的构建过程的模块示意图;
45.图2为本发明实施例的一种地质灾害事理图谱的构建方法的流程图;
46.图3为本发明实施例的一种地质灾害事理图谱的模式层的示意图;
47.图4为本发明实施例的一种地质灾害事件抽取示例图;
48.图5为本发明实施例的一种中文事件检测模型的结构示意图;
49.图6为本发明实施例的一种地质灾害事理图谱的示意图。
具体实施方式
50.下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
51.在本发明的描述中,若干的含义是一个以上,多个的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
52.本发明的描述中,除非另有明确的限定,设置等词语应做广义理解,所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。
53.本发明的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
54.在信息抽取领域,事件被定义为发生在某个特定时间点或时间段、某个特定地域范围内,由一个或者多个角色参与的一个或者多个动作组成的事件或者状态的改变。事件抽取任务作为构建事理图谱的核心步骤,其任务在于自动识别文本中所描述的事件,判断事件类型,并将事件包含的信息抽取出来。事件抽取任务所涉及的一些相关概念如表1所示:
55.表1
[0056][0057]
本实施例主要基于非结构化的地质灾害文本构建反映事件动态演化规律的事理图谱,构建步骤如图1所示。首先根据地质灾害事件的特点和属性设计地质灾害事理图谱的模式层,然后在此基础上从地质灾害文本中抽取地质灾害事件和事件之间的关系,例如从地质灾害新闻抽取地质灾害事件和事件之间的关系,最后将获取的事件信息以结构化的地质灾害事理图谱(图1仅仅展示一种地质灾害事理图谱的表示形式,不限制于里面的内容)形式展示,以动态的事件作为节点,将灾前、灾中和灾后发生的事件以及事件各个元素的信息组织和关联起来,形成事件脉络以描述地质灾害事件的发展过程。其中,事理图谱是在知识图谱的基础上发展起来的概念,以事件及其关系作为研究对象,描述事件间时序、因果等事理逻辑,展示动态事件的演化规律。
[0058]
具体地,参照图2,本发明实施例提供了一种地质灾害事理图谱的构建方法,本实施例可应用于地质灾害分析平台对应的处理端,该处理端可以从各个互联网的终端上获取地质灾害文本。
[0059]
在处理过程中,本实施例包括以下步骤:
[0060]
s21、构建地质灾害事理图谱的模式层。
[0061]
在本技术实施例中,模式层的构建可以是通过预先设置的事件定义信息构建地质灾害事理图谱的模式层。其中,预先设置的事件定义信息包括地质灾害事件类型的定义信息、不同类型的地质灾害事件触发词和事件元素角色的定义信息、事件关系的定义信息。例如,将模式层视为图谱的基础抽象框架,涵盖了本实施例中地质灾害事理图谱包含的内容并指导地质灾害事理图谱的整个构建过程。本实施例通过定义地质灾害事件和事件之间关系来设计地质灾害事理图谱的模式层,如图3所示。地质灾害事件的定义决定了事件抽取模型能够从文本中抽取地质灾害事件的类型和属性,事件关系的定义决定了地质灾害事件之间存在的联系。从图3可知,地质灾害事理图谱将地质灾害事件分为三大类:灾前事件、灾中事件和灾后事件。事件大类还可以进一步细分为若干具体的类别,例如灾前事件可分为起因事件、预警事件等类型。本实施例对地质灾害事件类型的定义如表2所示:
[0062]
表2
[0063][0064][0065]
从表2可知,不同类型事件包含了不同的信息,本实施例针对不同类型的地质灾害
事件定义了不同的事件触发词和事件元素角色,具体如表3所示:
[0066]
表3
[0067][0068][0069]
其中,地质灾害事理图谱中的事件之间关系主要包括因果关系、顺承关系和并列关系。其中,因果关系表示事件的前因后果,一个事件的发生导致另一事件的发生。可能存在因果关系的地质灾难事件包括:起因事件和灾中事件、起因事件和预警事件、互为因果的两个灾中事件、灾中事件和灾后事件等。顺承关系表示事件发生的先后顺序,即一个事件发生后,另一事件随之而发生。可能存在顺承关系的地质灾难事件包括:预警事件和灾中事件、先后发生的两个无关的灾中事件、同一地质灾害的应急救援事件等。并列关系表示一个
事件和另一事件同时发生。可能存在并列关系的地质灾难事件对包括:伤亡事件和损失事件等。
[0070]
s22、获取若干个地质灾害文本。
[0071]
在本技术实施例中,若干个地质灾害文本可以是从不同的网页中获取得到,其相同点都是关于地质灾害的信息。
[0072]
s23、根据模式层从地质灾害文本中抽取地质灾害事件。
[0073]
在本技术实施例中,地质灾害事件的抽取过程包括地质灾害事件检测步骤和事件元素抽取步骤。其中,地质灾害事件检测步骤包括:从地质灾害文本中识别出包含不同类型的地质灾害事件触发词和事件元素角色的定义信息的文本,然后根据地质灾害事件类型的定义信息判断所述文本句中的事件类型。具体地,通过中文事件检测模型执行地质灾害事件检测步骤。其中,中文事件检测模型为基于字级别搭建的事件检测模型,其内设有词汇特征,由特征表示层、序列特征建模层和条件随机场层组成。事件元素抽取步骤包括:确定完成地质灾害事件检测步骤,在所述文本句中抽取事件元素。具体地,在特征表示层内增设事件类型特征和相对距离特征,然后通过增设事件类型特征和相对距离特征的特征表示层中执行事件元素抽取步骤。如图4所示的地质灾害事件抽取示例,该时间对应的文本为“9月13日,云南省丽江市宁蒗县发生滑坡,造成三人死亡。”,事件抽取则从该文本中检测到了滑坡事件和伤亡事件,并抽取出时间、地点等事件元素。
[0074]
具体地,地质灾害事件检测是指识别出包含事件触发词的文本句,即识别出包括如表3中所示内容的文本句,并判断出事件触发词所对应的事件类型。在检测过程中,中文事件检测与英文事件检测相比,中文事件检测任务更加困难。英文天然存在单词的分隔,而中文没有明显的单词边界,对字符序列的不同分词会有不同的含义。基于中文的特性,本实施例基于多粒度上下文特征设置中文事件检测模型,该模型为基于字级别搭建事件检测模型,在模型中添加重要的词汇特征,从而可以同时利用字级别和词级别模型的优点。中文事件检测模型主要分为以下模块:结合字符二元嵌入和词汇信息增强的特征表示层、基于bilstm捕获序列上下文特征的序列特征建模层,以及对序列作标注推理的crf(条件随机场)层,中文事件检测模型如图5所示。本实施例能够弥补字级别模型在信息交互和上下文特征利用方面的不足,也不会受到词级别模型因为分词错误造成的直接性能影响,同时解决了位于“词内部”的事件触发词的识别问题。
[0075]
事件元素抽取是指在完成地质灾害事件检测之后,抽取句子中的事件元素。事件元素抽取是在事件检测模型的基础上进一步扩展,在模型的特征表示层加入事件类型特征和“当前字

触发词首部”相对距离特征。对于句子中存在多个触发词的情况,依次以每个触发词为中心,识别该触发词对应的事件元素,完成事件元素抽取的任务。
[0076]
s24、根据地质灾害事件从地质灾害文本中抽取地质灾害事件关系。
[0077]
在本技术实施例中,抽取地质灾害事件关系包括取显式关系步骤和抽取隐式关系步骤。其中,抽取显式关系步骤包括:获取地质灾害文本中关系提示词和句法模式,然后根据关系提示词和句法模式抽取地质灾害事件的因果关系、顺承关系和并列关系。抽取隐式关系步骤包括:提取地质灾害文本中的事件语义信息,并根据事件语义信息对不同事件进行分类,然后根据分类结果抽取地质灾害文本中的隐式关系。其中,抽取隐式关系步骤可通过关系抽取模型执行,关系抽取模型包括语言表示模型bert、双向长短时记忆网络模型
bilstm和注意力模型attention。
[0078]
具体地,地质灾害事件关系抽取以地质灾害事件作为基本的语义单元,自动抽取事件之间的逻辑关系,形成事件的发展脉络。地质灾害事件关系抽取可以分为两种类型:显式关系抽取和隐式关系抽取。例如以下三个句子:
[0079]

昨日的暴风雨导致了这场泥石流的发生。
[0080]

市县两级党委、政府第一时间组织开展搜救工作,同时撤离危险区域民众。
[0081]

专家们赶赴现场,开展应急救援处置工作。
[0082]




条句子中明显包含表示关系的词语,例如“导致”表示因果关系,“同时”表示并列关系,可以采用显式关系抽取方法进行事件之间的关系抽取。第

条句子中不存在明显的关系提示词,却包含有两个应急救援事件的顺承关系,只能采用隐式关系抽取方法。
[0083]
本实施例对地质灾害文本的显式关系抽取采用模式匹配法,通过归纳出地质灾害文本中常见的各类关系提示词和句法模式,抽取出地质灾害事件之间的因果、顺承和并列关系。由于隐式关系抽取的难度明显高于显式关系抽取,无法通过句法模板来界定关联事件的起始和结束,因此,需要关系抽取模型具有上下文的语义分析能力,所以,本发明基于bert、bilstm和attention框架搭建深度学习模型,在特征表示层加入事件类型特征以增强模型的事件语义信息,通过对地质灾害文本中不同事件的关系进行分类,实现地质灾害事件的隐式关系抽取。
[0084]
s25、根据抽取到的地质灾害事件和抽取到的地质灾害事件关系融合多个地质灾害事件,得到地质灾害事理图谱。
[0085]
在本技术实施例中,有时多个地质灾害文本中描述的是同一个事件,不同文本抽取出来的事件信息可以互为补充。基于此,本实施例通过事件融合机制完成事件元素和事件关系的补全。例如文本1抽取出事件e01的事件元素仅包含时间信息,而文本2抽取出事件e02的事件元素仅包含地点信息。如果通过分析可以确定e01和e02共指同一个地质灾害事件,就可以通过融合机制补全该事件的时间和地点信息。地质灾害事件共指关系的判断可以从事件描述句的相似度、事件元素相似度和事件描述句实体共现三个方面来进行事件综合相似度的计算,从而识别共指事件,进行事件信息的融合。
[0086]
由此可知,本实施例构建的地质灾害事理图谱,实现了自动化地从非结构化的地质灾害文本中检测事件并抽取事件信息和关系,大大节省了过去人工整理文本提取事件信息的时间和成本。同时,本实施例构建的地质灾害事理图谱具有语义关联的功能,以图结构的形式将一系列地质灾害事件关联起来,可以更为直观地梳理事件之间的关系,描述地质灾害发展过程的事件脉络,例如,如图6所示地质灾害事理图谱的示例,图6仅仅是一个示例性的表示,不局限于具体的内容。
[0087]
本发明实施例提供了一种地质灾害事理图谱的构建系统,包括:
[0088]
构建模块,用于构建地质灾害事理图谱的模式层;
[0089]
获取模块,用于获取若干个地质灾害文本;
[0090]
第一抽取模块,用于根据所述模式层从所述地质灾害文本中抽取地质灾害事件;
[0091]
第二抽取模块,用于根据所述地质灾害事件从所述地质灾害文本中抽取地质灾害事件关系;
[0092]
融合模块,用于根据抽取到的地质灾害事件和抽取到的地质灾害事件关系融合多个地质灾害事件,得到地质灾害事理图谱。
[0093]
本发明方法实施例的内容均适用于本系统实施例,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法达到的有益效果也相同。
[0094]
本发明实施例提供了一种地质灾害事理图谱的构建装置,包括:
[0095]
至少一个存储器,用于存储程序;
[0096]
至少一个处理器,用于加载所述程序以执行图2所示的地质灾害事理图谱的构建方法。
[0097]
本发明方法实施例的内容均适用于本装置实施例,本装置实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法达到的有益效果也相同。
[0098]
本发明实施例提供了一种存储介质,其中存储有计算机可执行的程序,所述计算机可执行的程序被处理器执行时用于实现图2所示的地质灾害事理图谱的构建方法。
[0099]
本发明实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行图2所示的方法。
[0100]
上面结合附图对本发明实施例作了详细说明,但是本发明不限于上述实施例,在所属技术领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。此外,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献