一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于地震数据处理的知识图谱生成方法及装置与流程

2022-02-25 20:06:12 来源:中国专利 TAG:


1.本发明涉及石油勘探技术领域,尤其涉及地震数据处理技术领域,具体涉及一种基于地震数据处理的知识图谱生成方法及装置。


背景技术:

2.现有技术中,在地震数据处理中不同类型的数据有相应的针对性处理措施,但是由于地震数据的类型差异大,因此每次处理之前需要针对地震数据开展特征分析,根据数据特征制定针对性的处理措施。相同的数据进行二次处理时,如果处理人员发生了变化则需要重新进行数据分析;即使处理的数据特征与邻近位置的数据特征近似,也要重新进行数据分析;相同的数据由于处理人员理解不同获得的数据分析结果也不相同,处理结果因而有较大差异;上述问题是由于缺乏地震数据处理关联信息查询途径造成的。
3.另外,当前处理人员为了能尽快的获得所处理地震数据的相关信息,所能采取的主要方法有查阅往次处理报告或者采集报告,然而上述资料内容单一,通常反映的是处理员在处理过程中的个人理解,和事实难免存在一定的偏差,同时受到处理员自身处理水平的限制,其所撰写的报告难免存在错误或者误解,在一定程度上会影响报告的自身的价值,因此急需一种通过地震数据特征获得地震数据处理关联信息的查询方法。


技术实现要素:

4.针对现有技术中的问题,本发明提供一种基于地震数据处理的知识图谱生成方法、装置、电子设备及存储介质,能够在地震数据处理过程中,获取具有针对性的地震数据处理知识图谱。进而获得相同类型地震数据的深层次的处理关联信息;并通过知识图谱可以将历年处理相关的信息进行分类存储以便再次处理时查询。
5.为了实现上述目的,本发明采用如下技术方案:
6.第一方面,提供一种基于地震数据处理的知识图谱生成方法,包括:
7.获取目标工区地震数据的第一特征属性;
8.根据所述第一特征属性获取与其所对应的子特征属性;
9.根据所述第一特征属性、所述子特征属性以及所述地震数据生成知识图谱。
10.进一步地,所述第一特征属性包括:采集参数、采集仪器、地表条件以及地下构造中的至少一个;
11.所述采集参数的子特征属性包括:采集单位、空间位置、偏移距范围、方位角范围、记录时间、覆盖次数、检波器组合方式、激发能量、观测系统设置方式、激发深度以及检波器埋深中的至少一个;
12.所述采集仪器的子特征属性包括:震源类型以及检波器类型中的至少一个;
13.所述地表条件的子特征属性包括:地表岩性、地表高程值、地表高程变化范围中的至少一个;
14.所述地下构造的子特征属性包括:构造类型、断裂类型、油藏类型中的至少一个。
15.进一步地,所述获取目标工区地震数据的第一特征属性包括:
16.根据前馈式机器学习算法构建地震数据特征分析模型;
17.将所述地震数据输入至所述地震数据特征分析模型,以获取地震数据中的干扰波的类型及/或干扰波的位置;
18.从预获取的地震数据中的文字数据、干扰波的类型及/或干扰波的位置提取所述第一特征属性。
19.进一步地,获取所述文字数据包括以下步骤:
20.从所述地震数据的采集报告中提取第一文字数据;
21.从地震数据的分析报告中提取第二文字数据;所述文字数据包括所述第一文字数据及所述第二文字数据中的至少一个。
22.进一步地,所述从预获取的地震数据中的文字数据、干扰波的类型及/或干扰波的位置提取所述第一特征属性,包括:
23.将所述文字数据分割成词组;
24.对所述词组进行筛选,以生成所述地震数据的关键字;
25.将所述关键字根据预设条件进行匹配,以确定所述第一特征属性。
26.进一步地,所述根据所述第一特征属性获取与其所对应的子特征属性,包括:
27.根据所述关键字以及所述第一特征属性对所述子特征属性进行匹配,以确定所述子特征属性。
28.进一步地,所述根据所述第一特征属性、所述子特征属性以及所述地震数据生成知识图谱,包括:
29.对所述第一特征属性进行匹配,以确定所述第一特征属性的相互关联标签;
30.对所述子特征属性进行匹配,以确定所述子特征属性的相互关联标签;
31.对所述第一特征属性以及所述子特征属性同时进行匹配,以确定共同相互关联标签;
32.对所述子特征属性的相互关联标签进行匹配,以确定相同的子特征属性的共同互相关联标签;
33.对所述第一特征属性的相互关联标签、所述子特征属性的相互关联标签、所述共同相互关联标签以及所述相同的子特征属性的共同互相关联标签进行相同合并操作,以生成所述知识图谱。
34.第二方面,提供一种基于地震数据处理的知识图谱生成装置,包括:
35.第一属性获取单元,用于获取目标工区地震数据的第一特征属性;
36.子属性获取单元,用于根据所述第一特征属性获取与其所对应的子特征属性;
37.图谱生成单元,用于根据所述第一特征属性、所述子特征属性以及所述地震数据生成知识图谱。
38.进一步地,所述第一特征属性包括:采集参数、采集仪器、地表条件以及地下构造中的至少一个;
39.所述采集参数的子特征属性包括:采集单位、空间位置、偏移距范围、方位角范围、记录时间、覆盖次数、检波器组合方式、激发能量、观测系统设置方式、激发深度以及检波器埋深中的至少一个;
40.所述采集仪器的子特征属性包括:震源类型以及检波器类型中的至少一个;
41.所述地表条件的子特征属性包括:地表岩性、地表高程值、地表高程变化范围中的至少一个;
42.所述地下构造的子特征属性包括:构造类型、断裂类型、油藏类型中的至少一个。
43.进一步地,所述第一属性获取单元包括:
44.模型构建模块,用于根据前馈式机器学习算法构建地震数据特征分析模型;
45.干扰波获取模块,用于将所述地震数据输入至所述地震数据特征分析模型,以获取地震数据中的干扰波的类型及/或干扰波的位置;
46.第一属性提取模块,用于从预获取的地震数据中的文字数据、干扰波的类型及/或干扰波的位置提取所述第一特征属性。
47.进一步地,基于地震数据处理的知识图谱生成装置还包括:文字获取单元,用于获取所述文字数据,所述文字获取单元包括:
48.第一文字提取模块,用于从所述地震数据的采集报告中提取第一文字数据;
49.第二文字提取模块,用于从地震数据的分析报告中提取第二文字数据;所述文字数据包括所述第一文字数据及所述第二文字数据中的至少一个。
50.进一步地,所述第一属性提取模块包括:
51.文字分割模块,用于将所述文字数据分割成词组;
52.关键字筛选模块,用于对所述词组进行筛选,以生成所述地震数据的关键字;
53.第一属性确定模块,用于将所述关键字根据预设条件进行匹配,以确定所述第一特征属性。
54.进一步地,所述子属性获取单元具体用于根据所述关键字以及所述第一特征属性对所述子特征属性进行匹配,以确定所述子特征属性。
55.进一步地,所述图谱生成单元包括:
56.第一属性匹配模块,用于对所述第一特征属性进行匹配,以确定所述第一特征属性的相互关联标签;
57.子属性匹配模块,用于对所述子特征属性进行匹配,以确定所述子特征属性的相互关联标签;
58.同时匹配模块,用于对所述第一特征属性以及所述子特征属性同时进行匹配,以确定共同相互关联标签;
59.相互标签匹配模块,用于对所述子特征属性的相互关联标签进行匹配,以确定相同的子特征属性的共同互相关联标签;
60.图谱生成模块,用于对所述第一特征属性的相互关联标签、所述子特征属性的相互关联标签、所述共同相互关联标签以及所述相同的子特征属性的共同互相关联标签进行相同合并操作,以生成所述知识图谱。
61.第三方面,提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行该程序时实现上述的基于地震数据处理的知识图谱生成方法的步骤。
62.第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述的基于地震数据处理的知识图谱生成方法的步骤。
63.本发明实施例提供的基于地震数据处理的知识图谱生成方法、装置、电子设备及存储介质,该方法包括:首先获取目标工区地震数据的第一特征属性;接着,根据第一特征属性获取与其所对应的子特征属性;最后根据第一特征属性、子特征属性以及地震数据生成知识图谱。本发明能够在地震数据处理过程中,获取具有针对性的地震数据处理知识图谱。
64.为让本发明的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。
附图说明
65.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
66.图1是本发明实施例中的基于地震数据处理的知识图谱生成方法的流程示意图一;
67.图2示出了图1中步骤s100的具体步骤;
68.图3示出了本发明实施例中的获取所述文字数据方法的流程示意图;
69.图4示出了本发明实施例中步骤s103的流程示意图;
70.图5示出了图1中步骤s200的具体步骤;
71.图6示出了图1中步骤s300的具体步骤;
72.图7是本发明实施例中的基于地震数据处理的知识图谱生成方法的流程示意图二;
73.图8为本发明的具体实施方式中基于机器学习的地震数据多域处理方法的流程示意图;
74.图9为本发明的实施例中的基于地震数据处理的知识图谱生成装置的结构示意图一;
75.图10为本发明的实施例中第一属性获取单元的结构示意图;
76.图11为本发明的实施例中的基于地震数据处理的知识图谱生成装置的结构示意图二;
77.图12为本发明的实施例中文字获取单元的结构示意图;
78.图13为本发明的实施例中第一属性提取模块的结构示意图;
79.图14为本发明的实施例中图谱生成单元的结构示意图;
80.图15为本发明实施例电子设备的结构图。
具体实施方式
81.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分的实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范
围。
82.本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
83.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
84.需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本技术。
85.鉴于现有技术存在如下问题:相同的地震数据进行二次处理时,如果处理人员发生了变化则需要重新进行数据分析;即使处理的数据特征与邻近位置的数据特征近似,也要重新进行数据分析;相同的地震数据由于处理人员理解不同获得的数据分析结果也不相同,处理结果因而有较大差异。本技术实施例提供一种基于地震数据处理的知识图谱生成方法方法,通过地震数据处理知识图谱可以获得相同类型地震数据的处理信息;通过地震数据处理知识图谱可以获得相同类型地震数据的深层次的处理关联信息;通过地震数据处理知识图谱可以将历年处理相关的信息进行分类存储以便再次处理时查询。
86.如图1所示,该基于地震数据处理的知识图谱生成方法可以包括以下内容:
87.步骤s100:获取目标工区地震数据的第一特征属性。
88.步骤s100中的第一特征属性具体包括:采集参数、采集仪器、地表条件、地下构造中的一项或者多项。
89.步骤s200:根据所述第一特征属性获取与其所对应的子特征属性。
90.步骤s200中的子特征属性具体包括:
91.采集参数的子特征属性:采集单位、空间位置、偏移距范围、方位角范围、记录时间、覆盖次数、检波器组合方式、激发能量、观测系统设置方式、激发深度、检波器埋深其中一项或者多项;
92.采集仪器的子特征属性:震源类型、检波器类型其中一项或者多项;
93.地表条件的子特征属性:地表岩性、地表高程值、地表高程变化范围其中一项或者多项;
94.地下构造的子特征属性:构造类型、断裂类型、油藏类型其中一项或者多项。
95.步骤s300:根据所述第一特征属性、所述子特征属性以及所述地震数据生成知识图谱。
96.可以理解的是,知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,揭示知识领域的动态发展规律,为学科研究提供切实的、有价值的参考。知识图谱可以找到最
想要的信息、提供最全面的摘要以及让搜索更有深度和广度,通过步骤s300所生成的知识图谱可以搜索地震数据更具有针对性。
97.本发明通过以上技术方案可以获得相同类型地震数据的处理信息;通过地震数据处理知识图谱可以获得相同类型地震数据的深层次的处理关联信息;通过地震数据处理知识图谱可以将历年处理相关的信息进行分类存储以便再次处理时查询。
98.在一个可选的实施例中,所述第一特征属性包括:采集参数、采集仪器、地表条件以及地下构造中的至少一个;
99.所述采集参数的子特征属性包括:采集单位、空间位置、偏移距范围、方位角范围、记录时间、覆盖次数、检波器组合方式、激发能量、观测系统设置方式、激发深度以及检波器埋深中的至少一个;
100.所述采集仪器的子特征属性包括:震源类型以及检波器类型中的至少一个;
101.所述地表条件的子特征属性包括:地表岩性、地表高程值、地表高程变化范围中的至少一个;
102.所述地下构造的子特征属性包括:构造类型、断裂类型、油藏类型中的至少一个。
103.在一个可选的实施例中,参见图2,步骤s100进一步包括:
104.步骤s101:根据前馈式机器学习算法构建地震数据特征分析模型;
105.可以理解的是,地震数据特征分析模型是一种前馈式机器学习模型;可以理解的是,前馈式机器学习模型的目标是近似某个函数。例如,对于分类器,y=f*(x)将输入x映射到一个类别y。前馈网络定义了一个映射y=f(x;θ),并且学习参数θ的值,使它能够得到最佳的函数近似。在前馈神经网络内部,参数从输入层向输出层单向传播,通常前馈式深度学习网络包含卷积层、池化层、全连接层。
106.步骤s102:将所述地震数据输入至所述地震数据特征分析模型,以获取地震数据中的干扰波的类型及/或干扰波的位置;
107.地震数据特征分析模型被配置为由输入的地震数据获得相应的特征分析结果;相应的特征分析结果包括:干扰波的类型和干扰波的位置信息中一项或者多项。
108.步骤s103:从预获取的地震数据中的文字数据、干扰波的类型及/或干扰波的位置提取所述第一特征属性。
109.在一个可选的实施例中,参见图3,获取所述文字数据包括以下步骤:
110.步骤s701:从所述地震数据的采集报告中提取第一文字数据;
111.步骤s702:从地震数据的分析报告中提取第二文字数据;所述文字数据包括所述第一文字数据及所述第二文字数据中的至少一个。
112.具体地,由采集报告中提取的文字内容;由处理人员分析地震数据时总结的文字内容;由机器学习的地震数据特征分析模型获得的数据特征文字描述内容;从上述文字内容以及数据特征文字描述内容中提取第一特征属性。
113.在一个可选的实施例中,参见图4,步骤s103进一步包括:
114.步骤s1031:将所述文字数据分割成词组;
115.步骤s1032:对所述词组进行筛选,以生成所述地震数据的关键字;
116.步骤s1033:将所述关键字根据预设条件进行匹配,以确定所述第一特征属性。
117.在步骤s1031至步骤s1033中,具体地,将所述的地震数据相关文字信息分割成词
组;对分割成的词组进行筛选保留地震数据相关的词组作为地震数据的关键词;将地震数据关键词按照预先设定的第一特征分类进行匹配,将匹配后分类结果作为地震数据第一特征属性;另外,将未匹配的结果保留作为新的地震数据第一特征属性。
118.在一个可选的实施例中,参见图5,步骤s200进一步包括:
119.步骤s201:根据所述关键字以及所述第一特征属性对所述子特征属性进行匹配,以确定所述子特征属性。
120.具体地,将所述的地震数据关键词与第一特征属性对应分类下的子特征属性进行匹配;进一步将匹配的结果作为地震数据子特征属性;另外,未匹配结果作为新的子特征属性。
121.在一个可选的实施例中,参见图6,步骤s300进一步包括:
122.步骤s301:对所述第一特征属性进行匹配,以确定所述第一特征属性的相互关联标签。
123.具体地,由地震数据第一特征属性匹配获得相同的第一特征属性预先相互关联标签。
124.步骤s302:对所述子特征属性进行匹配,以确定所述子特征属性的相互关联标签。
125.具体地,由地震数据子特征属性匹配获得相同的子特征属性预先相互关联标签。
126.步骤s303:对所述第一特征属性以及所述子特征属性同时进行匹配,以确定共同相互关联标签。
127.具体地,由地震数据第一特征属性和子特征属性同时匹配获得第一特征属性和子特征属性同时预先相互关联标签。
128.步骤s304:对所述子特征属性的相互关联标签进行匹配,以确定相同的子特征属性的共同互相关联标签。
129.具体地,由子特征属性预先相互关联标签匹配获得相同子特征属性的第一特征属性和子特征属性同时预先相互关联标签。
130.步骤s305:对所述第一特征属性的相互关联标签、所述子特征属性的相互关联标签、所述共同相互关联标签以及所述相同的子特征属性的共同互相关联标签进行相同合并操作,以生成所述知识图谱。
131.具体地,合并步骤s301至步骤s304中相同的标签;将获得的标签、关联次数和标签对应的文字内容作为知识图谱呈现给用户。
132.在一个可选的实施例中,参见图7,基于地震数据处理的知识图谱生成方法还包括:
133.步骤s400:将地震数据进行相互关联。
134.具体地,获得已有的地震数据处理文字关键词的第一特征属性和子特征属性对应的地震数据处理信息,包括:数据分析结果、处理单位、处理软件、处理流程及参数、机器学习地震数据处理模型相关信息其中一项或者多项;将相同的第一特征属性建立关联并记录关联次数作为第一特征属性预先相互关联标签;将第一特征属性对应的地震数据处理文字作为第一特征属性预先相互关联标签对应的文字内容;将相同的子特征属性建立关联并记录关联次数作为子特征属性预先相互关联标签;将子特征属性对应的地震数据处理文字作为子特征属性预先相互关联标签对应的文字内容;将同时具有相同的第一特征属性和子特
征属性建立关联并记录关联次数作为第一特征属性和子特征属性同时预先相互关联标签;将第一特征属性和子特征属性同时对应的地震数据处理文字作为第一特征属性和子特征属性同时预先相互关联标签对应的文字内容。
135.为进一步地说明本方案,本发明提供基于地震数据处理的知识图谱生成方法的具体应用实例,该具体应用实例具体包括如下内容,参见图8。
136.在本具体应用实例中,需要处理的地震区块经历过多次的采集以及不同处理单位多次的处理,每次地震数据采集和处理后,处理成果以文字报告的形式存档,为了在当前需要处理的地震区块处理前,通过知识图谱获得历次采集和处理过程的相关经验,采取如下步骤:
137.s1:对历次的文字报告中的文字内容中提取与采集参数、采集仪器、地表条件、地下构造相关的文字内容。
138.具体来说,首先通过查档获得与本次处理地震数据工区相关的电子文档,例如采集报告、采集设计报告;然后,由电子文档中提取文字内容,这里提取的文字内容包括:由采集报告中提取的文字内容、由处理人员分析地震数据时总结的文字内容、由机器学习的地震数据特征分析模型获得的数据特征文字描述内容。
139.其中,由电子文档中提取的文字内容采取如下步骤:地震数据处理相关电子文档为与采集报告和处理报告相关的文字报告,如果标题或者目录为采集报告、处理报告便可将相关文字内容提取作为提取的文字内容,此外通过机器学习的地震数据特征分析模型提取更多的数据特征文字描述内容。
140.其中,在地震资料处理中主要的干扰波类型有:强能量干扰、线性干扰、多次波干扰、散射干扰、随机干扰。
141.其中,通过地震数据特征相关分析模型获得相应的相关特征关键词分析结果采取如下步骤:提取地震数据并人工标定地震数据干扰波的类型,将地震数据和人工标定结果作为样本进行深度学习模型训练,训练后的模型为地震数据特征相关分析模型,获得相关特征关键词分析结果时,在地震数据开滑动时窗,时窗的横向和纵向宽度为横向和纵向宽度的1/3,将时窗中的数据输入地震数据特征相关分析模型获得相关特征关键词分析结果。
142.最后,对电子文档中提取文字内容分割成词组后提取地震数据第一特征属性。具体来说采取如下步骤:分割词组借助常见的地震数据采集和处理关键词进行实施,关键词取自相关专业词典中的词条,例如:中国石油勘探开发百科全书中以“地震采集”、“地震处理”为内容的词条。对分割成的词组进行进一步的筛选保留地震数据相关的词组作为地震数据的关键词,例如将关键词输入搜索引擎或者石油类百科,舍去未完整匹配的分割词组。
143.将地震数据关键词按照预先设定的第一特征分类进行匹配,将匹配后分类结果作为地震数据第一特征属性,将未匹配的结果保留作为新的地震数据第一特征属性,所述的预先设定的第一特征分类,包括采集参数、采集仪器、地表条件、地下构造中的一项或者多项。举例来说,关键词“正交观测系统”的分类,在搜索引擎或者石油类百科中搜索“正交观测系统” “采集参数”或者“正交观测系统” “地表条件”均无完全匹配的结果,则将正交观测系统新增为第一特征分类,关键词“非纵偏移距”的分类时,对于“非纵偏移距” “正交观测系统”有匹配内容,则“非纵偏移距”属于“正交观测系统”分类,分类结果和输入的先后顺序无关,即使结果为“正交观测系统”属于“非纵偏移距”分类,处理人员也能够理解其含义,
搜索内容匹配指的是搜索引擎返回结果同时含有两者内容。
144.s2:由步骤s1中提取的与采集参数、采集仪器、地表条件、地下构造相关的文字内容中进一步提取具体的相关特征的关键词。
145.其中,地震数据第一特征属性对应的子特征属性,指的是:采集参数的子特征属性:采集单位、空间位置、偏移距范围、方位角范围、记录时间、覆盖次数、检波器组合方式、激发能量、观测系统设置方式、激发深度、检波器埋深其中一项或者多项。
146.采集仪器的子特征属性:震源类型、检波器类型其中一项或者多项;
147.地表条件的子特征属性:地表岩性、地表高程值、地表高程变化范围其中一项或者多项;
148.地下构造的子特征属性:构造类型、断裂类型、油藏类型其中一项或者多项;
149.具体来说采取如下步骤:将所述的地震数据关键词与第一特征属性对应分类下的子特征属性进行匹配,然后进一步将匹配的结果作为地震数据子特征属性,如果关键词未匹配则作为新的子特征属性。举例来说,关键词“砾石区”属于第一类特征“地表条件”,这里进一步细分,将关键词“砾石区”分别按照“砾石区” “地表岩性”、“砾石区” “地表高程”通过搜索引擎或者石油类百科进行搜索,搜索内容完全匹配即同时含有两者内容时进行归类,这里砾石区属于地表岩性子特征属性。另一个例子,关键词“滩海”属于第一类特征“地表条件”,但是与现有定义的第二特征条件不匹配,则关键词“滩海”成为新的一类子特征属性。
150.s3:根据步骤s2提取具体的相关特征的关键词与地震数据处理相关的关键词建立关联从而形成知识图谱。
151.首先与地震数据的处理信息建立预先相互关联,具体采取如下步骤:如同第一步的方法获得已有的地震数据处理文字,例如地震处理报告。获得已有的地震数据处理文字的关键词;其中,关键词取自相关专业词典中的词条,例如:中国石油勘探开发百科全书中以“地震处理”为内容的词条。
152.获得已有的地震数据处理文字关键词的第一特征属性和子特征属性如同第一步方法,举例来说,关键词“剩余静校正”的分类,在搜索引擎或者石油类百科中搜索“剩余静校正” “采集参数”或者“剩余静校正” “地表条件”进行搜索,根据结果将关键词“剩余静校正”归为“地表条件”第一类特诊属性。然后,关键词“剩余静校正”的在“地表条件”第一类特诊属性下的第二类特征属性进行归类,举例来说,关键词“剩余静校正”属于第一类特征“地表条件”,这里进一步细分,将关键词“剩余静校正”分别按照“剩余静校正” “地表岩性”、“剩余静校正” “地表高程”通过搜索引擎或者石油类百科进行搜索,搜索内容完全匹配即同时含有两者内容时进行归类,这里“剩余静校正”属于“地表岩性”和“地表高程”两个子特征属性。
153.获得已有的地震数据处理文字关键词的第一特征属性和子特征属性对应的地震数据处理分类信息,地震数据处理分类信息包括:数据分析结果、处理单位、处理软件、处理流程及参数、机器学习地震数据处理模型相关信息其中一项或者多项。例如:关键词“剩余静校正”的第一特征属性“地表条件”和子特征属性“地表高程”在搜索引擎或者石油类百科中搜索“地表条件” “处理软件”或者“地表条件” “处理流程及参数”进行搜索,根据结果将关键词“剩余静校正”的第一特征属性“地表条件”归为“数据分析结果”地震数据处理分类
信息,根据结果将关键词“剩余静校正”的子特征属性“地表高程”归为“处理流程及参数”地震数据处理分类信息。
154.建立关键词和处理信息之间的关联,首先将相同的第一特征属性建立关联并记录关联次数作为第一特征属性预先相互关联标签;然后将第一特征属性对应的地震数据处理文字作为第一特征属性预先相互关联标签对应的文字内容;然后将相同的子特征属性建立关联并记录关联次数作为子特征属性预先相互关联标签;然后将子特征属性对应的地震数据处理文字作为子特征属性预先相互关联标签对应的文字内容;然后将同时具有相同的第一特征属性和子特征属性建立关联并记录关联次数作为第一特征属性和子特征属性同时预先相互关联标签;最后将第一特征属性和子特征属性同时对应的地震数据处理文字作为第一特征属性和子特征属性同时预先相互关联标签对应的文字内容。
155.举例来说:关键词“剩余静校正”的第一特征属性是“地表条件”,子特征属性是“地表高程”,地震处理信息分类是“处理流程及参数”。关键词“多次波衰减”的第一特征属性是“地表条件”,子特征属性是“地表岩性”,地震处理信息分类是“处理流程及参数”。关键词“速度分析”的第一特征属性是“地表条件”,子特征属性是“地表岩性”,地震处理信息分类是“处理流程及参数”。
156.第一特征属性建立关联并记录关联次数作为第一特征属性预先相互关联标签,则第一特征属性是“地表条件”对应的关键词“剩余静校正”、“多次波衰减”、“速度分析”相互关联,记录关联次数为3。
157.将相同的子特征属性建立关联并记录关联次数作为子特征属性预先相互关联标签,则相同的子特征属性“地表岩性”对应的关键词“多次波衰减”和“速度分析”建立关联,记录关联次数为2。
158.将子特征属性对应的地震数据处理文字作为子特征属性预先相互关联标签对应的文字内容,则子特征属性“地表岩性”对应的关键词“多次波衰减”、“速度分析”,将处理报告中“多次波衰减”、“速度分析”的文字内容与“地表岩性”建立关联。子特征属性“地表高程”对应的关键词“剩余静校正”,将处理报告中“剩余静校正”的文字内容与“地表高程”建立关联。
159.将同时具有相同的第一特征属性和子特征属性建立关联并记录关联次数作为第一特征属性和子特征属性同时预先相互关联标签,则同时具有第一特征属性“地表条件”和子特征属性“地表岩性”的关键词“多次波衰减”和“速度分析”,将“多次波衰减”和“速度分析”建立关联,记录关联次数为2。
160.将第一特征属性和子特征属性同时对应的地震数据处理文字作为第一特征属性和子特征属性同时预先相互关联标签对应的文字内容,则同时具有第一特征属性“地表条件”和子特征属性“地表岩性”的关键词“多次波衰减”和“速度分析”,将“多次波衰减”和“速度分析”建立关联,将处理报告中“多次波衰减”、“速度分析”的文字内容与第一特征属性“地表条件”和子特征属性“地表岩性”建立关联。
161.然后由所述的特征属性获得预先相互关联的地震数据处理信息形成知识图谱,采取如下步骤:首先由地震数据子特征属性匹配获得相同的子特征属性预先相互关联标签;然后由地震数据第一特征属性匹配获得相同的第一特征属性预先相互关联标签;然后由地震数据第一特征属性和子特征属性同时匹配获得第一特征属性和子特征属性同时预先相
互关联标签;然后由子特征属性预先相互关联标签匹配获得相同子特征属性的第一特征属性和子特征属性同时预先相互关联标签;然后合并相同的标签;最后将获得的标签、关联次数和标签对应的文字内容作为知识图谱呈现给用户。
162.举例来说,关键词“剩余静校正”的第一特征属性是“地表条件”,子特征属性是“地表高程”,地震处理信息分类是“处理流程及参数”。关键词“多次波衰减”的第一特征属性是“地表条件”,子特征属性是“地表岩性”,地震处理信息分类是“处理流程及参数”。关键词“速度分析”的第一特征属性是“地表条件”,子特征属性是“地表岩性”,地震处理信息分类是“处理流程及参数”。
163.由地震数据子特征属性匹配获得相同的子特征属性预先相互关联标签,则检索子特征属性关键词“地表岩性”时将获得“多次波衰减”和“速度分析”关联标签。检索子特征属性关键词“地表高程”时将获得“剩余静校正”关联标签。
164.由地震数据第一特征属性匹配获得相同的第一特征属性预先相互关联标签,则检索第一特征属性关键词“地表条件”时将获得“剩余静校正”、“多次波衰减”和“速度分析”关联标签。
165.由地震数据第一特征属性和子特征属性同时匹配获得第一特征属性和子特征属性同时预先相互关联标签,则检索第一特征属性关键词“地表条件”和子特征属性关键词“地表岩性”时将获得“多次波衰减”和“速度分析”关联标签。
166.由子特征属性预先相互关联标签匹配获得相同子特征属性的第一特征属性和子特征属性同时预先相互关联标签,则检索子特征属性关键词“地表岩性”时将获得“多次波衰减”和“速度分析”关联标签。
167.合并相同的标签,如果存在完全一致的分类和标签则合并;将获得的标签、关联次数和标签对应的文字内容作为知识图谱呈现给用户,则呈现给用户的内容为:该区块地表条件相关内容3项,地表岩性相关内容2项,地表高程相关内容1项,针对地表岩性的处理方法为“多次波衰减”和“速度分析”并呈现相关处理报告的详细内容,针对地表高程的处理方法为“剩余静校正”并成像相关处理报告内容。
168.本发明提供的基于地震数据处理的知识图谱生成方法,通过建立地震数据处理知识图谱,提高地震数据处理关联信息查询的准确度和全面性。包括:首先获得地震数据第一特征属性;然后由第一特征属性获得地震数据子特征属性;最后由所述的特征属性获得预先相互关联的地震数据处理信息形成知识图谱。本技术使得在地震数据处理过程中能够由地震数据获得已有的针对性地震数据处理知识图谱。
169.基于同一发明构思,本技术实施例还提供了一种基于地震数据处理的知识图谱生成装置,可以用于实现上述实施例所描述的方法,如下面的实施例所述。由于基于地震数据处理的知识图谱生成装置解决问题的原理与上述方法相似,因此基于地震数据处理的知识图谱生成装置的实施可以参见上述方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
170.如图9所示,基于地震数据处理的知识图谱生成装置具体包括:
171.第一属性获取单元10,用于获取目标工区地震数据的第一特征属性;
172.子属性获取单元20,用于根据所述第一特征属性获取与其所对应的子特征属性;
173.图谱生成单元30,用于根据所述第一特征属性、所述子特征属性以及所述地震数据生成知识图谱。
174.进一步地,所述第一特征属性包括:采集参数、采集仪器、地表条件以及地下构造中的至少一个;
175.所述采集参数的子特征属性包括:采集单位、空间位置、偏移距范围、方位角范围、记录时间、覆盖次数、检波器组合方式、激发能量、观测系统设置方式、激发深度以及检波器埋深中的至少一个;
176.所述采集仪器的子特征属性包括:震源类型以及检波器类型中的至少一个;
177.所述地表条件的子特征属性包括:地表岩性、地表高程值、地表高程变化范围中的至少一个;
178.所述地下构造的子特征属性包括:构造类型、断裂类型、油藏类型中的至少一个。
179.进一步地,参见图10,所述第一属性获取单元10包括:
180.模型构建模块101,用于根据前馈式机器学习算法构建地震数据特征分析模型;
181.干扰波获取模块102,用于将所述地震数据输入至所述地震数据特征分析模型,以获取地震数据中的干扰波的类型及/或干扰波的位置;
182.第一属性提取模块103,用于从预获取的地震数据中的文字数据、干扰波的类型及/或干扰波的位置提取所述第一特征属性。
183.进一步地,参见图11,基于地震数据处理的知识图谱生成装置还包括:文字获取单元40,用于获取所述文字数据,参见图12,所述文字获取单元40包括:
184.第一文字提取模块401,用于从所述地震数据的采集报告中提取第一文字数据;
185.第二文字提取模块402,用于从地震数据的分析报告中提取第二文字数据;所述文字数据包括所述第一文字数据及所述第二文字数据中的至少一个。
186.进一步地,参见图13,所述第一属性提取模块103包括:
187.文字分割模块1031,用于将所述文字数据分割成词组;
188.关键字筛选模块1032,用于对所述词组进行筛选,以生成所述地震数据的关键字;
189.第一属性确定模块1033,用于将所述关键字根据预设条件进行匹配,以确定所述第一特征属性。
190.进一步地,所述子属性获取单元20具体用于根据所述关键字以及所述第一特征属性对所述子特征属性进行匹配,以确定所述子特征属性。
191.进一步地,参见图14,所述图谱生成单元30包括:
192.第一属性匹配模块301,用于对所述第一特征属性进行匹配,以确定所述第一特征属性的相互关联标签;
193.子属性匹配模块302,用于对所述子特征属性进行匹配,以确定所述子特征属性的相互关联标签;
194.同时匹配模块303,用于对所述第一特征属性以及所述子特征属性同时进行匹配,以确定共同相互关联标签;
195.相互标签匹配模块304,用于对所述子特征属性的相互关联标签进行匹配,以确定相同的子特征属性的共同互相关联标签;
196.图谱生成模块305,用于对所述第一特征属性的相互关联标签、所述子特征属性的
相互关联标签、所述共同相互关联标签以及所述相同的子特征属性的共同互相关联标签进行相同合并操作,以生成所述知识图谱。
197.本发明实施例提供的基于地震数据处理的知识图谱生成装置,首先获取目标工区地震数据的第一特征属性;接着,根据第一特征属性获取与其所对应的子特征属性;最后根据第一特征属性、子特征属性以及地震数据生成知识图谱。本发明能够在地震数据处理过程中,获取具有针对性的地震数据处理知识图谱。
198.上述实施例阐明的装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为电子设备,具体的,电子设备例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
199.在一个典型的实例中电子设备具体包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述基于地震数据处理的知识图谱生成方法的步骤。
200.下面参考图15,其示出了适于用来实现本技术实施例的电子设备600的结构示意图。
201.如图15所示,电子设备600包括中央处理单元(cpu)601,其可以根据存储在只读存储器(rom)602中的程序或者从存储部分608加载到随机访问存储器(ram))603中的程序而执行各种适当的工作和处理。在ram603中,还存储有系统600操作所需的各种程序和数据。cpu601、rom602、以及ram603通过总线604彼此相连。输入/输出(i/o)接口605也连接至总线604。
202.以下部件连接至i/o接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如lan卡,调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至i/o接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装如存储部分608。
203.特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述基于地震数据处理的知识图谱生成方法的步骤。
204.在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。
205.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算
机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
206.为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本技术时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
207.本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
208.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
209.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
210.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
211.本领域技术人员应明白,本技术的实施例可提供为方法、系统或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
212.本技术可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本技术,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
213.本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
214.以上所述仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的权利要求范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献