一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种测井智能解释系统的制作方法

2022-07-20 20:24:03 来源:中国专利 TAG:


1.本发明属于测井解释技术领域,具体为一种测井智能解释系统。


背景技术:

2.在石油勘探过程中,专业人员可以通过分析测井数据来估计地质环境参数,这被称为测井解释。测井解释的核心是用合适的方法确定测井信息与地质参数之间的对应关系。通常,获得解释结果的过程既耗时又费力。一方面,测井数据的采集过程需要高性能的仪器,另一方面,测井数据的解释在很大程度上取决于专家的经验。目前,测井解释的难点之一就在于测井数据表现出维度高、数据量大等特点(专利公开号:cn106968668a一种得分式测井岩性优选解释方法cn112287650a)。
3.一般传统测井解释中所使用的分析方法十分依赖于进行操作的专家的经验与知识,具有较强的主观性。传统的如交会图法等许多方法具有解释精度低等特点(专利公开号:cn103969682a一种钻测井资料深度匹配方法及系统),所以使用更加智能、更加精确的软件系统对测井数据进行分析是十分有必要的。由于人工智能在地球科学中已经显示出强大的应用潜力,采用人工智能方法辅助专家进行测井解释工作可有效提升其工作效率,并降低解释结果对专家经验的依赖。
4.目前,国内外已有几种测井解释软件,但随着勘探任务的日益复杂,它们无法解决当前勘探过程中遇到的问题。斯伦贝谢的工程师在techlog解释软件中开发了主成分分析、聚类、决策树和神经网络等分析模型。在这些模型中,一方面数据量不足,另一方面算法的数据预处理不理想,导致应用受到限制。此外,壳牌公司的测地线和道达尔公司的云平台等国外产品在测井解释方面更先进,但因为测井数据涉及地质数据安全问题,自主开发的软件更符合当前的需求(石玉江,刘国强,钟吉彬,等.基于大数据的测井智能解释系统开发与应用[j].中国石油勘探,2021,26(2):113-126.)。
[0005]
然而,我国测井解释软件的开发还处于起步阶段。测井资料标准不统一、信息共享差、物理模型与机器学习算法结合程度低等问题尚未解决,决定了解释软件在准确性、全面性和现场适用性方面有待进一步提高。


技术实现要素:

[0006]
本发明的目的在于:为了解决上述提出的问题,提供一种测井智能解释系统。
[0007]
本发明采用的技术方案如下:一种测井智能解释系统,所述测井智能解释系统包括调试模式和用户模式;
[0008]
其中调试模式的功能是数据导入导出、数据预处理、特征优选、分析模型的构建以及模型的评估;
[0009]
用户模式的功能是数据预处理、数据导入导出、测井解释以及单井分析
[0010]
在一优选的实施方式中,所述调试模式的数据导入导出模块,其功能是用户能够在处理一批新的原始数据时可以将数据导入系统,并可以完成对分析结果的导出。
[0011]
在一优选的实施方式中,所述调试模式的数据预处理包括对导入系统中的测井数据进行离群点检测,剔除其中的异常值以及与事实不相符的数据。同时,由于测井数据通常按照一定的深度间隔进行采样,采样间隔一般为0.125m、0.5m等,这种深度上的相邻使得相邻深度的测井数据在测井曲线上也具有相关性。基于以上两点,我们提出了一种三阶段的离群点检测方法;
[0012]
第一步,在整个数据集上找出全局的离群点并去除;第二步,利用深度相近的数据点特征也相似的特点将第一步处理后的数据分成多个段;第三步,在每个段内使用离群点检测算法,找出局部的离群点并去除,实现从全局到局部的离群点检测;具体操作如下:
[0013]
nk(p)={q∈d\{p}|d(p,q)≤k-distance(p)}
ꢀꢀꢀꢀꢀꢀꢀ
(1)
[0014]
reach-distancek(p,o)=max{k-distance(o),d(p,o)}
ꢀꢀꢀꢀꢀꢀ
(2)
[0015][0016][0017][0018][0019][0020][0021][0022]
假设有测井数据集d以及测井数据点p,o,q,其中p∈d、o∈d且q∈d\{p}:
[0023]
1)对于任意正整数k,p的k距离邻域nk(p)可以表示为公式(1)。其中,d(p,q)表示p和q之间的欧氏距离,k-distance(p)表示p与其第k个近邻之间的欧式距离;
[0024]
2)数据p到o的可达距离reach-distancek(p,o)如公式(2)所示,是k-distance(o)和d(p,o)之间的较大者;
[0025]
3)数据p的局部可达密度lrdk(p)可以表示为公式(3),这个密度值越低,说明p和k距离邻域内点的距离越远,那么p就越可能是离群点;
[0026]
4)p的局部异常因子lofk(p)可以表示为公式(4),如果这个值越接近1,说明p与邻域点的密度差不多,p和邻域点属于同一簇;如果这个比值大于1越多,说明p的密度越小于邻域点的密度,p就越有可能是离群点;
[0027]
设置局部异常因子阈值为θ,当局部异常因子大于θ时则认为该数据点是离群点,去除全局离群点后,设数据集d

有n条数据,要分割为k个段,具体操作步骤如下:
[0028]
5)初始化聚类中心,首先将数据等分为k段,这里选择每一段的深度中间点作为初
始化的聚类中心,聚类中心ci如公式(5)所示,其在d

中对应的序号为ai,ai∈{1,2,...,n},表示其聚类标签,对聚类中心来说表示该点深度,表示除深度外的其他特征,共n个;
[0029]
6)定义距离disc,diss,dis分别如公式(6)、(7)、(8)所示,α、β都是可调整的常数,disc代表了特征之间距离,diss代表了空间上的距离,用dis来表征两个数据点之间的融合距离;
[0030]
7)对d

中的第m条数据,计算其相邻最多两个聚类中心与该条数据的融合距离,设与该条数据融合距离最小的聚类中心为cj,其中j∈{1,2,...,k},则该点的聚类标签lm=j;
[0031]
8)将具有相同聚类标签的数据作为一个段,并重新计算聚类中心,过程如下,对于聚类标签为i的所有数据点计算它们的深度平均值并取与最接近的深度所对应的数据点来更新ci,并重复步骤7)、8)直到算法收敛;
[0032]
9)对分段后的数据每一段内分别使用离群点检测算法找出局部离群点并去除,这样就完成了从全局到局部的离群点检测;
[0033]
10)公式(9)中的x指的是原始测井曲线数据,min(x)指的是该测井曲线中的最小值,max(x)指的是该测井曲线中的最大值,x

指标准化后的数据。
[0034]
除了离群点问题、归一化问题外,原始的测井数据还可能存在数据缺失问题,如某一条数据在ac这条测井曲线上数值为空,那么此条数据在插入数据库时会在ac数据项上补空值null;数据预处理需要找出并剔除此类数据,只保留录入完整的测井数据,但是这些在某一测井曲线上存在空值的数据并不是没有价值的,在系统中会将其单独保存在数据表中,以供专业人士通过界面上的相关按钮对其检索和调用。
[0035]
在一优选的实施方式中,所述调试模式的特征优选模块的功能是当数据预处理完成后,要选择有意义的特征输入机器学习模型进行训练;通常来说,从两个方面考虑来选择特征:特征是否发散以及特征与目标的相关性,这里使用了sklearn库的相关系数法,通过计算相关系数来选择哪些特征对问题的解决更加适合。
[0036]
在一优选的实施方式中,所述调试模式的模型构建指构建测井解释的机器学习模型;事实上,由于测井数据的采集成本较高,我们能用于训练的有标签测井数据是十分有限的,而更多的是没有标签的数据。在系统中,为了充分利用所有数据,除常用的监督学习算法(svm、cnn)外我们还集成了半监督学习算法。
[0037]
在一优选的实施方式中,所述调试模式的模型的评估,这里采用的模型评估方法是k-fold交叉验证法。
[0038]
在一优选的实施方式中,所述用户模式的数据导入导出,其处理流程和调试模式的数据导入导出相同。
[0039]
在一优选的实施方式中,所述用户模式的数据预处理,其处理流程和调试模式的数据预处理相同,但在界面上不提供对有空值数据进行检索和调用的按钮。
[0040]
在一优选的实施方式中,所述用户模式的测井解释模块即使用系统内的人工智能算法完成测井解释工作,主要包括测井曲线的绘制、多种岩性的岩性识别等,解释的结果会以测井曲线图或混淆矩阵的形式保存起来,以供用户浏览和保存。
[0041]
在一优选的实施方式中,所述用户模式的单井数据分析包括新建单井图、单井图
绘制等,其结果同样保存在本地,以供用户浏览和保存。
[0042]
综上所述,由于采用了上述技术方案,本发明的有益效果是:
[0043]
1、本发明中,对调试模式和用户模式从界面上进行区分,对调试模式和用户模式从界面上进行区分,从而确保处在不同工作模式下的界面可以向用户提供符合前期设计的功能。在数据预处理模块中,除了对数据空值的处理外,还提出了一种三阶段的离群点检测方法,用来去除异常数据。
[0044]
2、测井解释主要通过系统中集成的人工智能算法完成测井解释工作。为了充分利用所有数据,除常用的监督学习算法(svm、cnn)外,本系统可集成半监督学习算法实现对庞大规模的无标签数据进行学习。可完成的工作包括测井曲线的绘制、多类别岩性的岩性识别等工作。单井分析的主要功能包括创建单井分析图的创建、粘贴测井曲线、页面属性设置、曲线刻度设置等功能,从而使得人们在使用过程更加便捷,减少了人工测绘的劳动负担
附图说明
[0045]
图1为本发明的测井智能解释系统的功能模块;
[0046]
图2为本发明中测井智能解释系统的系统结构;
[0047]
图3为本发明中测井智能解释系统的数据分析流程图;
[0048]
图4为本发明中系统整体流程图;
[0049]
图5为本发明的系统主界面示意图;
[0050]
图6为本发明的数据库连接配置示意图;
[0051]
图7为本发明的测井数据导入示意图;
[0052]
图8为本发明的分析模型选择示意图;
[0053]
图9为本发明的测井曲线绘制示意图一;
[0054]
图10为本发明的测井曲线绘制示意图二;
[0055]
图11为本发明的创建单井分析图;
[0056]
图12为本发明的粘贴测井曲线示意图。
具体实施方式
[0057]
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
[0058]
参照图1-12,
[0059]
一种测井智能解释系统,其特征在于:所述测井智能解释系统包括调试模式和用户模式;
[0060]
其中调试模式的功能是数据导入导出、数据预处理、特征优选、分析模型的构建以及模型的评估;
[0061]
用户模式的功能是数据导入导出、数据预处理、测井解释以及单井分析。
[0062]
所述调试模式的数据导入导出模块,其功能是用户能够在处理一批新的原始数据时可以将数据导入系统,并可以完成对分析结果的导出。
[0063]
所述调试模式的数据预处理包括对导入系统中的测井数据进行离群点检测,剔除
其中的异常值以及与事实不相符的数据。同时,由于测井数据通常按照一定的深度间隔进行采样,采样间隔一般为0.125m、0.5m等,这种深度上的相邻使得相邻深度的测井数据在测井曲线上也具有相关性。基于以上两点,我们提出了一种三阶段的离群点检测方法;
[0064]
第一步,在整个数据集上找出全局的离群点并去除;第二步,利用深度相近的数据点特征也相似的特点将第一步处理后的数据分成多个段;第三步,在每个段内使用离群点检测算法,找出局部的离群点并去除,实现从全局到局部的离群点检测;具体操作如下:
[0065]
nk(p)={q∈d\{p}|d(p,q)≤k-distance(p)}
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0066]
reach-distancek(p,o)=max{k-distance(o),d(p,o)}
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0067][0068][0069][0070][0071][0072][0073][0074]
假设有测井数据集d以及测井数据点p,o,q,其中p∈d、o∈d且q∈d\{p}:
[0075]
1)对于任意正整数k,p的k距离邻域nk(p)可以表示为公式(1)。其中,d(p,q)表示p和q之间的欧氏距离,k-distance(p)表示p与其第k个近邻之间的欧式距离;
[0076]
2)数据p到o的可达距离reach-distancek(p,o)如公式(2)所示,是k-distance(o)和d(p,o)之间的较大者;
[0077]
3)数据p的局部可达密度lrdk(p)可以表示为公式(3),这个密度值越低,说明p和k距离邻域内点的距离越远,那么p就越可能是离群点;
[0078]
4)p的局部异常因子lofk(p)可以表示为公式(4),如果这个值越接近1,说明p与邻域点的密度差不多,p和邻域点属于同一簇;如果这个比值大于1越多,说明p的密度越小于邻域点的密度,p就越有可能是离群点;
[0079]
设置局部异常因子阈值为θ,当局部异常因子大于θ时则认为该数据点是离群点,去除全局离群点后,设数据集d

有n条数据,要分割为k个段,具体操作步骤如下:
[0080]
5)初始化聚类中心,首先将数据等分为k段,这里选择每一段的深度中间点作为初始化的聚类中心,聚类中心ci如公式(5)所示,其在d

中对应的序号为ai,ai∈{1,2,...,n},表示其聚类标签,对聚类中心来说表示该点深度,表示除深
度外的其他特征,共n个;
[0081]
6)定义距离disc,diss,dis分别如公式(6)、(7)、(8)所示,α、β都是可调整的常数,disc代表了特征之间距离,diss代表了空间上的距离,用dis来表征两个数据点之间的融合距离;
[0082]
7)对d

中的第m条数据,计算其相邻最多两个聚类中心与该条数据的融合距离,设与该条数据融合距离最小的聚类中心为cj,其中j∈{1,2,...,k},则该点的聚类标签lm=j;
[0083]
8)将具有相同聚类标签的数据作为一个段,并重新计算聚类中心,过程如下,对于聚类标签为i的所有数据点计算它们的深度平均值并取与最接近的深度所对应的数据点来更新ci,并重复步骤7)、8)直到算法收敛;
[0084]
9)对分段后的数据每一段内分别使用离群点检测算法找出局部离群点并去除,这样就完成了从全局到局部的离群点检测;
[0085]
10)公式(9)中的x指的是原始测井曲线数据,min(x)指的是该测井曲线中的最小值,max(x)指的是该测井曲线中的最大值,x

指标准化后的数据。
[0086]
11)除了离群点问题、归一化问题外,原始的测井数据还可能存在数据缺失问题,如某一条数据在ac这条测井曲线上数值为空,那么此条数据在插入数据库时会在ac数据项上补空值null;数据预处理需要找出并剔除此类数据,只保留录入完整的测井数据,但是这些在某一测井曲线上存在空值的数据并不是没有价值的,在系统中会将其单独保存在数据表中,以供专业人士通过界面上的相关按钮对其检索和调用。
[0087]
所述调试模式的特征优选模块的功能是当数据预处理完成后,选择有意义的特征输入机器学习模型进行训练。
[0088]
所述调试模式的模型构建指构建测井解释的机器学习模型。事实上,由于测井数据的采集成本较高,我们能用于训练的有标签测井数据是十分有限的,而更多的是没有标签的数据。在系统中,为了充分利用所有数据,除常用的监督学习算法(svm、cnn)外我们还集成了半监督学习算法。所述调试模式的模型的评估,这里采用的模型评估方法是k-fold交叉验证法。
[0089]
所述用户模式的数据导入导出,其处理流程和调试模式的数据导入导出相同。
[0090]
所述用户模式的数据预处理,其处理流程和调试模式的数据预处理相同,但在界面上不提供对有空值数据进行检索和调用的按钮。
[0091]
所述用户模式的测井解释模块即使用系统内的人工智能算法完成测井解释工作,包括测井曲线的绘制、多种岩性的岩性识别等,解释的结果会以测井曲线图或混淆矩阵的形式保存起来,以供用户浏览和保存。
[0092]
所述用户模式的单井数据分析包括新建单井图、单井图绘制等,其结果同样保存在本地,以供用户浏览和保存。
[0093]
本发明中,对功能模块设计中所提到的两种工作模式从界面上进行区分,从而确保处在不同工作模式下的界面可以向用户提供符合前期设计的功能。在数据预处理模块中,除了对数据空值的处理外,还提出了一种三阶段的离群点检测方法,用来去除异常数据。
[0094]
本发明中,测井解释主要通过系统中集成的人工智能算法完成测井解释工作。为了充分利用所有数据,除常用的监督学习算法(svm、cnn)外,本系统可集成半监督学习算法
实现对庞大规模的无标签数据进行学习。可完成的工作包括测井曲线的绘制、多类别岩性的岩性识别等工作。单井分析的主要功能包括创建单井分析图的创建、粘贴测井曲线、页面属性设置、曲线刻度设置等功能,从而使得人们在使用过程更加便捷,减少了人工测绘的劳动负担。
[0095]
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献