一种提升模型性能的方法、地层岩性预测方法及相关设备与流程

2023-01-15 03:31:53 来源：中国专利 TAG：

1.本技术涉及地球物理勘探技术领域，更具体地说，是涉及一种提升模型性能的方法、地层岩性预测方法及相关设备。

背景技术：

2.地层岩性是油藏分析的基础，计算油藏参数、搭建地质模型等都需要知道地层岩性信息。传统获取地层岩性信息的方式主要通过分析钻井返回的岩屑、分析岩心、分析传统测井曲线。当数据量增大的时候，采用传统方法获取地层岩性信息就会耗时耗力。
3.深度神经网络在图像识别领域获得突破性进展，引领各行各业相继掀起机器学习应用热潮，近年来油气行业也尝试采用机器学习的方法来助力油气开发。应用于地层岩性识别的机器学习算法主要有随机森林（rf）、xgboost、多层感知器（mlp）、一维卷积网络模型（1d cnns）以及循环神经网络（lstm和gru）。机器学习算法的应用加大了地层岩性识别实现自动化的可能性。
4.然而，机器学习模型主要基于训练数据建立输入和输出的映射关系，本质上是一个黑箱，难以解释输入和输出的内部规律；此外，地层岩性样本存在不平衡性，影响了机器学习模型的性能。

技术实现要素：

5.有鉴于此，本技术提供了一种提升模型性能的方法、地层岩性预测方法及相关设备，以提高地层岩性预测模型的性能及可解释性。
6.为实现上述目的，本技术第一方面提供了一种提升模型性能的方法，包括：基于岩层的地球物理特性，确定各目标测井曲线之间的逻辑关系集；基于所述逻辑关系集及训练样本所在地层的岩性，对训练样本进行标注，得到样本标签，所述训练样本为地层的各目标测井曲线的值；结合基于概率分布度量的损失函数以及所述逻辑关系集，构建目标损失函数；基于所述训练样本、所述样本标签及所述目标损失函数，对预设的地层岩性预测模型进行训练，得到目标地层岩性预测模型。
7.优选地，基于岩层的地球物理特性，确定各目标测井曲线之间的逻辑关系集的过程，包括：基于煤的物理特性，得到第一逻辑关系：如果，那么地层岩性为煤；基于硬石膏的物理特性，得到第二逻辑关系：如果，或，那么地层岩性为硬石膏；基于页岩的物理特性，得到第三逻辑关系：如果，那么地层岩性为页岩；其中，及为预设的密度值，为预设的中子孔隙度，为预设的伽马曲线读数。
8.优选地，基于所述逻辑关系集及训练样本所在地层的岩性，对训练样本进行标注，得到样本标签的过程，包括：基于所述逻辑关系集，得到第一扩展标签项：、第二扩展标签项：、第三扩展标签项：以及第四扩展标签项：；若训练样本所在地层的岩性为页岩，将所述训练样本的岩性标记为页岩，将所述训练样本的第一扩展标签项标记为1，将所述训练样本的第二扩展标签项标记为0，将所述训练样本的第三扩展标签项标记为0，将所述训练样本的第四扩展标签项标记为0；若训练样本所在地层的岩性为煤，将所述训练样本的岩性标记为煤，将所述训练样本的第一扩展标签项标记为0，将所述训练样本的第二扩展标签项标记为1，将所述训练样本的第三扩展标签项标记为0，将所述训练样本的第四扩展标签项标记为0；若训练样本所在地层的岩性为硬石膏，将所述训练样本的岩性标记为硬石膏，将所述训练样本的第一扩展标签项标记为0，将所述训练样本的第二扩展标签项标记为0，将所述训练样本的第三扩展标签项标记为1，将所述训练样本的第四扩展标签项标记为1；若训练样本所在地层的岩性为除了煤、硬石膏以及页岩以外的其他岩性，将所述训练样本的岩性标记为相应的岩性，将所述训练样本的第一扩展标签项标记为0，将所述训练样本的第二扩展标签项标记为0，将所述训练样本的第三扩展标签项标记为0，将所述训练样本的第四扩展标签项标记为0；其中，由训练样本的岩性及各扩展标签项构成样本标签。
9.优选地，所述基于概率分布度量的损失函数为二值交叉熵函数；结合基于概率分布度量的损失函数以及所述逻辑关系集，构建目标损失函数的过程，包括：基于所述逻辑关系集，构建多个约束项，所述约束项用于约束训练样本的岩性及各目标测井曲线的值；利用乘积三角范数product t-norm将每一约束项转化为损失函数项；结合二值交叉熵函数及各损失函数项，构建目标损失函数。
10.优选地，所述多个约束项包括：第一约束项：；第二约束项：；第三约束项：；第四约束项：以及第五约束项：；其中，、和分别表示岩性为煤、硬石膏和页岩的概率，、和分别表示密度小于或等于、密度大于或等于、中子孔隙度
小于或等于的概率，表示岩性为第i类岩性的概率。
11.优选地，利用乘积三角范数product t-norm将每一约束项转化为损失函数项的过程，包括：将所述第一约束项转换为第一损失函数项：；将所述第二约束项转换为第二损失函数项：；将所述第三约束项转换为第三损失函数项：；将所述第四约束项转换为第四损失函数项：；将所述第五约束项转换为第五损失函数项：。
12.优选地，结合二值交叉熵函数及各损失函数项，构建目标损失函数的过程，包括：将下述方程式确定为目标损失函数：其中，为二值交叉熵函数，为激活函数的输出，、、、和分别为每一损失函数项的权重。
13.优选地，基于所述训练样本、所述样本标签及所述目标损失函数，对预设的地层岩性预测模型进行训练的过程，包括：将训练样本输入至地层岩性预测模型中，得到所述地层岩性预测模型的输出；基于训练样本的样本标签以及所述目标损失函数，计算得到所述输出的损失值，并以所述损失值趋近于预设的损失阈值为目标，更新所述地层岩性预测模型的可学习参数。
14.本技术第二方面提供了一种提升模型性能的装置，包括：逻辑关系确定单元，用于基于岩层的地球物理特性，确定各目标测井曲线之间的
逻辑关系集；样本标签确定单元，用于基于所述逻辑关系集及训练样本所在地层的岩性，对训练样本进行标注，得到样本标签，所述训练样本为地层的各目标测井曲线的值；损失函数构建单元，用于结合基于概率分布度量的损失函数以及所述逻辑关系集，构建目标损失函数；预测模型训练单元，用于基于所述训练样本、所述样本标签及所述目标损失函数，对预设的地层岩性预测模型进行训练，得到目标地层岩性预测模型。
15.本技术第三方面提供了一种提升模型性能的设备，包括：存储器和处理器；所述存储器，用于存储程序；所述处理器，用于执行所述程序，实现上述的提升模型性能的方法的各个步骤。
16.本技术第四方面提供了一种存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时，实现如上述的提升模型性能的方法的各个步骤。
17.本技术第五方面提供了一种地层岩性预测方法，包括：将对应于一地层的各目标测井曲线的值输入目标地层岩性预测模型，得到所述地层的岩性预测结果；其中，所述目标地层岩性预测模型为采用上述的提升模型性能的方法来构建的目标地层岩性预测模型。
18.经由上述的技术方案可知，本技术首先基于岩层的地球物理特性，确定各目标测井曲线之间的逻辑关系集。其中，所述逻辑关系集包含了各目标测井曲线之间的约束关系。然后，基于所述逻辑关系集及训练样本所在地层的岩性，对训练样本进行标注，得到样本标签。其中，所述训练样本为地层的各目标测井曲线的值；所述样本标签不但包括训练样本的岩性，还包括描述各测井曲线关系的中间标注。接着，结合基于概率分布度量的损失函数以及所述逻辑关系集，构建目标损失函数。最后，基于所述训练样本、所述样本标签及所述目标损失函数，对预设的地层岩性预测模型进行训练，得到目标地层岩性预测模型。由于样本标签及目标损失函数均包含了各测井曲线的之间的约束关系，使得可以引导所述地层岩性预测模型识别出作为少数类的训练样本的岩性，降低了样本不均衡性对所述地层岩性预测模型性能的影响，提高了所述地层岩性预测模型预测的准确性，并且提高了所述地层岩性预测模型的可解释性。
附图说明
19.为了更清楚地说明本技术实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。
20.图1为本技术实施例公开的提升模型性能的方法的示意图；图2为本技术实施例公开的利用领域知识进行标注扩展的示意图；图3示例了地层岩性预测模型在数据上得到的交叉验证结果和测试结果；图4示例了本技术实施例公开的地层岩性预测模型的整体性能；图5为本技术实施例公开的提升模型性能的装置的示意图；
图6为本技术实施例公开的提升模型性能的设备的示意图。
具体实施方式
21.下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
22.本技术的发明人发现，机器学习模型主要基于训练数据建立输入和输出的映射关系，是纯数据驱动的方法。目前纯数据驱动模型在地层岩性应用方面主要存在以下问题：（1）地层岩性样本存在不平衡性，样本主要为砂岩和碳酸盐岩，含少量的泥岩，偶尔会存在煤层以及蒸发矿物，其中砂岩和碳酸盐岩为大多数类（majority class），煤层和蒸发矿物为少数类（minority class）。对于多分类问题，模型假定每类的样本数目相近。由于模型训练的时候主要看到大多数类的样本，从少数类学习到的信息较少，因此，如果样本不均衡，模型在少数类上会表现较差；（2）地质学家基于测井曲线分析地层岩性信息已有几十年的历史，积累了丰富的经验，传统方法侧重物理机理，得到的结果具备可解释性。因此，地质学家希望模型也具有可解释性，而目前的机器学习模型为一个黑箱，难以解释输入和输出的内部规律。
23.由于少数类样本少，模型从少量类学习到的信息少，因此，为降低不均衡样本对模型性能的影响，可以将传统用于识别岩性的领域知识跟机器学习算法结合，如此一来，可以通过领域知识来告诉模型如何识别少数类，而不是让模型自己从不平衡的数据中学习出识别少数类的本领。基于领域知识，可以明确知道为什么模型会把一个样本预测成煤层或者硬石膏，因此，模型的可解释性也得到增强。领域知识和机器学习算法结合的方式主要有四种：（1）基于领域知识生成更多的训练数据；（2）基于领域知识修改模型结构；（3）基于领域知识构建额外的损失函数项来约束模型训练过程；（4）基于领域知识验证最终输出结果。本技术选择通过构建额外损失函数项的方式将领域知识跟机器学习算法结合，以增强模型可解释性以及降低不均衡样本对模型性能的影响。
24.下面介绍本技术实施例提供的提升模型性能的方法，该方法可以提高地层岩性预测模型的性能，且使得预测结果具备可解释性。请参阅图1，本技术实施例提供的提升模型性能的方法可以包括如下步骤：步骤s101，基于岩层的地球物理特性，确定各目标测井曲线之间的逻辑关系集。
25.其中，各目标测井曲线可以包括伽马曲线（gr）、中子孔隙度（）、密度（）、p-波时差（dtc）、s-波时差（dts）、电阻率（）和地层岩性（lith）数据等。岩层的地球物理特性可以包括各目标测井曲线与地层岩性的约束关系，基于这些约束关系，可以构建一系列逻辑关系式。
26.表1：基于领域知识的约束关系
各约束关系如表1所示，其中，接近1.7 g/cm3，接近2.8 g/cm3，接近0.1 cm3/cm3，接近100 gapi。
27.步骤s102，基于逻辑关系集及训练样本所在地层的岩性，对训练样本进行标注，得到样本标签。
28.其中，训练样本为地层的各目标测井曲线的值。通常地，训练样本的标签仅包括最终标注，如某训练样本的岩性为页岩，则该训练样本的标签为页岩；如某训练样本的岩性为煤，则该训练样本的标签为煤。为引导模型识别出少数类，可以基于逻辑关系集构建额外的中间标注。即，若某训练样本的岩性为页岩，则该训练样本的中间标注可以包括：伽马曲线的读数高于；若如某训练样本的岩性为煤，则该训练样本的中间标注可以包括：密度不高于。这些中间标注用于监督模型的训练，使得模型能够基于领域知识正确识别出少数类的岩性。
29.步骤s103，结合基于概率分布度量的损失函数以及逻辑关系集，构建目标损失函数。
30.其中，基于概率分布度量的损失函数可以包括交叉熵损失函数、softmax损失函数等，用于度量模型的预测值与真实值之间的差异程度。可以基于逻辑关系集，构建额外的损失函数项，然后由这些损失函数项，结合交叉熵损失函数等现有的损失函数，来构建目标损失函数。
31.步骤s104，基于训练样本、样本标签及目标损失函数，对预设的地层岩性预测模型进行训练，得到目标地层岩性预测模型。
32.本技术首先基于岩层的地球物理特性，确定各目标测井曲线之间的逻辑关系集。其中，所述逻辑关系集包含了各目标测井曲线之间的约束关系。然后，基于所述逻辑关系集及训练样本所在地层的岩性，对训练样本进行标注，得到样本标签。其中，所述训练样本为地层的各目标测井曲线的值；所述样本标签不但包括训练样本的岩性，还包括描述各测井曲线关系的中间标注。接着，结合基于概率分布度量的损失函数以及所述逻辑关系集，构建目标损失函数。最后，基于所述训练样本、所述样本标签及所述目标损失函数，对预设的地层岩性预测模型进行训练，得到目标地层岩性预测模型。由于样本标签及目标损失函数均包含了各测井曲线的之间的约束关系，使得可以引导所述地层岩性预测模型识别出作为少数类的训练样本的岩性，降低了样本不均衡性对所述地层岩性预测模型性能的影响，提高了所述地层岩性预测模型预测的准确性，并且提高了所述地层岩性预测模型的可解释性。
33.在本技术的一些实施例中，步骤s101基于岩层的地球物理特性，确定各目标测井曲线之间的逻辑关系集的过程，可以包括：
s1，基于煤的物理特性，得到第一逻辑关系：如果，那么地层岩性为煤。
34.s2，基于硬石膏的物理特性，得到第二逻辑关系：如果，或，那么地层岩性为硬石膏。
35.s3，基于页岩的物理特性，得到第三逻辑关系：如果，那么地层岩性为页岩。
36.其中，及为预设的密度值，为预设的中子孔隙度，为预设的伽马曲线读数。
37.实际上，在标注时不需要给定、、和的值，只需要对煤层、硬石膏以及页岩这三类样本的中间标注做监督。基于此，在本技术的一些实施例中，步骤s102基于逻辑关系集及训练样本所在地层的岩性，对训练样本进行标注，得到样本标签的过程，可以包括：s1，基于逻辑关系集，得到第一扩展标签项：、第二扩展标签项：、第三扩展标签项：以及第四扩展标签项：。
38.s2，若训练样本所在地层的岩性为页岩，将该训练样本的岩性标记为页岩，将该训练样本的第一扩展标签项、第二扩展标签项、第三扩展标签项以及第四扩展标签项分别标记为1、0、0、0。
39.s3，若训练样本所在地层的岩性为煤，将该训练样本的岩性标记为煤，将该训练样本的第一扩展标签项、第二扩展标签项、第三扩展标签项以及第四扩展标签项分别标记为0、1、0、0。
40.s4，若训练样本所在地层的岩性为硬石膏，将该训练样本的岩性标记为硬石膏，将该训练样本的第一扩展标签项、第二扩展标签项、第三扩展标签项以及第四扩展标签项分别标记为0、0、1、1。
41.s5，若训练样本所在地层的岩性为除了煤、硬石膏以及页岩以外的其他岩性，将该训练样本的岩性标记为相应的岩性，将该训练样本的第一扩展标签项标记为0，将所述训练样本的第二扩展标签项标记为0，将所述训练样本的第三扩展标签项标记为0，将所述训练样本的第四扩展标签项标记为0。
42.上述“相应的岩性”是指与训练样本所在地层的岩性相一致的岩性，具体地，地层岩性除了煤、硬石膏、页岩，还可以包括砂岩、泥质砂岩、石灰岩、泥质石灰岩等，因此，若训练样本所在地层的岩性为砂岩，则可以将该训练样本的岩性标记为砂岩；若训练样本所在地层的岩性为泥质砂岩，则可以将该训练样本的岩性标记为泥质砂岩；以此类推。
43.其中，由训练样本的岩性及各扩展标签项构成样本标签。
44.如图2所示，通过上述的扩展标注过程，使得标注数据的维度从扩充到，其中，n为训练样本的个数，为扩展标注项的个数，亦即表1中所包含的条件的个数。由于本实施例中，扩展标注项有4个，最终得到的标注数据的维度为。
45.本技术要解决的问题为多标签分类（multi-label classification）问题。采用神经网络处理这类问题时，输出层包含k个神经元对应k个类别，输出层的激活函数一般采用
softmax，而损失函数可以为交叉熵损失(cross-entropy loss)。在前述实施例中，把各逻辑关系中的条件添加到标注数据以后，输出层神经元增加至k m-1。因为各类别之间不是互斥的，允许同时出现，可以采用sigmoid激活函数分别将输出层的每个元素转换为概率值，同时将损失函数调整为二值交叉熵损失函数（binary cross-entropy loss）。
46.基于此，在本技术的一些实施例中，前面提及的基于概率分布度量的损失函数为二值交叉熵函数。步骤s103结合基于概率分布度量的损失函数以及逻辑关系集，构建目标损失函数的过程，可以包括：s1，基于逻辑关系集，构建多个约束项。
47.其中，这些约束项用于约束训练样本的岩性及各目标测井曲线的值。
48.s2，利用product t-norm（乘积三角范数）将每一约束项转化为损失函数项。
49.s3，结合二值交叉熵函数及各损失函数项，构建目标损失函数。
50.表2：逻辑运算符的真值表如表2所示，逻辑语句“如果p那么q”等同于。
51.基于此，在本技术的一些实施例中，上述s1提及的多个约束项可以包括以下五个约束项：第一约束项：；第二约束项：；第三约束项：；第四约束项：以及第五约束项：；其中，、和分别表示岩性为煤、硬石膏和页岩的概率，、和分别表示密度小于或等于、密度大于或等于、中子孔隙度小于或等于的概率，表示岩性为第i类岩性的概率。
52.具体地，对于第一逻辑关系“如果，那么地层岩性为煤”，可以得到第一约束项：。
53.对于第二逻辑关系“如果，或，那么地层岩性为硬石膏”，可以得到第二约束项：。
54.对于第三逻辑关系“如果，那么地层岩性为页岩”，可以得到第三约束项：。
55.由于每一训练样本有且仅有一个岩性类别（页岩、煤、硬石膏及其他岩性中仅可择一），因此，可以得到第四约束项：其中，此处假设总共有k种岩性，每一训练样本的岩性仅可在这k种岩性中择一而定。
56.对于每一训练样本，和不能同时为真，因此，可以得到第五约束项：。
57.基于德
·
摩根定律，可以表示为：
ꢀꢀ
（1）表3：将逻辑关系映射到可导函数基于表3所示的product t-norm算子，式（1）可以改写为：
ꢀꢀ
（2）假设式（2）为真，则添加到损失函数的惩罚项为：
ꢀꢀ
（3）基于式（3）可以得到第一约束项、第二约束项及第三约束项的可导函数。
58.对于第四约束项，假设所有样本中总有4种岩性，即对于每一训练样本，其岩性为
第一岩性（概率为）、其岩性为第二岩性（概率为）、其岩性为第三岩性（概率为）以及其岩性为第四岩性（概率为）中，仅有一项为真，可以表示为：假设上式为真，则最小化目标函数为：
ꢀꢀꢀ
（4）因此，对于所有样本中总有k种岩性的情况，根据式（4）可以得到最小化目标函数为：
ꢀꢀꢀ
（5）基于此，在本技术的一些实施例中，上述s2利用乘积三角范数product t-norm将每一约束项转化为损失函数项的过程，可以包括：s21，将第一约束项转换为第一损失函数项：；s22，将第二约束项转换为第二损失函数项：；s23，将第三约束项转换为第三损失函数项：；s24，将第四约束项转换为第四损失函数项：；s25，将第五约束项转换为第五损失函数项：。
59.在本技术的一些实施例中，上述s3结合二值交叉熵函数及各损失函数项，构建目标损失函数的过程，可以包括：将下述方程式确定为目标损失函数：
其中，为二值交叉熵函数，为激活函数的输出，、、、和分别为每一损失函数项的权重。
60.在本技术的一些实施例中，步骤s104基于训练样本、样本标签及目标损失函数，对预设的地层岩性预测模型进行训练的过程，可以包括：s1，将训练样本输入至地层岩性预测模型中，得到地层岩性预测模型的输出。
61.s2，基于训练样本的样本标签以及目标损失函数，计算得到该输出的损失值，并以损失值趋近于预设的损失阈值为目标，更新该地层岩性预测模型的可学习参数。
62.基于上述各实施例提供的提升模型性能的方法，本技术实施例还提供一种地层岩性预测方法，该方法可以包括：将对应于一地层的各目标测井曲线的值输入地层岩性预测模型，得到改地层的岩性预测结果。
63.其中，该地层岩性预测模型为采用上述任一实施例提供的提升模型性能的方法构建的目标地层岩性预测模型。
64.表4：每一类地层岩性的f-score
为证明本技术所提出的方法的有效性，采用f-score来衡量地层岩性预测模型的性能，其中，神经网络模型采用gru模型。图3及图4展示了该地层岩性预测模型在数据上得到的交叉验证结果和测试结果。从图3中可以看到，页岩、煤层和硬石膏为少数样本，图4展示了模型整体性能，考虑了领域知识以后，模型的整体性能有一定的提升。从表4可以看到，结合领域知识（gru_mu_0.01）的方法能提升模型预测煤、硬石膏以及页岩的能力，有效提升了模型的性能。
65.可以理解的是，本技术实施例仅展示了基于gru模型得到的结果。由于领域知识是以额外损失函数项的方式跟机器学习算法结合，因此模型不局限于gru模型。
66.下面对本技术实施例提供的提升模型性能的装置进行描述，下文描述的提升模型性能的装置与上文描述的提升模型性能的方法可相互对应参照。
67.请参见图5，本技术实施例提供的提升模型性能的装置，可以包括：逻辑关系确定单元21，用于基于岩层的地球物理特性，确定各目标测井曲线之间的逻辑关系集；样本标签确定单元22，用于基于所述逻辑关系集及训练样本所在地层的岩性，对训练样本进行标注，得到样本标签，所述训练样本为地层的各目标测井曲线的值；损失函数构建单元23，用于结合基于概率分布度量的损失函数以及所述逻辑关系集，构建目标损失函数；预测模型训练单元24，用于基于所述训练样本、所述样本标签及所述目标损失函数，对预设的地层岩性预测模型进行训练，得到目标地层岩性预测模型。
68.在本技术的一些实施例中，逻辑关系确定单元21基于岩层的地球物理特性，确定各目标测井曲线之间的逻辑关系集的过程，可以包括：基于煤的物理特性，得到第一逻辑关系：如果，那么地层岩性为煤；基于硬石膏的物理特性，得到第二逻辑关系：如果，或，那么地层岩性为硬石膏；
基于页岩的物理特性，得到第三逻辑关系：如果，那么地层岩性为页岩；其中，及为预设的密度值，为预设的中子孔隙度，为预设的伽马曲线读数。
69.在本技术的一些实施例中，样本标签确定单元22基于所述逻辑关系集及训练样本所在地层的岩性，对训练样本进行标注，得到样本标签的过程，可以包括：基于所述逻辑关系集，得到第一扩展标签项：、第二扩展标签项：、第三扩展标签项：以及第四扩展标签项：；若训练样本所在地层的岩性为页岩，将所述训练样本的岩性标记为页岩，将所述训练样本的第一扩展标签项标记为1，将所述训练样本的第二扩展标签项标记为0，将所述训练样本的第三扩展标签项标记为0，将所述训练样本的第四扩展标签项标记为0；若训练样本所在地层的岩性为煤，将所述训练样本的岩性标记为煤，将所述训练样本的第一扩展标签项标记为0，将所述训练样本的第二扩展标签项标记为1，将所述训练样本的第三扩展标签项标记为0，将所述训练样本的第四扩展标签项标记为0；若训练样本所在地层的岩性为硬石膏，将所述训练样本的岩性标记为硬石膏，将所述训练样本的第一扩展标签项标记为0，将所述训练样本的第二扩展标签项标记为0，将所述训练样本的第三扩展标签项标记为1，将所述训练样本的第四扩展标签项标记为1；若训练样本所在地层的岩性为除了煤、硬石膏以及页岩以外的其他岩性，将所述训练样本的岩性标记为相应的岩性，将所述训练样本的第一扩展标签项标记为0，将所述训练样本的第二扩展标签项标记为0，将所述训练样本的第三扩展标签项标记为0，将所述训练样本的第四扩展标签项标记为0；其中，由训练样本的岩性及各扩展标签项构成样本标签。
70.在本技术的一些实施例中，所述基于概率分布度量的损失函数为二值交叉熵函数；损失函数构建单元23结合基于概率分布度量的损失函数以及所述逻辑关系集，构建目标损失函数的过程，可以包括：基于所述逻辑关系集，构建多个约束项，所述约束项用于约束训练样本的岩性及各目标测井曲线的值；利用乘积三角范数product t-norm将每一约束项转化为损失函数项；结合二值交叉熵函数及各损失函数项，构建目标损失函数。
71.在本技术的一些实施例中，所述多个约束项包括：第一约束项：；第二约束项：；第三约束项：；第四约束项：以及
第五约束项：；其中，、和分别表示岩性为煤、硬石膏和页岩的概率，、和分别表示密度小于或等于、密度大于或等于、中子孔隙度小于或等于的概率，表示岩性为第i类岩性的概率。
72.在本技术的一些实施例中，损失函数构建单元23利用乘积三角范数product t-norm将每一约束项转化为损失函数项的过程，可以包括：将所述第一约束项转换为第一损失函数项：；将所述第二约束项转换为第二损失函数项：；将所述第三约束项转换为第三损失函数项：；将所述第四约束项转换为第四损失函数项：；将所述第五约束项转换为第五损失函数项：。
73.在本技术的一些实施例中，损失函数构建单元23结合二值交叉熵函数及各损失函数项，构建目标损失函数的过程，可以包括：将下述方程式确定为目标损失函数：其中，为二值交叉熵函数，为激活函数的输出，、、、和分别为每一损失函数项的权重。
74.在本技术的一些实施例中，预测模型训练单元24基于所述训练样本、所述样本标签及所述目标损失函数，对预设的地层岩性预测模型进行训练的过程，可以包括：
将训练样本输入至地层岩性预测模型中，得到所述地层岩性预测模型的输出；基于训练样本的样本标签以及所述目标损失函数，计算得到所述输出的损失值，并以所述损失值趋近于预设的损失阈值为目标，更新所述地层岩性预测模型的可学习参数。
75.本技术实施例提供的提升模型性能的装置可应用于提升模型性能的设备，如计算机等。可选的，图6示出了提升模型性能的设备的硬件结构框图，参照图6，提升模型性能的设备的硬件结构可以包括：至少一个处理器31，至少一个通信接口32，至少一个存储器33和至少一个通信总线34。
76.在本技术实施例中，处理器31、通信接口32、存储器33、通信总线34的数量为至少一个，且处理器31、通信接口32、存储器33通过通信总线34完成相互间的通信；处理器31可能是一个中央处理器cpu，或者是特定集成电路asic（application specific integrated circuit），或者是被配置成实施本技术实施例的一个或多个集成电路等；存储器33可能包含高速ram存储器，也可能还包括非易失性存储器（non-volatile memory）等，例如至少一个磁盘存储器；其中，存储器33存储有程序，处理器31可调用存储器33存储的程序，所述程序用于：基于岩层的地球物理特性，确定各目标测井曲线之间的逻辑关系集；基于所述逻辑关系集及训练样本所在地层的岩性，对训练样本进行标注，得到样本标签，所述训练样本为地层的各目标测井曲线的值；结合基于概率分布度量的损失函数以及所述逻辑关系集，构建目标损失函数；基于所述训练样本、所述样本标签及所述目标损失函数，对预设的地层岩性预测模型进行训练，得到目标地层岩性预测模型。
77.可选的，所述程序的细化功能和扩展功能可参照上文描述。
78.本技术实施例还提供一种存储介质，该存储介质可存储有适于处理器执行的程序，所述程序用于：基于岩层的地球物理特性，确定各目标测井曲线之间的逻辑关系集；基于所述逻辑关系集及训练样本所在地层的岩性，对训练样本进行标注，得到样本标签，所述训练样本为地层的各目标测井曲线的值；结合基于概率分布度量的损失函数以及所述逻辑关系集，构建目标损失函数；基于所述训练样本、所述样本标签及所述目标损失函数，对预设的地层岩性预测模型进行训练，得到目标地层岩性预测模型。
79.可选的，所述程序的细化功能和扩展功能可参照上文描述。
80.综上所述：本技术首先基于岩层的地球物理特性，确定各目标测井曲线之间的逻辑关系集。其中，所述逻辑关系集包含了各目标测井曲线之间的约束关系。然后，基于所述逻辑关系集及训练样本所在地层的岩性，对训练样本进行标注，得到样本标签。其中，所述训练样本为地层的各目标测井曲线的值；所述样本标签不但包括训练样本的岩性，还包括描述各测井曲线关系的中间标注。接着，结合基于概率分布度量的损失函数以及所述逻辑关系集，构建
目标损失函数。最后，基于所述训练样本、所述样本标签及所述目标损失函数，对预设的地层岩性预测模型进行训练，得到目标地层岩性预测模型。由于样本标签及目标损失函数均包含了各测井曲线的之间的约束关系，使得可以引导所述地层岩性预测模型识别出作为少数类的训练样本的岩性，降低了样本不均衡性对所述地层岩性预测模型性能的影响，提高了所述地层岩性预测模型预测的准确性，并且提高了所述地层岩性预测模型的可解释性。进一步地，领域知识以额外损失函数项的形式跟算法结合，可应用于多种模型结构，具有良好的普适性。
81.最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
82.本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间可以根据需要进行组合，且相同相似部分互相参见即可。
83.对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本技术。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下，在其它实施例中实现。因此，本技术将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

一种提升模型性能的方法、地层岩性预测方法及相关设备与流程

相关文献

最热文献