一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种岩石分类方法、终端设备及存储介质与流程

2022-03-14 00:36:18 来源:中国专利 TAG:


1.本发明涉及岩石分类领域,尤其涉及一种岩石分类方法、终端设备及存储介质。


背景技术:

2.自然界中大的岩石种类非常丰富,目前被人类发现的已达到三千多种。岩石岩性的识别是研究地质储层特征、计算储量和地质建模工作的基础,尤其是在矿产资源勘探中,岩性识别同样发挥着重要作用。对目标区域岩石的智能识别可以帮助确定不同岩石的布局和数量,可以为区域特征的描绘提供具体的地质信息。岩石识别效率的提高代表地质勘探工作效率得到提升,因此,如何快速识别岩石岩性是一个亟需引起重视的问题。
3.传统岩石样本识别的方法主要有重磁、测井、地震、遥感、电磁、地球化学、手标本及薄片分析等方法,传统的岩石样本识别都是以人眼观察、手工操作和经验分类为主,是由专业人员通过专业设备从岩石图像中提取有效信息特征来分类,主要依靠的是分类人的经验和设备灵敏度,这种方法存在着无法定量分析、效率较低、受人为主观因素影响较大、专业程度比较高和难以普及等问题。


技术实现要素:

4.为了解决上述问题,本发明提出了一种岩石分类方法、终端设备及存储介质。
5.具体方案如下:
6.一种岩石分类方法,包括以下步骤:
7.s1:采集不同类型的纹理图像组成第一训练集,采集不同类型的岩石图像组成第二训练集;
8.s2:构建基于残差块堆叠网络的分类模型,采用迁移学习的方法,设定第一训练集为迁移学习的源域、第二训练集为迁移学习的目标域,在只改变分类模型中的全连接层的参数的情况下对模型进行训练,将训练后的分类模型作为岩石分类模型;
9.分类模型的网络结构由一层卷积层、一层最大池化层、32层残差块、一层平均池化层和一层全连接层组成,其中每个残差块由2个卷积核大小为3
×
3的卷积层组成,残差块的输出由残差块的输入x与经过残差块内的两层卷积层的残差映射f(x)相加得到;
10.s3:通过岩石分类模型对待识别岩石图像进行类型识别,得到待识别岩石图像对应岩石的类型。
11.进一步的,步骤s1中采集的纹理图像为texture library纹理数据集中的图像。
12.进一步的,步骤s1中第一训练集中的图像包括对纹理图像进行图像切分处理后的子图像;第二训练集中的图像包括对岩石图像切分处理后的子图像。
13.进一步的,步骤s1中第一训练集中的图像还包括对纹理图像的子图像进行数据增强处理后的各图像;第二训练集中的图像还包括对岩石图像的子图像进行数据增强处理后的各图像。
14.进一步的,分类模型的网络结构中的32层残差块分为4个模块,每个模块中残差块
个数分别为3、4、6、3,分别为3个包含64个卷积核的残差块、4个包含128个卷积核的残差块、6个包含256个卷积核、3个包含512个卷积核的残差块。
15.进一步的,分类模型的分类器采用softmax,优化器采用自适应矩估计算法。
16.进一步的,分类模型的网络结构中在每个卷积层后均设置一个bn层。
17.进一步的,分类模型的评价指标采用分类准确度与损失值,损失值由损失函数计算获得,损失函数采用交叉熵函数。
18.一种岩石分类终端设备,包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本发明实施例上述的方法的步骤。
19.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例上述的方法的步骤。
20.本发明采用如上技术方案,并具有有益效果:通过迁移学习来防止模型过拟合或者欠拟合,提高岩石分类识别效果;通过迁移学习减少训练耗时,提高学习效率,在迭代次数少的情况下取得不错的训练效果;将迁移学习应用到岩石分类模型,训练之后能达到99%的准确率,保证了岩石识别的准确性。
附图说明
21.图1所示为本发明实施例一的流程图。
22.图2所示为该实施例中分类模型的网络结构示意图。
23.图3所示为该实施例中迁移学习的示意图。
24.图4所示为该实施例中训练过程的参数变化图。
具体实施方式
25.为进一步说明各实施例,本发明提供有附图。这些附图为本发明揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理。配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点。
26.现结合附图和具体实施方式对本发明进一步说明。
27.实施例一:
28.本发明实施例提供了一种岩石分类方法,如图1所示,所述方法包括以下步骤:
29.s1:采集不同类型的纹理图像组成第一训练集,采集不同类型的岩石图像组成第二训练集。
30.第一训练集和第二训练集用于对分类模型的迁移训练。
31.该实施例中采集的纹理图像选用现有的texture library纹理数据集中的图像,该纹理数据集收集了47类与纹理有关的图像,具有与岩石图像纹理相似的特征,因此,在由纹理图像组成的第一训练集上训练过的网络参数会具有较好的岩石特征提取能力,进行迁移学习能有效提高模型分类识别效果。
32.该实施例中采集的岩石图像通过工业相机在录井现场对处于白光灯下的岩屑和岩心样品拍照得到,一共315张,包括黑色煤、灰黑色泥岩、灰色泥质粉砂岩、灰色细砂岩、浅灰色细砂岩、深灰色粉砂质泥岩、深灰色泥岩七类岩石。各类岩石图像数量不同,图像统一
存储为bmp格式,图像大小统一设置为4096
×
3000像素。
33.由于采集的原始岩石图像和纹理图像的样本数量过少且各类别样本数量不均匀,会对识别准确率造成影响,因此该实施例中还包括对纹理图像和岩石图像进行预处理。
34.由于在图像中,像素和空间排列结合在一起产生信息。也就是说,图像特征是由相邻的局部像素来表示的。而放大图像可以揭示更多的局部细节,从而使图像之间有更大的区别。而岩石分类中应充分利用岩石图像的这些局部细节。由于拍摄条件的限制,整体岩石图像样本数据集过小,图像像素过大,且每种岩石类别的样本数量不均匀,会影响识别的准确性。因此,在本发明中采用图像切分的方法。具体的,使用像素大小为322
×
322的滑动窗口对原始图像进行切分,将4096
×
3000像素图像切分为9
×
12个小块,即每幅原始图像切分为108个子图像。以原始图像名 切分后的子图像在原始图像中的位置对切分后的子图像进行命名,便于后续对图像进行还原。例如:3-1-1-2.jpg表示为原始图像3-1.jpg的第2行第3列位置处的子图像。
35.经过图像切分后训练集中的样本数量进行了扩充,为降低样本的不平衡性和解决数据集过小容易造成模型的过拟合的问题,该实施例中还包括对切分后的图像进行数据增强处理,基于有限的数据生成更多同等有效的数据,使通过训练得到的模型泛化能力更强。具体的,将各切分后的子图像经过旋转、翻转、平移、明亮度变化、模糊、增加噪声等多种方式进行数据增强处理。通过这些数据增强方法训练集中的样本数量进行进一步的扩充。
36.s2:构建基于残差块堆叠网络的分类模型,采用迁移学习的方法,设定第一训练集为迁移学习的源域、第二训练集为迁移学习的目标域,在只改变分类模型中的全连接层的参数的情况下对模型进行训练,将训练后的分类模型作为岩石分类模型。
37.通常来说,神经网络层数越多,网络的性能也会提高。实际上,网络过深就可能会出现梯度消失等问题,使训练变得困难。可以通过数据预处理来缓解这些问题,使得较深的网络也可以收敛。可是随着网络深度增加,还是会出现退化问题:训练准确率会逐渐达到饱和,然后不断降低。为了解决深度网络训练困难的问题,该实施例中提出了一种误差无损反向传播的残差块堆叠网络的结构,如图2所示。网络由一层卷积核大小为7
×
7的卷积层(conv)、一层最大池化层(max pool)、32层残差块、一层平均池化层(avg pool)和一层全连接层(fc)组成。
38.32层残差块堆叠,加上卷积核大小为7
×
7的卷积层和全连接层(fc)一共34层。输入残差块的数据通过2个卷积核大小为3
×
3的卷积层得到输出,采用一条捷径直接从输入连接到输出,主线经过卷积操作得到的输出通过捷径与输入相加,两者相加之后的结果再通过relu激活函数输出。捷径连接可以将输入残差块的数据x直接传递到输出,和通过卷积层的残差映射f(x)相加,因此残差块的特征输出为f(x) x。通过捷径连接将误差无损反向传播,解决了梯度消失的问题。残差块使用跳跃链接,将开始的输入信息直接传递给输出,防止信息缺失,使得网络能够更好地提取输入与输出之间有差别特征。由此简化了网络的训练过程中识别的难度,提高了网络训练的速度。
39.32层残差块分为4个模块,每个模块中残差块个数分别为3、4、6、3,分别为3个包含64个卷积核的残差块、4个包含128个卷积核的残差块、6个包含256个卷积核、3个包含512个卷积核的残差块。卷积层的激活函数为非线性relu激活函数。7
×
7的卷积层和3
×
3的最大池化层步幅均设定为2,全连接层的维度设置为所需分类数。
40.该实施例中分类模型的分类器设定为softmax。softmax回归算法常用于多分类问题中,将多个神经元的输出值映射到(0,1)内,且其总和为1,故可作为样本被分类为某一类别的概率,从而实现多分类。选用自适应矩估计(adaptive moment estimation,adam)作为模型的优化器。adam是一种一阶优化算法,可以基于训练数据迭代地更新神经网络的权重。除了使用残差结构来解决网络退化的问题,在网络中还使用了批归一化(batch normalization,bn)。在网络训练过程中,通过归一化使卷积层的输出都满足均值为0、方差为1的分布规律,使激活输入值落在非线性函数对输入比较敏感的区域,此时输入的小变化会导致损失函数较大的变化,让梯度变大,避免梯度消失问题产生。而且梯度变大意味着学习收敛速度快,能加快训练速度,也增强了网络的泛化能力。因此,为解决数据卷积后分布不均和梯度弥散的问题,在每次卷积后进行批归一化,即每个卷积层后都设置一个bn层,加速网络的收敛并提升识别准确率。
41.该实施例中采用分类准确度与损失值作为分类模型的评价指标。分类准确度的计算公式如下:
[0042][0043]
其中,t表示预测的岩石类别与实际岩石类别一致的岩石图像样本的个数,n表示所有岩石图像样本的总数。
[0044]
采用交叉熵函数作为分类模型的损失函数,损失值由损失函数计算,损失函数的计算公式为:
[0045][0046]
其中,m为类别的数量,y
ic
为指示变量,取值为0或1,如果该类别和样本i的类别相同则为1,反之为0;p
ic
为对于观测样本i属于类别c的预测概率。该函数为凸函数,用梯度下降求解时,具有很好的收敛特性,求导时可以得到全局最优值。损失值反映了模型在训练过程中的学习效果。损失值越小,学习效果越好。
[0047]
从深度神经网络的结构和功能角度来看,网络的卷积层部分主要是对图像进行特征提取,网络的池化层主要是用来降低参数数量,网络的全连接层负责整合网络所提取的特征,获取图像特征所具有的高层含义,在分类问题上,最后再通过分类器进行分类,得到分类结果。考虑到岩石图像数据集相比于大型数据集而言类间差距相对较小、数据量也较少,是专业领域的精细类型的小数据集,因而,岩石图像识别问题属于小数据集的细粒度分类。由于岩石图像数据集样本较少,若从零开始训练卷积神经网络易导致过拟合,影响模型的泛化能力。因此该实施例中提出使用迁移学习方法进行岩石识别,分为预训练和参数迁移。迁移学习过程示意图如图3所示。
[0048]
该实施例中采用由texture library纹理数据集组成的第一训练集对上述构建的分类模型进行预训练,由于texture library纹理数据集中包含47类纹理图像,将模型中全连接层的输出设置为47。设置学习率为0.001,批大小为16,迭代60次,设置保存网络模型参数信息的文件路径,训练结束后便可以得到模型参数文件。在预训练中,随着迭代次数增加,模型对纹理图像分类的准确率平稳上升。经过60个周期后模型收敛且准确率能达到
98.3%,损失值降低到0.128,说明预训练效果较好。
[0049]
将在纹理数据集上预训练的模型参数迁移到岩石分类模型进行再训练。由于预训练时全连接层的输出节点为47个,而本实施例中需要分类的岩石类别为7类,所以在预训练网络的基础上,删除最后一层输出为47的全连接层,添加输出为7的全连接层。冻结网络中的全部卷积层避免训练过程中卷积层参数被修改,通过由岩石图像组成的第二训练集重新训练最后的全连接层。该实施例中设置学习率为0.001,批大小为16,迭代60次。每次迭代计算出分类准确率和损失值,并上传到tensorboard工具将训练过程可视化,反复迭代训练从而得到迁移学习后的最优模型。
[0050]
在tensorboard中观察到的参数变化如图4所示。训练过程中,准确率不断上升,损失率不断下降。使用迁移学习的方法训练模型,在第一次迭代时岩石识别准确率就已经达到67.5%,训练过程中准确度波动幅度小。经过60个周期的训练,网络最后分类准确率达到99.1%,损失值降低到0.085,说明模型训练效果良好。
[0051]
s3:通过岩石分类模型对待识别岩石图像进行类型识别,得到待识别岩石图像对应岩石的类型。
[0052]
实施例二:
[0053]
本发明还提供一种岩石分类终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本发明实施例一的上述方法实施例中的步骤。
[0054]
进一步地,作为一个可执行方案,所述岩石分类终端设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述岩石分类终端设备可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,上述岩石分类终端设备的组成结构仅仅是岩石分类终端设备的示例,并不构成对岩石分类终端设备的限定,可以包括比上述更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述岩石分类终端设备还可以包括输入输出设备、网络接入设备、总线等,本发明实施例对此不做限定。
[0055]
进一步地,作为一个可执行方案,所称处理器可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述岩石分类终端设备的控制中心,利用各种接口和线路连接整个岩石分类终端设备的各个部分。
[0056]
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述岩石分类终端设备的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据手机的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0057]
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例上述方法的步骤。
[0058]
所述岩石分类终端设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)以及软件分发介质等。
[0059]
尽管结合优选实施方案具体展示和介绍了本发明,但所属领域的技术人员应该明白,在不脱离所附权利要求书所限定的本发明的精神和范围内,在形式上和细节上可以对本发明做出各种变化,均为本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献