一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于时域卷积网络的可控源电磁数据去噪方法、系统、终端及可读存储介质与流程

2021-12-08 00:09:00 来源:中国专利 TAG:


1.本发明属于地球物理信号处理技术领域,具体涉及一种基于时域卷积网络 (temporal convolutional network,tcn)的可控源电磁法(controlled

sourceelectromagnetic method,csem)数据去噪方法、系统、终端及可读存储介质。


背景技术:

2.可控源电磁法以人工源代替天然场源,相对于天然场源电磁法,具有更高的抗干扰能力,目前已经在页岩气勘探、金属矿勘探以及工程物探等领域获得越来越广泛的应用。随着城市化比例的不断提高,人文噪声的分布越来越广,人工源电磁法在实际勘探过程中依然受到噪声的严重影响,对采集到的信号进行去噪处理仍然是一项重要的任务。
3.面对严峻的人文噪声污染,常用的做法是设置相关度的阈值并进行数据挑选。然而,人为设定阈值具有一定的主观性并且需要一定的经验才能取得较为理想的结果。由于人文噪声常常是持续性的,而传统的方法所采用的参数单一,只能反映单一的数据特征,因此传统方法常常无法有效准确鉴别人文噪声。
4.近年来,人工智能算法快速发展,引起了地球物理领域的关注。深度学习背景下的序列建模主要与循环神经网络架构有关,但是其架构存在常见缺陷,如梯度爆炸问题或缺乏内存保留的问题,而卷积操作很好地避免了上述问题。因而,卷积网络成为主流的架构之一。从而,如何利用卷积网络提高可控源电磁数据的去噪精度是值得进一步探讨和研究的。


技术实现要素:

5.本发明的目的是针对可控源电磁数据的去噪问题,提供一种基于时域卷积网络的可控源电磁数据去噪方法、系统、终端及可读存储介质,所述方法引入结合了残差网络和卷积神经网络优点的时域卷积网络,利用时域卷积网络实现可控源电磁数据的去噪,提高了去噪精度和效果,有效解决传统方法损失高质量片段及人工挑选数据结果不一致以及产生主观偏差等问题。
6.一方面,本发明提供一种基于时域卷积网络的可控源电磁数据去噪方法,其包括以下步骤:
7.步骤1:获取可控源电磁数据并对其进行分段,将每一个数据段作为一个样本以及标记样本的分类标签;
8.所述分类标签表示样本为噪声数据段或高质量数据段;
9.步骤2:构建时域卷积网络,并将样本及分类标签输入至所述时域卷积网络进行训练得到可控源电磁数据分类模型;
10.步骤3:针对待去噪的可控源电磁数据,先分段再输入至所述可控源电磁数据分类模型得到每个数据段的分类结果;
11.步骤4:基于步骤3中的分类结果将高质量数据段进行重组拼接。
12.时域卷积网络结合了残差网络和传统卷积神经网络的优点,是用于序列建模任务的卷积神经网络的变体。其卷积操作由因果卷积和扩张卷积构成,因果卷积获取历史信息,扩张卷积扩大卷积核感受野。相比于传统的卷积网络,时域卷积网络没有池化层,但是其输入输出的序列长度却是一致的。这也使得它具有了灵活的感受野大小、非常长的有效历史长度等特点。
13.基于时域卷积网络的独特优势,本发明将其引入用于解决可控源电磁数据去噪问题,从而提高了去噪精度。
14.可选地,所述时域卷积网络包括输入层、隐藏层以及输出层,其中,所述隐藏层由若干个残差块构成,每个残差块包含一维因果扩张卷积和一维卷积。
15.譬如本发明具体应用时使用3
×
1一维卷积替代传统时域卷积网络残差链接中的一维逐点卷积,既能有效控制通道数,也可以进一步提取数据特征,达到快速收敛的目的。
16.可选地,所述若干个残差块中卷积核的数目依次递减。
17.其中,传统时域卷积网络深度逐步增大,参数量庞大,网络收敛速度缓慢。而本发明将网络卷积核数目逐步降低,即减小网络深度,降低模型的参数量,可以防止过拟合;同时在利用网络进行特征筛选时,还可以加快网络收敛速度。
18.可选地,步骤1中获取可控源电磁数据后,按照平移增广法构建样本;
19.其中,一个样本对应时间序列表示为:
[0020][0021]
式中,i表示样本序号,m是获取的可控源电磁数据的数据长度,n为样本长度,q为小于n的正整数,x
(i

1)*q 1
为可控源电磁数据中第(i

1)*q 1个数据点。
[0022]
应当理解,增广处理一方面增加了样本数量,弥补训练样本的匮乏,二方面提升了样本的多样性;为了能够突出并学习数据的相位特征,样本之间存在部分重叠。本发明通过数据增广能够使得模型的泛化能力更加突出,分类效果更好。这是因为模型分类的依据是现有的样本训练而来的权重,而数据增广丰富了样本的多样性,即所得权重综合考虑多方因素。
[0023]
可选地,设定每个样本的分类标签时,按照如下标准进行分类标记:
[0024]
若样本中有效信号幅值小于1mv时,将噪声幅值大于或等于有效信号幅值的样本设定为噪声数据段;
[0025]
若样本中有效信号幅值大于或等于1mv时,将噪声幅值大于或等于1mv 的样本定义为噪声数据段;
[0026]
反之,其他为高质量数据段。
[0027]
可选地,每个样本对应的时间为一个周期或者整数倍周期。其中,周期性分段,可以更有效降低噪声数据段直接删除的影响。
[0028]
第二方面,本发明提供一种基于上述方法的系统,其包括:
[0029]
样本构建模块,用于获取可控源电磁数据并对其进行分段,将每一个数据段作为一个样本;
[0030]
分类标签标记模块,用于标记每个样本的分类标签;
[0031]
可控源电磁数据分类模型构建模块,用于构建时域卷积网络,并将样本及分类标
签输入至所述时域卷积网络进行训练得到可控源电磁数据分类模型;
[0032]
分类模块,用于将待去噪的可控源电磁数据的数据段输入至所述可控源电磁数据分类模型得到每个数据段的分类结果;
[0033]
重组模块,用于基于分类结果将高质量数据段进行重组拼接。
[0034]
第三方面,本发明提供一种终端,其包括:
[0035]
一个或多个处理器;
[0036]
存储了一个或多个计算机程序的存储器;
[0037]
所述处理器调用计算机程序以执行:
[0038]
一种基于时域卷积网络的可控源电磁数据去噪方法的步骤。
[0039]
第四方面,本发明提供一种可读存储介质,其存储了计算机程序,所述计算机程序被处理器调用以执行:
[0040]
一种基于时域卷积网络的可控源电磁数据去噪方法的步骤。
[0041]
有益效果
[0042]
1.本发明引入时域卷积网络算法,充分利用时域卷积网络算法的独特优势,提高了可控源电磁数据去噪精度,在保证数据质量的前提下保留高质量数据段,避免传统相关度阈值法带来的误差。
[0043]
2.本发明进一步的优选方案中,数据段的长度设置为一个周期或者整数倍周期的采样点数,可以保留完整的频率信息,相较于以往大地电磁数据分段需要通过人为或者其他算法设置较为合理的数据段长度的方式,本发明针对周期性的可控电磁数据,数据段的长度设置更为合理以及简单,同时也有效降低直接删除强干扰的噪声数据段的影响。
[0044]
3.本发明进一步的优选方案中,针对可控源电磁数据的伪随机方波特征,本发明所搭建时域卷积模型做了如下优化:首先,传统时域卷积网络深度逐步增大,参数量庞大,网络收敛速度缓慢。本发明将网络卷积核数目逐步降低,即降低网络深度,降低模型的参数量,防止过拟合;同时可以加快网络收敛速度。其次,本发明用一维卷积替代传统时域卷积网络残差链接中的一维逐点卷积,既能有效控制通道数,也可以进一步提取数据特征,达到快速收敛的目的。经过上述优化,本发明的数据筛选及去噪精度得到明显提高。
附图说明
[0045]
图1是本发明提供的时域卷积网络模型架构图;
[0046]
图2是本发明提供的因果扩张卷积原理图;
[0047]
图3是本发明提供的残差块的结构示意图;
[0048]
图4是本发明提供的一种基于时域卷积网络的可控源电磁数据去噪方法的流程图;
[0049]
图5是时域卷积网络模型精度的训练过程的比对图;
[0050]
图6是时域卷积网络模型损失的训练过程的比对图;
[0051]
图7是实测数据处理前后的时间序列效果(会东县2号测点);
[0052]
图8为实测数据处理前后的时间序列效果(巧家县33号测点)。
具体实施方式
[0053]
本发明提供一种基于时域卷积网络的可控源电磁数据去噪方法,其引入时域卷积网络算法来解决可控源电磁数据去噪问题,下面将结合实施例对本发明做进一步的说明。
[0054]
实施例1:
[0055]
如图1所示,本实施例提供的一种基于时域卷积网络的可控源电磁数据去噪方法,其包括以下步骤:
[0056]
步骤1:获取可控源电磁数据并对其进行分段,将每一个数据段作为一个样本以及标记样本的分类标签。
[0057]
本实施例中以周期为单元,选择实测可控源电磁数据进行样本构建,每一段为一个样本。设用于制作样本的数据为x={x1,x2,

,x
m
},m是数据长度。则第 i个样本对应的时间序列为s
i
={x
(i

1)*n 1
,x
(i

1)*n 2
,

,x
(i

1)*n n
},其中,n为一个样本所占的采样点数,即每一个样本的长度。
[0058]
根据样本的特征,对全部样本进行分类、标记。其中,本实施例对于有效信号幅值小于1mv的数据,将噪声幅值大于或等于有效信号幅值的样本定义为噪声样本(非高质量数据段),标记为1;反之则定义为高质量样本,标记为0。对于有效信号幅值大于等于1mv的信号,将噪声幅值大于等于1mv的样本定义为噪声样本,标记为1;反之则为高质量样本,标记为0。
[0059]
其中,有效信号一般指代可控源电磁数据的有用信号,从图中可以明显看出。本实施例中进行样本分类时,可以基于有效信号的最大值,也可以基于有效信号的平均值进行比较。如比较有效信号的平均值与1mv大小;比较噪声幅值与有效信号最大幅值大小。
[0060]
对于长度为m的观测数据x,核心样本数量n0为:
[0061][0062]
本实施例中优选对数据进行增广处理,以第i个样本为例,取任意小于一个 周期采样点数n的正整数为基数,记作q,则样本对应时间序列为 增广后的样本总数n1为:
[0063][0064]
其他可行的实施例中,可以不进行增广处理,本发明对此没有具体的限定。
[0065]
步骤2:构建时域卷积网络,并将样本及分类标签输入至所述时域卷积网络进行训练得到可控源电磁数据分类模型;
[0066]
时域卷积网络结合了残差网络和卷积神经网络,是用于序列建模任务的卷积神经网络的变体。卷积操作由因果卷积和扩张卷积构成,因果卷积获取历史信息,扩张卷积扩大卷积核感受野。如图1所示,时域卷积网络模型由输入层、隐藏层和输出层三部分构成。所述输入层形状是:样本长度乘以通道数,即n
×
1。
[0067]
本实施例中隐藏层由残差块1、残差块2、残差块3、残差块4、残差块5 共计五个残差块构成,而残差块一般包含2个一维因果扩张卷积和1个一维卷积。因果扩张卷积由因果
flatten层将残差块5的结果展平为6n
×
1的一维序列;dense层含有2个神经元且使用“softmax”函数激活。输出层输出的是所述类别的概率,从而得到样本的分类结果,即噪声或高质量。
[0077]
如图5和6为时域卷积网络训练过程,其中,带有圆点标记的曲线代表训练集在模型训练过程中精度及损失的变化,带有三角形标记的曲线代表验证集在模型经过训练集训练后精度及损失的变化。从模型的精度看,随着训练次数的增加,模型的精度持续上涨,最终训练集的精度和验证集的精度趋于稳定,这表明模型所学习到的数据特征由增长到收敛的趋势。同时,伴随着训练次数增加,模型的损失值也在逐步下降,最终也趋于稳定,这暗示着模型对于数据的适应性在增长,模型的误差在下降。
[0078]
步骤3:针对待去噪的可控源电磁数据,先分段再输入至所述可控源电磁数据分类模型得到每个数据段的分类结果。
[0079]
步骤4:基于步骤3中的分类结果将高质量数据段进行重组拼接。
[0080]
本实施例中还优选模型训练之前,对样本数据归一化,降低由样本幅值的差异引入的误差:
[0081][0082]
其中,是第i个归一化后的样本。其他可行的实施例中,对此不进行具体的限定。
[0083]
本实施例的模型训练过程中选择用adam优化器,初始学习率为3
×
10
‑5,并使用学习率衰减方法,衰减率为1
×
10
‑3,batchsize为100,共训练30epochs。其他可行的实施例中,对此不进行具体的限定,可以选择其他优化器。
[0084]
图7和图8为本发明与传统的相关度阈值挑选法的比较,图中信号受到脉冲的污染。图7对比了两类数据挑选方法的结果,图7中(b)为基于相关度的阈值挑选结果,其中设定的阈值为0.94,图7中(c)为使用本发明得到的结果。两种方法均得到较好的结果,但是相关度挑选的结果中仍然存在些许脉冲噪声并且挑选出来的时间序列要少,挑选精度仅64.6%,本发明得到的挑选精度高达 95.8%。针对上述结果,增加了两种方法挑选并保留相同数据量的实验。如图8 所示,本发明的方法挑选出的数据片段质量要更高,并且挑选精度达95.5%;而基于相关度挑选得到的数据中仍含有明显的脉冲噪声,精度只有78.8%。值得注意的是本次模型训练所用训练样本均来自同一个地区,但经过大量的测试表明,无论是当前地区的数据还是其它地区的数据,本发明所得到的模型的其挑选精度均在90%以上。这意味着本发明的泛化能力较强,具有极好的实用性。
[0085]
综上所述,本发明可以有效去除可控源电磁数据中的强人文噪声,显著提高数据质量,取得明显优于现有方法的效果。
[0086]
实施例2:
[0087]
本实施例提供一种基于可控源电磁数据去噪方法的系统,其包括:样本构建模块、分类标签标记模块、可控源电磁数据分类模型构建模块、分类模块以及重组模块。
[0088]
其中,样本构建模块用于获取可控源电磁数据并对其进行分段,将每一个数据段作为一个样本;分类标签标记模块用于标记每个样本的分类标签;可控源电磁数据分类模型构建模块用于构建时域卷积网络,并将样本及分类标签输入至所述时域卷积网络进行训
练得到可控源电磁数据分类模型;分类模块用于将待去噪的可控源电磁数据的数据段输入至所述可控源电磁数据分类模型得到每个数据段的分类结果;重组模块用于基于分类结果将高质量数据段进行重组拼接。
[0089]
应当理解,上述单元模块的具体实现过程参照方法内容,本发明在此不进行具体的赘述,且上述功能模块单元的划分仅仅是一种逻辑功能的划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。同时,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0090]
实施例3:
[0091]
本实施例提供了一种终端,其包括:一个或多个处理器以及存储了一个或多个计算机程序的存储器。其中,所述处理器调用计算机程序以执行:
[0092]
一种基于时域卷积网络的可控源电磁数据去噪方法的步骤。具体为:
[0093]
步骤1:获取可控源电磁数据并对其进行分段,将每一个数据段作为一个样本以及标记样本的分类标签。
[0094]
步骤2:构建时域卷积网络,并将样本及分类标签输入至所述时域卷积网络进行训练得到可控源电磁数据分类模型;
[0095]
步骤3:针对待去噪的可控源电磁数据,先分段再输入至所述可控源电磁数据分类模型得到每个数据段的分类结果。
[0096]
步骤4:基于步骤3中的分类结果将高质量数据段进行重组拼接。
[0097]
该终端还包括:通信接口,用于与外界设备进行通信,进行数据交互传输。
[0098]
其中,存储器可能包含高速ram存储器,也可能还包括非易失性除颤器,例如至少一个磁盘存储器。
[0099]
如果存储器、处理器和通信接口独立实现,则存储器、处理器和通信接口可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构总线,外部设备互联总线或扩展工业标准体系结构总线等。所述总线可以分为地址总线、数据总线、控制总线等。
[0100]
可选的,在具体实现上,如果存储器、处理器和通信接口集成在一块芯片上,则存储器、处理器即通信接口可以通过内部接口完成相互之间的通信。
[0101]
各个步骤的具体实现过程请参照前述方法的阐述。
[0102]
应当理解,在本发明实施例中,所称处理器可以是中央处理单元(centralprocessing unit,cpu),该处理器还可以是其他通用处理器、数字信号处理器 (digital signal processor,dsp)、专用集成电路(application specific integratedcircuit,asic)、现成可编程门阵列(field

programmable gatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据。存储器的一部分还可以包括非易失性随机存取存储器。例如,存储器还可以存储设备类型的信息。
[0103]
实施例4:
[0104]
本实施例提供一种可读存储介质,其存储了计算机程序,计算机程序被处理器调
用以执行:
[0105]
一种基于时域卷积网络的可控源电磁数据去噪方法的步骤。具体为:
[0106]
步骤1:获取可控源电磁数据并对其进行分段,将每一个数据段作为一个样本以及标记样本的分类标签。
[0107]
步骤2:构建时域卷积网络,并将样本及分类标签输入至所述时域卷积网络进行训练得到可控源电磁数据分类模型;
[0108]
步骤3:针对待去噪的可控源电磁数据,先分段再输入至所述可控源电磁数据分类模型得到每个数据段的分类结果。
[0109]
步骤4:基于步骤3中的分类结果将高质量数据段进行重组拼接。
[0110]
各个步骤的具体实现过程请参照前述方法的阐述。
[0111]
所述可读存储介质为计算机可读存储介质,其可以是前述任一实施例所述的控制器的内部存储单元,例如控制器的硬盘或内存。所述可读存储介质也可以是所述控制器的外部存储设备,例如所述控制器上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flashcard)等。进一步地,所述可读存储介质还可以既包括所述控制器的内部存储单元也包括外部存储设备。所述可读存储介质用于存储所述计算机程序以及所述控制器所需的其他程序和数据。所述可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
[0112]
基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的可读存储介质包括:u盘、移动硬盘、只读存储器 (rom,read

onlymemory)、随机存取存储器(ram,randomaccess memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0113]
需要强调的是,本发明所述的实例是说明性的,而不是限定性的,因此本发明不限于具体实施方式中所述的实例,凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式,不脱离本发明宗旨和范围的,不论是修改还是替换,同样属于本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献