一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于弹性网络回归的重金属元素含量检测方法与流程

2022-02-25 22:10:05 来源:中国专利 TAG:


1.本发明属于x射线荧光光谱分析应用技术领域,涉及一种基于弹性网络回归的重金属元素含量检测方法。


背景技术:

2.土壤重金属污染具有长期累积性、生态毒理性、生物富集放大性等特点,对地区生态环境、食品安全和人体健康构成持续性威胁,因此对土壤重金属的检测引起了农业劳动者和科研工作者等的重视。随着土壤详查工作的开展,土壤重金属的快速检测成为了重点研究方向。
3.其中x射线荧光光谱(xrf)因具样本前处理简易、操作简便、检测速度快、灵敏度高、成本低、可现场检测等优点,已被广泛应用于土壤重金属检测领域。土壤成分的复杂导致xrf扫描分析时产生基质效应干扰,从而影响检测结果。如何提高仪器检测的准确度、精确度是困扰仪器开发者的重点及难点问题。


技术实现要素:

4.针对现有技术中存在的问题,本发明的目的在于提供一种基于弹性网络回归的重金属元素含量检测方法,至少部分解决上述技术问题。
5.本发明实施例提供了一种基于弹性网络回归的重金属元素含量检测方法,包括:
6.s1:采集待检测土壤样本的xrf光谱信息;
7.s2:对所述待检测土壤样本的xrf光谱信息进行预处理;
8.s3:将经预处理后的光谱信息,输入预设的基于弹性网络回归的重金属元素含量检测模型,输出所述待检测土壤样本的重金属元素含量信息。
9.进一步地,所述基于弹性网络回归的重金属元素含量检测模型的建模过程包括:
10.采集不同土壤样品的xrf光谱信息和分别对应的重金属元素信息;
11.对所述不同土壤样品的xrf光谱信息进行预处理;
12.将经预处理后的光谱信息,根据预设比例划分为训练集和验证集;将所述训练集和对应的所述重金属元素信息输入基于弹性网络回归模型进行训练;
13.利用所述验证集输入训练后的所述基于弹性网络回归模型进行模型评估。
14.进一步地,采集不同土壤样品的xrf光谱信息,包括:采集地表不同预设深度土壤样品,进行多次光谱测量取平均值得到。
15.进一步地,所述重金属元素信息为使用icp-ms方法检测所述不同土壤样品得到。
16.进一步地,所述预处理为对所述光谱信息使用snv标准正态变换法进行平滑和降噪。
17.进一步地,所述根据预设比例划分为训练集和验证集包括:
18.使用holdout检验方法根据预设比例,将所述不同土壤样品的xrf光谱信息划分为训练集和验证集。
19.进一步地,所述将所述训练集和对应的所述重金属元素信息输入基于弹性网络回归模型进行训练包括:
20.将所述训练集和对应的所述重金属元素信息,使用十折交叉验证方法输入所述基于弹性网络回归模型进行测试;
21.计算训练测试后所述重金属元素含量检测模型的损失函数;
22.根据所述损失函数优化所述基于弹性网络回归模型,得到训练后的模型。
23.进一步地,利用所述验证集输入训练后的所述重金属元素含量检测模型进行模型评估,包括:
24.将所述验证集输入所述训练后的所述基于弹性网络回归模型,得到检测结果;
25.根据所述检测结果与所述验证集对应的所述重金属元素信息,进行模型评估;具体计算过程包括:
[0026][0027][0028][0029]
式中,r2表示决定系数;rmse表示均方根误差;rpd表示相对分析误差;n表示所述验证集中样本的总数;i表示所述验证集中样本的标号;yi表示所述验证集中第i个样本对应的所述重金属元素信息;表示所述验证集第i个样本的模型预测值;表示所述验证集的所有模型预测值均值;sd()表示所述验证集的标准差。
[0030]
本发明一种基于弹性网络回归的x射线荧光光谱建模方法,现有技术在特征选择时通常在全光谱范围内进行处理,由于光谱成分复杂及干扰等原因,可能会导致选定的特征波段无法很好的实现数据拟合。与现有技术相比较,本方法在特征选择时,通过在重金属元素特征峰能量范围内进行特征选择,提高了建模效率和模型准确度;相较于传统偏最小二乘回归方法,弹性网络回归计算时在最小化经验误差函数上加约束,可以防止过拟合现象的产生。
[0031]
光谱采集时间短,模型建立成功后,模型计算时间基本可忽略,建模易实现。
[0032]
建立的多种重金属元素检测模型,可同时计算出对应重金属元素的含量,实现多组分同时检测。
[0033]
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明
书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
[0034]
图1为本发明实施例提供的一种基于弹性网络回归的重金属元素含量检测方法流程图;
[0035]
图2为本发明实施例提供的弹性网络回归建模时最优调节参数的选择图;
[0036]
图3为本发明实施例提供的弹性网络回归模型对cu的训练集预测结果示意图;
[0037]
图4为本发明实施例提供的弹性网络回归模型对cu的验证集预测结果示意图。
具体实施方式
[0038]
下面将结合本发明实施例中的附图对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0039]
在本发明的描述中,需要说明的是,术语“上”、“下”、“内”、“外”、“顶/底端”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
[0040]
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“设置有”、“内接”、“连接”等,应做广义理解,例如“连接”,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
[0041]
本发明实施例提供的一种基于弹性网络回归的重金属元素含量检测方法,包括:
[0042]
s1:采集待检测土壤样本的xrf光谱信息;
[0043]
s2:对待检测土壤样本的xrf光谱信息进行预处理;
[0044]
s3:将经预处理后的光谱信息,输入预设的基于弹性网络回归的重金属元素含量检测模型,输出待检测土壤样本的重金属元素含量信息。
[0045]
本发明与现有技术相比较,通过在重金属元素特征峰能量范围内进行特征选择,提高了建模效率和模型准确度;相较于传统偏最小二乘回归方法,本发明在最小化经验误差函数上加约束,可以防止过拟合现象的产生,其中弹性网络回归为正则化处理,正则化的定义就是对最小化经验误差函数上加约束;光谱采集时间短,模型建立成功后,模型计算时间基本可忽略,建模易实现;建立的多种重金属元素检测模型,可同时计算出对应重金属元素的含量,实现多组分同时检测。
[0046]
下面将结合农田重金属测量进行详细说明。
[0047]
采集41个农田土壤样品,取农田表层0-20cm深样品约100g,采用四分法取土并混匀,将样品进行风干,去除其中异物后研磨、过100目尼龙筛,备用。
[0048]
采用nx-100s(钢研纳克公司)xrf光谱仪采集样品光谱信息。对于镉(cd),单次扫描时间为600s,光管电压设置为65kv,对于砷(as)、铅(pb)、铬(cr)、铜(cu)、镍(ni)和锌
(zn),单次扫描时间为120s,光管电压为40kv。每个样品扫描3次,取平均光谱进行后续分析。
[0049]
土壤中重金属元素cd、as、pb、cr、cu、ni、zn含量的化学检测值采用icp-ms方法测定。
[0050]
建模用土壤样品共41个,可以使用snv标准正态变换法、s-g法、小波变换等方法进行光谱预处理平滑和降噪其中,最优的为使用snv标准正态变换法进行预处理。下一步需要对预处理后的数据进行数据集划分,包括holdout法、浓度梯度法、spxy法等方法,其中最优的为在使用snv标准正态变换法进行预处理后,使用holdout法进行划分,下面将以最优方法为例进行详细说明。
[0051]
采用标准正态变量(snv)法对光谱进行预处理,用弹性网络回归方法建立xrf光谱与化学检测值之间的校正模型,如图1所示。采用holdout检验方法划分训练集和预测集,其中80%样品(33个)用作训练集数据,20%样品(8个)用作预测集数据。训练集样品用于建立定量模型,预测集样品用于验证模型的准确性。
[0052]
运用弹性网络回归建模时,选取十折交叉验证方法测试算法准确性,对模型进行校正,计算模型的均方误差,并以此确定模型调节参数lambda(弹性网络回归建模的固定参数)的值,如图2所示,图中分别标记了交叉验证误差最小时的lambda,和交叉验证误差最小值加上一个标准偏差的数值。lambda的取值可以从二者之中任取其一,较优的为选取交叉验证误差最小时的数值,从图2中可以看出lambda最优值附近的函数平坦,表明在最优值附近变化,对模型的预测能力影响很小。
[0053]
确定lambda数值后,计算lambda对应的稀疏系数,计算过程中相关性低的稀疏会被压缩为0,从而进行稀疏变量筛选,达到特征选择优化的目的,最终建立xrf基于弹性网络回归的重金属元素含量检测模型。
[0054]
利用预测集数据验证校正模型的准确性。
[0055]
以决定系数(r2)、均方根误差(rmse)、相对分析误差(rpd)为模型评价指标。
[0056][0057][0058][0059]
其中,yi为第i个样本的化学检测值,为第i个样本的模型预测值,为测试集所有模型预测值的均值,sd为测试集标准差。决定系数r2越高,均方根误差rmse越小,表明模
型的建模效果越好,反之模型的建模效果越差。rpd》3时,所建立的模型预测效果良好,具有实际应用价值;2.25《rpd《3,所建立的模型预测效果较好,具有一定的应用价值;1.75《rpd《2.25,认为模型可用;rpd《1.75,所建立的模型预测效果较差,模型不可用。
[0060]
建模结果见表1,其中rmsec、rmse
p
分别表示训练集和预测集(即验证集)的均方根误差,r
2c
、r
2p
分别表示训练集和预测集的决定系数,rpdc、rpd
p
分别表示训练集和预测集的相对分析误差。从表1可以看出土壤中cd、as、pb、cr、cu、ni、zn各元素在训练集和预测集上的决定系数均高于0.92,rpd均高于1.8,训练集的均方根误差与预测集均方根误差数值上比较接近,表明模型效果较好,预测集样本在整个建模浓度区间的分布能够较好的衡量模型的预测结果准确性。以上建模结果说明基于弹性网络回归的xrf建模能够准确的检测土壤中cd、as、pb、cr、cu、ni、zn元素的含量。
[0061]
以cu建模效果为例,如图3和图4所示以光谱预测值决定系数为纵轴,化学检测值为横轴,分别表示cu在训练集r
2c
和预测集r
2p
上的预测结果,可以看出模型预测结果与化学检测结果在数值上接近,表明模型预测结果准确。
[0062]
表1土壤重金属元素的光谱建模预测结果
[0063] rmsecr
2c
rpdcrmse
pr2p
rpd
p
cu10.64050.995915.76299.18780.93172.1952cr9.46040.98317.41615.98950.9665.3793as10.79010.98958.14966.51860.92231.8483cd0.52830.994110.17080.47370.97073.3398ni17.08760.96564.12194.76280.92712.6863pb14.67800.992611.094322.66540.98661.8250zn47.47020.96743.786714.10880.93762.5583
[0064]
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其改进构思加以等同替换或改变,都应涵盖在本发明的保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献