一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

水稻镉含量的预测方法

2023-03-20 06:35:09 来源:中国专利 TAG:


1.本技术涉及水稻重金属含量预测技术领域,尤其涉及水稻镉含量的预测方法。


背景技术:

2.近年来,随着机器学习算法的发展与改进,机器学习在回归预测问题中的表现已经无限接近基于物理化学检测技术的检测结果与检测精度,然而机器学习模型预测某种样品的元素含量,需要基于大量样品的高通量特征数据来训练获得该预测模型。高光谱成像技术便可以有效获取样品的高通量特征数据,它是一种融合了光谱技术与成像技术的无损检测技术,能够获取待测样品空间维度的面光谱。结合机器学习技术与高光谱成像技术,可以构建待测样品的元素含量无损检测模型,实现低成本、高效率的化学含量检测。
3.尽管现有技术有利用机器学习与高光谱成像技术结合应用于化学物质含量检测领域,但对于含量极低的化学物质检测中,预测精度难以提升。此外高通量的样品特征数据会严重降低预测效率,也容易引起回归模型过拟合,使得训练好的模型在实际应用中面对陌生数据而失效。
4.因此本技术提出一种水稻镉含量的预测方法,对样品特征数据预处理与特征降维,并通过联通特征数据预处理、特征降维和回归模型构建的全流程,进行全流程、端到端地模型训练从而得到回归预测模型,提升回归预测模型整体的泛化能力。


技术实现要素:

5.为克服相关技术中存在的问题,本技术提供一种水稻镉含量的预测方法,该预测方法,能够使训练好的回归预测模型在实际应用中不会面对陌生数据失效。
6.本技术提供一种水稻镉含量的预测方法,包括如下步骤:
7.原始光谱数据建立:收集样本地的水稻作为样本集;对所述样本集中的样本进行光谱扫描,得到原始光谱数据;
8.原始光谱数据预处理:对所述原始光谱数据进行预处理,得到初始光谱数据;
9.预测模型建立:基于初始光谱数据与样本实际含镉量利用核岭回归算法建立模型,得到水稻中镉含量的预测模型;所述样本实际含镉量为所述样本通过化学方法测定的含镉量;
10.预测模型优化:利用网络搜索算法优化所述预测模型,得到回归预测模型;
11.通过所述回归预测模型进行镉含量预测。
12.在一种实施方式中,对所述样本集中的样本进行光谱扫描,得到原始光谱数据包括:
13.利用高光谱成像系统对所述样本集的样本进行光谱扫描,采集范围为402.6~1005.5纳米和900.2~1710.5纳米的可见光高光谱以及402.6~1005.5纳米和900.2~1710.5纳米的近红外高光谱的高光谱数据,得到原始光谱数据。
14.在一种实施方式中,对所述原始光谱数据进行预处理,得到初始光谱数据包括:
15.对所述原始光谱数据进行反射率校正,并通过阈值分割算法来分割样本和背景的像素,计算得到所述样本集的平均光谱数据。
16.在一种实施方式中,得到所述样本集的平均光谱数据之后还包括:
17.对所述样本集的平均光谱数据进行卷积平滑预处理,得到预处理光谱数据。
18.在一种实施方式中,对所述样本集的平均光谱数据进行卷积平滑预处理之后还包括:
19.对所述预处理光谱数据运用截断奇异值分解算法进行特征降维。
20.在一种实施方式中,所述光谱扫描的条件如下:所述高光谱成像系统的镜头与所述样本的距离为20-30厘米,所述近红外高光谱的曝光时间为3.5毫秒,所述可见光高光谱的曝光时间为12.5毫秒。
21.在一种实施方式中,所述样本实际含镉量为利用分光光度计检测方法检测所述样本集中的镉含量。
22.在一种实施方式中,所述预测模型优化之前还包括:
23.利用管道机制联通所述原始光谱数据预处理及所述预测模型建立。
24.本技术提供的技术方案具有以下有益效果:本水稻镉含量的预测方法,通过原始光谱数据建立、原始光谱数据预处理、预测模型建立及预测模型优化等步骤,该方法通过对原始光谱数据预处理与特征降维,并通过联通原始光谱数据、特征降维和预测模型构建的全流程,进行全流程、端到端地模型训练,从而得到优化后的回归预测模型,优化后的回归预测模型在实际应用中不会面对陌生数据失效,提升了回归预测模型整体的泛化能力。
25.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本技术。
附图说明
26.通过结合附图对本技术示例性实施方式进行更详细的描述,本技术的上述以及其它目的、特征和优势将变得更加明显,其中,在本技术示例性实施方式中,相同的参考标号通常代表相同部件。
27.图1是本技术实施例一示出的水稻镉含量的预测方法的流程示意图;
28.图2是本技术实施例二示出的水稻镉含量的预测方法的另一流程示意图;
29.图3是本技术实施例示出的水稻镉含量的预测方法的预测散点图。
具体实施方式
30.下面将参照附图更详细地描述本技术的优选实施方式。虽然附图中显示了本技术的优选实施方式,然而应该理解,可以以各种形式实现本技术而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本技术更加透彻和完整,并且能够将本技术的范围完整地传达给本领域的技术人员。
31.在本技术使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本技术。在本技术和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
32.应当理解,尽管在本技术可能采用术语“第一”、“第二”、“第三”等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本技术范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本技术的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
33.实施例一
34.现有技术有利用机器学习与高光谱成像技术结合应用于化学物质含量检测领域,但对于含量极低的化学物质检测中,预测精度难以提升。此外高通量的样品特征数据会严重降低预测效率,也容易引起回归模型过拟合,使得训练好的模型在实际应用中面对陌生数据而失效。
35.因此本技术提出一种水稻镉含量的预测方法,对样品特征数据预处理与特征降维,并通过联通特征数据预处理、特征降维和回归模型构建的全流程,进行全流程、端到端地模型训练从而得到回归预测模型,提升回归预测模型整体的泛化能力。
36.以下结合附图详细描述本技术实施例的技术方案。
37.图1是本技术实施例一示出的水稻镉含量的预测方法的流程示意图。
38.图3是本技术实施例示出的水稻镉含量的预测方法的预测散点图。
39.参见图1及图3。
40.本技术实施例的一种水稻镉含量的预测方法,包括如下步骤:
41.s101原始光谱数据建立:收集样本地的水稻作为样本集;对样本集中的样本进行光谱扫描,得到原始光谱数据。
42.进一步的,本技术实施例未限制样本地的具体位置,依据实际情况选择即可,示例性的,本技术选择中国广州种植的水稻收获的成熟稻米为样本集,该种植区土壤背景值为0.23mg/kg(cd),ph为5.8。
43.示例性的,采集样本集的原始光谱数据具体为:在暗箱环境内,以卤素灯作为照明光源,利用可见光高光谱成像系统和近红外高光谱成像系统采集样本集的原始光谱数据;进一步的,在采集样本集的原始光谱数据之前,设置合适的物距,调节合适的曝光时间,并调节焦距使高光谱成像系统对样本集能清晰成像。
44.本技术实施例未对物距、曝光时间以及焦距进行限制,依据实际情况而设置,关于物距、曝光时间以及焦距的发明设计范围均属于本技术的保护保护范围。
45.s102原始光谱数据预处理:对原始光谱数据进行预处理,得到初始光谱数据。
46.对上述步骤所获取的原始数据需要进行预处理,预处理后得到的初始光谱数据。
47.s103预测模型建立:基于初始光谱数据与样本实际含镉量利用核岭回归算法建立模型,得到水稻中镉含量的预测模型;样本实际含镉量为通过化学方法测定的样本集的含镉量。
48.示例性的,核岭回归(kernel ridge regression,krr)是岭回归在非线性上的一种拓展,利用核机器,将数据映射到高维空间,再利用线性方法进行回归。核岭回归相较于岭回归能够更好的拟合非线性关系。
49.示例性的,本技术krr的核函数为(高斯)径向基函数核(radialbasis function,
decomposition,t-svd)算法进行特征降维,减少原始光谱数据中的多种共线性与特征冗余。
71.截断奇异值分解(t-svd)是一种矩阵因式分解算法,与奇异值分解(singular value decomposition,svd)的不同之处在于,t-svd可以将矩阵分解成指定维度的分解矩阵,从而可以实现特征降维。
72.示例性的,本技术预处理光谱数据运用截断奇异值分解算法进行特征降维,降维后的维度为15。
73.示例性的,待分解的预处理光谱数据矩阵为一个m
×
n维矩阵a,定义矩阵a的svd为:
74.a=uσv
t
75.其中u为一个m
×
m的矩阵,σ为一个m
×
n的矩阵,σ除主对角线的元素外都为0,主对角线上的元素成为奇异值,v为一个n
×
n的矩阵。矩阵u和v满足如下关系式:
76.uu
t
=i,vv
t
=i
77.其中i为单位向量。
78.为求解上述三个矩阵u、σ和v,将矩阵a的转置与矩阵a进行矩阵乘法,获得一个n
×
n的方阵a
t
a,对该方阵进行特征分解:
79.(a
t
a)vi=λvi80.将a
t
a所有n个特征向量张成一个n
×
n的矩阵,该矩阵便是svd公式中的矩阵v,其中每一向量称为矩阵a的右奇异向量。
81.将矩阵a与矩阵a的转置进行矩阵乘法,获得一个m
×
m的方阵aa
t
,对该方阵进行特征分解:
82.(aa
t
)ui=λui83.将aa
t
所有m个特征向量张成一个m
×
m的矩阵,该矩阵便是svd公式中的矩阵u,其中每一向量称为矩阵a的左奇异向量。
84.通过下式计算出所有奇异值:
85.av=uσv
tv86.av=uσ
87.avi=σiui88.σi=avi/ui89.由此求得奇异值矩阵σ。
90.s205利用管道机制结合原始光谱数据预处理及预测模型建立并利用网络搜索算法优化预测模型,得到回归预测模型。
91.利用管道机制,接合原始光谱数据、特征降维和预测模型构建的全流程,实现三个过程端到端同步训练;并利用网格搜索算法,搜索整个模型的参数空间,基于测试集决定系数(rp2),获取最佳预测模型。
92.s206通过回归预测模型对水稻进行镉含量预测。
93.以上已经描述了本技术的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨
在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献