一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

灌浆期玉米籽粒醇溶蛋白质含量变化快速检测方法与流程

2022-02-22 19:43:11 来源:中国专利 TAG:


1.本发明属于玉米考种技术领域,主要涉及一种玉米灌浆期的醇溶蛋白质含量变化的近红外光谱快速检测方法。


背景技术:

2.我国玉米种植现在及未来将面向规范化、机械化和自动化种植方向发展。玉米籽粒的硬度是否适合机械粒收的判定将是推动玉米种植机械化发展的方向之一,也是在玉米加工、管理、储藏等环节使用的重要指标。适宜密植和机械化作业的玉米品种的最直接的特征是机收籽粒的破碎率在8%以下,损失率在5%以下,杂质率在1.5%以下,符合我国目前的机械收获的损失率标准,而籽粒破碎率与玉米籽粒的醇溶蛋白呈显著相关。所以在玉米育种中,培育适宜密植和机械化作业的新品种的关键之一是对玉米灌浆期籽粒的蛋白质含量中的醇溶蛋白进行准确快速的测量。
3.另一方面,玉米种子的质量会直接影响到玉米的播种质量和产量,玉米生物育种是保证优质玉米种子的重要环节,玉米品质也是保证玉米机械化收获的重要保障。每年的玉米生物育种量可达几万甚至几十万份,全自动的玉米考种生产线是必要的,蛋白质的检测是生产线上非常重要且需要精密处理的环节。种子及其亲本,尤其是自交粒每穗籽粒数量较少,有时会少至几十甚至十几粒,非常珍贵。传统的蛋白质含量的测定需要大量的玉米考种样本、设备及人工操作时间。而在玉米育种时,由于受繁育新品种的种植面积,每平方米可以种植的玉米植株数目,有效试验穗数量等客观条件的制约,灌浆期玉米籽粒含水率测量时样本的取样数量、取样成本等受到一定限制。


技术实现要素:

4.本发明旨在于克服现有技术的不足,针对现有玉米灌浆期间籽粒醇溶蛋白检测中普遍存在速度慢、损害种子、需要大量的样品集等问题,结合适宜机收玉米育种考种过程中醇溶蛋白的快速检测需求,本发明提出一种灌浆期玉米籽粒醇溶蛋白质含量变化快速检测方法,不仅能够改善近红外光谱的定量分析模型的建模速率,扩展近红外光谱分析方法应用领域;减少在玉米育种过程中的采样数量,节约玉米育种中的亲本,为玉米育种、品种改良等方面提供醇溶蛋白检测技术支持;有助于提高玉米种子育种的大规模自动化的快速发展,促进玉米机械化进程的推进。
5.本发明的灌浆期玉米籽粒醇溶蛋白质含量变化快速检测方法,是通过下列步骤实现的:1)样品采集与制备采集不同产地适宜种植的玉米品种,从玉米进入灌浆期开始,每7天进行一次采样,采集5~7次,每次每个品种采样不少于50穗,按照3:2的比例进行分配,其中3份用来收集光谱数据和进行蛋白质的测定,2份作为保留样本放在阴凉干燥处;2)近红外光谱采集
采用布鲁克傅立叶变换tango-r型近红外光谱仪采集光谱数据,光谱采集波长范围1104~2495nm,分辨率为16 cm-1;光谱采集时分为两次采集,第一次对玉米籽粒进行光谱采集,获得不少于120份样本的玉米籽粒平均光谱;第二次将上述玉米籽粒研磨成化学测定所需要的粉末,装进相同的样本池,并同时完成玉米粉末光谱的采集;3)样本醇溶蛋白化学值的测定对步骤2得到的玉米粉末,采用国标方法进行蛋白质测试;4)样品集划分及光谱数据预处理将步骤2)得到的玉米籽粒光谱样本和玉米粉末的光谱样本按照70%建模集和30%预测集的比例进行随机划分,并利用标准归一化处理方法对原始光谱数据进行预处理;5)基于随机森林特征重要性和区间偏最小二乘法相结合的算法进行玉米籽粒和粉末的醇溶蛋白的近红外光谱特征波长的筛选第一步:对经步骤4)处理的建模集玉米籽粒和玉米粉末平均光谱分别进行随机森林特征重要性计算并降序排序,设置特征重要性阈值,若特征变量重要性大于此阈值,则提取这部分变量,并将特征变量按照特征重要性结果从大到小依次排列,构成特征波长子集;后面的处理均对玉米籽粒光谱数据和玉米粉末光谱数据分别进行处理;第二步:采用区间偏最小二乘法对特征波长子集进行特征波长二次筛选,区间偏最小二乘法将特征波长子集划分为等宽的n个子区间,比较各个区间pls模型中的建模集和预测集均方根误差,将最小的均方根误差对应区间的波长作为最优特征波长子集,建立偏最小二乘回归模型,能够得到较高的回归模型性能;第三步:通过蒙特卡洛方法对特征波长子集进行特征波长样本随机采样,验证随机森林特征重要性结合区间偏最小二乘算法筛选醇溶蛋白特征波长,根据随机森林特征重要性得到的特征波长子集经过蒙特卡洛500次样本随机采样后,结合区间偏最小二乘法进行特征波长二次筛选,设置子区间的个数与第二步相同,选定建模集均方根误差最小时所对应的特征波长点,与随机森林特征重要性结合区间偏最小二乘法筛选的最优特征波长子集中的波长点做对比,确认最后建模的特征波长集合;6)检测模型建立与评价分别将玉米籽粒建模集光谱数据和玉米粉末建模集光谱数据按随机森林特征重要性和区间偏最小二乘法相结合的方法,筛选出灌浆期玉米籽粒和玉米粉末的醇溶蛋白的特征波长并建立偏最小二乘回归模型,并分别使用玉米籽粒和玉米粉末预测集对上述籽粒和粉末的回归模型的精度进行评测。若预测集的评测结果不满足实际检测精度要求,重新执行步骤5,进行特征波长筛选和回归模型建立;当建立的偏最小二乘回归模型检测精度满足需求时,对照玉米籽粒光谱和玉米粉末光谱的预测结果,得到籽粒预测模型和粉末预测模型的醇溶蛋白质含量预测偏差,并将偏差作为调整系数添加到玉米籽粒预测模型中,输出相应模型,完成玉米籽粒醇溶蛋白近红外光谱快速检测模型的构建;7)玉米籽粒醇溶蛋白质的检测对需要检测灌浆期间籽粒醇溶蛋白的玉米籽粒进行近红外光谱扫描获得玉米籽粒光谱,对光谱数据进行预处理后再按优选的特征波长输入检测模型,既可完成灌浆期玉米籽粒醇溶蛋白质含量的快速检测。
6.本发明的灌浆期玉米籽粒醇溶蛋白质含量变化快速检测方法,基于随机森林特征
重要性和区间偏最小二乘法相结合的算法进行玉米籽粒醇溶蛋白的特征波长筛选先根据随机森林特征重要性进行特征波长的初步筛选,既解决了近红外光谱全谱中存在波长冗余的问题,又能够从全谱中筛选出特征波长点并对其进行排序,构成特征子集。然后使用区间偏最小二乘法对特征波长子集进行波长二次筛选,进一步剔除因随机森林的随机性问题造成的相关性较弱的波长点,同时能够将离散的特征波长点联合起来,提升预测精度。基于该波长筛选方法建立的玉米籽粒醇溶蛋白偏最小二乘回归模型具有检测速度快、精度高的特点,能够解决检测中普遍存在速度慢、损害种子、需要大量的样品集等问题,实现了玉米灌浆期间籽粒醇溶蛋白的快速检测,有效解决了玉米育种过程中检测醇溶蛋白技术耗时长、工作强度大的问题。
附图说明
7.图1基于随机森林特征重要性和区间偏最小二乘法相结合的算法进行玉米籽粒醇溶蛋白的特征波长筛选流程示意图。
具体实施方式
8.本发明的灌浆期玉米籽粒醇溶蛋白质含量变化快速检测方法,是通过下列步骤实现的:1)样品采集与制备采集实验用选取2-3个北方垦区适宜种植的玉米品种,从玉米进入灌浆期开始,一般从8月末开始,每一个灌浆周期(7天)进行一次采样,采集7次,每次每个品种采样50穗,其中30穗用来收集玉米籽粒、玉米粉末光谱数据和进行蛋白质的测定,20穗作为保留样本放在阴凉干燥处。光谱采集,取每穗中间200粒共6000粒,作为光谱采集和化学值测定的实验样本。
9.2)近红外光谱采集光谱采用布鲁克傅立叶变换tango-r型近红外光谱仪采集光谱数据,光谱采集波长范围1104~2495nm,分辨率为16 cm-1
。光谱采集时分为两次采集,第一次为玉米籽粒的光谱采集,每次采集将规格为50mm的样品池每次装样50粒,采用旋转台方式扫描32次取平均值,获得120份样本的平均光谱。第二次采集为玉米粉末光谱的采集,将相同的样本研磨成化学测定所需要的粉末,装进相同的样本池,完成光谱的采集,并进行一一对应记录;采样过程中保持实验室内温度在25℃左右,湿度在50%rh左右,每60分钟扫描一次背景。
10.3)样本醇溶蛋白化学值的测定采用自动凯氏定氮仪对7个灌浆期的共计采集与制备的840个样品进行蛋白质测试实验。每个样本取1.500g,每次将12个样本置于消化管中,按照蛋白质测定的国家标准(gb 5009.5-2016)加入硫酸铜、硫酸钾和0.0500mol/l硫酸标准滴定溶液,加入剂量分别为0.4g、6g和20ml。将消化管置于消化炉上恒定温度达到420℃保持1小时,带消化管中呈现绿色透明状液体,完成消化过程。冷却后加入50ml纯水,完成自动凯氏定氮仪的样本制备。在定氮仪中准备好10mol/l naoh溶液、0.0500mol/l硫酸标准滴定溶液、甲基红和亚甲基蓝的2:1的95%乙醇溶液、0.3226mol/l硼酸溶液的分析溶液。用kjelflexk-360凯氏定氮仪测定蛋白质含量,其中,氮与蛋白质的转换系数取值6.25。
11.4)样品集划分及光谱数据预处理将步骤2)得到的玉米籽粒840个样本和玉米粉末的光谱样本840个样本按照70%建模集和30%预测集的比例进行随机划分,两种光谱样本的建模集均包含588个样本,预测集均包含252个样本。蛋白质近红外光谱存在明显的基线漂移和噪声干扰引起的不平滑等问题。为了在全光谱区域内校正光谱基线、消除相关噪声的干扰,减少光谱数据在一定程度上的线性相关,利用标准归一化处理方法对上述原始光谱数据进行预处理。
12.5)基于随机森林特征重要性和区间偏最小二乘法相结合的算法进行玉米籽粒和粉末醇溶蛋白的近红外光谱特征波长的筛选第一步:基于随机森林特征重要性的近红外光谱特征波长初步筛选。随机森林作为一种集成算法,可计算特征重要性进行特征筛选。由于随机森林因具有随机抽样和随机特征选取的双重随机特性,仅使用特征属性在随机森林决策树中的出现频率来体现特征重要性并不可取,因此,为了更准确地反映出光谱特征的重要性,选择基于袋外数据的平均精度下降方法计算均方误差作为特征的重要性。假设随机森林中有t棵决策树,对于每棵决策树tm(m=1,

t),输入袋外数据的矩阵x
oob
,计算预测值y
p
与真实值y的均方误差 00bm
,袋外数据的其他特征变量保持不变,只打乱x
oob
中第i列特征变量顺序重新排列,即x
oobi
,利用决策树tm对打乱顺序重新排列后的样本进行预测,计算预测值y
pi
与真实值y的均方误差 i00bm,
,特征变量x
oobi
对决策树tm预测的均方误差为 ,遍历整个随机森林,特征变量x
oobi
的重要性结果为 。对经步骤4)处理的建模集光谱集合进行随机森林特征重要性计算并降序排序,设置特征重要性阈值,若特征变量重要性大于此阈值,则提取这部分变量,并将特征变量按照特征重要性结果从大到小依次排列,构成特征波长子集;第二步:基于区间偏最小二乘法的近红外光谱特征波长的二次筛选。针对基于随机森林特征重要性筛选的特征波长存在随机性现象,可能存在无效变量,且无法保证筛选出一个规模较小的优化特征波长子集,因此采用区间偏最小二乘法对特征波长子集进行特征波长二次筛选。区间偏最小二乘法将特征波长子集划分为等宽的n个子区间,比较各个区间pls模型中的建模集和预测集均方根误差,将最小的均方根误差对应区间的波长作为最优特征波长子集,建立偏最小二乘回归模型,能够得到较高的回归模型性能;第三步:通过蒙特卡洛方法对特征波长子集进行特征波长样本随机采样,验证随机森林特征重要性结合区间偏最小二乘算法筛选醇溶蛋白特征波长。根据随机森林特征重要性得到的特征波长子集经过蒙特卡洛500次样本随机采样后,结合区间偏最小二乘法进行特征波长二次筛选,设置子区间的个数与第二步相同,选定建模集均方根误差最小时所对应的特征波长点,与随机森林特征重要性结合区间偏最小二乘法筛选的最优特征波长子集中的波长点做对比,确认最后建模的特征波长集合。
13.6)检测模型建立与评价分别将玉米籽粒建模集光谱数据和玉米粉末建模集光谱数据按随机森林特征重要性和区间偏最小二乘法相结合的方法,筛选出灌浆期玉米籽粒和玉米粉末的醇溶蛋白的特征波长并建立偏最小二乘回归模型,并分别使用玉米籽粒和玉米粉末预测集对上述籽粒和粉末的回归模型的精度进行评测。若预测集的评测结果不满足实际检测精度要求,重新
执行步骤5,进行特征波长筛选和回归模型建立;当建立的偏最小二乘回归模型检测精度满足需求时,对照玉米籽粒光谱和玉米粉末光谱的预测结果,得到籽粒预测模型和粉末预测模型的醇溶蛋白质含量预测偏差,并将偏差作为调整系数添加到玉米籽粒预测模型中,输出相应模型,完成玉米籽粒醇溶蛋白近红外光谱快速检测模型的构建。
14.7)玉米籽粒醇溶蛋白质的检测对需要检测灌浆期间籽粒醇溶蛋白的玉米籽粒进行近红外光谱扫描获得玉米籽粒光谱,对光谱数据进行预处理后再按优选的特征波长输入检测模型,既可完成灌浆期玉米籽粒醇溶蛋白质含量的快速检测。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献