一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于近红外光谱的烟叶致香成分通用模型建模方法与流程

2023-03-20 09:00:23 来源:中国专利 TAG:


1.本发明属于卷烟制造技术领域,具体涉及一种基于近红外光谱的烟叶致香成分通用模型建模方法。


背景技术:

2.卷烟作为一种日益盛行的消费品,其产品品质的优劣将直接影响消费者的切身利益,烟叶烟丝原料是卷烟生产的基础,其内在质量的好坏是衡量烟叶烟丝可用性高低的标准。卷烟的化学成分与其内在质量有着很大的相关性,因此针对卷烟过程中烟丝烟叶主要成分的检测对卷烟产业的质量监控有着重要的理论意义和使用价值。
3.烟叶致香成分是影响烟叶香型风格质量感官评价的重要因素,研究烟叶中致香成分对于揭示烟叶风格质量的形成原因具有重要意义。
4.近红外分子振动光谱技术主要是含氢基团x-h振动的倍频和合频吸收,具有简单、快速(至多3分钟/样品)、无污染、低成本等优点,光谱包含结构信息丰富、指纹特征强,适合分析复杂体系样品的识别与鉴定,其中近红外分析技术在烟草行业中已经得到广泛的应用,例如产地溯源、烟叶品质判定、烟叶品质常规理化指标数值的快速预测。虽然近红外在烟叶致香成分测定上已经有了应用,但是这些研究中,对于变量选择只是最简单的光谱谱段拆分,缺乏理论与统计学意义。因此有必要提出改进。


技术实现要素:

5.本发明解决的技术问题:提供一种基于近红外光谱的烟叶致香成分通用模型建模方法,本发明是针对现有技术中基于近红外分子技术对烟叶致香成分进行建模研究中存在的变量选择只是最简单的光谱谱段拆分,缺乏理论与统计学意义而提出。
6.为达到上述目的,本发明采用的技术方案:
7.基于近红外光谱的烟叶致香成分通用模型建模方法,包括以下步骤:
8.步骤1):选取不同的烟叶,制成烟叶样品保存待用;
9.步骤2):对各烟叶样品进行近红外光谱数据采集并优化成近红外光谱谱图;
10.步骤3):对烟叶样品中的致香成分化学值进行检测;
11.步骤4):设定一组烟叶致香成分的预测集目标评价参数;基于步骤1)中采集的样品近红外光谱数据,采用合适的预处理方法处理光谱数据;然后对预处理后的光谱数据和步骤3)中的烟叶样品致香成分含量数据进行变量特征选择算法优化模型,完成对烟叶样品致香成分的特征波长的提取,并与预测集目标评价参数进行比较,确定出最优的可行性通用模型;
12.其中变量特征选择算法采用线性算法pls和非线性算法lssvm,优先采用线性算法pls模型建模,如果线性模型效果不好,再采用非线性算法lssvm模型建模;
13.步骤5):对于待测烟叶样本,先采集其近红外光谱数据,利用通用模型进行致香成分预测。
14.上述步骤1)中,烟叶样品制作时,对选取的不同的烟叶研磨后标号装入密封袋中,平衡水分,保存待测。
15.上述步骤2)中,对各烟叶样品进行近红外光谱数据采集时,将样品置于旋转采样杯中,每个样品重新取样三次,每次重新采集光谱,保存后供后续数据处理使用。
16.上述步骤2)中,所述近红外光谱测量方法选用漫反射积分球测样方法;近红外仪器工作条件设置及光谱采集:采用thermo antaris ii傅里叶变换近红外光谱仪,开机预热30分钟后,光谱扫描范围为10000-4000cm-1
,选用分辨率8cm-1
,扫描次数64次,实验环境温度为(23
±
1)℃,湿度为(50
±
2)%;旋转样品杯承装样品厚度确定为0.5cm。
17.上述步骤3)中,所述致香成分为丙二醇、大马酮、金合欢丙酮、香叶基丙酮、新酯二烯。
18.上述步骤4)中,各变量特征选择算法具体过程:
19.(1)pls算法步骤如下:
20.输入样本矩阵x,输出值矩阵y分别对x,y进行中心化处理、归—化方差,得到矩阵:e0和f;
21.令n=0;
22.计算矩阵e
n’ff’en,计算e
n’ff’en的最大特征根对应的单位特征向量
23.令:
24.tn=enwn,自变量的主成分
25.pn=e
n’tn/|tn|2,自变量回归系数
26.rn=f’tn/|tn|2,因变量回归系数
27.e
n 1
=e
n-tnp
n’自变量残差
28.也可以表示为:
29.n ,重复3、4,直到残差达到满意水平
30.最后的回归方程:
31.f=t0r0’
t1r1’
.....t
nrn

fn32.其中fn为因变量残差
33.预测方程可写为:f=e0b
34.其中b=∑k
jrj’35.上式中(从j=0累乘到j=h-1);
36.(2)非线性算法lssvm:
37.该算法通过非线性内积函数k(xi,xj),也称核函数,把输入的低维空间数据非线性映射到高维空间,利用结构风险最小化原则在高维空间求解最优线性分类器或多元线性模型,由于利用了原空间核函数取代了高维空间的内积运算,算法复杂度没有增加,形式上类似人工神经网络ann;
38.lssvm最小二乘支持向量机算法采用最小二乘线性系统作为损失函数,代替传统的支持向量机采用的二次规划方法,基于结构风险最小化原则,lssvm优化以下问题:
[0039][0040]
λ是正则化参数,起到权衡拟合精度与模型复杂度的作用;
[0041]
回归模型可描述为:
[0042][0043]
xi为输入向量;ak为拉格朗日乘子,称为支持值,b为偏置核函数,k(x,xi)定义了从原始变量所在的低维度空间向高维度空间做非线性映射的方式;目前支持向量机研究中对于核函数的选择并无固定的方法,但从核函数紧致性和计算复杂度来评价,径向基核函数rbf更具优势,有:
[0044]
k(x,xk)=exp(-||x-xk||2/σ2)
[0045]
式中,σ2是rbf核函数宽度。
[0046]
正则化参数λ优化、核函数k(x,xi)选择和核函数参数优化是lssvm的三个关键问题;选用rbf核函数,用单纯型搜索、十折交叉验证优化参数λ和σ2,这两个参数决定了lssvm的学习能力、预测能力和泛化能力。
[0047]
本发明与现有技术相比的优点:
[0048]
1、本方案选择烟叶作为研究对象,利用近红外分子振动光谱技术建立烟叶快速质量分析与评估方法技术体系,结合预处理和变量选择建立烟叶致香成分丙二醇、大马酮、金合欢丙酮、香叶基丙酮、新酯二烯定量模型,实现对烟叶的品质指标快速测定,为烟叶的品质指标快速分析评估提供新的方法,为卷烟企业烟叶质量品控的快速化、准确化、数字化提供有力的技术支撑;
[0049]
2、本方案中采用lssvm算法模型,完成了烟叶中的致香成分丙二醇、大马酮、金合欢丙酮、香叶基丙酮、新酯二烯的建模,从而建立更优、更具有化学意义的模型,提高模型性能,简化模型,减少计算量,提高模型的解释性,提高模型的鲁棒性。
附图说明
[0050]
图1为本发明实施例中采用lssvm模型对致香成分丙二醇的建模图;
[0051]
图2为本发明实施例中采用lssvm模型对致香成分大马酮的建模图;
[0052]
图3为本发明实施例中采用lssvm模型对致香成分金合欢丙酮的建模图;
[0053]
图4为本发明实施例中采用lssvm模型对致香成分香叶基丙酮的建模图;
[0054]
图5为本发明实施例中采用lssvm模型对致香成分新酯二烯的建模图;
[0055]
图6为本发明中最小二乘支持向量机lssvm的示意图;
[0056]
图7为本发明中最小二乘支持向量机lssvm具体流程图。
具体实施方式
[0057]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0058]
请参阅图1-7,详述本发明的实施例。
[0059]
实施例1:
[0060]
基于近红外光谱的烟叶致香成分通用模型建模方法,包括以下步骤:
[0061]
步骤1):选取一卷烟生产地区的300多个库存烟叶样品,研磨后标号装入密封袋
中,平衡水分,保存待测。
[0062]
步骤2):对各烟叶样品进行近红外光谱数据采集并优化成近红外光谱谱图;
[0063]
所述近红外光谱测量方法选用漫反射积分球测样方法;近红外仪器工作条件设置及光谱采集:采用thermo antaris ii傅里叶变换近红外光谱仪,开机预热30分钟后,光谱扫描范围为10000-4000cm-1
,选用分辨率8cm-1
,扫描次数64次,实验环境温度为(23
±
1)℃,湿度为(50
±
2)%;旋转样品杯承装样品厚度确定为0.5cm。
[0064]
对各烟叶样品进行近红外光谱数据采集时,将样品置于旋转采样杯中,每个样品重新取样三次,每次重新采集光谱,保存后供后续数据处理使用。
[0065]
步骤3):对烟叶样品中的致香成分化学值进行检测;所述致香成分为丙二醇、大马酮、金合欢丙酮、香叶基丙酮、新酯二烯。
[0066]
步骤4):设定一组烟叶致香成分的预测集目标评价参数;基于步骤1)中采集的样品近红外光谱数据,采用合适的预处理方法处理光谱数据;然后对预处理后的光谱数据和步骤3)中的烟叶样品致香成分含量数据进行变量特征选择算法优化模型,完成对烟叶样品致香成分的特征波长的提取,并与预测集目标评价参数进行比较,确定出最优的可行性通用模型;
[0067]
其中变量特征选择算法采用线性算法pls和非线性算法lssvm,优先采用线性算法pls模型建模,如果线性模型效果不好,再采用非线性算法lssvm模型建模;
[0068]
各变量特征选择算法具体过程:
[0069]
(1)pls算法步骤如下:
[0070]
输入样本矩阵
×
,输出值矩阵y分别对x,y进行中心化处理、归一化方差,得到矩阵:e0和f;
[0071]
令n=0:
[0072]
计算矩阵e
n’ff’en,计算e
n’ff’en的最大特征根对应的单位特征向量
[0073]
令:
[0074]
tn=enwn,自变量的主成分
[0075]
pn=e
n’tn/tn|2,自变量回归系数
[0076]rn
=f’tn/|tn|2,因变量回归系数
[0077]en 1
=e
n-tnp
n’自变量残差
[0078]
也可以表示为:
[0079]
n ,重复3、4,直到残差达到满意水平
[0080]
最后的回归方程:
[0081]
f=t0r0’
t1r1’
.....t
nrn’ fn[0082]
其中fn为因变量残差
[0083]
预测方程可写为:f=e0b
[0084]
其中b=σk
jrj’[0085]
上式中(从j=0累乘到j=h-1);
[0086]
(2)非线性算法lssvm:
[0087]
该算法通过非线性内积函数k(xi,xj),也称核函数,把输入的低维空间数据非线性
映射到高维空间,利用结构风险最小化原则在高维空间求解最优线性分类器或多元线性模型,由于利用了原空间核函数取代了高维空间的内积运算,算法复杂度没有增加,形式上类似人工神经网络ann。结构如图6所示。lssvm具体流程如图7所示。
[0088]
lssvm最小二乘支持向量机算法采用最小二乘线性系统作为损失函数,代替传统的支持向量机采用的二次规划方法,基于结构风险最小化原则,lssvm优化以下问题:
[0089][0090]
λ是正则化参数,起到权衡拟合精度与模型复杂度的作用;
[0091]
回归模型可描述为:
[0092][0093]
xi为输入向量;ak为拉格朗日乘子,称为支持值,b为偏置核函数,k(x,xi)定义了从原始变量所在的低维度空间向高维度空间做非线性映射的方式;目前支持向量机研究中对于核函数的选择并无固定的方法,但从核函数紧致性和计算复杂度来评价,径向基核函数rbf更具优势,有:
[0094]
k(x,xk)=exp(-||x-xk||2/σ2)
[0095]
式中,σ2是rbf核函数宽度。
[0096]
正则化参数λ优化、核函数k(x,xi)选择和核函数参数优化是lssvm的三个关键问题;选用rbf核函数,用单纯型搜索、十折交叉验证优化参数λ和σ2,这两个参数决定了lssvm的学习能力、预测能力和泛化能力。
[0097]
以下为本实施例的具体建模效果:
[0098]
五种致香成分pls建模结果:
[0099][0100]
ꢀꢀ
剔除后
ꢀꢀꢀꢀꢀ
cvq2preq2rmsecvrmsep剔除10丙二醇0.59830.50460.9410.9587剔除14大马酮0.4020.55671.57871.0976剔除8新植二烯0.23970.2731209.343175.2491剔除8香叶基丙酮0.5970.34151.92612.3727剔除8金合欢基丙酮05794043783452743264
[0101]
其中,pls模型中波长选择的ipls、mwpls、uve模型分别为
[0102]
ipls:
[0103] cvq2rmsecvpreq2rmsep丙二醇0.46000.87810.50960.9086大马酮0.25481.56990.32041.4736
香叶基丙酮0.49212.03100.53021.9594新植二烯0.3346190.81000.3340174.6200金合欢基丙酮0.50673.74550.49304.7336
[0104]
mwpls:
[0105]
mwplscvq2preq2rm secvrm sep丙二醇0.563348-0.022320.9142420.923363大马酮0.2425670.448851.5716971.190716新植二烯0.3034720.261156190.0987208.9042香叶基丙酮0.4624470.4790872.2832252.086884金合欢基丙酮0.3895590.3909524.5062494.141764
[0106]
uve:
[0107] nlvcvq2preq2rmsecvrmsep丙二醇100.55290.72620.79900.6789大马酮70.46160.51101.33431.2500香叶基丙酮80.57400.66101.86001.6645新植二烯50.32190.2680192.6223183.0664金合欢基丙酮70.60680.44253.34324.9637
[0108]
lssvm建模结构如图1-5及下表所示:
[0109] cvq2q2_prermsecvrmsep香叶基丙酮1.00000.62600.00151.7609新植二烯1.00000.70300.5069120.7261丙二醇1.00000.00180.85630.4827大马酮1.00000.82360.00540.7068金合欢基丙酮1.00000.78050.00382.9693
[0110]
通过对以上五个致香成分的化学值与光谱建立了模型,分别采用了pls以及其波长选择的ipls、mwpls、uve模型和lssvm模型。根据以上数据可以看出lssvm模型的效果较好。
[0111]
步骤5):对于待测烟叶样本,先采集其近红外光谱数据,利用通用模型进行致香成分预测。
[0112]
综上,本发明选择烟叶作为研究对象,利用近红外分子振动光谱技术建立烟叶快速质量分析与评估方法技术体系,结合预处理和变量选择建立烟叶致香成分丙二醇、大马酮、金合欢丙酮、香叶基丙酮、新酯二烯定量模型,实现对烟叶的品质指标快速测定;其中,采用lssvm算法模型,完成了烟叶中的致香成分丙二醇、大马酮、金合欢丙酮、香叶基丙酮、新酯二烯的建模,从而建立更优、更具有化学意义的模型,提高模型性能,简化模型,减少计算量,提高模型的解释性,提高模型的鲁棒性。
[0113]
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权
利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内,不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
[0114]
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献