一种基于参数校正和迁移学习的近红外木材密度检测方法

2022-06-05 18:31:27 来源：中国专利 TAG：

1.本发明涉及光谱检测与光谱模型传递领域，主要涉及木材密度无损检测领域，具体为一种基于参数校正和迁移学习的近红外木材密度检测方法。

背景技术：

2.木材密度是检验木材力学性能的重要物理性质，也是鉴定木材质量的重要指标。在林业领域，木材密度可以用来预测木材的物理和机械性能，如湿胀度，硬度和强度。木材性质的准确预测与评价可为材料改良、人工林培育、提高木材综合利用率、木结构建筑物的修复与维护等方面提供理论和科学依据。因此，快速准确地获取木材密度对现代林业生产具有重要意义。传统的木材密度检测方法包括排水法、称重法和基于机械力的密度检测法。然而，上述方法过程复杂且耗时，不利于大量木材的检测。近红外光谱技术的原理是记录样品分子水平上含氢基团的组合振动，这可以与化学计量学技术结合，对木材特性进行快速、非破坏性的定性和定量分析。
3.然而，近红外光谱数据的强共线性、光谱对设备和环境的超灵敏度以及预测模型性能差仍然是光谱技术在木材密度估测中广泛应用的主要障碍。目前已经提出了多种模型传递方法，可以提高模型的泛化能力，改善不同数据集间的差异，但效果参差不齐，大多不理想。而且大多数模型传递方法受到数据维数和样本容量的限制，不能灵活地处理相关问题。
4.目前已有相关技术将深度学习和迁移学习方法应用于光谱模型传递技术中，cnn网络在许多领域得到了广泛应用且验证了其具有很强的特征提取能力，将cnn网络作为特征提取器，可以提高线性不可分的光谱数据集的可分割度，但cnn的执行条件需要大量样本，而且每个样本在训练过程中都会影响分类超平面的位置，这无疑会导致小样本数据(如光谱数据)的预测精度大大降低。与cnn的原理不同，svr将非线性特征映射到高维空间来实现分类，一些研究证明，使用svr作为cnn的回归器可以提高cnn对小样本数据集的预测能力，虽然cnn-svr可以降低cnn模型过拟合的风险，但在迁移学习域，当源域和目标域的样本权重变化较大时，cnn-svr也缺乏动态调整样本权值的能力。同时，cnn-svr不能及时更新超平面划分规则，在面对实际生产中不可预测的外部干扰时缺乏灵活性。

技术实现要素：

5.基于此，为解决上述技术问题，本发明选择了特征提取能力更强层数更深的resnet网络，并将svr作为resnet网络的回归器，同时在网络训练的过程中调用tradaboost.r2算法实时调整样本权重，提出了一种预测精度更高，泛化能力更强的近红外木材密度检测方法。
6.为达到上述目的，本发明是通过以下技术方案解决上述技术问题的：
7.本发明提供了一种基于参数校正和迁移学习的近红外木材密度检测方法，具体包括：
8.s1：木材样品收集、光谱采集，收集若干木材样品并编号，采用排水法测得木材密度，将样品分别置于不同的温度、湿度等环境条件下，采集不同环境条件下木材样品的近红外光谱，所述环境条件均为单一变量；
9.s2：光谱数据预处理，采用平滑、标准正态变量校正等传统光谱预处理方法预处理光谱数据，增大信噪比，消除干扰，获得预处理后的标准化光谱矩阵，所述标准化光谱矩阵中的不同行对应不同样品的光谱，与编号一一对应；
10.s3：划分样品集，将所述标准化光谱矩阵划分为训练集和测试集，包括源域和目标域数据集的训练集和测试集，所述源域的训练集和测试集为测量木材密度所在环境条件下采集的光谱数据集，目标域的训练集和测试集为其他环境条件下采集的光谱数据集；
11.s4：构建主从resnet网络预训练模型，将源域和目标域训练集分别输入进行多次训练后，保存具有最佳预测能力的主预训练模型，将其超参数值迁移到从预训练模型中，微调从预训练模型的权值参数，使其达到最优并保存；
12.s5：将svr设为所述resnet网络的回归器和tradaboost.r2迁移学习框架的学习算法，用粒子群算法优化svr的超参数；
13.s6：将resnet网络作为特征提取器，将源域和目标域测试集分别输入主从resnet网络预训练模型提取甁颈特征，所述甁颈特征为resnet网络提取的低维有效特征，可显著提高光谱数据的可读性和可学习性；
14.s7：将所述主从预训练模型提取的甁颈特征分别输入tradaboost.r2迁移学习框架循环训练，并输出木材密度预测结果。
15.进一步的，步骤s1中所述的排水法测木材密度参照了国家标准《木材密度测定方法(gb/t 1933-2009)》，且为控制单一环境变量，实验中所述木材样品被放置在恒温恒湿箱中至少48小时。
16.进一步的，步骤s1中所述的采用近红外光谱仪扫描木材样品光谱，在样品同一位置重复扫描3次取平均值，每次扫描时间约为1.5秒，在设定的扫描周期内连续扫描样品30次，扫描范围为350-2500nm。
17.进一步的，步骤s2中所述的光谱预处理方法具体为：先采用savitzky-golay滤波法对步骤s1中采集的原始光谱进行21点3阶的平滑处理，消除噪声，然后使用标准正态变量校正法消除样品表面颗粒大小和散射对光谱的影响。
18.进一步的，步骤s4中所述的resnet网络预训练模型主要由1个输入层(input)、若干个卷积块(basic block)、1个展平层(flatten)、若干个全连接层(fc)和1个输出层(output)依次连接构成，所述卷积块包括由两个卷积层(conv)、批归一化层(bn)和一条捷径组成，所述展平层是将最后一个池化层的输出结果按序排列连接，所述输入层为原始的光谱曲线，所述输出层为定量分析的预测值。
19.进一步的，步骤s4中所述的resnet网络预训练模型中，将除输出层之外的每一层的激活函数设置为校正线性元函数(relu)，并将输出层的激活函数设置为线性函数(line)，以使网络成为回归模型，adam优化器用于训练网络的超参数，以均方误差(mse)作为resnet的损失函数，选择决定系数(r2)和平均绝对误差(mae)作为模型的评价指标，为了避免模型陷入局部最优，引入了keras提供的reducelronplatform函数和earlystopping函数。
20.进一步的，步骤s5中所述的svr的核函数确定为径向基函数(rbf)，并利用粒子群优化算法(pso)对svr的超参数(惩罚因子c、核参数等)进行优化，在pso中，种群大小被设置为50，个体学习因子c1＝1.5，社会学习因子c2＝1.7，最大迭代次数被设置为50，并且交叉验证折数被设置为10折。
21.进一步的，步骤s5中所述的tradaboost.r2的具体步骤如下：
22.初始化主从预训练模型提取的瓶颈特征的权重向量w
1i
分布，公式如下：
[0023][0024]
其中m和n为分别为源域和目标域数据集的大小；将主从甁颈特征合并为数据集t；
[0025]
循环次数为：t＝1,2,
…
,k，
[0026]
调用adaboost.r2，得到svr
t
模型，用f-折交叉验证来计算svr
t
的损失误差error
t
，当达到最大迭代次数k时，源域数据集的权值逐渐减小并趋于零，用svr
t
每次学习的错误率e
ti
来更新源域的权值分布，当源域权重分布达到最优时，固定源域数据集权重，调用adaboost.r2更新目标域数据集权重，更新权重的公式如下：
[0027][0028]
其中w
t 1i
为更新样本权重，w
ti
为上一轮迭代的样本权重，z
t
是一个归一化常数，β
t
为源域与目标域数据集svr
t
的权重，调整β
t
使目标域甁颈特征的权重为：
[0029][0030]
确定最优的svr
t
模型，完成resnet-svr-tradaboost.r2迁移模型，并输出木材密度预测结果。
[0031]
与现有技术相比，本发明的有益效果在于：
[0032]
本发明提出了一种基于tradaboost.r2参数校准和svr特征优化的深度迁移学习策略，解决了不同测量环境下光谱存在明显非线性差异时，传统模型传递方法的优化性能较低的问题，避免了仪器昂贵、检测成本高的局限。
[0033]
本发明可以提取高维和非线性光谱，利用支持向量机减弱源域和目标域之间的非线性差异，最后利用tradaboost.r2对每个样本进行参数标定；对目标域的校准样本数量的需求较低；且当源域与目标域有较大差异，该方法可灵活调整样本权重，在木材密度反演中表现出较好的通用性、准确性和便携性，是一种准确可行的方法。该发明方法有望有效推进林业领域近红外分析技术的发展和应用。
附图说明
[0034]
附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例共同用于解释本发明，并不构成对本发明的限制。在附图中：
[0035]
图1为本发明实施例提供的一种基于参数校正和迁移学习的近红外木材密度检测方法的流程图；
[0036]
图2为本发明实施例提供的不同含水率条件下(10％、30％、50％、70％)的落叶松
木材密度近红外光谱图；
[0037]
图3为本发明实施例提供的1dresnet的网络结构图；
[0038]
图4为本发明实施例提供的resnet-svr-tradaboost.r2模型的迁移学习框架图；
[0039]
图5为本发明实施例提供的源域和目标域中不同模型传递方法的r2对比图；
[0040]
图6为本发明实施例提供的不同含水率下标准测量值与预测值之间的线性相关图；
具体实施方式
[0041]
以下将结合具体实施例对本发明的技术方案进行清楚、完整的描述，显然，所描述实施例仅仅是本发明的一部分实施例，而不是全部的实施例。基于本发明的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施例，都属于本发明所保护的范围。
[0042]
实施例：
[0043]
本实施例采用落叶松作为研究对象，采用近红外光谱法预测其在不同含水率条件下的木材气干密度。以落叶松作为对象进行介绍，是考虑到落叶松是中国东北地区针叶林的主要树种，木材蓄积丰富，也是该地区今后荒山造林和森林更新的主要树种，木材略重，硬度中等，易裂，纹理直，结构细密，比重0.32-0.52，有树脂，耐久用，可供房屋建筑、土木工程、电杆、舟车、细木加工及木纤维工业原料等用材。本实施例所述方法在落叶松木材密度检测上的成功应用是较为典型的，是可以推广至其他相当一部分木材上的，具有很强的代表性。
[0044]
本实施例中，设置呈梯度变化的含水率条件，分别为：10％、30％、50％、70％。选择该含水率梯度参考了黑龙江省近五年的气候变化规律，结合当地生产作业规律和落叶松自身特性，设置典型对照。在实际应用中，可根据具体木材的品种及理化特性决定生产和实验方式。
[0045]
如图1所示步骤，上述实施例过程具体如下：
[0046]
s1：木材样品收集、光谱采集。收集若干木材样品并编号，采用排水法测得木材气干密度，所述的排水法测木材密度参照了国家标准《木材密度测定方法(gb/t 1933-2009)》。为了避免表面粗糙度的影响，用80目砂纸对试样的每面进行5次抛光，使表面粗糙度参数ra接近12.5μm。控制温度为20℃，设定含水率为70％、50％、30％和10％共4个梯度，将木材样品在水中浸泡20d，然后在烘箱中烘干，干燥后每隔5-15分钟称重计算样品的含水率，当木材含水率达到规定的含水率梯度时，立即测量样品的近红外光谱数据。使用asdpro fr/a114260便携式光谱仪，波长范围350-2500nm，由2151个数据点组成。使用光纤探头在样品横截面上同一位置重复扫描3次，每次扫描时间约为1.5秒。在设定的扫描周期内连续扫描样本30次。取三个测量值的平均值作为原始光谱数据。
[0047]
如图2所示，木材样品的内部结构随含水率的不同而不同，导致光谱分布不同，如基线漂移、小部分吸收峰位移、吸收峰形变化等，但总体趋势相似。本实施例以含水率为10％的木材样品的光谱数据作为源域数据集，以其他含水率水平(70％、50％、30％)的木材样品的光谱数据作为目标域数据集。并从测量环境的角度对模型传递进行了研究。
[0048]
s2：光谱数据预处理。先采用savitzky-golay滤波法对步骤s1中采集的原始光谱
进行21点3阶的平滑处理，消除噪声，然后使用标准正态变量校正法消除样品表面颗粒大小和散射对光谱的影响，获得预处理后的标准化光谱矩阵，所述标准化光谱矩阵中的不同行对应不同样品的光谱，与编号一一对应；
[0049]
s3：划分样品集。本发明实施例中，采用基于联合x-y距离(spxy)的样本集划分方法，将步骤s1所述的四组光谱数据分别划分为训练集和测试集。其中，各组光谱数据的源域和目标域的训练集和测试集各有118个和51个样本。
[0050]
s4：构建主从resnet网络预训练模型，将源域和目标域训练集分别输入进行多次训练后，保存具有最佳预测能力的主预训练模型，将其超参数值迁移到从预训练模型中，微调从预训练模型的权值参数，使其达到最优并保存。
[0051]
在本发明实施例中，如图3所示，步骤s4中所述的resnet网络预训练模型主要由1个输入层(input)、八个卷积块(basic block)、1个展平层(flatten)、四个全连接层(fc)和1个输出层(output)依次连接构成，所述卷积块包括由两个卷积层(conv)、批归一化层(bn)和一条捷径组成，所述展平层是将最后一个池化层的输出结果按序排列连接，所述输入层为原始的光谱曲线，所述输出层为定量分析的预测值。
[0052]
在本发明实施例中，将除输出层之外的每一层的激活函数设置为校正线性元函数(relu)，并将输出层的激活函数设置为线性函数(line)，以使网络成为回归模型，adam优化器用于训练网络的超参数，以均方误差(mse)作为resnet的损失函数，选择决定系数(r2)和平均绝对误差(mae)作为模型的评价指标，为了避免模型陷入局部最优，引入了keras提供的reducelronplatform函数和earlystopping函数。
[0053]
s5：将svr设为所述resnet网络的回归器和tradaboost.r2迁移学习框架的学习算法，用粒子群算法优化svr的超参数。其中svr的核函数确定为径向基函数(rbf)，并利用粒子群优化算法(pso)对svr的超参数(惩罚因子c、核参数等)进行优化，在pso中，种群大小被设置为50，个体学习因子c1＝1.5，社会学习因子c2＝1.7，最大迭代次数被设置为50，并且交叉验证折数被设置为10折。
[0054]
s6：将resnet网络作为特征提取器，将源域和目标域测试集分别输入主从resnet网络预训练模型提取甁颈特征，所述甁颈特征为resnet网络提取的低维有效特征，可显著提高光谱数据的可读性和可学习性；
[0055]
在本发明实施例中，如图4所示，步骤s5中所述的tradaboost.r2的具体步骤如下：
[0056]
初始化主从预训练模型提取的瓶颈特征的权重向量w
1i
分布，公式如下：
[0057][0058]
其中m和n为分别为源域和目标域数据集的大小；将主从甁颈特征合并为数据集t；
[0059]
循环次数为：t＝1,2,
…
,k，
[0060]
调用adaboost.r2，得到svr
t
模型，用f-折交叉验证来计算svr
t
的损失误差error
t
，当达到最大迭代次数k时，源域数据集的权值逐渐减小并趋于零，用svr
t
每次学习的错误率e
ti
来更新源域的权值分布，当源域权重分布达到最优时，固定源域数据集权重，调用adaboost.r2更新目标域数据集权重，更新权重的公式如下：
[0061][0062]
其中w
t 1i
为更新样本权重，w
ti
为上一轮迭代的样本权重，z
t
是一个归一化常数，β
t
为源域与目标域数据集svr
t
的权重，调整β
t
使目标域甁颈特征的权重为：
[0063][0064]
s7：将所述主从预训练模型提取的甁颈特征分别输入tradaboost.r2迁移学习框架循环训练，确定最优的svr
t
模型，完成resnet-svr-tradaboost.r2迁移模型，并输出木材密度预测结果。
[0065]
在本发明实施例中，为验证resnst1d-svr-tradaboost.r2方法是否有效，是否优于传统方法。在实验中加入了偏最小二乘直接预测模型(plsr-target)、支持向量回归机直接预测模型(svr-target)、基于截距/斜率方法传递的plsr模型(plsr sbc)、基于分段直接校正方法传递的plsr模型(plsr pds)、基于分段直接校正方法传递的svr模型(svr pds)、基于迁移学习的resnet1d模型(resnet1d-tl)和基于迁移学习的resnet1d-svr模型(renst1d-svr)作为比较。使用本发明所提出的resnet1d-svr-tradaboost.r2作为模型传递方法，在木材含水率为70％、50％和30％的目标域中进行实验，并取3组结果的平均值。其中每组结果平均运行20次，克服了随机参数的影响。结果如图5所示。总体而言，迁移学习法建立的模型预测精度较高。其中，resnet1d-svr-tradaboost.r2具有较强的泛化能力，在源域(r2＝0.7152)和目标域(r2＝0.4106)均可体现出来，其预测模型的性能是所有方法中最好的。
[0066]
在本发明实施例中，还研究了不同含水率之间的模型传递，分别建立了各含水率组的预测模型，并以此作为标准，以plsr-target为对照测试本发明所提出的方法。在实际测量中，一批木材的含水率往往存在个体差异。因此，实验组中设置了一个新的混合含水率组，采用spxy方法从每个目标域实验组中选取40个样品(水分含量分别为30％、50％、70％)，并将这些样品合并到一个含有120个样品的训练集中。同样，从剩余的样品中选出30个样品，合并成一个有90个样品的测试集。模型传递的结果如图6所示。
[0067]
上述结果表明，50％和70％含水率的直接预测值(plsr-target)的散点大多在plsr预测线以上，总体预测结果偏大。含水率为30％的直接预测值的散点基本上位于plsr预测线附近。这意味着随着含水率的增加，木材的吸湿效果增强，细胞内游离水分也增加。木材吸湿过程中含水率的增加和内部结构的变化会严重干扰可见光谱，导致模型的预测效果较差。不同含水率影响响应函数，用10％含水率模型预测其它含水率条件下的光谱时，会产生较大的系统误差。直观上可以看出，30％、50％和70％含水率组的预测散点非常接近plsr预测线，而混合含水率组的散点相对接近。试验结果表明，对于不同含水率或混合含水率，即使光谱受测量环境的影响很大，resnet1d-svr-tradaboost.r2都具有较强的泛化能力，也具有实际应用的潜力。
[0068]
以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保
护范围。因此，本发明专利的保护范围应以所附权利要求为准。
[0069]
本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本技术旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由权利要求指出。
[0070]
应该理解的是，虽然本发明各实施例的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
[0071]
以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种用于气相色谱仪试验的防阻塞微量注射器吸取设备的制作方法

一种基于参数校正和迁移学习的近红外木材密度检测方法

相关文献

最热文献