一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于集成学习的雪茄烟采收成熟度识别方法及系统与流程

2022-08-09 20:43:11 来源:中国专利 TAG:


1.本发明涉及雪茄烟分级技术领域,具体为一种基于集成学习的雪茄烟采收成熟度识别方法及系统。


背景技术:

2.田间生长的烟叶在发育成熟过程中,其物理特性和生理生化特性均会发生显著的变化,成熟度是指烟叶在田间生长发育到适于调制加工的成熟状态。采收时雪茄烟的成熟状态直接决定了晾制作业前的烟叶品质,并与晾制后烟叶的外观质量、内在质量及感官质量密切相关。即使是相同品种的烟叶,成熟度的差异也会影响晾制中烟叶的变黄、定色特性及失水特性,从而在一定程度上对烟叶质量产生影响,因此准确把握烟叶成熟度是获得优质烟叶的前提和基础。
3.烟农在采收雪茄烟时,常常根据烟叶的外观特征将不同部位的处于可采收阶段的雪茄烟进一步细分为欠熟、生理成熟、尚熟、工艺成熟、完熟、过熟5个等级,不同成熟度等级的烟叶在调制加工后的质量存在明显的差异。例如,欠熟烟叶在加工后化学成分不协调,评吸质量表现为香气质差、香气量不足,刺激性明显,青杂气略重,潜在质量特征未充分彰显,烟叶内在品质有较大提升空间。工艺成熟烟叶在加工后品质最高、内在化学成分最协调、感官评吸质量最高,因此采收成熟度好、等级高、易调制加工、具有较好的香气质与香气量的烟叶可明显增加烟农收益。
4.但在烟叶晾制生产中,由于地域不同,气候、土壤肥力、水分、栽培方式等有较大差异,适宜成熟度的标准不同,同时烟农中青烟加工的现象较为普遍,对加工后烟叶质量产生不利的影响。此外目前农业领域大多仍采用人工采收、肉眼鉴别成熟度的方法,难以保证准确率与效率,普遍存在下部采过熟、中部采生、上部采青现象,导致晾制后烟叶质量下降,影响烟叶的工业可用性。


技术实现要素:

5.为克服上述现有技术的不足,本发明提供一种基于集成学习的雪茄烟采收成熟度识别方法及系统,用以解决上述至少一个技术问题。
6.根据本发明说明书的一方面,提供一种基于集成学习的雪茄烟采收成熟度识别方法,包括:获取待测雪茄烟图像,并对所述待测雪茄烟图像进行预处理;对预处理后的待测雪茄烟图像进行矢量化降维,并提取rgb、hsv特征值,得到特征集合;利用wrapper包装算法对特征集合中的数据进行特征降维,得到待测雪茄烟图像的初始数据集;将初始数据集输入训练好的随机森林模型中,输出所述雪茄烟图像的成熟度识别结果。
7.上述技术方案在不压缩数据样本量和数据特征数量的前提下,对雪茄烟图像数据进行矢量化降维,保障雪茄烟图像数据信息的高效提取和利用;同时利用机器学习中集成学习博采众长的优势,将雪茄烟采收过程中采集到的烟叶纹理、颜色作为成熟度等级识别模型的输入特征,解决数据价值受损的问题;此外,还利用wrapper包装算法的特征选择和算法训练同时进行的特点,在实现特征选择的同时进行特征降维,降低模型的训练成本。
8.上述技术方案利用田间采集数据实现在采收过程中对雪茄烟成熟度等级的高精度识别,能够有效缓解烟农工作负担,提高雪茄烟采收效率,提升烟叶晾制质量和增加烟叶的经济效益。
9.作为进一步的技术方案,将初始数据集输入训练好的随机森林模型中,输出所述雪茄烟图像的成熟度识别结果,之前还包括:获取大量雪茄烟图像样本,并对所述雪茄烟图像样本进行预处理;对预处理后的待测雪茄烟图像进行矢量化降维,并提取rgb、hsv特征值,得到特征集合;对特征集合中的数据进行雪茄烟成熟度等级编码;对特征集合中的所有样本数据进行无量纲化操作,并利用wrapper包装算法对所有样本数据进行特征降维,得到所有样本的初始数据集;根据bagging集成法,将初始数据集作为模型输入,将雪茄烟成熟度等级编码作为模型识别标签,使用随机森林算法对初始数据集进行建模,构建随机森林模型;将初始数据集中的特征集合和对应的雪茄烟成熟度等级编码按照预设的比例划分为训练集数据和测试集数据;输入训练集数据对构建的随机森林模型进行训练,得到训练好的随机森林模型。
10.上述技术方案利用bagging集成学习博采众长的优势来构建随机森林模型,进而提高识别准确率。该技术方案基于决策树模型在雪茄烟图像数据中展现出高精准度的识别效果,将其作为基评估器构建随机森林模型,通过考虑多个基评估器的建模结果,汇总获取比单个基评估器效果更好的识别表现,得到强评估器,从模型搭建层面提高雪茄烟成熟度等级识别模型的精度。
11.作为进一步的技术方案,在进行雪茄烟成熟度等级编码或进行无量纲化操作之前,对特征集合中的数据进行数据清洗,包括对特征集合中的数据进行缺失值和异常值处理。通过数据清洗可提高数据质量,有利于提高最终的识别精度。
12.具体地,缺失值处理使用特征集合均值填补缺失值,对特征集合中缺失大量有效特征值的数据则直接删除。
13.具体地,异常值处理利用箱型图法对异常值进行识别,再利用数据前后的函数关系校正异常值。
14.作为进一步的技术方案,对雪茄烟图像进行预处理包括:使用非局部平均去噪算法对雪茄烟图像进行去噪;接着使用暗通道去雾算法对去噪后的雪茄烟图像进行去雾;最后使用图像色彩校正算法对去雾后的雪茄烟图像进行色彩校正。
15.上述技术方案通过非局部平均去噪算法、暗通道去雾算法和图像色彩校正算法,对采集到的图像进行预处理,提高图像质量。
16.进一步地,利用非局部平均去噪算法对雪茄烟图像进行去噪,并保留图像的细节
特征。具体为从整个图像出发,以像素为单位检索图像中的相似区块,进行加权平均值计算,将区块内所有像素点的灰度值中值作为待处理像素点的像素值。
17.进一步地,利用暗通道去雾算法对雪茄烟图像进行去雾,缓解图像中像素点向白色过度的趋势,得到高质量深度图像。对比图像中像素点的r、g、b三通道值,并把每个像素点三个通道中具有最小通道值的通道(“偏暗”的通道)按照固定的形式组合构成雪茄烟的暗通道图像。
18.进一步地,利用图像色彩校正算法对雪茄烟图像进行色彩校正,屏蔽采集环境对图像的影响。结合支持向量回归方法对图像中偏差颜色进行校正,解决彩色图像在拼接时因为时间、光线等因素造成拼接后的图像有色差的问题,恢复图像色彩。
19.作为进一步的技术方案,对预处理后的待测雪茄烟图像进行矢量化降维,进一步包括:提取雪茄烟图像中上万个像素点的颜色特征值,得到数据为[图长,图宽,颜色特征值通道数]的矩阵,将数据矢量化为[图长*图宽,颜色特征值通道数]的矩阵,得到聚类前的图像数据;将聚类前的图像数据导入k-means算法,选取聚类数量r,聚类得到图像数据中的r种颜色特征值;用r种类的质心处像素点的颜色特征值替代当前类下所有像素点的颜色特征值。
[0020]
上述技术方案在不改变数据的特征数目和样本量数目的前提下,利用k-means聚类算法,将每张图像上万个像素点的通道值进行聚类,并用类的质心处的像素点通道值替代该类下所有像素点的通道值,简化雪茄烟图像结构,保障了雪茄烟图像数据信息的高效提取和利用,并解决了数据价值受损的问题。
[0021]
作为进一步的技术方案,所述方法进一步包括:将决策树模型作为基评估器,构建多个相互独立的基评估器,并对多个基评估器按照bagging原则进行集成,得到随机森林模型;将多个基评估器的识别结果通过平均或者多数表决原则来决定随机森林模型的识别结果,得到强评估器,用于对雪茄烟成熟度等级的识别。
[0022]
上述技术方案利用bagging集成学习博采众长的优势,构建随机森林模型,将多个基评估器的识别结果通过平均或者多数表决原则来决定随机森林模型的识别结果,提高了雪茄烟成熟度识别准确率。
[0023]
根据本发明说明书的一方面,提供了一种基于集成学习的雪茄烟采收成熟度识别系统,包括:采集模块,用于获取雪茄烟图像;预处理模块,用于对雪茄烟图像进行预处理;矢量化降维模块,用于对预处理后的雪茄烟图像进行矢量化降维,并提取rgb、hsv特征值,得到特征集合;特征降维模块,用于对特征集合中的数据进行无量纲化操作,并利用wrapper包装算法对特征集合中的数据进行特征降维,得到待测雪茄烟图像的初始数据集;模型识别模块,用于将初始数据集输入训练好的随机森林模型中,输出所述雪茄烟图像的成熟度识别结果。
[0024]
上述技术方案通过采集模块采集雪茄烟图像并上传,通过预处理模块进行图像预处理,通过矢量化降维模块对预处理后的图像进行矢量化降维,并提取特征值得到特征集合,实现在不损害数据价值的前提下保障雪茄烟图像数据信息的高效提取及利用;并且,还通过特征降维模块在实现特征选择的同时进行特征降维,并得到初始数据集,该模块消除了样本数据中不利于模型训练的特征,降低了模型的训练成本,提高了模型的训练效率;最后将得到的初始数据集输入训练好的随机森林模型,得到雪茄烟成熟度识别结果,实现了雪茄烟采收过程中的高效高精度识别。
[0025]
进一步地,所述系统还包括数据清洗模块,在执行特征降维模块之前,对特征集合中的数据进行数据清洗,包括对特征集合中的数据进行缺失值和异常值处理。通过数据清洗可提高数据质量,有利于提高最终的识别精度。
[0026]
作为进一步的技术方案,所述系统还包括:随机森林模型构建模块,用于根据bagging集成法,将初始数据集作为模型输入,将雪茄烟成熟度等级编码作为模型识别标签,使用随机森林算法对初始数据集进行建模,构建随机森林模型;随机森林模型训练模块,用于将初始数据集中的特征集合和对应的雪茄烟成熟度等级编码按照预设的比例划分为训练集数据和测试集数据,输入训练集数据对构建的随机森林模型进行训练,得到训练好的随机森林模型。
[0027]
进一步地,所述系统还包括等级编码模块,用于在数据清洗之后或矢量化降维之后,对雪茄烟所处成熟度的等级进行数字编码,并将数字编码存入数据库中。
[0028]
作为进一步的技术方案,所述矢量化降维模块进一步包括:数据提取模块,用于提取雪茄烟图像中上万个像素点的颜色特征值,得到数据为[图长,图宽,颜色特征值通道数]的矩阵,将数据矢量化为[图长*图宽,颜色特征值通道数]的矩阵,得到聚类前的图像数据;聚类模块,用于将聚类前的图像数据导入k-means算法,选取聚类数量r,聚类得到图像数据中的r种颜色特征值信息;降维模块,用于用r种类的质心处像素点的颜色特征值替代当前类下所有像素点的颜色特征值;特征值提取模块,用于基于降维后的数据提取rgb、hsv特征值,得到特征集合。
[0029]
上述技术方案在图像结构简化处理的同时高效利用图像数据信息,其采用k-means聚类算法在不压缩数据样本量和数据特征数量的前提下,对雪茄烟图像数据进行矢量化降维,保障雪茄烟图像数据信息的高效提取和利用,解决数据价值受损的问题,从数据层面提高雪茄烟成熟度等级识别模型的精度。
[0030]
作为进一步的技术方案,所述预处理模块进一步包括:去噪模块,用于使用非局部平均去噪算法对雪茄烟图像进行去噪;去雾模块,用于使用暗通道去雾算法对去噪后的雪茄烟图像进行去雾;校正模块,用于使用图像色彩校正算法对去雾后的雪茄烟图像进行色彩校正。
[0031]
与现有技术相比,本发明的有益效果在于:(1)本发明在不压缩数据样本量和数据特征数量的前提下,对雪茄烟图像数据进行矢量化降维,保障雪茄烟图像数据信息的高效提取和利用;同时利用机器学习中集成学习博采众长的优势,将雪茄烟采收过程中采集到的烟叶纹理、颜色作为成熟度等级识别模
型的输入特征,解决数据价值受损的问题;此外,还利用wrapper包装算法的特征选择和算法训练同时进行的特点,在实现特征选择的同时进行特征降维,降低模型的训练成本。
[0032]
(2)本发明利用田间采集数据实现在采收过程中对雪茄烟成熟度等级的高精度识别,能够有效缓解烟农工作负担,提高雪茄烟采收效率,提升烟叶晾制质量和增加烟叶的经济效益。
[0033]
(3)本发明基于决策树模型在雪茄烟图像数据中展现出高精准度的识别效果,将其作为基评估器构建随机森林模型,通过考虑多个评估器的建模结果,汇总获取比单个评估器效果更好的识别表现,得到强评估器,从模型搭建层面提高雪茄烟成熟度等级识别模型的精度。
附图说明
[0034]
图1为根据本发明实施例的基于集成学习的雪茄烟采收成熟度识别方法流程图。
[0035]
图2为根据本发明又一实施例的基于集成学习的雪茄烟采收成熟度识别方法流程图。
[0036]
图3为根据本发明又一实施例的模型构建及训练流程图。
[0037]
图4为根据本发明实施例的矢量化降维前后图像对比示意图。
[0038]
图5为根据本发明实施例的特征降维选择流程图。
[0039]
图6为根据本发明实施例的随机森林模型训练流程图。
具体实施方式
[0040]
以下将结合附图对本发明各实施例的技术方案进行清楚、完整的描述,显然,所描述发实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施例,都属于本发明所保护的范围。
[0041]
实施例1本发明提供了一种基于集成学习的雪茄烟采收成熟度识别方法,主要应用于田间采收雪茄烟工作中。如图1所示,该方法包括:雪茄烟采集步骤;图像预处理步骤;矢量化降维步骤;特征降维步骤和模型识别步骤。
[0042]
具体实施方案如下:s1、雪茄烟采集步骤:在采收过程中采集雪茄烟图像数据,通过传输设备上传到云平台数据库,构成模型训练的原始数据集。
[0043]
s2、图像预处理步骤:使用非局部平均去噪算法、暗通道去雾算法和图像色彩校正算法,对采集到的雪茄烟图像进行预处理,以提高图像质量。
[0044]
针对雪茄烟图像的预处理步骤如下:s21、利用非局部平均去噪算法对雪茄烟图像进行去噪。从整个图像出发,以n*n的像素区块为单位检索图像中的相似区块,将区块内所有像素点的灰度值中值作为待处理像素点的像素值。举例而言,以n*n的像素区块为单位检索图像中的相似区块时,参数设置可选择如下:n为3,搜素窗口大小为21*21,像素区块为7*7,平滑系数为5。
[0045]
s22、利用暗通道去雾算法对烟叶图像进行去雾,缓解图像中像素点向白色过度的
趋势,得到高质量深度图像。对比图像中像素点的r、g、b三通道值,并把每个像素点三个通道中具有最小通道值的通道(“偏暗”的通道)按照固定的形式组合构成烟叶的暗通道图像。
[0046]
s23、利用图像色彩校正算法对烟叶图形进行色彩校正,屏蔽采集环境对图像的影响。结合支持向量回归方法对图像中偏差颜色校正,解决彩色图像在拼接时因为时间、光线等因素造成拼接后的图像有色差的问题,恢复图像色彩。
[0047]
s3、矢量化降维步骤:获取步骤s2处理后的雪茄烟预处理图像,先利用k-means聚类算法进行矢量化降维,在不改变样本量的基础上简化烟叶图像的结构,再对雪茄烟图像的rgb、hsv特征值进行提取,将非结构化数据转化为结构化数据,得到特征集合。
[0048]
图像矢量化降维的具体步骤为:s31、提取雪茄烟图像中上万个像素点的颜色特征值,得到数据为[图长,图宽,颜色特征通道数]的矩阵,将数据矢量化为[图长*图宽,颜色特征值通道数]的矩阵,得到聚类前的图像数据。
[0049]
s32、利用k-means聚类算法将图像的颜色特征值聚类到20种。将s31处理后的图像数据导入k-means算法,选取聚类数量为20,聚类得到图像数据中最主要的20种颜色特征值信息。
[0050]
s33、用20种类的质心处像素点的颜色特征值替代该类下所有像素点的颜色特征值。图像中上万个像素点的颜色特征值同他们所属质心处像素点的颜色特征值十分相似,因此将质心处像素点的颜色特征值替代该类下所有像素点的颜色特征值,这样即不改变图像样本的数量,也没有压缩数据特征的数量,在保留图像信息的同时,简化烟叶图像结构。图4为k-means矢量化降维前后对比图。
[0051]
s34、构建特征集合包括:提取步骤s33处理后的图像的r(红)、g(绿)、b(蓝)和h(色调)、s(饱和度)、v(明度)六种颜色分量的特征值,通过归一化处理减轻亮度的影响,将数据通过网络上传到数据库,得到特征集合。
[0052]
可选地,为提高数据质量,可在进行特征降维步骤之前先进行数据清洗步骤,如图2所示。即,将步骤s34中特征集合中的数据进行缺失值处理、异常值处理,提高数据的质量,再进行特征降维。
[0053]
数据清洗的具体步骤为:(1)缺失值处理:使用特征集合均值填补缺失值,对特征集合中缺失大量有效特征值的数据则直接删除。
[0054]
(2)异常值处理:利用箱型图法对异常值进行识别,再利用数据前后的函数关系校正异常值。
[0055]
s4、特征降维步骤:对所有样本数据进行无量纲化操作,并利用wrapper包装算法对步骤s3处理后的数据集进行特征降维选择,得到初始数据集。
[0056]
具体步骤为:s41、数据无量纲化。
[0057]
将清洗后的采收数据按照最小值中心化后,再按极差缩放,使全部数据移动最小值个单位,并且收敛到[0,1]之间,完成不同规格的数据转换到同一规格,不同分布的数据转换到某个特定分布的无量纲化操作,提升模型精度,避免某一个取值范围特别大的特征
对距离计算造成影响。
[0058]
s42、数据特征选择。
[0059]
利用wrapper包装算法的特征选择和算法训练同时进行的特点,依靠识别模型自身学习需求进行特征选择。如图5所示,从当前的一组特征中修剪最不重要的特征,在修剪的特征集合上递归地重复该过程,直到最终到达所需数量的要选择的特征子集,结合模型需求提升模型的表现。
[0060]
图5中目标函数选用最经典的贪婪优化算法:递归特征消除法(recursive feature elimination, rfe),反复创建模型,并在每次迭代时保留最佳特征或剔除最差特征,下一次迭代时,它会使用上一次建模中没有被选中的特征来构建下一个模型,直到所有特征都耗尽为止。 然后,它根据自己保留或剔除特征的顺序来对特征进行排名,最终选出一个最佳子集。
[0061]
s5、模型识别步骤:将特征降维处理后得到的初始数据集输入训练好的随机森林模型中,输出所述雪茄烟图像的成熟度识别结果。
[0062]
在进行模型识别之前,还可对矢量化降维或数据清洗后的数据进行雪茄烟成熟度等级编码。雪茄烟的成熟度等级分为:欠熟、生理成熟、尚熟、工艺成熟、完熟、过熟。将处理后的数据按照状态进行标注,分别对应数0、1、2、3、4,将等级作为训练标签保存到雪茄烟采收数据库。
[0063]
在进行模型识别之前,还包括模型构建及训练步骤,如图3所示,具体为:根据bagging集成法,将特征集合作为模型输入的特征数据,将雪茄烟成熟度等级数字编码作为模型识别标签,使用随机森林算法对特征集合进行建模,并使用训练数据集进行训练,得到训练好的随机森林模型。
[0064]
如图6所示,具体做法为:s51、划分训练集和测试集。
[0065]
将步骤s4中的选择后的特征子集和对应的雪茄烟成熟度等级数字编码按照7:3的比例划分为训练集数据和测试集数据。
[0066]
s52、构建决策树基评估器。
[0067]
利用决策树算法构建基评估器,对于分类模型,首先计算全部特征的不纯度指标,选取不纯度指标最优的特征进行分支,分枝后,在被分枝特征的不同取值下,再计算每个特征的不纯度,继续选取不纯度最低的特征进行下一层分枝。每分枝一层,树整体的不纯度会越来越小,决策树追求的是最小不纯度,因此决策树会一直分枝,直到没有更多的特征可用,或整体的不纯度指标已经最优,决策树停止生长,完成单个基评估器的构建。
[0068]
s53、根据bagging法集成随机森林模型。
[0069]
根据bagging法集成随机森林模型,将多个相互独立的基评估器的识别结果按照少数服从多数的原则集成得到最终的识别结果,因此单个决策树基评估器的识别准确率越高,最终集成的随机森林识别模型的识别准确率也会越高。
[0070]
举例而言,选取基评估器的数量为100,对任何一个样本而言,平均或多数表决原则下,随机森林模型中当且仅当有50棵以上的树判断错误的时候,随机森林才会判断错误。单独一棵决策树对雪茄烟成熟度等级的识别准确率在0.90上下浮动,假设一棵树判断错误的可能性为,那50棵树以上都判断错误的可能性是:
其中,i是判断错误的次数,也是判错的树的数量,是一棵树判断错误的概率,是判断正确的概率,共判对100-i次,因为100棵树中,有任意i棵树都判断错误,所以采用组合进行计算。
[0071]
输入训练集数据对随机森林集成模型进行训练,根据网格搜索方法自动调节集成模型参数,根据学习曲线确定,集成模型中决策树模型数量为100,不纯度指标为gini(基尼系数),树的最大深度为8,一个中间节点要分支所需要的最小样本量为13,一个中间节点要存在所需要的最小样本量为1,最大叶节点数量为12,完成bagging集成学习中随机森林识别模型的训练。
[0072]
s54、采用步骤s53得到的随机森林模型对测试集数据进行识别并输出,正确率为98%以上。这表明,采集雪茄烟采收过程中提取到的特征数据,导入到本发明的随机森林模型进行雪茄烟成熟度等级识别,解决数据价值受损的问题,高效地利用田间采集数据实现在采收过程中对雪茄烟成熟度档次的高精度识别。
[0073]
实施例2根据本发明说明书的一方面,提供了一种基于集成学习的雪茄烟采收成熟度识别系统,包括:采集模块,用于获取雪茄烟图像;预处理模块,用于对雪茄烟图像进行预处理;矢量化降维模块,用于对预处理后的雪茄烟图像进行矢量化降维,并提取rgb、hsv特征值,得到特征集合;特征降维模块,用于对特征集合中的数据进行无量纲化操作,并利用wrapper包装算法对特征集合中的数据进行特征降维,得到待测雪茄烟图像的初始数据集;模型识别模块,用于将初始数据集输入训练好的随机森林模型中,输出所述雪茄烟图像的成熟度识别结果。
[0074]
进一步地,所述系统还包括数据清洗模块,在执行特征降维模块之前,对特征集合中的数据进行数据清洗,包括对特征集合中的数据进行缺失值和异常值处理。通过数据清洗可提高数据质量,有利于提高最终的识别精度。
[0075]
进一步地,所述系统还包括等级编码模块,用于在数据清洗之后或矢量化降维之后,对雪茄烟所处成熟度的等级进行数字编码,并将数字编码存入数据库中。
[0076]
所述系统还包括随机森林模型构建模块和随机森林模型训练模块,用于在进行模型识别之前,进行随机森林模型的构建和训练。
[0077]
所述随机森林模型构建模块具体为,根据bagging集成法,将初始数据集作为模型输入,将雪茄烟成熟度等级编码作为模型识别标签,使用随机森林算法对初始数据集进行建模,构建随机森林模型;随机森林模型训练模块,用于将初始数据集中的特征集合和对应的雪茄烟成熟度等级编码按照预设的比例划分为训练集数据和测试集数据,输入训练集数据对构建的随机森林模型进行训练,得到训练好的随机森林模型。
[0078]
优选地,所述矢量化降维模块进一步包括:数据提取模块,用于提取雪茄烟图像中上万个像素点的颜色特征值,得到数据为[图长,图宽,颜色特征值通道数]的矩阵,将数据矢量化为[图长*图宽,颜色特征值通道数]的矩阵,得到聚类前的图像数据;聚类模块,用于将聚类前的图像数据导入k-means算法,选取聚类数量r,聚类得到图像数据中的r种颜色特
征值信息;降维模块,用于用r种类的质心处像素点的颜色特征值替代当前类下所有像素点的颜色特征值;特征值提取模块,用于基于降维后的数据提取rgb、hsv特征值,得到特征集合。
[0079]
上述优选方案在图像结构简化处理的同时高效利用图像数据信息,其采用k-means聚类算法在不压缩数据样本量和数据特征数量的前提下,对雪茄烟图像数据进行矢量化降维,保障雪茄烟图像数据信息的高效提取和利用,解决数据价值受损的问题,从数据层面提高雪茄烟成熟度等级识别模型的精度。
[0080]
进一步地,所述预处理模块还包括:去噪模块,用于使用非局部平均去噪算法对雪茄烟图像进行去噪;去雾模块,用于使用暗通道去雾算法对去噪后的雪茄烟图像进行去雾;校正模块,用于使用图像色彩校正算法对去雾后的雪茄烟图像进行色彩校正。
[0081]
利用非局部平均去噪算法对雪茄烟图像进行去噪,并保留图像的细节特征。具体为从整个图像出发,以像素为单位检索图像中的相似区块,进行加权平均值计算,将区块内所有像素点的灰度值中值作为待处理像素点的像素值。
[0082]
利用暗通道去雾算法对雪茄烟图像进行去雾,缓解图像中像素点向白色过度的趋势,得到高质量深度图像。对比图像中像素点的r、g、b三通道值,并把每个像素点三个通道中具有最小通道值的通道(“偏暗”的通道)按照固定的形式组合构成雪茄烟的暗通道图像。
[0083]
利用图像色彩校正算法对雪茄烟图像进行色彩校正,屏蔽采集环境对图像的影响。结合支持向量回归方法对图像中偏差颜色进行校正,解决彩色图像在拼接时因为时间、光线等因素造成拼接后的图像有色差的问题,恢复图像色彩。
[0084]
通过上述非局部平均去噪算法、暗通道去雾算法和图像色彩校正算法,对采集到的图像进行预处理,提高图像质量。
[0085]
在本说明书的描述中,参考术语“一个实施方式”、“某些实施方式”、“示意性实施方式”、“示例”、“具体示例”、或“一些示例”等的描述意指结合所述实施方式或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施方式或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。
[0086]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献