一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于特征融合的群养猪身份识别方法

2022-05-21 06:05:08 来源:中国专利 TAG:


1.本发明属于计算机视觉技术领域,涉及图像处理、特征融合及分类识别,具体涉及一种基于特征融合的群养猪身份识别方法。


背景技术:

2.近年来,随着国家经济和人们生活水平的提高,中国生猪的养殖规模和数量在不断扩大,养殖信息化是今后生猪饲养监管的重要模式。而群养猪身份识别在生猪饲养管理和个体行为分析中发挥着重要作用。相比于通过耳标和涂标记识别猪个体的方法,基于生物特征的识别方法是稳定的和非侵入性的。因此,猪体表面的纹理特征和颜色特征常被用来识别猪个体身份,如hog特征、sift特征、lbp特征、颜色直方图特征等等,而这些特征的描述精度均不是很高。因此,本发明公开了一种基于特征融合的群养猪身份识别方法,首先对sift、lbp和颜色直方图这三种特征进行改进,得到稀疏点多方向描述的sift特征、多分块改进的中心对称局部八元模式特征和基于空间分布信息的连通域统计特征,提高了猪个体特征获取的精度,然后将猪个体图像提取的这三种特征进行串行加权融合,并采用pca进行降维,最后采用基于改进杂交育种算法的加权集成分类器对猪个体图像进行分类训练。


技术实现要素:

3.本发明的目的是通过机器视觉技术对采集到的群养猪俯视视频进行猪个体身份识别。
4.本发明所采用的技术方案是基于特征融合的群养猪身份识别方法,包括以下步骤:
5.步骤1,对群养猪俯视视频进行分帧处理,采用关键区域最近邻像素比较法选取关键帧,图像增强后利用基于阈值优化的分水岭算法进行猪个体分割,得到七张猪个体图像,其中阈值优化采用改进的果蝇优化算法(fruit fly optimization algorithm based on adaptive optimization and improved evaluation strategy,简称aoies-foa);
6.步骤2,分别对七张猪个体图像,采用稀疏点多方向描述的尺度不变特征变换算法(sparse point multi-direction description scale-invariant feature transform,简称smd-sift)提取猪个体的局部特征,多分块改进的中心对称局部八元模式算法(multi-block improved central symmetry local octet pattern,简称mb-icslop)提取猪个体的纹理特征,基于空间分布信息的连通域统计算法提取猪个体的颜色区域块特征;
7.步骤3,对上述提取的三种特征分别进行归一化后,给每个特征赋予一个权重,并采用改进的杂交育种算法(improved hybrid breeding algorithm,简称ihba)进行优化,然后对加权特征进行串行融合,最后采用pca进行降维;
8.步骤4,采用基于改进杂交育种算法的加权集成分类器对猪个体图像进行分类训练。首先采取按比例有放回的抽样方式将数据集生成3个不同的训练子集,接着采用kappa值度量出差异性最大的3个分类器进行并行训练,然后采用改进的杂交育种算法对分类器
的权重进行优化,得到最优权重组合,最后通过加权投票法来识别猪个体的身份。
9.进一步,所述步骤1具体包括:
10.首先,采集7头猪的俯视视频进行分帧处理,利用关键区域最近邻像素比较法选取关键帧。关键区域最近邻像素比较法具体步骤如下:对群养猪视频进行分帧后,根据分帧顺序取出相邻的2帧图像,本专利主要针对饮水区域猪的身份识别,在2帧图像中选定相同饮水区域,计算该区域rgb三分量对应的像素差值和,如果该像素差值和小于设定阈值,则2帧图像相似性高,剔除后一帧图像,反之,保存后一帧图像,即将相似度低的图像作为关键帧。
11.然后采用局部直方图均衡化来提高图像对比度,使用中值滤波去除引入的噪声;对增强后的图像先提取有效区域,利用基于阈值优化的分水岭算法进行分割,再经过形态学处理,计算各连通区域的面积,最后舍去面积小于阈值的连通区域,得到猪个体的分割图。
12.其中,基于阈值优化的分水岭算法具体步骤包括:首先利用改进的果蝇优化算法搜索最优阈值,进行阈值分割,得到二值化图像;然后通过形态学运算和距离变换得到背景和前景区域;标记背景与前景区域相交的部分;最后采用分水岭算法对图像进一步分割,得到最终分割结果。
13.对于果蝇优化算法的改进,改进一是将原算法的固定步长改进为根据迭代次数自适应调整搜索步长,如公式(1)所示,使得算法在寻优前期具备较大的搜索距离进行全局性的搜索,避免较早地陷入局部最优,寻优后期随着迭代次数的增加搜索距离减小,提高算法的局部搜索能力。
[0014][0015]
其中,d
l
为搜索步长,d为初始步长,ic为当前迭代次数,i
max
为最大迭代次数,b为偏移量。
[0016]
改进二是因为图像的二维信息总熵和二维类间方差是评判图像分割的两个标准,本专利选择将两者进行加权融合作为浓度适应度函数,如公式(2)所示。
[0017][0018]
其中,f(s,t)为浓度适应度值,为图像的二维信息总熵,o(s,t)为图像的二维类间方差值,si为味道浓度判定值,i为当前寻优次数,ω为权重值,r为系数。
[0019]
进一步,所述步骤2中稀疏点多方向描述的尺度不变特征变换算法具体包括:在原sift算法的基础上,进行以下改进:改进一是为了扩大关键点的稀疏度,使关键点分布得更均匀,本专利设定一个3*3的抑制区域,根据公式(3)计算该区域内所有关键点的harris响应值rm,响应值小于设定阈值的关键点应被剔除,使得留下的关键点更稳定。
[0020][0021]
其中,m为协方差矩阵,p为图像块,i
x
为关键点沿x方向的梯度值,iy为关键点沿y方向的梯度值,rm为harris响应值,trace为求矩阵的迹,k为系数,取值0.5。
[0022]
改进二是在原算法对关键点描述的基础上增加了对角线像素的灰度变化特征,有利于提取猪个体关键点的更多方向特征,提高了特征获取的精度。
[0023]
1)根据公式(4)计算像素(x,y)两条对角线方向的梯度。
[0024]gx
(x,y)=i(x 1,y 1)-i(x-1,y-1),gy(x,y)=i(x-1,y 1)-i(x 1,y-1)
ꢀꢀ
(4)
[0025]
其中,g
x
(x,y)、gy(x,y)为两条对角线方向的梯度,i(x,y)为像素(x,y)的值。
[0026]
2)根据公式(5)计算梯度幅值m(x,y)和方向值θ(x,y)。
[0027][0028]
3)然后将4
×
4个窗口内的像素进行8个方向的直方图统计,形成一个128维的特征向量。
[0029]
将原始sift特征向量和通过计算对角线像素变化得到的特征向量进行串联,最终得到关键点的256维描述子。
[0030]
进一步,所述步骤2中多分块改进的中心对称局部八元模式算法具体包括:该算法通过滑动9*9的窗口提取特征,将窗口均分成9个大小为3*3像素的子窗口,计算每个子窗口的平均值,得到大小为3*3像素的均值图像块,然后对均值图像块进行mb-icslop编码计算。mb-icslop在比较中心像素与相邻像素的灰度值的基础上,采用两位二进制编码,增加了邻域像素之间的灰度值对比,还采用三位二进制编码,增加了四个梯度方向上中心对称像素点的灰度值对比,这样能更好地突显出像素点间的细微差异信息,使得提取到的纹理特征更加细致精准,有利于猪个体的识别。具体公式如(6)-(9)所示。
[0031][0032]
其中,s(i)=ν(f(p
2i-p
2i 1
),f(p
2i 1-p
2i 2
))2iꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
[0033]
t(i)=μ(f(p
i-pc),f(p
i 4-pc),f(p
i-p
i 4
))2iꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
[0034][0035]
其中,bm-icslop(c)为当前像素c的bm-icslop编码值,s(i)为邻域像素值比较的编码值,t(i)为对角线像素值比较的编码值,ν(a,b)表示两位二进制编码值,μ(a,b,c)表示三位二进制编码值,f(x)为像素比较函数,pi为邻域像素值,pc为中心像素值;
[0036]
在特征提取过程中,一个mb-icslop算子在9*9像素的窗口下能产生150种模式,因此单只猪图像可提取150维mb-icslop特征,降低特征维数的同时不会缺失细节信息。
[0037]
进一步,所述步骤2中基于空间分布信息的连通域统计特征具体包括:颜色直方图特征是对全局颜色特征的统计,但缺少颜色的空间分布信息。为了改进这一点,本专利采用局部颜色范围值构成的连通区域的4个统计特征,来描述图像中该颜色范围值的像素分布信息,具体步骤如下:
[0038]
1)定义连通域:若两个像素点之间符合八邻域相邻的特征,并且像素值大小是相同的,则认为两个像素点是属于一个连通域。
[0039]
2)将r、g、b分量中颜色值{0,1,2,

,255}按顺序划分为64个范围,每个范围有4个颜色值,根据连通域定义找到每个颜色范围值的连通域图像,该图像中所有连通域均做区分标记。
[0040]
3)统计每个连通域图像的最大连通域的像素数cr1、第二大连通域的像素数cr2、所
有连通域的个数n
cr
和连通域的密度ρ
cr
,每个连通域图像得到4维统计特征。
[0041]
4)将r、g、b各分量中64个颜色范围值生成的连通域统计特征级联,可得到64*4*3=768维的连通域统计特征,该特征能够更好地反映出颜色的空间信息。
[0042]
进一步,所述步骤3具体包括:本专利使用加权串行特征融合算法来组合三个特征向量。首先将归一化后的smd-sift特征、mb-icslop特征和基于空间分布信息的连通域统计特征的特征向量分别定义为f1、f2和f3。通过f=[w1×
f1,w2×
f2,w3×
f3]
t
获得融合后的特征f,其中w1、w2和w3分别是f1、f2和f3的权重,通过改进的杂交育种算法进行优化。然后对加权特征进行串行融合,得到1174维特征,此时维数较大,分类速度较慢,选取pca进行降维以提高分类速度。
[0043]
上述步骤3中,改进的杂交育种算法在原算法的基础上做了两处改进,改进一是在原杂交操作中引入一个随机扰动因子α,该因子利用公式(10)产生随机值对杂交生成的个体进行轻微扰动,利用公式(11)产生新个体,进而提高个体的活跃性以及算法的局部寻优能力。
[0044]
α=[max-rand()*(max-min)]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(10)
[0045][0046]
其中,为不育系个体,为保持系个体,为不育系个体,r2、r3为[-1,1]中的随机数,且r2 r3≠0,α为随机扰动因子(max为所需随机值最大值,取值为2,min为所需随机值最小值,取值为-2,即α取值范围为-2,-1,0,1,2),[]表示取整,rand()取值范围为[0,1]。
[0047]
改进二是针对原自交操作算法寻优速度不高这一缺点,本专利根据公式(12)在算法优化前期设定较大的初始步长,但随着迭代次数的增加,搜索步长逐渐减小。从而因前期搜索范围较大,提高了算法的全局搜索能力,后期搜索步长较小,提高了算法的局部寻优精度。根据公式(13)自交产生新个体。
[0048][0049][0050]
其中,ic为当前迭代次数,c0为控制步长因子c的初始值,表示恢复系自交产生的新个体,为恢复系中随机选择的个体,x
best
为当前全局最优个体。
[0051]
进一步,所述步骤4具体包括:对猪个体图像进行分类训练时,首先对原始训练集进行按比例有放回的抽样,生成3个大小相同的训练子集训练基分类器。然后通过计算kappa值度量基分类器的差异性,当选择knn、svm和bayes这3种分类器时,差异性最大。最后通过加权投票法来识别猪个体的身份,即给每个基分类器赋予一个权重,通过改进的杂交育种算法进行优化,将基分类器识别出的相同结果加权求和,选择最大的结果作为猪个体的最终身份。
[0052]
上述步骤4中,按比例有放回的抽样是针对原bootstrap抽样技术有可能致使原训练集中某些训练数据始终未被抽取这一缺点提出的。假设原训练集有n个样本,需要生成m
个训练子集,每个子集需要n个训练样本,其中n》(n/m),具体步骤如下:1)将原训练集平均生成m份分配到每个训练子集中;2)子集中剩余的(n-n/m)个样本通过对原训练集(除去当前子集中平均分配到的训练样本)采取有放回的抽样获得,最后生成m个大小相同的训练子集。如此便能保证所有训练数据都能被抽到训练。
[0053]
例如本专利共选取9000张图像作为训练集,需要生成3个子训练集,每个子训练集有4500张图像,首先将训练集数据平均生成3份分给每个子训练集,每个子训练集有3000张图像,剩下的1500张图像采用对原训练集(除去当前子集中平均分配到的3000张图像,剩余6000张图像)采取有放回的抽样获得。
[0054]
本发明的有益效果
[0055]
(1)关键区域最近邻像素比较法选取关键区域相似度低的图像作为关键帧,保证训练数据的多样性。
[0056]
(2)利用基于阈值优化的分水岭算法对猪个体图像进行分割,提高了阈值搜索速度和精度,有效缓解了传统分水岭算法的过分割问题。
[0057]
(3)smd-sift算法在原sift算法的基础上,利用harris响应值和非极大值抑制算法进一步筛选稳定的关键点,以及在对关键点描述时增加了对角线方向上像素的灰度变化特征,提高了猪个体特征获取的精度。
[0058]
(4)多分块改进的中心对称局部八元模式算法通过对图像进行分块求取灰度均值减少了随机噪声、光照及边缘变化等造成的影响,对形成的均值块描述的纹理变化角度较全面,特征差异捕获地更细致,使得提取的特征更加精准,有利于猪个体的识别。
[0059]
(5)基于空间分布信息的连通域统计特征是通过级联单只猪图像所有分量中各颜色范围值构成连通域的4个统计特征生成的,该特征能够更好地反映出猪个体图像的颜色分布信息。
[0060]
(6)改进的杂交育种算法在原杂交操作中加入随机扰动因子来提高个体的活跃性以及算法的局部寻优能力;通过改进搜索步长提高算法的全局搜索能力以及局部寻优精度。
[0061]
(7)将bootstrap抽样方法改进为按比例有放回的抽样方法,避免原训练集中部分训练数据始终未被抽取训练。
[0062]
(8)基于改进杂交育种算法的加权集成分类器采取按比例有放回的抽样方式将训练集生成3个不同的训练子集,提高了模型的泛化性能。采用改进的杂交育种算法对分类器的权重进行优化,得到最优权重组合,最后通过加权投票法来识别猪个体的身份,提高了集成分类器的性能。
附图说明
[0063]
图1是本发明中mb-icslop特征提取示意图;
[0064]
图2是本发明中不同编码值对比图;
[0065]
图3是本发明中基于空间分布信息的连通域统计特征提取示意图;
具体实施方式
[0066]
下面结合附图和具体实施方式对本发明进行详细说明。
[0067]
步骤一,对群养猪俯视视频进行分帧处理,采用关键区域最近邻像素比较法选取关键帧,图像增强后利用基于阈值优化的分水岭算法进行猪个体分割,得到七张猪个体图像。
[0068]
具体方法如下:首先,采集7头猪的俯视视频进行分帧处理,利用关键区域最近邻像素比较法选取关键帧。关键区域最近邻像素比较法具体步骤如下:对群养猪视频进行分帧后,根据分帧顺序取出相邻的2帧图像,本专利主要针对饮水区域猪的身份识别,在2帧图像中选定相同饮水区域,计算该区域rgb三分量对应的像素差值和,如果该像素差值和小于设定阈值,则2帧图像相似性高,剔除后一帧图像,反之,保存后一帧图像,即将相似度低的图像作为关键帧。
[0069]
然后采用局部直方图均衡化来提高图像对比度,使用中值滤波去除引入的噪声;对增强后的图像先提取有效区域,利用基于阈值优化的分水岭算法进行分割,再经过形态学处理,计算各连通区域的面积,最后舍去面积小于阈值的连通区域,得到猪个体的分割图。其中,基于阈值优化的分水岭算法具体步骤是:
[0070]
步骤1,利用改进的果蝇优化算法搜索最优阈值进行分割,得到二值化图像;
[0071]
步骤1.1,初始化果蝇群体的初始位置(x,y),初始搜索步长为d,最大迭代次数t和种群规模n;
[0072]
步骤1.2,利用公式(1)得到自适应搜索步长d
l
,果蝇根据该距离和随机方向搜索食物,如公式(2)(3)所示;
[0073][0074]
xi=x d
l
*rand()
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0075]
yi=y d
l
*rand()
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0076]
其中,d为初始步长,t为当前迭代次数,i
max
为最大迭代次数,b为偏移量,xiyi为果蝇个体的坐标值;i为果蝇的数量;rand()为随机搜索方向。
[0077]
步骤1.3,根据果蝇个体的位置坐标计算味道浓度判定值,如式(4)所示;
[0078][0079]
步骤1.4,将式(5)作为味道浓度判定函数,计算每个果蝇的味道浓度值;
[0080][0081]
其中,f(s,t)为浓度适应度值,为图像的二维信息总熵,o(s,t)为图像的二维类间方差值,si为味道浓度判定值,i为当前寻优次数,ω为权重值,r为系数。
[0082]
步骤1.5,更新并记录最佳味道浓度值和最优果蝇个体的坐标,继续迭代;
[0083]
步骤1.6,根据最终最优果蝇个体的坐标求得最优阈值,进行二值分割。
[0084]
步骤2,通过形态学运算和距离变换得到背景和前景区域;
[0085]
步骤3,标记背景与前景区域相交的部分;
[0086]
步骤4,采用分水岭算法进行二次分割,得到最终分割结果。
[0087]
根据上述步骤得到单只猪个体的分割图,然后对这分割图进行特征提取。步骤二,分别对七张猪个体图像,采用稀疏点多方向描述的尺度不变特征变换算法提取猪个体的局部特征,多分块改进的中心对称局部八元模式算法提取猪个体的纹理特征,基于空间分布
信息的连通域统计算法提取猪个体的颜色区域块特征。
[0088]
具体方法如下:第一个提取的是smd-sift特征,具体步骤如下:
[0089]
使用原始sift特征方法提取猪个体图像中的所有关键点。其次为了扩大关键点的稀疏度,使关键点分布得更均匀,本专利设定一个3*3的抑制区域,根据公式(6)计算该区域内所有关键点的harris响应值rm,剔除响应值小于设定阈值的关键点,保留最稳定的关键点。
[0090][0091]
其中,m为协方差矩阵,p为图像块,i
x
为关键点沿x方向的梯度值,iy为关键点沿y方向的梯度值,rm为harris响应值,trace为求矩阵的迹,k为系数,取值0.5。
[0092]
然后根据原sift算法寻找关键点的主方向,以保证特征的旋转不变性。
[0093]
原sift特征描述子只考虑了像素水平和垂直方向的灰度变化,步骤如下:
[0094]
1)计算像素(x,y)垂直方向和水平方向的梯度,如公式(7)所示。
[0095]gx
(x,y)=i(x-1,y)-i(x 1,y),gy(x,y)=i(x,y 1)-i(x,y-1)
ꢀꢀꢀꢀꢀꢀ
(7)
[0096]
其中,g
x
(x,y)、gy(x,y)分别代表像素(x,y)垂直方向的梯度和水平方向的梯度。
[0097]
计算梯度幅值m(x,y)和方向值θ(x,y),如公式(8)所示。
[0098][0099]
然后将4
×
4个窗口内的像素进行8个方向的直方图统计,可以形成一个128的特征向量。
[0100]
2)改进后的sift算法加入了相邻对角线的灰度变化特征,提高了特征获取的精度。根据公式(9)计算像素(x,y)两条对角线方向的梯度。
[0101]gx
(x,y)=i(x 1,y 1)-i(x-1,y-1),gy(x,y)=i(x-1,y 1)-i(x 1,y-1)
ꢀꢀꢀ
(9)
[0102]
其中,g
x
(x,y)、gy(x,y)分别代表像素(x,y)两条对角线方向的梯度。
[0103]
根据公式(8)计算对角线方向的梯度幅值m(x,y)和方向值θ(x,y)。
[0104]
然后将4
×
4个窗口内的像素进行8个方向的直方图统计,形成一个128的特征向量。
[0105]
3)最后将原始sift特征向量和通过对角线元素计算得到的特征向量进行串联,最终得到关键点的256维描述子,提高了特征获取的精度。
[0106]
第二个提取的是mb-icslop特征,具体步骤如下:
[0107]
滑动9*9的窗口提取特征,将窗口均分成9个大小为3*3像素的子窗口;首先计算每个子窗口的平均值,得到大小为3*3像素的均值图像块,然后对均值图像块进行icslop编码计算,最终生成mb-icslop特征。如附图说明中的图1所示。
[0108]
mb-icslop在比较中心像素与相邻像素的灰度值的基础上,采用两位二进制编码,增加了邻域像素之间的灰度值对比,还采用三位二进制编码,增加了四个梯度方向上中心对称像素点的灰度值对比。如附图说明中的图2所示,与lbp、cslop编码相比,分块取均值后生成的icslop编码能捕捉到变化较小的纹理特征,使得提取的特征更加精准,有利于猪个体的识别。具体如公式(10)-(13)所示。
[0109][0110]
其中,s(i)=ν(f(p
2i-p
2i 1
),f(p
2i 1-p
2i 2
))2iꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(11)
[0111]
t(i)=μ(f(p
i-pc),f(p
i 4-pc),f(p
i-p
i 4
))2iꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(12)
[0112][0113]
其中,bm-icslop(c)为当前像素c的bm-icslop编码值,s(i)为邻域像素值比较的编码值,t(i)为对角线像素值比较的编码值,ν(a,b)表示两位二进制编码值,μ(a,b,c)表示三位二进制编码值,f(x)为像素比较函数,pi为邻域像素值,pc为中心像素值;
[0114]
在特征提取过程中,一个mb-icslop算子在9*9像素的窗口下能产生150种模式,因此单只猪图像可提取150维mb-icslop特征,降低特征维数的同时不会缺失细节信息。
[0115]
第三个提取的是基于空间分布信息的连通域统计特征,具体步骤如下:
[0116]
在rgb颜色空间中,将r、g、b各分量中颜色值{0,1,2,

,255}按顺序划分为64个范围,每个范围有4个颜色值。在本专利中,若两个像素点之间符合八邻域相邻的特征,并且像素值大小是相同的,则认为两个像素点是属于一个连通区域。根据连通域定义找到每个颜色范围值的连通域图像,该图像中所有连通域做区分标记,像素未在连通域内均置0。如附图说明中的图3所示。利用opencv中connectedcomponentswithstats函数计算连通区域的面积和个数,统计得到最大连通域的像素数cr1、第二大连通域的像素数cr2、所有连通域的个数n
cr
和连通域的密度(s
cr
表示s分量中每个颜色范围值的像素总和),即可得s分量中各颜色范围值图像的颜色连通域统计特征为{cr1,cr2,n
cr

cr
}。最后计算单只猪图像的所有分量中各颜色范围值构成的4个连通域统计特征,级联生成64*4*3=768维基于空间分布信息的连通域统计特征。
[0117]
步骤三,对上述提取的三种特征分别进行归一化后,给每个特征赋予一个权重,并采用改进的杂交育种算法进行优化,然后对加权特征进行串行融合,最后采用pca进行降维。
[0118]
具体方法如下:根据步骤三提取上述三种特征后,本专利采用加权串行特征融合算法来融合三个特征向量。将归一化后的smd-sift特征、mb-icslop特征和基于空间分布信息的连通域统计特征的特征向量分别定义为f1、f2和f3,融合后的特征f可以通过f=[w1×
f1,w2×
f2,w3×
f3]
t
来获得,其中w1、w2和w3分别是f1、f2和f3的权重,其值通过改进的杂交育种算法进行优化,然后对加权特征进行串行融合,融合后的特征具有良好的分类精度。对于融合后的特征,特征维数为1174(256 150 768)维,不利于后续分类器的分类性能和分类速度的提高,所以需要对融合后的特征进行简化。pca是一种非常成熟的特征提取和降维方法,它的主要思想是将n维特征映射到k维上(k《n)。为了确定降维后的最优维数,对100、120、140、160、180、200六种不同的维数识别结果进行了比较。通过比较不同维数的识别准确性,当融合特征降到180维时,猪只识别的准确率最高。
[0119]
上述步骤三中,改进杂交育种算法的具体步骤如下:
[0120]
步骤1,初始化种群,包括种群个数n、最大迭代次数i
max
、最大自交次数t
max
,种群个体初始化如公式(14)所示;
[0121]
xi=x
min
r1·
(x
max-x
min
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(14)
[0122]
其中,xi表示种群中第i个个体,x
max
、x
min
分别为x的上、下限值,r1、r4为[0,1]中随机数。
[0123]
步骤2,根据种群中个体的适应度值从高到低进行排序,保持系为顺序1到n/3的个体,恢复系为n/3 1至2n/3的个体,不育系为2n/3 1至n的个体,存储当前适应度值最高的个体;
[0124]
步骤3,保持系p与不育系q通过杂交操作产生新的个体,如式(16)所示;
[0125]
α=[max-rand()*(max-min)]
ꢀꢀꢀꢀꢀꢀꢀ
(15)
[0126][0127]
其中,为不育系个体,为保持系个体,为不育系个体,r2、r3为[-1,1]中的随机数,且r2 r3≠0,α为随机扰动因子(max为所需随机值最大值,取值为2,min为所需随机值最小值,取值为-2,即α取值范围为-2,-1,0,1,2),[]表示取整,rand()取值范围为[0,1]。
[0128]
步骤4,计算新个体的适应度值,若大于原个体的适应度值,则替换,否则保留原个体;
[0129]
步骤5,若自交次数《t
max
,恢复系个体进行自交操作生成新的恢复系个体,如公式(18)所示,否则按公式(14)执行重置操作,若新个体适应度值大于原个体适应度值,则替换;
[0130][0131][0132]
其中,ic为当前迭代次数,c0为控制步长因子c的初始值,表示恢复系自交产生的新个体,为恢复系中随机选择的个体,x
best
为当前全局最优个体。
[0133]
步骤6,若迭代次数《i
max
,执行步骤2;若迭代次数》=i
max
,则输出全局最优个体。
[0134]
步骤四,采用基于改进杂交育种算法的加权集成分类器对猪个体图像进行分类训练。
[0135]
具体方法如下:对猪个体图像进行分类训练时,首先对原始训练集进行按比例有放回的抽样,本专利从原始训练集中随机抽取3个相同大小的训练子集进行训练基分类器,这样使得不同的基分类器选用的训练集样本均不相同,进一步增加了基分类器训练时的差异性,从而提高了分类器的泛化性能。
[0136]
其中,按比例有放回的抽样是针对原bootstrap抽样技术有可能致使原训练集中有的训练数据始终未被抽取这一缺点提出的。假设原训练集有n个样本,需要生成m个训练子集,每个子集需要n个训练样本,其中n》(n/m),具体步骤如下:步骤1,将原训练集平均生成m份分配到每个训练子集中;步骤2,子集中剩余的(n-n/m)个样本通过对原训练集(除去当前子集中平均分配到的训练样本)采取有放回的抽样获得,最后生成m个相同大小的训练子集。例如本专利共选取9000张图像作为训练集,需要生成3个子训练集,每个子训练集有
4500张图像,首先将训练集平均生成3份数据分给每个子训练集,每个子训练集有3000张图像,剩下的1500张图像采用对原训练集(除去当前子集中平均分配到的3000张图像,剩余6000张图像)采取有放回的抽样获得。
[0137]
然后采用kappa值对基分类器进行差异性度量。kappa值越大,分类器的相关性越小,集成效果越明显。根据kappa值分析,当选择knn、svm和bayes这3种分类器时,差异性最大。最后通过加权投票法来识别猪个体,即给每个基分类器赋予一个权重,将基分类器识别出的相同结果加权求和,选择最大的结果作为猪个体的最终身份。对测试样本x最后的判定函数如公式(19)所示。
[0138][0139]
其中,c
x
为样本x的判定值,d为基分类器个数,t
ji
为第i个基分类器将样本x分到第j类的值,wi为第i个基分类器的权重,其值是通过改进的杂交育种算法进行优化。
[0140]
以上实例仅为本发明的举例论证,来具体说明本发明的可行性,但不仅仅限于此。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献