一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于深度残差收缩网络的犬鼻纹识别方法和模型

2022-05-18 10:29:26 来源:中国专利 TAG:


1.本发明涉及图像识别的技术领域,特别是涉及一种基于深度残差收缩网络的犬鼻纹识别方法和模型。


背景技术:

2.近年来,我国经济水平飞速发展,人们的生活水平也在不断提高,同时,人口老龄化问题日益严重,这使得人们对精神生活的需求愈发强烈,拥有宠物伴侣的人数也在迅速增长。宠物伴侣中,犬类是很好的选择,而犬类由于其贪玩好动的性格,非常容易意外走失。另一方面,我国城市的犬只管理面临严峻的形势,如未注册犬和流浪犬不断增加、恶性犬伤人事件时间时有发生等。因此,犬个体识别技术对于加强城市犬只管理都尤为重要,而传统的非生物识别方法,例如宠物项圈和宠物铭牌容易磨损、丢失,并且可以被轻易摘下;芯片植入会给宠物生理和心理带来伤害;dna认证操作繁琐成本耗费高。而犬类鼻纹和人类的指纹相似,是它们独一无二的身份证。如果能够构建一个犬鼻纹数据库,就能将未知犬只的犬鼻纹图像在犬鼻纹数据库中进行匹配识别,获得到该犬只的身份。因此,犬鼻纹识别研究在工程和社会应用中有着极高的价值。
3.犬鼻纹识别技术是通过对比犬鼻纹图像特征之间的相似性来确定犬的身份,其核心步骤是使用模式识别、图像处理等方法对犬的鼻纹特征进行描述、匹配和分类,从而实现自动的犬个体认证。目前犬鼻纹识别的方法主要是特征工程加图像匹配的小样本机器学习算法,其缺点在于特征构建需要花费大量的人力和时间观察数据,思考潜在形式和数据结构,非常受限于设计的算法,需要一定的经验,并且特征提取和分类是两个分开的过程,不能将其融合到一个end-to-end的模型中。
4.请参阅图1,其为现有技术中的一种狗鼻纹特征点的检测方法的示例图。该检测方法包括步骤:基于狗鼻图像与已经训练好的狗鼻纹模型,得到狗鼻图像中狗鼻纹特征点与对应的各个狗鼻纹基准特征点的坐标偏差;根据各个狗鼻纹基准特征点的坐标及坐标偏差得到狗鼻图像中各个狗鼻纹特征点的坐标。该检测方法需要花费大量人力和时间从大量犬鼻纹图像中获取基准特征点的坐标,而且只能检测到待测犬鼻纹图像中的特征点的准确坐标,并没法对待测图像进行分类。
5.此外,犬类鼻纹纹理细密,差异很小,鼻纹图像上非常细微的噪声仍然会对鼻纹识别准确率产生很大的影响,因此,如何提高犬鼻纹识别的准确率仍然是一大难题。


技术实现要素:

6.基于此,本发明的目的在于,提供一种基于深度残差收缩网络的犬鼻纹识别方法、装置、系统和存储介质,同时实现了犬鼻纹特征提取和分类识别的功能,减少犬鼻纹特征提取过程中人力和时间的消耗,降低了图像噪声对犬鼻纹识别的影响,显著提高了犬鼻纹识别的准确率,有利于实际工程开发研究。
7.本发明通过如下技术方案进行实现的:
8.第一方面,本发明提供了一种基于深度残差收缩网络的犬鼻纹识别方法,包括步骤:s10:构建深度残差收缩网络模型;其中,所述深度残差收缩网络模型执行步骤:
9.s11:对输入的所述犬鼻纹图像进行图像预处理,获得原始特征向量;
10.s12:对所述原始特征向量进行特征提取和噪声滤除,获得分类特征向量;
11.s13:判断分类特征向量的计算次数是否达到预设循环次数,若否,则将当前的分类特征向量作为原始特征向量,返回步骤s12,若是,执行步骤s14;
12.s14:根据所述分类特征向量进行打分预测,输出识别结果;
13.s20:输入构建的犬鼻纹数据集的犬鼻纹图像,将所述深度残差收缩网络模型训练至收敛,获得训练后的深度残差收缩网络模型;
14.s30:将待识别的犬鼻纹图像输入训练后的深度残差收缩网络模型,输出识别结果。
15.本发明所述的基于深度残差收缩网络的犬鼻纹识别方法,通过一个端对端的深度残差收缩网络模型,有效滤除犬鼻纹图像中的冗余噪声,并保留重要的犬鼻纹特征,提高了犬鼻纹识别的准确率,具有简单易行、投入成本低、识别精度高的优点。
16.进一步地,步骤s12具体为:
17.对所述原始特征向量进行特征提取,获得第一特征向量;然后通过注意力机制对所述第一特征向量进行处理,获得自适应阈值;再根据所述自适应阈值,对所述第一特征向量进行软阈值化处理,获得第二特征向量;最后根据所述原始特征向量和所述第二特征向量进行残差计算,获得所述分类特征向量。
18.进一步地,所述自适应阈值的获取过程为:计算所述第一特征向量的绝对值,然后经过全局均值池化获得中间特征向量;通过全连接网络对所述中间特征向量进行计算,获得一个自适应系数;根据所述自适应系数和所述中间特征向量,计算得到所述自适应阈值;
19.所述自适应阈值的计算公式为:
20.τ=α
×
a(2)
21.式中,τ表示所述自适应阈值,α表示所述自适应系数,a表示所述中间特征向量,其中,α∈[0,1]。
[0022]
进一步地,所述第二特征向量的获取过程为:将绝对值小于等于所述自适应阈值的所述第一特征向量直接赋值为零,将绝对值大于所述自适应阈值的所述第一特征向量朝着零的方向进行收缩;
[0023]
所述第二特征向量的计算公式为:
[0024][0025]
式中,f'(x)表示所述第二特征向量,f(x)表示所述第一特征向量,x表示所述原始特征向量。
[0026]
进一步地,所述原始特征向量经过至少一个卷积组的特征提取,获得所述第一特征向量;
[0027]
所述分类特征向量的获取方式为:将所述原始特征向量经过快捷连接添加到所述第二分类特征向量;
[0028]
所述分类特征向量的计算公式为:
[0029]
h(x)=f'(x) x(4)
[0030]
式中,h(x)表示所述分类特征向量。
[0031]
进一步地,所述预设循环次数为8,所述卷积组的个数为2。
[0032]
进一步地,步骤s20具体为:
[0033]
将所述犬鼻纹数据集中的犬鼻纹图像按9:1的比例随机划分为训练集和测试集,将所述训练集中的犬鼻纹图像随机分为多个batch;
[0034]
初始化所述深度残差收缩网络模型的网络参数,按batch将所述训练集中的犬鼻纹图像输入所述深度残差收缩网络模型进行训练,通过sgd算法优化所述深度残差收缩网络模型的网络参数;训练过程中采用softmaxloss损失函数进行损失计算;
[0035]
每次迭代后,输入所述测试集中的犬鼻纹图像对所述深度残差收缩网络模型的性能进行测试;
[0036]
重复多个迭代直至所述深度残差收缩网络模型达到收敛状态,获得训练后的深度残差收缩网络模型。
[0037]
第二方面,本发明提供了一种基于深度残差收缩网络的犬鼻纹识别装置,所述犬鼻纹识别模型根据下述步骤构建:
[0038]
s10:构建深度残差收缩网络模型;其中,所述深度残差收缩网络模型执行步骤:
[0039]
s11:对输入的所述犬鼻纹图像进行图像预处理,获得原始特征向量;
[0040]
s12:对所述原始特征向量进行特征提取和噪声滤除,获得分类特征向量;
[0041]
s13:判断分类特征向量的计算次数是否达到预设循环次数,若否,则将当前的分类特征向量作为原始特征向量,返回步骤s12,若是,执行步骤s14;
[0042]
s14:根据所述分类特征向量进行打分预测,输出识别结果;
[0043]
s20:输入构建的犬鼻纹数据集的犬鼻纹图像将所述深度残差收缩网络模型训练至收敛,获得训练后的深度残差收缩网络模型。
[0044]
第三方面,本发明提供了一种基于深度残差收缩网络的犬鼻纹识别装置,包括:
[0045]
犬鼻纹数据集,存储有大量犬鼻纹图像;
[0046]
训练后的深度残差收缩网络模型,包括图像预处理模块、至少一个残差收缩模块和分类识别模块;所述图像预处理模块用于对所述犬鼻纹图像进行图像预处理,输出原始特征向量;所述残差收缩模块包括残差单元、注意力机制单元和软阈值化单元;所述残差单元用于对所述原始特征向量进行特征提取,获得第一特征向量;所述注意力机制模块用于根据所述第一特征向量计算获得自适应阈值;所述软阈值化单元用于根据所述自适应阈值对所述第一特征向量进行软阈值化处理,获得第二特征向量;所述残差单元还用于对所述第二特征向量进行残差计算,获得分类特征向量;所述分类识别模块用于根据所述分类特征向量进行打分预测,输出识别结果。
[0047]
第四方面,本发明提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,其特征在于:
[0048]
所述计算机程序被计算机执行时实现权利要求1至7中任一项所述方法的步骤。
[0049]
与现有技术相比,本发明提供的一种基于深度残差收缩网络的犬鼻纹识别方法、装置、系统和存储介质,通过一个端对端的深度残差收缩网络模型,同时实现了犬鼻纹图像
的特征提取和分类识别的功能,有效降低了图像噪声对犬鼻纹识别的影响,大大提高了犬鼻纹识别的准确率,具有简单易行、投入成本低、识别精度高的优点。
[0050]
为了更好地理解和实施,下面结合附图详细说明本发明。
附图说明
[0051]
图1为现有技术中一种狗鼻纹特征点的检测方法的示例图;
[0052]
图2为本发明一实施例提供的一种基于深度残差收缩网络(drsn)的犬鼻纹识别方法的步骤流程图;
[0053]
图3为本发明一实施例提供的drsn模型的网络架构图;
[0054]
图4为本发明一实施例提供的残差收缩模块的结构示意图;
[0055]
图5为本发明一实施例提供的残差单元的结构示意图;
[0056]
图6为本发明一实施例提供的犬鼻纹原始图像和犬鼻纹图像;
[0057]
图7为本发明一实施例提供的犬鼻纹图像输入drsn模型后的张量变化示意图;
[0058]
图8为本发明一实施例提供的drsn模型在100次迭代过程中识别准确率和损失曲线的变化图;
[0059]
图9为本发明一实施例提供的drsn模型第66次迭代时的测试结果图;
[0060]
图10为本发明一实施例提供的drsn模型第66次迭代时的混淆矩阵图。
具体实施方式
[0061]
现有技术中犬鼻纹识别方法在特征提取需要花费大量的人力和时间,并且特征提取和分类是两个分开的过程,过程较为繁琐复杂,并且由于犬鼻纹纹路细腻,图像噪声对识别准确率影响很大。所以本发明基于深度残差收缩网络(deep residual shrinkage networks,drsn),提出一种简单易行的犬鼻纹识别方法,同时实现犬鼻纹特征提取和分类识别的功能,并有效滤除冗余噪声,保留了关键的鼻纹特征,提高识别准确率。以下通过一具体实施例进行说明:
[0062]
请参阅图2,其为本实施例提供的一种基于drsn的犬鼻纹识别方法的步骤流程图。该基于drsn的犬鼻纹识别方法包括如下步骤:
[0063]
s10:构建深度残差收缩网络(drsn)模型;
[0064]
s20:输入构建的犬鼻纹数据集中的犬鼻纹图像,将drsn模型训练至收敛,获得训练后的drsn模型;
[0065]
s30:将待识别的犬鼻纹图像输入训练后的drsn模型,得到识别结果。
[0066]
具体的,步骤s10所构建的drsn模型执行步骤:
[0067]
s11:对输入的所述犬鼻纹图像进行图像预处理,获得原始特征向量;
[0068]
s12:对所述原始特征向量进行特征提取和噪声滤除,获得分类特征向量;
[0069]
s13:判断分类特征向量的计算次数是否达到预设循环次数,若否,则将当前的分类特征向量作为原始特征向量,返回步骤s12,若是,执行步骤s14;
[0070]
s14:根据所述分类特征向量进行打分预测,输出识别结果;
[0071]
在步骤s11中,图像预处理过程为:犬鼻纹图像经过一个卷积层和一个最大池化层,提取得到原始特征向量;该卷积层的卷积核的尺寸为(7
×
7),数量为64,移动步长设置
为2;最大池化层的步长也设置为2。
[0072]
步骤s12具体为:
[0073]
对原始特征向量进行特征提取,获得第一特征向量;然后通过注意力机制对第一特征向量进行处理,获得自适应阈值;再根据自适应阈值,对第一特征向量进行软阈值化处理,获得第二特征向量;最后根据原始特征向量和第二特征向量进行残差计算,获得分类特征向量。
[0074]
原始特征向量经过至少一个卷积组的特征提取,获得第一特征向量;该卷积组包括一个卷积层、一个批量归一化(batchnormalization,bn)层和一个relu函数层;卷积层的卷积核尺寸为(3
×
3),卷积核的数量至少为64,步长至少设置为1。
[0075]
将卷积组对原始特征向量的处理过程定义为:
[0076]
f(x)=f(x,{wi})(1)
[0077]
式中,f(x)表示第一特征向量,x表示原始特征向量,f()表示残差映射函数,{wi}表示残差映射函数对应的权值。
[0078]
自适应阈值的获取过程为:计算第一特征向量的绝对值,然后经过全局均值池化(globalaveragepooling,gap)获得中间特征向量;通过全连接网络(fullyconnected,fc)对中间特征向量进行计算,获得一个自适应系数;根据自适应系数和中间特征向量,计算得到自适应阈值,其计算公式为:
[0079]
τ=α
×
a(2)
[0080]
式中,τ表示自适应阈值,α表示自适应系数,a表示中间特征向量;其中,α∈[0,1]。
[0081]
其中,fc网络依次叠加了fc层、bn层、relu函数层、fc层和sigmoid函数层。sigmoid函数将fc网络的输出结果归一到0和1之间,而中间特征向量也为正值,保证了最终获得的自适应阈值为正值,且数值不会太大。通过注意力机制的处理,每个犬鼻纹图像均能获取一个独立的自适应阈值,换言之,任意的两个犬鼻纹图像,它们的自适应阈值都不相同,这样有助于犬鼻纹识别过程中发现关键的特征信息,并减少噪声或冗余信息的影响,提高识别准确度。
[0082]
第二特征向量的获取过程为:将绝对值小于等于自适应阈值的第一特征向量直接赋值为零,将绝对值大于自适应阈值的第一特征向量朝着零的方向进行收缩,其计算公式为:
[0083][0084]
式中,f'(x)表示第二分类向量。
[0085]
通过注意力机制和软阈值化的协同作用,可以直接滤除犬鼻纹图像中的冗余特征,并保留住关键的特征信息,显著提升了纹路细腻、噪声较多的犬鼻纹图像的识别准确度。另外,软阈值化也能够减小深度学习算法遭遇梯度弥散和梯度爆炸的风险。
[0086]
分类特征向量的获取方式为:将原始特征向量经过快捷连接(shortcut)添加到二分类特征向量中,其计算公式为:
[0087]
h(x)=f'(x) x(4)
[0088]
式中,h(x)表示所述分类特征向量。
[0089]
在步骤s13中,先设定好一个预设循环次数,再判断分类特征向量的计算次数是否达到预设循环次数;在本实施例中,预设循环次数为8,在其他实施例中,也可以根据犬鼻纹数据库和训练方法的实际需求,调整预设循环次数。
[0090]
步骤s20具体为:
[0091]
构建犬鼻纹数据集;收集犬鼻纹原始图像,对犬鼻纹原始图像进行数据预处理,获得犬鼻纹图像,并将犬鼻纹图像保存至犬鼻纹数据集。
[0092]
其中,犬鼻纹原始图像是通过人工方式进行收集的:前往宠物店、宠物医院和其他公共场所,利用手机和相机等移动摄像设备,在光线充足的情况下拍摄犬只的正面图像,获得犬鼻纹原始图像。由于犬鼻纹的纹路细腻,存在一定的噪声,拍摄时需要环境光线充足,例如在室外阳光下或室内高强度灯光下拍摄;拍摄犬只的正面图像时,应使鼻部正对镜头,便于后续裁剪出鼻纹区域;另外,收集犬鼻纹原始图像时,还需记录犬只名字,每个名字作为一个类别,构成犬鼻纹原始图像的真实标签。在其他实施例中,还可以在公共数据集中收集犬鼻纹原始图像。
[0093]
犬鼻纹原始图像的数据预处理包括人工裁剪、图像增强技术和大小调整;将收集的犬鼻纹原始图像人工裁剪出犬鼻纹区域,再通过翻转、旋转、平移、缩放等图像增强技术进行图像扩充,最后将所有图像的大小调整成同一像素尺寸,获得犬鼻纹图像。将数据预处理后获得的犬鼻纹图像保存至犬鼻纹数据集,并按照犬鼻纹原始图像的真实标签做好标注。
[0094]
输入犬鼻纹数据集的犬鼻纹图像,将drsn模型训练至收敛,获得训练后的drsn模型,其训练过程如下:
[0095]
将犬鼻纹数据集中的犬鼻纹图像按9:1的比例随机划分成训练集和测试集,将训练集中的犬鼻纹图像随机分为多个批次;其中,每个批次的批大小为k,k为正整数;
[0096]
初始化drsn模型的网络参数,按批次将训练集中的犬鼻纹图像输入drsn模型进行训练,通过随机梯度下降(stochastic gradient descent,sgd)算法优化drsn模型的网络参数;训练过程中采用softmax loss损失函数进行损失计算,其计算公式为:式中,n表示总类别数,表示第i个类别,yi表示犬鼻纹图像的真实标签,zi表示犬鼻纹图像的分类特征向量的第i个值(或预测标签、识别结果),p(zi)表示犬鼻纹图像属于第i个类别的预测值;
[0097]
每次迭代后,输入测试集中的犬鼻纹图像对drsn模型的性能进行测试,重复多个迭代直至drsn模型达到收敛状态;每遍历一次训练集中的犬鼻纹图像,称为一次迭代(epoch),重复多个迭代后,drsn模型的性能不再提高,即训练至收敛。
[0098]
在步骤s30中,将待识别的犬鼻纹图像输入训练后的drsn模型,获得识别结果,就可以获得对应犬只的预测标签。
[0099]
本实施例还提供了一种基于深度残差收缩网络的犬鼻纹识别模型,该模型根据步骤s10和s20构建。
[0100]
本实施例还提供了一种基于深度残差收缩网络的犬鼻纹识别装置,该装置包括一个犬鼻纹数据集和一个训练后的drsn模型。其中,犬鼻纹数据集存储有大量犬鼻纹图像。
[0101]
请参阅图3,其为本实施例提供的drsn模型的网络架构图。该drsn模型包括图像预
处理模块、至少1个残差收缩模块(逐通道不同阈值的残差收缩模块,residual shrinkage building unit with channel-wise thresholds,rsbu-cw)和分类识别模块。
[0102]
图像预处理模块将输入的犬鼻纹图像进行图像预处理,获得原始特征向量。其中,图像预处理模块包括一个卷积层和一个最大池化层;该卷积层的卷积核的尺寸为(7
×
7),数量为64,移动步长设置为2;最大池化层的步长也设置为2。
[0103]
请参阅图4,其为本实施例提供的残差收缩模块的结构示意图。残差收缩模块包括残差单元、注意力机制单元和软阈值化单元。残差单元对原始特征向量进行特征提取,获得第一特征向量。注意力机制单元根据第一特征向量计算获得一个自适应阈值。软阈值化单元根据自适应阈值滤除第一特征向量的冗余特征,提取得到第二特征向量。残差单元还将原始特征向量按照快捷连接添加到第二特征向量中,计算获得分类特征向量。
[0104]
当残差收缩模块的数量为多个时,则从第2个残差收缩模块起,将前一个残差收缩模块输出的分类特征向量作为输入的原始特征向量,而最后一个残差收缩模块计算的分类特征向量直接输入至分类识别模块。
[0105]
请参阅图5,其为本实施例提供的残差单元的结构示意图,图中并未画出注意力机制单元和软阈值化单元。残差单元包括至少一个卷积组和第一输出层。残差单元接收原始特征向量后,一方面直接传输至卷积组,另一方面通过快捷连接传输至第一输出层。卷积组对原始特征向量进行处理,提取得到第一特征向量,并将之分别输入注意力机制单元和软阈值化单元;第一输出层对输入的原始特征向量和第二特征向量进行相加计算,获得分类特征向量。
[0106]
请参阅图4中右侧的虚线框,其为本实施例提供的注意力机制单元的结构示意图。该注意力机制单元包括绝对值层、gap层、fc网络和第二输出层。将第一特征向量传输至注意力机制单元后,先通过绝对值层求得第一特征向量的绝对值,然后经过gap层处理获得中间特征向量,最后将中间特征向量分别输入fc网络和第二输出层。fc网络依次叠加了fc层、bn层、relu函数层、fc层和sigmoid函数层,对中间特征向量进行处理得到一个自适应系数,并将自适应系数输入第二输出层。第二输出层对输入的中间特征向量和自适应系数进行相乘计算,获得自适应阈值,并将该自适应阈值输入软阈值化单元。
[0107]
软阈值化单元接收到自适应阈值和第一特征向量后,将第一特征向量中绝对值小于等于自适应阈值的冗余特征直接赋值为零,将绝对值大于自适应阈值的其他特征朝着零的方向进行收缩。
[0108]
通过至少一个残差收缩模块,计算获得分类特征向量后,将分类特征向量输入分类识别模块。分类识别模块根据输入的分类特征向量进行打分预测,将分类特征向量中预测值最大的值作为识别结果。其中,分类识别模块包括平均池化层和fc层。
[0109]
本实施例还提供了一种基于深度残差收缩网络的犬鼻纹识别系统,包括存储器,处理器,以及存储在所述存储器上、且在所述处理器上运行的计算机程序,其特征在于:
[0110]
所述处理器执行所述计算机程序时实现上述犬鼻纹识别方法的步骤。
[0111]
本实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,其特征在于:所述计算机程序被计算机执行时实现上述犬鼻纹识别方法的步骤。
[0112]
以下提供一个具体的应用情形:
[0113]
请参阅图6,其为本实施例提供的犬鼻纹原始图像和犬鼻纹图像。在本实施例中,
先通过人工采集的方式收集了87只犬只的犬鼻纹原始图像,经过数据预处理获得870张犬鼻纹图像,即犬鼻纹数据集含有870张犬鼻纹图像;按照9:1的划分比例,随机选取犬鼻纹数据集中的783张犬鼻纹图像为训练集,其余的87张犬鼻纹图像为测试集。
[0114]
在图6的例子中,a1、b1和c1均为犬鼻纹原始图像;a1经过裁剪、随机角度旋转和大小调整后获得犬鼻纹图像a2、a3和a4;b1经过裁剪、翻转、随机角度旋转和大小调整后获得犬鼻纹图像b2、b3和b4;c1经过裁剪、随机角度旋转和大小调整后获得犬鼻纹图像c2、c3和c4;犬鼻纹图像可以用一个长度
×
宽度
×
通道数(即h
×w×
c)的张量来表示,则图6所示的犬鼻纹图像的张量均为48
×
48
×
3。
[0115]
接着,构建drsn模型。在本实施例中,该drsn模型包括图像预处理模块、8个残差收缩模块和分类识别模块。前7个残差收缩模块输出的分类特征向量作为下一个残差收缩模块输入的原始特征向量,最后1个残差收缩模块输出的分类特征向量直接输入分类识别模块。每个残差收缩模块中,残差单元均包括两个卷积组,每个卷积组均包括一个卷积层。
[0116]
请参阅图7,其为本实施例提供的犬鼻纹图像输入drsn模型后的张量变化示意图。将卷积核的结构用(尺寸,数量,/步长)表示,步长为1时省略不写,则8个残差收缩模块中的卷积层对应的卷积核结构分别为:(3
×
3,64),(3
×
3,64),(3
×
3,64),(3
×
3,64),(3
×
3,128,/2),(3
×
3,128),(3
×
3,128),(3
×
3,128),(3
×
3,256,/2),(3
×
3,256),(3
×
3,256),(3
×
3,256),(3
×
3,517,/2),(3
×
3,517),(3
×
3,517),(3
×
3,517)。将张量为48
×
48
×
3的犬鼻纹图像输入drsn模型,经过图像预处理模块处理后输出张量为12
×
12
×
64的原始特征向量;将原始特征向量依次输入8个残差收缩模块进行处理,获得张量为2
×2×
512的分类特征向量;最后将分类特征向量输入分类识别模块,对分类特征向量进行打分预测,将分类特征向量中预测值最高的值输出作为识别结果。在图7的例子中,512表示分类特征向量的通道数,87表示分类特征向量有87个数值(对应前文的87只犬只)。
[0117]
在本实施例中,通过pytorch上实现了上述drsn模型。模型构建在intel(r)core(tm)i5-6300hq cpu@2.30ghz和8.0gb ram的笔记本电脑上进行,并使用nvidiartx 960gpu进行学习的。模型的训练采用sgd算法优化drsn模型的网络参数;其中,sgd算法的权值衰减设置为0.0001,初始学习率为0.03。训练过程一共经历100个迭代,每次迭代中的批大小为256。
[0118]
请参阅图8~10,图8为本实施例提供的drsn模型在100次迭代过程中识别准确率和损失曲线的变化图,图9为本实施例提供的drsn模型第66次迭代时的测试结果图,图10为本实施例提供的drsn模型第66次迭代时的混淆矩阵图。由图8可知,drsn模型在进行训练时能快速达到拟合状态,并在训练初期就有较高的识别准确率和较低损失。由图9可知,第66次迭代后,输入测试集中的犬鼻纹图像对模型性能进行测试,其识别准确率就能达到98.85%,87张犬鼻纹图像中仅有一张识别错误。由图10可知,混淆矩阵的对角线十分明显,即drsn模型输出的识别结果(预测标签)和真实标签能够成功匹配。这说明基于drsn的犬鼻纹识别方法能够在犬鼻纹图像识别过程中滤除冗余噪声,注意到重要特征,从而提高识别准确率和训练速度。
[0119]
与现有技术相比,本发明提供的一种基于深度残差收缩网络的犬鼻纹识别方法、装置、系统和存储介质,通过一个端对端的深度残差收缩网络模型,同时实现了犬鼻纹图像的特征提取和分类识别的功能,有效降低了图像噪声对犬鼻纹识别的影响,大大提高了犬
鼻纹识别的准确率,具有简单易行、投入成本低、识别精度高的优点。
[0120]
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献