一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种融合车标分类特征的车标检测识别方法与流程

2022-11-09 22:27:11 来源:中国专利 TAG:


1.本发明属于车标检测识别技术领域,尤其涉及一种融合车标分类特征的车标检测识别方法。


背景技术:

2.车标自动识别是车辆属性自动识别系统的重要组成部分,解决了车标识别的问题也就解决了车型识别准确性的问题,而车标作为车辆一个关键信息,不易被更换,能够成为车辆的一个显著特征,如果能准确地定位车标,将会有效地提高汽车分类和识别的准确率,因此车标的检测对车辆检测管控具有十分重要的意义。
3.传统的车标定位和识别的算法主要是利用车标和车牌位置关系,先找出车牌的位置,然后在车牌上方的定位车标的大致区域,再根据形态学算子对车标进行二次定位,然后利用模式识别技术对定位后的车标进行分类,但是该方法中车标和车牌的位置关系不完全是一致的,有的车标和车牌不满足这种位置关系就会造成找不到车标的问题。
4.基于检测技术的车标识别技术主要包括车标定位和车标识别两大部分, 首先定位出车标,然后对车标进行识别,随着深度学习技术的发展,基于深度学习目标检测算法的车标检测方法成为车标检测算法的主流,但是该方法存在检测速度慢、准确率低等问题,主要原因是车标在图像中占比较小,属于小目标,因此检测精度较低,识别率较差。因此急需有效的手段提升车标检测算法的精度和识别率。


技术实现要素:

5.本发明的目的在于克服现有技术存在的缺点,设计提供一种融合车标分类特征的车标检测识别方法,提高车标检测的精度和识别率。
6.为实现上述目的,本发明先收集常用的车标图像,设计车标分类网络,再把车标分类网络得到的一维特征通过复制扩展后融合到车辆图像的车标分割网络的译码层,使车辆图像的车标特征与分类网络中的车标特征相似时产生最大的相应,因此能够在图像中凸显车辆区域,完成车标区域的分割,车标区域的最大外切矩形即为检测识别的车标,具体包括如下步骤:(1)收集80类车标图像组成车标数据集,每类车标收集500张图像,共40000张图像,车标图像只包含车标不包含其他内容;(2)将车标图像缩放到64
×
64
×
3像素大小后输入车标分类网络中,车标图像经过四个卷积、relu、bn(批量标准化)和池化层处理后得到4
×4×
512的特征图像,再经过两个全连接层后得到80维车标分类特征,并将车标数据集按照8:1:1的比例划分为训练集、验证集和测试集,训练300个迭代终止保存参数模型,取出第一个全连接层输出的512个特征b1作为车辆的分类特征用于辅助车标图像的分割;(3)将车标图像缩放到512
×
512
×
3像素大小输入到车标分割网络中,与步骤(2)第一个全连接层输出的512个特征b1一起处理得到分割结果;
(4)训练车标分割网络:采集20000张含有不同车标的图像,用图像分割标注工具进行标注,数据集按照8:1:1的比例划分为训练集、验证集和测试集,分割网络的能量函数为交叉熵损失函数,训练的时候固定b1降采样后的特征,即车标的分类特征不随分割网络的训练而改变,训练800个迭代终止保存参数模型,得到训练好的网络;(5)测试车标分割网络:将待测试图像缩放到512
×
512
×
3,送入步骤(3)训练好的网络,得到车标的分割结果,分割结果的最大外切矩形即为检测识别到的车标。
7.作为本发明的进一步技术方案,步骤(2)所述四个卷积、relu、bn(批量标准化)和池化层分别为含64个3
×3×
3卷积的卷积层、bn(批量标准化)、relu和平均池化层;含128个3
×
3卷积的卷积层、bn(批量标准化)、relu和平均池化层;含256个3
×
3卷积的卷积层、bn(批量标准化)、relu和平均池化层;含512个3
×
3卷积的卷积层、bn(批量标准化)、relu和平均池化层。
8.作为本发明的进一步技术方案,步骤(2)所述两个全连接层中第一个全连接层的神经单元为512个,第二个全连接层的神经单元为80个。
9.作为本发明的进一步技术方案,步骤(2)所述车标分类网络的能量损失采用交叉熵损失函数。
10.作为本发明的进一步技术方案,步骤(3)的具体过程为:(31)输入到车标分割网络的车标图像依次经过含64个3
×3×
3卷积的卷积层、bn(批量标准化)、relu、池化层操作,输出特征维度为256
×
256
×
64的特征s1,步骤(2)得到的b1特征维度扩展为256
×
256
×
64(利用降采样把特征维度降低到64维,在平面内进行扩展,使得每个位置的特征为b1降维的特征),用符号b1e表示,s1与b1e进行串联操作后得到特征维度为256
×
256
×
128的特征;(32)将步骤(31)得到的特征输入到含有128个3
×
3卷积的卷积层、bn(批量标准化)、relu、池化层操作,输出特征维度为128
×
128
×
128的特征s2,步骤(2)得到的b1特征维度扩展为128
×
128
×
128(利用降采样把特征维度降低到128维,在平面内进行扩展,使得每个位置的特征为b1降维的特征),用符号b2e表示,将s2与b2e进行串联操作后得到特征维度为128
×
128
×
256的特征;(33)将步骤(32)得到的特征输入到含有256个3
×
3卷积的卷积层、bn(批量标准化)、relu、池化层操作,输出特征维度为64
×
64
×
256的特征s3,步骤(2)得到的b1特征维度扩展为64
×
64
×
256(利用降采样把特征维度降低到256维,在平面内进行扩展,使得每个位置的特征为b1降维的特征),用符号b3e表示,将s3与b3e进行串联操作后得到特征维度为64
×
64
×
512的特征;(34)将步骤(33)得到的特征输入到含有256个3
×
3卷积的反卷积层、bn(批量标准化)、relu、池化层操作,输出特征维度为128
×
128
×
256的特征s4;(35)将步骤(34)得到的特征输入到含有128个3
×
3卷积的反卷积层、bn(批量标准化)、relu、池化层操作,输出特征维度为256
×
256
×
128的特征s5;(36)将步骤(35)得到的特征输入到含有64个3
×
3卷积的反卷积层、bn(批量标准化)、relu、池化层操作,输出特征维度为512
×
512
×
64,再经过1
×
1卷积后得到512
×
512
×
1的分割结果。
11.与现有技术相比,本发明先收集常用的车标图像,设计车标分类网络,再将车标分
类网络得到的一维特征通过复制扩展后融合到车辆图像的车标分割网络的译码层,使得车辆图像的车标特征与分类网络中的车标特征相似时会产生最大的相应,因此能够在图像中凸显车辆区域,也就完成了车标区域的分割,车标区域的最大外切矩形即为检测识别的车标,该方法能够很好的解决车标图像识别问题,提高车标检测的精度和识别率。
附图说明
12.图1为本发明所述融合车标分类特征的车标图像分割网络结构图。
具体实施方式
13.下面结合附图,通过实施例进一步描述本发明,但不以任何方式限制本发明的范围。
14.实施例:本实施例提供了一种融合车标分类特征的车标检测识别方法,通过训练车标分类网络获取车标特征,然后融合到车标分割网络得到车标分割结果从而实现车标的检测和分类。图1得融合车标分类特征的车标图像分割网络结构图,如图1所示,具体实施包括如下步骤:(1)收集车标数据集并设计车标分类网络:收集80类车标组成数据集,每类车标收集500张图像,共40000张图像,该车标图像只包含车标不包含其他内容,即采集样本的时候从车辆图像中把车标抠出来。
15.设计车标分类网络,车标分类网络的结构图如说明书附图1下半部分所示,将车标图像缩放到64
×
64
×
3像素大小作为输入图像输入到车标分类网络中,输入图像经过四个卷积、relu、池化层操作(分别为:含64个3
×3×
3卷积的卷积层,bn(批量标准化),relu和平均池化层;含128个3
×
3卷积的卷积层,bn(批量标准化),relu和平均池化层;含256个3
×
3卷积的卷积层,bn(批量标准化),relu和平均池化层;含512个3
×
3卷积的卷积层,bn(批量标准化),relu和平均池化层)得到4
×4×
512的特征图像,经过两个全连接层(第一个全连接层神经单元为512个,第二个全连接层神经单元为80个)后得到80维车标分类特征,网络的能量损失采用交叉熵损失函数;车标数据集按照8:1:1的比例划分为训练集、验证集和测试集,训练300个迭代终止保存参数模型,取出第一个全连接层输出的512个特征b1作为车辆的分类特征用于辅助车标图像的分割;(2)设计融合车标分类特征的车标分割网络:设计融合车标分类特征的车标分割网络如说明书附图1上半部分所示,将含车标的图像缩放到512
×
512
×
3像素大小作为输入图像输入到网络中,输入图像经过含64个3
×3×
3卷积的卷积层、bn(批量标准化)、relu、池化层操作,输出特征维度为256
×
256
×
64,用符号s1表示,步骤1)得到的b1特征维度扩展为256
×
256
×
64(利用降采样把特征维度降低到64维,在平面内进行扩展,使得每个位置的特征为b1降维的特征),用符号b1e表示,s1与b1e进行串联操作后的特征维度为256
×
256
×
128,把此特征输入到含有128个3
×
3卷积的卷积层、bn(批量标准化)、relu、池化层操作,输出特征维度为128
×
128
×
128,用符号s2表示,步骤1)得到的b1特征维度扩展为128
×
128
×
128(利用降采样把特征维度降低到128维,
在平面内进行扩展,使得每个位置的特征为b1降维的特征),用符号b2e表示,s2与b2e进行串联操作后的特征维度为128
×
128
×
256,把此特征输入到含有256个3
×
3卷积的卷积层、bn(批量标准化)、relu、池化层操作,输出特征维度为64
×
64
×
256,用符号s3表示,步骤1)得到的b1特征维度扩展为64
×
64
×
256(利用降采样把特征维度降低到256维,在平面内进行扩展,使得每个位置的特征为b1降维的特征),用符号b3e表示,s3与b3e进行串联操作后的特征维度为64
×
64
×
512,把此特征输入到含有256个3
×
3卷积的反卷积层、bn(批量标准化)、relu、池化层操作,输出特征维度为128
×
128
×
256,用符号s4表示,把此特征输入到含有128个3
×
3卷积的反卷积层、bn(批量标准化)、relu、池化层操作,输出特征维度为256
×
256
×
128,用符号s5表示,把此特征输入到含有64个3
×
3卷积的反卷积层、bn(批量标准化)、relu、池化层操作,输出特征维度为512
×
512
×
64,经过1
×
1卷积后得到512
×
512
×
1的分割结果;(3)训练车标分割网络:采集20000张含有不同车标的图像,用图像分割标注工具进行标注,数据集按照8:1:1的比例划分为训练集、验证集和测试集,分割网络的能量函数为交叉熵损失函数,训练的时候固定b1降采样后的特征,即车标的分类特征不随分割网络的训练而改变,训练800个迭代终止保存参数模型,得到训练好的车标分割网络;(4)测试车标分割网络:输入测试图像,将测试图像缩放到512
×
512
×
3,送入步骤(3)训练好的网络,可以得到车标的分割结果,分割结果的最大外切矩形即为检测识别到的车标区域。
16.本文中未详细说明的网络结构和算法均为本领域通用技术。
17.需要注意的是,公布实施例的目的在于帮助进一步理解本发明,但是本领域的技术人员可以理解:在不脱离本发明及所附权利要求的精神和范围内,各种替换和修改都是可能的。因此,本发明不应局限于实施例所公开的内容,本发明要求保护的范围以权利要求书界定的范围为准。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献