一种基于神经网络的车辆尾框回归方法、装置及存储介质与流程

2022-04-13 18:08:55 来源：中国专利 TAG：

1.本发明涉及一种基于神经网络的车辆尾框回归方法、装置及存储介质，属于辅助驾驶技术领域。

背景技术：

2.在车载辅助驾驶系统中，我们需要对车辆前方道路上行驶的车辆属性进行分析，从而获取车辆在现实场景中位置信息。依据目标车辆尾框的位置、目标车辆现实场景中的车尾宽度、摄像头的成像参数，我们可以精确的计算目标车辆在现实场景中的位置，从而为后续的运动状态判断提供依据，从而有助于系统对场景中各个车辆的运动状态进行分析，并提供相对准确的辅助驾驶决策。那么其中核心的一环在于如何获取精准的车辆尾框。常见的车辆尾框回归的方式不外乎两种，方案一是直接利用检测网络对车辆尾框进行检测，方案二是先利用检测网络检测完整的车辆，然后再对目标车辆进行尾框回归。由于输入原图的尺寸较大，场景中冗余的信息太多，直接对车辆尾框进行检测，往往会出现车辆尾框的偏差较大。方案二首先通过对车辆整体的位置进行检测，获取目标车辆的位置信息，然后直接对目标车辆的尾框进行回归或者先回归车辆尾部的特征点，然后再根据车辆尾部特征点来计算出车辆尾部回归框。然而上述方式虽然可以进一步提高车辆尾框的精确度，但是仍然会有不小的误差。如何进一步的提升车辆尾框的回归精度是目标值的进一步探索的问题。

技术实现要素：

3.本发明的目的在于克服现有技术中的不足，提供一种基于神经网络的车辆尾框回归方法、装置及存储介质，能够提升车辆尾框的回归精度。
4.为达到上述目的，本发明是采用下述技术方案实现的：
5.第一方面，本发明提供了一种基于神经网络的车辆尾框回归方法，包括：
6.采集车辆前方车况的视频片段，并从视频片段中提取含有车辆尾框的目标图像；
7.基于预设的yolov5目标检测框架获取目标图像中的目标车辆的位置信息；
8.基于位置信息从目标图像中裁剪出目标车辆图像，并对目标车辆图像进行预处理；
9.将预处理后的目标车辆图像输入训练好的深度神经网络得到车辆尾框预测信息，并基于车辆尾框预测信息生成车辆尾框。
10.可选的，所述位置信息包括目标车辆图像在目标图像中的中心点坐标(cx，cy)以及目标车辆图像的宽w和高h；
11.所述裁剪出目标车辆图像在目标图像中左上角坐标为：
[0012][0013]
所述裁剪出目标车辆图像在目标图像中右下角坐标为：
[0014][0015]
可选的，所述深度神经网络的训练过程包括：
[0016]
获取目标车辆图像的历史数据，并分别对目标车辆图像中的车辆尾框进行标注，所述标注包括对车辆尾框添加标注框，将标注框内的每个像素点的标签记为1，将标注框外的每个像素点的标签记为0，并获取标注框内的每个像素点距离标注框边界的距离；
[0017]
对标注后的目标车辆图像进行预处理并汇总生成训练集；
[0018]
将训练集中的训练样本输入深度神经网络；
[0019]
深度神经网络的分类单元分别输出标注框内和标注框外的每个像素点的标签预测，基于标签预测和标签标注计算分类单元损失；
[0020]
深度神经网络的回归单元输出标注框内的每个像素点距离标注框边界的距离预测，基于距离预测和距离标注计算回归单元损失；
[0021]
将分类单元损失和回归单元损失反向传播迭代深度神经网络的网络参数，直至到达预设迭代次数或损失收敛，完成深度神经网络的训练。
[0022]
可选的，所述对目标车辆图像进行预处理包括：将目标车辆图像变形至96*96，并在周围均匀填补黑边至128*128得到预处理后的目标车辆图像。
[0023]
可选的，所述对车辆尾框添加标注框包括：
[0024]
位于采集车辆正前方的车辆尾框的标注框：
[0025]
车顶平面标注为标注框上边界；
[0026]
车辆后车轮与地面交线标注为标注框下边界；
[0027]
车辆尾框左侧最宽处标注为标注框左边界；
[0028]
车辆尾框右侧最宽处标注为标注框右边界；
[0029]
位于采集车辆左前方的车辆尾框的标注框：
[0030]
车顶平面标注为标注框上边界；
[0031]
车辆左侧后车轮与地面交线标注为标注框下边界；
[0032]
车辆尾框左侧最宽处标注为标注框左边界；
[0033]
车辆尾框右侧最宽处标注为标注框右边界；
[0034]
位于采集车辆右前方的车辆尾框的标注框：
[0035]
车顶平面标注为标注框上边界；
[0036]
车辆右侧后车轮与地面交线标注为标注框下边界；
[0037]
车辆尾框左侧最宽处标注为标注框左边界；
[0038]
车辆尾框右侧最宽处标注为标注框右边界。
[0039]
可选的，所述分类单元损失通过交叉熵损失函数计算获取，所述分类单元损失l
cls
为：
[0040][0041]
其中，yi′
为标注框内第i个像素点的标签预测，i为标注框内像素点的数量；yo′
为
标注框外第o个像素点的标签预测，o为标注框外像素点的数量，sigmoid(
·
)为sigmoid函数。
[0042]
可选的，所述回归单元损失通过ciou loss损失函数计算获取，所述回归单元损失l
reg
为：
[0043][0044]
其中，l
cioui
为标注框内第i个像素点的回归预测损失，i为标注框内像素点的数量；标注框内任一像素点的回归预测损失l
ciou
为：
[0045][0046][0047][0048][0049]
其中，a为标注框，b为预测框，标注框a和标注框b分别通过像素点与像素点距离标注框边界的距离标注和距离预测获取；ρ2(b，b
gt
)为标注框a的中心点b与预测的预测框b的中心点b
gt
的欧几里得距离，c为标注框a与预测框b之间最小外接矩形对角线长度；w和h分别为标注框a的宽和高，w
gt
和h
gt
分别为预测框b的宽和高。
[0050]
可选的，所述基于车辆尾框预测信息生成车辆尾框包括：
[0051]
根据车辆尾框预测信息得到车辆尾框内第i个像素点的标签预测yi″
以及第i个像素点距离车辆尾框的上边界、下边界、左边界和右边界的距离du、dd、d
l
、dr，通过计算得到车辆尾框预测f(x,y)：
[0052]
f(x,y)＝(x
i-d
l
,y
i-du,x
i-dr,y
i-dd)
[0053]
其中，(xi，yi)为车辆尾框内第i个像素点在目标车辆图像上的坐标；
[0054]
基于预设的置信度n计算车辆尾框内每个像素点的权重s(x,y)：
[0055][0056]
其中，sigmoid(
·
)为sigmoid函数；
[0057]
根据车辆尾框预测f(x,y)和像素点的权重s(x,y)计算得到车辆尾框reg：
[0058]
reg＝∑s(x，y)*f(x，y)。
[0059]
第二方面，本发明提供了一种基于神经网络的车辆尾框回归装置，包括处理器及存储介质；
[0060]
所述存储介质用于存储指令；
[0061]
所述处理器用于根据所述指令进行操作以执行根据上述任一项所述方法的步骤。
[0062]
第三方面，本发明提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现权上述任一项所述方法的步骤。
[0063]
与现有技术相比，本发明所达到的有益效果：
[0064]
本发明提供的一种基于神经网络的车辆尾框回归方法、装置及存储介质，在不增加人工设计和标注特征点的步骤下，将标注框内所有像素点作为特征点，最大化的利用车辆尾部的特征点信息。同时对所选区域中每一个像素点生成的尾框学习一个置信度，依据置信度和尾框坐标，生成目标车辆的尾框。通过上述方案，优化了尾框特征点设计和标注的步骤，并尽可能的利用车辆尾框中每一个像素点，尽可能的提升车辆尾框的回归精度。
附图说明
[0065]
图1是本发明实施例提供的一种基于神经网络的车辆尾框回归方法的流程图；
[0066]
图2是本发明实施例提供的位于采集车辆正前方的车辆尾框的标注框示意图；
[0067]
图3是本发明实施例提供的位于采集车辆左前方的车辆尾框的标注框示意图；
[0068]
图4是本发明实施例提供的位于采集车辆右前方的车辆尾框的标注框示意图。
具体实施方式
[0069]
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案，而不能以此来限制本发明的保护范围。
[0070]
实施例一：
[0071]
如图1所示，本发明实施例提供了一种基于神经网络的车辆尾框回归方法，包括以下步骤：
[0072]
1、采集车辆前方车况的视频片段，并从视频片段中提取含有车辆尾框的目标图像。
[0073]
2、基于预设的yolov5目标检测框架获取目标图像中的目标车辆的位置信息；
[0074]
2.1、位置信息包括目标车辆图像在目标图像中的中心点坐标(cx，cy)以及目标车辆图像的宽w和高h；
[0075]
裁剪出目标车辆图像在目标图像中左上角坐标为：
[0076][0077]
裁剪出目标车辆图像在目标图像中右下角坐标为：
[0078][0079]
3、基于位置信息从目标图像中裁剪出目标车辆图像，并对目标车辆图像进行预处理；
[0080]
对目标车辆图像进行预处理包括：将目标车辆图像变形至96*96，并在周围均匀填补黑边至128*128得到预处理后的目标车辆图像。
[0081]
4、将预处理后的目标车辆图像输入训练好的深度神经网络得到车辆尾框预测信
息，并基于车辆尾框预测信息生成车辆尾框。
[0082]
深度神经网络的训练过程包括：
[0083]
4.1、获取目标车辆图像的历史数据，并分别对目标车辆图像中的车辆尾框进行标注，标注包括对车辆尾框添加标注框，将标注框内的每个像素点的标签记为1，将标注框外的每个像素点的标签记为0，并获取标注框内的每个像素点距离标注框边界的距离；
[0084]
4.2、对标注后的目标车辆图像进行预处理并汇总生成训练集；对目标车辆图像进行预处理包括：将目标车辆图像变形至96*96，并在周围均匀填补黑边至128*128得到预处理后的目标车辆图像。
[0085]
4.3、将训练集中的训练样本输入深度神经网络；
[0086]
深度神经网络的分类单元分别输出标注框内和标注框外的每个像素点的标签预测，基于标签预测和标签标注计算分类单元损失；
[0087]
分类单元损失通过交叉熵损失函数计算获取，分类单元损失l
cls
为：
[0088][0089]
其中，yi′
为标注框内第i个像素点的标签预测，i为标注框内像素点的数量；yo′
为标注框外第o个像素点的标签预测，o为标注框外像素点的数量，sigmoid(
·
)为sigmoid函数。
[0090]
深度神经网络的回归单元输出标注框内的每个像素点距离标注框边界的距离预测，基于距离预测和距离标注计算回归单元损失；
[0091]
回归单元损失通过ciou loss损失函数计算获取，回归单元损失l
reg
为：
[0092][0093]
其中，l
cioui
为标注框内第i个像素点的回归预测损失，i为标注框内像素点的数量；标注框内任一像素点的回归预测损失l
ciou
为：
[0094][0095][0096][0097][0098]
其中，a为标注框，b为预测框，标注框a和标注框b分别通过像素点与像素点距离标注框边界的距离标注和距离预测获取；ρ2(b，b
gt
)为标注框a的中心点b与预测的预测框b的中心点b
gt
的欧几里得距离，c为标注框a与预测框b之间最小外接矩形对角线长度；w和h分别
为标注框a的宽和高，w
gt
和h
gt
分别为预测框b的宽和高。
[0099]
4.4、将分类单元损失和回归单元损失反向传播迭代深度神经网络的网络参数，直至到达预设迭代次数或损失收敛，完成深度神经网络的训练。
[0100]
4.5、基于车辆尾框预测信息生成车辆尾框包括：
[0101]
根据车辆尾框预测信息得到车辆尾框内第i个像素点的标签预测yi″
以及第i个像素点距离车辆尾框的上边界、下边界、左边界和右边界的距离du、dd、d
l
、dr，通过计算得到车辆尾框预测f(x，y)：
[0102]
f(x，y)＝(x
i-d
l
，y
i-du，x
i-dr，y
i-dd)
[0103]
其中，(xi，yi)为车辆尾框内第i个像素点在目标车辆图像上的坐标；
[0104]
基于预设的置信度n计算车辆尾框内每个像素点的权重s(x,y)：
[0105][0106]
其中，sigmoid(
·
)为sigmoid函数；置信度n一般设置为0.5；
[0107]
根据车辆尾框预测f(x,y)和像素点的权重s(x，y)计算得到车辆尾框reg：
[0108][0109]
其中，对车辆尾框添加标注框包括：
[0110]
如图2所示，位于采集车辆正前方的车辆尾框的标注框：
[0111]
车顶平面标注为标注框上边界；
[0112]
车辆后车轮与地面交线标注为标注框下边界；
[0113]
车辆尾框左侧最宽处标注为标注框左边界；
[0114]
车辆尾框右侧最宽处标注为标注框右边界；
[0115]
如图3所示，位于采集车辆左前方的车辆尾框的标注框：
[0116]
车顶平面标注为标注框上边界；
[0117]
车辆左侧后车轮与地面交线标注为标注框下边界；
[0118]
车辆尾框左侧最宽处标注为标注框左边界；
[0119]
车辆尾框右侧最宽处标注为标注框右边界；
[0120]
如图4所示，位于采集车辆右前方的车辆尾框的标注框：
[0121]
车顶平面标注为标注框上边界；
[0122]
车辆右侧后车轮与地面交线标注为标注框下边界；
[0123]
车辆尾框左侧最宽处标注为标注框左边界；
[0124]
车辆尾框右侧最宽处标注为标注框右边界。
[0125]
实施例二：
[0126]
基于实施例一，本发明实施例提供了一种基于神经网络的车辆尾框回归装置，包括处理器及存储介质；
[0127]
存储介质用于存储指令；
[0128]
处理器用于根据指令进行操作以执行根据上述方法的步骤。
[0129]
实施例三：
[0130]
基于实施例一，本发明实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现权上述方法的步骤。
[0131]
本领域内的技术人员应明白，本技术的实施例可提供为方法、系统、或计算机程序产品。因此，本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0132]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0133]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0134]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0135]
以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和变形，这些改进和变形也应视为本发明的保护范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种通过压力传感器技术实现笔锋笔迹的手写笔控制方法与流程

一种基于神经网络的车辆尾框回归方法、装置及存储介质与流程

相关文献

最热文献