一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

卷积神经网络中loss函数

2022-06-11 22:08:50 来源:中国专利 TAG:


1.本发明属于神经网络技术领域,特别是涉及一种卷积神经网络中loss函数。


背景技术:

2.传统基于摄像头的计算机视觉系统,例如商业服务行业中的监控安全应用、军事任务和养老系统等等,性能好坏严重依赖光照和色彩,在低照度自然环境下无法正常工作。通常,低照度场景中拍摄的图像存在质量下降问题,例如运动模糊、高斯噪声和相机成像噪声。针对这种情况,也进行了图像去噪和恢复方面的研究,包括各种典型的低级视觉任务,例如超分辨率和去条纹等。由于海量数据和复杂算法处理,以前的大多数方法都以牺牲计算负担为代价。此外,单个模型的功能有限,不足以处理存在的所有低级视觉问题。因此,现有图像去噪和恢复对于实际应用是不可行的。
3.此外,与高分辨率图像相比,低照度场景下的图像分割具有更高的挑战性。低照度图像没有清晰的边界,限制了基于边缘的分割方法的性能。光照不均匀的图像中,物体的某部分过亮,某些部分过暗,限制了基于光照的分割方法的性能。月光自然场景下的图像,目标与背景上下文的光照和颜色几乎没有差异,阻碍了基于颜色的分割方法的性能。低照度图像中存在目标因运动而产生的模糊现象,无法进行准确的分割。


技术实现要素:

4.本发明的目的在于提供一种卷积神经网络中loss函数,解决了上述现有技术中低照度场景下的图像无法进行准确的分割的问题。
5.为达上述目的,本发明是通过以下技术方案实现的:
6.一种卷积神经网络中loss函数,包括如下步骤:
7.步骤一:设计网络模型结构,引入三通道灰度图像,对输入图像数据进行均方差归一化预处理;通过数据细化层引入三通道灰度图像,数据细化层可为dr,数据细化层在网络模型结构前端对放大、旋转、镜像、灰度转换后的图像数据准确读取。
8.步骤二:设计下采样部分遵循卷积网络的代表性架构,提取的特征由内容感知重组上采样的解码器处理,重组特征图的语义信息;
9.步骤三:采用acs损失函数计算网络在训练期间的误差损失;
10.步骤四:将数据集内的弱光照图像用作模型训练和测试的基准,在三个不同的测试集上对网络性能进行测试;
11.步骤五:将测试后是实验结果自动生成报告发送至无线终端。
12.可选的,步骤一中,通过数据归一化层对输入图像数据进行均方差归一化预处理,加速网络收敛,数据归一化层可为dn,数据归一化层和数据细化层位于网络模型结构的前端。
13.可选的,步骤二中,下采样部分包括两次重复使用两次3
×
3卷积和三次重复使用四次3
×
3卷积,两次3
×
3卷积和四次3
×
3卷积均连接有非线性纠正单元relu和一个2
×
2步
长为2均值池化层。
14.可选的,步骤三中,acs损失函数包括基于区域、质心和形状三个条件的监督,计算网络在训练期间的误差损失,最终总的loss是对三个因素的真实值和预测值误差值计算的加权和满足下式:
15.loss
rcs
=c1·
shape c2·
centroid c3·
region
16.其中,图像为t,预测为p∈[0,1]m
×
n,n为索引图像空间n中的每个像素值,每个类的标签在c类中写为l。
[0017]
可选的,算式中第一项表示形状误差lshape,从形状方面对网络性能进行监督,使用hu矩标识二值化图像的形状,通过计算hu矩的欧几里德距离来计算预测图像和gt图像中像素的强度及其位置,具体的满足下式:
[0018][0019]
其中,d(p,t)是预测图像和标注gt的hu矩之间的欧几里得距离,hi,j取决于像素的强度及其在图像中的位置,捕获了目标的形状信息。
[0020]
可选的,算式中第二项表示质心误差lcentroid,通过计算两个质心之间的距离来进行质心匹配图像m(x,y)的质心定义满足下式:
[0021][0022]
其中,ε(ε》0)是避免在计算中平方根为零的参数,包括左右一致性检查。
[0023]
可选的,算式中第三项表示区域误差lregion,从区域方面对网络预测性能进行监督,通过计算加权交叉熵进行计算目标区域匹配满足下式:
[0024][0025]
其中,ω代表像素的重要性,像素越关键,权重越大。
[0026]
可选的,步骤四中,数据集数据产生步骤为:
[0027]
1)、训练数据准备,收集22338张图像,并进行手工标注;
[0028]
2)、将数据集分为三个子集:训练集(18980)、验证集(2108)和测试集(1250);
[0029]
3)、通过图像旋转和按比例放大来增加训练数据集数量,其中,使用两个比例:0.6和1.5,在三个方向上进行旋转:-90、90和180的方法来增加训练数据,通过数据增强,训练图像不低于287500张。
[0030]
可选的,步骤四中,测试集数据产生步骤:
[0031]
1)、测试数据准备,在三个不同的测试集上对网络性能进行测试;
[0032]
2)、测试集第一个是新的数据集nhws,包括自然低照度环境中收集的1250张图像;
[0033]
3)、测试集第二个是pascal voc,从pascal voc 2007~2012中随机选择了335张包含人的图像;
[0034]
4)、测试集第三个是ade20k,包括了从ade20k中选择的215张包含人的图像。
[0035]
本发明的实施例具有以下有益效果:
[0036]
本发明的一个实施例通过设置网络模型结构,实现了在非约束的低光照自然场景中,准确识别出人物目标以及对目标进行准确的分割,对于混合噪声非常严重的单个帧,通过卷积神经网络中loss函数处理也能获得令人满意的结果,且本发明能实时,准确的对自然场景中低光照,多光源光照,摄像机噪声严重,运动模糊现象中的图像中的目标进行识别。
[0037]
当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
[0038]
构成本技术的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0039]
图1为本发明一实施例的系统流程结构示意图。
具体实施方式
[0040]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
[0041]
为了保持本发明实施例的以下说明清楚且简明,本发明省略了已知功能和已知部件的详细说明。
[0042]
请参阅图1所示,在本实施例中提供了一种卷积神经网络中loss函数,包括:如下步骤:
[0043]
步骤一:设计网络模型结构,引入三通道灰度图像,对输入图像数据进行均方差归一化预处理;
[0044]
步骤二:设计下采样部分遵循卷积网络的代表性架构,提取的特征由内容感知重组上采样的解码器处理,重组特征图的语义信息;
[0045]
步骤三:采用acs损失函数计算网络在训练期间的误差损失;
[0046]
步骤四:将数据集内的弱光照图像用作模型训练和测试的基准,在三个不同的测试集上对网络性能进行测试;
[0047]
步骤五:将测试后是实验结果自动生成报告发送至无线终端。
[0048]
通过设置网络模型结构,实现了在非约束的低光照自然场景中,准确识别出人物目标以及对目标进行准确的分割,对于混合噪声非常严重的单个帧,通过卷积神经网络中loss函数处理也能获得令人满意的结果,且本发明能实时,准确的对自然场景中低光照,多光源光照,摄像机噪声严重,运动模糊现象中的图像中的目标进行识别。
[0049]
本实施例的步骤一中,通过数据细化层引入三通道灰度图像,数据细化层可为dr,数据细化层在网络模型结构前端对放大、旋转、镜像、灰度转换后的图像数据准确读取。
[0050]
本实施例的,步骤一中,通过数据归一化层对输入图像数据进行均方差归一化预处理,加速网络收敛,数据归一化层可为dn,数据归一化层和数据细化层位于网络模型结构的前端。
[0051]
本实施例的,步骤二中,下采样部分包括两次重复使用两次3
×
3卷积和三次重复
使用四次3
×
3卷积,两次3
×
3卷积和四次3
×
3卷积均连接有非线性纠正单元relu和一个2
×
2步长为2均值池化层。在每经过一个下采样后,特征通道的数量都会增加一倍,上采样部分结构与fcn-8s相同,但数据更详细准确,在金字塔的顶部,提取的特征由内容感知重组上采样的解码器处理,重组后的特征图的语义信息就更强,因为来自局部区域中语义相关点的信息可以得到更多关注。
[0052]
本实施例的,步骤三中,acs损失函数包括基于区域、质心和形状三个条件的监督,计算网络在训练期间的误差损失,最终总的loss是对三个因素的真实值和预测值误差值计算的加权和满足下式:
[0053]
loss
rcs
=c1·
shape c2·
centroid c3·
region
[0054]
其中,图像为t,预测为p∈[0,1]m
×
n,n为索引图像空间n中的每个像素值,每个类的标签在c类中写为l。
[0055]
本实施例的,算式中第一项表示形状误差lshape,从形状方面对网络性能进行监督,使用hu矩标识二值化图像的形状,通过计算hu矩的欧几里德距离来计算预测图像和gt图像中像素的强度及其位置,具体的满足下式:
[0056][0057]
其中,d(p,t)是预测图像和标注gt的hu矩之间的欧几里得距离,hi,j取决于像素的强度及其在图像中的位置,捕获了目标的形状信息。
[0058]
本实施例的,算式中第二项表示质心误差lcentroid,通过计算两个质心之间的距离来进行质心匹配图像m(x,y)的质心定义满足下式:
[0059][0060]
其中,ε(ε》0)是避免在计算中平方根为零的参数,包括左右一致性检查。
[0061]
本实施例的,算式中第三项表示区域误差lregion,从区域方面对网络预测性能进行监督,通过计算加权交叉熵进行计算目标区域匹配满足下式:
[0062][0063]
其中,ω代表像素的重要性,像素越关键,权重越大。
[0064]
本实施例的,步骤四中,数据集数据产生步骤为:
[0065]
1)、训练数据准备,收集22338张图像,并进行手工标注;
[0066]
2)、将数据集分为三个子集:训练集(18980)、验证集(2108)和测试集(1250);
[0067]
3)、通过图像旋转和按比例放大来增加训练数据集数量,其中,使用两个比例:0.6和1.5,在三个方向上进行旋转:-90、90和180的方法来增加训练数据,通过数据增强,训练图像不低于287500张。
[0068]
本实施例的,步骤四中,测试集数据产生步骤:
[0069]
1)、测试数据准备,在三个不同的测试集上对网络性能进行测试;
[0070]
2)、测试集第一个是新的数据集nhws,包括自然低照度环境中收集的1250张图像;
[0071]
3)、测试集第二个是pascal voc,从pascal voc 2007~2012中随机选择了335张包含人的图像;
[0072]
4)、测试集第三个是ade20k,包括了从ade20k中选择的215张包含人的图像。
[0073]
上述实施例可以相互结合。
[0074]
需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施方式能够以除了在这里图示或描述的那些以外的顺序实施。
[0075]
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0076]
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献