一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于坐标注意力群组优化的小样本目标检测方法

2022-09-08 08:37:02 来源:中国专利 TAG:


1.本发明属于计算机技术领域,尤其是计算机视觉技术领域,涉及小样本场景下的目标检测,具体涉及一种基于坐标注意力群组优化的小样本目标检测方法。


背景技术:

2.目标检测是一项基础的计算机视觉任务,旨在从图像中定位并识别感兴趣的人或物体。传统方法通过滑动窗口机制和尺度不变特征变换(scale-invariant feature transform,sift)、方向梯度直方图(histogram of oriented gradient,hog)等手工特征提取算法得到目标特征,再采用支持向量机预测目标类别。过去十多年间,以卷积神经网络为基础的深度学习方法被广泛应用于目标检测领域,显著提升了目标检测的性能。然而,深度学习方法通常需要用大量已标记的数据训练模型,难以直接应用于数据稀缺的场景。同时,手动标注图像中目标的边界框和类别需要耗费大量人工成本,这极大地限制了深度学习方法在工业界的推广与应用。为解决上述数据缺乏和人工成本问题,研究人员提出小样本目标检测这一任务,小样本目标检测模型旨在依靠少量已标记的图像检测出未标记图像中的同类目标。该方法可应用于工业产品缺陷检测、稀有动物检测等场景,同时减少人工标注数据的开销。例如,工业产品缺陷检测通常需要大量带缺陷的产品样本对模型进行训练,然而,实际生产场景中缺陷产品的比例很小,很难收集到足够多的符合条件的样本,造成模型训练不充分,从而导致模型过拟合,而小样本目标检测模型能通过少量缺陷样本检测出产品表面的缺陷,避免了上述问题。
3.目前,大多数小样本目标检测方法将两阶段更快速的区域卷积神经网络faster-rcnn(faster region-convolution neural network)模型作为检测框架,同时采用元学习(meta-learning)方式训练。数据预处理时,小样本方法按照图像中的目标类别将数据集划分为训练集和测试集,即训练集和测试集中的目标类别无交集。其中,训练集中的目标类别称为基类(base class),测试集中的目标类别称为新类(novel class)。训练期间,在每次迭代优化时模型从包含基类目标的训练集中随机选取部分样本作为支持集,再随机选取含同类目标的部分剩余样本作为查询集。其中,支持集作为已知标注的样本集合,模型需要利用少量支持样本检测查询样本中的目标。支持集和查询集组成一个小样本目标检测任务中的数据集。这些方法通常采用双分支结构,将支持集和查询集输入参数共享的主干(backbone)网络得到支持特征图和查询特征图。随后,查询特征图通过区域生成网络(region proposal network,rpn)输出的候选框得到查询目标特征图,而支持特征图通过全局池化操作得到支持目标类特征向量。最终,支持目标类特征向量与查询目标特征图通过注意力模块融合得到融合特征图,再将融合特征图输入检测器中得到查询集的目标边界框和类别。模型在训练期间根据每次迭代生成的小样本目标检测任务数据集学习到任务无关的先验知识,从而在实际应用时快速适应新的检测任务。训练结束后,模型通过少量带标注的包含新类目标的样本检测其他未标注样本中的同类目标。
4.上述方法存在的不足点主要表现在三个方面:1)采用两阶段的检测框架,新类目
标定位依赖于生成的候选框,且模型只在基类样本上训练,若新类与基类差异很大,则难以输出合适的候选框定位新类目标;2)采用全局池化操作使得模型容易丢失目标空间位置特征,不利于目标的准确定位;3)支持集中的每个样本被当成独立的个体,没有充分考虑到具体检测任务中支持集不同目标间的相似关系,当不同类别目标相似时容易导致错误分类。综上所述,为了缓解现有方法难以捕获支持目标空间位置特征和不同类别目标相似而造成分类不准确的问题,迫切需要一种方法不依赖于候选框而根据支持集中目标的空间位置定位查询集的目标,并利用支持集中目标间的相似关系识别查询集中的目标。


技术实现要素:

5.本发明的目的就是针对现有技术的不足,提供一种基于坐标注意力群组优化的小样本目标检测方法。本发明方法无需预先生成候选框,而是通过坐标注意力从特征图的水平和垂直两个方向捕获支持集目标的关键空间位置特征,引导检测器关注查询集中包含目标的区域,从而提升目标定位的精度;同时采用群组优化模块更新支持目标类向量,利用支持集中不同目标间的相似关系得到更具判别性的类特征,从而提高目标识别的准确率。
6.本发明方法首先获取含有目标边界框和类别标注的图像数据集合,然后进行如下操作:
7.步骤(1)对图像数据集进行采样,获得支持集和查询集,将两者输入到深度视觉特征提取模块,输出支持特征图集合和查询特征图集合;
8.步骤(2)构建坐标注意力引导模块,输入为随机初始化的目标参数矩阵集合和支持特征图集合,输出为目标融合矩阵集合;
9.步骤(3)构建群组优化模块,输入为支持特征图集合和支持集对应的边界框标注,输出为支持目标类向量集合;
10.步骤(4)构建查询目标预测模块,输入为查询特征图集合、目标融合矩阵集合和支持目标类向量集合,输出为预测的查询目标边界框和类别概率;
11.步骤(5)利用随机梯度下降算法优化由坐标注意力引导模块、群组优化模块和查询目标预测模块组成的小样本目标检测模型,对新的支持集和查询集通过步骤(1)~(4)得到查询集中图像的目标边界框和类别。
12.进一步,步骤(1)具体是:
13.(1-1)首先将数据集中的图像缩放到相同大小,对图像样本进行不放回随机采样,得到支持集和查询集其中,为实数域,ns表示支持集中的图像样本个数,表示第i个支持图像样本,nq表示查询集中的图像样本个数,表示第j个查询图像样本,h表示图像高度,w表示图像宽度,3表示rgb通道数量;
14.每个支持图像样本有标注其中,φi表示中的目标数,c
i,φ
∈{1,

,c}表示中第φ个目标的类别,表示中第φ个目标边界框的左上角和右下角坐标组成的四维向量,支持集中共包含ck个目标,ck=c
×
k,即
c表示目标类别数,k表示每类目标数;
15.(1-2)构建由深度卷积网络和一个二维卷积层组成的深度视觉特征提取模块,其中,深度卷积网络是在imagenet数据集预训练的50层残差网络resnet-50,二维卷积层的卷积核尺寸为1
×
1;
16.(1-3)将支持集和查询集输入到深度视觉特征提取模块,得到支持特征图集合和查询特征图集合其中,表示第i个支持特征图,表示第j个查询特征图,h

、w

和256分别表示单个特征图的高、宽和通道数,
17.又进一步,步骤(2)具体是:
18.(2-1)随机初始化,得到目标参数矩阵集合aj表示第j个查询图像样本对应的目标参数矩阵,m表示单个查询图像样本中待检测的目标个数,256表示单个目标参数矩阵中行向量维度;构建坐标注意力引导模块,所述坐标注意力引导模块由坐标注意力子模块和交叉注意力子模块组成,其中坐标注意力子模块从特征图的水平和垂直两个方向计算各个坐标位置的权重,得到空间位置注意特征图集合,交叉注意力子模块用于融合目标参数矩阵集合与空间位置注意特征图集合;
19.(2-2)对第i个支持特征图分别沿水平坐标方向和垂直坐标方向做平均池化操作,得到水平特征图和垂直特征图和垂直特征图表示张量第μ个通道中坐标位置为(h

,w

)处的值,1≤μ≤256,1≤h

≤h

,1≤w

≤w

,则:张量第μ个通道中坐标位置为(h

,1)处的值张量第μ个通道中坐标位置为(1,w

)处的值
20.(2-3)将水平特征图和垂直特征图依次输入二维卷积层和激活函数层,得到水平权重特征图和垂直权重特征图和垂直权重特征图和垂直权重特征图其中conv1(
·
)表示卷积核尺寸为1
×
1的二维卷积层,σ(
·
)表示sigmoid激活函数;
21.(2-4)根据支持特征图水平权重特征图和垂直权重特征图计算得到空间位置注意特征图张量第μ个通道中坐标位置为(h

,w

)处的值)处的值表示张量第μ个通道中坐标位置为(h

,1)处的值,表示张量第μ个通道中坐标位置为(1,w

)处的值;
22.(2-5)对支持特征图集合中所有特征图执行步骤(2-2)~(2-4),得到空间位
置注意特征图集合将集合中所有特征图的按空间维度展开并拼接,得到空间目标位置特征
23.(2-6)将中每个目标参数矩阵aj与空间目标位置特征输入到交叉注意力子模块中,得到目标融合矩阵集合块中,得到目标融合矩阵集合softmax(
·
)为归一化指数函数,上标t表示转置操作。
24.再进一步,步骤(3)具体是:
25.(3-1)构建群组优化模块,群组是属于同一类别的支持目标集合,根据支持目标类标记和得到的支持目标向量集合计算支持目标概率矩阵和相似度矩阵,并通过支持目标概率矩阵和相似度矩阵得到群组传播矩阵;
26.(3-2)将步骤(1-3)中得到的支持特征图集合和步骤(1-1)中得到的每个支持图像样本对应标注中每个边界框b
i,φ
输入到感兴趣区域池化层中,得到支持目标特征图集合其中感兴趣区域池化层表示特征图在对应目标边界框区域内做最大池化操作,o
c,k
表示集合中第c类中第k个目标的特征图;
27.(3-3)对支持目标特征图集合依次通过卷积和全局平均池化操作,得到支持目标向量集合其中,集合中第c类中第k个目标的特征向量gap(
·
)表示在特征图空间维度上的全局平均池化操作,conv2(
·
)表示卷积核尺寸为3
×
3的二维卷积层;
28.(3-4)计算支持目标类向量集合通过支持目标类向量集合得到支持目标概率矩阵其中,集合中第c类的支持目标类向量矩阵p第u行第v列的值,表示第u个支持向量属于第v类的概率1≤u≤ck,1≤v≤c,u=(c-1)
×
k k,表示集合中第u个支持目标向量,即exp(
·
)表示自然常数e为底的指数函数,dist(
·
,
·
)表示欧式距离函数,则
29.(3-5)利用高斯核函数计算支持目标向量间的相似度矩阵通过相似度矩阵z和支持目标概率矩阵p构建群组传播矩阵其中,矩阵z第u行第w列的值,表示支持目标向量和间的相似度1≤w≤ck,高斯核函数中的超
参数γ>0,表示集合中第w个支持目标向量,群组传播矩阵λ=zp,λ中第u行第v列的值λ
u,v
表示支持目标向量根据样本间相似度加权求和得到的属于第v类的概率;
30.(3-6)初始化迭代上限值ψ,通过群组传播矩阵λ、相似度矩阵z和标签传播算法迭代优化支持目标概率矩阵p,直至迭代次数达到上限值ψ,得到更新后的支持目标概率矩阵p
(ψ)
,初始迭代时p
(0)
=p,λ
(0)
=λ,标签传播算法迭代为=λ,标签传播算法迭代为100≤ψ≤120,和表示第次迭代时的支持目标概率矩阵和群组传播矩阵,和表示矩阵第u行第v列的值和矩阵第u行第v列的值,和表示矩阵第u行第v列的值和第u行第c列的值;
31.(3-7)利用更新后的支持目标概率矩阵p
(ψ)
和支持目标向量集合计算得到新的支持目标类向量集合其中,集合中第c类的支持目标类向量p
(ψ)
表示第ψ次迭代结束后的目标概率矩阵,为矩阵p
(ψ)
第u行第c列的值,表示更新后第u个支持目标向量属于第c类的概率。
32.更进一步,步骤(4)具体是:
33.(4-1)构建查询目标预测模块,模块由转换器子模块、目标分类函数和边界框预测子模块组成;
34.将查询特征图集合中每个特征图沿空间维度展开得到查询特征矩阵集合计算查询样本的位置编码矩阵矩阵g第κ行第ω列的值1≤κ≤h
′×w′
,1≤ω≤256,mod表示取余数运算;
35.(4-2)将查询特征矩阵集合和位置编码矩阵e输入到转换器子模块的编码器中,得到查询目标编码特征集合编码器由一个注意力层和两个全连接层组成,第j个查询目标编码特征层和两个全连接层组成,第j个查询目标编码特征表示逐元素相加操作,ffn(
·
)表示两个全连接层组成的前馈神经网络;
36.(4-3)将查询目标编码特征集合和步骤(2-6)中得到的目标融合矩阵集合输入到转换器子模块的解码器中,得到查询目标解码特征集合解码器由两个注意力层和两个全连接层组成,第j个查询目标解码特征
表示输入到第一个注意力层得到的中间结果矩阵,
37.(4-4)通过查询目标解码特征集合和步骤(3-6)得到的支持目标类向量集合计算查询集的目标预测类别概率,第j个查询样本中第m个目标属于第c类的概率1≤m≤m,表示矩阵第m行的向量;
38.(4-5)将查询目标解码特征集合输入到边界框预测子模块得到查询集的预测目标边界框集合边界框预测子模块为三个全连层组成的多层感知器,第j个查询样本的预测边界框矩阵中第m行表示第j个查询样本中第m个目标的预测边界框,为边界框的左上角坐标,为边界框的右下角坐标。
39.还进一步,步骤(5)具体是:
40.(5-1)通过查询集的目标预测类别概率和交叉熵损失函数计算目标分类损失和交叉熵损失函数计算目标分类损失y
j,m,c
∈{0,1}表示第j个查询样本中第m个目标属于第c类的真实标记值;
41.(5-2)通过查询集的预测目标边界框集合计算边界框损失计算边界框损失b
j,m
表示第j个查询样本中第m个目标的真实边界框,表示真实边界框与预测边界框的交并比;
42.(5-3)根据目标分类损失和边界框损失得到总损失利用利用随机梯度下降算法优化由坐标注意力引导模块、群组优化模块和查询目标预测模块组成的小样本目标检测模型,迭代训练该模型直至收敛,获得优化后的小样本目标检测模型;
43.(5-4)对新的图像数据集采样得到支持集和查询集输入上述优化后的小样本目标检测模型,按照步骤(1)~(4)依次执行,输出查询集中图像样本的目标类别概率和边界框集合选择概率最大目标类索引作为预测类别。
44.本发明提出的基于坐标注意力群组优化的小样本目标检测方法具有以下几个特
点:1)直接使用转换器模块检测查询集中的目标,不依赖生成的候选框;2)利用坐标注意力从特征图的两个空间方向捕获支持集中目标的空间位置特征,将目标空间特征融入目标参数矩阵,使检测器能根据支持集自适应地关注查询集中包含目标的区域;3)在群组优化模块中采用标签传播算法更新支持目标类向量,充分利用了支持集中不同目标间的相似关系,使得更新后的支持目标类向量在嵌入空间更具判别性。
45.本发明适用于小样本环境下的目标检测任务,有益效果包括:1)通过转换器模块直接预测查询目标的边界框和类别,避免新类与基类差异大时生成的候选框不准确;2)坐标注意力能捕获支持目标的关键空间位置特征,引导检测器能根据当前的目标空间位置特征动态地调整对查询样本中相关区域的关注,有效地提升了查询目标定位的精度;3)群组优化模块充分利用支持集中不同目标间的相似关系来更新支持目标类向量,得到更具判别性的支持目标类特征,有助于模型区分不同类别的目标,从而提高查询目标的分类准确率。本发明所具有的坐标注意力机制和群组优化机制,显著地提升了小样本目标检测模型的性能,可应用于工业产品缺陷检测、稀有动物检测等实际应用领域。
附图说明
46.图1是本发明方法的流程图。
具体实施方式
47.基于坐标注意力群组优化的小样本目标检测方法,如图1所示,首先对图像数据集采样得到支持集和查询集,利用深度视觉特征提取器得到支持特征图集合和查询特征图集合;接着将支持特征图集合和初始化的目标参数矩阵集输入坐标注意力引导模块,得到目标融合矩阵集合;再构建群组优化模块,支持特征图集合通过目标真实边界框和标签传播算法得到更新后的支持目标类向量集合;最后,将查询特征图集合、目标融合矩阵集合和支持目标类向量集合输入查询目标预测模块得到查询集中样本目标的边界框和类别。该方法利用坐标注意力捕获支持集中目标的空间位置特征,使检测器能自适应地关注查询集中包含目标的区域,提升查询目标定位的精度,同时通过群组优化模块得到区分性的支持目标类向量,从而提高查询目标的分类准确率。
48.该方法首先获取含有目标边界框和类别标注的图像数据集合,然后进行如下操作:
49.步骤(1)对图像数据集进行采样,获得支持集和查询集,将两者输入到深度视觉特征提取模块,输出支持特征图集合和查询特征图集合;具体是:
50.(1-1)首先将数据集中的图像缩放到相同大小,对图像样本进行不放回随机采样,得到支持集和查询集其中,为实数域,s表示“支持”(support),ns表示支持集中的图像样本个数,表示第i个支持图像样本,q表示“查询”(query),nq表示查询集中的图像样本个数,表示第j个查询图像样本,h表示图像高度,w表示图像宽度,3表示rgb通道数量;
51.每个支持图像样本有标注其中,φi表示中
的目标数,c
i,φ
∈{1,

,c}表示中第φ个目标的类别,表示中第φ个目标边界框的左上角和右下角坐标组成的四维向量,支持集中共包含ck个目标,ck=c
×
k,即c表示目标类别数,k表示每类目标数;
52.(1-2)构建由深度卷积网络和一个二维卷积层组成的深度视觉特征提取模块,其中,深度卷积网络是在imagenet数据集预训练的50层残差网络resnet-50(residual network),二维卷积层的卷积核尺寸为1
×
1;
53.(1-3)将支持集和查询集输入到深度视觉特征提取模块,得到支持特征图集合和查询特征图集合其中,表示第i个支持特征图,表示第j个查询特征图,h

、w

和256分别表示单个特征图的高、宽和通道数,
54.步骤(2)构建坐标注意力引导模块,输入为随机初始化的目标参数矩阵集合和支持特征图集合,输出为目标融合矩阵集合;具体是:
55.(2-1)随机初始化,得到目标参数矩阵集合其中aj表示第j个查询图像样本对应的目标参数矩阵,m表示单个查询图像样本中待检测的目标个数,256表示单个目标参数矩阵中行向量维度;构建坐标注意力引导模块,所述坐标注意力引导模块由坐标注意力子模块和交叉注意力子模块组成,其中坐标注意力子模块从特征图的水平和垂直两个方向计算各个坐标位置的权重,使得包含目标特征的位置区域权重更大,进而得到空间位置注意特征图集合,交叉注意力子模块用于融合目标参数矩阵集合与空间位置注意特征图集合;
56.(2-2)对第i个支持特征图分别沿水平坐标方向和垂直坐标方向做平均池化操作,得到水平特征图和垂直特征图hor表示“水平”(horizontal),ver表示“垂直”(vertical),表示张量第μ个通道中坐标位置为(h

,w

)处的值,1≤μ≤256,1≤h

≤h

,1≤w

≤w

,则:张量第μ个通道中坐标位置为(h

,1)处的值张量第μ个通道中坐标位置为(1,w

)处的值
57.(2-3)将水平特征图和垂直特征图依次输入二维卷积层和激活函数层,得到水平权重特征图和垂直权重特征图和垂直权重特征图和垂直权重特征图其中conv1(
·
)表示卷积核尺寸为1
×
1的二维卷积层,σ(
·
)表示sigmoid激活函数;
58.(2-4)根据支持特征图水平权重特征图和垂直权重特征图计算得到
空间位置注意特征图张量第μ个通道中坐标位置为(h

,w

)处的值)处的值表示张量第μ个通道中坐标位置为(h

,1)处的值,表示张量第μ个通道中坐标位置为(1,w

)处的值;
59.(2-5)对支持特征图集合中所有特征图执行步骤(2-2)~(2-4),得到空间位置注意特征图集合将集合中所有特征图的按空间维度展开并拼接,得到空间目标位置特征
60.(2-6)将目标参数矩阵集合中每个目标参数矩阵aj与空间目标位置特征输入到交叉注意力子模块中,得到目标融合矩阵集合到交叉注意力子模块中,得到目标融合矩阵集合softmax(
·
)为归一化指数函数,上标t表示转置操作。
61.步骤(3)构建群组优化模块,输入为支持特征图集合和支持集对应的边界框标注,输出为支持目标类向量集合;具体是:
62.(3-1)构建群组优化模块,群组是属于同一类别的支持目标集合,根据支持目标类标记和得到的支持目标向量集合计算支持目标概率矩阵和相似度矩阵,并通过支持目标概率矩阵和相似度矩阵得到群组传播矩阵;
63.(3-2)将步骤(1-3)中得到的支持特征图集合和步骤(1-1)中得到的每个支持图像样本对应标注中每个边界框b
i,φ
输入到感兴趣区域池化(regions of interest pooling,roi pooling)层中,得到支持目标特征图集合其中感兴趣区域池化层表示特征图在对应目标边界框区域内做最大池化操作,o
c,k
表示集合中第c类中第k个目标的特征图;
64.(3-3)对支持目标特征图集合依次通过卷积和全局平均池化操作,得到支持目标向量集合其中,集合中第c类中第k个目标的特征向量gap(
·
)表示在特征图空间维度上的全局平均池化操作,conv2(
·
)表示卷积核尺寸为3
×
3的二维卷积层;
65.(3-4)计算支持目标类向量集合通过支持目标类向量集合得到支持目标概率矩阵其中,集合中第c类的支持目标类向量矩阵p第u行第v列的值,表示第u个支持向量属于第v类的概率1≤u≤ck,1≤v≤c,u=(c-1)
×
k k,表示集合中第u个支
持目标向量,即exp(
·
)表示自然常数e为底的指数函数,dist(
·
,
·
)表示欧式距离函数,则
66.(3-5)利用高斯核函数计算支持目标向量间的相似度矩阵通过相似度矩阵z和支持目标概率矩阵p构建群组传播矩阵其中,矩阵z第u行第w列的值,表示支持目标向量和间的相似度1≤w≤ck,高斯核函数中的超参数γ>0,表示集合中第w个支持目标向量,群组传播矩阵λ=zp,λ中第u行第v列的值λ
u,v
表示支持目标向量根据样本间相似度加权求和得到的属于第v类的概率;
67.(3-6)初始化迭代上限值ψ,通过群组传播矩阵λ、相似度矩阵z和标签传播算法迭代优化支持目标概率矩阵p,直至迭代次数达到上限值ψ,得到更新后的支持目标概率矩阵p
(ψ)
,初始迭代时p
(0)
=p,λ
(0)
=λ,标签传播算法迭代为=λ,标签传播算法迭代为其中ψ取值范围为100≤ψ≤120,和表示第次迭代时的支持目标概率矩阵和群组传播矩阵,和表示矩阵第u行第v列的值和矩阵第u行第v列的值,和表示矩阵第u行第v列的值和第u行第c列的值;
68.(3-7)利用更新后的支持目标概率矩阵p
(ψ)
和支持目标向量集合计算得到新的支持目标类向量集合其中,集合中第c类的支持目标类向量p
(ψ)
表示第ψ次迭代结束后的目标概率矩阵,为矩阵p
(ψ)
第u行第c列的值,表示更新后第u个支持目标向量属于第c类的概率。
69.步骤(4)构建查询目标预测模块,输入为查询特征图集合、目标融合矩阵集合和支持目标类向量集合,输出为预测的查询目标边界框和类别概率;具体是:
70.(4-1)构建查询目标预测模块,模块由转换器(transformer)子模块、目标分类函数和边界框预测子模块组成;
71.将查询特征图集合中每个特征图沿空间维度展开得到查询特征矩阵集合计算查询样本的位置编码矩阵矩阵g第κ行第ω列的值1≤κ≤h
′×w′
,1≤ω≤256,mod表示取余数运算;
72.(4-2)将查询特征矩阵集合和位置编码矩阵e输入到转换器子模块的编码器
中,得到查询目标编码特征集合编码器由一个注意力层和两个全连接层组成,第j个查询目标编码特征层和两个全连接层组成,第j个查询目标编码特征表示逐元素相加操作,ffn(
·
)表示两个全连接层组成的前馈神经网络;
73.(4-3)将查询目标编码特征集合和步骤(2-6)中得到的目标融合矩阵集合输入到转换器子模块的解码器中,得到查询目标解码特征集合解码器由两个注意力层和两个全连接层组成,第j个查询目标解码特征解码器由两个注意力层和两个全连接层组成,第j个查询目标解码特征表示输入到第一个注意力层得到的中间结果矩阵,
74.(4-4)通过查询目标解码特征集合和步骤(3-6)得到的支持目标类向量集合计算查询集的目标预测类别概率,第j个查询样本中第m个目标属于第c类的概率1≤m≤m,表示矩阵第m行的向量;
75.(4-5)将查询目标解码特征集合输入到边界框预测子模块得到查询集的预测目标边界框集合边界框预测子模块为三个全连层组成的多层感知器,第j个查询样本的预测边界框矩阵中第m行表示第j个查询样本中第m个目标的预测边界框,为边界框的左上角坐标,为边界框的右下角坐标。
76.步骤(5)利用随机梯度下降算法优化由坐标注意力引导模块、群组优化模块和查询目标预测模块组成的小样本目标检测模型,对新的支持集和查询集通过步骤(1)~(4)得到查询集中图像的目标边界框和类别;具体是:
77.(5-1)通过查询集的目标预测类别概率和交叉熵损失函数计算目标分类损失和交叉熵损失函数计算目标分类损失y
j,m,c
∈{0,1}表示第j个查询样本中第m个目标属于第c类的真实标记值;
78.(5-2)通过查询集的预测目标边界框集合计算边界框损失计算边界框损失b
j,m
表示第j个查询样本中第m个目标的真实边界框,表示真实边界框与预测边界框的交并比;
79.(5-3)根据目标分类损失和边界框损失得到总损失利用利用随机梯度下降算法优化由坐标注意力引导模块、群组优化模块和查询目标预测模块组成的小样本目标检测模型,迭代训练该模型直至收敛,获得优化后的小样本目标检测模型;
80.(5-4)对新的图像数据集采样得到支持集和查询集输入上述优化后的小样本目标检测模型,按照步骤(1)~(4)依次执行,输出查询集中图像样本的目标类别概率和边界框集合选择概率最大目标类索引作为预测类别。
81.本实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围的不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献