一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种废品瓶多标签分类模型构建方法及废品瓶分类方法与流程

2022-04-02 05:36:13 来源:中国专利 TAG:


1.本发明属于图像处理技术领域,尤其涉及一种废品瓶多标签分类模型构建方法及废品瓶分类方法。


背景技术:

2.现有的废品瓶包含以下8个标签:蓝色、绿色、白色、其他颜色、破损、未破损、包装去除和包装未去除。因此标签之间并不存在明显依赖性。比如,绿色与白色瓶破损概率应当视作相同。
3.对于获取多个标签的语义关系,研究者运用多种结构来对标签之间的语义关系或者同现性进行建模。如提出使用循环神经网络(recurrent neural network,rnn)来对标签关系与依赖进行建模;又如提出使用图卷积网络(graph convolution network)来对标签共同出现对建立关联矩阵。此类方法虽然解决了训练多个独立二分类器方法的预测空间指数增长的问题,但不太适合垃圾塑料瓶的多标签任务。
4.其次,研究者还通过生成候选区域的方法在于将图像中包含对象的区域框选出来,然后用模型在对应区域进行特征提取和分类。如提出hypotheses-cnn-pooling(hcp)方法,在不需要真值候选框的前提下解决多标签图像分类问题;另外,又如提出random crop pooling(rcp)的方法,其随机缩放并裁剪的方式适合于图像内容复杂的情况。虽然相比传统滑动窗口生成候选区域的方式效率有不小提升,但在实际应用场景中仍然需要大量时间来生成候选区域。
5.其次,基于注意力机制的方法也被提出来。如recurrent attentional reinforcement learning(rarl)方法使用强化学习模块来迭代生成注意力区域与分类分数,类似地,recurrently discovering attentional regions(rdar)采取空间变换的方式生成注意力区域,进而计算分类分数。这两种方法虽然可以节省计算量,但所生成的区域所属类别未知,仍有待改进。
6.再者,有研究者提出spatial regularization network(srn)用注意力图获取标签之间的关系和空间语义,虽然也能降低计算量并提升分类性能,但同样由于标签关系的原因不适用于废品瓶分类任务。此外,废品瓶多标签分类要求模型能够检测瓶身破损,由于破损形态多样,因此大部分在公开数据集表现良好的方法,在废品瓶分类的任务中准确率不高。
7.因而,实有必要设计一种废品瓶多标签分类模型构建方法及废品瓶分类方法,提高废品瓶多标签分类的分类效率与分类准确率,减少废品瓶分类所需的计算量。


技术实现要素:

8.本发明的目的在于提供一种废品瓶多标签分类模型构建方法及废品瓶分类方法,旨在解决现有技术中废品瓶多标签分类的分类效率低下、分类准确率不高以及废品瓶分类所需计算量大的技术问题。
9.为实现上述目的,本发明实施例提供一种废品瓶多标签分类模型构建方法,其特征在于,包括:获取废品瓶图像数据集,根据所述废品瓶图像数据集,采用残差网络结构提取上下文特征,构建残差学习模型;其中,所述废品瓶图像数据集包括废品瓶图像数据和废品瓶图像类别标签;结合通道注意力机制与空间注意力机制,提取废品瓶图像数据集的分类特征,构建混合注意力模型;基于混合注意力模型输出的特征图像,生成标签分类数值,构建自注意力模型;根据所述残差学习模型、所述混合注意力模型和所述自注意力模型,构建废品瓶多标签分类模型。
10.可选地,所述结合通道注意力机制与空间注意力机制,提取废品瓶图像数据集的分类特征,构建混合注意力模型的步骤,具体包括:
11.在构建残差学习模块并从废品瓶图像数据集中提取上下文特征后,构建通道注意力单元并输入特征图像,所述通道注意力单元用于对特征图像进行加权,平衡残差学习模型输出特征图像在不同通道的权重;
12.构建空间注意力单元并输入通道注意力单元处理输出后的特征图像,所述空间注意力单元用于对特征图像的位置生成对应的权重,提取特征图像中的关键空间位置,对特征图像进行加权,使特征图像的分类特征更加突出。
13.可选地,所述在构建残差学习模块并从废品瓶图像数据集中提取上下文特征后,构建通道注意力单元并输入特征图像,所述通道注意力单元用于对特征图像进行加权,平衡残差学习模型输出特征图像在不同通道的权重的步骤,具体包括:
14.获取经残差网络模型提取上下文特征后的特征图像,输入至所述通道注意力单元,提取通道信息;
15.将输入的特征图像分别进行最大池化和平均池化操作;
16.分别获取经最大池化操作和平均池化操作后的特征图像,输入至多层感知机中,其中,所述多层感知机由两个线性连接层和一个激活函数组成;
17.对多层感知机输出的特征图像进行元素加操作,并通过sigmoid函数转换成通道注意力向量;
18.将残差网络模型输入的特征图像与通道注意力向量进行元素乘操作,输出特征图像。
19.可选地,所述构建空间注意力单元并输入通道注意力单元处理输出后的特征图像,所述空间注意力单元用于对特征图像的位置生成对应的权重,提取特征图像中的关键空间位置,对特征图像进行加权,使特征图像的分类特征更加突出的步骤,具体包括:
20.获取经通道注意力单元输出的特征图像,输入至所述空间注意力单元中,提取空间信息;
21.将输入的特征图像分别进行最大池化和平均池化操作;
22.对经最大池化操作和平均池化操作后的特征图像进行通道拼接操作;
23.将经过通过通道拼接操作后的特征图像传入卷积核大小为3
×
3的卷积层中,融合成单通道特征图像,并通过sigmoid函数将特征图像转换成空间注意力向量;
24.将通道注意力单元输入的特征图像与空间注意力向量进行元素乘操作,输出特征图像。
25.可选地,所述基于混合注意力模型输出的特征图像,生成标签分类数值,构建自注
意力模型的步骤,具体包括:
26.获取混合注意力模型输出的特征图像,输入至所述自注意力模型中,
27.对输入的特征图像传入卷积核大小为1
×
1的卷积层中,通过卷积输出特征图像并获取卷积层权重参数,
28.对卷积层权重参数做二范数操作,得到自注意力向量;
29.将卷积输出的特征图像与自注意力向量做元素除操作,并对做元素除操作后的特征图做求平均操作,得到各标签分类分数。
30.可选地,所述获取废品瓶图像数据集,根据所述废品瓶图像数据集,采用残差网络结构提取上下文特征,构建残差学习模型的步骤,具体包括:
31.获取废品瓶图像数据集,将废品瓶图像数据集的特征图输入至残差网络结构的权重层中,残差网络结构的权重层由多个卷积层、bn层和relu层组成;
32.将残差网络结构的权重层输出的特征图像至最大池化层,进行最大池化操作;
33.将最大池化层输出的特征图像依次输出至多个res层,多个所述res层由瓶颈层构成,提取特征图像的特征。
34.可选地,所述残差网络结构为resnet101。
35.本发明还提供一种废品瓶分类方法,包括:
36.获取废品瓶图像数据集,其中,所述废品瓶图像数据集包括废品瓶图像数据和废品瓶图像类别标签;
37.加载所述的废品瓶多标签分类模型构建方法所构建的废品瓶多标签分类模型,将废品瓶图像数据集按照批次依序输入至废品瓶多标签分类模型中,对废品瓶模型进行训练;
38.将待分类图像输入至训练完毕的废品瓶多标签分类模型中,获取待分类图像的识别结果。
39.本发明还提供一种废品瓶多标签分类模型构建装置,包括:
40.残差学习模型构建模块,所述残差学习模型构建模块用于获取废品瓶图像数据集,根据所述废品瓶图像数据集,采用残差网络结构提取上下文特征,构建残差学习模型;其中,所述废品瓶图像数据集包括废品瓶图像数据和废品瓶图像类别标签;
41.混合注意力模型构建模块,所述混合注意力模型构建模块用于结合通道注意力机制与空间注意力机制,提取废品瓶图像数据集的分类特征,构建混合注意力模型;
42.自注意力模型构建模块,所述自注意力模型构建模块用于基于混合注意力模型输出的特征图像,生成标签分类数值,构建自注意力模型;
43.废品瓶多标签分类模型构建模块,所述废品瓶多标签分类模型构建模块用于根据所述残差学习模型、所述混合注意力模型和所述自注意力模型,构建废品瓶多标签分类模型。
44.本发明还提供一种废品瓶分类装置,包括:
45.图像特征获取模块,所述图像特征获取模块用于获取废品瓶图像数据集,其中,所述废品瓶图像数据集包括废品瓶图像数据和废品瓶图像类别标签;
46.废品瓶多标签分类模型训练模块,所述废品瓶多标签分类模型训练模块用于加载所述的废品瓶多标签分类模型构建方法所构建的废品瓶多标签分类模型,将废品瓶图像数
据集按照批次依序输入至废品瓶多标签分类模型中,对废品瓶模型进行训练;
47.图像识别模块,所述图像识别模块用于将待分类图像输入至训练完毕的废品瓶多标签分类模型中,获取待分类图像的识别结果。
48.本发明实施例提供的废品瓶多标签分类模型构建方法中的上述一个或多个技术方案至少具有如下技术效果之一:
49.本发明通过设置残差学习模型,通过预训练残差网络结构提取废品瓶的上下文特征,使残差学习模型学习先验知识,缩短废品瓶多标签分类模型所需的训练时间,使废品瓶模型收敛的效果提升,并减小训练所需的训练数据集的大小,大幅减少人工标注数据集的成本;通过设置结合通道注意力机制和空间注意力机制的混合注意力模型,从特征图像中提取更多显著分类特征;还通过设置所述自注意力模型,获取标签分类数值。自注意力机制采取自身参数计算注意力向量,结合特征图提升分类效果,而无需新增额外参数,减少模型参数量。通过将标签分类数值与预设的标准阈值进行比较,转换成相对应的标签,得到废品瓶对应的类别,由此,所述废品瓶多标签分类模型通过结合所述残差学习模型、所述混合注意力模型和所述自注意力模型,能够显著提高废品瓶多标签分类的准确性。
50.本发明实施例提供的废品瓶分类方法中的上述一个或多个技术方案至少具有如下技术效果之一:
51.通过将废品瓶图像输入至所述废品瓶多标签分类模型中,对废品瓶多标签分类模型进行训练,使经分类后的废品瓶多标签分类模型能够识别待分类图像,获取待分类图像的识别结果,有效提升废品瓶多标签分类的正确率,且因所述废品瓶分类方法应用了所述废品瓶多标签分类模型,故所述废品瓶分类方法亦具有所述废品瓶多标签分类模型的技术效果。
附图说明
52.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
53.图1为本发明实施例提供的废品瓶多标签分类模型构建方法的流程图;
54.图2为本发明实施例提供的构建残差学习模型的流程图;
55.图3为本发明实施例提供的构建通道注意力单元和空间注意力单元的流程图;
56.图4为本发明实施例提供的构建通道注意力单元的流程图;
57.图5为本发明实施例提供的构建空间注意力单元的流程图;
58.图6为本发明实施例提供的构建自注意力模型的流程图;
59.图7为本发明实施例提供的废品瓶分类方法的流程图;
60.图8为本发明实施例提供的废品瓶多标签分类模型构建装置的结构框图;
61.图9为本发明实施例提供的废品瓶分类装置提供的结构框图;
62.图10为本发明实施例提供的计算机设备的结构框图。
具体实施方式
63.以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本技术的描述。
64.应当理解,当在本技术说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
65.还应当理解,在本技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
66.如在本技术说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
[0067]
另外,在本技术说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0068]
在本技术说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本技术的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
[0069]
在本发明的一个实施例中,如图1所示,提供一种废品瓶多标签分类模型构建方法,其特征在于,包括:
[0070]
s100:获取废品瓶图像数据集,根据所述废品瓶图像数据集,采用残差网络结构提取上下文特征,构建残差学习模型;其中,所述废品瓶图像数据集包括废品瓶图像数据和废品瓶图像类别标签;
[0071]
s200:结合通道注意力机制与空间注意力机制,提取废品瓶图像数据集的分类特征,构建混合注意力模型;
[0072]
s300:基于混合注意力模型输出的特征图像,生成标签分类数值,构建自注意力模型;
[0073]
s400:根据所述残差学习模型、所述混合注意力模型和所述自注意力模型,构建废品瓶多标签分类模型。
[0074]
本发明通过设置残差学习模型,通过预训练残差网络结构提取废品瓶的上下文特征,使残差学习模型学习先验知识,缩短废品瓶多标签分类模型所需的训练时间,使废品瓶模型收敛的效果提升,并减小训练所需的训练数据集的大小,大幅减少人工标注数据集的成本;通过设置结合通道注意力机制和空间注意力机制的混合注意力模型,从特征图像中提取更多显著分类特征;还通过设置所述自注意力模型,获取标签分类数值。自注意力机制采取自身参数计算注意力向量,结合特征图提升分类效果,而无需新增额外参数,减少模型
参数量。通过将标签分类数值与预设的标准阈值进行比较,转换成相对应的标签,得到废品瓶对应的类别,由此,所述废品瓶多标签分类模型通过结合所述残差学习模型、所述混合注意力模型和所述自注意力模型,能够显著提高废品瓶多标签分类的准确性。
[0075]
具体地,在本发明的另一个实施例中,如图3所示,所述结合通道注意力机制与空间注意力机制,提取废品瓶图像数据集的分类特征,构建混合注意力模型的步骤,包括:
[0076]
s210:在构建残差学习模块并从废品瓶图像数据集中提取上下文特征后,构建通道注意力单元并输入特征图像,所述通道注意力单元用于对特征图像进行加权,平衡残差学习模型输出特征图像在不同通道的权重;
[0077]
s220:构建空间注意力单元并输入通道注意力单元处理输出后的特征图像,所述空间注意力单元用于对特征图像的位置生成对应的权重,提取特征图像中的关键空间位置,对特征图像进行加权,使特征图像的分类特征更加突出。
[0078]
所述通道注意力单元负责平衡输出特征图中不同通道的权重,所述通道注意力单元可以帮助混合注意力模型学习到废品瓶的种类。而空间注意力单元使所述混合注意力模型聚焦在重要的空间位置,使空间注意力单元则可以帮助混合注意力模型学习到废品瓶的关键位置。因此,有必要结合通道注意力单元和空间注意力单元为一个混合注意力模型。
[0079]
具体地,在本发明的另一个实施例中,如图4所示,所述在构建残差学习模块并从废品瓶图像数据集中提取上下文特征后,构建通道注意力单元并输入特征图像,所述通道注意力单元用于对特征图像进行加权,平衡残差学习模型输出特征图像在不同通道的权重的步骤,具体包括:
[0080]
s211:获取经残差网络模型提取上下文特征后的特征图像,输入至所述通道注意力单元,提取通道信息;
[0081]
s212:将输入的特征图像分别进行最大池化和平均池化操作;
[0082]
具体地,在本步骤中,将输入的特征图像并行的进行最大池化和平均池化操作,通过使用平均池化和最大池化聚合了特征图像的通道信息。生成两个输出结果,分别表示平均池化特征和最大池化特征,然后将输出的这两个特征并行地传递到多层感知机中。
[0083]
s213:分别获取经最大池化操作和平均池化操作后的特征图像,输入至多层感知机中,其中,所述多层感知机由两个线性连接层和一个激活函数组成;
[0084]
在本步骤中,所述线性连接层包括线性输入连接层与线性输出连接层,所述线性输入连接层接收池化操作的输出结果,并输出至激活函数relu,所述激活函数relu输出至所述线性输出连接层,由所述线性输出连接层输出特征向量。其中,所述线性输入连接层和所述线性输出连接层的输出通道数均为2048。
[0085]
s214:对多层感知机输出的特征图像进行元素加操作,并通过sigmoid函数转换成通道注意力向量;
[0086]
在本步骤中,通过使用元素求和的方法合并从所述线性输出连接层所输出的特征向量,生成通道注意力的特征图像,并通过将该通道注意力的特征图像结合sigmoid函数计算,获取通道注意力向量。
[0087]
s215:将残差网络模型输入的特征图像与通道注意力向量进行元素乘操作,输出特征图像。
[0088]
在本步骤中,获取进入通道注意力单元时的特征图像,即从所述残差网络模型输
入的特征图像,将该特征图像与通道注意力向量进行元素乘的操作,得到空间注意力单元所需的输入特征图像。
[0089]
具体地,在本发明的另一个实施例中,如图5所示,所述构建空间注意力单元并输入通道注意力单元处理输出后的特征图像,所述空间注意力单元用于对特征图像的位置生成对应的权重,提取特征图像中的关键空间位置,对特征图像进行加权,使特征图像的分类特征更加突出的步骤,具体包括:
[0090]
s221:获取经通道注意力单元输出的特征图像,输入至所述空间注意力单元中,提取空间信息;
[0091]
s222:将输入的特征图像分别进行最大池化和平均池化操作;
[0092]
s223:对经最大池化操作和平均池化操作后的特征图像进行通道拼接操作;
[0093]
s224:将经过通过通道拼接操作后的特征图像传入卷积核大小为3
×
3的卷积层中,融合成单通道特征图像,并通过sigmoid函数将特征图像转换成空间注意力向量;
[0094]
s225:将通道注意力单元输入的特征图像与空间注意力向量进行元素乘操作,输出特征图像。
[0095]
具体地,通过利用特征图像之间的空间关系生成空间注意力图,执行平均池化与最大池化操作,生成通道上的平均池化特征与最大池化特征,通过对平均池化特征和最大池化特征进行通道拼接操作,由一个卷积层融合呈单通道特征图,其中,所述卷积层的卷积核大小为3
×
3,输入通道数为2,输出通道数为1。同理,通过运用sigmoid函数,将该特征图像转换成空间注意力向量,再将该空间注意力向量与通道注意力单元输入到该空间注意力单元的特征图像进行元素乘,生成的自注意力模型所需的特征图像。
[0096]
具体地,在本发明的另一个实施例中,如图6所示,所述基于混合注意力模型输出的特征图像,生成标签分类数值,构建自注意力模型的步骤,具体包括:
[0097]
s310:获取混合注意力模型输出的特征图像,输入至所述自注意力模型中,
[0098]
s320:对输入的特征图像传入卷积核大小为1
×
1的卷积层中,通过卷积输出特征图像并获取卷积层权重参数,其中,输入通道数为2048,输出通道数为c,c为类别数。
[0099]
s330:对卷积层权重参数做二范数操作,得到自注意力向量;
[0100]
s340:将卷积输出的特征图像与自注意力向量做元素除操作,并对做元素除操作后的特征图做求平均操作,得到各标签分类分数。
[0101]
所述自注意力模型在混合注意力模型输出的特征图的基础上生成标签分类分数,其自注意力机制采取自身参数计算注意力向量,结合特征图提升分类效果,而无需新增额外参数,减少废品瓶多标签分类模型的参数量。并由自注意力模型将标签分类分数与预设的标准阈值进行比较,转换成相对应的标签。由此,使自注意力模型在不增加废品瓶多标签分类模型的参数量的情况下,提高生成每个标签分类分数的准确性。具体地,在一个实施例中,破损标签预设的标准阈值为标签分类分数为大于0.5,则当生成的标签分类分数大于0.5时,则认为该图像属于破损标签的类别。
[0102]
具体地,在本发明的另一个实施例中,如图2所示,所述获取废品瓶图像数据集,根据所述废品瓶图像数据集,采用残差网络结构提取上下文特征,构建残差学习模型的步骤,具体包括:
[0103]
s110:获取废品瓶图像数据集,将废品瓶图像数据集的特征图输入至残差网络结
构的权重层中,残差网络结构的权重层由多个卷积层、bn层和relu层组成;进一步地,所述残差网络结构为resnet101。
[0104]
s120:将残差网络结构的权重层输出的特征图像至最大池化层,进行最大池化操作;
[0105]
s130:将最大池化层输出的特征图像依次输出至多个res层,多个所述res层由瓶颈层构成,提取特征图像的特征。在本步骤中,所述res层的数量为4层,所述res层的第一层包括3个瓶颈层,所述res层的第二层包括4个瓶颈层,所述res层的第三层包括23个瓶颈层,所述res层的第四层包括3个瓶颈层。通过设置较深的网络结构,可以更好的提取废品瓶图像数据集中复杂的特征,且通过选用残差网络结构,能够有效防止网络层数过深时出现退化的现象。
[0106]
具体地,通过采用预训练的残差网络,大幅减少模型训练时所需数据集的大小,有效节省了训练所需的时间,使废品瓶多标签分类模型收敛效果更佳,并减少标注数据集的人工工作量。
[0107]
本发明还提供一种废品瓶分类方法,包括:
[0108]
s500:获取废品瓶图像数据集,其中,所述废品瓶图像数据集包括废品瓶图像数据和废品瓶图像类别标签。在一个实施例中,所述废品瓶图像数据集包括3224张图片,每一张图片根据以下八个标签进行二元标注:蓝色、绿色、白色、其他颜色、破损、未破损、包装去除和包装未去除。
[0109]
s600:加载所述的废品瓶多标签分类模型构建方法所构建的废品瓶多标签分类模型,将废品瓶图像数据集按照批次依序输入至废品瓶多标签分类模型中,对废品瓶模型进行训练。具体地,在本步骤中,在所述废品瓶多标签分类模型构建完毕后,将废品瓶图像数据集依序输入至废品瓶多标签分类模型中。将该废品瓶图像数据集输入至所述废品瓶多标签分类模型中,通过二元交叉熵损失函数(bceloss)计算损失并反复迭代,优化废品瓶多标签分类模型。
[0110]
s700:将待分类图像输入至训练完毕的废品瓶多标签分类模型中,获取待分类图像的识别结果。
[0111]
通过将废品瓶图像输入至所述废品瓶多标签分类模型中,对废品瓶多标签分类模型进行训练,使经分类后的废品瓶多标签分类模型能够识别待分类图像,获取待分类图像的识别结果,有效提升废品瓶多标签分类的正确率,且因所述废品瓶分类方法应用了所述废品瓶多标签分类模型,故所述废品瓶分类方法亦具有所述废品瓶多标签分类模型的技术效果。
[0112]
本发明还提供一种废品瓶分类的注意力序列框架模型构建装置,如图8所示,包括:
[0113]
残差学习模型构建模块,所述残差学习模型构建模块用于获取废品瓶图像数据集,根据所述废品瓶图像数据集,采用残差网络结构提取上下文特征,构建残差学习模型;其中,所述废品瓶图像数据集包括废品瓶图像数据和废品瓶图像类别标签;
[0114]
混合注意力模型构建模块,所述混合注意力模型构建模块用于结合通道注意力机制与空间注意力机制,提取废品瓶图像数据集的分类特征,构建混合注意力模型;
[0115]
自注意力模型构建模块,所述自注意力模型构建模块用于基于混合注意力模型输
出的特征图像,生成标签分类数值,构建自注意力模型;
[0116]
废品瓶多标签分类模型构建模块,所述废品瓶多标签分类模型构建模块用于根据所述残差学习模型、所述混合注意力模型和所述自注意力模型,构建废品瓶多标签分类模型。
[0117]
在本发明的另一个实施例中,所述混合注意力模型构建模块还用于:
[0118]
在构建残差学习模块并从废品瓶图像数据集中提取上下文特征后,构建通道注意力单元并输入特征图像,所述通道注意力单元用于对特征图像进行加权,平衡残差学习模型输出特征图像在不同通道的权重;
[0119]
构建空间注意力单元并输入通道注意力单元处理输出后的特征图像,所述空间注意力单元用于对特征图像的位置生成对应的权重,提取特征图像中的关键空间位置,对特征图像进行加权,使特征图像的分类特征更加突出。
[0120]
在本发明的另一个实施例中,所述混合注意力模型构建模块还用于:
[0121]
获取经残差网络模型提取上下文特征后的特征图像,输入至所述通道注意力单元,提取通道信息;
[0122]
将输入的特征图像分别进行最大池化和平均池化操作;
[0123]
分别获取经最大池化操作和平均池化操作后的特征图像,输入至多层感知机中,其中,所述多层感知机由两个线性连接层和一个激活函数组成;
[0124]
对多层感知机输出的特征图像进行元素加操作,并通过sigmoid函数转换成通道注意力向量;
[0125]
将残差网络模型输入的特征图像与通道注意力向量进行元素乘操作,输出特征图像。
[0126]
在本发明的另一个实施例中,所述混合注意力模型构建模块还用于:
[0127]
获取经通道注意力单元输出的特征图像,输入至所述空间注意力单元中,提取空间信息;
[0128]
将输入的特征图像分别进行最大池化和平均池化操作;
[0129]
对经最大池化操作和平均池化操作后的特征图像进行通道拼接操作;
[0130]
将经过通过通道拼接操作后的特征图像传入卷积核大小为3
×
3的卷积层中,融合成单通道特征图像,并通过sigmoid函数将特征图像转换成空间注意力向量;
[0131]
将通道注意力单元输入的特征图像与空间注意力向量进行元素乘操作,输出特征图像。
[0132]
在本发明的另一个实施例中,所述自注意力模型构建模块还用于:
[0133]
获取混合注意力模型输出的特征图像,输入至所述自注意力模型中,
[0134]
对输入的特征图像传入卷积核大小为1
×
1的卷积层中,通过卷积输出特征图像并获取卷积层权重参数,其中,输入通道数为2048,输出通道数为c,c为类别数。
[0135]
对卷积层权重参数做二范数操作,得到自注意力向量;
[0136]
将卷积输出的特征图像与自注意力向量做元素除操作,并对做元素除操作后的特征图做求平均操作,得到各标签分类分数。
[0137]
在本发明的另一个实施例中,所述残差学习模型构建模块还用于:
[0138]
获取废品瓶图像数据集,将废品瓶图像数据集的特征图输入至残差网络结构的权
重层中,残差网络结构的权重层由多个卷积层、bn层和relu层组成;
[0139]
将残差网络结构的权重层输出的特征图像至最大池化层,进行最大池化操作;
[0140]
将最大池化层输出的特征图像依次输出至多个res层,多个所述res层由瓶颈层构成,提取特征图像的特征。
[0141]
本发明还提供一种废品瓶分类装置,如图9所示,包括:
[0142]
图像特征获取模块,所述图像特征获取模块用于获取废品瓶图像数据集,其中,所述废品瓶图像数据集包括废品瓶图像数据和废品瓶图像类别标签;
[0143]
废品瓶多标签分类模型训练模块,所述废品瓶多标签分类模型训练模块用于加载所述的废品瓶多标签分类模型构建方法所构建的废品瓶多标签分类模型,将废品瓶图像数据集按照批次依序输入至废品瓶多标签分类模型中,对废品瓶模型进行训练;
[0144]
图像识别模块,所述图像识别模块用于将待分类图像输入至训练完毕的废品瓶多标签分类模型中,获取待分类图像的识别结果。
[0145]
在本发明的另一个实施例中,还提供一种计算机设备,包括一个或多个处理器、存储器;以及一个或多个程序,其中一个或多个程序被存储到存储器中,并且被配置成由一个或多个处理器执行,所述程序包括用于执行废品瓶多标签分类模型构建方法的控制指令。
[0146]
所述计算机设备可以是终端,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现废品瓶多标签分类模型构建方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
[0147]
在本发明的另一个实施例中,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述废品瓶多标签分类模型构建方法的步骤。
[0148]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
[0149]
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献