一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于单正类图像建立的图像分类方法和装置、存储介质和计算机与流程

2022-02-25 18:50:32 来源:中国专利 TAG:


1.本发明涉及机器学习与图像学领域,尤其涉及一种基于单正类图像建立的图像分类方法和装置、存储介质和计算机。


背景技术:

2.深度学习凭借其在识别应用中较高的预测准确率,在图像分类、图像语义分割领域中表现不凡,主要利用卷积神经网络(cnn),在图像中寻找特征,或将目标从背景中分离出来,或将不同类别的目标区分开来。
3.然而,建立一个优质的神经网络模型的前提,就是拥有一个优质的图像训练集,这不仅在数量上有所要求,还需针对环境差异化具有一定容纳性,这一点在工业应用时尤为重要,因为造成图片变化的不可抗因素极多,工业环境中,光源、相机、镜头等硬件性能的衰落,外部环境的变化与干扰,都会影响到模型的鲁棒性,但在已有的图像数据中无法完全体现出来。
4.然而,在有些应用场景中,只有正图像样本,没有负图像样本,在这种情况下如何训练出预测准确率高的图像分类模型是一个很大的挑战。


技术实现要素:

5.本发明的目的在于提供一种基于单正类图像建立的图像分类方法和装置、存储介质和计算机,其可以仅基于单一正类图像进行训练进而对图像进行高准确率的分类。
6.为实现发明目的,根据本发明的一个方面,本发明提供一种基于单正类图像建立的图像分类方法,其包括:提供单正类图像集、编码神经网络模型、解码神经网络模型和单类支持向量机模型,其中所述单正类图像集包括多张正类图像;将所述单正类图像集中的正类图像输入所述编码神经网络模型以对所述编码神经网络模型进行训练,此时所述编码神经网络模型提取所述正类图像的特征,所述解码神经网络模型基于所述编码神经网络模型提取的特征解码出还原图像,经过训练得到最终的编码神经网络模型;将最终的编码经网络模型提取的各个正类图像的特征输入所述单类支持向量机模型进行训练以划分正类图像范围,得到最终的单类支持向量机模型;将待检测图像输入最终的编码神经网络模型进行特征提取,最终的单类支持向量机模型基于最终的编码神经网络模型提取的特征进行图像分类以判断所述待检测图像是否为正类图像。
7.根据本发明的另一个方面,本发明提供一种基于单正类图像建立的图像分类装置,其包括:编码神经网络模型,其被配置的接收单正类图像集中的正类图像以进行训练,此时所述编码神经网络模型提取所述正类图像的特征,经过训练得到最终的编码神经网络模型;解码神经网络模型,其被配置的基于所述编码神经网络模型提取的特征解码出还原图像;和单类支持向量机模型,其被配置的接收最终的编码经网络模型提取的各个正类图像的特征以进行训练,进而划分正类图像范围,得到最终的单类支持向量机模型,其中将待
检测图像输入最终的编码神经网络模型进行特征提取,最终的单类支持向量机模型基于最终的编码神经网络模型提取的特征进行图像分类以判断所述待检测图像是否为正类图像。
8.根据本发明的另外一个方面,本发明提供一种存储介质,其存储有程序指令,在所述程序执行被运行以执行上述基于单正类图像建立的图像分类方法。所述基于单正类图像建立的图像分类方法,其包括:提供单正类图像集、编码神经网络模型、解码神经网络模型和单类支持向量机模型,其中所述单正类图像集包括多张正类图像;将所述单正类图像集中的正类图像输入所述编码神经网络模型以对所述编码神经网络模型进行训练,此时所述编码神经网络模型提取所述正类图像的特征,所述解码神经网络模型基于所述编码神经网络模型提取的特征解码出还原图像,经过训练得到最终的编码神经网络模型;将最终的编码经网络模型提取的各个正类图像的特征输入所述单类支持向量机模型进行训练以划分正类图像范围,得到最终的单类支持向量机模型;将待检测图像输入最终的编码神经网络模型进行特征提取,最终的单类支持向量机模型基于最终的编码神经网络模型提取的特征进行图像分类以判断所述待检测图像是否为正类图像。
9.根据本发明的另外一个方面,本发明提一种计算机,其包括处理器和存储器,所述存储器中存储有程序指令,所述处理器运行所述程序指令以执行上述基于单正类图像建立的图像分类方法。所述基于单正类图像建立的图像分类方法,其包括:提供单正类图像集、编码神经网络模型、解码神经网络模型和单类支持向量机模型,其中所述单正类图像集包括多张正类图像;将所述单正类图像集中的正类图像输入所述编码神经网络模型以对所述编码神经网络模型进行训练,此时所述编码神经网络模型提取所述正类图像的特征,所述解码神经网络模型基于所述编码神经网络模型提取的特征解码出还原图像,经过训练得到最终的编码神经网络模型;将最终的编码经网络模型提取的各个正类图像的特征输入所述单类支持向量机模型进行训练以划分正类图像范围,得到最终的单类支持向量机模型;将待检测图像输入最终的编码神经网络模型进行特征提取,最终的单类支持向量机模型基于最终的编码神经网络模型提取的特征进行图像分类以判断所述待检测图像是否为正类图像。
10.与现有技术相比,本发明利用单一正类图像训练编码神经网络,当编码神经网络能够提取到输入的正类图像的合适特征时,用提取到的特征训练单类支持向量机模型以划分正类图像范围,最后利用训练好的编码神经网络和单类支持向量机模型共同对待检测图像进行正负分类,最终准确了也比较高。
附图说明
11.图1为本发明的基于单正类图像建立的图像分类方法在一个实施例中的流程示意图;
12.图2为本发明中的基于单正类图像建立的图像分类装置在一个实施例中的示意图;和
13.图3为本发明中的编码神经网络模型和解码神经网络模型在一个实施例中的结构示意图。
具体实施方式
14.为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明的具体实施方式、结构、特征及其功效,详细说明如下。
15.图1为本发明的基于单正类图像建立的图像分类方法100在一个实施例中的流程示意图。如图1所示的,所述基于单正类图像建立的图像分类方法100包括如下步骤或操作。
16.步骤110,结合图2所示的,提供单正类图像集、编码神经网络模型210、解码神经网络模型220和单类支持向量机模型230(oneclasssvm)。
17.所述单正类图像集包括多张正类图像,“单正类图像集”的含义是这个图像集中只有正类图像,没有负类图像。“单正类图像”意思是单一的正类图像,本发明中的图像分类仅对待检测图像是否是正类图像进行判断。
18.优选的,所述单正类图像集中的正类图像已经过尺寸归一化处理。
19.很显然,单正类图像集、编码神经网络模型、解码神经网络模型和单类支持向量机模型可以在同一步骤中被提供,也可以在不同步骤中被提供,这取决于需要和选择。
20.步骤120,将所述单正类图像集中的正类图像输入所述编码神经网络模型210以对所述编码神经网络模型210进行训练,此时所述编码神经网络模型210提取所述正类图像的特征,所述解码神经网络模型220基于所述编码神经网络模型提取的特征解码出还原图像,经过训练得到最终的编码神经网络模型。
21.具体的,在对所述编码神经网络模型210的训练过程中,通过比对输入所述编码神经网络模型210的正类图像以及所述解码神经网络模型220输出的还原图像,调整所述编码神经网络模型210的参数和结构以保证所述编码神经网络模型210能够提取到合适的特征,以使得所述解码神经网络模型220能够得到合适的还原图像。
22.在一个实施例中,所述编码神经网络模型用于对输入的正类图像进行下采样提取高维特征,所述解码神经网络模型220用于对所述高维特征进行上采样得到所述还原图像,通过比对输入所述编码神经网络模型210的正类图像以及所述解码神经网络模型220输出的还原图像,所述编码神经网络模型210是否提取到了合适的特征,如果所述编码神经网络模型210未提取到合适的特征,则调整所述编码神经网络模型210的参数和结构继续进行训练,直到所述编码神经网络模型210能够提取到合适的特征。
23.结合图3所示的,所述编码神经网络模型210包括一个编码单元或串联的多个编码单元,在图3中示例性的给出了两个编码单元211和212,在其他实施例中也可以只有一个编码单元,还可以有更多个编码单元。每个编码单元包括依次连接的一层卷积层、一层激活层和一层池化层,最后的编码单元输出提取的特征。如图3,第二编码单元212输出提取的特征。所述解码神经网络模型220包括一个解码单元或串联的多个解码单元,在图3中示例性的给出了两个解码单元221和222,在其他实施例中也可以只有一个解码单元,还可以有更多个解码单元。每个解码单元包括依次连接的一层反卷积层和一层激活层,最后的解码单元输出还原图像。如图3,第二解码单元222输出还原图像。
24.优选的,所述编码神经网络模型210可以采用跳跃结构,此时,每个编码单元的输入还与自己的输出以及后续的编码单元的输出进行通道叠加或数值相加。具体的,第一编码单元211的输入与自己的输出以及后续的第二编码单元212的输出进行通道叠加或数值相加。同样的,所述解码神经网络模型也可以采用跳跃结构,此时,每个解码单元的输入还
与自己的输出以及后续的解码单元的输出进行通道叠加或数值相加。具体的,第一编码单元221的输入与自己的输出以及后续第二解码单元222的输出进行通道叠加或数值相加。
25.步骤130,结合图2所示的,将最终的编码经网络模型210提取的各个正类图像的特征输入所述单类支持向量机模型230进行训练以划分正类图像范围,得到最终的单类支持向量机模型230。
26.具体的,单类支持向量机模型230对其提取的特征进行映射,检测时可以通过提取的特征的映射是否处于构建的特征映射范围内进行判断是否是正类图像。
27.步骤140,将待检测图像输入最终的编码神经网络模型210进行特征提取,最终的单类支持向量机模型230基于最终的编码神经网络模型提取的特征进行图像分类以判断所述待检测图像是否为正类图像。
28.这样,就可以实现待检测图像的分类。有的待检测图像也可以被称为测试图像,如果经过多个测试图像的测试,发现分类的准确率不高,那么就需要重新对单类支持向量机模型230进行参数和结构优化,之后重新对单类支持向量机模型230进行训练得到最终的单类支持向量机模型230,最后进行再次的测试。可见,本发明利用单一正类图像就可以训练得到准确率较高的图像分类器,解决了有些应用场景下只有单一类图像无法训练图像分类器的问题。
29.在一个应用实例中,最后输入测试集,使用编码神经网络模型210提取特征,利用单类支持向量机模型230对测试图像进行检测,最终准确率70%左右。
30.根据本发明的另一个方面,本发明还可以实现为一种基于单正类图像建立的图像分类装置200。图2为本发明中的图像分类装置200在一个实施例中的结构示意图。所述图像分类装置200包括编码神经网络模型210、解码神经网络模型220和单类支持向量机模型230(oneclasssvm)。
31.所述编码神经网络模型210被配置的接收单正类图像集中的正类图像以进行训练,此时所述编码神经网络模型提取所述正类图像的特征,经过训练得到最终的编码神经网络模型。所述编码神经网络模型220被配置的基于所述编码神经网络模型提取的特征解码出还原图像。所述单类支持向量机模型230被配置的接收最终的编码经网络模型提取的各个正类图像的特征以进行训练,进而划分正类图像范围,得到最终的单类支持向量机模型。其中将待检测图像输入最终的编码神经网络模型210进行特征提取,最终的单类支持向量机模型230基于最终的编码神经网络模型提取的特征进行图像分类以判断所述待检测图像是否为正类图像。
32.具体的,在对所述编码神经网络模型210的训练过程中,通过比对输入所述编码神经网络模型210的正类图像以及所述解码神经网络模型220输出的还原图像,调整所述编码神经网络模型210的参数和结构以保证所述编码神经网络模型210能够提取到合适的特征,以使得所述解码神经网络模型220能够得到合适的还原图像。
33.在一个实施例中,结合图3所示的,所述编码神经网络模型用于对输入的正类图像进行下采样提取高维特征,所述解码神经网络模型220用于对所述高维特征进行上采样得到所述还原图像,通过比对输入所述编码神经网络模型210的正类图像以及所述解码神经网络模型220输出的还原图像,所述编码神经网络模型210是否提取到了合适的特征,如果所述编码神经网络模型210未提取到合适的特征,则调整所述编码神经网络模型210的参数
和结构继续进行训练,直到所述编码神经网络模型210能够提取到合适的特征。
34.结合图3所示的,所述编码神经网络模型210包括一个编码单元或串联的多个编码单元,在图3中示例性的给出了两个编码单元211和212,在其他实施例中也可以只有一个编码单元,还可以有更多个编码单元。每个编码单元包括依次连接的一层卷积层、一层激活层和一层池化层,最后的编码单元输出提取的特征。如图3,第二编码单元212输出提取的特征。所述解码神经网络模型220包括一个解码单元或串联的多个解码单元,在图3中示例性的给出了两个解码单元221和222,在其他实施例中也可以只有一个解码单元,还可以有更多个解码单元。每个解码单元包括依次连接的一层反卷积层和一层激活层,最后的解码单元输出还原图像。如图3,第二解码单元222输出还原图像。
35.由于所述图像分类装置200在技术上与图像分类方法100本质上是一致的,因此有关重复的部分,这里就不再重复了。
36.根据本发明的另外一个方面,本发明提供一种存储介质,其存储有程序指令,在所述程序执行被运行以执行上述图像分类方法。所述图像扩充方法包括:提供单正类图像集、编码神经网络模型、解码神经网络模型和单类支持向量机模型,其中所述单正类图像集包括多张正类图像;将所述单正类图像集中的正类图像输入所述编码神经网络模型以对所述编码神经网络模型进行训练,此时所述编码神经网络模型提取所述正类图像的特征,所述解码神经网络模型基于所述编码神经网络模型提取的特征解码出还原图像,经过训练得到最终的编码神经网络模型;将最终的编码经网络模型提取的各个正类图像的特征输入所述单类支持向量机模型进行训练以划分正类图像范围,得到最终的单类支持向量机模型;将待检测图像输入最终的编码神经网络模型进行特征提取,最终的单类支持向量机模型基于最终的编码神经网络模型提取的特征进行图像分类以判断所述待检测图像是否为正类图像。所述图像分类方法100的其余步骤在这里就不再重复了。
37.根据本发明的另外一个方面,本发明提一种计算机,其包括处理器和存储器,所述存储器中存储有程序指令,所述处理器运行所述程序指令以执行上述图像分类方法。所述图像扩充方法包括:提供单正类图像集、编码神经网络模型、解码神经网络模型和单类支持向量机模型,其中所述单正类图像集包括多张正类图像;将所述单正类图像集中的正类图像输入所述编码神经网络模型以对所述编码神经网络模型进行训练,此时所述编码神经网络模型提取所述正类图像的特征,所述解码神经网络模型基于所述编码神经网络模型提取的特征解码出还原图像,经过训练得到最终的编码神经网络模型;将最终的编码经网络模型提取的各个正类图像的特征输入所述单类支持向量机模型进行训练以划分正类图像范围,得到最终的单类支持向量机模型;将待检测图像输入最终的编码神经网络模型进行特征提取,最终的单类支持向量机模型基于最终的编码神经网络模型提取的特征进行图像分类以判断所述待检测图像是否为正类图像。所述图像分类方法100的其余步骤在这里就不再重复了。
38.在本发明中,为了容易理解,有时采用了多个步骤的方式介绍相关方案,然而步骤的序号的先后并不意味一定有顺序上的先后关系,还需要看两个步骤之间是否有前后依赖关系,如果两个步骤之间没有前后依赖关系,那么虽然步骤序号又先后,也不意味着两个步骤间又先后关系。
39.在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,除
了包含所列的那些要素,而且还可包含没有明确列出的其他要素。
40.在本文中,所涉及的前、后、上、下等方位词是以附图中零部件位于图中以及零部件相互之间的位置来定义的,只是为了表达技术方案的清楚及方便。应当理解,所述方位词的使用不应限制本技术请求保护的范围。
41.在不冲突的情况下,本文中上述实施例及实施例中的特征可以相互结合。
42.以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献