一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于人工智能的智慧林业航拍图像样本数据扩增方法、装置、平台和存储介质与流程

2022-02-24 13:43:13 来源:中国专利 TAG:


1.本发明属于林业巡查技术领域,特别涉及一种基于人工智能的智慧林业航拍图像样本数据扩增方法、装置、平台和存储介质。


背景技术:

2.在采用算法模型对林业图像进行目标检测时,当样本数量较小,导致检测的效果比较差,这时就需要进行数据扩增。要想获得更多数据,可以对现有数据做相应的调整,例如翻转、旋转、平移等,神经网络模型将这些调整后的图像当作不同的图像。数据扩增是针对有限训练数据问题的一个重要的空间解决办法,旨在扩增训练数据的规模,缓解深度神经网络模型的过拟合问题,提高模型的性能和泛化能力。数据扩增发展至今衍生出许多方法,但由于始终都是在原始图像上进行变换,对于分类性能的提升依然十分有限,即使后来出现了自动化搜索数据扩增策略,也只是简化了策略选择流程,本质上并未对数据集的分类性能带来很大的提升。


技术实现要素:

3.本发明实施例之一,一种基于生成对抗网络的林业样本数据扩增方法:将wgan-gp模型与acgan模型结合,获得生成对抗网络模型wacgan-gp;将原始林业航拍图像样本数据输入所述的生成对抗网络模型wacgan-gp,生成第一样本数据集;
4.将所述的原始林业航拍图像样本数据输入,同时输入vgg19模型,获得特征提取改进vgg19模型;
5.将所述第一样本数据集输入所述特征提取改进vgg19模型,经过对所述第一样本数据集进行样本提取,获得第二样本数据集;
6.对所述第二样本数据集采用数据选择方法enn-iht,使用enn-iht对数据进行选择,过滤掉噪声数据,获得增强样本数据集。
附图说明
7.通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
8.图1根据本发明实施例之一的样本数据扩增方法流程图。
具体实施方式
9.数据扩增可以增加训练集的样本,可以有效缓解模型过拟合的情况,使得训练数据尽可能的接近测试数据,从而提高预测精度。另外样本扩增可以迫使网络学习到更鲁棒性的特征,从而使模型拥有更强的泛化能力,比如对图像进行一定程度的遮挡。
10.生成对抗网络(gan)是一种全新的深度学习框架,它可以从图像中学习鉴别特征并生成真实样本,gan生成的图像主要取决于模型结构和样本集质量。随着生成对抗网络(gan)的兴起,gan可以根据已有数据集的高维特征进行组合,生成与原始数据集完全不同的图像,相比于传统的数据扩增方法,可以为神经网络提供更多的图像特征,经过精心设计的生成对抗网络可以生成与原始图像相似且清晰的图像,但同时gan也存在训练不稳定、生成图像质量不高、无法生成指定标签图像、生成图像中包含噪声数据等问题,因此本发明针对这些问题提出了一种基于生成对抗网络的数据扩增方法,即,
11.wgan-gp模型可以快速稳定生成高质量的图像,但无法生成指定标签的图像。acgan模型可以生成指定标签的图像,但是不能稳定生成高质量的图像。本发明结合wgan-gp和accgn的优点,设计一种生成对抗网络模型wacgan-gp,结合梯度惩罚,设计新的损失函数。同时引入了一系列的优化策略,标签平滑、小批量判别、谱归一化、残差块,使得wacgan-gp能够生成更加清晰可分辨的图像,同时能获得更优的结果。
12.根据一个或者多个实施例,一种生成对抗网络模型wacgan-gp模型框架,用以解决现有生成对抗网络在进行训练时容易崩溃、生成图像的质量不高、无法指定生成图像类别等问题。该林业图像样本数据扩增方法包括,
13.1)结合wgan-gp和acgan的优点,提出一种生成对抗网络模型wacgan-gp。
14.2)wacgan-gp模型能够生成高质量的指定标签的图像,以满足图像数据扩增的需求。如图1所示。
15.进一步的,针对wacgan-gp生成样本中可能出现的质量不高的数据,提出一种数据选择方法,清洗掉噪声样本,防止其影响模型的分类能力和泛化能力,包括,
16.1)将原始数据集放入改进的vgg19模型中进行训练来得到特征提取模型。vggnet作为经典的深度卷积神经网络是常用的特征提取模型,通过深层次的网络结构,可以提取到数据的深层次特征。vggnet属于深度网络,采用vgg19模型既可以防止训练出现过拟合,同时vgg19网络深度比vgg16更深,特征提取能力更强。改进的vgg19模型是去掉原模型中的全连接层并加上了改进的全连接层。
17.2)提取wacgan-gp生成数据集的特征
18.3)数据选择采用结合最近邻(enn)和实例硬度阈值(iht)两种算法优点的一种新的数据选择方法:enn-int。使用enn-iht对数据进行选择时,数据集经过enn选择后,原始数据集大部分噪声数据都被清除掉,iht可以很好地弥补enn对于边界的样本不好区分的缺点,进而提高生成数据集的质量。
19.本发明实施例通过采集的林业图像样本数据,标注获得的所有样本数据,计算wacgan-gp算法的权重和参数,获得得增强样本数据集。
20.本发明的有益效果包括,提出基于生成对抗网络和数据选择的图像数据扩增方法能够针对不同数据集生成高质量的图像数据,可以有效应用于图像识别领域,对图像数据集进行有效扩充,提高模型分类性能。未来将会继续优化网络结构使其能够更加高效的运行,进一步适配不平衡数据集,并优化数据选择算法使其能进行自适应参数选择。本发明通过采用wacgan-gp,可以使gan的训练更加稳定,生成更加逼真的图像,acgan可以根据图像标签生成指定标签的图像,将两者的优点结合到一起来生成指定标签的高质量的图像对于图像数据扩增具有十分重要的研究意义。
21.值得说明的是,虽然前述内容已经参考若干具体实施方式描述了本发明创造的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。


技术特征:
1.一种基于人工智能的智慧林业航拍图像样本数据扩增方法,包括以下步骤,将wgan-gp模型与acgan模型结合,获得生成对抗网络模型wacgan-gp;将原始林业航拍图像样本数据输入所述的生成对抗网络模型wacgan-gp,生成第一样本数据集。2.根据权利要求1所述的样本数据扩增方法,其特征在于,将所述的原始林业航拍图像样本数据输入,同时输入vgg19模型,获得特征提取改进vgg19模型。3.根据权利要求2所述的样本数据扩增方法,其特征在于,将所述第一样本数据集输入所述特征提取改进vgg19模型,经过对所述第一样本数据集进行样本提取,获得第二样本数据集。4.根据权利要求3所述的样本数据扩增方法,其特征在于,对所述第二样本数据集采用数据选择方法enn-iht,使用enn-iht对数据进行选择,过滤掉噪声数据,获得增强样本数据集。5.一种基于人工智能的智慧林业航拍图像样本数据扩增装置,所述装置包括存储器;以及耦合到所述存储器的处理器,该处理器被配置为执行存储在所述存储器中的指令,所述处理器执行以下操作:将wgan-gp模型与acgan模型结合,获得生成对抗网络模型wacgan-gp;将原始林业航拍图像样本数据输入所述的生成对抗网络模型wacgan-gp,生成第一样本数据集。6.根据权利要求5所述的样本数据扩增装置,其特征在于,将所述的原始林业航拍图像样本数据输入,同时输入vgg19模型,获得特征提取改进vgg19模型。7.根据权利要求6所述的样本数据扩增装置,其特征在于,将所述第一样本数据集输入所述特征提取改进vgg19模型,经过对所述第一样本数据集进行样本提取,获得第二样本数据集。8.根据权利要求7所述的样本数据扩增装置,其特征在于,对所述第二样本数据集采用数据选择方法enn-iht,使用enn-iht对数据进行选择,过滤掉噪声数据,获得增强样本数据集。9.一种基于人工智能的智慧林业航拍图像样本数据扩增平台,所述平台包括服务器,服务器具有存储器;以及耦合到所述存储器的处理器,该处理器被配置为执行存储在所述存储器中的指令,所述处理器执行以下操作:将wgan-gp模型与acgan模型结合,获得生成对抗网络模型wacgan-gp;将原始林业航拍图像样本数据输入所述的生成对抗网络模型wacgan-gp,生成第一样本数据集。10.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时,实现如权利要求1至4中任一所述的方法。

技术总结
一种基于人工智能的智慧林业航拍图像样本数据扩增方法,包括步骤,将WGAN-GP模型与ACGAN模型结合,获得生成对抗网络模型WACGAN-GP;将原始林业航拍图像样本数据输入所述的生成对抗网络模型WACGAN-GP,生成第一样本数据集。将所述的原始林业航拍图像样本数据输入,同时输入VGG19模型,获得特征提取改进VGG19模型。型。型。


技术研发人员:周俊峰 张显峰 蒋含笑 张令涛 杨清宇
受保护的技术使用者:上海岩易科技有限公司
技术研发日:2021.11.16
技术公布日:2022/2/23
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献