一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种提高花型图分类打标准确率的方法与流程

2022-03-16 13:41:43 来源:中国专利 TAG:


1.本发明涉及图片分类技术领域,尤其涉及一种提高花型图分类打标准确率的方法。


背景技术:

2.图片分类技术已经经过了多年的发展,从最先色彩匹配、灰度匹配、到如今神经网络特征提取分类,而神经网络也经过了不同模型的提升,主要有这几大网络lenet、alexnet、vggnet、goolenet、resnet,图片分类的准确度得到了大幅度的提升。在花型网站中,对于图片正确的分类打标是非常重要的一环,正确的标签分类能够大大提高智能推荐给用户花型的准确率,也能间接提高花型搜索的响应时间,最重要的是能够让用户通过分类标签找到自己心仪的图片。
3.目前主流的图片分类方法是通过神经网络cnn方法,在已知数据集上,每个cnn通过提取图片一定范围的特征训练迭代得到分类模型,图片分类主流方法,在图片主体明确且训练资源较为丰富的情况下,图片分类结果较好。
4.但是现有的对于网站花型图,图片主题不明确,图片自带很多局部特征,花型图目标主体较多、特征视野分布在整张图上,传统神经网络分类方法对其分类效果并不佳。


技术实现要素:

5.本发明的目的是为了解决现有技术中对于网站花型图,图片主题不明确,图片自带很多局部特征,花型图目标主体较多、特征视野分布在整张图上,传统神经网络分类方法对其分类效果并不佳的问题,而提出的一种提高花型图分类打标准确率的方法。
6.为了实现上述目的,本发明采用了如下技术方案:
7.一种提高花型图分类打标准确率的方法,包括图片预处理模组、分类训练模组与数据集清洗再分类训练模型,所述图片预处理模组包括把图片等分成一组带有坐标的序列元素,所述分类训练模组包括有多个self-attention、norm和feed forward前馈网络组成。
8.优选地,所述图片预处理模组匹配vit模型的输入,所述图片预处理模组包括h
×w×
c的三维图片转化为n
×
d的二维输入。
9.优选地,所述分类训练模组包括transformer encode。
10.优选地,所述数据集清洗再分类训练模型包括鉴别数据集中图片模块与筛选图片类别模块。
11.一种提高花型图分类打标准确率的方法,该方法的具体步骤如下:
12.步骤1-图片预处理:通过图片预处理模组把图片等分成一组带有坐标的序列元素,匹配vit模型的输入,首先把图片等比例划分成n片区域,每片区域长宽为p,输入序列为(n,p
2 c),再通过一个全连接层压缩为(n,d)的二维向量,图片割裂后,不再保有原来的位置信息,在patch embedding向量上增加一个positional encoding epos,在图片序列前增加一个和图片单个序列同纬度的可学习嵌入向量;
13.步骤2-分类训练模组:将图片序列经过多个self-attention再进行add&norm,add防止网络退化,norm对每一层的激活值进行归一化,然后经过前馈网络,整个encode经过n次该网络;
14.步骤3-数据集清洗再分类:在上一步生成的模型中,鉴别数据集中图片的具体类别及概率,再和图片所在类别进行对比,准确筛选图片类别,清洗原有数据集,在清洗的数据集上继续训练最新模型。
15.有益效果:
16.本发明中,该提高花型图分类打标准确率的方法针对花型图目标主体较多、特征视野分布在整张图上传统神经网络分类方法对其分类效果并不佳的问题,在人工筛选的数据集上,通过vit模型训练其分类模型,通过其训练模型再去自动筛选掉数据集中类别定义模糊的图片,再在原始模型上训练迭代最新模型,对花型分类效果优于其他神经网络cnn分类模型。
附图说明
17.图1为本发明提出的一种提高花型图分类打标准确率的方法的vit框架结构示意图;
18.图2为本发明提出的一种提高花型图分类打标准确率的方法的transformer encode流程结构示意图。
具体实施方式
19.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
20.参照图1-2,一种提高花型图分类打标准确率的方法,包括图片预处理模组、分类训练模组与数据集清洗再分类训练模型,所述图片预处理模组包括把图片等分成一组带有坐标的序列元素,所述分类训练模组包括有多个self-attention、norm和feed forward前馈网络组成。
21.本实施例中,所述图片预处理模组匹配vit模型的输入,所述图片预处理模组包括h
×w×
c的三维图片转化为n
×
d的二维输入;所述分类训练模组包括transformer encode,主要有多个self-attention、norm和feed forward前馈网络组成,用于特征训练及反馈;所述数据集清洗再分类训练模型包括鉴别数据集中图片模块与筛选图片类别模块,数据集清洗再分类用于在第一次生成模型基础上,清洗原有数据集图片,再训练其模型。
22.本实施例中,通过图片预处理模组把图片等分成一组带有坐标的序列元素,匹配vit模型的输入,首先把图片等比例划分成n片区域,每片区域长宽为p,输入序列为(n,p
2 c),再通过一个全连接层压缩为(n,d)的二维向量,图片割裂后,不再保有原来的位置信息,在patch embedding向量上增加一个positional encoding epos,在图片序列前增加一个和图片单个序列同纬度的可学习嵌入向量,该向量用于最后的分类预测,将图片序列经过多个self-attention再进行add&norm,add防止网络退化,norm对每一层的激活值进行归一化,然后经过前馈网络,整个encode经过n次该网络,在上一步生成的模型中,鉴别数据集中图片的具体类别及概率,再和图片所在类别进行对比,准确筛选图片类别,清洗原有数据
集,在清洗的数据集上继续训练最新模型。
23.以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。


技术特征:
1.一种提高花型图分类打标准确率的方法,包括图片预处理模组、分类训练模组与数据集清洗再分类训练模型,其特征在于:所述图片预处理模组包括把图片等分成一组带有坐标的序列元素,所述分类训练模组包括有多个self-attention、norm和feed forward前馈网络组成。2.根据权利要求1所述的一种提高花型图分类打标准确率的方法,其特征在于:所述图片预处理模组匹配vit模型的输入,所述图片预处理模组包括h
×
w
×
c的三维图片转化为n
×
d的二维输入。3.根据权利要求1所述的一种提高花型图分类打标准确率的方法,其特征在于:所述分类训练模组包括transformer encode。4.根据权利要求1所述的一种提高花型图分类打标准确率的方法,其特征在于:所述数据集清洗再分类训练模型包括鉴别数据集中图片模块与筛选图片类别模块。5.根据权利要求1-4所述的一种提高花型图分类打标准确率的方法,该方法的具体步骤如下:步骤1-图片预处理:通过图片预处理模组把图片等分成一组带有坐标的序列元素,匹配vit模型的输入,首先把图片等比例划分成n片区域,每片区域长宽为p,输入序列为(n,p2c),再通过一个全连接层压缩为(n,d)的二维向量,图片割裂后,不再保有原来的位置信息,在patch embedding向量上增加一个positional encoding epos,在图片序列前增加一个和图片单个序列同纬度的可学习嵌入向量;步骤2-分类训练模组:将图片序列经过多个self-attention再进行add&norm,add防止网络退化,norm对每一层的激活值进行归一化,然后经过前馈网络,整个encode经过n次该网络;步骤3-数据集清洗再分类:在上一步生成的模型中,鉴别数据集中图片的具体类别及概率,再和图片所在类别进行对比,准确筛选图片类别,清洗原有数据集,在清洗的数据集上继续训练最新模型。

技术总结
本发明公开了一种提高花型图分类打标准确率的方法,包括图片预处理模组、分类训练模组与数据集清洗再分类训练模型,所述图片预处理模组包括把图片等分成一组带有坐标的序列元素,所述分类训练模组包括有多个self-attention、Norm和Feed Forward前馈网络组成。该提高花型图分类打标准确率的方法通过VIT模型训练其分类模型,通过其训练模型再去自动筛选掉数据集中类别定义模糊的图片,再在原始模型上训练迭代最新模型,对花型分类效果优于其他神经网络CNN分类模型。他神经网络CNN分类模型。他神经网络CNN分类模型。


技术研发人员:金海云 伍赛 傅琳 郭琦康 王朔
受保护的技术使用者:杭州慕锐科技有限公司
技术研发日:2021.12.06
技术公布日:2022/3/15
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献