一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于类别不平衡的自适应数据增强方法

2022-08-13 18:17:57 来源:中国专利 TAG:

技术特征:
1.一种基于类别不平衡的自适应数据增强方法,其特征在于,其特征在于包括以下步骤:步骤一、对模型进行预训练和统计数据集的类别不平衡信息;步骤二、根据根据预训练的结果和统计信息计算模型对每个类别的偏好程度;步骤三、在偏好因子中引入微调系数t与偏好增强系数e;步骤四、构建自适应复制粘贴增强表达式;步骤五、根据表达式生成新的数据与更新对应的标签,用新的数据集进行训练。2.根据权利要求1所述的一种基于类别不平衡的自适应数据增强方法,其特征在于:所述步骤一的模型预训练,模型用原始的数据集进行预训练,该预训练的训练量并不是固定的,当训练到某一个阶段时,就提取出该阶段训练权重来得出模型在前状态下对数据集的评估。3.根据权利要求1所述的一种基于类别不平衡的自适应数据增强方法,其特征在于:所述步骤一的数据集统计方法,该统计方法主要是评估数据集的类别不平衡问题,该方法通过使用数据集的标签文件进行统计,统计的主要内容包括每个类别物体的个数以及对目标面积大小的归类。4.根据权利要求1所述的一种基于类别不平衡的自适应数据增强方法,其特征在于:所述步骤二的偏好程度计算,模型对每个类别的偏好程度是通过预训练的评估值和类别的统计信息共同计算而得的,其中的评估值主要是map和每个类别的ap值。5.根据权利要求1所述的一种基于类别不平衡的自适应数据增强方法,其特征在于:所述步骤三的微调因子t,以用于适当地调节模型对每个类别的偏好程度,如下式所示:p=(map-ap
i
t)*n
i
ꢀꢀꢀꢀ
(1),ap是指每个类别的评估值。i是每个类别对应的序号。map是ap的均值。用均值map与各类的ap值相减,该结果反映了模型对数据集中每个类别的学习情况。t是微调系数。通过对t的适当调整来干预模型的偏好。模型是否易于掌握某个类别,除了受到该类别自身的特征信息影响外,还受到数据集中含有该类别的信息量的影响,n
i
表示的是数据集中每个类别的目标数量。我们用p
i
反映模型对每个类别的学习情况。6.根据权利要求5所述的一种基于类别不平衡的自适应数据增强方法,其特征在于:其特征在于步骤四的表达式构建,其表达式如下所示:n

i
=p
ie
*f(map-ap
i
t)
ꢀꢀꢀꢀ
(2),因为有部分类别的ap值与map值相差不大,导致相减之后的结果十分的小,虽然有n
i
的影响,但从数值上很难反映p
i
之间的差距,因此引入一个增强系数e来扩大它们之间的差距。同时,存在一些类别由于自身特征的结构或者数据集中有充足的特征信息进行学习,使得模型能准确地分辨它们,这部分类别是不需要进行数据扩增的。引入判别式f(ap
i-map)决定当前该类是否进行复制,粘贴的操作。该式子的详细表达如下:在判别式中,也加入了微调系数t,通过对t的适当调整来增加或减少扩增的类别,只有当map-ap
i
t大于零时,公式(2)才有效,否则不会对该类别进行数据扩增。n
i

是该类别通过复制,粘贴算法扩增到的数据量。为了防止某些类别的偏好因子过高或者过低导致n
i

偏离
了整体,通过加入归一化对其整体的结果进行了修正,其归一化公式如下:其中归一化的范围是(s1,s2),n

是n

i
的集合。y是自适应算法最终的输出值。7.根据权利要求1所述的一种基于类别不平衡的自适应数据增强方法,其特征在于:所述步骤五的数据更新,根据表达式生成新的数据并同步更新对应的标签,然后把新生成的数据加入到原数据集中,即新的数据集在数据量上是和原来的数据集保持一致。8.一种基于类别不平衡的自适应数据增强方法的应用,其特征在于:所述自适应数据增强方法应用于复制粘贴。该自适应增强方法还能应用于旋转、翻转、颜色变换、随机遮挡、非线性变化等增强方法。

技术总结
本发明公开了一种基于类别不平衡的自适应数据增强方法,在原来的复制粘贴增强方法上加入自适应算法,该训练方法的步骤包括:用数据集对模型进行预训练并提取相应的评估值;对原数据集的类别不平衡进行信息统计;用预训练的评估值和统计的信息计算出模型对每个类别的偏好程度,用偏好因子p表示;在自适应算法中加入参数的调节,引入微调系数T对偏好因子进行微调,引入偏好增强系数e来扩大类别之间的偏好差异;用偏好因子和增强系数组成判别式,判断每个类别是否需要进行数据扩增;对输出的结果进行范围的合理化;复制粘贴增强根据输出的结果对类别的数量信息进行微调并同步更新对应的数据标签,用新的生成的数据集进行训练能进一步提高模型的识别性能。能进一步提高模型的识别性能。能进一步提高模型的识别性能。


技术研发人员:于效宇 李富超 刘艳 陈颖璐
受保护的技术使用者:电子科技大学中山学院
技术研发日:2022.06.08
技术公布日:2022/8/12
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献