一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于特征缩放和边界样本的不平衡图像分类系统的制作方法

2022-03-09 06:46:48 来源:中国专利 TAG:

技术特征:
1.一种基于特征缩放和边界样本的不平衡图像分类系统,其特征在于,该方法包括以下步骤:1) 将原始样本数据划分为训练集和测试集两部分,并将训练集构造为不平衡数据;2) 特征缩放模块,根据每个类的特征所构成的超球半径对特征进行按比例缩放,从而增强模型对少数类样本的训练与学习;3) 基于gabriel图的边界样本挖掘模块,根据gabriel图的定义在样本特征的基础上构建gabriel图,并且发掘边界样本特征,在所发掘的特征的基础上对类内类间距离进行约束;4) 通过损失调度器,控制上述两个模块的训练过程,使训练前期关注表征你能力的训练,后期关注类别的判别;5) 测试步骤中,将原始测试图片输入到训练好的卷积神经网络中,通过网络提取特征,然后通过全连接层对图片进行判断。2.根据权利要求1所述的基于特征缩放和gabriel图边界样本挖掘的不平衡学习方法,其特征在于:步骤2)中的特征缩放模块,根据一个批次中的每个类中所包含的样本特征计算每个类的中心,在求得每个类在当前批次的中心后通过指数移动平均计算类中心,该过程可以被定义为,其中为中心,为中心更新的系数,为之前批次计算得到的中心,为当前批次每个类的中心;计算得到每个类的中心后,需要计算每个类的半径,将类的中心向量和所有同类样本的特征向量求欧式距离,取最大值作为当前类的半径;最后,利用每一类的半径和拥有最多样本数的类的半径求比值,根据半径的比值,对不同类别的特征进行缩放,缩放系数可以定义为,其中为温度系数,控制半径比值对原始特征的影响;为第j类的半径,为包含最多样本数的类的半径;得到缩放系数之后,对卷积神经网络提取的特征进行缩放,最后经过softmax函数归一化得到预测结果。3.根据权利要求1所述的基于特征缩放和gabriel图边界样本挖掘的不平衡学习方法,其特征在于:步骤3)中的基于gabriel图的边界样本挖掘模块,gabriel图的定义如下,若满足上式则特征和特征之间可以构成边,其中表示欧式距离,表示出了和之外的所有其他特征向量;在卷积神经网络提取特征之后,利用gabriel图的定义在特征上构建gabriel图,并且
保留端点是异类的边,而这些样本我们将其定义为每个类别的边界样本;在这些边界样本的基础上,我们利用损失函数使得边界样本本身更加靠近类中心,而异类边界样本之间更加远离,从而使得类内更加紧凑,而类间更加分散,达到增强模型表征能力的目的,具体损失函数定义如下,其中s为gabriel图边的集合,为系数,对应的全连接层的权重,为阈值用于控制类内类间距离的差值,为用于平衡不平衡性的权重,由于类别的样本数存在不平衡性,因此在挖掘得到的边界样本中,多数类的样本较多,从而导致在计算类内类间距离值时多数类的距离值更多,使得少数类的结果几乎被忽略;通过加权增强少数类距离在损失函数中的作用,其中表示包含最多样本数的类别的样本数,表示每一类的样本数。4.根据权利要求1所述的基于特征缩放和gabriel图边界样本挖掘的不平衡学习方法,其特征在于: 步骤4)中的损失调度器,用于控制两个模块的训练过程,使训练前期关注表征能力的训练,即更加关注的变化,后期更加关注判别能力的训练,即更加关注交叉熵损失函数的变化,通过损失调度器控制步骤2)中的温度系数;系数和控制训练过程,定义如下,其中和为超参数,为[0,1]之间的小数,其中用于控制不同轮次时系数的影响力,用于控制当训练到后期是仍然保持之前训练得到的表征能力,防止后续的训练破坏之前训练轮次模型学习到的表征能力,epoch为训练轮次,epochs为总轮次;因此总的损失函数可以被定义如下,其中表示交叉熵损失函数。

技术总结
本发明公开了一种基于特征缩放和边界样本的不平衡图像分类系统。所述图像分类系统包括:1)将原始样本数据划分为训练集和测试集,并将训练集构造为不平衡数据;2)对每个类实施特征缩放模块进行特征缩放;3)对每个类实施边界样本挖掘模块,进行边界样本挖掘,约束类内类间距离;4)通过损失调度器调控上述两个模块的训练过程;5)将原始测试图片输入到训练好的卷积神经网络中,然后通过全连接层对图片进行判断。本发明从模型结构上调整,增强了深度学习模型在不平衡图像数据上的分类性能和鲁棒性。性。性。


技术研发人员:王喆 李冬冬 董奇达 杨孟平 杜文莉 杨海
受保护的技术使用者:华东理工大学
技术研发日:2021.12.01
技术公布日:2022/3/8
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献