一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于主动学习的芯片缺陷检测方法和装置与流程

2022-03-09 02:20:22 来源:中国专利 TAG:

技术特征:
1.一种基于主动学习的芯片缺陷检测方法,其特征在于,包括以下步骤:获取芯片图片集合,其中,所述芯片图片集合包括标注数据集和未标注数据集;构建芯片缺陷检测骨干网络,之后根据所述芯片缺陷检测骨干网络构建损失预测模块;使用芯片图片集合对所述芯片缺陷检测骨干网络和所述损失预测模块进行训练;使用损失预测模块得到芯片缺陷检测骨干网络对未标注数据集的损失预测值后,使用基于高斯噪声的样本选择方法对未标注数据集进行最终的样本选择,并将最终选择的样本交由人工标注,生成新的标注数据集;将新的标注数据集加入标注数据集,完成一次迭代训练,不断迭代训练整体神经网络模型,直到获得具有足够精度的芯片缺陷检测网络。2.如权利要求1所述的方法,其特征在于,所述构建芯片缺陷检测骨干网络使用darknet-53卷积网络,在darknet-53卷积网络中添加任意检测头之后得到网络的最终输出,且根据芯片数据目标类数对最终输出的维度进行调整,使得网络输出维度数与芯片数据目标类数一致,同时,根据目前已有的芯片标注数据通过k-均值聚类得到9种大小的标注框聚类结果,将其用作模型的预设锚框设定,完成芯片缺陷检测骨干网络的构建。3.如权利要求1所述的方法,其特征在于,所述根据所述芯片缺陷检测骨干网络构建损失预测模块,具体为:取出芯片缺陷检测骨干网络结构中每一类重复的残差块中最后一个残差块的输出,将这些输出分别通过全局平均池化层、全连接层与一个relu激活层,拼接所有的relu激活层输出,并通过一个全连接层之后获得损失预测值,完成损失预测模块的构建。4.如权利要求1所述的方法,其特征在于,所述芯片缺陷检测骨干网络和所述损失预测模块训练时使用的损失函数表示为:loss
backbone lpm
(x
p
)=λ
·
2loss
lpm
(x
p
) f
loss
(x
i
) f
loss
(x
j
)其中,λ表示训练过程中可调的控制两种损失的训练重视程度的超参数,loss
backbone lpm
()表示训练时总体的损失函数,f
loss
()表示图片通过骨干网络darknet-53所产生的真实损失,x
p
=(x
i
,x
j
)为一次损失预测模块的反向传播过程使用到的两张图片,sign()表示示性函数,l
i
表示图片x
i
经过主干网络产生的损失值,l
j
表示图片x
j
经过主干网络产生的损失值,表示图片x
i
经过损失预测网络产生的损失值,表示图片x
j
经过损失预测网络产生的损失值,η是一个超参,用来调节和之间的差异。5.如权利要求1所述的方法,其特征在于,所述使用基于高斯噪声的样本选择方法对未标注数据集进行最终的样本选择,具体为:步骤s1:在从未标注数据集中选择需要标注的图片时,对每一张未标注数据集中的图片,在完成输入网络之前所需的所有预处理过程后,进行不同大小方差的高斯噪声预处理,将整体网络分别对所有的预处理后的图片进行推理,得到损失预测模块对所有图片的预测损失;步骤s2:根据所述预测损失,计算图片经过网络预测的信息量得分;
步骤s3:在进行选择目标图片进行标注并加入标注集合过程时,使用步骤s1、s2的方法处理未标注图片中所有的图片,设定阈值选择信息量得分排名靠前的图片。6.一种基于主动学习的芯片缺陷检测装置,其特征在于,包括获取模块、模型生成模块、模型训练模块、样本选择模块、迭代模块,其中,所述获取模块,用于获取芯片图片集合,其中,所述芯片图片集合包括标注数据集和未标注数据集;所述模型生成模块,用于构建芯片缺陷检测骨干网络,之后根据所述芯片缺陷检测骨干网络构建损失预测模块;所述模型训练模块,用于使用芯片图片集合对所述芯片缺陷检测骨干网络和所述损失预测模块进行训练;所述样本选择模块,用于使用损失预测模块得到芯片缺陷检测骨干网络对未标注数据集的损失预测值后,使用基于高斯噪声的样本选择方法对未标注数据集进行最终的样本选择,并将最终选择的样本交由人工标注,生成新的标注数据集;所述迭代模块,用于将新的标注数据集加入标注数据集,完成一次迭代训练,不断迭代训练整体神经网络模型,直到获得具有足够精度的芯片缺陷检测网络。7.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-5中任一所述的方法。

技术总结
本申请提出了一种基于主动学习的芯片缺陷检测方法,包括:获取芯片图片集合,芯片图片集合包括标注数据集和未标注数据集;构建芯片缺陷检测骨干网络,并根据其构建损失预测模块;使用芯片图片集合对芯片缺陷检测骨干网络和损失预测模块进行训练;使用损失预测模块得到芯片缺陷检测骨干网络对未标注数据集的损失预测值后,使用基于高斯噪声的样本选择方法对未标注数据集进行最终的样本选择,并将最终选择的样本交由人工标注,生成新的标注数据集;将新的标注数据集加入标注数据集,完成一次迭代训练,不断迭代训练整体神经网络模型,直到获得具有足够精度的芯片缺陷检测网络。本申请在标注少的客观条件下改善了缺陷检测效果,具有较强的实用性。具有较强的实用性。具有较强的实用性。


技术研发人员:熊翊哲 陈辉 陈仕江
受保护的技术使用者:杭州涿溪脑与智能研究所
技术研发日:2021.11.24
技术公布日:2022/3/7
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献