一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种循环利用式训练样本的海量图像识别方法及系统

2023-03-15 17:14:37 来源:中国专利 TAG:

技术特征:
1.一种循环利用式训练样本的海量图像识别方法,其特征在于,包括:从互联网上采集海量图像数据,并随机选取第一预设数量的包含不同类别的初始图像;利用hc显著性检测方法对所述初始图像进行检测,若所述初始图像的显著性区域面积不足整幅图像的预设比例,将所述初始图像进行删除;反之,则将所述初始图像作为潜在循环利用图像;对所述潜在循环利用图像与目标图像进行相似度计算,筛选出相似度低于预设阈值的循环利用图像,作为循环利用式训练样本;挑选第二预设数量的循环利用式训练样本作为负样本;从目标图像类别中,挑选出第三预设数量的初始图像作为正样本;利用svm模型对所述正样本和所述负样本进行训练,得到图像识别决策模型;将待识别图像带入图像识别决策模型中进行识别;当基于svm模型的得分大于等于预设值时,判定为目标类别图像;反之,则判定为非目标类别图像;根据不同图像类别,分别建立对应的图像识别决策模型;当任一所述图像识别决策模型开始工作前,将除了所述图像识别决策模型自身的正样本图像以外的循环利用图像作为负样本带入svm模型进行训练,实现多个图像识别决策模型共用循环利用图像。2.如权利要求1所述的一种循环利用式训练样本的海量图像识别方法,其特征在于,对所述潜在循环利用图像进行相似度计算,筛选出相似度低于预设阈值的循环利用图像,作为循环利用式训练样本的步骤包括:对所述潜在循环利用图像进行深度自编码;计算不同图像自编码后的欧式距离;当多个所述潜在循环利用图像的欧式距离达到预设范围内时,认定多个所述潜在循环利用图像高度相似,选取其中一个进行保留;经过多次欧式距离的计算,筛选出相似度低于预设阈值的循环利用图像,作为循环利用式训练样本。3.如权利要求1所述的一种循环利用式训练样本的海量图像识别方法,其特征在于,利用hc显著性检测方法对所述初始图像进行检测,若所述初始图像的显著性区域面积不足整幅图像的预设比例,将所述初始图像进行删除;反之,则将所述初始图像作为潜在循环利用图像的步骤包括:用基于直方图的图像分割方法将输入的图像分割成若干区域;为每个所述区域建立颜色直方图;对每个像素颜色进行平滑操作,对每个所述区域通过测量与图像其它区域的颜色对比度来计算其显著性值;为图像中每一个像素分配显著性值,生成显著图,计算所述显著性值大于预设显著性值阈值的像素在图像中的比例,若所述比例低于整幅图像的第一预设比例,将所述样本图像进行删除,反之继续下一步。4.如权利要求3所述的一种循环利用式训练样本的海量图像识别方法,其特征在于,所述直方图采用稀疏直方图。5.如权利要求3所述的一种循环利用式训练样本的海量图像识别方法,其特征在于,对每个所述区域通过测量与图像其它区域的颜色对比度来计算其显著性值前的步骤包括:对每个像素颜色进行平滑操作。
6.如权利要求1所述的一种循环利用式训练样本的海量图像识别方法,其特征在于,对每个像素颜色进行平滑操作的步骤包括:在rgb颜色空间进行量化;统一将每个像素颜色的通道划分为12个等级;在lab颜色空间来测量颜色的距离,统计像素数目覆盖图像不小于第二预设比例的高频颜色种类,以及其他的不高于第三预设比例的低频颜色种类;把低频颜色的像素替换成与其lab颜色空间中颜色距离相距最近的高频颜色内。7.如权利要求1所述的一种循环利用式训练样本的海量图像识别方法,其特征在于,所述预设比例为三分之一。8.一种循环利用式训练样本的海量图像识别系统,其特征在于,包括:采集模块,用于从互联网上采集海量图像数据,并随机选取第一预设数量的包含不同类别的初始图像;显著性检测模块,用于利用hc显著性检测方法对所述初始图像进行检测,若所述初始图像的显著性区域面积不足整幅图像的预设比例,将所述初始图像进行删除;反之,则将所述初始图像作为潜在循环利用图像;相似度检测模块,用于对所述潜在循环利用图像进行相似度计算,筛选出相似度低于预设阈值的循环利用图像,作为循环利用式训练样本;挑选第二预设数量的循环利用式训练样本作为负样本;正样本选择模块,用于从目标图像类别中,挑选出第三预设数量的初始图像作为正样本;模型训练模块,用于利用svm模型对所述正样本和所述负样本进行训练,得到图像识别决策模型;模型判断模块,用于将待识别图像带入图像识别决策模型中进行识别;当基于svm模型的得分大于等于预设值时,判定为目标类别图像;反之,则判定为非目标类别图像;训练样本共用模块,用于根据不同图像类别,分别建立对应的图像识别决策模型;当任一所述图像识别决策模型开始工作前,将除了所述图像识别决策模型自身的正样本图像以外的循环利用图像作为负样本带入svm模型进行训练,实现多个图像识别决策模型共用循环利用图像。9.一种电子设备,其特征在于,包括至少一个处理器、至少一个存储器和数据总线;其中:所述处理器与所述存储器通过所述数据总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令以执行如权利要求1-7任一所述的方法。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-7中任一项所述的方法。

技术总结
本发明提出了一种循环利用式训练样本的海量图像识别方法及系统,涉及图像识别的技术领域。包括随机选取包含不同类别的初始图像;利用显著性检测方法对初始图像进行检测,若显著性区域不足整幅图像的预设比例,进行删除;反之,则作为潜在循环利用图像;对图像进行相似度计算,筛选出相似度较低的图像,作为循环利用式训练样本;挑选循环利用式训练样本作为负样本;同时挑选出一定的初始图像作为正样本;利用SVM模型进行训练;当基于SVM模型的得分大于等于预设值时,判定为目标类别图像;反之,则判定为非目标类别图像;分别建立对应的图像识别决策模型;实现多个图像识别决策模型共用循环利用图像。其能够减少人力资源和计算资源的消耗。资源的消耗。资源的消耗。


技术研发人员:吴昊 张林焘
受保护的技术使用者:北京师范大学
技术研发日:2022.10.09
技术公布日:2023/2/6
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献