一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

训练样本获取方法、装置、计算机设备和可读存储介质与流程

2022-02-22 19:03:33 来源:中国专利 TAG:

技术特征:
1.一种训练样本获取方法,其特征在于,包括获取初始样本集,根据所述初始样本集中的标记样本训练得到目标模型以及鉴别模型;所述鉴别模型用于对所述目标模型进行模型评估;将所述初始样本集中的未标记样本输入所述目标模型,得到标注数据;根据所述标注数据和所述未标记样本确定所述鉴别模型的输入参数;并将所述输入参数输入所述鉴别模型,得到评估分值;根据所述评估分值,确定是否根据所述标注数据和所述未标记样本更新所述初始样本集的标记样本。2.根据权利要求1所述的训练样本获取方法,其特征在于,所述根据所述评估分值,确定是否根据所述标注数据和所述未标记样本更新所述初始样本集的标记样本,包括:若所述评估分值大于或等于预设阈值,则将所述未标注的样本和所述标注数据组成的样本作为新的标记样本加入所述初始样本集,所述预设阈值用于表征所述目标模型的输出结果的准确度。3.根据权利要求1所述的训练样本获取方法,其特征在于,所述根据所述标注数据和所述未标记样本确定所述鉴别模型的输入参数,包括:将所述未标记样本和所述标注数据作为所述输入参数;和/或,对所述未标记样本和所述标注数据进行特征提取处理,将提取的特征作为所述输入参数。4.根据权利要求3所述的训练样本获取方法,其特征在于,所述鉴别模型包括深度学习模型和/或机器学习模型。5.根据权利要求4所述的训练样本获取方法,其特征在于,在所述鉴别模型包括深度学习模型和机器学习模型时,所述将所述输入参数输入所述鉴别模型,得到评估分值,包括:将所述输入参数分别输入所述深度学习模型和所述机器学习模型;对所述深度学习模型的输出和所述机器学习模型的输出进行求均值处理,获得所述评估分值。6.根据权利要求1所述的训练样本获取方法,其特征在于,所述方法还包括:对多个初始标记样本进行样本评估,基于评估结果从所述多个初始标记样本中获得所述标记样本。7.根据权利要求6所述的训练样本获取方法,其特征在于,所述对多个初始标记样本进行样本评估,基于评估结果从所述多个初始标记样本中获得所述标记样本,包括:对所述多个初始标记样本进行以下筛选处理:根据所述多个初始标记样本确定l组样本集,根据所述l组样本集确定训练集和验证集,根据所述训练集和所述验证集对所述目标模型对应的初始模型进行训练,得到n组样本筛选模型;l和n均为大于零的整数;将所述多个初始标记样本输入所述n组样本筛选模型,根据所述n组样本筛选模型的输出确定所述评估结果,根据所述评估结果确定所述多个初始标记样本中的异常样本;根据所述异常样本对所述多个初始标记样本进行更新,并对更新后的所述多个初始标记样本执行所述筛选处理,直至所述多个初始标记样本中不包含异常样本。8.根据权利要求7所述的训练样本获取方法,其特征在于,所述根据所述l组样本集确
定训练集和验证集,根据所述训练集和所述验证集对所述目标模型对应的初始模型进行训练,得到n组样本筛选模型,包括:遍历所述l组样本集中的每一组样本集,以所述一组样本集为所述验证集,以所述l组样本集中的剩余样本集为所述训练集;使用所述训练集对所述初始模型进行训练,得到训练结果,并使用所述验证集对训练后的初始模型进行验证,得到验证结果;根据所述训练结果、所述验证结果以及预设约束条件,确定所述一组样本集对应的样本筛选模型;根据所述l组样本集中的每一组样本集对应的样本筛选模型确定所述n组样本筛选模型。9.根据权利要求1所述的训练样本获取方法,其特征在于,所述方法还包括:接收对所述标注数据的主观评估分值和对所述标注数据的修改结果;所述主观评估分值用于表征对所述标注数据的主观评估;若所述主观评估分值小于所述评估分值,则根据所述修改结果、所述未标记样本和所述主观评估分值对所述目标模型和所述鉴别模型进行训练。10.一种训练样本获取装置,其特征在于,包括:获取模块,用于获取初始样本集,根据所述初始样本集中的标记样本训练得到目标模型以及鉴别模型;所述鉴别模型用于对所述目标模型进行模型评估;第一确定模块,用于将所述初始样本集中的未标记样本输入所述目标模型,得到标注数据;第二确定模块,用于根据所述标注数据和所述未标记样本确定所述鉴别模型的输入参数;并将所述输入参数输入所述鉴别模型,得到评估分值;第三确定模块,用于根据所述评估分值,确定是否根据所述标注数据和所述未标记样本更新所述初始样本集的标记样本。11.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至9中任一项所述的方法的步骤。12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。

技术总结
本申请涉及一种训练样本获取方法、装置、计算机设备和可读存储介质,该方法通过获取初始样本集,根据初始样本集中的标记样本训练得到目标模型以及鉴别模型;将初始样本集中的未标记样本输入目标模型,得到标注数据;根据标注数据和未标记样本确定鉴别模型的输入参数,并将输入参数输入鉴别模型,得到评估分值;根据评估分值,确定是否根据标注数据和未标记样本更新初始样本集中的标记样本。本申请提供的训练样本获取方法,对于大量的训练样本的标注,无需工作人员进行标注,可以减少人力的消耗,从而提高获取训练样本的速度。从而提高获取训练样本的速度。从而提高获取训练样本的速度。


技术研发人员:贾乐成
受保护的技术使用者:深圳市联影高端医疗装备创新研究院
技术研发日:2021.11.16
技术公布日:2022/2/8
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献