一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种模型训练方法及装置与流程

2021-12-01 00:43:00 来源:中国专利 TAG:

技术特征:
1.一种模型训练方法,其特征在于,包括:通过半监督方法对训练数据进行扩充;基于扩充后的训练数据训练得到多个不同模型结构的模型;使用训练得到的多个模型分别对待预测数据进行预测,通过投票的方式选择预测结果。2.根据权利要求1所述的方法,其特征在于,所述通过半监督方法对训练数据进行扩充,具体包括:将训练数据中的标注数据采用k折数据交叉法划分出k个数据集,将所述k个数据集均采用同一种模型结构训练出k个模型,使用k个模型分别对测试数据进行预测,基于投票的方式获得最终结果,采用以上方法分别训练获得n个不同模型结构的基础模型;采用所述n个基础模型分别对所述训练数据中的未标注数据进行标注,将预测的伪标签数据加入训练集。3.根据权利要求1或2所述的方法,其特征在于,所述基于扩充后的训练数据训练得到多个不同模型结构的模型,具体包括:基于扩充后的训练数据,采用对抗算法训练得到多个不同模型结构的模型。4.根据权利要求3所述的方法,其特征在于,所述对抗训练的公式如下:其中d表示训练集,x表示输入,y表示标签,θ表示模型参数,l(θ,x r
adv
,y)表示单个样本loss,r
adv
表示对抗扰动,s表示扰动空间,表示期望。5.根据权利要求3所述的方法,其特征在于,所述对抗算法采用快速梯度法fgm。6.一种模型训练装置,其特征在于,包括:半监督训练模块,用于通过半监督方法对训练数据进行扩充;模型训练模块,用于基于扩充后的训练数据训练得到多个不同模型结构的模型;投票模块,用于使用训练得到的多个模型分别对待预测数据进行预测,通过投票的方式选择预测结果。7.根据权利要求6所述的装置,其特征在于,所述半监督训练模块,具体包括:基础模型训练单元,用于将训练数据中的标注数据采用k折数据交叉法划分出k个数据集,将所述k个数据集均采用同一种模型结构训练出k个模型,使用k个模型分别对测试数据进行预测,基于投票的方式获得最终结果,采用以上方法分别训练获得n个不同模型结构的基础模型;伪数据生成单元,用于采用所述n个基础模型分别对所述训练数据中的未标注数据进行标注,将预测的伪标签数据加入训练集。8.根据权利要求6或7所述的装置,其特征在于,所述模型训练模块,具体用于:基于扩充后的训练数据,采用对抗算法训练得到多个不同模型结构的模型。9.根据权利要求8所述的装置,其特征在于,所述对抗训练的公式如下:其中d表示训练集,x表示输入,y表示标签,θ表示模型参数,l(θ,x r
adv
,y)表示单个样本loss,r
adv
表示对抗扰动,s表示扰动空间,表示期望。
10.根据权利要求8所述的装置,其特征在于,所述对抗算法采用快速梯度法fgm。

技术总结
本发明涉及一种模型训练方法及装置,该方法包括:通过半监督方法对训练数据进行扩充;基于扩充后的训练数据训练得到多个不同模型结构的模型;使用训练得到的多个模型分别对待预测数据进行预测,通过投票的方式选择预测结果。一方面,本发明训练多个模型从不同的维度模拟数据的分布,让模型更全面学习到数据的特征;并通过半监督方法扩充训练数据,优化训练数据数量的限制,从而解决了数据不确定性问题;另一方面,本发明通过多个不同模型结构的模型对同一份数据进行预测,能够降低模型参数本身的随机性对预测结果的影响,并通过投票的方式选择预测结果,从而解决了模型学习不确定性问题。性问题。性问题。


技术研发人员:史亚飞 李霄寒
受保护的技术使用者:云知声智能科技股份有限公司
技术研发日:2021.09.15
技术公布日:2021/11/30
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献