一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

模型训练方法、装置、存储介质及电子设备与流程

2021-10-20 00:04:00 来源:中国专利 TAG:人工智能 电子设备 装置 模型 训练

技术特征:
1.一种模型训练方法,包括:获取多个数据集;将多个数据集逐个输入初始多任务模型;其中,所述初始多任务模型包含模型参数,所述模型参数包含共享参数和任务参数;其中,所述共享参数为所述初始多任务模型中多个任务共有的模型参数,所述任务参数为所述初始多任务模型中多个任务中每个任务独有的模型参数;基于所述初始多任务模型的输出结果调整所述模型参数,得到训练后的多任务模型。2.根据权利要求1所述的训练方法,其特征在于,基于所述初始多任务模型的输出结果调整所述模型参数,得到训练后的多任务模型,包括:根据所述初始多任务模型的输出结果计算损失函数的总损失值,并根据所述损失值对所述多任务模型的模型参数进行调整。3.根据权利要求2所述的训练方法,其特征在于,每个数据集包含一个或多个任务标签,若每个数据集的任务标签数量为一个,则将该任务标签对应的任务的损失值作为该数据集的损失值,其中,根据每个数据集的损失值计算得到损失函数的总损失值。4.根据权利要求2所述的训练方法,其特征在于,每个数据集包含一个或多个任务标签,若所述数据集的任务标签数量为多个,则将多个任务标签对应的多个任务的损失值之和作为该数据集的损失值,其中,根据每个数据集的损失值计算得到损失函数的总损失值。5.根据权利要求2所述的训练方法,其特征在于,所述总损失值为多个数据集对应的所有任务的损失值之和。6.根据权利要求5所述的训练方法,其特征在于,多个数据集中的每个数据集对应的损失函数乘以c,其中,c为每个数据集占所有数据集的比重。7.根据权利要求5所述的训练方法,其特征在于,所述损失函数中还包含动态系数,其中,所述动态系数可根据当前模型训练自适应调整。8.根据权利要求1所述的训练方法,其特征在于,所述获取多个数据集包括:将所述多个数据集按照第一顺序加载入数据加载器,并将加载入数据加载器中的数据集按照预设批数量进行划分。9.根据权利要求8所述的训练方法,其特征在于,所述将加载入数据加载器中的数据集按照预设批数量进行划分之后,还包括:判断是否还存在下一批数据,其中,所述下一批数据为需要从数据加载器输出的数据;若有,则继续输出下一批数据。10.根据权利要求9所述的训练方法,其特征在于,若没有,则所述多个数据集按照第二顺序加载入数据加载器,其中,所述第一顺序和所述第二顺序不同。11.根据权利要求1所述的训练方法,其特征在于,将所述多个数据集中的部分数据集进行合并,得到多个合并后的数据集;将所述多个合并后的数据集逐个输入初始多任务模型。12.根据权利要求11所述的训练方法,其特征在于,所述将所述多个数据集中的部分数据集进行合并,包括:将带有相同任务标签的数据集进行合并。
13.根据权利要求12所述的训练方法,其特征在于,将带有相同任务标签比例大于合并阈值的数据集进行合并。14.根据权利要求1

13任一项所述的训练方法,其特征在于,包括:获取待处理数据,其中,所述待处理数据包含多个数据集,每个数据集包含一个或多个任务标签;利用权所述训练得到训练后的多任务模型对所述待处理数据进行处理,得到处理结果。15.一种模型训练装置,包括:第一获取模块,用于获取多个数据集;输入模块,用于将所述多个数据集逐个输入初始多任务模型;其中,所述初始多任务模型包括共享参数和任务参数,所述共享参数为多个任务共有的模型参数,所述任务参数为多个任务中每个任务各自独有的模型参数;训练模块,用于基于所述初始多任务模型的输出结果训练所述初始多任务模型,得到训练后的多任务模型。16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,当所述计算机程序在计算机上运行时,使得所述计算机执行如权利要求1至13任一项所述的模型训练方法。17.一种电子设备,包括处理器和存储器,所述存储器存储有计算机程序,其特征在于,所述处理器通过调用所述计算机程序,用于执行如权利要求1至13任一项所述的模型训练方法。

技术总结
本申请公开一种模型训练方法、装置、存储介质及电子设备。其中,获取多个数据集;将多个数据集逐个输入初始多任务模型;其中,所述初始多任务模型包含模型参数,所述模型参数包含共享参数和任务参数;其中,所述共享参数为所述初始多任务模型中多个任务共有的模型参数,所述任务参数为所述初始多任务模型中多个任务中每个任务独有的模型参数;基于所述初始多任务模型的输出结果调整所述模型参数,得到训练后的多任务模型。本方法能够避免针对同一训练样本进行重复计算的问题,提高了训练效率,节省了计算资源。节省了计算资源。节省了计算资源。


技术研发人员:陈子予 陶训强 何苗 郭彦东
受保护的技术使用者:OPPO广东移动通信有限公司
技术研发日:2021.04.16
技术公布日:2021/10/19
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜