一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种回归模型训练方法、装置、设备及存储介质与流程

2022-04-30 06:02:22 来源:中国专利 TAG:

技术特征:
1.一种回归模型训练方法,其特征在于,包括:获取用于对预设模型进行训练的目标函数,所述目标函数中包括基于目标约束条件生成的约束调整项;获取目标样本集合,所述目标样本集合中包括至少一个目标样本以及所述至少一个目标样本的真实标签;通过所述预设模型对所述至少一个目标样本进行标签预测,得到所述至少一个目标样本的预测标签;基于所述目标样本集合中所述至少一个目标样本的真实标签以及所述至少一个目标样本的预测标签,确定所述约束调整项的值;基于所述约束调整项的值,确定所述目标函数的函数值;基于所述目标函数的函数值对所述预设模型的模型参数进行更新。2.根据权利要求1所述的一种回归模型训练方法,其特征在于,所述目标约束条件包括方差约束条件,所述约束调整项包括基于所述方差约束条件生成的方差约束调整项;所述基于所述目标样本集合中所述至少一个目标样本的真实标签以及所述至少一个目标样本的预测标签,确定所述约束调整项的值包括:基于所述目标样本集合中各目标样本的真实标签,计算各目标样本的真实标签的均值;对于每个目标样本,基于所述目标样本的真实标签、所述目标样本的预测标签以及所述各目标样本的真实标签的均值,确定与所述目标样本对应的方差约束调整子项的值;基于与各目标样本对应的方差约束调整子项的值,确定所述方差约束调整项的值。3.根据权利要求2所述的一种回归模型训练方法,其特征在于,所述对于每个目标样本,基于所述目标样本的真实标签、所述目标样本的预测标签以及所述各目标样本的真实标签的均值,确定与所述目标样本对应的方差约束调整子项的值包括:对于每个目标样本,确定所述目标样本的真实标签与所述目标样本的预测标签的差值为第一差值,以及确定所述目标样本的真实标签与所述各目标样本的真实标签的均值的差值为第二差值;将所述第一差值和所述第二差值的乘积确定为与所述目标样本对应的方差约束调整子项的值;所述基于与各目标样本对应的方差约束调整子项的值,确定所述方差约束调整项的值包括:对各目标样本对应的方差约束调整子项的值进行求和,得到第一数值;基于对所述第一数值取绝对值后得到的数值计算所述方差约束调整项的值。4.根据权利要求1所述的一种回归模型训练方法,其特征在于,所述目标约束条件包括均值约束条件,所述约束调整项包括基于所述均值约束条件生成的均值约束调整项;所述基于所述目标样本集合中所述至少一个目标样本的真实标签以及所述至少一个目标样本的预测标签,确定所述约束调整项的值包括:对于每个目标样本,基于所述目标样本的真实标签以及所述目标样本的预测标签,确定与所述目标样本对应的均值约束调整子项的值;基于与各目标样本对应的均值约束调整子项的值,确定所述均值约束调整项的值。
5.根据权利要求4所述的一种回归模型训练方法,其特征在于,所述对于每个目标样本,基于所述目标样本的真实标签以及所述目标样本的预测标签,确定与所述目标样本对应的均值约束调整子项的值包括:对于每个目标样本,确定所述目标样本的真实标签与所述目标样本的预测标签的差值为与所述目标样本对应的均值约束调整子项的值;所述基于与各目标样本对应的均值约束调整子项的值,确定所述均值约束调整项的值包括:对各目标样本对应的均值约束调整子项的值进行求和,得到第二数值;基于对所述第二数值取绝对值后得到的数值计算所述均值约束调整项的值。6.根据权利要求1所述的一种回归模型训练方法,其特征在于,所述目标函数中还包括预设基准项;所述方法还包括:为所述预设基准项分配基准系数,为所述约束调整项分配调整系数;基于所述基准系数与所述预设基准项的乘积,以及所述调整系数与所述约束调整项的乘积,生成所述目标函数;所述基于所述约束调整项的值,确定所述目标函数的函数值包括:基于所述目标样本集合中所述至少一个目标样本的真实标签以及所述至少一个目标样本的预测标签,确定所述预设基准项的值;将所述预设基准项的值,以及所述约束调整项的值代入到所述目标函数中,得到所述目标函数的函数值。7.根据权利要求1所述的一种回归模型训练方法,其特征在于,所述基于所述目标函数的函数值对所述预设模型的模型参数进行更新包括:基于所述目标函数的函数值计算所述预设模型中的各模型参数的调整梯度;根据各模型参数的调整梯度分别对相应的模型参数进行调整,得到调整后的模型参数;基于所述调整后的模型参数对所述预设模型的模型参数进行更新。8.一种回归模型训练装置,其特征在于,包括:目标函数获取模块,用于获取用于对预设模型进行训练的目标函数,所述目标函数中包括基于目标约束条件生成的约束调整项;目标样本集合获取模块,用于获取目标样本集合,所述目标样本集合中包括至少一个目标样本以及所述至少一个目标样本的真实标签;标签预测模块,用于通过所述预设模型对所述至少一个目标样本进行标签预测,得到所述至少一个目标样本的预测标签;约束调整项值确定模块,用于基于所述目标样本集合中所述至少一个目标样本的真实标签以及所述至少一个目标样本的预测标签,确定所述约束调整项的值;函数值确定模块,用于基于所述约束调整项的值,确定所述目标函数的函数值;模型参数更新模块,用于基于所述目标函数的函数值对所述预设模型的模型参数进行更新。9.一种设备,其特征在于,所述设备包括处理器和存储器,所述存储器中存储有至少一
条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如权利要求1至7任一项所述的回归模型训练方法。10.一种计算机存储介质,其特征在于,所述存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行如权利要求1至7任一项所述的回归模型训练方法。

技术总结
本申请涉及一种回归模型训练方法、装置、设备及存储介质,所述方法包括:获取用于对预设模型进行训练的目标函数,所述目标函数中包括基于目标约束条件生成的约束调整项;获取目标样本集合;通过所述预设模型对所述目标样本集合中的至少一个目标样本进行标签预测,得到所述至少一个目标样本的预测标签;基于所述目标样本集合中所述至少一个目标样本的真实标签以及所述至少一个目标样本的预测标签,确定所述约束调整项的值;基于所述约束调整项的值,确定所述目标函数的函数值;基于所述目标函数的函数值对所述预设模型的模型参数进行更新。本申请能够使得训练得到的模型的预测效果与约束条件相匹配,并且具有通用性。并且具有通用性。并且具有通用性。


技术研发人员:方俊 林炳怀
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:2020.10.09
技术公布日:2022/4/28
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献