一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

模型间的特征兼容学习方法、装置、电子设备及介质与流程

2021-11-05 22:57:00 来源:中国专利 TAG:

技术特征:
1.一种模型间的特征兼容学习方法,其特征在于,包括:根据第一模型确定的模型参数和第二模型待学习的模型参数以及新训练数据集,确定第一模型和第二模型的特征兼容学习信息,所述特征兼容学习信息包括代表特征迁移损失和/或网络组件的结构正则,所述新训练数据集用于第二模型训练;将所述特征兼容学习信息以及用于监督第二模型的目标损失共同作为第二模型最终的优化目标,以完成第一模型和第二模型间的特征兼容学习。2.根据权利要求1所述的方法,其特征在于,所述确定第一模型和第二模型的代表特征迁移损失,包括:使用第一模型提取新训练数据集中所有样本的特征,得到第一模型特征;基于第一模型特征,提取第一模型对应的每个类别的代表特征;使用第二模型提取新训练数据集中所有样本的特征,得到第二模型特征,对于每个第二模型特征,计算其与各所述代表特征的相似度;计算基于所述相似度的代表特征迁移损失,以实现第一模型和第二模型的特征兼容;所述代表特征迁移损失的表达式如下:其中,为第二模型参数,m
o
为第一模型代表特征的集合,t
n
为新训练数据集,符号<.,.>代表样本特征的余弦距离,x
c
为类别标签为c的样本,为c类别的代表特征。3.根据权利要求1或2所述的方法,其特征在于,所述第一模型的网络组件包括第一特征提取模块和第一任务头模块;所述第二模型的网络组件包括第二特征提取模块和第二任务头模块。4.根据权利要求3所述的方法,其特征在于,所述确定第一模型和第二模型的网络组件的结构正则,包括:确定第一特征提取模块和第二任务头模块重组后的第一重组网络的第一监督损失;确定第二特征提取模块和第一任务头模块重组后的第二重组网络的第二监督损失;根据第一监督损失和第二监督损失确定第一模型和第二模型相互结构正则化的优化目标;所述优化目标的表达式如下:其中,l
ce_o
为第一监督损失,l
ce_n
为第二监督损失;代表使用第一特征提取模块和第二任务头模块h
n
在数据集t
n
上进行特定的目标任务,t
n
为新训练数据集;代表使用第二特征提取模块和第一任务头模块h
o
在数据集t
n

上进行特定的目标任务,t
n

为新训练数据集与旧训练数据集中具有相同类别的样本集合,所述旧训练数据集用于第一模型训练。5.一种模型间的特征兼容学习装置,其特征在于,包括:确定模块,用于根据第一模型确定的模型参数和第二模型待学习的模型参数以及新训
练数据集,确定第一模型和第二模型的特征兼容学习信息,所述特征兼容学习信息包括代表特征迁移损失和/或网络组件的结构正则,所述新训练数据集用于第二模型训练;特征兼容模块,用于将所述特征兼容学习信息以及用于监督第二模型的目标损失共同作为第二模型最终的优化目标,以完成第一模型和第二模型间的特征兼容学习。6.根据权利要求5所述的装置,其特征在于,所述确定模块,具体用于:使用第一模型提取新训练数据集中所有样本的特征,得到第一模型特征;基于第一模型特征,提取第一模型对应的每个类别的代表特征;使用第二模型提取新训练数据集中所有样本的特征,得到第二模型特征,对于每个第二模型特征,计算其与各所述代表特征的相似度;计算基于所述相似度的代表特征迁移损失,以实现第一模型和第二模型的特征兼容;所述代表特征迁移损失的表达式如下:其中,为第二模型参数,m
o
为第一模型代表特征的集合,t
n
为新训练数据集,符号<.,.>代表样本特征的余弦距离,x
c
为类别标签为c的样本,为c类别的代表特征。7.根据权利要求5或6所述的装置,其特征在于,所述第一模型的网络组件包括第一特征提取模块和第一任务头模块;所述第二模型的网络组件包括第二特征提取模块和第二任务头模块。8.根据权利要求7所述的装置,其特征在于,所述确定模块,具体用于:确定第一特征提取模块和第二任务头模块重组后的第一重组网络的第一监督损失;确定第二特征提取模块和第一任务头模块重组后的第二重组网络的第二监督损失;根据第一监督损失和第二监督损失确定第一模型和第二模型相互结构正则化的优化目标;所述优化目标的表达式如下:其中,l
ce_o
为第一监督损失,l
ce_n
为第二监督损失;代表使用第一特征提取模块和第二任务头模块h
n
在数据集t
n
上进行特定的目标任务,t
n
为新训练数据集;代表使用第二特征提取模块和第一任务头模块h
o
在数据集t
n

上进行特定的目标任务,t
n

为新训练数据集与旧训练数据集中具有相同类别的样本集合,所述旧训练数据集用于第一模型训练。9.一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器运行所述计算机程序时执行以实现如权利要求1至4中任一项所述的方法。10.一种计算机可读存储介质,其特征在于,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现如权利要求1至4中任一项所述的方法。

技术总结
本申请提供一种模型间的特征兼容学习方法、装置、电子设备及介质。所述方法包括:根据第一模型确定的模型参数和第二模型待学习的模型参数以及新训练数据集,确定第一模型和第二模型的特征兼容学习信息,所述特征兼容学习信息包括代表特征迁移损失和/或网络组件的结构正则,所述新训练数据集用于第二模型训练;将所述特征兼容学习信息以及用于监督第二模型的目标损失共同作为第二模型最终的优化目标,以完成第一模型和第二模型间的特征兼容学习,通过本方案,能够获得一个兼容的特征,使得其可以与旧版本模型提取的特征直接进行匹配检索,旧版本模型被更新后,整个数据库的特征无需被重新提取,节约了时间,减少了计算资源消耗。消耗。消耗。


技术研发人员:段凌宇 白燕 吴生森
受保护的技术使用者:北京大学
技术研发日:2021.07.01
技术公布日:2021/11/4
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献