一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于联合学习的确定资源贡献度的方法、装置和电子设备与流程

2022-06-01 08:12:50 来源:中国专利 TAG:

技术特征:
1.一种基于联合学习的确定资源贡献度的方法,其特征在于,包括:获取联合学习架构中的各个参与方上传的模型;其中,所述上传的模型携带有模型的通讯轮次,以及所述通讯轮次对应的参与方的边际贡献值;基于所述边际贡献值,确定所述各参与方的资源量;根据所述参与方的资源量和夏普利值算法,确定所述各个参与方的分配资源量;基于所述通讯轮次和分配资源量,得到所述各参与方对联合模型的贡献度。2.根据权利要求1所述的方法,其特征在于,所述各个参与方的资源量包括用于联合模型训练的数据数量。3.根据权利要求1所述的方法,其特征在于,所述分配资源量包括参与方在各个通讯轮次对应的资源量的夏普利值;所述根据所述参与方的资源量和夏普利值算法,确定所述各个参与方的分配资源量,包括:基于所述参与方的数量,确定所述参与方加入联盟的全部组合顺序,其中,每一种加入联盟的组合顺序为一个子联盟;基于蒙特卡罗采样方法对所述全部组合顺序进行采样,确定进行夏普利值计算的目标子联盟;在各个通讯轮次中,基于夏普利值算法计算所述目标子联盟对应的组合顺序中每个所述参与方加入所述目标子联盟的边际贡献,其中,所述边际贡献等于所述参与方在当前通讯轮次的资源量的效用函数值;在当前通讯轮次的全局模型的边际贡献与所述全局模型的绝对差值小于预设的第一阈值的情况下,退出当前通讯轮次的所述目标子联盟对应的组合顺序中每个所述参与方的边际贡献计算,且当前通讯轮次各个所述参与方的夏普利值为基于所述蒙特卡罗采样方法计算的边际贡献的均值;在当前通讯轮次的全局模型的边际贡献与上一通讯轮次的全局模型的边际贡献的绝对差值小于或等于预设的第二阈值的情况下,结束计算各个所述参与方的夏普利值,其中,当前通讯轮次各个所述参与方的夏普利值均为零。4.根据权利要求3所述的方法,其特征在于,还包括:基于所述夏普利值算法,确定最终的联合模型的边际增益,其中,所述边际增益等于最终的联合模型的效用函数值与初始模型的效用函数值的绝对差值;基于所述边际增益,确定所述第二阈值。5.根据权利要求4所述的方法,其特征在于,还包括:在至少两个连续通讯轮次内,若所述边际增益的平局值小于所述第二阈值,则结束计算各个所述参与方的夏普利值。6.根据权利要求1所述的方法,其特征在于,所述分配资源量包括参与方在各个通讯轮次对应的资源量的夏普利值;所述根据所述参与方的资源量和夏普利值算法,确定所述各个参与方的分配资源量,包括:基于所述参与方的数量,确定所述参与方加入联盟的全部组合顺序;计算每种所述组合顺序的权重;在每个通讯轮次内,计算当前通讯轮次全局模型的效用函数值与上一通讯轮次全局模
型的效用函数值的绝对差值;在所述绝对差值大于预设的第二阈值的情况下,获取所述参与方加入联盟的全部组合顺序中小于或等于预设的权重阈值的目标组合顺序,并计算各个所述参与方在所述目标组合顺序下的边际贡献;在所述绝对差值小于或等于预设的第二阈值的情况下,退出计算所述参与方在当前通讯轮次的边际贡献;基于所述参与方的边际贡献和夏普利值算法,确定所述参与方在各个通讯轮次对应的资源量的夏普利值。7.根据权利要求1所述的方法,其特征在于,所述分配资源量包括参与方在各个通讯轮次对应的资源量的夏普利值;所述根据所述参与方的资源量和夏普利值算法,确定所述各个参与方的分配资源量,包括:基于所述参与方的数量,确定全部所述参与方加入联盟的全组合顺序,以及由部分所述参与方加入联盟的头部组合顺序;计算每种所述组合顺序的权重;在每个通讯轮次内,计算当前通讯轮次全局模型的效用函数值与上一通讯轮次全局模型的效用函数值的绝对差值;在所述绝对差值大于预设的第二阈值的情况下,分别计算所述头部组合顺序的效用函数值和所述全部组合顺序的效用函数值,并利用所述头部组合顺序的效用函数值和所述全部组合顺序的效用函数值进行线性或非线性函数插值,估计其余部分所述参与方加入联盟的剩余组合顺序的效用函数值;基于所述效用函数值和夏普利算法,确定所述参与方在各个通讯轮次对应的资源量的夏普利值。8.根据权利要求3、6或7所述的方法,其特征在于,所述基于所述通讯轮次和分配资源量,得到所述各参与方对联合模型的贡献度,包括:计算所述参与方在各个通讯轮次对应的资源量的夏普利值的加和,得到所述参与方对联合模型的贡献度。9.一种基于联合学习的确定资源贡献度的装置,其特征在于,包括:获取模块,被配置为获取联合学习架构中的各个参与方上传的模型;其中,所述上传的模型携带有模型的通讯轮次,以及所述通讯轮次对应的参与方的边际贡献值;第一确定模块,被配置为基于所述边际贡献值,确定所述各参与方的资源量;计算模块,被配置为根据所述参与方的资源量和夏普利值算法,确定所述各个参与方的分配资源量;第二确定模块,被配置为基于所述通讯轮次和分配资源量,得到所述各参与方对联合模型的贡献度。10.一种电子设备,包括存储器、处理器以及存储在所述存储器中并且可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8中任一项所述方法的步骤。

技术总结
本公开涉及联合学习技术领域,提供了一种基于联合学习的确定资源贡献度的方法、装置和电子设备。该方法包括:获取联合学习架构中的各个参与方上传的模型;其中,上传的模型携带有模型的通讯轮次,以及通讯轮次对应的参与方的边际贡献值;基于边际贡献值,确定各参与方的资源量;根据参与方的资源量和夏普利值算法,确定各个参与方的分配资源量;基于通讯轮次和分配资源量,得到各参与方对联合模型的贡献度。本公开可以通过参与方对于联合模型的贡献度来实现联合学习的激励分配,以保证联合学习的成功进行和可持续性。习的成功进行和可持续性。习的成功进行和可持续性。


技术研发人员:杨程屹 刘嘉 李增祥
受保护的技术使用者:新智我来网络科技有限公司
技术研发日:2022.02.11
技术公布日:2022/5/31
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献