一种基于动态契约理论的车联网联邦学习激励方法

2022-06-22 15:14:10 来源：中国专利 TAG：

技术特征：
1.一种基于动态契约理论的车联网联邦学习激励方法，其特征在于：包括以下步骤：步骤1：建立车联网客户端和联邦学习服务器的效用模型，通过满足ir、ic、iir和iic约束条件，构建两期动态契约模型，得到最优动态契约；步骤2：使用步骤1得到的最优动态契约与车联网客户端进行签约；步骤3：在动态契约的第一阶段，签约的车联网客户端从联邦学习服务器下载全局模型，对全局模型进行本地训练得到本地模型，将训练完成的本地模型上传到联邦学习服务器；步骤4：联邦学习服务器判断车联网客户端上传的本地模型的精度是否满足设定精度阈值，若满足设定精度阈值，联邦学习服务器接收车联网客户端上传的本地模型并按照第一阶段最优动态契约发放相应的奖励，反之则不接收车联网客户端上传的本地模型并不发放奖励；步骤5：在动态契约的第二阶段，签约的车联网客户端从联邦学习服务器下载全局模型，对全局模型进行本地训练得到本地模型，将训练完成的本地模型上传到联邦学习服务器；步骤6：联邦学习服务器判断车联网客户端上传的本地模型的精度是否满足设定精度阈值，若满足设定精度阈值，联邦学习服务器接收车联网客户端上传的本地模型并按照第二阶段最优动态契约发放相应的奖励，反之则不接收车联网客户端上传的本地模型并不发放奖励。2.如权利要求1所述基于动态契约理论的车联网联邦学习激励方法，其特征在于：所述步骤1的具体过程，包括以下步骤：步骤1.1：建立车联网客户端的成本模型、效用模型，建立联邦学习服务器的效用模型；设定类型为m的车联网客户端训练的数据大小为d
m
，训练截止时间为t
m
，其训练数据的cpu频率为f
m
，每轮cpu周期的消耗成本为其中，k为常数；当类型为m的车联网客户端训练的数据大小为d
m
时，需要消耗的cpu周期为pd
m
，其中，p为常数；类型为m型车辆的cpu频率具体包括以下步骤：步骤1.1.1：建立类型为m的车联网客户端的成本模型，如式(1)所示：设定μ＝kp3，其中，μ为常数；将定义为类型为m的车联网客户端的私有信息，表示类型为m的车联网客户端基于训练时间的数据训练能力；类型为m的车联网客户端的成本模型，如式(2)所示：c
m
＝μθ
m
[d
m
]3ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)步骤1.1.2：建立类型为m的车联网客户端的效用模型u
v
，如式(3)所示：u
v
＝r
m-c
m
＝r
m-μθ
m
[d
m
]3ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)其中，r
m
为类型为m的车联网客户端从联邦学习服务器收到的奖励；步骤1.1.3：联邦学习服务器从类型为m的车联网客户端上传的本地模型中获得的收益g
m
，如式(4)所示：
g
m
＝σlog(1 αd
m
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)其中，σ和α基于数据大小确定模型精度对联邦学习服务器收益的影响；建立联邦学习服务器的效用模型u
s
，如式(5)所示：其中，n代表有n个车联网客户端参与联邦学习训练，q
m
代表类型为m的车联网客户端的先验概率分布，r
m
为联邦学习服务器为类型为m的车联网客户端发放的奖励；步骤1.2：建立动态契约第二阶段和第一阶段的车联网客户端的效用模型、两阶段的最优契约模型；具体分为以下步骤：步骤1.2.1：建立第二阶段的类型为n的车联网客户端的效用模型，如式(6)所示：其中，代表第一阶段类型为m第二阶段类型为n的车联网客户端的私有信息；第二阶段类型为n的车联网客户端在选择契约时获得非负效用，满足ir(individual rationality)约束条件，如式(7)所示：其中，x为常数，表示第二阶段类型为n的车联网客户端最小可接受效用；第二阶段类型为n的车联网客户端在选择和自身类型相同的契约时获得最大效用，满足ic(incentive compatibility)约束条件，如式(8)所示：其中，和为选取最适合自身契约情况下的第二阶段的奖励和训练数据大小；和为选取其他契约情况下第二阶段的奖励和训练数据大小；步骤1.2.2：建立第一阶段的类型为m的车联网客户端的跨期效用模型，如式(9)所示：其中，为类型为m的车联网客户端在第一阶段的私有信息；δ为折扣因子；表示第二阶段先验概率分布；第一阶段类型为m的车联网客户端应满足iir(intertemporal individually rational)约束条件，如式(10)所示：同时满足iic(intertemporal incentive compatibility)约束条件，如式(11)所示：
两阶段满足ir，ic，iir和iic约束条件时，两期动态合同的优化问题，如式(12)-式(16)所示：所示：所示：所示：所示：其中,为联邦学习服务器在第一阶段的效用，为联邦学习服务器在第二阶段的效用；步骤1.3：放松ir、ic、iir、iic约束条件，得到联邦学习服务器和车联网客户端的最优动态合约；对步骤1.2中的ir约束进行放松约束，如式(17)所示：对步骤1.2中的ic约束进行放松约束，如式(18)所示：对步骤1.2中的iir约束进行放松约束，如式(19)所示：对步骤1.2中中的iic约束进行放松约束，如式(20)所示：通过放松步骤1.2中的约束条件，两期动态合同的优化问题，如式(21)-式(25)所示：式(25)所示：式(25)所示：
在放松后约束条件下，式(21)-式(25)，通过拉格朗日函数可以得到最终的最优动态契约。3.如权利要求1所述基于动态契约理论的车联网联邦学习激励方法，其特征在于：所述步骤2的具体过程，包括以下步骤：步骤2.1：联邦学习服务器向车联网客户端广播最优动态契约；联邦学习服务器将步骤1.3中得到的最优动态契约广播给所有参与合作的车联网客户端；步骤2.2：车联网客户端选择是否签约最优动态契约，若是执行步骤3，若否，则退出此次合作。4.如权利要求1所述基于动态契约理论的车联网联邦学习激励方法，其特征在于：所述步骤3的具体过程，包括以下步骤：步骤3.1：车联网客户端从联邦学习服务器下载全局模型；步骤3.2：车联网客户端使用本地数据对从联邦学习服务器下载的全局模型进行训练，按照选择的契约训练相应的数据量，训练完成后执行步骤3.3；步骤3.3：车联网客户端将训练完成的本地模型上传给联邦学习服务器。5.如权利要求1所述基于动态契约理论的车联网联邦学习激励方法，其特征在于：所述步骤4的具体过程，包括以下步骤：步骤4.1：联邦学习服务器将验证车联网客户端上传的本地模型，设定精度阈值ψ；若模型的测试精度大于等于精度阈值ψ，则通过验证接收模型并执行步骤4.2，若小于精度阈值ψ，则拒绝接收该模型；步骤4.2：联邦学习服务器对接受模型的车联网客户端按照签约的第一阶段最优动态契约发放相应的奖励。6.如权利要求1所述基于动态契约理论的车联网联邦学习激励方法，其特征在于：所述步骤5的具体过程，包括以下步骤：步骤5.1：车联网客户端从联邦学习服务器下载全局模型；步骤5.2：车联网客户端使用本地数据对从联邦学习服务器下载的全局模型进行训练，按照选择的契约训练相应的数据量，训练完成后执行步骤5.3；步骤5.3：车联网客户端将训练完成的本地模型上传给联邦学习服务器。7.如权利要求1所述基于动态契约理论的车联网联邦学习激励方法，其特征在于：所述步骤6的具体过程，包括以下步骤：步骤6.1：联邦学习服务器将验证车联网客户端上传的本地模型，设定精度阈值ψ；若模型的测试精度大于等于精度阈值ψ，则通过验证接收模型并执行步骤6.2，若小于精度阈值ψ，则拒绝接收该模型；
步骤6.2：联邦学习服务器对接受模型的车联网客户端按照签约的第二阶段最优动态契约发放相应的奖励。8.如权利要求4所述基于动态契约理论的车联网联邦学习激励方法，其特征在于：所述全局模型为联邦学习服务器需要车联网客户端训练的模型。

技术总结
本发明公开了一种基于动态契约理论的车联网联邦学习激励方法，涉及联邦学习领域；采用了联邦学习架构，使数据在本地进行训练，保障了数据的隐私和安全。在采用联邦学习架构的基础上，为联邦学习服务器和车联网客户端建立了两期动态契约激励机制，在非对称信息的情况下，最大化联邦学习服务器的效用，使车联网客户端选择和自身私有信息相对应的契约，当车联网客户端选择和自身类型相对应的契约时，车联网客户端获得的效用最高。在长期合作下，考虑了车联网联邦学习的私有信息的动态变化，采用了动态契约激励机制，更适用于联邦学习服务器和车联网边缘设备之间的长期合作，在动态契约激励机制下，联邦学习服务器和车联网边缘设备会获得更高的收益。会获得更高的收益。会获得更高的收益。

技术研发人员：陈俣欣刘园
受保护的技术使用者：东北大学
技术研发日：2022.03.31
技术公布日：2022/6/21

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

一种基于动态契约理论的车联网联邦学习激励方法

相关文献

最热文献