一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种能感知设备可用性的高性能联邦边缘学习方法与流程

2022-05-21 08:55:15 来源:中国专利 TAG:


1.本发明涉及无线通讯技术领域,特别是涉及一种能感知设备可用性的高性能联邦边缘学习方法。


背景技术:

2.随着机器学习的发展,在无线边缘部署ml算法,以从智能手机和汽车等边缘设备上生成的海量数据中提取智能信息的趋势越来越大。对于传统的机器学习算法,训练数据需要集中在基站、接入点等边缘服务器上进行模型训练。然而,由于担心隐私泄露,边缘设备可能不愿意与服务器共享敏感数据。为了解决这个问题,近年来,研究者提出了联邦边缘学习(以下简称feel)的概念。feel的模型训练过程是一个迭代的过程,其中一次迭代也成为一次通信。在任意一轮迭代中,每个边缘设备从边缘服务器下载全局ml模型,在本地计算更新的模型或梯度,然后将计算得到的模型或梯度上传到边缘服务器进行模型或梯度聚合,紧接着,边缘服务器将改进后的全局模型回传到边缘设备进行下一轮模型训练。由于feel在模型训练过程中不会暴露设备数据,可以很好的保护用户数据隐私,这引起了产业界和学术界的广泛关注。
3.设计一个有效的feel系统(例如更高的训练性能和较低的训练能耗),需要优化系统的设备调度和无线资源分配。现有的该方向的研究工作大致可以分为三类:设备调度、资源分配,以及联合设备调度和资源分配。现有的常规设备调度方案包括随机调度、循环调度和按比例调度等;已有研究提出了一些在线设备调度方法以最小化feel的训练延迟;另外,还有一些研究在训练延迟和训练能耗之间做出权衡,建立了联合设备调度和资源分配的优化问题,以提高训练性能或节省训练能耗。
4.当前大多数关于设备调度和无线资源分配的研究工作都假设边缘设备始终可以参与feel的训练过程。这种假设在实践中可能并不适用,因为一些设备可能会由于各种原因暂时离开训练过程,例如失去连接、打电话或电池电量不足等。此外,现有研究一般没有考虑无线信道质量或没个边缘设备更新的模型或梯度的质量。这可能不适用于feel系统,因为调度那些无线信道和模型或梯度质量较差的边缘设备不仅会增加训练能耗,还会延长训练时间


技术实现要素:

5.针对上述现有技术的不足,本专利申请所要解决的技术问题是如何提供一种同时感知设备可用性和无线信道质量以及设备更新梯度质量的能感知设备可用性的高性能联邦边缘学习方法。
6.为了解决上述技术问题,本发明采用了如下的技术方案:
7.一种能感知设备可用性的高性能联邦边缘学习方法,包括以下步骤:s1:初始化全局机器学习模型为初始模型,并指定训练次数;s2:边缘服务器向边缘设备广播全局模型;边缘设备根据收到的全局模型和本地数据集计算本地梯度;s3:边缘服务器决定最优的边
缘设备集群调度和通信资源分配方案,边缘服务器根据方案选择一个边缘设备集群,被调度的边缘设备上传本地梯度。s4:边缘服务器计算全局梯度并更新全局模型;s5:判断指标是否收敛或达到训练精度,若是,则结束训练,若否则进入步骤s2。
8.作为优化,全局包括一个边缘服务器以及k个边缘设备,用集合表示,所述边缘服务器和所有的所述边缘设备均配备一根天线,所述边缘设备k的数据集表示为其中表示集合的基数,ξd表示集合中的第d个数据点,用表示所有数据集。
9.作为优化,步骤s1中,学习模型记为w,初始模型为w0,所述初始模型w0通过加载卷积神经网络到边缘服务器,每个边缘设备的数据样本种类和数目都不相同。
10.作为优化,步骤s2中,所述边缘设备计算本地梯度时,包括以下步骤:a1:为每个数据样本ξd定义一个损失函数lk(w,ξd),在数据集上的机器学习模型w的本地损失函数被定义为:
[0011][0012]
a2:在整个数据集上的全局损失函数表示为:
[0013][0014]
a3:定义参数xk∈{0,1}表示边缘设备k的可用性,xk=1表示边缘设备k可以计算本地梯度,同时,定义表示边缘设备k的可用性概率,表示概率分布情况,基于概率ρk,边缘设备k将拥有一个具体的可用性状态,即在第n轮训练中,可以用表示边缘设备k的当前可用性状态;
[0015]
a4:在第n轮训练中,边缘设备k的本地梯度可以表示为其中表示本地损失函数在w=wn处的梯度。
[0016]
作为优化,步骤s3中选择最优的边缘设备集群调度包括以下步骤:b1:定义c<k表示被调度的边缘设备数量;b2:假定每c个边缘设备形成一个边缘设备集群,所有边缘设备将会形成个集群,用集合表示;b3:令表示第m个边缘设备集群中的c个边缘设备集合,调度中的集群m相当于调度集合中的c个边缘设备;b4:定义概率表示在第n轮联邦学习训练中集群m被调度的概率,该概率满足以下约束条件:b5:定义表示所有边缘设备集群被调度的概率分布。
[0017]
作为优化,步骤s3中,被调度的边缘设备上传本地梯度时通过时分复用(tdma)系统提交,在提交时将消耗一定的能量,需要选择最优的通信资源分配方案,在第n轮模型训练过程中,令和分别表示边缘设备k的信道功率增益和传输功率,边缘设备k的传输
速率可以表示为:
[0018]
比特/秒
[0019]
其中,b和σ2分别表示带宽和噪声功率;
[0020]
为了保证设备集群m中的边缘设备k能够成功提交本地梯度,其传输速率需要满足以下约束条件:
[0021][0022]
其中ik(m)∈{0,1}用来确定边缘设备k是否在设备集群m中,即当边缘设备k在设备集群m中时,ik(m)=1,否则ik(m)=0,另外,表示边缘设备k执行本地梯度提交的时间,需要满足以下约束条件:
[0023][0024][0025]
其中,t表示被调度设备执行梯度提交的时间段,因此,在时间段内,边缘设备k消耗的能量可以表示为:
[0026][0027]
其中,那么,总能耗可以表示为:
[0028][0029]
其中,由于设备集群m被调度的概率为根据全概率公式,所考虑的所有边缘设备的平均总能耗可以表示为:
[0030][0031]
其中,因此,系统中的所有边缘设备的平均总能耗将受到无限信道和边缘设备可用性的影响。
[0032]
作为优化,步骤s4中计算边缘服务器全局梯度时采用如下公式:
[0033][0034]
其中
[0035]
边缘服务器进行更新全局模型时根据以下公式进行:
[0036][0037]
作为优化,步骤s5中收敛上限确定时采用如下公式:假定全局损失函数的梯度满足μ-lipschitz条件,可以得到一轮训练收敛上界:
[0038]
[0039]
其中,w
*
表示最优全局模型,即而g(pn)是一个与边缘设备集群调度概率有关的函数:
[0040][0041]
综上,本发明具有以下优点:
[0042]
(1)综合考虑了现实情况中用户可用性和信道质量以及本地梯度质量对学习模型训练收敛性的影响,通过求解一个具有挑战性的非凸优化问题,选择最合适的边缘设备集群参与学习模型更新,从而提高feel系统模型训练准确度。
[0043]
(2)本发明能根据边缘设备的可用性、边缘设备的数据信息以及无线信道质量调整feel系统的更新和优化,从而达到准确处理数据和降低能耗,提高能源利用效率的目的。
附图说明
[0044]
图1为本发明提出的联合设备集群调度和通信资源分配方案流程图;
[0045]
图2为本发明考虑的feel系统概念图本发明考虑的feel系统概念图;
[0046]
图3为解决优化问题1的流程图;
[0047]
图4为feel系统训练准确度随着边缘设备可用性和信道质量变化的变化情况图。
具体实施方式
[0048]
下面结合附图对本发明作进一步的详细说明。在本发明的描述中,需要理解的是,方位词如“上、下”和“顶、底”等所指示的方位或位置关系通常是基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,在未作相反说明的情况下,这些方位词并不指示和暗示所指的装置或元件必须具有特定的方位或者以特定的方位构造和操作,因此不能理解为对本发明保护范围的限制;方位词“内、外”是指相对于各部件本身的轮廓的内外。
[0049]
如图1-4所示,一种能感知设备可用性的高性能联邦边缘学习方法,s1:初始化全局机器学习模型为初始模型,并指定训练次数;s2:边缘服务器向边缘设备广播全局模型;边缘设备根据收到的全局模型和本地数据集计算本地梯度;s3:边缘服务器决定最优的边缘设备集群调度和通信资源分配方案,边缘服务器根据方案选择一个边缘设备集群,被调度的边缘设备上传本地梯度。s4:边缘服务器计算全局梯度并更新全局模型;s5:判断指标是否收敛或达到训练精度,若是,则结束训练,若否则进入步骤s2。
[0050]
作为优化,全局包括一个边缘服务器以及k个边缘设备,用集合表示,所述边缘服务器和所有的所述边缘设备均配备一根天线,所述边缘设备k的数据集表示为其中表示集合的基数,ξd表示集合中的第d个数据点,用表示所有数据集。
[0051]
作为优化,步骤s1中,学习模型记为w,初始模型为w0,所述初始模型w0通过加载卷积神经网络到边缘服务器,将应用数据集mnist随机地加载到各个边缘设备中,每个边缘设备的数据样本种类和数目都不相同,以实现非独立同分布和不均衡的数据集。
[0052]
其中,该步骤将初始模型加载到边缘服务器中,将应用数据集随机地加载到各个边缘设备中,给每个边缘设备随机分配10种数据中的一种数据,并将每种数据的1000张图片随机分成训练集和测试集,单数序号的边缘设备选择作为训练集,偶数序号的边缘设备选择作为训练集,以模拟实际分层联邦边缘学习系统的情况。
[0053]
其中,边缘设备向边缘服务器提交的本地梯度的大小为比特;feel训练模型的学习步长设置为η=0.001,动量权重为momentum=0。
[0054]
作为优化,步骤s2中,所述边缘设备计算本地梯度时,包括以下步骤:a1:为每个数据样本ξd定义一个损失函数lk(w,ξd),在数据集上的机器学习模型w的本地损失函数被定义为:
[0055][0056]
a2:在整个数据集上的全局损失函数表示为:
[0057][0058]
a3:定义参数xk∈{0,1}表示边缘设备k的可用性,xk=1表示边缘设备k可以计算本地梯度,同时,定义表示边缘设备k的可用性概率,表示概率分布情况,基于概率ρk,边缘设备k将拥有一个具体的可用性状态,即在第n轮训练中,可以用表示边缘设备k的当前可用性状态;
[0059]
a4:在第n轮训练中,边缘设备k的本地梯度可以表示为其中表示本地损失函数在w=wn处的梯度。
[0060]
其中,所述边缘服务器向边缘设备广播全局模型,第一轮训练过程中,边缘服务器向边缘设备广播的全局模型为步骤1中加载的初始模型w0。不失一般性地,在第n轮训练中,边缘服务器向边缘设备广播的全局模型为wn。
[0061]
作为优化,步骤s3中选择最优的边缘设备集群调度包括以下步骤:b1:定义c<k表示被调度的边缘设备数量;b2:假定每c个边缘设备形成一个边缘设备集群,所有边缘设备将会形成个集群,用集合表示;b3:令表示第m个边缘设备集群中的c个边缘设备集合,调度中的集群m相当于调度集合中的c个边缘设备;b4:定义概率表示在第n轮联邦学习训练中集群m被调度的概率,该概率满足以下约束条件:b5:定义表示所有边缘设备集群被调度的概率分布。作为优化,步骤s3中,被调度的边缘设备上传本地梯度时通过时分复用(tdma)系统提交,在提交时将消耗一定的能量,需要选择最优的通信资源分配方案,在第n轮模型训练过程中,令和分别表示边缘设备k的信道功率增益和传输功率,边缘设备k的传输速率可以表示为:
[0062]
比特/秒
[0063]
其中,b和σ2分别表示带宽和噪声功率;
[0064]
为了保证设备集群m中的边缘设备k能够成功提交本地梯度,其传输速率需要满足以下约束条件:
[0065][0066]
其中ik(m)∈{0,1}用来确定边缘设备k是否在设备集群m中,即当边缘设备k在设备集群m中时,ik(m)=1,否则ik(m)=0,另外,表示边缘设备k执行本地梯度提交的时间,需要满足以下约束条件:
[0067][0068][0069]
其中,t表示被调度设备执行梯度提交的时间段,因此,在时间段内,边缘设备k消耗的能量可以表示为:
[0070][0071]
其中,那么,总能耗可以表示为:
[0072][0073]
其中,由于设备集群m被调度的概率为根据全概率公式,所考虑的所有边缘设备的平均总能耗可以表示为:
[0074][0075]
其中,因此,系统中的所有边缘设备的平均总能耗将受到无限信道和边缘设备可用性的影响。
[0076]
作为优化,步骤s4中计算边缘服务器全局梯度时采用如下公式:
[0077][0078]
其中
[0079]
边缘服务器进行更新全局模型时根据以下公式进行:
[0080][0081]
作为优化,步骤s5中收敛上限确定时采用如下公式:假定全局损失函数的梯度满足μ-lipschitz条件,可以得到一轮训练收敛上界:
[0082][0083]
其中,w
*
表示最优全局模型,即而g(pn)是一个与边缘设备集群调度概率有关的函数:
[0084][0085]
其中,g(gn)项与设备集群调度的概率分布pn有关,并且将进一步地影响feel模型训练性能,具体地说,g(gn)越小,feel模型训练收敛越快。
[0086]
进一步地,根据上述设置和分析,设备集群调度和通信资源分配(pn,tn)都将影响边缘设备的能耗和模型训练的收敛速度,因此,本发明同时考虑这两方面,在最小化边缘设备能耗的同时,加速模型收敛。构造联合设备集群调度和通信资源分配优化问题1(p1):
[0087]
进一步地,构造优化问题1(p1):
[0088]
(p1):
[0089][0090][0091][0092][0093]
其中,λ∈[0,1]表示权重因子,令表示优化问题1的最优解。
[0094]
本发明提出的求解优化问题1的流程,由于优化问题1是一个非凸优化问题,不能直接求解。因此,本发明根据优化问题1的结构特性,将优化问题1拆分成两个子问题求解,以得到优化问题1的最优解。所述两个子问题,分别为通信资源分配问题和边缘设备集群调度问题。
[0095]
进一步地,通信资源分配问题表示为优化问题2:
[0096]
(p2):
[0097][0098][0099]
其中,表示一组最优解,并且
[0100]
进一步地,给定通信资源分配状态下的边缘设备集群调度问题可以表示为优化问题3:
[0101]
(p3):
[0102][0103][0104]
根据上述分析,优化问题1和两个优化子问题2和3是等效的。
[0105]
进一步地,本发明将优化问题1的求解转化为优化问题2和优化问题3的求解,并
且,优化问题2的结果将作为优化问题3的输入变量。所以,本发明先解决优化问题2。
[0106]
由于优化问题2是一个凸优化问题,本发明采用kkt条件得到最优解的闭合表达式:
[0107][0108]
其中w0(
·
)表示朗博函数,满足
[0109]
进一步地,上述通信资源分配只与信道质量有关,而独立于梯度质量和设备可用性ρk。具体地说,由于更高的信道质量可以支持更高的传输速率,因此,随着设备集群m中的可用设备k的信道质量增加而降低。
[0110]
进一步地,由于优化问题3也是一个凸优化问题,基于求解优化问题2得到的最优通信资源分配,本发明同样采用kkt条件得到最优解的闭合表达式:
[0111][0112]
其中,其中,满足
[0113]
进一步地,上述设备集群调度概率由信道质量、梯度质量和设备可用性共同决定。具体地说,随着集群m中的可用边缘设备的信道质量和梯度质量的增加而增加。这可以用以下事实解释:
[0114]
更高的梯度质量包括更多的本地数据信息,可以为模型训练的收敛做出更多的贡献;更高的信道质量可以支持边缘设备上传更多的高质量本地梯度。
[0115]
另外,调度概率随着集群中所有活跃设备的可用性概率的减少而增加,这是由于可用性概率低的设备拥有更多的新鲜数据,调度这些设备可以加速模型收敛。
[0116]
进一步地,结合上述两个子问题的最优解,可以得到联合边缘设备集群调度和通信资源分配的最优策略,即优化问题1的最优解。并且,上述求解优化问题的过程是在图2所示的步骤3中由边缘服务器实现的,由于本发明提出了优化问题的最优解的闭合表达式,有理由相信边缘设备有足够的处理能力完成上述计算过程。
[0117]
feel系统训练准确度随着边缘设备可用性和信道质量变化的变化情况图。观察图4可以发现,模型测试精度随着设备可用性的增加而增加,但同时设备能耗也随之增加。这是因为边缘设备的频繁参与会增加能耗,但机器学习模型可以获得更好的训练。另外,从图4中还可以发现,提高信道质量不仅可以降低设备能耗,还可以明显提升训练效果,这是因为当信道质量更好时,拥有高质量本地梯度的边缘设备可以消耗更少的能耗完成本地梯度上传,从而提升训练性能。
[0118]
对比方案1表示统一调度方案,每个边缘设备集群被调度的概率相同:
[0119][0120]
对比方案2表示设备可用性和梯度质量感知调度方案,调度策略只与设备可用性
和边缘设备的本地梯度质量有关,而独立于信道质量,即:
[0121][0122]
其中表示边缘设备集群m的平均梯度范数;
[0123]
对比方案3表示设备可用性和信道质量感知调度方案,调度策略只与设备可用性和信道质量有关,而独立于边缘设备的本地梯度质量,即:
[0124][0125]
其中表示边缘设备集群m的平均信道功率增益。
[0126]
上述三种对比方案都采用本发明提出的最优通信资源分配方案。
[0127]
本发明所提出的设计方案在模型测试精度和设备能耗两方面的性能都明显高于上述三种对比方案,原因如下:
[0128]
对比方案1没有考虑边缘设备的可用性,并且在训练过程中也没有考虑信道质量和边缘设备的本地梯度质量;
[0129]
虽然对比方案2同时考虑了边缘设备的可用性和边缘设备的本地梯度质量,但是忽略了信道质量带来的影响;
[0130]
类似地,尽管对比方案3同时考虑了边缘设备的可用性和信道质量,但该方案忽略了边缘设备的本地梯度质量对模型训练带来的影响。
[0131]
相比之下,本发明提出的设计方案可以充分适应边缘设备可用性、边缘设备的本地梯度质量和信道质量的变化,因此可以在达到更高的测试精度的同时消耗更少的能耗。
[0132]
最后应说明的是:本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等统计数的范围之内,则本发明也意图包含这些改动和变型。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献