确定联合学习中参与方贡献度的方法及装置与流程

2022-03-02 00:48:01 来源：中国专利 TAG：

1.本公开涉及联合学习技术领域，尤其涉及一种确定联合学习中参与方贡献度的方法及装置。

背景技术：

2.随着人工智能以及分布式机器学习技术的发展，通过联合不同参与方进行机器学习的联合学习方法成为一种训练人工智能模型的主流趋势。联合学习作为一种新型的分布式机器学习框架，满足了多个客户端在数据安全的要求下进行模型训练的需求。
3.现有技术中，在对联合学习中参与方的贡献度进行衡量时，通常利用联合学习系统基于各参与方的本地数据量，来确定各参与方在联合学习中对联合学习模型的贡献度。但是，由于各参与方的本地数据可能存在数据质量参差不齐，本地数据的形式不同等问题，导致现有的联合学习贡献度的计算方法，存在计算精度低，计算结果不准确，计算数据量比较大，计算效率低等问题。
4.鉴于上述现有技术中的问题，需要提供一种能够提升贡献值的计算精度，降低计算数据量，使贡献值的计算结果更准确，计算效率更高的确定联合学习中参与方贡献度的方法。

技术实现要素：

5.有鉴于此，本公开实施例提供了一种确定联合学习中参与方贡献度的方法及装置，以解决现有技术存在的联合学习贡献度的计算方法，存在计算精度低，计算结果不准确，计算数据量比较大，计算效率低的问题。
6.本公开实施例的第一方面，提供了一种确定联合学习中参与方贡献度的方法，包括：基于联合学习的架构，生成多个参与方组，并确定由多个参与方组构成的参与方组集合，计算参与方组的权重，其中每个参与方组包含至少两个参与方；确定联合学习中的聚合周期，获取聚合周期前后联合学习模型对应的效用变化值并建立查找表，根据效用变化值判断是否计算聚合周期内各个参与方的贡献值；当判断结果为是时，利用参与方组集合中的参与方组随机生成一个全排列组合，并根据全排列组合中参与方组中的参与方顺序生成多个子组合，计算参与方加入子组合时的边际贡献值的估计值，根据边际贡献值的估计值以及参与方组的权重，判断是否采用插值函数对参与方加入子组合后形成的新参与方组的效用值进行计算；当判断结果为是时，利用插值函数计算新参与方组的效用值，当判断结果为否时，利用预设的模型推演方式计算新参与方组的效用值，并依据计算出的新参与方组的效用值对查找表进行更新；基于更新后的查找表，计算参与方的边际贡献值，并判断参与方的边际贡献值是否收敛，当判断结果为是时，将收敛后的边际贡献值作为参与方的贡献值，当判断结果为否时，生成一个新的全排列组合，直至计算得到所有收敛后的参与方的贡献值，根据贡献值确定参与方在联合学习中的贡献度。
7.本公开实施例的第二方面，提供了一种确定联合学习中参与方贡献度的装置，包
括：生成模块，被配置为基于联合学习的架构，生成多个参与方组，并确定由多个参与方组构成的参与方组集合，计算参与方组的权重，其中每个参与方组包含至少两个参与方；建立模块，被配置为确定联合学习中的聚合周期，获取聚合周期前后联合学习模型对应的效用变化值并建立查找表，根据效用变化值判断是否计算聚合周期内各个参与方的贡献值；判断模块，被配置为当判断结果为是时，利用参与方组集合中的参与方组随机生成一个全排列组合，并根据全排列组合中参与方组中的参与方顺序生成多个子组合，计算参与方加入子组合时的边际贡献值的估计值，根据边际贡献值的估计值以及参与方组的权重，判断是否采用插值函数对参与方加入子组合后形成的新参与方组的效用值进行计算；更新模块，被配置为当判断结果为是时，利用插值函数计算新参与方组的效用值，当判断结果为否时，利用预设的模型推演方式计算新参与方组的效用值，并依据计算出的新参与方组的效用值对查找表进行更新；计算模块，被配置为基于更新后的查找表，计算参与方的边际贡献值，并判断参与方的边际贡献值是否收敛，当判断结果为是时，将收敛后的边际贡献值作为参与方的贡献值，当判断结果为否时，生成一个新的全排列组合，直至计算得到所有收敛后的参与方的贡献值，根据贡献值确定参与方在联合学习中的贡献度。
8.本公开实施例采用的上述至少一个技术方案能够达到以下有益效果：
9.通过基于联合学习的架构，生成多个参与方组，并确定由多个参与方组构成的参与方组集合，计算参与方组的权重，其中每个参与方组包含至少两个参与方；确定联合学习中的聚合周期，获取聚合周期前后联合学习模型对应的效用变化值并建立查找表，根据效用变化值判断是否计算聚合周期内各个参与方的贡献值；当判断结果为是时，利用参与方组集合中的参与方组随机生成一个全排列组合，并根据全排列组合中参与方组中的参与方顺序生成多个子组合，计算参与方加入子组合时的边际贡献值的估计值，根据边际贡献值的估计值以及参与方组的权重，判断是否采用插值函数对参与方加入子组合后形成的新参与方组的效用值进行计算；当判断结果为是时，利用插值函数计算新参与方组的效用值，当判断结果为否时，利用预设的模型推演方式计算新参与方组的效用值，并依据计算出的新参与方组的效用值对查找表进行更新；基于更新后的查找表，计算参与方的边际贡献值，并判断参与方的边际贡献值是否收敛，当判断结果为是时，将收敛后的边际贡献值作为参与方的贡献值，当判断结果为否时，生成一个新的全排列组合，直至计算得到所有收敛后的参与方的贡献值，根据贡献值确定参与方在联合学习中的贡献度。本公开能够提升联合学习中参与方贡献值的计算精度，降低计算数据量，使贡献值的计算结果更准确，计算效率更高。
附图说明
10.为了更清楚地说明本公开实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。
11.图1是本公开实施例提供的一种联合学习的架构示意图；
12.图2是本公开实施例提供的确定联合学习中参与方贡献度的方法的流程示意图；
13.图3是本公开实施例提供的计算参与方贡献值的程序流程示意图；
14.图4是本公开实施例提供的确定联合学习中参与方贡献度的装置的结构示意图；
15.图5是本公开实施例提供的电子设备的结构示意图。
具体实施方式
16.以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本公开实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本公开。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本公开的描述。
17.联合学习是指在确保数据安全及用户隐私的前提下，综合利用多种ai(artificial intelligence，人工智能)技术，联合多方合作共同挖掘数据价值，催生基于联合建模的新的智能业态和模式。联合学习至少具有以下特点：
18.(1)参与节点控制自有数据的弱中心化联合训练模式，确保共创智能过程中的数据隐私安全。
19.(2)在不同应用场景下，利用筛选和/或组合ai算法、隐私保护计算，建立多种模型聚合优化策略，以获取高层次、高质量的模型。
20.(3)在确保数据安全及用户隐私的前提下，基于多种模型聚合优化策略，获取提升联合学习引擎的效能方法，其中效能方法可以是通过解决包括计算架构并行、大规模跨域网络下的信息交互、智能感知、异常处理机制等，提升联合学习引擎的整体效能。
21.(4)获取各场景下多方用户的需求，通过互信机制，确定合理评估各联合参与方的真实贡献度，进行分配激励。
22.基于上述方式，可以建立基于联合学习的ai技术生态，充分发挥行业数据价值，推动垂直领域的场景落地。
23.目前随着联合学习参与方以及计算数据量的增加，如何精准快速地评估联合学习中各参与方对联合学习模型训练的贡献度成为亟需解决的问题。现有技术中，联合学习系统根据各参与方的本地数据量确定各参与方对联合学习模型的贡献度，但由于各参与方的本地数据可能存在数据质量参差不齐，本地数据的格式或形式不同，各参与方的数据特征重叠较多等问题，导致在联合学习中对联合学习模型的贡献度的计算效率较低，并且各参与方的联合学习贡献度的准确率也较低。这将会导致后期利用联合学习贡献度对各参与方的收益进行分配时，对各参与方贡献度的公平性和公正性的评估不足。
24.鉴于以上现有技术中的问题，需要提供一种基于沙普利值计算法则，结合各参与方加入参与方组时产生的边际贡献值，对联合学习中各参与方的贡献度进行计算的方法。基于本公开的实施例，能够提升联合学习中对各参与方的联合学习模型训练的贡献值进行精确计算，并降低计算量，使得贡献值的计算结果更加准确，计算效率更高。
25.下面将结合附图详细说明根据本公开实施例的一种确定联合学习中参与方贡献度的方法及装置。
26.图1是本公开实施例提供的一种联合学习的架构示意图。如图1所示，联合学习的架构可以包括服务器(中心节点)101以及参与方102、参与方103和参与方104。
27.在联合学习过程中，基本模型可以通过服务器101建立，服务器101将该模型发送至与其建立通信连接的参与方102、参与方103和参与方104。基本模型还可以是任一参与方
建立后上传至服务器101，服务器101将该模型发送至与其建立通信连接的其他参与方。参与方102、参与方103和参与方104根据下载的基本结构和模型参数构建模型，利用本地数据进行模型训练，获得更新的模型参数，并将更新的模型参数加密上传至服务器101。服务器101对参与方102、参与方103和参与方104发送的模型参数进行聚合，获得全局模型参数，并将全局模型参数传回至参与方102、参与方103和参与方104。参与方102、参与方103和参与方104根据接收的全局模型参数对各自的模型进行迭代，直到模型最终收敛，从而实现对模型的训练。在联合学习过程中，参与方102、参与方103和参与方104上传的数据为模型参数，本地数据并不会上传至服务器101，且所有参与方可以共享最终的模型参数，因此可以在保证数据隐私的基础上实现共同建模。需要说明的是，参与方的数量不限于如上的三个，而是可以根据需要进行设置，本公开实施例对此不作限制。
28.图2是本公开实施例提供的确定联合学习中参与方贡献度的方法的流程示意图。图2的用于联合学习中确定参与方贡献度的方法可以由联合学习的服务器执行。如图2所示，该确定联合学习中参与方贡献度的方法具体可以包括：
29.s201，基于联合学习的架构，生成多个参与方组，并确定由多个参与方组构成的参与方组集合，计算参与方组的权重，其中每个参与方组包含至少两个参与方；
30.s202，确定联合学习中的聚合周期，获取聚合周期前后联合学习模型对应的效用变化值并建立查找表，根据效用变化值判断是否计算聚合周期内各个参与方的贡献值；
31.s203，当判断结果为是时，利用参与方组集合中的参与方组随机生成一个全排列组合，并根据全排列组合中参与方组中的参与方顺序生成多个子组合，计算参与方加入子组合时的边际贡献值的估计值，根据边际贡献值的估计值以及参与方组的权重，判断是否采用插值函数对参与方加入子组合后形成的新参与方组的效用值进行计算；
32.s204，当判断结果为是时，利用插值函数计算新参与方组的效用值，当判断结果为否时，利用预设的模型推演方式计算新参与方组的效用值，并依据计算出的新参与方组的效用值对查找表进行更新；
33.s205，基于更新后的查找表，计算参与方的边际贡献值，并判断参与方的边际贡献值是否收敛，当判断结果为是时，将收敛后的边际贡献值作为参与方的贡献值，当判断结果为否时，生成一个新的全排列组合，直至计算得到所有收敛后的参与方的贡献值，根据贡献值确定参与方在联合学习中的贡献度。
34.具体地，每一个参与方对应联合学习框架中的一个节点，每一个节点对应一个参与方设备，参与方设备可以是pc、平板电脑、智能手机、智能可穿戴设备等，每一个参与方设备上具有联合学习参与方的客户终端，但参与方设备并不局限于上述这些设备或者客户端。联合学习框架中还具有为客户端提供服务的节点(即服务端)，服务端可以是用于执行聚合操作的服务器，服务端可以协调多个客户端进行联合学习以得到联合学习模型。服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者云计算服务器。
35.进一步地，参与方组是指在联合学习中所有参与方的个体之间的相互排列组合，是由参与方的个体所组成的参与方组，例如：在一个联合学习框架中一共有3个参与方，分别为a、b、c，那么它们之间可以形成以下参与方组：a、b、c、ab、bc、ac。
36.进一步地，在联合学习中一个聚合周期是指对联合学习模型进行的一轮训练，各
参与方客户端利用本地数据对本地模型进行训练，当本地模型训练达到收敛时，得到训练后的本地模型参数，并将其发送给服务端。所有参与方在每一个聚合轮次都会上传自己的本地模型参数，服务器进行加权平均得出一个联合模型来，因此每一个参与方在每一轮次都会做出自己的贡献，此处的轮表示服务端对联合学习模型进行一次完整的训练。
37.根据本公开实施例提供的技术方案，通过基于联合学习的架构，生成多个参与方组，并确定由多个参与方组构成的参与方组集合，计算参与方组的权重，其中每个参与方组包含至少两个参与方；确定联合学习中的聚合周期，获取聚合周期前后联合学习模型对应的效用变化值并建立查找表，根据效用变化值判断是否计算聚合周期内各个参与方的贡献值；当判断结果为是时，利用参与方组集合中的参与方组随机生成一个全排列组合，并根据全排列组合中参与方组中的参与方顺序生成多个子组合，计算参与方加入子组合时的边际贡献值的估计值，根据边际贡献值的估计值以及参与方组的权重，判断是否采用插值函数对参与方加入子组合后形成的新参与方组的效用值进行计算；当判断结果为是时，利用插值函数计算新参与方组的效用值，当判断结果为否时，利用预设的模型推演方式计算新参与方组的效用值，并依据计算出的新参与方组的效用值对查找表进行更新；基于更新后的查找表，计算参与方的边际贡献值，并判断参与方的边际贡献值是否收敛，当判断结果为是时，将收敛后的边际贡献值作为参与方的贡献值，当判断结果为否时，生成一个新的全排列组合，直至计算得到所有收敛后的参与方的贡献值，根据贡献值确定参与方在联合学习中的贡献度。本公开能够提升联合学习中贡献值的计算精度，降低计算数据量，使贡献值的计算结果更准确，计算效率更高。
38.下面结合具体的程序流程示意图，对本公开在联合学习中对各参与方的贡献值计算的循环过程进行详细说明，图3是本公开实施例提供的计算参与方贡献值的程序流程示意图。如图3所示，该计算参与方贡献值的程序中具体可以包括以下内容：
39.在一些实施例中，根据全排列组合中参与方组中参与方顺序生成多个子组合，计算参与方加入子组合时的边际贡献值的估计值，包括：按照参与方顺序将全排列组合划分成多个子组合，并确定全排列组合中的子组合的最后一个参与方所对应的下一个参与方，计算下一个参与方加入子组合时的边际贡献值的估计值。
40.具体地，当判断需要对各参与方在本轮的贡献值做计算时，首先从本轮聚合周期的参与方组集合ps中随机生成一个全排列组合p，并令k＝0，例如：假设一个参与方组集合ps中包含元素1、2、3、4、5，这5个元素分别对应5个参与方，根据这5个参与方可以生成以下全排列组合：(1、2、3、4、5)、(2、3、4、5、1)、(3、4、5、1、2)、(4、5、1、2、3)、(5、4、3、2、1)
……
。在随机生成一个全排列组合之后，再将该全排列组合中的参与方划分成多个子组合。
41.进一步地，在根据全排列组合计算参与方的边际贡献值时，可以采用以下方式：
42.从全排列组合p中依次取出前j个参与方构成子组合s，计算第j 1个参与方加入子组合s时产生的边际贡献的一个估计值，例如：全排列组合为(5、4、3、2、1)，那么可以先取出前1个参与方(即元素5)，形成子组合(5)，并计算第2个参与方(即元素4)加入子组合(5)时产生的边际贡献的估计值。在实际应用中，可以采用以下公式对边际贡献进行估计，即δ
j 1_est
＝v
n-vs＝v_lut[n]-v_lut[s]，由于vs已在上一个组合s’中计算过，此处只需从查找表v_lut中获取，无需计算v(m
s(t)
)。
[0043]
进一步地，利用上述计算方式对当前全排列组合中，所有形成的子组合s，以及第j
1个参与方加入子组合s时产生的边际贡献值做一次循环，直至对当前全排列组合中的每一种子组合的情形计算一次，最终估计得到参与方在加入子组合时的边际贡献值。
[0044]
在一些实施例中，根据边际贡献值的估计值以及参与方组的权重，判断是否采用插值函数对参与方加入子组合后形成的新参与方组的效用值进行计算，包括：计算边际贡献值的估计值与参与方组的权重的乘积，并将乘积与预设的第二截断阈值进行比较；当乘积均小于或等于第二截断阈值时，则判断采用插值函数计算新参与方组的效用值；否则，利用预设的模型推演方式计算新参与方组的效用值。
[0045]
具体地，根据边际贡献值的估计值与参与方组的权重的乘积与第二截断阈值之间的关系，判断是否对新参与方组的效用值进行计算；下面结合具体实施例，对上述乘积的计算以及判断过程进行详细说明，具体可以包括以下内容：
[0046]
计算第j 1个参与方加入子组合s时产生的边际贡献值与子组合s对应的权重的乘积|δ
j 1_est
*w
|s|
|，如果该乘积满足|δ
j 1_est
*w
|s|
|≤η*|vn-v0|，则判断使用插值函数对新参与方组的效用值进行计算，否则，判断利用预设的模型推演方式计算新参与方组的效用值。
[0047]
也就是说，如果第j 1个参与方加入子组合s时产生的边际贡献值满足上述公式，那此时第j 1个参与方加入子组合s后的新参与方组对应的效用值就无需再进行推演了，直接采用插值函数计算新参与方组的效用值，如果不满足上述公式，就需要对新参与方组进行模型推演并计算效用值。
[0048]
根据本公开实施例提供的技术方案，为了提前判断是否对新参与方组进行模型推演，通过放大效用值的方式，对第j 1个参与方加入子组合s时产生的边际贡献值进行估计，并将估计值与参与方组的权重相乘，将乘积与第二截断阈值进行比较，从而判断采用插值函数的方式计算新参与方组的效用值，还是采用模型推演的方式计算新参与方组的效用值；由于模型推演的复杂度很高，计算量较大，因此，通过增加上述判断手段，对于无需做模型推演的新参与方组，可直接利用之前迭代过程中计算的子组合的效用值进行加权求和得到，从而提升了贡献值的计算速度。
[0049]
在一些实施例中，利用插值函数计算新参与方组的效用值，包括：基于历史迭代过程中计算的子组合的效用值、以及参与方组为全集参与方组时对应的效用值，利用预设的插值函数对新参与方组的效用值进行计算，并根据计算结果对查找表进行更新。
[0050]
具体地，插值函数计算效用值的原理是，用已经计算过的子组合的效用值去估计新参与方组的效用值，插值函数的计算公式为v(s∪{j 1})＝interpolate(vs,vn,s,n)，根据该计算公式得到新参与方组的效用估计值，即得到新参与方组s∪{j 1}对应的效用估计值，并更新查找表v_lut[s∪{j 1}]＝v(s∪{j 1})。其中，插值函数interpolate(
·
)的实现方法为：
[0051][0052]
上述插值函数的计算公式中，将vs，vn，子组合s和全组合n作为函数的输入，计算并输出。
[0053]
在一些实施例中，利用预设的模型推演方式计算新参与方组的效用值，并依据计算出的新参与方组的效用值对查找表进行更新，包括：对新参与方组的模型参数进行聚合，
并对新参与方组的模型进行模型推演，对新参与方组中的每一个参与方的权重进行聚合，得到新参与方组的权重，对新参与方组的模型在标准验证集上进行模型推演，计算得到新参与方组的真实效用值，利用真实效用值对查找表进行更新。
[0054]
具体地，模型推演采用公式v(s∪{j 1})＝v(m
s∪{j 1}(t)
)＝v(agg(s∪{j 1}))，根据该计算公式得到新参与方组的真实效用值并更新查找表v_lut[s∪{j 1}]＝v(s∪{j 1})。
[0055]
在一些实施例中，基于更新后的查找表，计算参与方的边际贡献值，并判断参与方的边际贡献值是否收敛，当判断结果为是时，将收敛后的边际贡献值作为参与方的贡献值，包括：根据更新后的查找表中参与方加入子组合后的效用值，利用预设的沙普利值计算公式，计算参与方的边际贡献值；并根据参与方的边际贡献值是否收敛，当判断结果为收敛时，将收敛后的边际贡献值作为参与方的贡献值；其中，贡献值用于表示参与方在联合学习中对聚合周期训练的联合学习模型的贡献度。
[0056]
具体地，根据更新后的v_lut查找表，计算参与方i的边际贡献值如果则表示当前全排列组合中的参与方i的边际贡献值已经收敛，此时，直接将作为第t个聚合周期各个参与方i的贡献值否则，使k＝k 1，并重新生成一个新的全排列组合p，重复以上实施例的步骤，计算全排列组合p中各个参与方的贡献值。
[0057]
这里，对于阈值θ的设置，θ可表示蒙特卡洛方法是否收敛的判断条件，在实际应用中，可以设置θ＝1e-3～1e-5。
[0058]
基于以上实施例中全排列组合p中各个参与方的贡献值的计算过程，将所有的全排列组合都循环一遍，得到每一个参与方i在全部t个聚合周期的贡献值，累加得到参与方i对联合模型的贡献值
[0059]
进一步地，shapley value是根据个体i加入组合s产生的边际贡献的平均值，公平的进行利益分配的方法，其计算复杂度是o(2n)，n为个体总数。其计算公式为：
[0060][0061]
shapley值(即沙普利值)考虑个体i加入子组合的全部可能的顺序，其中n表示全组合，s表示某个排列情况下的子组合，v(
·
)表示效用函数，|
·
|符号表示求集合中元素的数量，[v(s∪{i})
–
v(s)]表示i加入子组合s后的边际效用，权重w
|s|
＝|s|！(|n|-|s|-1)！/|n|！表示该组合出现的概率。
[0062]
进一步地，重复以上步骤，获得每一个参与方i在全部t个聚合周期的贡献值，累加得到参与方i对联合模型的贡献值；即将所有聚合周期按照上面的方式计算一遍，得到每一个参与方在每一个聚合周期对应的贡献值，然后进行累加得到总的贡献值。
[0063]
进一步地，采用以下方式对第一截断阈值λ进行设置：设最终的联合模型效用函数相对于初始模型的边际增益为δu＝|v(m
(t)
)-v(m
(0)
)|，其中t为总通讯轮次，可设置λ＝δu*0.01。第二截断阈值η可用于表示贡献值的误差水平，可将其设置为η＝1e-3～1e-5。
[0064]
在一些实施例中，基于联合学习的架构，生成多个参与方组，并确定由多个参与方组构成的参与方组集合，计算参与方组的权重，包括：确定联合学习中的所有参与方，将参与方按照数量从少至多的方式依次进行枚举得到多个参与方组，将多个参与方组所构成的集合作为参与方组集合，并基于每一个参与方组中参与方的数量计算每一个参与方组对应的权重；其中，权重用于表示参与方组在参与方组集合中出现的概率。
[0065]
具体地，下面结合一个具体实施例对联合学习的参与方以及构造参与方组集合的过程进行详细说明，具体可以包括以下内容：
[0066]
假设有n个参与方1，2，
…i…
n-1，n的联合学习，训练一共进行了t个周期的聚合，记录训练过程中每一个聚合周期t，每一个参与方i上传的本地模型m
i(t)
，以及中心聚合后的联合模型m
(t)
，初始化模型m
(0)
，有对模型性能(如准确率、loss等)的评估函数或效用函数v(
·
)，联合学习模型聚合方法agg(
·
)，阈值λ，η；其中，λ表示第一截断阈值，η表示第二截断阈值。
[0067]
进一步地，首先根据联合学习中的所有参与方，按照参与方数量从少到多枚举全部可能的参与方组ps＝[(1,),(2,),(3,)
…
,(1,2),(1,3),(2,3),
…
p,
…
n]；对每一个具有0，1，2，
…
n-1个参与方的子组合s，计算权重w
|s|
＝|s|！(|n|-|s|-1)！/|n|！。
[0068]
需要说明的是，每一个参与方组对应上述的一个子组合s，在对子组合s的权重进行计算时，依据的是每一个子组合中参与方的个数，在参与方组中一个参与方对应一个集合中的元素，即根据参与方组中的元素个数来计算参与方组对应的权重，每一个子组合对应的权重可以认为是该子组合在整体参与方组中出现的概率。
[0069]
在一些实施例中，确定联合学习中的聚合周期，获取聚合周期前后联合学习模型对应的效用变化值并建立查找表，包括：针对联合学习中的每一个聚合周期，确定聚合周期对应的联合学习模型的初始效用值和最终效用值，计算最终效用值与初始效用值之间的差值，将差值作为效用变化值，并建立聚合周期对应的包含所有参与方组的查找表；对查找表执行初始化操作，以使查找表中除空集参与方组和全集参与方组之外的其他参与方组的初始效用值为0；其中，查找表用于存储所有参与方组对应的效用值。
[0070]
具体地，计算每一个聚合周期开始前以及结束后，联合学习模型对应的效用值，并建立查找表，即对于每一个聚合周期来说，可以先计算本聚合周期的最终效用值与本聚合周期的初始效用值，下面结合一个具体实施例，对聚合周期的初始效用值和最终效用值的计算过程进行详细说明，具体可以包括以下内容：
[0071]
对每一个聚合周期t，分别计算vn＝v(m
(t)
)，v0＝v(m
(t-1)
)，并建立查找表v_lut＝{():v0,(1,):0,(2,):0,(3,):0
…
,(1,2):0,(1,3):0,(2,3):0,
…
n:vn}，其中，vn表示当前聚合周期结束后联合模型的最终效用值，v0表示当前聚合周期对应的上一聚合周期结束后的联合模型的效用值，当然v0也可以理解为当前聚合周期开始前，当前聚合周期的初始效用值，不同表述方式上的差别不构成对v0本质含义的限定，且上述两种表述方式是等价的。
[0072]
进一步地，在对查找表执行初始化操作时，除空集()和全集n对应的参与方组之外，令参与方组集合ps中的其他参与方组的效用值为0。通过建立v_lut查找表，并利用查找表对参与方组的效用值进行缓存，从而记录已经计算过的效用值，可以为后续贡献值计算降低计算量，避免重复计算。
[0073]
在一些实施例中，根据效用变化值判断是否计算聚合周期内各个参与方的贡献
值，包括：将聚合周期前后对应的联合学习模型的效用变化值与预设的第一截断阈值进行比较，当效用变化值小于第一截断阈值，且连续多轮聚合周期对应的效用变化值均小于第一截断阈值时，判断聚合周期内各个参与方的贡献值为0；否则，对聚合周期内各个参与方的贡献值进行重新计算。
[0074]
具体地，通过计算本聚合周期的最终效用值与本聚合周期的初始效用值，如果本聚合周期对应的最终效用值与初始效用值之间的差值小于第一截断阈值，且如果连续两轮聚合周期，最终效用值与初始效用值之间的差值都小于第一截断阈值时，则结束计算，并将当前聚合周期内各参与方的贡献值视为0，即各参与方没有在当前聚合周期内做出贡献。下面结合一个具体实施例，对利用计算器判断是否对本聚合周期内各参与方的贡献值进行计算的过程进行详细说明，具体可以包括以下内容：
[0075]
如果|v
n-v0|≤λ，则计数器加1，如果计数器超过1(计数器的值大于等于2)，则本聚合周期t内各个参与方i的贡献值则返回上一步骤，否则继续执行下一步骤；换言之，通过将当前聚合周期前后产生的聚合模型所对应的最终效用值与初始效用值做差，并将差值与第一截断阈值进行比较，当差值小于第一截断阈值时，计数器的数值加1，如果计算器大于或等于2(即连续两轮聚合周期所产生的聚合模型的效用变化值均小于阈值)，则判断本聚合周期内各参与方的贡献值为0。
[0076]
本公开实施例这样做的目的在于，在正式计算每一个参与方的贡献值之前，先对本轮联合模型效用值的变化情况做一下评估，根据评估结果可判断在经过本轮聚合训练之后的联合模型的效用值有没有得到提升，即联合模型本身的性能有没有提升，如果模型性能的提升量很少，就可以认为各个参与方在本轮的贡献值都为0；如果本轮发现联合学习模型的性能提升比较大，那就继续执行下面计算，即具体计算每一个参与方在本轮的贡献值是多少。本公开能够提前判断是否需要对参与方的贡献值做进一步计算，还是直接将参与方在本轮的贡献值算作为0，从而避免了无效的计算过程，提升了计算效率。
[0077]
下述为本公开装置实施例，可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节，请参照本公开方法实施例。
[0078]
图4是本公开实施例提供的确定联合学习中参与方贡献度的装置的结构示意图。如图4所示，该确定联合学习中参与方贡献度的装置包括：
[0079]
生成模块401，被配置为基于联合学习的架构，生成多个参与方组，并确定由多个参与方组构成的参与方组集合，计算参与方组的权重，其中每个参与方组包含至少两个参与方；
[0080]
建立模块402，被配置为确定联合学习中的聚合周期，获取聚合周期前后联合学习模型对应的效用变化值并建立查找表，根据效用变化值判断是否计算聚合周期内各个参与方的贡献值；
[0081]
判断模块403，被配置为当判断结果为是时，利用参与方组集合中的参与方组随机生成一个全排列组合，并根据全排列组合中参与方组中的参与方顺序生成多个子组合，计算参与方加入子组合时的边际贡献值的估计值，根据边际贡献值的估计值以及参与方组的权重，判断是否采用插值函数对参与方加入子组合后形成的新参与方组的效用值进行计算；
[0082]
更新模块404，被配置为当判断结果为是时，利用插值函数计算新参与方组的效用
值，当判断结果为否时，利用预设的模型推演方式计算新参与方组的效用值，并依据计算出的新参与方组的效用值对查找表进行更新；
[0083]
计算模块405，被配置为基于更新后的查找表，计算参与方的边际贡献值，并判断参与方的边际贡献值是否收敛，当判断结果为是时，将收敛后的边际贡献值作为参与方的贡献值，当判断结果为否时，生成一个新的全排列组合，直至计算得到所有收敛后的参与方的贡献值，根据贡献值确定参与方在联合学习中的贡献度。
[0084]
在一些实施例中，图4的判断模块403按照参与方顺序将全排列组合划分成多个子组合，并确定全排列组合中的子组合的最后一个参与方所对应的下一个参与方，计算下一个参与方加入子组合时的边际贡献值的估计值。
[0085]
在一些实施例中，图4的判断模块403计算边际贡献值的估计值与参与方组的权重的乘积，并将乘积与预设的第二截断阈值进行比较；当乘积均小于或等于第二截断阈值时，则判断采用插值函数计算新参与方组的效用值；否则，利用预设的模型推演方式计算新参与方组的效用值。
[0086]
在一些实施例中，图4的更新模块404基于历史迭代过程中计算的子组合的效用值、以及参与方组为全集参与方组时对应的效用值，利用预设的插值函数对新参与方组的效用值进行计算，并根据计算结果对查找表进行更新。
[0087]
在一些实施例中，图4的更新模块404对新参与方组的模型参数进行聚合，并对新参与方组的模型进行模型推演，对新参与方组中的每一个参与方的权重进行聚合，得到新参与方组的权重，对新参与方组的模型在标准验证集上进行模型推演，计算得到新参与方组的真实效用值，利用真实效用值对查找表进行更新。
[0088]
在一些实施例中，图4的生成模块401确定联合学习中的所有参与方，将参与方按照数量从少至多的方式依次进行枚举得到多个参与方组，将多个参与方组所构成的集合作为参与方组集合，并基于每一个参与方组中参与方的数量计算每一个参与方组对应的权重；其中，权重用于表示参与方组在参与方组集合中出现的概率。
[0089]
在一些实施例中，图4的第一判断模块402针对联合学习中的每一个聚合周期，确定聚合周期对应的联合学习模型的初始效用值和最终效用值，计算最终效用值与初始效用值之间的差值，将差值作为效用变化值，并建立聚合周期对应的包含所有参与方组的查找表；对查找表执行初始化操作，以使查找表中除空集参与方组和全集参与方组之外的其他参与方组的初始效用值为0；其中，查找表用于存储所有参与方组对应的效用值。
[0090]
在一些实施例中，图4的建立模块402将聚合周期前后对应的联合学习模型的效用变化值与预设的第一截断阈值进行比较，当效用变化值小于第一截断阈值，且连续多轮聚合周期对应的效用变化值均小于第一截断阈值时，判断聚合周期内各个参与方的贡献值为0；否则，对聚合周期内各个参与方的贡献值进行重新计算。
[0091]
在一些实施例中，图4的计算模块405根据更新后的查找表中参与方加入子组合后的效用值，利用预设的沙普利值计算公式，计算参与方的边际贡献值；并根据参与方的边际贡献值是否收敛，当判断结果为收敛时，将收敛后的边际贡献值作为参与方的贡献值；其中，贡献值用于表示参与方在联合学习中对聚合周期训练的联合学习模型的贡献度。
[0092]
应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本公开实施例的实施过程构成任何限
定。
[0093]
图5是本公开实施例提供的电子设备5的结构示意图。如图5所示，该实施例的电子设备5包括：处理器501、存储器502以及存储在该存储器502中并且可以在处理器501上运行的计算机程序503。处理器501执行计算机程序503时实现上述各个方法实施例中的步骤。或者，处理器501执行计算机程序503时实现上述各装置实施例中各模块/单元的功能。
[0094]
示例性地，计算机程序503可以被分割成一个或多个模块/单元，一个或多个模块/单元被存储在存储器502中，并由处理器501执行，以完成本公开。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述计算机程序503在电子设备5中的执行过程。
[0095]
电子设备5可以是桌上型计算机、笔记本、掌上电脑及云端服务器等电子设备。电子设备5可以包括但不仅限于处理器501和存储器502。本领域技术人员可以理解，图5仅仅是电子设备5的示例，并不构成对电子设备5的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如，电子设备还可以包括输入输出设备、网络接入设备、总线等。
[0096]
处理器501可以是中央处理单元(central processing unit，cpu)，也可以是其它通用处理器、数字信号处理器(digital signal processor，dsp)、专用集成电路(application specific integrated circuit，asic)、现场可编程门阵列(field-programmable gate array，fpga)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0097]
存储器502可以是电子设备5的内部存储单元，例如，电子设备5的硬盘或内存。存储器502也可以是电子设备5的外部存储设备，例如，电子设备5上配备的插接式硬盘，智能存储卡(smart media card，smc)，安全数字(secure digital，sd)卡，闪存卡(flash card)等。进一步地，存储器502还可以既包括电子设备5的内部存储单元也包括外部存储设备。存储器502用于存储计算机程序以及电子设备所需的其它程序和数据。存储器502还可以用于暂时地存储已经输出或者将要输出的数据。
[0098]
所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本技术的保护范围。上述系统中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。
[0099]
在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。
[0100]
本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员
可以对每一个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本公开的范围。
[0101]
在本公开所提供的实施例中，应该理解到，所揭露的装置/计算机设备和方法，可以通过其它的方式实现。例如，以上所描述的装置/计算机设备实施例仅仅是示意性的，例如，模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性，机械或其它的形式。
[0102]
作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0103]
另外，在本公开各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。
[0104]
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读存储介质中。基于这样的理解，本公开实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，计算机程序可以存储在计算机可读存储介质中，该计算机程序在被处理器执行时，可以实现上述各个方法实施例的步骤。计算机程序可以包括计算机程序代码，计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括：能够携带计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(read-only memory，rom)、随机存取存储器(random access memory，ram)、电载波信号、电信信号以及软件分发介质等。需要说明的是，计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如，在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。
[0105]
以上实施例仅用以说明本公开的技术方案，而非对其限制；尽管参照前述实施例对本公开进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本公开各实施例技术方案的精神和范围，均应包含在本公开的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：词性标注模型的训练方法、词性标注方法及电子设备与流程

确定联合学习中参与方贡献度的方法及装置与流程

相关文献

最热文献