一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

联邦学习系统中的跨样本特征选择方法及联邦学习系统与流程

2021-10-24 08:32:00 来源:中国专利 TAG:联邦 学习 系统 人工智能 样本

技术特征:
1.一种联邦学习系统中的跨样本特征选择方法,其特征在于,所述方法包括:通过隐私计算的方式,对所有参与方所拥有样本的特征进行假设检验,得到样本中各个特征维度的检验统计量;每次对所有参与方所拥有样本的特征进行假设检验,将所述检验统计量处于预设统计量区间之外且距离最远的特征维度从样本中剔除,并对所有参与方所拥有样本的特征再次进行假设检验,直到样本中各个特征维度的检验统计量均处于所述预设统计量区间内,得到特征选择后的样本。2.根据权利要求1所述的方法,其特征在于,对所有参与方所拥有样本的特征进行假设检验,得到样本中各个特征维度的检验统计量,包括:基于所有参与方所拥有样本的特征以及所有参与方所拥有样本的标签,计算得到第一矩阵的转置乘以所述第一矩阵所得到的第一乘积,以及所述第一矩阵的转置乘以第二矩阵所得到的第二乘积,其中,所述第一矩阵用于描述所有参与方所拥有样本的特征,所述第二矩阵用于描述所有参与方所拥有样本的标签;基于所述第一乘积以及所述第二乘积,计算得到样本中各个特征维度的回归系数;基于所述回归系数,计算得到所有参与方的误差之和;基于所述回归系数以及所述误差之和,计算得到样本中各个特征维度的f统计量。3.根据权利要求2所述的方法,其特征在于,基于所有参与方所拥有样本的特征以及所有参与方所拥有样本的标签,计算得到第一矩阵的转置乘以所述第一矩阵所得到的第一乘积,以及所述第一矩阵的转置乘以第二矩阵所得到的第二乘积,包括:将所有参与方所拥有样本的特征按照特征维度进行对齐,得到所述第一矩阵;将所有参与方所拥有样本的标签按照第一矩阵中样本的顺序进行排列,得到所述第二矩阵;基于所述第一矩阵以及所述第二矩阵,计算得到所述第一乘积以及所述第二乘积。4.根据权利要求2所述的方法,其特征在于,基于所述第一乘积以及所述第二乘积,计算得到样本中各个特征维度的回归系数,包括:将所述第一乘积的逆矩阵乘以所述第二乘积,得到所述回归系数。5.根据权利要求2所述的方法,其特征在于,基于所述回归系数,计算得到所有参与方的误差之和,包括:基于所述回归系数以及各个参与方的第三矩阵,计算得到各个参与方所拥有样本的标签的估计值,其中,所述第三矩阵用于描述对应参与方所拥有样本的特征;基于所述估计值与对应参与方所拥有样本的标签之间的偏差,计算得到各个参与方的误差;将各个参与方的误差求和,得到所有参与方的误差之和。6.根据权利要求2所述的方法,其特征在于,基于所述回归系数以及所述误差之和,计算得到样本中各个特征维度的f统计量,包括:获取所有参与方所拥有样本的样本数量,以及样本所包含特征维度的维度数量;通过公式计算得到各个特征维度的f统计量,其中,i为对应特征维度的维度标识,f
i
为对应特征维度的f统计量,b
i
为对应特征维度的回归系数,c
ii
为所述第一乘
积的逆矩阵的对应对角元,q为所述误差之和,r为所述样本数量,s为所述维度数量。7.一种联邦学习系统,其特征在于,所述系统包括至少两个参与方,所述至少两个参与方通过多方安全计算的方式,共同对所有参与方所拥有样本的特征进行假设检验,得到样本中各个特征维度的检验统计量;各个参与方配置为:每次对所有参与方所拥有样本的特征进行假设检验,将所述检验统计量处于预设统计量区间之外且距离最远的特征维度从所拥有样本中剔除,并对所有参与方所拥有样本的特征再次进行假设检验,直到样本中各个特征维度的检验统计量均处于所述预设统计量区间内,得到特征选择后的所拥有样本。8.一种联邦学习系统,其特征在于,所述系统包括中间方、至少两个参与方,所述中间方配置为:作为可信第三方接收所有参与方所拥有样本的私有数据,其中,所述私有数据至少包括所有参与方所拥有样本的特征;每次接收到所有参与方所拥有样本的私有数据,基于所述私有数据对所有参与方所拥有样本的特征进行假设检验,得到样本中各个特征维度的检验统计量,并将样本中各个特征维度的检验统计量发送给各个参与方;所述各个参与方配置为:每次接收到样本中各个特征维度的检验统计量,将所述检验统计量处于预设统计量区间之外且距离最远的特征维度从所拥有样本中剔除,并将所拥有样本的私有数据发送至所述中间方,直到样本中各个特征维度的检验统计量均处于所述预设统计量区间内,得到特征选择后的所拥有样本。9.一种联邦学习系统中的跨样本特征选择装置,其特征在于,所述装置包括:假设检验模块,配置为通过隐私计算的方式,对所有参与方所拥有样本的特征进行假设检验,得到样本中各个特征维度的检验统计量;特征维度剔除模块,配置为每次对所有参与方所拥有样本的特征进行假设检验,将所述检验统计量处于预设统计量区间之外且距离最远的特征维度从样本中剔除,并对所有参与方所拥有样本的特征再次进行假设检验,直到样本中各个特征维度的检验统计量均处于所述预设统计量区间内,得到特征选择后的样本。10.一种电子设备,其特征在于,包括:存储器,存储有计算机可读指令;处理器,读取存储器存储的计算机可读指令,以执行权利要求1

6中的任一个所述的方法。

技术总结
本申请提供了一种联邦学习系统中的跨样本特征选择方法及联邦学习系统,所述方法包括:通过隐私计算的方式,对所有参与方所拥有样本的特征进行假设检验,得到样本中各个特征维度的检验统计量;每次对所有参与方所拥有样本的特征进行假设检验,将所述检验统计量处于预设统计量区间之外且距离最远的特征维度从样本中剔除,并对所有参与方所拥有样本的特征再次进行假设检验,直到样本中各个特征维度的检验统计量均处于所述预设统计量区间内,得到特征选择后的样本。本申请实施例能够提高特征选择的准确率以及效率。选择的准确率以及效率。选择的准确率以及效率。


技术研发人员:周一竞 孟丹 李宏宇 李晓林
受保护的技术使用者:同盾控股有限公司
技术研发日:2021.07.20
技术公布日:2021/10/23
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜