一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

数据处理方法、装置、设备及存储介质与流程

2022-06-01 14:49:19 来源:中国专利 TAG:

技术特征:
1.一种数据处理方法,其特征在于,应用于参与信息价值计算的任一参与方,所述方法包括:判断所述参与方是否为目标变量提供方,若所述参与方为目标变量提供方,则将多个数据id对应的目标变量分别进行同态加密,并将所述多个数据id以及加密后的目标变量发送给特征变量提供方;判断所述参与方是否为特征变量提供方,若所述参与方为特征变量提供方,则根据本地存储的所述多个数据id对应的特征变量,对所述多个数据id进行分箱,并在每个分箱中进行加密后的目标变量求和,将各分箱对应的求和结果发送给所述目标变量提供方;若所述参与方为目标变量提供方,则对所述求和结果进行解密,并根据解密后的数据计算所述特征变量的信息价值。2.根据权利要求1所述的方法,其特征在于,还包括:获取用于进行信息价值计算的源代码,所述源代码包括多个角色标识以及从属于每个角色标识的操作代码;其中,每个角色标识包括所述目标变量提供方和/或特征变量提供方的标识,从属于所述角色标识的操作代码用于指示所述角色标识对应的参与方执行的操作;对所述源代码进行编译,得到目标代码,以根据所述目标代码实现信息价值计算;其中,所述角色标识在编译后对应生成判断语句,用于判断执行所述目标代码的参与方是否为所述角色标识对应的参与方,从属于所述角色标识的操作代码在编译后对应生成用于在所述判断语句的判断结果为是时执行的操作语句。3.根据权利要求1或2所述的方法,其特征在于,根据解密后的数据计算所述特征变量的信息价值,包括:针对每一分箱,根据所述解密后的数据,计算所述分箱对应的正向数量占比和负向数量占比;根据各个分箱对应的正向数量占比和负向数量占比,计算所述特征变量的信息价值;其中,所述正向数量占比为所述分箱中正向数据id的数量与全部正向数据id的总数量的比值,所述负向数量占比为所述分箱中负向数据id的数量与全部负向数据id的总数量的比值;所述正向数据id为对应的目标变量为第一数值的数据id,所述负向数据id为对应的目标变量为非第一数值的数据id。4.根据权利要求3所述的方法,其特征在于,将多个数据id对应的目标变量分别进行同态加密,并将所述多个数据id以及加密后的目标变量发送给特征变量提供方,包括:针对所述多个数据id中的每一数据id,对所述数据id对应的目标变量以及反变量分别进行同态加密;将所述多个数据id以及每个数据id对应的加密后的目标变量和加密后的反变量发送给所述特征变量提供方;相应的,在每个分箱中进行加密后的目标变量求和,包括:针对每一分箱,计算所述分箱中各数据id对应的加密后的目标变量之和以及加密后的反变量之和;其中,每一分箱包括至少一个数据id。5.根据权利要求4所述的方法,其特征在于,根据所述解密后的数据,计算所述分箱对
应的正向数量占比和负向数量占比,包括:根据所述分箱对应的解密后的目标变量之和以及全部正向数据id的总数量,计算正向数量占比;根据所述分箱对应的解密后的反变量之和以及全部负向数据id的总数量,计算负向数量占比。6.根据权利要求3所述的方法,其特征在于,所述方法还包括:若所述参与方为特征变量提供方,则将每一分箱内数据id的数量发送给所述目标变量提供方;相应的,根据所述解密后的数据,计算正向数量占比和负向数量占比,包括:根据所述分箱对应的解密后的目标变量之和以及全部正向数据id的总数量,计算正向数量占比;根据所述分箱对应的解密后的目标变量之和、所述分箱内数据id的数量以及全部负向数据id的总数量,计算负向数量占比。7.根据权利要求1或2所述的方法,其特征在于,根据本地存储的所述多个数据id对应的特征变量,对所述多个数据id进行分箱,并在每个分箱中进行加密后的目标变量求和,将各分箱对应的求和结果发送给所述目标变量提供方,包括:获取多种类型的特征变量;针对每一类型,根据所述类型的特征变量,对所述多个数据id进行分箱,并在每个分箱中进行加密后的目标变量求和;针对每一类型,将所述类型以及所述类型下各分箱对应的求和结果发送给所述目标变量提供方;相应的,对所述求和结果进行解密,并根据解密后的数据计算所述特征变量的信息价值,包括:针对每一类型,对各分箱对应的求和结果进行解密,并根据解密后的数据计算所述类型的特征变量的信息价值;相应的,所述方法还包括:若所述参与方为目标变量提供方,则在得到多个类型对应的信息价值后,对所述信息价值进行排序,并根据排序结果选择联邦模型训练所使用的特征变量类型;判断所述特征变量提供方是否属于联邦模型训练的参与方,若是,则将所使用的特征变量类型发送给所述特征变量提供方,以联合所述特征变量提供方实现联邦模型的训练。8.一种数据处理装置,其特征在于,应用于参与信息价值计算的任一参与方,所述装置包括:第一处理模块,用于判断所述参与方是否为目标变量提供方,若所述参与方为目标变量提供方,则将多个数据id对应的目标变量分别进行同态加密,并将所述多个数据id以及加密后的目标变量发送给特征变量提供方;第二处理模块,用于判断所述参与方是否为特征变量提供方,若所述参与方为特征变量提供方,则根据本地存储的所述多个数据id对应的特征变量,对所述多个数据id进行分箱,并在每个分箱中进行加密后的目标变量求和,将各分箱对应的求和结果发送给所述目标变量提供方;
第三处理模块,用于在所述参与方为目标变量提供方时,对所述求和结果进行解密,并根据解密后的数据计算所述特征变量的信息价值。9.一种数据处理设备,其特征在于,所述数据处理设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的数据处理程序,所述数据处理程序被所述处理器执行时实现如权利要求1-7中任一项所述的数据处理方法的步骤。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有数据处理程序,所述数据处理程序被处理器执行时实现如权利要求1-7中任一项所述的数据处理方法的步骤。11.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至7任一项所述的数据处理方法。

技术总结
本发明公开了一种数据处理方法、装置、设备及存储介质,其中方法包括:判断参与方是否为目标变量提供方,若是,则将多个数据ID对应的目标变量分别进行同态加密,并将多个数据ID以及加密后的目标变量发送给特征变量提供方;判断参与方是否为特征变量提供方,若是,则根据本地存储的多个数据ID对应的特征变量,对多个数据ID进行分箱,并在每个分箱中进行加密后的目标变量求和,将各分箱对应的求和结果发送给目标变量提供方;若参与方为目标变量提供方,则对求和结果进行解密,并根据解密后的数据计算特征变量的信息价值。本发明可以安全、快速地实现不同参与方共同确定信息价值,提高确定信息价值的效率。确定信息价值的效率。确定信息价值的效率。


技术研发人员:黄文赞 黄启军 黄铭毅
受保护的技术使用者:深圳前海微众银行股份有限公司
技术研发日:2020.11.27
技术公布日:2022/5/31
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献