一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种多维数据个性化隐私保护方法、系统及存储介质与流程

2022-07-06 10:17:07 来源:中国专利 TAG:

技术特征:
1.一种多维数据个性化隐私保护方法,其特征在于,包括:根据用户设定从隐私预算列表中的多个隐私预算等级中选择目标隐私预算等级;根据所述目标隐私预算等级对多维混合型数据进行有偏采样以获得维度索引列表、并判断所述维度索引列表中各个索引的数据类型,所述数据类型包括分类型数据和数值型数据;根据数据扰动规则分别对所述分类型数据和所述数值型数据进行相应的扰动、并获得扰动后的分类型数据扰动向量和数值型数据扰动值;分别对所述分类型数据扰动向量和所述数值型数据扰动值做聚合操作。2.根据权利要求1所述的多维数据个性化隐私保护方法,其特征在于,所述根据所述目标隐私预算等级对多维混合型数据进行有偏采样以获得维度索引列表的步骤具体包括:将所述多维混合型数据根据预设分类规则分成第一维度索引组、第二维度索引组及第三维度索引组;根据所述目标隐私预算等级分别对所述第一维度索引组和所述第二维度索引组进行有偏采样获得所述维度索引列表。3.根据权利要求2所述的多维数据个性化隐私保护方法,其特征在于,所述第一维度索引组用于存放第一重要的索引、所述第二维度索引组用于存放第二重要的索引、所述第三维度索引组用于存放无意义或重复的索引。4.根据权利要求1所述的多维数据个性化隐私保护方法,其特征在于,所述根据数据扰动规则分别对所述分类型数据和所述数值型数据进行相应的扰动、并获得扰动后的分类型数据扰动向量和数值型数据扰动值的步骤具体包括:根据第一扰动规则对所述数值型数据计算得出数值型数据扰动值,并以所述数值型数据扰动值的倍数对其进行矫正;根据第二扰动规则对所述分类型数据计算得出所述分类型数据扰动向量,并以所述分类型数据扰动向量的倍数对其进行矫正。5.根据权利要求4所述的多维数据个性化隐私保护方法,其特征在于,所述分别对所述分类型数据扰动向量和所述数值型数据扰动值做聚合操作的步骤具体包括:将每个所述数值型扰动值直接加和后求均值,以得到原始数值型数据统计均值的无偏估计;将每组所述分类型数据扰动向量对应所述目标隐私预算等级消除噪声后,直接加和各组所述分类型数据扰动向量的频率值,以得到原始分类型数据频率的无偏估计。6.一种多维数据个性化隐私保护系统,适用于权利要求1-5中任一项所述的多维数据个性化隐私保护方法,其特征在于,包括:参数选择模块,用于根据用户设定从隐私预算列表中的多个隐私预算等级中选择目标隐私预算等级;数据采样模块,用于根据所述目标隐私预算等级对多维混合型数据进行有偏采样以获得维度索引列表、并判断所述维度索引列表中各个索引的数据类型,所述数据类型包括分类型数据和数值型数据;隐私保护模块,用于根据数据扰动规则分别对所述分类型数据和所述数值型数据进行相应的扰动、并获得扰动后的分类型数据扰动向量和数值型数据扰动值;
聚合模块,用于分别对所述分类型数据扰动向量和所述数值型数据扰动值做聚合操作。7.根据权利要求6所述的多维数据个性化隐私保护系统,其特征在于,所述数据采样模块包括:数据分组单元,用于将所述多维混合型数据根据预设分类规则分成第一维度索引组、第二维度索引组及第三维度索引组;数据采样单元,用于根据所述目标隐私预算等级分别对所述第一维度索引组和所述第二维度索引组进行有偏采样获得所述维度索引列表。8.根据权利要求6所述的多维数据个性化隐私保护系统,其特征在于,所述隐私保护模块包括:数值型数据扰动单元,用于根据第一扰动规则对所述数值型数据计算得出数值型数据扰动值,并以所述数值型数据扰动值的倍数对其进行矫正;分类型数据扰动单元,用于根据第二扰动规则对所述分类型数据计算得出所述分类型数据扰动向量,并以所述分类型数据扰动向量的倍数对其进行矫正。9.根据权利要求6所述的多维数据个性化隐私保护系统,其特征在于,所述聚合模块包括:数值型数据聚合单元,用于将每个所述数值型扰动值直接加和后求均值,以得到原始数值型数据统计均值的无偏估计;分类型数据聚合单元,用于将每组所述分类型数据扰动向量对应所述目标隐私预算等级消除噪声后,直接加和各组所述分类型数据扰动向量的频率值,以得到原始分类型数据频率的无偏估计。10.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至5任一项所述的方法。

技术总结
本发明提供一种多维数据个性化隐私保护方法、系统及存储介质,所述方法包括:根据用户设定从隐私预算列表中的多个隐私预算等级中选择目标隐私预算等级;根据所述目标隐私预算等级对多维混合型数据进行有偏采样以获得维度索引列表、并判断所述维度索引列表中各个索引的数据类型,所述数据类型包括分类型数据和数值型数据;根据数据扰动规则分别对所述分类型数据和所述数值型数据进行相应的扰动、并获得扰动后的分类型数据扰动向量和数值型数据扰动值;分别对所述分类型数据扰动向量和所述数值型数据扰动值做聚合操作。解决了现有技术中在本地化差分隐私的环境下无法满足对多维混合型数据进行个性化隐私保护的技术问题。混合型数据进行个性化隐私保护的技术问题。混合型数据进行个性化隐私保护的技术问题。


技术研发人员:袁野 于程远 谷香 李艳辉 李新玲
受保护的技术使用者:思创数码科技股份有限公司
技术研发日:2022.02.28
技术公布日:2022/7/5
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献