一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于效用矩阵实现l-diversity匿名的方法与流程

2022-12-07 02:09:16 来源:中国专利 TAG:

技术特征:
1.一种基于效用矩阵实现l-diversity匿名的方法,其特征在于,包括如下步骤:s1、获取用户属性标识,引入效用矩阵,计算效用矩阵所包含元素的取值概率;s2、设定参数l、聚类个数n,利用基于划分的聚类算法,对用户属性标识中敏感属性的值进行聚类,并输出聚类结果;s3、判断步骤s2输出的聚类结果中存在敏感属性值的个数是否小于参数l的设定值,若是,则执行步骤s4,若否,则直接结束,并根据聚类结果对用户属性标识中的敏感属性值进行匿名;s4、设定聚类次数k的阈值,判断输出聚类结果时进行的聚类次数是否超过k的设定阈值,若是,则将聚类个数n减1后返回执行步骤s2,若否,则直接返回执行步骤s2。2.根据权利要求1所述的一种基于效用矩阵实现l-diversity匿名的方法,其特征在于,执行步骤s1,获取的用户属性标识包括显示标识符、准标识符、敏感属性三类,其中,显示标识符能唯一标识单一个体的属性,多个准标识符组合起来能唯一标识一个用户的多个属性,敏感属性为涉及隐私的属性;多个用户的属性标识存储在同一个数据集内,不同用户的属性标识存储在不同的数据子集内。3.根据权利要求2所述的一种基于效用矩阵实现l-diversity匿名的方法,其特征在于,执行步骤s1,引入效用矩阵,计算效用矩阵所包含元素的取值概率,具体操作流程如下:s1.1、引入效用矩阵,效用矩阵的定义如下:u=(u
ij
)
m
×
n

ꢀꢀꢀꢀꢀꢀꢀ
公式(a)其中,矩阵元素u
ij
表示准标识符中第j个属性对敏感属性中第i个属性的效用,m是敏感属性包含的属性个数,n是准标识符包含的属性个数;s1.2、获取用户的准标识符和敏感属性,利用效用矩阵计算矩阵元素u
ij
的取值概率,计算公式如下:其中,是矩阵元素u
ij
的值,表示q
j
对s
i
的取值概率,s
i
表示敏感属性中第i个属性的值,q
j
表示准标识符中第j个属性的值。4.根据权利要求3所述的一种基于效用矩阵实现l-diversity匿名的方法,其特征在于,用户的准标识符和敏感属性是数值型数据或离散型数据;当准标识符是数值型数据时,表示:对敏感属性s
i
而言,的取值等于准标识符q
j
的取值范围与整个数据集上准标识符中q
j
的取值范围之比;当准标识符是离散型数据,表示:对敏感属性s
i
而言,的取值等于准标识符q
j
的取值个数与整个数据集上准标识符中q
j
的取值个数之比。5.根据权利要求3所述的一种基于效用矩阵实现l-diversity匿名的方法,其特征在于,针对数据集上所有用户的属性标识,参数l大于同一敏感属性取不同值的最大取值个数;聚类个数n等于敏感属性所包含的属性个数;聚类次数k的阈值不超过敏感属性所包含属性个数的一半。
6.根据权利要求5所述的一种基于效用矩阵实现l-diversity匿名的方法,其特征在于,执行步骤s2,利用基于划分的聚类算法,对用户属性标识中敏感属性的值进行聚类,具体操作流程如下:s2.1、将聚类次数计数器的计数值初始化为0,以敏感属性值、效用矩阵、参数l作为基于划分的聚类算法的输入;s2.2、随机选取n个敏感属性值,作为n个聚类的初始聚类中心;s2.3、聚类次数计数器的计数值 1;s2.4、计算敏感属性值到每个聚类中心的距离,将敏感属性值分配到距离最近的聚类;s2.5、所有用户的敏感属性值全部分配完成后,更新聚类中心;s2.6、基于更新的聚类中心,重新执行步骤s2.4-步骤s2.5,直至聚类结果不再发生变化。7.根据权利要求6所述的一种基于效用矩阵实现l-diversity匿名的方法,其特征在于,执行步骤s2.2时,被选取的n个敏感属性值不一定属于同一个用户,且被选取的n个敏感属性值对应n个不同的敏感属性。8.根据权利要求7所述的一种基于效用矩阵实现l-diversity匿名的方法,其特征在于,执行步骤s4后,聚类个数n减1后返回执行步骤s2,此时,从n个敏感属性中随机选取n-1个敏感属性值作为新的聚类中心。

技术总结
本发明公开一种基于效用矩阵实现l-diversity匿名的方法,涉及技术领域,包括:S1、获取用户属性标识,引入效用矩阵,计算效用矩阵所包含元素的取值概率;S2、设定参数L、聚类个数N,利用基于划分的聚类算法,对用户属性标识中敏感属性的值进行聚类,并输出聚类结果;S3、判断聚类结果中存在敏感属性值的个数是否小于参数L的设定值,若是,则执行S4,若否,则直接结束,并根据聚类结果对用户属性标识中的敏感属性值进行匿名;S4、设定聚类次数K的阈值,判断输出聚类结果时进行的聚类次数是否超过K的设定阈值,若是,则将聚类个数N减1后返回执行S2,若否,则直接返回执行S2。本发明通过将用户的敏感信息多样性提高到L,来更好地保护用户隐私。户隐私。户隐私。


技术研发人员:侯令晨 周永进 李国涛
受保护的技术使用者:浪潮云信息技术股份公司
技术研发日:2022.08.12
技术公布日:2022/12/5
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献