一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于可控去标识化的标签实现混合隐私计算处理的方法与流程

2022-02-21 04:09:39 来源:中国专利 TAG:


1.本发明涉及多方数据安全计算技术领域,具体是指一种基于可控去标识化的标签实现混合隐私计算处理的方法。


背景技术:

2.在数据流通领域,不同方的数据因为隐私保护等要求,无法实现不同方相互之间的合法数据流通,进而无法实现数据的有价增值。
3.在传统的方法中,各方将明文数据发往一个可信中心平台,中心平台进行计算。计算完成后,返回给需要结果的一方。在整个过程中,一方面要考虑信息安全防护。所以,在数据流动过程中,需要对数据进行加密处理。
4.同时,另一方面又要考虑数据的可计算性,需要对发来的密文数据进行解密,然后再进行处理。这导致原始数据不得不暴露于中心平台。当中心平台出现安全问题时,如敏感信息泄露,将导致不可挽回的损失。
5.总之,使用传统方法进行数据流通,存在隐私泄露的风险。因此,需要研究实现一种新的数据流通技术。


技术实现要素:

6.本发明的目的是克服了上述现有技术的缺点,提供了一种满足隐私性好、准确性高、适用范围较为广泛的基于可控去标识化的标签实现混合隐私计算处理的方法。
7.为了实现上述目的,本发明的基于可控去标识化的标签实现混合隐私计算处理的方法如下:
8.该基于可控去标识化的标签实现混合隐私计算处理的方法,其主要特点是,所述的方法包括以下步骤:
9.(1)系统初始化;
10.(2)数据提供方审核数据查询方,并将数据提供方的密钥ska加密传输至数据查询方;
11.(3)数据提供方将标签数据通过同态加密发送,中心化计算平台与数据查询方合作处理数据,以密文的形式汇集数据至中心化计算平台,构建密文标签数据仓库;
12.(4)数据查询方向中心化计算平台发起隐私计算请求,中心化计算平台汇聚标识数据所属的标签数据,进行标签数据混合隐私计算。
13.较佳地,所述的步骤(1)具体包括以下步骤:
14.(1.1)数据提供方生成密钥ska,并安全存储,同时数据查询方生成同态密钥skb,并安全存储;
15.(1.2)数据查询方生成非对称公私钥对,使用私钥pri对公钥pub进行签名,得到sig,并发送私钥pri和公钥pub至中心化计算平台;
16.(1.3)中心化计算平台通过公钥pub对sig进行验证,并将pub发送给数据提供方。
17.较佳地,所述的步骤(2)具体包括以下步骤:
18.(2.1)数据提供方对数据查询方进行审核,若审核通过,则使用数据查询方的公钥pub加密数据提供方的密钥ska,得到密文p并发送至数据查询方;
19.(2.2)数据查询方使用私钥pri解密所述的密文p,得到数据提供方的密钥ska。
20.较佳地,所述的步骤(3)具体包括以下步骤:
21.(3.1)数据提供方对标识数据进行可控去标识化处理得到a,生成随机数r,并进行明文计算得到x,其中x=l r;
22.(3.2)数据提供方使用数据提供方的密钥ska对x进行加密,得到enc(x,ska);
23.(3.3)数据提供方将随机数r、enc(x,ska)和a发送至中心化计算平台;
24.(3.4)中心化计算平台存储随机数r,并将a通过可控去标识化转换处理为b,记录b和随机数r以及数据间关联,并将enc(x,ska)发送至数据查询方;
25.(3.5)数据查询方使用数据提供方的密钥ska解密enc(x,ska)得到x;
26.(3.6)数据查询方使用数据查询方的同态密钥skb对x进行同态加密,得到he(x,skb),并将he(x,skb)发送至中心化计算平台;
27.(3.7)中心化计算平台根据he(x,skb)和随机数r通过明密文同态计算得到he(l,skb);
28.(3.8)中心化计算平台存储b、he(l,skb),以及数据间关联,进行标签数据密文仓库构建。
29.较佳地,所述的步骤(4)具体包括以下步骤:
30.(4.1)数据查询方先将某待查询标识id进行去标识化处理,计算得到c,生成查询请求,并将c和同态计算类型ht发送至中心化计算平台;
31.(4.2)中心化计算平台通过可控去标识化转换处理,将c转成b’;
32.(4.3)中心化计算平台将b’作为索引,查找所有关联的密态标签数据he(l,skb);
33.(4.4)中心化计算平台按照同态计算类型ht对he(l,skb)进行同态密文计算得到he(n,skb),并发送至数据查询方;
34.(4.5)数据查询方使用数据查询方的同态密钥skb对he(n,skb)进行解密得到结果n。
35.采用了本发明的基于可控去标识化的标签实现混合隐私计算处理的方法,基于可控去标识化技术,并结合同态加密技术、重加密技术,从而实现对标签数据进行混合隐私计算的目的。本发明所阐述的设计方案,一方面,能够做到数据的安全保护,不让其他参与方知晓原始明文信息;另一方面,能够安全地参与到数据计算中,并实现数据增值服务的目标。本发明所阐述的设计方案,有多方面的优势。例如,基于可控去标识化技术,中心化计算平台能够实现对数据的审计、追溯,并建立数据提供方和数据查询方之间的对等关系,去除双方之间存有数据泄露给对方的顾虑;另外,通过将随机数r值存于中心化计算平台,可以建立数据提供方、数据查询方和中心化计算平台三方之间的可信关系,从而防止数据提供方的密文标签数据被非法解密。
附图说明
36.图1为本发明的基于可控去标识化的标签实现混合隐私计算处理的方法的标签混
合隐私计算参与方之间的关系示意图。
37.图2为本发明的基于可控去标识化的标签实现混合隐私计算处理的方法的初始化和授权示意图。
38.图3为本发明的基于可控去标识化的标签实现混合隐私计算处理的方法的构建密文标签数据仓库示意图。
39.图4为本发明的基于可控去标识化的标签实现混合隐私计算处理的方法的标签数据混合隐私计算示意图。
具体实施方式
40.为了能够更清楚地描述本发明的技术内容,下面结合具体实施例来进行进一步的描述。
41.本发明的该基于可控去标识化的标签实现混合隐私计算处理的方法,其中包括以下步骤:
42.(1)系统初始化;
43.(1.1)数据提供方生成密钥ska,并安全存储,同时数据查询方生成同态密钥skb,并安全存储;
44.(1.2)数据查询方生成非对称公私钥对(pub、pri),使用私钥pri对公钥pub进行签名,得到sig,并发送私钥pri和公钥pub至中心化计算平台;
45.(1.3)中心化计算平台通过公钥pub对sig进行验证,并将pub发送给数据提供方;
46.(2)数据提供方审核数据查询方,并将数据提供方的密钥ska加密传输至数据查询方;
47.(2.1)数据提供方对数据查询方进行审核,若审核通过,则使用数据查询方的公钥pub加密数据提供方的密钥ska,得到密文p并发送至数据查询方;
48.(2.2)数据查询方使用私钥pri解密所述的密文p,得到数据提供方的密钥ska;
49.(3)数据提供方将标签数据通过同态加密发送,中心化计算平台和数据查询方处理数据,以密文的形式汇集数据至中心化计算平台,构建密文标签数据仓库;
50.(3.1)数据提供方对标识数据进行可控去标识化处理得到a,生成随机数r,并进行明文计算得到x,其中x=l r;
51.(3.2)数据提供方使用数据提供方的密钥ska对x进行同态加密,得到enc(x,ska);
52.(3.3)数据提供方将随机数r、enc(x,ska)和a发送至中心化计算平台;
53.(3.4)中心化计算平台存储随机数r,并将a通过可控去标识化转换处理为b,记录b和随机数r以及数据间关联,并将enc(x,ska)发送至数据查询方;
54.(3.5)数据查询方使用数据提供方的密钥ska同态解密enc(x,ska)得到x;
55.(3.6)数据查询方使用数据查询方的同态密钥skb对x进行同态加密,得到he(x,skb),并将he(x,skb)发送至中心化计算平台;
56.(3.7)中心化计算平台根据he(x,skb)和随机数r通过明密文计算得到he(l,skb);
57.(3.8)中心化计算平台存储b、he(l,skb),以及数据间关联,进行标签数据密文仓库构建;
58.(4)数据查询方对标识数据所属的标签数据进行计算,进行标签数据混合隐私计
算;
59.(4.1)数据查询方先将某待查询标识id进行去标识化处理,计算得到c,生成查询请求,将c和同态计算类型ht发送至中心化计算平台;
60.(4.2)中心化计算平台通过可控去标识化转换处理,将c转成b’;
61.(4.3)中心化计算平台将b’作为索引,查找所有关联的密态标签数据he(l,skb);
62.(4.4)中心化计算平台按照同态计算类型ht对he(l,skb)进行同态密文计算
63.得到he(n,skb),并发送至数据查询方;
64.(4.5)数据查询方使用数据查询方的同态密钥skb对he(n,skb)进行解密得到结果n。
65.本发明的具体实施方式中,为使不同数据拥有方将数据安全共享出来,并参与到数据安全计算过程中来,设计了一种基于可控去标识化的标签混合隐私计算方法及系统。
66.本发明的角色参与方主要包括数据提供方、中心化计算平台和数据查询方。数据提供方和数据查询方皆可多方参与。
67.1)数据提供方一般是指数据生产方。通过广泛参与社会活动,汇集大量的数据,并以某一标识作为关键值存储。同时,为了实现数据更高的应用价值,数据提供方具有尝试将数据提供出去的潜在动力。
68.2)中心化计算平台一般是指具有计算能力的可信第三方,能够建立数据提供方和数据查询方之间的关联。中心化计算平台需要做到:能够汇聚来自数据提供方的、同态密文形式的数据;能够对同态密文形式的数据进行计算;能够向数据查询方提供查询服务,如求和、均值、方差等。
69.3)数据查询方一般是指针对某一标签数据有计算需求的一方。比如查询某一范围内的用户身高分布和均值,或者年龄分布和均值,或标签数据的方差、标准差等,或者某银行卡的交易总额等。
70.本发明的整体设计方案如下:
71.1)数据提供方汇聚原始数据,原始数据以某标识id作为索引建立原始数据仓库,记为(id,l),l可以为多维标签数据;
72.2)数据提供方对标识数据进行可控去标识化操作,如标识id经过处理后,可记为a;
73.3)按照去标识化后的数据,数据提供方建立不同维度的标签数据,则数据重新记为(a,l);
74.4)数据提供方对标签数据使用密钥ska进行加密,记为(a,enc(l,ska));
75.5)通过中心化计算平台以及数据查询方的参与,实现标签同态密文数据仓库的构建。也就说,将数据提供方的密文数据enc(l,ska)转换成以数据查询方密钥skb加密的同态密文,记为enc(l,skb)。同时,中心化计算平台将a使用可控去标识化技术转换为b。最后,将(b,enc(l,skb))存储在中心化计算平台数据仓库;
76.6)当需要针对某一标识id的某一维度的标签数据进行计算时,数据查询方先将id进行去标识化处理,记为c。然后,将c和同态密文数据计算类型(不限于求和、均值,方差、标准差等)作为参数发送到中心化计算平台;
77.7)中心化计算平台通过可控去标识化技术将c转换为b’。接着,查询所有与b’有关
联的标签同态密文数据。若b’与b相同,则即可对所有标签同态密文数据enc(l,skb),按照同态密文数据计算类型执行计算。计算完成后将同态密文结果返回给数据查询方;
78.8)数据查询方拥有自己的密钥skb,可对同态密文结果进行解密,获取经中心化计算平台密文计算的结果明文数据。
79.在本发明的具体实施例中,本发明涉及的技术有可控去标识化技术、同态加密技术和重加密技术。
80.1)可控去标识化技术
81.可控去标识化技术主要包括生成数据对象主体标识的匿名编码和转换数据对象主体标识的匿名编码两种技术。
82.为便于本发明的描述,定义可控去标识化操作函数为gen,即对标识数据id执行生成数据对象主体标识的匿名编码,记为a=gen(id)。同理,定义可控去标识化转换操作函数为conv,即对a执行转换数据对象主体标识的匿名编码后,得到新的匿名编码,记为b=conv(a)。
83.2)同态加密技术
84.同态加密是基于数学难题的计算复杂性理论的密码学技术。对经过同态加密的数据进行处理得到一个输出,将这一输出进行解密,其结果与用同一方法处理未加密的原始数据得到的输出结果是一样的。本发明不指定某一具体的同态加密技术,只要适合本发明的功能需求,皆可使用。
85.同态密文数据计算类型,记为ht。其中,计算类型ht不限于求和、均值,方差、标准差等。
86.3)重加密技术
87.本发明所用的重加密技术主要是基于非对称算法的重加密技术。当一方使用密钥对明文进行加密后,不仅要将密文数据发送给另一方,同时也要将密钥发送至另一方。另一方将密文解密后,再使用自己的密钥对解密的明文进行加密。在这一过程中,为了防止另一方获取明文的原始信息,在数据发送前,一方需要对明文进行混淆处理,并将混淆所需参数发送至第三方。这样第三方可以对另一方加密的密文进行处理,并利用混淆参数,以及同态计算去除混淆参数,从而达到重加密的目的。
88.本发明涉及的重加密技术不限于非对称算法的重加密技术,如可使用基于nrtu的代理重加密技术等。
89.本发明的实施流程主要包括系统初始化、数据提供方授权、构建密文标签数据仓库和标签数据混合隐私计算。
90.一、系统初始化:
91.系统初始化主要是完成密钥的初始化,如图2所示的初始化部分。
92.1)当数据提供方加入到系统后,需要提前生成密钥,记为ska,并安全存储。对于后续需要加密的数据,数据提供方都要用密钥ska进行加密处理;
93.2)当数据查询方加入到系统后,需要提前生成同态密钥,记为skb,并安全存储。对于后续需要加密的数据,数据查询方都要用密钥skb进行同态加密处理;
94.3)数据查询方生成非对称公私钥对,公钥记为pub,私钥记为pri,安全存储pri。使用pri对pub进行签名,得到sig。然后将pub、sig发送给中心化计算平台。非对称公私钥对所
需的非对称算法不限于sm2、rsa;
95.4)中心化计算平台使用pub对sig进行验签,若验签成功,则将pub发送给数据提供方。
96.二、数据提供方授权
97.如图2所示的授权部分:
98.1)数据提供方对数据查询方进行审核,若审核通过,则使用数据查询方的pub加密ska,得到密文p,然后将密文p发送给数据查询方;
99.2)数据查询方使用pri解密p,得到ska。
100.三、构建密文标签数据仓库
101.定义二维数据(id,l),其中id表示标识数据,l表示标签数据。标签数据主要标识id的属性信息。例如一个人性别、年龄、身高、喜好等,或者某银行卡号的交易金额、交易他行银行卡号、关联商户信息等。l可以表示为多维信息。本发明以标签某一维度数据进行阐述,如人的身高、年龄或银行卡交易金额等,也记为l。数据提供方需要将l同态加密发送出去,以及中心化计算平台和数据查询方的参与,最终数据以密文的形式汇集到中心化计算平台,如图3所示。
102.1)数据提供方对id进行可控去标识化处理,得到a=gen(id);
103.2)数据提供方生成随机数r;
104.3)数据提供方明文计算x=l r;
105.4)数据提供方使用ska对x进行加密,得到enc(x,ska);
106.5)数据提供方将r、enc(x,ska)、a发送给中心化计算平台;
107.6)中心化计算平台存储r,并将a使用可控去标识化转换操作函数conv转成b=conv(a),记录b和r之间的关联;
108.7)中心化计算平台将enc(x,ska)发送给数据查询方;
109.8)数据查询方使用ska解密enc(x,ska),得到x;
110.9)数据查询方使用skb对x进行同态加密,得到he(x,skb);
111.10)数据查询方将he(x,skb)发送给中心化计算平台;
112.11)中心化计算平台基于同态加密的性质,使用明密文计算he(x,skb)-r得到he(l,skb);
113.12)中心化计算平台存储b、he(l,skb),以及它们之间的关联,完成标签数据密文仓库构建。
114.四、标签数据混合隐私计算
115.若数据查询方需要对某id所属的某标签数据l进行计算,同态计算类型ht不限于求和、均值,方差、标准差等,以最终得到计算结果。见图4,其流程描述如下:
116.1)数据查询方使用可控去标识化操作函数gen对id进行处理,得到c=gen(id),并将c和同态计算类型ht发送给中心化计算平台;
117.2)中心化计算平台使用可控去标识化转换操作函数conv,将c转成b’=conv(c);
118.3)中心化计算平台以b’作为索引,查找所有关联的密态标签数据he(l,skb);
119.4)中心化计算平台按照同态计算类型ht对所有he(l,skb)进行同态密文计算,得到he(n,skb),并将he(n,skb)发给数据查询方;
120.5)数据查询方使用同态密钥skb对he(n,skb)进行解密,得到值n,n即为数据查询方所需要的查询计算结果。
121.从数据应用本身来分类,数据主要以标识和标签来划分。其中,标识主要是在数据使用时能够做到区分不同实体,如人们的身份号码、手机号等可作为标识,而标签主要是标识所具有的属性或行为信息,如人的年龄、性别、银行交易以及购物行为等信息。因此,为了能够更好地发挥数据的价值,需要建立不同数据拥有方之间数据标识的关联,从而实现对共有数据标识部分的标签数据进行混合隐私计算。对于拥有原始数据标识的一方,为防止用户信息泄露,需要对原始标识做去标识化处理后,才能进入混合隐私计算环境。而对于标签数据,不同数据方考虑其敏感性,往往不想被他方所知晓。因此,在混合隐私计算时,会将标签数据做具有同态特性的加密处理,从而实现在密态下的标签数据计算。
122.本发明主要解决的是,当存在多方数据参与计算时,参与各方不想公开自己的明文数据,存在着多方参与数据计算上的隔离。各方也不想公开自己的关联标识信息,导致标识相关联的标签数据无法参与到计算中。
123.例如,计算同一个人在不同家银行中的交易总金额,计算同一个人在不同电商平台的交易数据。为实现类似应用场景,通过本发明所描述的方法和系统,监管机构作为数据查询方,可以实现通过中心化计算平台对某银行卡号在所有银行的交易进行交易总额的隐私计算。也就是说,各银行将涉及该银行卡号的交易金额进行加密,同时将该银行卡号做去标识化处理,然后将整个交易信息发送到中心化计算平台。中心化计算平台融合各家银行的数据,并在数据安全保护下实现标签混合隐私计算,得到该银行卡号的交易总金额,从而实现为监管提供依据的目的。
124.因此,基于可控去标识化技术,中心化计算平台能够实现对数据的审计。通过可控去标识化技术,可以将数据提供方和数据查询方的标识数据汇聚到中心化计算平台,中心化计算平台可以完成对整个数据流通过程中的标识数据进行审计,防止数据查询方发出非法查询请求,或数据提供方混入非法数据。
125.基于可控去标识化技术,中心化计算平台能够实现对数据的追溯。中心化计算平台记录整个数据流通过程中的标识数据,实现数据的可追溯,从而完成针对诈骗、洗钱等违法行为的有效取证。
126.基于可控去标识化技术,可以建立数据提供方和数据查询方之间的对等关系,去除双方之间存有数据泄露给对方的顾虑。
127.通过将r值存于中心化计算平台,可以建立数据提供方、数据查询方和中心化计算平台三方之间的可信关系,从而防止数据提供方的密文标签数据被非法解密。本实施例的具体实现方案可以参见上述实施例中的相关说明,此处不再赘述。
128.可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
129.需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是指至少两个。
130.流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部
分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
131.应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行装置执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
132.本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,相应的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
133.此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
134.在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
135.采用了本发明的基于可控去标识化的标签实现混合隐私计算处理的方法,基于可控去标识化技术,并结合同态加密技术、重加密技术,从而实现对标签数据进行混合隐私计算的目的。本发明所阐述的设计方案,一方面,能够做到数据的安全保护,不让其他参与方知晓原始明文信息;另一方面,能够安全地参与到数据计算中,并实现数据增值服务的目标。本发明所阐述的设计方案,有多方面的优势。例如,基于可控去标识化技术,中心化计算平台能够实现对数据的审计、追溯,并建立数据提供方和数据查询方之间的对等关系,去除双方之间存有数据泄露给对方的顾虑;另外,通过将随机数r值存于中心化计算平台,可以建立数据提供方、数据查询方和中心化计算平台三方之间的可信关系,从而防止数据提供方的密文标签数据被非法解密。
136.在此说明书中,本发明已参照其特定的实施例作了描述。但是,很显然仍可以作出各种修改和变换而不背离本发明的精神和范围。因此,说明书和附图应被认为是说明性的而非限制性的。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献