一种隐私保护细粒度数据聚合方法及系统与流程

2022-04-24 23:35:56 来源：中国专利 TAG：

1.本发明属于信息安全技术领域，涉及一种应用密码学中的隐私保护数据聚合方法，具体涉及一种多功能和高性能的隐私保护细粒度数据聚合方法及系统。

背景技术：

2.智能电网通过将信息和通信技术融入到传统电力网络中，从而形成一种高效、可靠、安全的电力系统。而作为其中的一个重要组成部分，先进的计量基础设施(ami)网络允许控制中心每隔几分钟收集一次居民用户的细粒度用电数据，用于能源管理和实时负载监测。例如，通过分析、监测这些细粒度的用电数据，控制中心可以对电力生产计划进行调节，从而降低断电的风险。
3.虽然分析这些细粒度的用电数据是有价值的，但是这些数据可能会揭示居民用户的日常活动，一旦处理不当，将会泄露居民用户的隐私，从而引发严重的隐私问题。例如，通过分析某一居民用户每天的用电数据，可以知道该用户的在家和外出时间，一旦被不怀好意的人知道了这些信息，将会对用户的财产、甚至是生命造成损害。
4.为了保护用户的隐私数据，在ami网络中，目前已经提出了许多隐私保护数据聚合(ppda)方案。虽然大多数现有的ppda方案允许控制中心在聚合用户总用电量的同时也能保护用户的个人隐私，但是这些方案有时并不能满足控制中心更加细粒度的需求。例如，为了制定更佳的电力生产计划和进行更精准的用电量预测，控制中心不仅需要知道所有用户的总用电量数据，还需要知道各个用电量段的用户分布信息，这就需要更加细粒度的ppda方案，也即隐私保护多子集数据聚合(ppmda)方案。
5.如今，国内外也有不少学者已经对ppmda方案进行了深入的研究。但是，这些方案大多只专注于特定函数(例如求平均、方差等)的隐私保护多子集数据聚合方法，难以满足智能服务的多样性需求。据我们所知，在ami网络中，目前还没有关于多功能ppmda(也即能够实现求平均、方差、单向方差分析、最大、最小的隐私保护多子集数据聚合)的正式研究。此外，现有的大多数ppmda方案在进行隐私保护数据聚合时，往往都是用户上传一组数据后，只进行单一的特定函数聚合操作，并不能将数据充分利用起来，这是不够高效的。
6.因此，发明一种多功能和高性能的隐私保护细粒度数据聚合方法是十分重要的。

技术实现要素：

7.鉴于以上提及的ppmda方案的弊端，以及满足智能服务的多样性需求，本发明基于应用密码学中的同态加密技术，提供了一种在ami网络中具有多功能和高性能的隐私保护细粒度数据聚合方法。
8.本发明的一方面，提供了一种多功能和高性能的隐私保护多子集数据聚合方法，包括精准的加性多子集数据聚合和近似的非加性多子集数据聚合。
9.所述精准的加性多子集数据聚合，包括初始化阶段、用户报告产生阶段、隐私保护用户报告聚合阶段和控制中心解密阶段；
10.所述初始化阶段，可信机构初始化整个系统，产生公钥和私钥对，并分发给控制中心、网关和用户，完成注册。
11.所述用户报告产生阶段，假设用户每隔15分钟会产生一个用电量报告，并将其报告给网关。通过收集和分析n个用户的细粒度用电量数据，控制中心可以监测ami网络的健康状态和进一步地提供更加多样性的细粒度智能服务。
12.所述隐私保护用户报告聚合阶段，网关首先验证每个用户报告的有效性，然后执行隐私保护用户报告聚合并生成网关的签名，最后将聚合的结果上报给控制中心。
13.所述控制中心解密阶段，当控制中心收到网关发来的聚合报告后，控制中心首先验证聚合报告的有效性，然后对聚合结果进行解密，就能同时实现求平均和求方差的隐私保护多子集数据聚合。
14.所述近似的非加性多子集数据聚合，包括针对所有用户的非加性数据聚合和针对多子集的非加性数据聚合；
15.所述针对所有用户的非加性数据聚合可以很容易地由精准的加性多子集数据聚合扩展而来。通过精准的加性多子集数据聚合的控制中心解密阶段得到的数据，根据最大/最小可能值定理，就能实现针对所有用户的近似直方图、中位数和最大/最小数据聚合。
16.所述针对多子集的非加性数据聚合可以很容易地由精准的加性多子集数据聚合扩展而来。通过精准的加性多子集数据聚合的控制中心解密阶段得到的数据，根据最大/最小可能值定理，就能实现针对多子集的近似最大/最小数据聚合。
17.所述最大/最小可能值定理是实现近似的非加性多子集数据聚合的关键定理，该定理可以帮助控制中心在只知道数据个数、平均值和方差的情况下，找到未知数据集中的最大/最小可能值。
18.本发明的另一方面，还提供了一种隐私保护细粒度数据聚合系统，包括精准的加性多子集数据聚合模块和近似的非加性多子集数据聚合模块；
19.所述的精准的加性多子集数据聚合模块主要实现精准的均值、方差和单向方差分析聚合；
20.所述的近似的非加性多子集数据聚合模块主要实现近似的最小聚合和最大聚合。
21.本发明与现有技术相比，其有益效果主要体现在以下几个方面：
22.(1)本发明提供了一种多功能的隐私保护细粒度数据聚合方法，该方法支持精准的加性多子集数据聚合(如精准的均值、方差和单向方差分析聚合)和近似的非加性多子集数据聚合(如近似的最小聚合和最大聚合)，是第一个为ami网络实现多功能隐私保护多子集数据聚合的正式研究，从而满足智能服务的多样性需求。
23.(2)本发明提供了一种高性能的隐私保护细粒度数据聚合方法，该方法只需要用户上传一次数据，就能同时实现五重的隐私保护统计聚合(也即同时实现求平均、方差、单向方差分析、最大、最小的隐私保护统计聚合)，从而极大地降低了隐私保护细粒度数据聚合中的计算和通信开销。
24.(3)本发明提供了一种隐私保护细粒度数据聚合实用框架，该框架不仅支持动态定价计费和容忍用户错误，还能结合差分隐私技术来抵抗差分攻击，适用于大多数实际应用场景。
附图说明
25.图1为本发明实施例的整体系统模型图。
26.图2为本发明实施例的内容框架图。
具体实施方式
27.为了便于本领域普遍技术人员的理解和实施本发明，下面结合附图及实施例对本发明作进一步的详细描述，应当理解，此处所描述的实施示例仅用于说明和解释本发明，并不用于限定本发明。
28.本发明提供一种多功能和高性能的隐私保护细粒度数据聚合系统，由精准的加性多子集数据聚合模块和近似的非加性多子集数据聚合模块组成。本实施例中，精准的加性多子集数据聚合模块主要实现精准的均值、方差和单向方差分析聚合；近似的非加性多子集数据聚合模块主要实现近似的最小聚合和最大聚合。
29.在本实施例的整体系统模型图中(见图1)，可信机构往往是一个强大且可信的实体，该实体主要负责初始化整个系统；在发电站中，控制中心是一个高可信的实体，该实体负责收集、处理和分析用户上传上来的细粒度用电量数据，并提供多样性的智能用电服务；网关处于控制中心和用户之间，负责转发需求和聚合一定范围内收集上来的用户细粒度用电量数据；每个居民用户都配备一个智能电表，用于收集细粒度的用电量数据。
30.基于上述系统模型，本发明提供了一种多功能和高性能的隐私保护多子集数据聚合方法，包括精准的加性多子集数据聚合和近似的非加性多子集数据聚合，见图2。
31.本实施例中，精准的加性多子集数据聚合，包括初始化阶段、用户报告产生阶段、隐私保护用户报告聚合阶段和控制中心解密阶段；
32.本实施例在初始化阶段，可信机构能够初始化整个系统，产生公钥和私钥对，并分发给控制中心、网关和用户，完成注册；具体实施过程包括：
33.首先，可信机构根据安全参数κ执行算法产生一个五元组根据paillier密码算法产生相应的私钥(λ,μ)和公钥(n,g)；
34.其中，和是两个循环群，p和q是两个大素数，满足|p|＝|q|＝κ，e是一个双线性映射g是的生成元，n是的阶，λ＝lcm(p-1,q-1)，l(x)＝(x-1)/n，μ＝(l(g
λ
mod n2))-1 mod n，lcm是最小公倍数函数。
35.其次，假设系统中有n个用户，且用电量范围[r1,r
k 1
)划分为k个子集[r1,r2),[r2,r3),
…
[rk,r
k 1
)；
[0036]
其中，r1＝0，r
k 1
是最大用电量，用户i的用电量数据mi∈[ri,r
i 1
)表示mi是大于等于用电量ri，小于用电量r
i 1
的。
[0037]
然后，可信机构从中产生n 2个随机数{x0,x1,
…
,xn,xg}，并计算和可信机构选择一个超递增序列计算并公布参数
[0038]
其中，是1到n-1内的整数，超递增序列需要满足以下条件：
[0039][0040]
最后，可信机构公布系统参数：
[0041][0042]
并通过安全信道将发送给控制中心，将xg发送给网关，将xi发送给用户i∈[1,n]；其中，h是一个哈希函数
[0043]
本实施例在用户报告产生阶段，假设用户每隔15分钟会产生一个用电量报告，并将其报告给网关。通过收集和分析n个用户的细粒度用电量数据，控制中心可以监测ami网络的健康状态和进一步地提供更加多样性的细粒度智能服务；具体实施过程包括：
[0044]
首先，为了不失一般性，假设用户i的用电量mi属于第j个子集[rj,r
j 1
)，也即mi∈[rj,r
j 1
)，那么用户i就会利用上个阶段产生的参数和私钥xi作为加密参数对用电量mi进行加密，得到密文
[0045]
其中，t是当前的时间戳，可以用来抵抗消息重放攻击。
[0046]
其次，用户i利用私钥xi产生一个签名
[0047]
最后，用户i将产生的用户报告{ci||i||t||σi}发送给网关；特别注意的是，在本实施例中，每个用户只需上传一次报告给控制中心，就能完成多功能的隐私保护多子集数据聚合，极大地降低了本系统的计算和通信开销。
[0048]
本实施例在隐私保护用户报告聚合阶段，网关首先验证每个用户报告的有效性，然后执行隐私保护用户报告聚合并生成网关的签名，最后将聚合的结果上报给控制中心；具体实施过程包括：
[0049]
首先，网关通过公式e(g,σi)＝e(yi,h(ci||i||t))检查签名σi和时间戳t来验证用户i上报的用户报告的有效性。为了使验证过程更加高效，可以使用批验证方法；
[0050]
其中，批验证方法是指，当收到n个用户的用户报告后，网关可以利用批验证公式来对用户报告进行批验证。通过批验证，可使原来需要2n个双线性映射操作时间降低到现在的n 1个双线性映射操作时间，大大降低了验证过程的计算开销。
[0051]
其次，在用户报告的有效性验证完成后，网关将执行隐私保护用户报告聚合，产生聚合结果
[0052]
其中，
对于j∈[1,k]，表示用电量数据落在第j个子集[rj,r
j 1
)范围内的用户集合，表示用电量数据落在第j个子集[rj,r
j 1
)范围内的用户数量。和在控制中心解密阶段可以通过初始化阶段产生的超递增序列来恢复。
[0053]
然后，网关利用私钥xg产生一个签名其中，gw是网关的身份标识。
[0054]
最后，网关将聚合报告{c||gw||t||σg}发送给控制中心。
[0055]
本实施例在控制中心解密阶段，当控制中心收到网关发来的聚合报告后，控制中心首先验证聚合报告的有效性，然后对聚合结果c进行解密，就能同时实现求平均和求方差的隐私保护多子集数据聚合；具体实施过程包括：
[0056]
首先，当控制中心收到网关发送的聚合报告后，控制中心首先通过公式e(g,σg)＝e(yg,h(c||gw||t))来验证聚合报告的有效性。
[0057]
其次，由于聚合结果c仍然是paillier加密的密文形式，因此控制中心可以使用私钥(λ,μ)进行解密得到控制中心根据超递增序列从中恢复出和
[0058]
其中，代表第j个子集内的用户数量，代表第j个子集内的用户总用电量，代表第j个子集内的用户用电量平方的和。因此，代表总用户数，代表所有用户的总用电量，代表所有用户的用电量平方的和。
[0059]
最后，通过计算控制中心就能同时实现求平均和求方差的隐私保护多子集数据聚合；
[0060]
其中，代表第j个子集内用户的用电量的平均值，代表第j个子集内用户的用电量的方差。需要注意的是，控制中心只需解密一次便可以得到第j个子集内的用户数量总用电量mj、用电量平方的和sj，以及总用户数所有用户的总用电量m、所有用户的用电量平方的和s，还可以得到第j个子集内用户的用电量的平均值第j个子集内用户的用电量的方差所有用户的用电量的平均值所有用户的用电量的方差实现了每个用户只需要加密和传输一次用电量数据就能完成多功能隐私保护多子集数据聚合，极大地减少了计算和通信开销，是一种多功能和高性能的隐私保护多子集数据聚合方法。
[0061]
本实施例中，近似的非加性多子集数据聚合，包括最大/最小可能值定理、针对所
有用户的非加性数据聚合和针对多子集的非加性数据聚合；
[0062]
本实施例中，最大/最小可能值定理是实现近似的非加性多子集数据聚合的关键定理，该定理可以帮助控制中心在只知道数据个数、平均值和方差的情况下，找到未知数据集中的最大/最小可能值；该定理的结论如下：
[0063]
对于一个未知的数据集d＝{x1,x2,
…
,xn}，已知其数据个数n，平均值和标准差就可以推导出近似的最小值和近似的最大值
[0064]
本实施例中，通过精准的加性多子集数据聚合的控制中心解密阶段得到的数据mj，sj，m，s，j∈[1,k]，根据最大/最小可能值定理，可以很容易地将精准的加性多子集数据聚合扩展为针对所有用户的非加性多子集数据聚合(例如针对所有用户的近似直方图、中位数和最大/最小数据聚合)；具体实施过程包括：
[0065]
首先，对于求所有用户的近似直方图数据聚合，由于已知落在各个子集中的用户个数和相应的用电量范围[rj,r
j 1
)，所以可以很容易地求所有用户的近似直方图数据聚合。
[0066]
其次，对于求所有用户的近似中位数数据聚合，由于已知落在各个子集中的用户个数和总用户数n，所以可以通过循环地比较与n/2的关系来寻找近似的中位数。
[0067]
最后，对于求所有用户的近似最大/最小数据聚合，由于已知所有用户的用电量的平均值所有用户的用电量的方差和总用户数n，根据最大/最小可能值定理，可以很容易地推出精准的最大值落在范围内，精准的最小值落在范围内；
[0068]
其中，min是求最小值函数，max是求最大值函数。
[0069]
本实施例中，通过精准的加性多子集数据聚合的控制中心解密阶段得到的数据，根据最大/最小可能值定理，可以很容易地将精准的加性多子集数据聚合扩展为针对多子集的非加性多子集数据聚合(例如针对多子集的近似最大/最小数据聚合)；具体实施过程包括：
[0070]
对于求多子集的近似最大/最小数据聚合，由于已知第j个子集内用户的用电量的平均值第j个子集内用户的用电量的方差和第j个子集内的用户数量可以先循环地找到最大的j，使得精准的最大值落在[rj,r
j 1
)范围内，然后根据最大/最小可能值定理，可以推出精准的最大值落在范围内，该范围与
相比，精确度更加高。用类似的方法，精准的最小值落在范围内。
[0071]
应当理解的是，上述针对实施例的描述较为详细，并不能因此而认为是对本发明专利保护范围的限制，本领域的普通技术人员在本发明的启示下，在不脱离本发明权利要求所保护的范围情况下，还可以做出替换或变形，均落入本发明的保护范围之内，本发明的请求保护范围应以所附权利要求为准。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种肺癌化疗生存期的预测方法、系统、设备及介质与流程

一种隐私保护细粒度数据聚合方法及系统与流程

相关文献

最热文献