一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于联邦隐私训练的电力设施安全态势感知方法及系统

2022-06-05 08:15:37 来源:中国专利 TAG:


1.本发明涉及电力数据隐私保护领域,具体涉及一种基于联邦隐私训练的电力设施安全态势感知方法及系统。


背景技术:

2.随着信息化时代的到来,各行各业的数字化和智能化程度飞速提高,电网系统也不例外。智能电网覆盖电力系统整个生产过程,包括发电、输电、变电、配电、用电及调度等多个环节,它建立在集成的高速双向通信网络的基础上,通过传感和测量技术、设备技术、控制方法等实现了电网的可靠、经济、高效和环境友好等目标,提供满足21 世纪用户需求的电能质量、容许各种不同发电形式的接入、启动电力市场以及资产的优化高效运行等。由于智能电网中大量智能设备的接入,电力用户与信息世界联系越加紧密,通过大数据和机器学习来制定电力利用策略也成为了新的发展方向。而对于电力基础设施的数据进行联合建模,可以有效判断电力系统中的安全风险,感知电力安全态势。随着新技术层出不穷,对多方掌握的不同用户数据进行共享分析、联合建模的需求日益加深,数据共享的安全问题逐渐凸显。电力系统进行大数据分析、联合建模时所采集的数据有天然的分离特点,可以由各方掌握若干条具有同样特征的数据,也可由各方掌握一条数据的不同特征。而直接将原始数据集中到同一服务器汇总进行建模学习势必无法完全保护掌握原始数据的各方的数据隐私安全,也会在很大程度上影响电力系统的计算和通信效率。例如变电站掌握了总的用电量数据,而变化的用电人口的数量则由其他部门或公司掌握,如果发布者在联合分析时直接发布原始数据,而不采取适当的数据保护措施,很可能会泄露敏感信息,进而危害数据所有者。当前流行的多方协作的分布式学习框架并未考虑隐私保护问题,仍采用直接共享原始数据的方式进行学习建模,造成了数据隐私难以管理和保护的情况。
3.针对上述问题,多方进行不断研究,并结合现有技术进行创新以找寻安全可靠的电力系统联合分析的隐私保护方法。专利《一种基于混合加密算法的电力数据隐私通信方法》(cn112511304a)提供一种基于混合加密算法的电力数据隐私通信方法,通过混合加密,保证数据的机密性和完整性,提高加密和解密速度,同时解决了aes加密算法的密钥管理与分发的问题,优化电力数据通信流程,但仅专注于数据通信保密问题,并未考虑到联合建模的数据使用问题;专利《一种基于电网数据采集的数据脱敏方法及系统》(cn113282961a)涉及一种基于电网数据采集的数据脱敏方法和系统,获取多维电力数据并识别出其中的敏感数据,生成敏感数据的近似分布进行脱敏,但近似数据在联合建模时的有效性无法得到保证。
4.联邦学习与传统的隐私保护方法不同,可以使得各个部门的数据不离开本地,通过同态加密等加密算法在相应的机制下实现参数的交换,在不违背数据隐私规定的情况下,多个部门建立一个共有的电力系统安全态势模型,从而提升系统整体的安全性。在这个过程中,数据本身是不进行移动,因此对数据的隐私和规范性不会造成影响,进而充分保障了各部门信息的隐私性以及数据的安全性。在训练的过程中,通过两方提供数据以扩展某
一条数据的维度的方式,称为纵向联邦学习,纵向联邦学习就是将某一条训练集的不同特征在加密状态下进行聚合,旨在增强、扩充某一条训练集的描述的联邦学习模式。不仅如此,由于联邦学习的模型参数共享与更新大多依赖可信第三方或集中式服务器来协调整个联邦学习系统,可能存在数据泄漏到第三方或集中式服务器的风险。因此,为提高联邦学习过程的可信性与容错性,可引入区块链技术。区块链作为一种去中心化的分布式存储架构,通过密码学知识保证其不可篡改性和不可伪造性,通过近年来联邦学习和区块链技术研究的积累,区块链 联邦学习(blockfl,bfl)已经在高度隐私行业中有着巨大的应用潜能,将区块链作为联邦学习的底层基础架构,通过在区块链上层设计协议和智能合约来实现分布式模型聚合的任务,并实现电力部门数据的隐私保护是本发明的立足点。
5.在多方进行联邦学习的过程中,还需要考虑数据以何种训练模型进行训练以形成最终的态势感知预测模型。而决策树模型以其强大的扩展能力,能够轻松应付特征筛选、回归、分类等任务,一直在机器学习领域发挥着重要作用。按照决策树的输入类型可以分为离散特征的决策树和连续特征的决策树,按照决策树的目标可以分为分类决策树 (例如c4.5)和回归树(例如cart树),按照模型的训练方式可以分为boosting决策树(xgboost等)和bagging决策树(随机森林等)。对于离散特征,决策树通常使用信息增益决定树模型分裂的节点,而信息增益存在偏好选择分支较多的特征属性,因此后续有使用信息增益率或者gini系数作为节点分类依据。对于连续特征,传统的方式即使用均方误差确定决策树的划分节点。单棵决策树的效果往往有限,如果要增加决策树的准确性,通常会增加决策树深度或者增加树的数量。但增加决策树深度往往会导致严重的过拟合,所以决策树的进一步优化通常选择增加决策树数量。多棵决策树的聚合有bagging和boosting的方法,本发明所使用的boosting方法以xgboost为代表,每生成一棵新的决策树,都是在拟合优化之前所有决策树预测的残差,最终模型是所有决策树结果的加和。xgboost在提供更高准确率的同时,针对boosting方法存有的过拟合风险,引用了随机森林中随机采样特征的方法和正则化项来有效防止过拟合。xgboost 的思想为决策树的准确性带来了极大的提升,后续也有例如lightgbm将缓存在内存中的样本特征值转为样本的分桶值,使用互斥特征捆绑算法减少特征数量;使用leaf-wise的决策树构建策略,减少不必要的计算量并对缓存进行优化,增加cache的命中率等方法,以优化xgboost的运行内存和计算速度,适应更大的数据量。
6.总之,现有技术存在以下缺点和不足:1)一些基于传统方式的隐私保护研究,在较大程度上增加了数据交互时的计算成本,不利于联合建模时对数据的使用;2)未在联邦学习时将区块链纳入隐私防护方案的研究中,存在数据内容泄漏至提供聚合服务的第三方或集中式服务器的风险,导致数据隐私无法得到有效的保障。


技术实现要素:

7.为了解决上述技术问题,本发明提供一种基于联邦隐私训练的电力设施安全态势感知方法及系统。
8.本发明技术解决方案为:一种基于联邦隐私训练的电力设施安全态势感知方法,包括:
9.步骤s1:以不同电力部门作为分布式协议节点,利用分布式账本构建联盟区块链网络,所述联盟区块链网络上各个所述分布式协议节点通过智能合约进行数据传递;
10.步骤s2:构建面向决策树的联邦学习模型,获取各个所述分布式协议节点的网络流量作为训练样本,根据所述训练样本的数学特征,在保证多方数据隐私的前提下,训练所述面向决策树的联邦学习模型,得到决策树;
11.步骤s3:在所述联盟区块链网络内共享训练好的面向决策树的联邦学习模型,各个所述分布式协议节点均可利用该模型进行本地计算和预测,得到所需预测结果。
12.本发明与现有技术相比,具有以下优点:
13.本发明提供的一种基于联邦隐私训练的电力设施安全态势感知方法,利用区块链技术作为底层框架,利用智能合约实现数据在传递过程中的隐私保护,利用区块链极大地改变了数据访问、存储和检索的方式,及其去中心化、数据共享全流程可靠、可追溯等特性,可以避免数据泄漏到提供聚合服务的第三方或集中式服务器的风险。
14.本发明提供的方法以决策树为基础,提取原始数据的数学特征,利用同态加密、智能合约和共识机制等实现数据的隐私建模,保证各部门的数据交互过程真实可信的同时不泄露参与者的数据隐私,也为其他未参与部门数据交互的规范性提出保证,提高所构建模型对电力基础设施安全态势的感知能力。
附图说明
15.图1为本发明实施例中一种基于联邦隐私训练的电力设施安全态势感知方法的流程图;
16.图2为本发明实施例中联盟区块链网络的构建过程示意图;
17.图3为本发明实施例中特征桶的生成过程示意图;
18.图4为本发明实施例中面向决策树的联邦学习模型的建模流程示意图;
19.图5为本发明实施例中一种基于联邦隐私训练的电力设施安全态势感知系统的结构框图。
具体实施方式
20.本发明提供了一种基于联邦隐私训练的电力设施安全态势感知方法,保护多方协作进行电力基础设施相关数据联邦学习时的隐私,旨在防止电力部门协作过程中出现隐私泄露对系统造成威胁的现象。
21.为了使本发明的目的、技术方案及优点更加清楚,以下通过具体实施,并结合附图,对本发明进一步详细说明。
22.实施例一
23.如图1所示,本发明实施例提供的一种基于联邦隐私训练的电力设施安全态势感知方法,包括下述步骤:
24.步骤s1:以不同电力部门作为分布式协议节点,利用分布式账本构建联盟区块链网络,联盟区块链网络上各个分布式协议节点通过智能合约进行数据传递;
25.步骤s2:构建面向决策树的联邦学习模型,获取各个分布式协议节点的网络流量作为训练样本,根据训练样本的数学特征,在保证多方数据隐私的前提下,训练面向决策树的联邦学习模型,得到决策树;
26.步骤s3:在联盟区块链网络内共享训练好的面向决策树的联邦学习模型,各个分
布式协议节点均可利用该模型进行本地计算和预测,得到所需预测结果。
27.在一个实施例中,上述步骤s1:以不同电力部门作为分布式协议节点,利用分布式账本构建联盟区块链网络,联盟区块链网络上各个分布式协议节点通过智能合约进行数据传递,具体包括:
28.步骤s11:联盟区块链网络包括:数字身份账本、分布式协议节点以及分布式客户端;其中数字身份账本包括身份标识符和身份凭证,数字身份账本存于分布式账本;
29.数字身份账本包括身份标识符和身份凭证,其中的身份标识符是作为联盟区块链内实体的唯一标识,身份凭证是与实体相关联的身份属性声明集合,以证明实体身份。
30.步骤s12:分布式协议节点连接分布式账本和分布式客户端,接收分布式客户端的请求;各个分布式协议节点上运行同一份智能合约,通过数字身份账本,进行业务处理;
31.步骤s13:用户在分布式客户端自主生成数字身份账本,经由分布式协议节点在对应的分布式账本进行上链存储;不同用户通过分布式客户端可向联盟区块链网络提出联合建模请求,共同利用双方的电力设施数据进行建模。
32.本发明实施例采用联盟区块链网络作为底层技术选型,更符合电力行业可信交互以及对接需求,有性能较优、监管友好等特性,联盟区块链网络信任分布式身份认证,由可信联盟区块链网络内各协议节点共同行使共识和记账的权利,各协议节点共同维护一份相同的联盟分布式身份账本。
33.如图2所示,展示了联盟区块链网络的构建过程。
34.下面通过举例展示在纵向联邦学习模型中,参与联合建模的分布式协议节点a与分布式协议节点b在共享隐私数据过程中如何保证双方隐私数据不被泄露的过程。
35.在一个实施例中,上述步骤s2:构建面向决策树的联邦学习模型,获取各个分布式协议节点的网络流量作为训练样本,根据训练样本的数学特征,在保证多方数据隐私的前提下,训练面向决策树的联邦学习模型,得到决策树,具体包括:
36.步骤s21:分布式协议节点a基于同态加密算法生成公钥和私钥,并将公钥和面向决策树的联邦学习模型的参数配置(例如:迭代轮数、决策树的最大深度、叶子节点树等参数)通过智能合约上传至联盟区块链网络中,进而同步给分布式协议节点b;其中,分布式协议节点a的训练样本具有标签,分布式协议节点b的训练样本不具有标签,且二者的训练样本具有不同维度的特征;
37.分布式协议节点a的训练样本应具备某些维度的特征,及其训练样本对应的标签;而分布式协议节点b的训练样本具备与分布式协议节点a不同维度的特征,且不具备对应的标签,从而可以起到补充分布式协议节点a的训练样本维度的作用。
38.步骤s22:分布式协议节点a和分布式协议节点b进行数据初始化处理,得到分布式协议节点a的特征数据data_a(分布式协议节点a提供的基础设施安全相关信息,例如针对该基础设施输入的网络流量:出现syn错误的连接次数、过去的2秒内与当前连接有着相同的目的地址的连接、出现rej错误的连接次数)和分布式协议节点b的特征数据data_b(分布式协议节点b提供的基础设施安全相关信息,如针对该基础设施输入的网络流量:建立相同服务的连接次数、建立不同服务的连接次数、过去2秒时间内出现和当前连接服务相同的连接次数),对其进行数据分桶和稀疏特征过滤操作,分别生成本地特征桶bina和binb;并且分布式协议节点a包含标签信息label_a(label_a 包括:该网络流量表现为正常记录、拒绝
服务攻击、监视和其他探测活动、来自远程机器的非法访问以及普通用户对本地超级用户特权的非法访问);
39.图3展示了特征桶的生成过程示意图;
40.步骤s23:设置迭代轮数n,若此时生成是第一棵决策树,则只需对分布式协议节点a进行初始化,否则,分布式协议节点a根据上一棵决策树的预测值和标签值label_a,计算上一轮的残差值,以及本轮的残差值ga和ha;
41.步骤s24:分布式协议节点a将ga和ha用公钥加密,得到密文残差enc_ga和 enc_ha,通过智能合约上传到联盟区块链网络中,进而同步到分布式协议节点b;
42.步骤s25:分布式协议节点a和分布式协议节点b分别从其决策树的根节点开始递归寻找决策树的每一个最优分裂点,直到所有的节点都是叶子节点,具体包括:
43.步骤s251:分布式协议节点a和分布式协议节点b判断当前节点是否为叶子节点,即判断决策树的最大深度是否达到阈值,或节点上的数据行数是否小于阈值,再或当前节点上的数据是否不需要再划分;如果不是叶子节点,就继续分裂;若是叶子节点就直接返回,结束递归;
44.步骤s252:分布式协议节点a和分布式协议节点b同步每个决策树节点划分的节点id信息;
45.步骤s253:分布式协议节点a根据本地特征分桶bina和残差值ga和ha,构建明文直方图,并计算基于直方图的每一个分裂位置的信息增益gain,并找到最大信息增益 gain_a的直方图位置作为分布式协议节点a的局部最优分裂点;
46.步骤s254:分布式协议节点b根据本地特征分桶binb、密文残差值enc_ga和enc_ha 和分布式协议节点a生成的公钥构建密文直方图;分布式协议节点b将密文直方图通过智能合约共享至联盟区块链网络网络中,进而发送回到分布式协议节点a;
47.步骤s255:分布式协议节点a根据私钥解密密文直方图,并计算分布式协议节点b 的信息增益,找到分布式协议节点b最大信息增益gain_b位置,做为分布式协议节点b 的局部最优分裂点;
48.步骤s256:分布式协议节点a比较两个局部最优信息增益gain_a和gain_b,判断全局最优分裂位于分布式协议节点a还是分布式协议节点b;如果位于分布式协议节点 a,则直接根据gain_a对应的分裂位置对节点进行分裂,更新新一轮分裂信息值,并存储;如果位于分布式协议节点b,则分布式协议节点a需要将gain_b对应的分裂位置发回分布式协议节点b。分布式协议节点b根据该位置对节点进行分裂,并存储分裂信息值,并将分裂id结果同步到分布式协议节点a;分布式协议节点a根据分布式协议节点b同步的结果,划分节点并更新分裂信息,直到所有的节点都是叶子节点,则生成决策树;
49.步骤s26:分布式协议节点a和分布式协议节点b同步决策树的结构,但是每个分裂点的分裂值信息不同步;最终分布式协议节点a和分布式协议节点b双方各自输出模型结果为n棵树,n为迭代轮数;如果在分布式协议节点a的特征上分裂,则存储于分布式协议节点a,如果在分布式协议节点b的特征上分裂,则存储于分布式协议节点b;叶子节点上存储了分裂到该叶子节点上的预测值;
50.步骤s27:根据新生成的决策树,计算新一轮的预测值,并输出到下一轮的迭代中,直到完成n轮迭代,分别得到分布式协议节点a的决策树和分布式协议节点b的决策树。
51.如图4所示,展示了面向决策树的联邦学习模型的建模流程示意图。
52.在一个实施例中,上述步骤s3:在联盟区块链网络内共享训练好的面向决策树的联邦学习模型,各个分布式协议节点均可利用该模型进行本地计算和预测,得到所需预测结果,具体包括:
53.步骤s31:合并分布式协议节点a的决策树和分布式协议节点b的决策树,构成最终的决策树,从而得到训练好的面向决策树的联邦学习模型,并将该模型通过智能合约共享到联盟区块链网络中;
54.步骤s32:联盟区块链网络中各个分布式协议节点可利用训练好的面向决策树的联邦学习模型进行本地计算和预测。
55.本发明提供的一种基于联邦隐私训练的电力设施安全态势感知方法,利用区块链技术作为底层框架,利用智能合约实现数据在传递过程中的隐私保护,利用区块链极大地改变了数据访问、存储和检索的方式,及其去中心化、数据共享全流程可靠、可追溯等特性,可以避免数据泄漏到提供聚合服务的第三方或集中式服务器的风险。
56.本发明提供的方法以决策树为基础,提取原始数据的数学特征,利用同态加密、智能合约和共识机制等实现数据的隐私建模,保证各部门的数据交互过程真实可信的同时不泄露参与者的数据隐私,也为其他未参与部门数据交互的规范性提出保证,提高所构建模型对电力基础设施安全态势的感知能力。
57.实施例二
58.如图5所示,本发明实施例提供了一种基于联邦隐私训练的电力设施安全态势感知系统,包括下述模块:
59.构建联盟区块链网络模块41,用于以不同电力部门作为分布式协议节点,利用分布式账本构建联盟区块链网络,联盟区块链网络上各个分布式协议节点通过智能合约进行数据传递;
60.训练面向决策树的联邦学习模型模块42,用于构建面向决策树的联邦学习模型,利用待训练的网络流量样本的数学特征,在保证多方数据隐私的前提下,训练面向决策树的联邦学习模型,得到决策树;
61.共享面向决策树的联邦学习模型模块43,用于在联盟区块链网络内共享训练好的面向决策树的联邦学习模型,各个分布式协议节点均可利用该模型进行本地计算和预测,得到所需预测结果。
62.提供以上实施例仅仅是为了描述本发明的目的,而并非要限制本发明的范围。本发明的范围由所附权利要求限定。不脱离本发明的精神和原理而做出的各种等同替换和修改,均应涵盖在本发明的范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献