一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种面向电力业务场景的数据敏感度标定方法及系统

2022-07-31 03:18:55 来源:中国专利 TAG:


1.本发明属于数据保护领域,尤其涉及一种面向电力业务场景的数据敏感度标定方法及系统。


背景技术:

2.由于电力行业与国家安全和个人隐私紧密相关,电力业务点多线长、专业性强,电力数据种类多、体量大等特点,电力数据的敏感度标定目前面临诸多挑战。电力行业事关国防安全、社会稳定、经济发展、人民生活,其数据敏感度标定需要同时考虑诸多方面的因素。
3.在大数据、物联网的背景下,电力行业数据纷繁复杂,并且不同数据之间可能存在较强的相关性。如能源、气候、电力系统、电力市场数据之间存在着复杂的关系,电力市场中的电价数据和电网线路参数之间存在相关性、气候数据和新能源数据之间存在相关性等等。不同领域之间的数据有可能进行相互推导,如果在对数据进行敏感度标定的过程中未考虑数据之间的相关性,则有可能关键数据由于与公开的数据之间的相关性而导致数据间接泄露。


技术实现要素:

4.本发明的目的在于提供一种面向电力业务场景的数据敏感度标定方法及系统,解决了现有技术中数据敏感度标定存在的上述不足;本发明在对电力业务数据进行敏感度标定保护的过程中,不仅考虑了数据的直接安全威胁,同时还考虑了数据之间的关联关系。
5.为了达到上述目的,本发明采用的技术方案是:
6.本发明提供的一种面向电力业务场景的数据敏感度标定方法,包括如下步骤:
7.步骤1,获取电力业务场景数据中需要进行敏感度标定的业务数据,所述业务数据包括电网数据、电网核企业数据和电力市场数据;
8.步骤2,判断该业务数据是否为首次进行敏感度标定,其中,若是首次进行敏感度标定,则进入步骤3,否则进入步骤6;
9.步骤3,确定该业务数据对应的数据节点集合;
10.步骤4,确定数据节点集合中每个数据节点对应的初始敏感度;
11.步骤5,构建数据关联关系图,并利用该数据关联关系图对每个数据节点对应的初始敏感度进行更新,直至每个数据节点对应的敏感度收敛;将更新得到的敏感度作为对应数据节点的最终敏感度;
12.步骤6,判断该业务数据中是否有新增数据节点,其中,若有新增节点则进入步骤3,否则进行步骤5。
13.优选地,步骤3中,数据节点包括:电网线路电抗、电网拓扑关联矩阵、电网导纳矩阵、电网动态参数节点注入功率和电压相角、功率传输分布因子矩阵、发电机报价和节点边际电价。
14.优选地,步骤4中,确定数据节点集合中每个数据节点对应的初始敏感度,具体方
法是:
15.分析确定每个数据节点对应的影响对象、影响范围和影响程度,得到影响对象集合、影响范围集合和影响程度集合;
16.采用模糊逻辑推理方法得到每个数据节点对应的初始敏感度。
17.优选地,采用模糊逻辑推理方法得到每个数据节点对应的初始敏感度,具体方法是:
18.将得到的影响对象集合、影响范围集合和影响程度集合进行模糊化处理,得到影响对象模糊集合、影响范围模糊集合和影响程度模糊集合;
19.分析确定每个数据节点分别在影响对象模糊集合、影响范围模糊集合和影响程度模糊集合的隶属度;
20.设定敏感数据集,且该敏感数据集中的元素为所有的数据节点;构建关于该敏感数据集的模糊规则库;
21.根据得到的模糊规则库,结合每个数据节点分别在影响对象模糊集合、影响范围模糊集合和影响程度模糊集合的隶属度,计算每个数据节点对敏感数据集的隶属度;
22.采用最大隶属度方法对得到的敏感数据集的隶属度进行去模糊化处理,最终得到每个数据节点对应的初始敏感度。
23.优选地,步骤5中,对每个数据节点对应的初始敏感度进行更新,具体方法是:
24.根据得到的每个数据节点对应的初始敏感度,构建数据关联关系图;
25.根据得到的数据关联关系图对每个数据节点对应的初始敏感度进行更新。
26.优选地,步骤5中,判断每个数据节点对应的敏感度是否收敛的具体方法是:
27.若每个数据节点对应的更新后的敏感度与更新前的敏感度之间的差值小于给定阈值,则视为收敛。
28.一种面向电力业务场景的数据敏感度标定系统,包括:
29.数据获取单元,用于获取电力业务场景数据中需要进行敏感度标定的业务数据,所述业务数据包括电网数据、电网核企业数据和电力市场数据;
30.数据判断单元,用于判断该业务数据是否为首次进行敏感度标定,其中,若是首次进行敏感度标定,则进入集合构建单元,否则进入条件选择单元;
31.集合构建单元,用于确定该业务数据对应的数据节点集合;
32.敏感度计算单元,用于确定数据节点集合中每个数据节点对应的初始敏感度;
33.敏感度更新单元,用于构建数据关联关系图,并利用该数据关联关系图对每个数据节点对应的初始敏感度进行更新,直至每个数据节点对应的敏感度收敛;将更新得到的敏感度作为对应数据节点的最终敏感度;
34.条件选择单元,用于判断该业务数据中是否有新增数据节点,其中,若有新增节点则进入集合构建单元,否则进行敏感度更新单元。
35.优选地,所述敏感度计算单元包括:
36.模糊化处理模块,用于将影响对象集合、影响范围集合和影响程度集合进行模糊化处理,得到影响对象模糊集合、影响范围模糊集合和影响程度模糊集合;
37.分析确定每个数据节点分别在影响对象模糊集合、影响范围模糊集合和影响程度模糊集合的隶属度;
38.模糊规则库构建单元,用于设定敏感数据集,且该敏感数据集中的元素为所有的数据节点;构建关于该敏感数据集的模糊规则库;
39.推理模块,用于根据得到的模糊规则库,结合每个数据节点分别在影响对象模糊集合、影响范围模糊集合和影响程度模糊集合的隶属度,计算每个数据节点对敏感数据集的隶属度;
40.去模糊化模块,用于采用最大隶属度方法对得到的敏感数据集的隶属度进行去模糊化处理,最终得到每个数据节点对应的初始敏感度。
41.与现有技术相比,本发明的有益效果是:
42.本发明提供的一种面向电力业务场景的数据敏感度标定方法,通过收集数据,建立敏感数据节点集合,然后对敏感数据节点采用基于模糊推理的数据敏感度一次标定,给每个数据对象赋予一个初始化的数据敏感度。然后构建数据关联关系图,并提出基于数据关联关系更新数据敏感度的方法,最终实现了对电力业务数据考虑数据关联关系下的敏感度标定。本发明不但考虑了先验知识和由数据间关联关系导致的安全风险,分级结果更加合理有效,还具有很好的拓展性,当先验知识、数据类型或数据间关联关系发生变化时,该方法可以很方便的修改分级结果。当发生由法规政策变化导致的对安全对象及数据类型的重视程度变化时,只需适当修改节点敏感程度初值;由电力业务系统发展导致的数据类型变化和由技术发展导致的数据间关联关系的变化,只需在构建关联关系图时适当增加或删除节点或边。
附图说明
43.图1是本发明流程图;
44.图2是基于模糊推理的数据敏感度标定流程图;
45.图3是一种电力场景中的数据关联关系图。
具体实施方式
46.为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
47.本发明提供的一种面向电力业务场景的数据敏感度标定方法,包括如下步骤:
48.s01:收集相关数据:
49.电力业务场景数据会随着时间发生变化,因此收集数据的工作是一个持续的过程。收集电力业务场景中需要敏感度标定的相关业务数据,转入s02处理,其中,相关数据具体包括电网数据、电网企业数据和电力市场数据;
50.s02:判断是否首次对数据进行敏感度标定:
51.如是,转入s03处理,如否,转入s10处理;
52.s03:敏感度标定对象确定:
53.根据收集到的数据,把每一个需要进行敏感度标定的对象看作一个数据节点,敏
感度标定对象确定以后,转入s04处理。
54.敏感度标定对象包括以下内容:电网线路电抗b,电网拓扑关联矩阵a,电网导纳矩阵b,电网动态参数节点注入功率和电压相角(p,θ),功率传输分布因子矩阵γ,发电机报价g
offer
,节点边际电价∏。一共7个对象,这些对象都被视作数据节点。其中1,2,

,7分别表示b,a,b,(p,θ),γ,g
offer
,π。
55.s04:电力数据安全影响对象、范围、程度分析:
56.根据s03得到了需要进行敏感度评估的数据对象,也就是数据节点。不同的数据节点的敏感度是不同的,需要根据各个数据节点是否会造成的安全威胁不同而进行分析,分析的主要内容包括各个数据节点对应的影响对象、影响范围和影响程度;分析完成后,转入s05处理。
57.本实施例中,对s03中的7个数据节点分析其影响对象、范围、程度进行分析,分析得到结论如表1所示:
58.表1电网数据节点影响分析
[0059][0060]
s05:基于模糊推理的数据敏感度一次标定:
[0061]
采用模糊逻辑推理的方法将s04中分析得出的各个数据节点对应的影响对象、影响范围和影响程度映射到各个数据节点的敏感度,转入s06处理;
[0062]
本实施例中,首先对数据节点的影响对象、影响范围、影响程度进行模糊化处理,得到影响对象、影响范围、影响程度三个模糊集合,三个模糊集合分别记作o,r,d,每个模糊集合的元素包括所有数据节点。
[0063]
确定各个数据节点在影响对象、影响范围、影响程度三个模糊集合当中的隶属度,如表2所示。
[0064]
表2电网数据节点影响分析
[0065][0066]
接下来构建模糊规则库:显然,如果影响对象所代表的集体越大,影响范围越大,影响程度越高,则该数据对应的敏感度也就应该越高。
[0067]
假设se表示敏感数据集,该敏感数据集的元素为全体数据节点,则可以构建如下模糊规则:
[0068]
模糊规则1:if v is o and v is d then v is se[0069]
模糊规则2:if v is r and v is d then v is se[0070]
接下来是推理方法:根据模糊规则,计算数据节点v对集合se的隶属度。
[0071]
根据模糊规则1,计算得到隶属度为
[0072]
根据模糊规则2,计算得到隶属度为
[0073]
接下来进行去模糊化:采用最大隶属度方法进行去模糊化,最终得到7个数据节点对敏感数据集合的隶属度为这些隶属度就是各个数据节点的敏感度,数据节点敏感初始化为
[0074]
s06:构建数据关联关系图:
[0075]
s05中已经得到了各个数据节点及其敏感度,本步骤将这些数据节点看作图网络中的节点,数据节点的敏感度看作该节点的属性,构建各个数据节点的关联关系图。两个数据节点间有边存在表明这两个数据之间有关联,两个数据节点边的权重表示这两个数据节点之间的关联程度,关联程度越大,边的权重也就越大。数据关联关系图构建完成后,转入s07处理。
[0076]
本实施例中,数据关联图的构建方法为:
[0077]
若节点a可以完全推断节点b,那么有一条从节点a指向节点b的边存在,并且边的权值取得最大值1;
[0078]
若节点a与节点b之间存在关联,但是节点a无法推断节点b,则节点a到节点b之间也有一条边;并且边的权值取值在0~1之间,具体取值大小根据a和b之间的关联性来确定;
具体而言,本实例中将边的权重分为从0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1.0十个等级,本实例当中的边的取值根据对电力业务场景的经验知识确定。
[0079]
若节点a和节点b之间无关联或者暂时无法确定节点a和节点b之间的关系,那么a和b之间没有边相连。
[0080]
上面7个节点的关联图构建过程如下:
[0081]
首先是节点b和节点b,节点b为导纳矩阵,节点h为线路电抗,导纳矩阵可以完全推断线路电抗,因此节点b存在指向节点b的边,权值为1,但是h需要结合电网拓扑才能推断导纳矩阵b,单独的b仅能推断较小的一部分导纳矩阵的信息,因此b存在指向b的边,假设边的权重取0.2;
[0082]
节点注入功率p和节点电压相角θ,节点导纳矩阵之间满足b关系p=bθ,因此根据p和θ可以唯一确定导纳矩阵b,故存在(p,θ)指向b且权重为1的边,而根据b无法完全确定(p,θ),故b存在一条指向(p,θ)的边,这里假设边的权重取0.5;
[0083]
节点导纳矩阵b可以唯一确定电网拓扑,也就可以唯一确定电网关联矩阵a,因此b存在一条指向a的权重为1的边,而a需要结合h才能唯一确定b,因此存在一条从a指向b的边权重,假设边的权重为0.5;
[0084]
同理,节点导纳矩阵b可以唯一确定分布因子矩阵γ,因此b存在一条指向γ的权重为1的边。γ不能唯一确定节点导纳矩阵b,但是可以大大降低b的不确定性,因此存在γ指向b的一条边,假设边的权重为0.9;
[0085]
分布因子矩阵γ可以唯一确定关联矩阵a,因此γ存在一条指向a的权重为1的边,而a无法唯一确定γ,但是可以大大降低γ的不确定性,a存在一条指向γ的边,假设权重为0.5;
[0086]
γ常用于计算节点边际电价∏,二者互相无法唯一确定,∏为γ中若干行的线性组合。因此二者之间都存在指向对方的边,但是权重都不为1。这里假设γ指向∏的边权重为0.6,∏指向γ的边的权重为0.3。
[0087]
节点边际电价∏的计算需要发电机报价g
offer
,但是二者互相不能唯一确定,这里假设∏指向g
offer
的权重为0.2,g
offer
指向∏的权重也为0.2。
[0088]
根据各条边和权重,构造关联关系图,如图3所示。
[0089]
根据关联关系图,可以写出关联矩阵
[0090][0091]
s07:根据数据关联关系图更新数据节点的敏感度:
[0092]
每个数据节点的敏感度由当前节点的敏感度以及邻居节点的敏感度共同决定,且当前节点的敏感度为本节点以及邻居节点敏感度的加权和。所有节点敏感度更新完成后,转入s08处理。
[0093]
本实施例中,根据敏感度更新公式可得:
[0094][0095]
s08:判断节点敏感度是否收敛:
[0096]
如果在s07中更新前后所有节点的敏感度并没有明显变化,说明敏感度已经收敛。具体为判断每个节点在s07中敏感度更新前后的差值是否小于给定阈值,如果小于给定阈值,则视为收敛。若节点敏感度收敛,转入s09处理,若节点敏感度不收敛,转入s07处理。
[0097]
本实施例中,在s08中假设判断是否收敛的阈值δ=0.01,由于||s
(1)-s
(0)
||1=0.74>δ,未满足收敛条件,转入s07。
[0098]
s07:根据关联关系更新数据节点敏感度:
[0099][0100]
计算完毕,转入s08。
[0101]
s08:计算得到||s
(2)-s
(1)
||1=0.06>δ,未满足收敛条件,转入s07。
[0102]
s07:根据关联关系更新数据节点敏感度:
[0103][0104]
计算完毕,转入s08。
[0105]
s08:计算得到||s
(3)-s
(2)
||1=0<δ,节点敏感度收敛。转入s09。
[0106]
s09:数据敏感度:
[0107]
此时数据敏感度已经完成标定,程序输出各个节点最终结果的数据敏感度。此时转入s01收集相关数据,等待下一次的数据敏感度标定。
[0108]
本实施例中,得到各个数据节点的敏感度为如表3所示,在考虑关联关系之后
[0109]
表3数据节点敏感度
[0110][0111]
分布因子矩阵γ的初始敏感度为0.8,但是因为分布因子矩阵γ到导纳矩阵b存在关联系数为0.9的边,而b的敏感度为1,因此更新γ的敏感度为0.9;
[0112]
关联矩阵a的初始敏感度为0.6,在第一次敏感度更新之后,γ的敏感度更新为0.9;而关联矩阵a到分布因子矩阵γ存在关联系数为0.7的边,因此关联矩阵a的敏感度在第二次敏感度更新中变为0.63。也就是说,敏感度传播链条为b

γ

a。这反映了存在潜在的从a

γ

b的威胁传播链条。
[0113]
(p,θ)的初始敏感度为0.6,但是从关联图中可以看出,根据(p,θ)可以直接完全推断导纳矩阵b,因此一旦(p,θ)泄露,将会直接导致导纳矩阵b泄露。因此(p,θ)的敏感度在考虑关联关系之后就有所提升。
[0114]
而节点边际电价∏在第一次敏感度更新中从0变为0.24,敏感度传播从γ

∏,而由于γ本身有可能造成导纳矩阵b的泄露,因此第一次敏感度传播中还存在b

γ的传播,在第二次敏感度更新中,节点边际电价∏在从0.24变为0.27,敏感度传播的链条为b

γ

∏,这说明有可能存在π

γ

b的推断链导致敏感数据b的泄露,并且这比∏

γ的造成的潜在威胁更大,因此最终选择0.27作为∏的敏感度。
[0115]
s10:判断是新增数据节点:
[0116]
若本次标定不是首次标定,需要判断此次标定有没有新增数据节点,判断方法为:
[0117]
检查本次数据敏感度标定的对象:检查本次标定的对象是否都在上一次标定的对象集合当中,其中,若本次标定的对象中有新增数据节点,则需要对新增加的数据节点进行影响对象、范围、程度分析,以及对这些数据节点的基于模糊推理的敏感度标定。因此,判断若有新增数据节点,转入s04,否则转入s06;
[0118]
步骤s03中,电力业务数据敏感度标定对象可能是最小数据类,也可能是最小数据类下具体的数据字段或者两者的组合。将研究不同数据分级对象对数据分级效果的影响,并提出合理有效的电力数据分级对象确定方法。数据敏感度标定对象在s03中确定之后将被视为一个整体,本发明中将其称为数据节点,该数据节点将最终仅有一个敏感度和一个安全等级。用表示所有这些数据节点,表示所有这些节点构成的集合。
[0119]
步骤s04中,将对各个数据节点的影响对象、范围、程度进行分析。电力行业数据一旦发生篡改、破坏、泄露或者非法获取、非法利用等安全事件,可能对国家安全、公共利益或者公民、组织的合法权益等对象造成不同范围和程度的侵损害。
[0120]
因此,将将数据影响对象分为国家安全、市场秩序、电网企业和电力用户。
[0121]
影响范围分为非常大、大、一般、非常小、小、无六个等级。
[0122]
影响程度分为非常严重、严重、一般、小、非常小、无六个等级。
[0123]
每个数据节点对应的影响对象、影响范围和影响程度判定根据相关法律法规,业内专家知识进行判定。
[0124]
步骤s05中模糊逻辑推理的方法将给定数据节点i的影响对象、范围、程度输入映射为电力数据敏感程度s(i)。所有节点的敏感度构成的向量记作
[0125]
模糊推理过程由4个模块组成,如图2所示。分别为模糊化、模糊规则库、推理方法和去模糊化。模糊化是指通过隶属度函数将精确的给定输入按照不同的隶属度映射到模糊集。这里模糊数据集包括影响对象、范围、程度,这三个模糊集合中的元素包括全体数据节点,隶属度的确定具有一定的主观性,需要根据具体情况而定,但是需要保证的是影响范围越大,对应的隶属度也就越大,如由于影响对象的大小从国家、电力市场、电力企业到电力用户逐渐递减。本发明中将不同的影响对象对应的隶属度设为1,0.8,0.4,0.2;影响范围从非常大到非常小对应的隶属度设为1,0.8,0.6,0.4,0.2,0。影响程度从非常严重到无对应的隶属度为1,0.8,0.6,0.4,0.2
[0126]
模糊规则库是由法规标准、专家知识等先验知识得到的模糊规则。
[0127]
推理方法是从模糊规则和给定输入对相关模糊集的隶属度得到模糊结论的方法。
[0128]
去模糊化是将定义在模糊集上的模糊结论转化为具体的、精确的输出的过程。
[0129]
通过模糊逻辑推理,可以基于模糊的、由自然语言描述的分类规则,将精确的影响
对象、范围、程度输入映射到给定的敏感程度上,该敏感程度将作为构建电力数据关联关系图的输入。步骤s05完成后,得到所有节点敏感度的一次标定矩阵,记作s
(0)

[0130]
步骤s06中构建数据关联关系图考虑了数据间关联关系。基于模糊逻辑推理的电力数据敏感程度分析虽然全面考虑了影响对象、范围、程度,但仍然面临两个问题:一是随着相关法规与政策的调整,对不同的数据类型和不同的安全问题及其影响对象的重视程度会发生变化,基于模糊逻辑推理的电力数据敏感程度标定方法不能够适应先验知识的变化进而调整电力数据的敏感程度。二是与其他行业不同,电力业务数据间具有较强的关联关系,通过一定方法可能通过一种或几种低风险的披露数据推导还原出高风险的保密数据,进而导致安全事件的发生。基于模糊逻辑推理的方法无法对因电力数据间关联关系导致的数据泄露和安全事件的风险进行有效评估。因此,在模糊逻辑推理的基础上,仍需要基于数据间关联关系挖掘的敏感程度二次标定。
[0131]
关联图用来表示,表示关联图中的各个节点,节点间的连线{n,m}表示连接节点n到节点m之间的连线。节点数量边的数量每个节点的属性为敏感度,其中第k个节点的敏感度为s(k)。定义节点i和节点j的关联性为r(i,j),当i=j时,r(i,j)=1,当节点i和节点j之间不存在边时,r(i,j)=0。节点i和节点j存在关联时,关联性r(i,j)介于(0,1]之间。
[0132]
如果根据节点i的数据可以完全确定节点j的数据,则说明数据i一旦泄露,数据j也已经泄露,因此此时关联性取得最大值,即r(i,j)=1,但是反之不一定成立,此时r(j,i)<1,因此两节点之间的关联关系具有有向性。根据关联关系,我们可以得到关联矩阵其中r
ij
=r(i,j)。
[0133]
作为本发明的一种改进,步骤s07中根据关联关系更新了数据节点的敏感度。如果说一个数据节点自身的敏感度并不高,但是其邻居节点的敏感度特别高,并且邻居节点与本节点关联关系较强,那么该节点也应该赋予较高的敏感度。则节点敏感度更新公式为:
[0134][0135]
其中是一种新的运算。假设定义如下:
[0136]
[y]
ij
=max{a
ik
·
x
kj
} k=1,2,
…m[0137]
作为本发明的进一步改进,步骤s7之后,需要判断敏感度更新是否收敛,具体方法为判断前后两次更新之后节点的敏感度之差是否小于一定的阈值。这里考虑所有节点敏感度向量s,若满足||s
(k)-s
(k-1)
||1<δ,则停止迭代。
[0138]
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施方式仅限于此,对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单的推演或替换都应当视为属于本发明所提交的权利要求书确定的专利保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献