一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种数据的空间特征提取、识别方法及系统与流程

2022-02-20 20:11:54 来源:中国专利 TAG:


1.本发明涉及数据处理技术领域,具体涉及一种数据的空间特征提取、识别方法及系统。


背景技术:

2.在数字时代,电力行业由于存在公共服务业属性,拥有海量的高价值敏感数据,运用得当则能创造巨大的经济价值,但是如果敏感数据发生泄漏,将会导致严重的经济后果,因此加强电力敏感数据安全防护已成为业界共识。电力敏感数据精准高效的识别是安全防护的前提,然而电力敏感数据类型复杂,既包括一些生产运行数据,也包括一些客户敏感信息,数据内容特征千差万别,同样的数据在不同的业务场景下是否敏感的判定也不同。目前面向文件、图片等的数据内容或者敏感信息特征的识别方法较为成熟,但是没有考虑到业务场景,敏感识别误判率较高。例如同样一份用户信息,在用户档案里就属于敏感信息,不相关的人不应该具备访问权限,而作为会议通知联系人,就不是敏感信息,如果仅从数据内容特征判别,将会发生误判。


技术实现要素:

3.有鉴于此,本发明实施例提供了一种数据的空间特征提取、识别方法及系统,解决现有技术中对于敏感数据的识别没有考虑到业务场景的不同,仅从数据内容特征判别,导致识别误判率高的问题。
4.第一方面,本发明实施例提供了一种数据的空间特征提取方法,包括:获取历史数据的数据特性,根据所述数据特性构建数据空间特征模型;基于所述数据空间特征模型对所述历史数据进行空间特征提取,确定所述历史数据的空间特征,以形成历史数据空间特征库。
5.可选地,所述数据特性包括:数据属性、用户属性、操作属性及环境属性,所述获取历史数据的数据特性,包括:对所述历史数据的存储数据库进行数据分析,确定所述历史数据的数据属性;获取用户信息与访问权限的预设关系以及所述历史数据的访问用户信息,根据所述用户信息和所述预设关系确定对所述历史数据的访问权限,以确定所述历史数据的用户属性;获取操作所述历史数据的操作信息,以确定所述历史数据的操作属性;获取访问所述历史数据的用户的网关信息,以确定所述历史数据的环境属性。
6.第二方面,本发明实施例还提供了一种数据的识别方法,包括:获取当前电力数据,利用本实施例第一方面所述的数据的空间特征提取方法确定所述当前电力数据空间特征库;获取历史数据空间特征库,利用预设敏感数据特征及所述历史数据空间特征库,确定敏感数据空间特征库;将所述当前电力数据空间特征库与所述敏感数据空间特征库进行模运算,确定当前电力数据的识别结果。
7.可选地,所述获取历史数据空间特征库,利用预设敏感数据特征及所述历史数据空间特征库,确定敏感数据空间特征库,包括:获取敏感数据的预设规则;基于所述预设规
则对所述历史数据空间特征库进行筛选,确定敏感数据空间特征库。
8.可选地,所述将所述当前电力数据空间特征库与所述敏感数据空间特征库进行模运算,确定当前电力数据的识别结果,包括:对所述当前电力数据空间特征库与所述敏感数据空间特征库进行模运算,确定第一运算结果;当所述第一运算结果为零时,判定所述当前电力数据为敏感电力数据。
9.可选地,本发明实施例提供的数据的识别方法还包括:当所述第一运算结果不为零时,对所述当前电力数据空间特征库与所述历史数据空间特征库进行模运算,确定第二运算结果;当所述第二运算结果为零时,判定所述当前电力数据为常规电力数据。当所述第二运算结果不为零时,判定所述当前电力数据为新产生的电力数据;将所述新产生的电力数据添加至所述历史数据空间特征库。
10.第三方面,本发明实施例还提供了一种数据的空间特征提取系统,包括:模型构建模块,用于获取历史数据的数据特性,根据所述数据特性构建数据空间特征模型;提取模块,用于基于所述数据空间特征模型对所述历史数据进行空间特征提取,确定所述历史数据的空间特征,以形成历史数据空间特征库。
11.第四方面,本发明实施例还提供了一种数据的识别系统,包括:第一处理模块,用于获取当前电力数据,利用如本实施例第三方面所述的数据的空间特征提取系统确定所述当前电力数据空间特征库;第二处理模块,用于获取历史数据空间特征库,利用预设敏感数据特征及所述历史数据空间特征库,确定敏感数据空间特征库;第三处理模块,用于将所述当前电力数据空间特征库与所述敏感数据空间特征库进行模运算,确定当前电力数据的识别结果。
12.第五方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,从而执行本发明实施例第一方面或者第二方面提供的方法。
13.本发明实施例还提供了一种电子设备,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,用于所述计算机指令执行本发明实施例第一方面或者第二方面提供的方法。
14.本发明技术方案,具有如下优点:
15.1.本发明提供的数据的空间特征提取方法,通过构建数据空间特征模型实现对历史数据进行空间特征提取,确定历史数据的空间特征,以形成历史数据空间特征库;充分考虑的数据的应用场景、访问对象等敏感属性,构建了多维空间特征,进而保证了敏感数据的识别过程的完备性,保证了敏感数据的识别率。
16.2.本发明提供的数据的识别方法,通过构建当前电力数据空间特征库以及敏感数据空间特征库,进而确定当前电力数据的识别结果;解决了传统没有考虑数据的应用场景的敏感数据识别方法的识别准确率不高的难题,基于空间特征向量的匹配识别,实现了电力海量数据中敏感数据的精准识别,进而可支持电力敏感数据识别的自动化识别,提高识别效率,进而提高数据安全防护水平。
附图说明
17.为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的
附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
18.图1为本发明实施例中提供的数据的空间特征提取方法的流程图;
19.图2为本发明实施例提供的数据特性的示意图;
20.图3为本发明实施例提供的数据的识别方法的流程图;
21.图4为本发明实施例提供的数据的空间特征提取系统的模块组成示意图;
22.图5为本发明实施例提供的数据的识别系统的模块组成示意图;
23.图6为本发明实施例提供的数据的识别系统的交互过程的示意图;
24.图7为本发明实施例提供的计算机设备一个具体示例的组成图。
具体实施方式
25.下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
26.此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
27.本发明实施例提供一种数据的空间特征提取方法,该方法充分考虑的数据的应用场景、访问对象等敏感属性,构建了多维空间特征,进而适应了同样的数据在不同的业务场景下是否敏感的判定也不同的情况,解决了传统(例如仅通过数据内容特征进行敏感数据识别的方法等)、静态(没有考虑数据的应用场景、业务环境)的方法敏感数据识别准确率不高的难题,充分考虑的数据的应用场景、访问对象等敏感属性,构建了多维空间特征。例如同样一份用户信息,在用户档案里就属于敏感信息,不相关的人不应该具备访问权限,而作为会议通知联系人,就不是敏感信息,如果仅从数据内容特征判别,将会发生误判。
28.具体地,如图1所示,该数据的空间特征提取方法具体包括:
29.步骤s01:获取历史数据的数据特性,根据数据特性构建数据空间特征模型。
30.本实施例中,首先获取各个历史数据的数据特性,随即根据数据特性构建数据空间特征模型如图2所示,其中不同的虚线类型代表了不同的数据属性,即首先从数据特性,用户属性、数据属性、操作属性、环境属性等4个方面构建电力敏感数据空间特征模型,然后当访问者需要使用敏感数据时,实时采集这4个维度的属性特征,并通过空间特征匹配,确定和识别敏感数据。
31.步骤s02:基于数据空间特征模型对历史数据进行空间特征提取,确定历史数据的空间特征,以形成历史数据空间特征库。本实施例中,利用上述确定的数据空间特征模型对历史数据进行空间特征提取,确定出历史数据对应的各个空间特征,进而构建历史数据空间特征库,v={v1,v2,

,vn}。
32.本发明提供的数据的空间特征提取方法,通过构建数据空间特征模型实现对历史数据进行空间特征提取,确定历史数据的空间特征,以形成历史数据空间特征库;充分考虑的数据的应用场景、访问对象等敏感属性,构建了多维空间特征,进而保证了敏感数据的识别过程的完备性,保证了敏感数据的识别率。
33.在一具体实施例中,数据特性包括:数据属性、用户属性、操作属性及环境属性,执
行步骤s01的过程可以具体包括如下步骤:
34.具体地,采集的数据特征包括:数据属性、用户属性、操作属性、环境属性等四个方面的信息,记为其中表示数据属性,表示用户属性,表示操作属性,表示环境属性。其中数据属性应包括数据类型、数据内容特征、数据安全密级、数据拥有者、数据管理者、数据可访问时间、数据时效性等。用户属性应包括唯一用户身份id、所属组织单位、访问所处的网络位置、用户临时特权通行证等。操作属性应包括对数据可能进行的操作类型,如读取操作、增加操作、修改操作、删除操作等。环境属性应包括实际场景中数据具体的访问环境,如可能的访问业务、访问的地理位置、访问的使用时间等。
35.步骤s011:对历史数据的存储数据库进行数据分析,确定历史数据的数据属性。本发明实施例中,数据属性由定期或者事先对电力数据(历史数据)存储数据库分析获得,例如客户邮箱、地址属于客户信息的不同类型,也都有各自的内容特征关键字,数据安全密级、数据拥有者、数据管理者、数据可访问时间、数据时效性等信息可以通过数据库表的属性和描述获得。当访问某个数据库中的某张表的某个字段时,可同时通过上述方法采集到数据属性。
36.步骤s012:获取用户信息与访问权限的预设关系以及历史数据的访问用户信息,根据用户信息和预设关系确定对历史数据的访问权限,以确定历史数据的用户属性。
37.本发明实施例中,用户属性可由电力信息系统的权限控制系统中获得,当用户需要访问某个电力数据(业务数据)时,首先会通过有线或者无线的网络登录信息系统,信息系统会对用户的账号、密码、ip地址等进行鉴权,此时可采集唯一用户身份id、所属组织单位、访问所处的网络位置等用户属性;当用户需要访问超权限数据时,需要通过各级管理部门的审批才能或者临时权限,此时可采集用户临时特权通行证信息。
38.步骤s013:获取操作历史数据的操作信息,以确定历史数据的操作属性。在实际应用中,操作属性可由电力信息系统或者数据库服务器获取,当用户需要访问某个业务数据时,会通过电力信息系统进行数据读取操作、增加操作、修改操作、删除操作,此时可获取用户的操作属性;电力信息系统也会将相关操作发送给后台数据库服务器执行,此时可获取用户的操作属性。
39.步骤s14:获取访问历史数据的用户的网关信息,以确定历史数据的环境属性。本发明实施例中,环境属性可由用户的接入网络采集获取,当用户需要访问某个业务数据时,首先会通过有线或者无线的网络接入到电力信息网络边界网关,才能登录和使用相关系统,此时可采集到用户访问数据的所处地理位置、时间、ip地址、终端类型等信息,也可获取用户是通过专网、互联网、固网还是移动网络访问数据。
40.本发明提供的数据的空间特征提取方法,通过构建数据空间特征模型实现对历史数据进行空间特征提取,确定历史数据的空间特征,以形成历史数据空间特征库;充分考虑的数据的应用场景、访问对象等敏感属性,构建了多维空间特征,进而保证了敏感数据的识别过程的完备性,保证了敏感数据的识别率。
41.本发明实施例还提供了一种数据的识别方法,如图3所示,具体包括如下步骤:
42.步骤s1:获取当前电力数据,确定当前电力数据空间特征库。本实施例中,当电力
系统接收到访问请求时,确定此访问请求对应的需要访问的当前电力数据,然后利用上述的数据的空间特征提取方法确定当前电力数据空间特征库v’。
43.步骤s2:获取历史数据空间特征库,利用预设敏感数据特征及历史数据空间特征库,确定敏感数据空间特征库。其中获取的历史数据空间特征库是根据上述数据的空间特征提取方法确定的历史数据空间特征库。
44.步骤s3:将当前电力数据空间特征库与敏感数据空间特征库进行模运算,确定当前电力数据的识别结果。
45.本发明提供的数据的识别方法,通过构建当前电力数据空间特征库以及敏感数据空间特征库,进而确定当前电力数据的识别结果;解决了传统没有考虑数据的应用场景的敏感数据识别方法的识别准确率不高的难题,基于空间特征向量的匹配识别,实现了电力海量数据中敏感数据的精准识别,进而可支持电力敏感数据识别的自动化识别,提高识别效率,进而提高数据安全防护水平。
46.在一具体实施例中,执行上述步骤s2具体包括如下步骤:
47.步骤s21:获取敏感数据的预设规则。其中敏感数据的预设规则可以由安全人员和业务人员参照国家、行业和电力企业的相关敏感数据制度规范,梳理和定义电力敏感数据的特征,可以根据实际需求进行调整,本发明实施例并不以此为限。
48.步骤s22:基于预设规则对历史数据空间特征库进行筛选,确定敏感数据空间特征库。本实施例中,基于预设规则,从当前电力数据的数据属性出发,梳理和定义电力敏感数据的特征,进而对历史数据空间特征库进行筛选,完成初始的敏感数据空间特征库构建,电力的敏感数据空间特征库可记为vs={v
s1
,v
s2
,

,v
sn
},其中敏感数据空间特征库vs是历史数据空间特征库v的一个子集。
49.具体地,执行上述步骤s3具体还包括如下步骤:
50.步骤s31:对当前电力数据空间特征库与敏感数据空间特征库进行模运算,确定第一运算结果。
51.其中模运算多应用于程序编写中,模运算在数论和程序设计中都有着广泛的应用,从奇偶数的判别到素数的判别,从模幂运算到最大公约数的求法,无不充斥着模运算的身影。具体地,对当前电力数据空间特征库v’与敏感数据空间特征库vs进行模运算,确定第一运算结果可通过以下公式表示:
[0052][0053]
步骤s32:当第一运算结果为零时,判定当前电力数据为敏感电力数据。具体地,如果|v
′‑vs
|=0,即可判断当前访问的电力数据是敏感的。
[0054]
步骤s33:当第一运算结果不为零时,对当前电力数据空间特征库与历史数据空间特征库进行模运算,确定第二运算结果。具体地模运算方法与上述公式(1)一致,在此不再赘述。
[0055]
步骤s34:当第二运算结果为零时,判定当前电力数据为常规电力数据。如果|v
′‑vs
|≠0,但是|v
′‑
v|=0,即可判断当前访问的电力数据是不敏感的,即当前电力数据为常规电力数据。
[0056]
步骤s35:当第二运算结果不为零时,判定当前电力数据为新产生的电力数据。如
果|v
′‑vs
|≠0,而且|v
′‑
v|≠0,即可判断当前访问的电力数据是在新业务下产生的新的电力数据,进而可以通过新产生的电力数据对历史数据空间特征库进行更新,具体地可以通过实时产生即更新,也可以通过先存储定时对数据库进行更新的方式进行,本实施例并不以此为限。
[0057]
步骤s36:将新产生的电力数据添加至历史数据空间特征库。本实施例中,将新产生的电力数据纳入历史数据空间特征v中。然后由安全人员和业务人员参照国家、行业和电力企业的相关敏感数据制度规范,判断该数据是否敏感,如果敏感则纳入电力敏感数据特征库vs。
[0058]
本发明提供的数据的识别方法,通过构建当前电力数据空间特征库以及敏感数据空间特征库,进而确定当前电力数据的识别结果;解决了传统没有考虑数据的应用场景的敏感数据识别方法的识别准确率不高的难题,基于空间特征向量的匹配识别,实现了电力海量数据中敏感数据的精准识别,进而可支持电力敏感数据识别的自动化识别,提高识别效率,进而提高数据安全防护水平。
[0059]
本发明实施例还提供了一种数据的空间特征提取系统,如图4所示,该系统包括:
[0060]
模型构建模块01,用于获取历史数据的数据特性,根据数据特性构建数据空间特征模型。详细内容参见上述方法实施例中步骤s01的相关描述,在此不再赘述。
[0061]
提取模块02,用于基于数据空间特征模型对历史数据进行空间特征提取,确定历史数据的空间特征,以形成历史数据空间特征库。详细内容参见上述方法实施例中步骤s02的相关描述,在此不再赘述。
[0062]
通过上述各个模块组成部分的协同合作,本发明提供的数据的空间特征提取系统,通过构建数据空间特征模型实现对历史数据进行空间特征提取,确定历史数据的空间特征,以形成历史数据空间特征库;充分考虑的数据的应用场景、访问对象等敏感属性,构建了多维空间特征,进而保证了敏感数据的识别过程的完备性,保证了敏感数据的识别率。
[0063]
本发明实施例还提供了一种数据的识别系统,如图5所示,该系统包括:
[0064]
第一处理模块1,用于获取当前电力数据,利用如权利要求8的数据的空间特征提取系统确定当前电力数据空间特征库。详细内容参见上述方法实施例中步骤s1的相关描述,在此不再赘述。
[0065]
第二处理模块2,用于获取历史数据空间特征库,利用预设敏感数据特征及历史数据空间特征库,确定敏感数据空间特征库。详细内容参见上述方法实施例中步骤s2的相关描述,在此不再赘述。
[0066]
第三处理模块3,用于将当前电力数据空间特征库与敏感数据空间特征库进行模运算,确定当前电力数据的识别结果。详细内容参见上述方法实施例中步骤s3的相关描述,在此不再赘述。
[0067]
具体地,本实施例提供的数据的识别系统的交互过程如图6所示,在数据服务器、统一权限系统、电力业务系统及统一接入网关分别确定数据属性、用户属性、操作属性及环境属性,然后利用各个采集模块进行相应属性的采集后进行敏感数据空间特征库,最后进行敏感数据空间特征的匹配计算,确定出敏感数据后对电力业务系统的敏感数据进行精准的识别与维护。
[0068]
通过上述各个模块组成部分的协同合作,本发明提供的数据的识别系统,通过构
建当前电力数据空间特征库以及敏感数据空间特征库,进而确定当前电力数据的识别结果;解决了传统没有考虑数据的应用场景的敏感数据识别方法的识别准确率不高的难题,基于空间特征向量的匹配识别,实现了电力海量数据中敏感数据的精准识别,进而可支持电力敏感数据识别的自动化识别,提高识别效率,进而提高数据安全防护水平。
[0069]
本发明实施例提供一种计算机设备,如图7所示,包括:至少一个处理器401,例如cpu(central processing unit,中央处理器),至少一个通信接口403,存储器404,至少一个通信总线402。其中,通信总线402用于实现这些组件之间的连接通信。其中,通信接口403可以包括显示屏(display)、键盘(keyboard),可选通信接口403还可以包括标准的有线接口、无线接口。存储器404可以是高速ram存储器(ramdom access memory,易挥发性随机存取存储器),也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器404可选的还可以是至少一个位于远离前述处理器401的存储装置。其中处理器401可以执行数据的空间特征提取方法或者数据的识别方法。存储器404中存储一组程序代码,且处理器401调用存储器404中存储的程序代码,以用于执行上述的数据的空间特征提取方法或者数据的识别方法。
[0070]
其中,通信总线402可以是外设部件互连标准(peripheral component interconnect,简称pci)总线或扩展工业标准结构(extended industry standard architecture,简称eisa)总线等。通信总线402可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条线表示,但并不表示仅有一根总线或一种类型的总线。
[0071]
其中,存储器404可以包括易失性存储器(英文:volatile memory),例如随机存取存储器(英文:random-access memory,缩写:ram);存储器也可以包括非易失性存储器(英文:non-volatile memory),例如快闪存储器(英文:flash memory),硬盘(英文:hard disk drive,缩写:hdd)或固降硬盘(英文:solid-state drive,缩写:ssd);存储器404还可以包括上述种类的存储器的组合。
[0072]
其中,处理器401可以是中央处理器(英文:central processing unit,缩写:cpu),网络处理器(英文:network processor,缩写:np)或者cpu和np的组合。
[0073]
其中,处理器401还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(英文:application-specific integrated circuit,缩写:asic),可编程逻辑器件(英文:programmable logic device,缩写:pld)或其组合。上述pld可以是复杂可编程逻辑器件(英文:complex programmable logic device,缩写:cpld),现场可编程逻辑门阵列(英文:field-programmable gate array,缩写:fpga),通用阵列逻辑(英文:generic array logic,缩写:gal)或其任意组合。
[0074]
可选地,存储器404还用于存储程序指令。处理器401可以调用程序指令,实现如本技术的数据的空间特征提取方法或者数据的识别方法。
[0075]
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机可执行指令,该计算机可执行指令可执行数据的空间特征提取方法或者数据的识别方法。其中,存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)、随机存储记忆体(random access memory,ram)、快闪存储器(flash memory)、硬盘(hard disk drive,缩写:hdd)或固降硬盘(solid-state drive,ssd)等;存储介质还可以包括上述种类的存储器的组合。
[0076]
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献