一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于树状结构的数据脱敏处理方法和系统与流程

2022-02-22 05:23:47 来源:中国专利 TAG:


1.本技术涉及到数据库处理领域,具体而言,涉及一种基于树状结构的数据脱敏处理方法和系统。


背景技术:

2.敏感数据是指泄漏后可能会给社会或个人带来严重危害的数据。包括个人隐私数据,如姓名、身份证号码、住址、电话、银行账号、邮箱、密码、医疗信息、教育背景等;也包括企业或社会机构不适合公布的数据,如企业的经营情况,企业的网络结构、ip地址列表等。
3.在数据进行脱敏处理中,可以根据数据内容来进行脱敏,例如在判断出预定字段下的多条数据进行脱敏时,对每条数据均进行整体脱敏处理,这种处理的方式,没有考虑到每条数据中内在的关系,从而导致脱敏后的数据存在问题。例如,xx省xx市xx区xx路xx号,在进行脱敏处理后,很有可能变成xx区xx省xx号xx区,这造成了脱敏后的数据的混乱。
4.针对该问题,在现有技术中没有提供合适的解决方案。


技术实现要素:

5.本技术实施例提供了一种基于树状结构的数据脱敏处理方法和系统,以至少解决现有技术中没有按照数据内容本身进行脱敏所导致的数据脱敏后混乱的问题。
6.根据本技术的一个方面,提供了一种基于树状结构的数据脱敏处理方法,包括:获取多条数据,其中,所述多条数据中的每一条数据均为待脱敏数据;获取所述每条数据中的数据内容,将所述数据内容划分为多个部分,其中,所述多个部分存在逻辑关系;将所述数据内容中多个部分中的每个部分进行脱敏;将脱敏后的每个部分按照所述逻辑关系连接起来,得到每条数据对应的脱敏后的内容。
7.进一步地,将所述数据内容划分为所述多个部分包括:在所述数据内容为地址的情况下,按照所述地址的区域范围大小将所述地址分为多个部分。
8.进一步地,将所述数据内容划分为所述多个部分包括:在所述数据内容为身份证号码的情况下,按照所述身份证号码中的出生日期将所述身份证号码划分为三个部分。
9.进一步地,在获取所述多条数据之前,所述方法还包括:接收到数据库查询请求,其中,所述数据库查询请求用于请求获取多条数据;确定所述多条数据为需要进行脱敏处理的数据。
10.进一步地,确定所述多条数据为需要进行脱敏处理的数据包括:从所述多条数据抽取预定数量的数据,根据所述预定数量的数据确定所述多条数据为需要进行脱敏处理的数据。
11.根据本技术的另一个方面,还提供了一种基于树状结构的数据脱敏处理系统,包括:获取模块,用于获取多条数据,其中,所述多条数据中的每一条数据均为待脱敏数据;划分模块, 用于获取所述每条数据中的数据内容,将所述数据内容划分为多个部分,其中,所述多个部分存在逻辑关系;脱敏模块,用于将所述数据内容中多个部分中的每个部分进行
脱敏;连接模块,用于将脱敏后的每个部分按照所述逻辑关系连接起来,得到每条数据对应的脱敏后的内容。
12.进一步地,所述划分模块用于:在所述数据内容为地址的情况下,按照所述地址的区域范围大小将所述地址分为多个部分。
13.进一步地,所述划分模块用于:在所述数据内容为身份证号码的情况下,按照所述身份证号码中的出生日期将所述身份证号码划分为三个部分。
14.进一步地,在获取所述多条数据之前,还包括:确定模块,用于接收到数据库查询请求,其中,所述数据库查询请求用于请求获取多条数据;确定所述多条数据为需要进行脱敏处理的数据。
15.进一步地,所述确定模块用于:从所述多条数据抽取预定数量的数据,根据所述预定数量的数据确定所述多条数据为需要进行脱敏处理的数据。
16.在本技术实施例中,采用了获取多条数据,其中,所述多条数据中的每一条数据均为待脱敏数据;获取所述每条数据中的数据内容,将所述数据内容划分为多个部分,其中,所述多个部分存在逻辑关系;将所述数据内容中多个部分中的每个部分进行脱敏;将脱敏后的每个部分按照所述逻辑关系连接起来,得到每条数据对应的脱敏后的内容。通过本技术解决了现有技术中没有按照数据内容本身进行脱敏所导致的数据脱敏后混乱的问题,从而保证了脱敏后的数据内容的逻辑正确,有利于对脱敏后的数据进行进一步处理。
附图说明
17.构成本技术的一部分的附图用来提供对本技术的进一步理解,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:图1是根据本技术实施例的基于树状结构的数据脱敏处理方法的流程图。
具体实施方式
18.需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本技术。
19.需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
20.在本实施例中提供了一种基于树状结构的数据脱敏处理方法,图1是根据本技术实施例的基于树状结构的数据脱敏处理方法的流程图,如图1所示,该流程包括如下步骤:步骤s102,获取多条数据,其中,所述多条数据中的每一条数据均为待脱敏数据;步骤s104,获取所述每条数据中的数据内容,将所述数据内容划分为多个部分,其中,所述多个部分存在逻辑关系;作为一个可选的实施方式,将所述多个部分的逻辑关系做成一个树状结构,所述树状结构包括根节点和树枝节点,例如,省市县区划用树状结构来进行匹配,例如,河南-洛阳-a区-b小区(还有c小区),是一个树干两个树杈b小区和c小区,这种树状结构执行速度比较快。
21.例如,在所述数据内容为地址的情况下,按照所述地址的区域范围大小将所述地
址分为多个部分。又例如,在所述数据内容为身份证号码的情况下,按照所述身份证号码中的出生日期将所述身份证号码划分为三个部分。
22.作为另一个可选的实施方式,还可以使用基于神经网络的机器学习模型将所述数据内容划分为多个部分,该机器学习模型是使用多组训练数据训练得到的,每组训练数据均包括输入数据和输出数据,其中,输入数据是一个座位整体的数据内容,输出数据是划分好树状结构的数据内容,在训练之后,将本步骤中的每条数据的数据内容输入到该机器学习模型中,则可以得到划分好树状结构的数据内容。该方式被称为方式一。
23.或者,还可以根据预先配置好的字典,该字典用于指示识别预定内容,将识别出的预定内容配置在树状结构的预定位置。在配置好带有多个关键字的字典之后,用来识别关键字,将包括所述关键字的部分配置在所述树状结构的预定位置。该方式被称作是方式二。
24.判断通过方式一和方式二得到的树状结构是否相同,如果相同则确认使用该树状结构,如果不相同,则使用人工输入的树状结构。
25.步骤s106,将所述数据内容中多个部分中的每个部分进行脱敏;作为一个可选的实施方式,脱敏处理的方式有很多种,例如,获取待脱敏数据对应的分类,其中,每种分类均对应一张或多张码表,所述码表用于指示对待脱敏数据进行脱敏时的字符替换规则;根据预定条件从该待脱敏数据对应的一张或多张码表中选择用于对所述待脱敏数据进行脱敏处理的第一码表,其中,所述预定条件为预先配置的,所述预定条件用于根据所述待脱敏数据的特征从所述一张或多张码表中选择出所述第一码表;建立并保存所述待脱敏数据与脱敏使用的所述第一码表之间的对应关系;使用所述第一码表对所述待脱敏数据进行脱敏。可选地,获取待脱敏数据对应的分类包括:从数据库中读取所述待脱敏数据,并获取所述待脱敏数据所在的字段;根据所述脱敏数据所在的字段的信息确定所述待脱敏数据对应的分类。
26.步骤s108,将脱敏后的每个部分按照所述逻辑关系连接起来,得到每条数据对应的脱敏后的内容。
27.通过本技术解决了现有技术中没有按照数据内容本身进行脱敏所导致的数据脱敏后混乱的问题,从而保证了脱敏后的数据内容的逻辑正确,有利于对脱敏后的数据进行进一步处理。
28.可选地,在获取所述多条数据之前,所述方法还包括:接收到数据库查询请求,其中,所述数据库查询请求用于请求获取多条数据;确定所述多条数据为需要进行脱敏处理的数据。例如,确定所述多条数据为需要进行脱敏处理的数据包括:从所述多条数据抽取预定数量的数据,根据所述预定数量的数据确定所述多条数据为需要进行脱敏处理的数据。抽取方法有很多种,可以采用如下抽取方法:获取数据库预定字段下的数据量;根据所述数据量将所述预定字段下数据分为多个区间,其中,所述多个区间中的每个区间包括多条数据;从所述每个区间中抽取预定条数的数据;将在所有区间抽取到的数据进行汇总得到待处理数据;对所述待处理数据进行脱敏发现,确定所述预定字段下的数据是否为敏感数据。
29.可选地,以第一预定步长从所述每个区域中抽取预定条数据的数据,其中,所述每个区间对应的第一预定步长的数据相同或者不同。可选地,从所述每个区间中抽取预定条数的数据包括:在所述每个区间内随机获取第一条抽取的数据,以所述第一条抽取的数据
为首条数据按照每个区间是对应的第一预定步长从所述每个区间中抽出预定条数的数据。
30.在本实施例中,提供一种电子装置,包括存储器和处理器,存储器中存储有计算机程序,处理器被设置为运行计算机程序以执行以上实施例中的方法。
31.上述程序可以运行在处理器中,或者也可以存储在存储器中(或称为计算机可读介质),计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存 (pram)、静态随机存取存储器 (sram)、动态随机存取存储器 (dram)、其他类型的随机存取存储器 (ram)、只读存储器 (rom)、电可擦除可编程只读存储器 (eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器 (cd-rom)、数字多功能光盘 (dvd) 或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体 (transitory media),如调制的数据信号和载波。
32.这些计算机程序也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤,对应与不同的步骤可以通过不同的模块来实现。
33.该本实施例中就提供了这样的一种装置或系统。该系统被称为基于树状结构的数据脱敏处理系统,包括:获取模块,用于获取多条数据,其中,所述多条数据中的每一条数据均为待脱敏数据;划分模块, 用于获取所述每条数据中的数据内容,将所述数据内容划分为多个部分,其中,所述多个部分存在逻辑关系;脱敏模块,用于将所述数据内容中多个部分中的每个部分进行脱敏;连接模块,用于将脱敏后的每个部分按照所述逻辑关系连接起来,得到每条数据对应的脱敏后的内容。
34.该系统或者装置用于实现上述的实施例中的方法的功能,该系统或者装置中的每个模块与方法中的每个步骤相对应,已经在方法中进行过说明的,在此不再赘述。
35.例如,所述划分模块用于:在所述数据内容为地址的情况下,按照所述地址的区域范围大小将所述地址分为多个部分。或者,所述划分模块用于:在所述数据内容为身份证号码的情况下,按照所述身份证号码中的出生日期将所述身份证号码划分为三个部分。
36.又例如,在获取所述多条数据之前,还包括:确定模块,用于接收到数据库查询请求,其中,所述数据库查询请求用于请求获取多条数据;确定所述多条数据为需要进行脱敏处理的数据。可选地,所述确定模块用于:从所述多条数据抽取预定数量的数据,根据所述预定数量的数据确定所述多条数据为需要进行脱敏处理的数据。
37.通过本技术解决了现有技术中没有按照数据内容本身进行脱敏所导致的数据脱敏后混乱的问题,从而保证了脱敏后的数据内容的逻辑正确,有利于对脱敏后的数据进行进一步处理。
38.以上仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的权利要求范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献