一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

日志脱敏方法、装置、设备及存储介质与流程

2022-06-01 09:07:51 来源:中国专利 TAG:


1.本技术属于信息安全技术领域,尤其涉及一种日志脱敏方法、装置、设备及存储介质。


背景技术:

2.业务系统的日志中经常包含用户敏感信息,例如姓名、手机号、邮箱、住宅地址、办公地址、身份证号码等。如果这些敏感信息不做脱敏处理,可能会让一些别有用心的人员非法收集,进行倒卖,造成用户信息泄露,同时也会给公司声誉带来影响。所以在打印日志时需要对这些敏感信息进行脱敏处理。
3.目前,市面也有一些基于log4j2实现日志脱敏的脱敏工具,但是,由于log4j2中的patternlayout(布局器)类被声明为final,导致其无法被直接继承使用,所以现有技术人员就从patternlayout中复制出代码,新写到其他layout,再重新注册到log4j2中作为脱敏布局器,导致该操作代码重复,脱敏工具中代码量较大,制作脱敏工具的工程量较大;其次,当log4j2版本更新时,由于脱敏布局器中的代码与patternlayout中的代码是对应的,所以还需要手动对脱敏布局器进行更新,工作量较大。并且,市面上基于log4j2实现日志脱敏的脱敏工具脱敏规则比较单一,例如,只利用正则表达式对日志进行脱敏,但利用正则表达式只能对一些有规则的敏感词进行检测,不能识别无规则的敏感词,对敏感词的检测精度不高。


技术实现要素:

4.鉴于以上内容,本发明提供一种日志脱敏方法、装置、设备及存储介质,其目的在于解决现有技术中对敏感词的检测精度不高的技术问题。
5.为实现上述目的,本发明提供一种日志脱敏方法,该方法包括:
6.接收应用程序的日志打印请求,所述日志打印请求包括所述应用程序的原始日志;
7.根据所述日志打印请求以及所述布局器中的脱敏标识调用所述脱敏转换组件;
8.根据所述复合敏感探测组件对所述原始日志进行敏感信息探测,确定所述原始日志的敏感信息;
9.根据所述脱敏转换组件中的内容替换组件对所述敏感信息进行替换处理,得到脱敏后日志;
10.通过所述布局器输出所述脱敏后日志。
11.优选的,所述接收应用程序的日志打印请求,所述日志打印请求包括所述应用程序的原始日志之后,包括:
12.根据所述访问者身份标识确定所述敏感探测组件对应的探测逻辑,以及根据所述访问者身份信息确定所述内容替换组件对应的替换逻辑。
13.优选的,所述接收应用程序的日志打印请求,所述日志打印请求包括所述应用程
序的原始日志之前,包括:
14.接收脱敏转换组件注册指令;
15.根据所述脱敏转换组件注册指令将所述布局器中的原生布局表达组件替换为脱敏转换组件,并写入所述脱敏转换组件对应的脱敏标识。
16.优选的,所述根据所述复合敏感探测组件对所述原始日志进行敏感信息探测,确定所述原始日志的敏感信息,包括:
17.基于所述复合敏感探测组件中的关键词匹配敏感探测组件,确定所述原始日志是否存在与关键词数据库中对应的关键词;
18.若存在所述关键词,则从所述原始日志中提取与所述关键词对应的信息作为所述原始日志的敏感信息,以及;
19.基于所述复合敏感探测组件中的正则表达式敏感探测组件,根据正则表达式敏感探测组件中预设的正则表达式确定所述原始日志中是否存在对应的匹配数据;
20.若存在对应的匹配数据,则将所述对应的匹配数据确定为所述原始日志的敏感信息。
21.优选的,所述方法,还包括:
22.接收所述复合敏感探测组件的探测逻辑修改指令;
23.根据所述探测逻辑修改指令对所述复合敏感探测组件中的探测逻辑进行修改。
24.优选的,所述方法,包括:
25.接收所述内容替换组件的替换逻辑修改指令;
26.根据所述替换逻辑修改指令对所述脱敏转换组件中的替换逻辑进行修改。
27.优选的,所述通过所述布局器输出所述脱敏后日志,包括:
28.基于所述布局器对所述脱敏后日志进行封装处理;
29.向所述日志打印请求对应的客户端发送所述进行过封装处理的脱敏后日记。
30.为实现上述目的,本发明还提供一种日志脱敏装置,所述装置包括:
31.接收模块,用于接收应用程序的日志打印请求,所述日志打印请求包括所述应用程序的原始日志;
32.调用模块,用于根据所述日志打印请求以及所述布局器中的脱敏标识调用所述脱敏转换组件;
33.确定模块,用于根据所述复合敏感探测组件对所述原始日志进行敏感信息探测,确定所述原始日志的敏感信息;
34.替换模块,用于根据所述脱敏转换组件中的内容替换组件对所述敏感信息进行替换处理,得到脱敏后日志;
35.输出模块,用于通过所述布局器输出所述脱敏后日志。
36.为实现上述目的,本发明还提供一种电子设备,所述电子设备包括:
37.至少一个处理器;以及,
38.与所述至少一个处理器通信连接的存储器;其中,
39.所述存储器存储有可被所述至少一个处理器执行的程序,所述程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行所述日志脱敏方法。
40.为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储
介质存储有日志脱敏程序,所述日志脱敏程序被处理器执行时,实现所述日志脱敏方法的步骤。
41.本发明日志脱敏方法将log4j2日志框架中原生布局表达组件替换成本专利中的脱敏转换组件,当确定布局器中的布局表达式中使用了脱敏注册标识,则调用与脱敏注册标识对应的脱敏转换组件,通过脱敏转换组件中的敏感探测组件及内容替换组件对日志进行脱敏处理,从而实现日志中敏感信息的脱敏处理,保证了企业信息安全性的同时,减少了技术人员修改日志脱敏设备的工作量。
附图说明
42.为了更清楚地说明本技术的实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
43.图1为本发明电子设备较佳实施例的示意图;
44.图2为图1中日志脱敏装置较佳实施例的模块示意图;
45.图3为本发明日志脱敏方法较佳实施例的流程图;
46.本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
47.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用于解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
48.参照图1所示,为本发明电子设备1较佳实施例的示意图。
49.该电子设备1包括但不限于:存储器11、处理器12、显示器13及网络接口14。所述电子设备1通过网络接口14连接网络,获取原始数据。其中,所述网络可以是企业内部网(intranet)、互联网(internet)、全球移动通讯系统(global system of mobilecommunication,gsm)、宽带码分多址(wideband code division multiple access,wcdma)、4g网络、5g网络、蓝牙(bluetooth)、wi-fi通话网络等无线或有线网络。
50.其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器11可以是所述电子设备1的内部存储单元,例如该电子设备1的硬盘或内存。在另一些实施例中,所述存储器11也可以是所述电子设备1的外部存储设备,例如该电子设备1配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。
51.当然,所述存储器11还可以既包括所述电子设备1的内部存储单元也包括其外部存储设备。本实施例中,存储器11通常用于存储安装于所述电子设备1的操作系统和各类应用软件,例如日志脱敏程序10的程序代码等。此外,存储器11还可以用于暂时地存储已经输
出或者将要输出的各类数据。
52.处理器12在一些实施例中可以是中央处理器(central processing unit,cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述电子设备1的总体操作,例如执行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据,例如运行日志脱敏程序10的程序代码等。
53.显示器13可以称为显示屏或显示单元。在一些实施例中显示器13可以是led显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(organic light-emittingdiode,oled)触摸器等。显示器13用于显示在电子设备1中处理的信息以及用于显示可视化的工作界面,例如显示数据统计的结果。
54.网络接口14可选地可以包括标准的有线接口、无线接口(如wi-fi接口),该网络接口14通常用于在所述电子设备1与其它电子设备之间建立通信连接。
55.图1仅示出了具有组件11-14以及日志脱敏程序10的电子设备1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
56.可选地,所述电子设备1还可以包括目标用户接口,目标用户接口可以包括显示器(display)、输入单元比如键盘(keyboard),可选的目标用户接口还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是led显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(organic light-emitting diode,oled)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的目标用户界面。
57.该电子设备1还可以包括射频(radio frequency,rf)电路、传感器和音频电路等等,在此不再赘述。
58.在上述实施例中,处理器12执行存储器11中存储的日志脱敏程序10时可以实现如下步骤:
59.接收应用程序的日志打印请求,所述日志打印请求包括所述应用程序的原始日志;
60.根据所述日志打印请求以及所述布局器中的脱敏标识调用所述脱敏转换组件;
61.根据所述复合敏感探测组件对所述原始日志进行敏感信息探测,确定所述原始日志的敏感信息;
62.根据所述脱敏转换组件中的内容替换组件对所述敏感信息进行替换处理,得到脱敏后日志;
63.通过所述布局器输出所述脱敏后日志。
64.关于上述步骤的详细介绍,请参照下述图2关于日志脱敏装置100实施例的功能模块图以及图3关于日志脱敏方法实施例的流程图的说明。
65.参照图2所示,为本发明日志脱敏装置100的功能模块图。
66.本发明所述日志脱敏装置100可以安装于电子设备中。根据实现的功能,所述日志脱敏装置100可以包括:接收模块110、调用模块120、确定模块130、替换模块140及输出模块150。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
67.在本实施例中,关于各模块/单元的功能如下:
68.接收模块110,用于接收应用程序的日志打印请求,所述日志打印请求包括所述应用程序的原始日志;
69.具体为,应用程序调用日志脱敏设备中log4j2的应用程序接口(application program interface,api),请求log4j2打印日志。
70.在一些实施例中,日志访问者通过客户端向应用程序发送日志查询请求,然后该应用程序响应该日志查询请求向日志脱敏设备发送日志打印请求,使得日志脱敏设备接收到该日志打印请求。
71.在一些实施例中,该日志查询请求还携带有访问者身份标识,该访问者身份标识为客户端的标识信息,该客户端的标识信息可以为客户端id、也可以为用户登录的id,具体此处不做限定。
72.即,应用程序除了向日志脱敏设备发送原始日志之外,一起发送的还有上面提及的访问者身份标识。
73.此时,日志打印请求中还包括访问者身份标识,在一些实施例中,步骤s110之后,方法还包括:
74.根据所述访问者身份标识确定所述敏感探测组件对应的探测逻辑,以及根据所述访问者身份信息确定所述内容替换组件对应的替换逻辑。
75.本实施例中,当日志脱敏设备接收到访问者身份标识之后,根据预设的访问者身份标识与权限类型的对应关系确定访问者身份标识(访问用户)对应的权限类型,然后根据对应的权限类型,及预设的权限类型与探测逻辑的对应关系确定敏感探测组件对应的探测逻辑,以及根据对应的权限类型,及预设的权限类型与替换逻辑的对应关系确定内容替换组件对应的替换逻辑。
76.例如,该权限类型包括完全授权用户、部分授权用户或者完全限制用户,其中,若确定日志访问者为完全授权用户,则不对原始日志进行脱敏处理,此方法可以方便权威调查机关获取完整的日志信息,方便调查人员进行调查;若确定日志访问者为部分授权用户,则对原始日志中的部分敏感内容进行脱敏处理,例如,对于完全限制用户需要对姓名、手机号、邮箱、住宅地址、办公地址、身份证号码进行完全的限制,即屏蔽掉原始日志中涉及姓名、手机号、邮箱、住宅地址、办公地址、身份证号码的所有内容,而部分授权用户只需屏蔽掉预先设置好的部分内容即可,例如屏蔽身份证号码、手机号以及邮箱,以及在屏蔽(替换)时,可以只屏蔽敏感内容中的部分信息,例如身份证号码保留前2位以及后两位,姓名保留第一位,其他做替换处理等;而对于完全限制用户则需要找出原始日志中的所有敏感信息以及对所有的敏感信息都进行替换处理。
77.在一些实施例中,在接收模块110之前,还包括:
78.接收脱敏转换组件注册指令;
79.根据所述脱敏转换组件注册指令将所述布局器中的原生布局表达组件替换为脱敏转换组件,并写入所述脱敏转换组件对应的脱敏标识。
80.即,在设置有log4j2的脱敏设备启动之后,技术人员向该脱敏设备发送脱敏转换组件注册指令,将log4j2中的布局器中的原生布局表达组件被替换为脱敏转换组件,并写入所述脱敏转换组件对应的脱敏标识(%dsm)。具体地,该脱敏转换组件注册指令包括替换
的位置信息以及替换的内容,脱敏设备接收到脱敏转换组件注册指令之后,确定该位置信息对应的原始标识(%m),然后替换该原始标识对应的内容。
81.需要说明的是,后续再使用该脱敏设备进行日志脱敏时,可以直接调用注册好的log4j2,不需要再进行脱敏转换组件的注册。
82.调用模块120、用于根据所述日志打印请求以及所述布局器中的脱敏标识调用所述脱敏转换组件;
83.具体地,当日志脱敏设备接收到日志打印请求之后,将使用log4j2自带的布局器进行日志输出布局,此时,当在布局器中的布局表达式中发现脱敏标识%dsm,则脱敏设备调用该脱敏转换组件进行后续脱敏操作。
84.本实施例中,调用所述脱敏转换组件即确定后续进行布局表达的执行逻辑。
85.确定模块130、用于根据所述复合敏感探测组件对所述原始日志进行敏感信息探测,确定所述原始日志的敏感信息;
86.具体地,根据复合敏感探测组件中的正则表达式敏感探测组件以及关键词匹配敏感探测组件同时对原始日志进行敏感信息探测,其中,正则表达式敏感探测组件可以对有规则的敏感词进行探测,该组件包括多种探测逻辑,其中包括姓名探测逻辑、手机号探测逻辑、住宅地址探测逻辑、办公地址探测逻辑以及身份证号码探测逻辑等,关键词匹配敏感探测组件可以对无规则的敏感测进行探测,并且所述关键词匹配敏感探测组件对应的敏感词数据库与实时敏感词识别模型连接,该模型可以在互联网中发布的新闻等消息中识别出当下新的敏感词,并将该敏感词存至关键词数据库中。例如,该模型可以获取热度高于预设阈值的政治新闻,然后通过识别该政治新闻的关键词确定新的敏感词。
87.在一些实施例中,确定模块130具体包括:
88.基于所述复合敏感探测组件中的关键词匹配敏感探测组件,确定所述原始日志是否存在与关键词数据库中对应的关键词;
89.若存在所述关键词,则从所述原始日志中提取与所述关键词对应的信息作为所述原始日志的敏感信息,以及;
90.基于所述复合敏感探测组件中的正则表达式敏感探测组件,根据正则表达式敏感探测组件中预设的正则表达式确定所述原始日志中是否存在对应的匹配数据;
91.若存在对应的匹配数据,则将所述对应的匹配数据确定为所述原始日志的敏感信息。
92.其中,正则表达式敏感探测组件中预设的正则表达式包括姓名正则表达式、手机号正则表达式、邮箱正则表达式、住宅地址正则表达式、办公地址正则表达式和/或身份证号码正则表达式等,正则表达式的类型可以根据实际需求定制。
93.例如,使用(. )@(. \\.[a-za-z]{2,4})正则表达式规则描述敏感信息email的数据格式等。
[0094]
在一些实施例中,本发明可以针对不同的访问者定制不同的脱敏规则,例如,步骤s130包括:
[0095]
根据日志打印请求中的访问者身份标识确定复合敏感探测组件中的目标探测逻辑;
[0096]
根据所述目标探测逻辑对所述原始日志进行敏感信息探测。
[0097]
在一些实施例中,在注册好log4j2中的脱敏转换组件之后,方法还包括:
[0098]
接收所述复合敏感探测组件的探测逻辑修改指令;
[0099]
根据所述探测逻辑修改指令对所述复合敏感探测组件中的探测逻辑进行修改。
[0100]
例如,为了业务需要,技术人员要对日志脱敏设备中的复合敏感探测组件进行修改,则此时技术人员向脱敏设备发送探测逻辑修改指令,该探测逻辑修改指令包括待修改的位置信息,以及对该位置信息对应的位置进行修改的逻辑修改信息,该修改只需要对复合敏感探测组件中对应的位置上的探测逻辑进行修改,不需要对其他代码进行改动,方便技术人员进行修改。
[0101]
其中,对探测逻辑进行修改包括删除探测逻辑,增加探测逻辑以及对探测逻辑进行替换,具体可以根据具体的应用场景进行配置,其中,对探测逻辑进行修改包括对用户的敏感信息类型进行修改以及对敏感信息的识别逻辑进行修改。
[0102]
本实施例中的探测规则可以根据实际需要进行修改,解决现有技术中脱敏范围无法定制,以及脱敏范围无法定制导致的脱敏范围过大,导致的完全无法识别日志内容,不利于it技术人员排查问题,以及脱敏范围过小,敏感信息屏蔽得不够的问题。
[0103]
替换模块140、用于根据所述脱敏转换组件中的内容替换组件对所述敏感信息进行替换处理,得到脱敏后日志;
[0104]
本实施例中,具体地,根据内容替换组件中的替换逻辑对所述敏感信息进行替换处理,得到脱敏后日志。
[0105]
在一些实施例中,本实施例中的替换逻辑可配置化,即本实施例中,在注册好log4j2中的脱敏转换组件之后,还包括:
[0106]
接收所述内容替换组件的替换逻辑修改指令;
[0107]
根据所述替换逻辑修改指令对所述脱敏转换组件中的替换逻辑进行修改。
[0108]
例如,为了业务需要,技术人员要对日志脱敏设备中的脱敏转换组件进行修改,则此时技术人员向脱敏设备发送替换逻辑修改指令,该替换逻辑修改指令包括待修改的位置信息,以及对该位置信息对应的位置进行修改的逻辑修改信息,该修改只需要对脱敏转换组件中对应的位置上的替换逻辑进行修改,不需要对其他代码进行改动,方面技术人员进行修改。
[0109]
其中,内容替换组件的替换逻辑包括但不限于:替换、乱码、截断或加密等。
[0110]
以敏感信息中的部分位置用“*”替换敏感词为例进行说明,例如,将姓名敏感信息脱敏为“张*四”,身份证号信息脱敏为“4417***********239”,其中,脱敏信息中具体的脱敏位置以及脱敏规则均可根据实际应用业务定制,此处不做限定。
[0111]
输出模块150、用于通过所述布局器输出所述脱敏后日志。
[0112]
本实施例中,输出模块150具体包括:
[0113]
基于所述布局器对所述脱敏后日志进行封装处理;
[0114]
向所述日志打印请求对应的客户端发送所述进行过封装处理的脱敏后日记。
[0115]
具体地,日志打印请求还包括有客户端标识,本实施例中的日志脱敏设备根据该客户端标识确定对应的客户端,然后向该客户端发送进行过封装处理的脱敏后日记。
[0116]
日志脱敏方法将log4j2日志框架中原生布局表达组件替换成本专利中的脱敏转换组件,当确定布局器中的布局表达式中使用了脱敏注册标识,则调用与所述脱敏注册标
识对应的脱敏转换组件,通过脱敏转换组件中的敏感探测组件及内容替换组件对日志进行脱敏处理,从而实现日志中敏感信息的脱敏处理,保证了企业信息安全性的同时,减少了技术人员修改本专利中日志脱敏设备的工作量。
[0117]
此外,本发明还提供一种日志脱敏方法。参照图3所示,为本发明日志脱敏方法的实施例的方法流程示意图。电子设备1的处理器12执行存储器11中存储的日志脱敏程序10时,实现日志脱敏方法,包括步骤s101-s105。以下对各个步骤进行具体说明。
[0118]
s110、接收应用程序的日志打印请求,所述日志打印请求包括所述应用程序的原始日志;
[0119]
具体为,应用程序调用日志脱敏设备中log4j2的应用程序接口(application program interface,api),请求log4j2打印日志。
[0120]
在一些实施例中,日志访问者通过客户端向应用程序发送日志查询请求,然后该应用程序响应该日志查询请求向日志脱敏设备发送日志打印请求,使得日志脱敏设备接收到该日志打印请求。
[0121]
在一些实施例中,该日志查询请求还携带有访问者身份标识,该访问者身份标识为客户端的标识信息,该客户端的标识信息可以为客户端id、也可以为用户登录的id,具体此处不做限定。
[0122]
即,应用程序除了向日志脱敏设备发送原始日志之外,一起发送的还有上面提及的访问者身份标识。
[0123]
此时,日志打印请求中还包括访问者身份标识,在一些实施例中,步骤s110之后,方法还包括:
[0124]
根据所述访问者身份标识确定所述敏感探测组件对应的探测逻辑,以及根据所述访问者身份信息确定所述内容替换组件对应的替换逻辑。
[0125]
本实施例中,当日志脱敏设备接收到访问者身份标识之后,根据预设的访问者身份标识与权限类型的对应关系确定访问者身份标识(访问用户)对应的权限类型,然后根据对应的权限类型,及预设的权限类型与探测逻辑的对应关系确定敏感探测组件对应的探测逻辑,以及根据对应的权限类型,及预设的权限类型与替换逻辑的对应关系确定内容替换组件对应的替换逻辑。
[0126]
例如,该权限类型包括完全授权用户、部分授权用户或者完全限制用户,其中,若确定日志访问者为完全授权用户,则不对原始日志进行脱敏处理,此方法可以方便权威调查机关获取完整的日志信息,方便调查人员进行调查;若确定日志访问者为部分授权用户,则对原始日志中的部分敏感内容进行脱敏处理,例如,对于完全限制用户需要对姓名、手机号、邮箱、住宅地址、办公地址、身份证号码进行完全的限制,即屏蔽掉原始日志中涉及姓名、手机号、邮箱、住宅地址、办公地址、身份证号码的所有内容,而部分授权用户只需屏蔽掉预先设置好的部分内容即可,例如屏蔽身份证号码、手机号以及邮箱,以及在屏蔽(替换)时,可以只屏蔽敏感内容中的部分信息,例如身份证号码保留前2位以及后两位,姓名保留第一位,其他做替换处理等;而对于完全限制用户则需要找出原始日志中的所有敏感信息以及对所有的敏感信息都进行替换处理。
[0127]
在一些实施例中,在执行步骤s110之前,方法还包括:
[0128]
接收脱敏转换组件注册指令;
[0129]
根据所述脱敏转换组件注册指令将所述布局器中的原生布局表达组件替换为脱敏转换组件,并写入所述脱敏转换组件对应的脱敏标识。
[0130]
即,在设置有log4j2的脱敏设备启动之后,技术人员向该脱敏设备发送脱敏转换组件注册指令,将log4j2中的布局器中的原生布局表达组件被替换为脱敏转换组件,并写入所述脱敏转换组件对应的脱敏标识(%dsm)。具体地,该脱敏转换组件注册指令包括替换的位置信息以及替换的内容,脱敏设备接收到脱敏转换组件注册指令之后,确定该位置信息对应的原始标识(%m),然后替换该原始标识对应的内容。
[0131]
需要说明的是,后续再使用该脱敏设备进行日志脱敏时,可以直接调用注册好的log4j2,不需要再进行脱敏转换组件的注册。
[0132]
s120、根据所述日志打印请求以及所述布局器中的脱敏标识调用所述脱敏转换组件;
[0133]
具体地,当日志脱敏设备接收到日志打印请求之后,将使用log4j2自带的布局器进行日志输出布局,此时,当在布局器中的布局表达式中发现脱敏标识%dsm,则脱敏设备调用该脱敏转换组件进行后续脱敏操作。
[0134]
本实施例中,调用所述脱敏转换组件即确定后续进行布局表达的执行逻辑。
[0135]
s130、根据所述复合敏感探测组件对所述原始日志进行敏感信息探测,确定所述原始日志的敏感信息;
[0136]
具体地,根据复合敏感探测组件中的正则表达式敏感探测组件以及关键词匹配敏感探测组件同时对原始日志进行敏感信息探测,其中,正则表达式敏感探测组件可以对有规则的敏感词进行探测,该组件包括多种探测逻辑,其中包括姓名探测逻辑、手机号探测逻辑、住宅地址探测逻辑、办公地址探测逻辑以及身份证号码探测逻辑等,关键词匹配敏感探测组件可以对无规则的敏感测进行探测,并且所述关键词匹配敏感探测组件对应的敏感词数据库与实时敏感词识别模型连接,该模型可以在互联网中发布的新闻等消息中识别出当下新的敏感词,并将该敏感词存至关键词数据库中。例如,该模型可以获取热度高于预设阈值的政治新闻,然后通过识别该政治新闻的关键词确定新的敏感词。
[0137]
在一些实施例中,s130具体包括:
[0138]
基于所述复合敏感探测组件中的关键词匹配敏感探测组件,确定所述原始日志是否存在与关键词数据库中对应的关键词;
[0139]
若存在所述关键词,则从所述原始日志中提取与所述关键词对应的信息作为所述原始日志的敏感信息,以及;
[0140]
基于所述复合敏感探测组件中的正则表达式敏感探测组件,根据正则表达式敏感探测组件中预设的正则表达式确定所述原始日志中是否存在对应的匹配数据;
[0141]
若存在对应的匹配数据,则将所述对应的匹配数据确定为所述原始日志的敏感信息。
[0142]
其中,正则表达式敏感探测组件中预设的正则表达式包括姓名正则表达式、手机号正则表达式、邮箱正则表达式、住宅地址正则表达式、办公地址正则表达式和/或身份证号码正则表达式等,正则表达式的类型可以根据实际需求定制。
[0143]
例如,使用(. )@(. \\.[a-za-z]{2,4})正则表达式规则描述敏感信息email的数据格式等。
[0144]
在一些实施例中,本发明可以针对不同的访问者定制不同的脱敏规则,例如,步骤s130包括:
[0145]
根据日志打印请求中的访问者身份标识确定复合敏感探测组件中的目标探测逻辑;
[0146]
根据所述目标探测逻辑对所述原始日志进行敏感信息探测。
[0147]
在一些实施例中,在注册好log4j2中的脱敏转换组件之后,方法还包括:
[0148]
接收所述复合敏感探测组件的探测逻辑修改指令;
[0149]
根据所述探测逻辑修改指令对所述复合敏感探测组件中的探测逻辑进行修改。
[0150]
例如,为了业务需要,技术人员要对日志脱敏设备中的复合敏感探测组件进行修改,则此时技术人员向脱敏设备发送探测逻辑修改指令,该探测逻辑修改指令包括待修改的位置信息,以及对该位置信息对应的位置进行修改的逻辑修改信息,该修改只需要对复合敏感探测组件中对应的位置上的探测逻辑进行修改,不需要对其他代码进行改动,方便技术人员进行修改。
[0151]
其中,对探测逻辑进行修改包括删除探测逻辑,增加探测逻辑以及对探测逻辑进行替换,具体可以根据具体的应用场景进行配置,其中,对探测逻辑进行修改包括对用户的敏感信息类型进行修改以及对敏感信息的识别逻辑进行修改。
[0152]
本实施例中的探测规则可以根据实际需要进行修改,解决现有技术中脱敏范围无法定制,以及脱敏范围无法定制导致的脱敏范围过大,导致的完全无法识别日志内容,不利于it技术人员排查问题,以及脱敏范围过小,敏感信息屏蔽得不够的问题。
[0153]
s140、根据所述脱敏转换组件中的内容替换组件对所述敏感信息进行替换处理,得到脱敏后日志;
[0154]
本实施例中,具体地,根据内容替换组件中的替换逻辑对所述敏感信息进行替换处理,得到脱敏后日志。
[0155]
在一些实施例中,本实施例中的替换逻辑可配置化,即本实施例中,在注册好log4j2中的脱敏转换组件之后,方法还包括:
[0156]
接收所述内容替换组件的替换逻辑修改指令;
[0157]
根据所述替换逻辑修改指令对所述脱敏转换组件中的替换逻辑进行修改。
[0158]
例如,为了业务需要,技术人员要对日志脱敏设备中的脱敏转换组件进行修改,则此时技术人员向脱敏设备发送替换逻辑修改指令,该替换逻辑修改指令包括待修改的位置信息,以及对该位置信息对应的位置进行修改的逻辑修改信息,该修改只需要对脱敏转换组件中对应的位置上的替换逻辑进行修改,不需要对其他代码进行改动,方面技术人员进行修改。
[0159]
其中,内容替换组件的替换逻辑包括但不限于:替换、乱码、截断或加密等。
[0160]
以敏感信息中的部分位置用“*”替换敏感词为例进行说明,例如,将姓名敏感信息脱敏为“张*四”,身份证号信息脱敏为“4417***********239”,其中,脱敏信息中具体的脱敏位置以及脱敏规则均可根据实际应用业务定制,此处不做限定。
[0161]
s150、通过所述布局器输出所述脱敏后日志。
[0162]
本实施例中,步骤s150具体包括:
[0163]
基于所述布局器对所述脱敏后日志进行封装处理;
[0164]
向所述日志打印请求对应的客户端发送所述进行过封装处理的脱敏后日记。
[0165]
具体地,日志打印请求还包括有客户端标识,本实施例中的日志脱敏设备根据该客户端标识确定对应的客户端,然后向该客户端发送进行过封装处理的脱敏后日记。
[0166]
本专利中的日志脱敏方法将log4j2日志框架中原生布局表达组件替换成本专利中的脱敏转换组件,当确定布局器中的布局表达式中使用了脱敏注册标识,则调用与所述脱敏注册标识对应的脱敏转换组件,通过脱敏转换组件中的敏感探测组件及内容替换组件对日志进行脱敏处理,从而实现日志中敏感信息的脱敏处理,保证了企业信息安全性的同时,减少了技术人员修改本专利中日志脱敏设备的工作量。
[0167]
此外,本专利的技术实现方案具备普适性,只需要少量的配置替换就能够轻松实现日志脱敏,无需重写布局器,可以完全复用log4j2框架中自带的布局器,降低工作量。对于个性化的脱敏需求,本发明也提供了配置化、可程序扩展的手段来满足,例如,可以对敏感探测组件中的探测逻辑以及内容替换组件的替换逻辑进行修改。
[0168]
此外,由于本实施例中的脱敏转换组件的运作不依赖原生代码,是独立的部件,当log4j2需要风险时,本实施例中的脱敏转换组件不需要进行更新,所以对于日志脱敏设备更新工作量小,而现有技术中的脱敏代码是与布局器的代码对应的,所以当log4j2中的布局器需要更新的时候,现有技术中的脱敏代码需要技术人员手动同步代码,导致更新现有技术中的日志脱敏设备的工作量大。
[0169]
此外,本发明实施例还提出一种计算机可读存储介质,该计算机可读存储介质可以是硬盘、多媒体卡、sd卡、闪存卡、smc、只读存储器(rom)、可擦除可编程只读存储器(eprom)、便携式紧致盘只读存储器(cd-rom)、usb存储器等等中的任意一种或者几种的任意组合。所述计算机可读存储介质中包括存储数据区和存储程序区,存储数据区存储根据区块链节点的使用所创建的数据,存储程序区存储有日志脱敏程序10,所述日志脱敏程序10被处理器执行时,实现日志脱敏方法的操作。
[0170]
在另一个实施例中,本发明所提供的日志脱敏方法,为进一步保证上述所有出现的数据的私密和安全性,上述所有数据还可以存储于一区块链的节点中。
[0171]
需要说明的是,本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
[0172]
本发明之计算机可读存储介质的具体实施方式与上述日志脱敏方法的具体实施方式大致相同,在此不再赘述。
[0173]
需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语"包括"、"包含"或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句"包括一个
……
"限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
[0174]
需要说明的是,上述本发明实施例可以基于人工智能技术对相关的数据进行获取
和处理。其中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
[0175]
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
[0176]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用于使得一台电子设备(可以是手机,计算机,电子装置,或者网络设备等)执行本发明各个实施例所述的方法。
[0177]
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献