一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

日志脱敏方法、装置、计算机设备及存储介质与流程

2021-12-01 00:54:00 来源:中国专利 TAG:


1.本发明涉及人工智能技术领域,尤其涉及一种日志脱敏方法、装置、计算 机设备及存储介质。


背景技术:

2.业务系统的日志中经常包含用户敏感信息,例如姓名、手机号、邮箱、住 宅地址、办公地址、身份证号码等。如果这些敏感信息不做脱敏处理,可能会 让一些别有用心的人员非法收集,进行倒卖,造成用户信息泄露,同时也会给 公司声誉带来影响,所以在打印日志时需要对这些敏感信息进行脱敏处理。
3.市面上日志框架的脱敏工具脱敏规则比较单一,并且更新脱敏规则的敏感 词库时需要重新发布程序,由于敏感词会根据社会热点的变化而变化,若长时 间不对脱敏工具的程序进行更新,则后续很可能会因为敏感词库中收录敏感词 不够及时,而导致日志脱敏不彻底的问题发生,日志的脱敏精度不够高。


技术实现要素:

4.本发明实施例提供了一种日志脱敏方法、装置、计算机设备及存储介质, 可以提高日志的脱敏精度。
5.第一方面,本发明实施例提供了一种日志脱敏方法,其包括:
6.获取目标应用程序的日志打印请求;
7.根据所述日志打印请求获取所述目标应用程序的待脱敏日志;
8.根据预设的布局器的布局表达式中的脱敏标识确定所述待脱敏日志的脱敏 转换组件,所述脱敏转换组件包括复合敏感探测组件、内容替换组件以及敏感 词实时更新模型;
9.通过所述敏感词实时更新模型从互联网中获取负面热点新闻的关键词,并 根据所述关键词更新所述复合敏感探测组件的敏感词库,得到更新后的复合敏 感探测组件,所述更新后的复合敏感探测组件包括更新后的敏感词库;
10.根据所述更新后的复合敏感探测组件对所述待脱敏日志进行敏感信息探 测,得到所述待脱敏日志的目标敏感信息;
11.根据所述内容替换组件对所述目标敏感信息进行替换处理,得到脱敏后日 志;
12.通过所述布局器输出所述脱敏后日志。
13.第二方面,本发明实施例还提供了一种日志脱敏装置,其包括:
14.第一获取单元,用于获取目标应用程序的日志打印请求;
15.第二获取单元,用于根据所述日志打印请求获取所述目标应用程序的待脱 敏日志;
16.确定单元,用于根据预设的布局器的布局表达式中的脱敏标识确定所述待 脱敏日志的脱敏转换组件,所述脱敏转换组件包括复合敏感探测组件、内容替 换组件以及敏感
词实时更新模型;
17.更新单元,用于通过所述敏感词实时更新模型从互联网中获取负面热点新 闻的关键词,并根据所述关键词更新所述复合敏感探测组件的敏感词库,得到 更新后的复合敏感探测组件,所述更新后的复合敏感探测组件包括更新后的敏 感词库;
18.探测单元,用于根据所述更新后的复合敏感探测组件对所述待脱敏日志进 行敏感信息探测,得到所述待脱敏日志的目标敏感信息;
19.第一替换单元,用于根据所述内容替换组件对所述目标敏感信息进行替换 处理,得到脱敏后日志;
20.输出单元,用于通过所述布局器输出所述脱敏后日志。
21.第三方面,本发明实施例还提供了一种计算机设备,其包括存储器及处理 器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现 上述方法。
22.第四方面,本发明实施例还提供了一种计算机可读存储介质,所述存储介 质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理 器执行时可实现上述方法。
23.本发明实施例提供了一种日志脱敏方法、装置、计算机设备及存储介质。 其中,所述方法包括:获取目标应用程序的日志打印请求;根据所述日志打印 请求获取所述目标应用程序的待脱敏日志;根据预设的布局器的布局表达式中 的脱敏标识确定所述待脱敏日志的脱敏转换组件,所述脱敏转换组件包括复合 敏感探测组件、内容替换组件以及敏感词实时更新模型;通过所述敏感词实时 更新模型从互联网中获取负面热点新闻的关键词,并根据所述关键词更新所述 复合敏感探测组件的敏感词库,得到更新后的复合敏感探测组件,所述更新后 的复合敏感探测组件包括更新后的敏感词库;根据所述更新后的复合敏感探测 组件对所述待脱敏日志进行敏感信息探测,得到所述待脱敏日志的目标敏感信 息;根据所述内容替换组件对所述目标敏感信息进行替换处理,得到脱敏后日 志;通过所述布局器输出所述脱敏后日志。本方案中的敏感词库可以通过敏感 词实时更新模型进行实时更新,所以可以减少由于敏感词库中收录敏感词不够 及时,而导致日志脱敏不彻底的问题发生,提高日志的脱敏精度。
附图说明
24.为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要 使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实 施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以 根据这些附图获得其他的附图。
25.图1为本发明实施例提供的日志脱敏方法的应用场景示意图;
26.图2为本发明实施例提供的日志脱敏方法的流程示意图;
27.图3为本发明实施例提供的日志脱敏方法的子流程示意图;
28.图4为本发明实施例提供的日志脱敏装置的示意性框图;
29.图5为本发明另一实施例提供的日志脱敏装置的示意性框图;
30.图6为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
31.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清 楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部 的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳 动前提下所获得的所有其他实施例,都属于本发明保护的范围。
32.应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含
”ꢀ
指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个 或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
33.还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施 例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使 用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该
”ꢀ
意在包括复数形式。
34.还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/ 或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包 括这些组合。
35.本发明实施例提供了一种日志脱敏方法、装置、计算机设备及存储介质。
36.该日志脱敏方法的执行主体可以是本发明实施例提供的日志脱敏装置,或 者集成了该日志脱敏装置的计算机设备,其中,该日志脱敏装置可以采用硬件 或者软件的方式实现,该计算机设备可以为终端或服务器,该终端可以是智能 手机、平板电脑、掌上电脑、或者笔记本电脑等。
37.请参阅图1,图1为本发明实施例提供的日志脱敏方法的应用场景示意图。 该日志脱敏方法应用于图1中的计算机设备10中,该计算机设备10获取来终 端20的目标应用程序的日志打印请求;根据所述日志打印请求获取所述目标应 用程序的待脱敏日志;根据预设的布局器的布局表达式中的脱敏标识确定所述 待脱敏日志的脱敏转换组件,所述脱敏转换组件包括复合敏感探测组件、内容 替换组件以及敏感词实时更新模型;通过所述敏感词实时更新模型从互联网中 获取负面热点新闻的关键词,并根据所述关键词更新所述复合敏感探测组件的 敏感词库,得到更新后的复合敏感探测组件,所述更新后的复合敏感探测组件 包括更新后的敏感词库;根据所述更新后的复合敏感探测组件对所述待脱敏日 志进行敏感信息探测,得到所述待脱敏日志的目标敏感信息;根据所述内容替 换组件对所述目标敏感信息进行替换处理,得到脱敏后日志;通过所述布局器 输出所述脱敏后日志。
38.首先对本实施例中的一些名词进行解释:
39.日志,特指程序日志或系统日志,一般包含时间、运行代码、业务信息、 错误信息等等内容,能够辅助it技术人员、运营人员分析定位系统问题。
40.log4j2,是java领域十分常用的日志框架,因其功能强大、性能突出而占 有较大市场。
41.布局器(patternlayout),位于日志框架中,可以通过设置patternlayout 的转换样式属性值来控制具体输出的格式。
42.%m:为patternlayout中布局表达式中的一个原生标识,用于输出代码中指 定的消息。
43.本实施例提供了一种日志脱敏方法,该方法的执行主体可以是与该方法对 应的日志脱敏装置,或者集成了该日志脱敏装置的日志脱敏设备,其中,该日 志脱敏装置可以
采用硬件或者软件的方式实现,该日志脱敏设备可以包括服务 器或终端,该终端可以是智能手机、平板电脑、掌上电脑、或者笔记本电脑等。
44.在一些实施例中,本实施例中的日志脱敏方法可以基于log4j2实现,即本 实施例中布局器所对应的日志框架可以为log4j2,此外,本实施例中的日志脱 敏方法还可以基于其他日志框架实现,具体日志框架类型此处不做限定。
45.在执行本方法之前,日志脱敏设备需要接收开发人员的脱敏转换组件 (desensitive message pattern converter)的注册指令,其中,该注册指令包括脱 敏标识(%dsm);然后根据该注册指令,将布局表达式中的原生日志处理标识 (%m)替换为该脱敏标识,实现脱敏转换组件在布局表达式中的注册,其中, 脱敏转换组件包括复合敏感探测组件、内容替换组件以及敏感词实时更新模型, 所述敏感词实时更新模型用于实时更新所述复合敏感探测组件的敏感词库。
46.目前,市面也有一些基于log4j2实现日志脱敏的脱敏工具,但是,由于 log4j2中的patternlayout类被声明为final,导致其无法被直接继承使用,所以 现有技术人员就从patternlayout中复制出代码,新写到其他layout,再重新注 册到log4j2中作为布局器,导致该操作代码重复,脱敏工具中代码量较大,制 作脱敏工具的工程量较大,并且,当log4j2版本更新时,由于布局器中的代码 与patternlayout中的代码是对应的,所以还需要手动对布局器进行更新,工作 量较大。
47.而当本实施例使用log4j2为布局器对应的日志框架时,本实施例可以利用 log4j2中注册自定义脱敏转换组件的机制,定义出%dsm,用于替换布局表达式 中自带的%m,因此当应用程序接入的时候只需要修改patternlayout的布局表达 式即可,让本发明的使用难度大大降低,无需重写patternlayout,可以完全复用 log4j2框架中自带的patternlayout,使得工作量大大降低。
48.以下对本实施例中的日志脱敏方法进行详细说明,其中,以下实施例以日 志脱敏设备(以下简称日志脱敏设备)为执行主体为例,图2是本发明实施例 提供的日志脱敏方法的流程示意图,如图2所示,该方法包括以下步骤s110

160。
49.s110、获取目标应用程序的日志打印请求。
50.具体为,应用程序向日志脱敏设备发送日志打印请求,调用日志脱敏设备 中日志框架的应用程序接口(application program interface,api),请求打印日志, 其中,本实施例中的目标应用程序为需要进行日志打印的应用程序。
51.在一些实施例中,日志访问者通过客户端向日志脱敏设备发送目标应用程 序的日志查询请求,使得日志脱敏设备获取目标应用程序的日志打印请求。
52.s120、根据日志打印请求获取目标应用程序的待脱敏日志。
53.本实施例中的日志框架在目标应用程序中的每一个页面中都嵌入一段js (javascript)脚本,使得目标应用程序的源代码在运行时自动触发该js脚本收 集行为日志,最后将收集到的日志提交到对应日志框架的日志服务器中,当获 取到日志打印请求时,日志脱敏设备将从该日志服务器中提取与该日志打印请 求对应的待脱敏日志。
54.s130、根据预设的布局器的布局表达式中的脱敏标识确定待脱敏日志的脱 敏转换组件。
55.其中,该脱敏转换组件包括复合敏感探测组件、内容替换组件以及敏感词 实时更
新模型,敏感词实时更新模型用于实时更新复合敏感探测组件的敏感词 库。
56.具体地,当日志脱敏设备接收到日志打印请求之后,将使用日志框架中的 布局器进行日志输出布局。
57.此时,在一些实施例中,当脱敏转换组件通过%dsm在布局表达式中注册时, 此时,当在布局器中的布局表达式中发现脱敏标识%dsm,则脱敏设备调用 该%dsm对应的脱敏转换组件进行后续脱敏操作。
58.本实施例中的复合敏感探测组件可以组合多个敏感探测组件,其中,本实 施例中的脱敏转换组件包括复合敏感探测组件、内容替换组件以及敏感词实时 更新模型,敏感词实时更新模型用于实时更新复合敏感探测组件的敏感词库。
59.其中,本实施例中的敏感词实时更新模型会对互联网中的目标网站(例如 百度)上的新闻进行监控,当监控到目标网站上出现热点值高于预设阈值的负 面热点新闻时,提取该负面热点新闻的关键词,然后将该关键词加入敏感词库 中,以实现敏感词库中关键词的实时更新,其中,该关键词可以为负面热点新 闻的主题词。
60.在一些实施例中,该敏感词实时更新模型可以为基于tf

idf(termfrequency

inverse document frequency)算法的卷积神经网络模型。
61.可见,本实施例可以实时更新复合敏感探测组件的敏感词库,使得敏感词 库得到及时的更新,减少由于敏感词库中由于收录敏感词不够及时,而导致的 日志脱敏不彻底的问题发生。
62.s140、通过敏感词实时更新模型从互联网中获取负面热点新闻的关键词, 并根据该关键词更新复合敏感探测组件的敏感词库,得到更新后的复合敏感探 测组件。
63.具体地,步骤s140包括:通过敏感词实时更新模型从互联网中获取热点值 高于预设阈值的负面热点新闻,得到目标负面热点新闻;然后提取目标负面热 点新闻的关键词;再根据关键词更新敏感词库,得到更新后的复合敏感探测组 件,该更新后的复合敏感探测组件包括更新后的敏感词库。
64.其中,根据关键词更新敏感词库具体可以为,将关键词新增至敏感词库中。
65.需要说明的是,在一些实施例中,步骤s140可以根据预设的更新周期进行 敏感词库的更新,例如每天的早上十点进行一次更新等,或者在步骤s110之后 且步骤s150之前,根据日志打印请求进行敏感词库的更新,所以本实施例中步 骤s140的执行顺序此处不做限定。
66.s150、根据更新后的复合敏感探测组件对待脱敏日志进行敏感信息探测, 得到待脱敏日志的目标敏感信息。
67.在一些实施例中,更新后的复合敏感探测组件包括关键词匹配敏感探测组 件以及正则表达式敏感探测组件,该关键词匹配敏感探测组件包括更新后的敏 感词库,其中,正则表达式敏感探测组件可以对待脱敏日志中有规则的敏感信 息进行检测,关键词匹配敏感探测组件可以对待脱敏日志中无规则的敏感信息 进行检测。
68.此时,请参阅图3,在一些实施例中,具体地,步骤s150包括:
69.s151、根据关键词匹配敏感探测组件,确定待脱敏日志中是否存在与更新 后的敏感词库对应的敏感词。
70.其中,该更新后的敏感词库为关键词匹配敏感探测组件中的敏感词库,关 键词匹
配敏感探测组件需要检测待脱敏日志中是否存在敏感词库中的敏感词, 并且该更新后的敏感词库可以根据互联网中的负面热点新闻进行实时更新。
71.s152、若待脱敏日志中存在与更新后的敏感词库对应的敏感词,则将敏感 词确定为待脱敏日志的第一敏感信息。
72.其中,第一敏感信息为根据关键词匹配敏感探测组件得到的敏感信息。
73.s153、根据正则表达式敏感探测组件中预设的正则表达式,确定待脱敏日 志中是否存在对应的匹配数据。
74.其中,正则表达式敏感探测组件中预设的正则表达式库,该正则表达式库 包括姓名正则表达式、手机号正则表达式、邮箱正则表达式、住宅地址正则表 达式、办公地址正则表达式和/或身份证号码正则表达式等,正则表达式的类型 可以根据实际需求定制。
75.例如,使用(. )@(. \\.[a

za

z]{2,4})正则表达式规则描述敏感信息email 的数据格式等。
[0076]
s154、若待脱敏日志中存在对应的匹配数据,则将匹配数据确定为第二敏 感信息。
[0077]
其中,该第二敏感信息为根据正则表达式敏感探测组件得到的敏感信息。
[0078]
s155、根据第一敏感信息以及第二敏感信息确定目标敏感信息。
[0079]
即,将第一敏感信息以及第二敏感信息作为目标敏感信息,此时,目标敏 感信息中包含第一敏感信息以及第二敏感信息。
[0080]
在一些实施例中,本发明可以针对不同的访问者定制不同的脱敏探测规则, 此时,日志打印请求携带有访问者身份标识,其中,该访问者表示可以为客户 端id、也可以为用户登录的id等,具体此处不做限定。
[0081]
此时,步骤s150包括:
[0082]
根据访问者身份标识确定复合敏感探测组件对应的目标探测逻辑,然后根 据目标探测逻辑对待脱敏日志进行敏感信息探测,得到待脱敏日志的目标敏感 信息。
[0083]
具体地,根据访问者身份标识确定关键词匹配敏感探测组件中的目标关键 词库,以供后续根据对应的目标关键词库对待脱敏日志进行敏感词检测处理, 以及根据访问者身份标识确定正则表达式敏感探测组件中的目标正则表达式 库,以供后续根据对应的目标正则表达式库对待脱敏日志进行敏感词检测处理。
[0084]
可见,本实施例可以针对不同的访问者定制不同的脱敏规则,对不同的权 限的人群定制不同的脱敏范围,针对不同的用户提供个性化脱敏,实现脱敏中 敏感词过滤的多样化。
[0085]
在一些实施例中,用户还可以修改复合敏感探测组件中对应的探测逻辑(例 如敏感词库和/或正则表达式库),此时,日志脱敏设备可以接收复合敏感探测组 件的探测逻辑修改指令;然后根据探测逻辑修改指令对复合敏感探测组件中对 应的探测逻辑进行修改。
[0086]
可见,本实施例中用户可以根据自己的实际需求对探测逻辑进行修改,做 到了脱敏范围可配置化,只需要修改复合敏感探测组件中对应的代码,不需要 对日志脱敏设备的所有代码进行更新,减少了不必要的开发工作量。
[0087]
以及,解决了现有技术中脱敏范围无法定制,以及脱敏范围无法定制导致 的脱敏范围过大,导致的完全无法识别日志内容,不利于it技术人员排查问题, 以及脱敏范围过
小,敏感信息屏蔽得不够的问题。
[0088]
s160、根据内容替换组件对目标敏感信息进行替换处理,得到脱敏后日志。
[0089]
在一些实施例中,该日志查询请求还携带有访问者身份标识,该访问者身 份标识为可以为客户端id、也可以为用户登录的id等,具体此处不做限定。
[0090]
此时,步骤s160包括:根据访问者身份标识确定内容替换组件对应的目标 替换逻辑,然后根据目标替换逻辑对目标敏感信息进行替换处理,得到脱敏后 日志。
[0091]
即本实施例除了可以根据不同的用户定制不同的敏感词探测规则之外,还 可以根据不同的用户定制不同的替换逻辑,例如,对于同一个敏感词,a用户 使用第一替换逻辑进行敏感词替换,b用户使用第二替换逻辑进行敏感词替换。
[0092]
可见,本实施例可以针对不同的访问者定制不同的替换规则,针对同一个 敏感词,针对不同的权限的人群也定制不同的脱敏范围,针对不同的用户提供 个性化脱敏,实现脱敏中敏感词替换的多样化。
[0093]
在一些实施例中,具体地,针对不同的敏感词类型制定不同的替换逻辑, 此时,步骤s160包括:确定目标敏感信息的信息类型;然后基于内容替换组件, 根据信息类型对敏感信息进行替换处理,得到脱敏后日志。
[0094]
在一些实施例中,用户还可以修改内容替换组件中的替换逻辑,此时日志 脱敏设备接收用户发送的内容替换组件的替换逻辑修改指令;然后根据替换逻 辑修改指令对内容替换组件中对应的替换逻辑进行修改。
[0095]
可见,本实施例中用户可以根据自己的实际需求对替换逻辑进行修改,做 到了替换规则可配置化,只需要修改内容替换组件中对应的代码,不需要对日 志脱敏设备的所有代码进行更新,减少了不必要的开发工作量。
[0096]
在一些实施例中,复合敏感探测组件中除了包括关键词匹配敏感探测组件 以及正则表达式敏感探测组件,还可以包括其他探测组件,例如包括键名(key 名)探测组件,此时根据复合敏感探测组件对待脱敏日志进行敏感信息探测, 得到待脱敏日志的目标敏感信息中还包括:
[0097]
基于键名探测组件,确定待脱敏日志中是否存在敏感键名库中的敏感键名, 若存在与敏感键名库中的敏感键名,则将该敏感键名对应的信息作为第三敏感 信息,最后根据第一敏感信息、第二敏感信息以及第三敏感信息确定目标敏感 信息。
[0098]
其中,内容替换组件的替换逻辑包括但不限于:替换、乱码、截断或加密 等。
[0099]
以敏感信息中的部分位置用“*”替换敏感词为例进行说明,例如,将姓名 敏感信息脱敏为“张*四”,身份证号信息脱敏为“4417***********239”,其中, 脱敏信息中具体的脱敏位置以及脱敏规则均可根据实际应用业务定制,此处不 做限定。
[0100]
s170、通过布局器输出脱敏后日志。
[0101]
在一些实施例中,步骤s170包括:
[0102]
基于布局器对脱敏后日志进行封装处理;
[0103]
向日志打印请求对应的客户端发送进行过封装处理的脱敏后日记。
[0104]
本专利中的日志框架中注册有脱敏转换组件,具体地,在将布局器中的布 局表达式中的%m替换为了%dsm,所以日志脱敏设备通过布局器对待脱敏日志 进行处理时,布局器会检测到布局检测器中的%dsm,然后根据%dsm跳转至脱 敏转换组件,通过脱敏转换组
件对待脱敏日志进行脱敏,从而实现日志中敏感 信息的脱敏处理,保证了企业信息安全性的同时,减少了技术人员修改本专利 中日志脱敏设备的工作量。
[0105]
此外,本专利的技术实现方案具备普适性,只需要少量的配置替换就能够 轻松实现日志脱敏,无需重写布局器,可以完全复用日志框架中自带的布局器, 降低工作量。对于个性化的脱敏需求,本发明也提供了配置化、可程序扩展的 手段来满足,例如,可以对敏感探测组件中的探测逻辑以及内容替换组件的替 换逻辑进行修改。
[0106]
此外,由于本实施例中的脱敏转换组件的运作不依赖原生代码,是独立的 部件,当日志框架需要更新时,本实施例中的脱敏转换组件不需要进行更新, 当脱敏转换组件需要更新时,日志框架也不需要进行更新,所以对于日志脱敏 设备更新的工作量小。
[0107]
综上所述,本实施例获取目标应用程序的日志打印请求;根据日志打印请 求获取目标应用程序的待脱敏日志;根据布局器的布局表达式中的脱敏标识确 定待脱敏日志的脱敏转换组件,脱敏转换组件包括复合敏感探测组件、内容替 换组件以及敏感词实时更新模型,敏感词实时更新模型用于实时更新复合敏感 探测组件的敏感词库;根据复合敏感探测组件对待脱敏日志进行敏感信息探测, 得到待脱敏日志的目标敏感信息;根据内容替换组件对目标敏感信息进行替换 处理,得到脱敏后日志;通过布局器输出脱敏后日志。本方案中的敏感词库可 以通过敏感词实时更新模型进行实时更新,所以可以减少由于敏感词库中收录 敏感词不够及时,而导致日志脱敏不彻底的问题发生,提高日志的脱敏精度。
[0108]
需要说明的是,本发明实施例可以基于人工智能技术对相关的数据进行获 取和处理。其中,人工智能(artificial intelligence,ai)是利用数字计算机或者 数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使 用知识获得最佳结果的理论、方法、技术及应用系统。
[0109]
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布 式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件 技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、 自然语言处理技术以及机器学习/深度学习等几大方向。
[0110]
图4是本发明实施例提供的一种日志脱敏装置的示意性框图。如图4所示, 对应于以上日志脱敏方法,本发明还提供一种日志脱敏装置。该日志脱敏装置 包括用于执行上述日志脱敏方法的单元,该装置可以被配置于台式电脑、平板 电脑、手提电脑、等终端中。具体地,请参阅图4,该日志脱敏装置包括第一获 取单元401、第二获取单元402、确定单元403、探测单元404、第一替换单元 405以及输出单元406。
[0111]
第一获取单元401,用于获取目标应用程序的日志打印请求;
[0112]
第二获取单元402,用于根据所述日志打印请求获取所述目标应用程序的待 脱敏日志;
[0113]
确定单元403,用于根据预设的布局器的布局表达式中的脱敏标识确定所述 待脱敏日志的脱敏转换组件,所述脱敏转换组件包括复合敏感探测组件、内容 替换组件以及敏感词实时更新模型;
[0114]
更新单元404,通过所述敏感词实时更新模型从互联网中获取负面热点新闻 的关键词,并根据所述关键词更新所述复合敏感探测组件的敏感词库,得到更 新后的复合敏感探测组件,所述更新后的复合敏感探测组件包括更新后的敏感 词库;
[0115]
探测单元405,用于根据所述更新后的复合敏感探测组件对所述待脱敏日志 进行敏感信息探测,得到所述待脱敏日志的目标敏感信息;
[0116]
第一替换单元406,用于根据所述内容替换组件对所述目标敏感信息进行替 换处理,得到脱敏后日志;
[0117]
输出单元407,用于通过所述布局器输出所述脱敏后日志。
[0118]
在一些实施例中,所述更新后的复合敏感探测组件包括关键词匹配敏感探 测组件以及正则表达式敏感探测组件,所述关键词匹配敏感探测组件包括所述 更新后的敏感词库,探测单元405具体用于:
[0119]
根据所述关键词匹配敏感探测组件,确定所述待脱敏日志中是否存在与所 述更新后的敏感词库对应的敏感词;
[0120]
若所述待脱敏日志中存在与所述更新后的敏感词库对应的敏感词,则将所 述敏感词确定为所述待脱敏日志的第一敏感信息;以及,
[0121]
根据所述正则表达式敏感探测组件中预设的正则表达式,确定所述待脱敏 日志中是否存在对应的匹配数据;
[0122]
若所述待脱敏日志中存在对应的匹配数据,则将所述匹配数据确定为第二 敏感信息;
[0123]
根据所述第一敏感信息以及所述第二敏感信息确定所述目标敏感信息。
[0124]
在一些实施例中,所述探测单元405具体用于:
[0125]
根据所述访问者身份标识确定所述复合敏感探测组件对应的目标探测逻 辑,以及根据所述访问者身份标识确定所述内容替换组件对应的目标替换逻辑;
[0126]
根据所述目标探测逻辑对所述待脱敏日志进行敏感信息探测,得到所述待 脱敏日志的目标敏感信息;
[0127]
此时,所述第一替换单元406具体用于:
[0128]
根据所述目标替换逻辑对所述目标敏感信息进行替换处理,得到脱敏后日 志。
[0129]
在一些实施例中,所述第一替换单元406具体用于:
[0130]
确定所述目标敏感信息的信息类型;
[0131]
基于所述内容替换组件,根据所述信息类型对所述敏感信息进行替换处理, 得到所述脱敏后日志。
[0132]
在一些实施例中,所述更新单元404具体用于:
[0133]
通过所述敏感词实时更新模型从所述互联网中获取热点值高于预设阈值的 负面热点新闻,得到目标负面热点新闻;
[0134]
提取所述目标负面热点新闻的所述关键词;
[0135]
根据所述关键词更新所述敏感词库,得到所述更新后的复合敏感探测组件。
[0136]
图5是本发明另一实施例提供的一种日志脱敏装置的示意性框图。如图5 所示,本实施例的日志脱敏装置是上述实施例的基础上增加了第一接收单元 408、第一修改单元409、第二接收单元410、第二修改单元411、第三接收单元 412以及第二替换单元413。
[0137]
第一接收单元408,用于接收所述复合敏感探测组件的探测逻辑修改指令;
[0138]
第一修改单元409,用于根据所述探测逻辑修改指令对所述复合敏感探测组 件中对应的探测逻辑进行修改;和/或,
[0139]
第二接收单元410,用于接收所述内容替换组件的替换逻辑修改指令;
[0140]
第二修改单元411,用于根据所述替换逻辑修改指令对所述内容替换组件中 对应的替换逻辑进行修改。
[0141]
在一些实施例中,所述装置还包括:
[0142]
第三接收单元412,用于接收所述脱敏转换组件的注册指令,所述注册指令 包括脱敏标识;
[0143]
第二替换单元413,用于根据所述注册指令,将所述布局表达式中的原生日 志处理标识替换为所述脱敏标识。
[0144]
需要说明的是,所属领域的技术人员可以清楚地了解到,上述日志脱敏装 置和各单元的具体实现过程,可以参考前述方法实施例中的相应描述,为了描 述的方便和简洁,在此不再赘述。
[0145]
上述日志脱敏装置可以实现为一种计算机程序的形式,该计算机程序可以 在如图6所示的计算机设备上运行。
[0146]
请参阅图6,图6是本发明实施例提供的一种计算机设备的示意性框图。该 计算机设备600可以是终端,也可以是服务器,其中,终端可以是智能手机、 平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等具有通信功 能的电子设备。服务器可以是独立的服务器,也可以是多个服务器组成的服务 器集群。
[0147]
参阅图6,该计算机设备600包括通过系统总线601连接的处理器602、存 储器和网络接口605,其中,存储器可以包括非易失性存储介质603和内存储器 604。
[0148]
该非易失性存储介质603可存储操作系统6031和计算机程序6032。该计算 机程序6032包括程序指令,该程序指令被执行时,可使得处理器602执行一种 日志脱敏方法。
[0149]
该处理器602用于提供计算和控制能力,以支撑整个计算机设备600的运 行。
[0150]
该内存储器604为非易失性存储介质603中的计算机程序6032的运行提供 环境,该计算机程序6032被处理器602执行时,可使得处理器602执行一种日 志脱敏方法。
[0151]
该网络接口605用于与其它设备进行网络通信。本领域技术人员可以理解, 图6中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对 本发明方案所应用于其上的计算机设备600的限定,具体的计算机设备600可 以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部 件布置。
[0152]
其中,所述处理器602用于运行存储在存储器中的计算机程序6032,以实 现如下步骤:
[0153]
获取目标应用程序的日志打印请求;
[0154]
根据所述日志打印请求获取所述目标应用程序的待脱敏日志;
[0155]
根据预设的布局器的布局表达式中的脱敏标识确定所述待脱敏日志的脱敏 转换组件,所述脱敏转换组件包括复合敏感探测组件、内容替换组件以及敏感 词实时更新模型;
[0156]
通过所述敏感词实时更新模型从互联网中获取负面热点新闻的关键词,并 根据所述关键词更新所述复合敏感探测组件的敏感词库,得到更新后的复合敏 感探测组件,所述更新后的复合敏感探测组件包括更新后的敏感词库;
[0157]
根据所述更新后的复合敏感探测组件对所述待脱敏日志进行敏感信息探 测,得
到所述待脱敏日志的目标敏感信息;
[0158]
根据所述内容替换组件对所述目标敏感信息进行替换处理,得到脱敏后日 志;
[0159]
通过所述布局器输出所述脱敏后日志。
[0160]
在一些实施例中,所述更新后复合敏感探测组件包括关键词匹配敏感探测 组件以及正则表达式敏感探测组件,所述关键词匹配敏感探测组件包括所述更 新后的敏感词库,处理器602在实现所述根据所述更新后的复合敏感探测组件 对所述待脱敏日志进行敏感信息探测,得到所述待脱敏日志的目标敏感信息步 骤时,具体实现如下步骤:
[0161]
根据所述关键词匹配敏感探测组件,确定所述待脱敏日志中是否存在与所 述更新后的敏感词库对应的敏感词;
[0162]
若所述待脱敏日志中存在与所述更新后的敏感词库对应的敏感词,则将所 述敏感词确定为所述待脱敏日志的第一敏感信息;以及,
[0163]
根据所述正则表达式敏感探测组件中预设的正则表达式,确定所述待脱敏 日志中是否存在对应的匹配数据;
[0164]
若所述待脱敏日志中存在对应的匹配数据,则将所述匹配数据确定为第二 敏感信息;
[0165]
根据所述第一敏感信息以及所述第二敏感信息确定所述目标敏感信息。
[0166]
在一些实施例中,所述日志打印请求携带有访问者身份标识,处理器602 在实现所述根据所述更新后的复合敏感探测组件对所述待脱敏日志进行敏感信 息探测,得到所述待脱敏日志的目标敏感信息;根据所述内容替换组件对所述 目标敏感信息进行替换处理,得到脱敏后日志步骤时,具体实现如下步骤:
[0167]
根据所述访问者身份标识确定所述复合敏感探测组件对应的目标探测逻 辑,以及根据所述访问者身份标识确定所述内容替换组件对应的目标替换逻辑;
[0168]
根据所述目标探测逻辑对所述待脱敏日志进行敏感信息探测,得到所述待 脱敏日志的目标敏感信息;
[0169]
根据所述目标替换逻辑对所述目标敏感信息进行替换处理,得到脱敏后日 志。
[0170]
在一些实施例中,处理器602在实现所述根据所述内容替换组件对所述目 标敏感信息进行替换处理,得到脱敏后日志步骤时,具体实现如下步骤:
[0171]
确定所述目标敏感信息的信息类型;
[0172]
基于所述内容替换组件,根据所述信息类型对所述敏感信息进行替换处理, 得到所述脱敏后日志。
[0173]
在一些实施例中,处理器602具体还实现如下步骤:
[0174]
通过所述敏感词实时更新模型从所述互联网中获取热点值高于预设阈值的 负面热点新闻,得到目标负面热点新闻;
[0175]
提取所述目标负面热点新闻的所述关键词;
[0176]
根据所述关键词更新所述敏感词库,得到所述更新后的复合敏感探测组件。
[0177]
在一些实施例中,处理器602具体还实现如下步骤:
[0178]
接收所述复合敏感探测组件的探测逻辑修改指令;
[0179]
根据所述探测逻辑修改指令对所述复合敏感探测组件中对应的探测逻辑进 行修改;和/或,
[0180]
接收所述内容替换组件的替换逻辑修改指令;
[0181]
根据所述替换逻辑修改指令对所述内容替换组件中对应的替换逻辑进行修 改。
[0182]
在一些实施例中,处理器602在实现所述获取目标应用程序的日志打印请 求步骤之前,还实现如下步骤:
[0183]
接收所述脱敏转换组件的注册指令,所述注册指令包括脱敏标识;
[0184]
根据所述注册指令,将所述布局表达式中的原生日志处理标识替换为所述 脱敏标识。
[0185]
应当理解,在本发明实施例中,处理器602可以是中央处理单元(centralprocessing unit,cpu),该处理器602还可以是其他通用处理器、数字信号处理 器(digital signal processor,dsp)、专用集成电路(application specific integratedcircuit,asic)、现成可编程门阵列(field

programmable gate array,fpga)或 者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中, 通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0186]
本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分 流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程 序指令,计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介 质。该程序指令被该计算机系统中的至少一个处理器执行,以实现上述方法的 实施例的流程步骤。
[0187]
因此,本发明还提供一种存储介质。该存储介质可以为计算机可读存储介 质。该存储介质存储有计算机程序,其中计算机程序包括程序指令。该程序指 令被处理器执行时使处理器执行如下步骤:
[0188]
获取目标应用程序的日志打印请求;
[0189]
根据所述日志打印请求获取所述目标应用程序的待脱敏日志;
[0190]
根据预设的布局器的布局表达式中的脱敏标识确定所述待脱敏日志的脱敏 转换组件,所述脱敏转换组件包括复合敏感探测组件、内容替换组件以及敏感 词实时更新模型;
[0191]
通过所述敏感词实时更新模型从互联网中获取负面热点新闻的关键词,并 根据所述关键词更新所述复合敏感探测组件的敏感词库,得到更新后的复合敏 感探测组件,所述更新后的复合敏感探测组件包括更新后的敏感词库;
[0192]
根据所述更新后的复合敏感探测组件对所述待脱敏日志进行敏感信息探 测,得到所述待脱敏日志的目标敏感信息;
[0193]
根据所述内容替换组件对所述目标敏感信息进行替换处理,得到脱敏后日 志;
[0194]
通过所述布局器输出所述脱敏后日志。
[0195]
在一些实施例中,所述更新后的复合敏感探测组件包括关键词匹配敏感探 测组件以及正则表达式敏感探测组件,所述关键词匹配敏感探测组件包括所述 更新后的敏感词库,所述处理器在执行所述程序指令而实现所述根据所述更新 后的复合敏感探测组件对所述待脱敏日志进行敏感信息探测,得到所述待脱敏 日志的目标敏感信息步骤时,具体实现如下步骤:
[0196]
根据所述关键词匹配敏感探测组件,确定所述待脱敏日志中是否存在与所 述更新后的敏感词库对应的敏感词;
[0197]
若所述待脱敏日志中存在与所述更新后的敏感词库对应的敏感词,则将所 述敏感词确定为所述待脱敏日志的第一敏感信息;以及,
[0198]
根据所述正则表达式敏感探测组件中预设的正则表达式,确定所述待脱敏 日志中是否存在对应的匹配数据;
[0199]
若所述待脱敏日志中存在对应的匹配数据,则将所述匹配数据确定为第二 敏感信息;
[0200]
根据所述第一敏感信息以及所述第二敏感信息确定所述目标敏感信息。
[0201]
在一些实施例中,所述日志打印请求携带有访问者身份标识,所述处理器 在执行所述程序指令而实现所述根据所述更新后的复合敏感探测组件对所述待 脱敏日志进行敏感信息探测,得到所述待脱敏日志的目标敏感信息;根据所述 内容替换组件对所述目标敏感信息进行替换处理,得到脱敏后日志步骤时,具 体实现如下步骤:
[0202]
根据所述访问者身份标识确定所述复合敏感探测组件对应的目标探测逻 辑,以及根据所述访问者身份标识确定所述内容替换组件对应的目标替换逻辑;
[0203]
根据所述目标探测逻辑对所述待脱敏日志进行敏感信息探测,得到所述待 脱敏日志的目标敏感信息;
[0204]
根据所述目标替换逻辑对所述目标敏感信息进行替换处理,得到脱敏后日 志。
[0205]
在一些实施例中,所述处理器在执行所述程序指令而实现所述根据所述内 容替换组件对所述目标敏感信息进行替换处理,得到脱敏后日志步骤时,具体 实现如下步骤:
[0206]
确定所述目标敏感信息的信息类型;
[0207]
基于所述内容替换组件,根据所述信息类型对所述敏感信息进行替换处理, 得到所述脱敏后日志。
[0208]
在一些实施例中,所述处理器具体还实现如下步骤:
[0209]
通过所述敏感词实时更新模型从互联网中获取热点值高于预设阈值的负面 热点新闻,得到目标负面热点新闻;
[0210]
提取所述目标负面热点新闻的所述关键词;
[0211]
根据所述关键词更新所述敏感词库,得到所述更新后的复合敏感探测组件。
[0212]
在一些实施例中,所述处理器具体还实现如下步骤:
[0213]
接收所述复合敏感探测组件的探测逻辑修改指令;
[0214]
根据所述探测逻辑修改指令对所述复合敏感探测组件中对应的探测逻辑进 行修改;和/或,
[0215]
接收所述内容替换组件的替换逻辑修改指令;
[0216]
根据所述替换逻辑修改指令对所述内容替换组件中对应的替换逻辑进行修 改。
[0217]
在一些实施例中,所述处理器在执行所述程序指令而实现所述获取目标应 用程序的日志打印请求步骤之前,还实现如下步骤:
[0218]
接收所述脱敏转换组件的注册指令,所述注册指令包括脱敏标识;
[0219]
根据所述注册指令,将所述布局表达式中的原生日志处理标识替换为所述 脱敏标识。
[0220]
所述存储介质可以是u盘、移动硬盘、只读存储器(read

only memory, rom)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
[0221]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示 例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现, 为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地 描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决 于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用 来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范 围。
[0222]
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可 以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例 如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划 分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特 征可以忽略,或不执行。
[0223]
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。 本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外, 在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各 个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
[0224]
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使 用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质 上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软 件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干 指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等) 执行本发明各个实施例所述方法的全部或部分步骤。
[0225]
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于 此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到 各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。 因此,本发明的保护范围应以权利要求的保护范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献