一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种用于标记敏感数据的方法、设备、介质及程序产品与流程

2023-02-02 01:06:58 来源:中国专利 TAG:


1.本技术涉及通信领域,尤其涉及一种用于标记敏感数据的技术。


背景技术:

2.敏感数据是指泄漏后可能会给社会或个人带来严重危害的数据。包括个人隐私数据,如姓名、身份证号码、住址、电话、银行账号、邮箱、密码、医疗信息、教育背景等。在现有技术中,业界对敏感数据的解决方案是手动标记形式,并未有智能流程化的形式。


技术实现要素:

3.本技术的一个目的是提供一种用于标记敏感数据的方法、设备、介质及程序产品。
4.根据本技术的一个方面,提供了一种用于标记敏感数据的方法,该方法包括:
5.对数据库的日志数据进行抽样采集,获得一个或多个抽样数据;
6.根据分类分级规则对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类,获取所述抽样数据在所述敏感分类下对应的敏感级别信息;
7.根据所述敏感级别信息,针对至少一个抽样数据打上敏感标记,并存储所述至少一个抽样数据,其中,所述敏感标记包括所述每个抽样数据对应的敏感分类及敏感级别信息。
8.根据本技术的一个方面,提供了一种用于标记敏感数据的计算机设备,该设备包括:
9.一一模块,用于对数据库的日志数据进行抽样采集,获得一个或多个抽样数据;
10.一二模块,用于根据分类分级规则对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类,获取所述抽样数据在所述敏感分类下对应的敏感级别信息;
11.一三模块,用于根据所述敏感级别信息,针对至少一个抽样数据打上敏感标记,并存储所述至少一个抽样数据,其中,所述敏感标记包括所述每个抽样数据对应的敏感分类及敏感级别信息。
12.根据本技术的一个方面,提供了一种用于标记敏感数据的计算机设备,包括存储器、处理器及存储在存储器上的计算机程序,其中,所述处理器执行所述计算机程序以实现如上所述任一方法的操作。
13.根据本技术的一个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如上所述任一方法的操作。
14.根据本技术的一个方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如上所述任一方法的步骤。
15.与现有技术相比,本技术通过对数据库的日志数据进行抽样采集,获得一个或多个抽样数据;根据分类分级规则对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类,获取所述抽样数据在所述敏感分类下对应的敏感级别信息;根据所述敏感级别信息,针对至少一个抽样数据打上敏感标记,并存储所述至少一个抽样数据,其中,所述敏感标记
gate array,fpga)、数字信号处理器(digital signal processor,dsp)、嵌入式设备等。所述网络设备包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云;在此,云由基于云计算(cloud computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟超级计算机。所述网络包括但不限于互联网、广域网、城域网、局域网、vpn网络、无线自组织网络(ad hoc网络)等。优选地,所述设备还可以是运行于所述终端、网络设备、或终端与网络设备、网络设备、触摸终端或网络设备与触摸终端通过网络相集成所构成的设备上的程序。
27.当然,本领域技术人员应能理解上述设备仅为举例,其他现有的或今后可能出现的设备如可适用于本技术,也应包含在本技术保护范围以内,并在此以引用方式包含于此。
28.在本技术的描述中,“多个”的含义是两个或者更多,除非另有明确具体的限定。
29.图1示出根据本技术一个实施例的一种用于标记敏感数据的方法流程图,该方法包括步骤s11、步骤s12和步骤s13。在步骤s11中,计算机设备对数据库的日志数据进行抽样采集,获得一个或多个抽样数据;在步骤s12中,计算机设备根据分类分级规则对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类,获取所述抽样数据在所述敏感分类下对应的敏感级别信息;在步骤s13中,计算机设备根据所述敏感级别信息,针对至少一个抽样数据打上敏感标记,并存储所述至少一个抽样数据,其中,所述敏感标记包括所述每个抽样数据对应的敏感分类及敏感级别信息。
30.在步骤s11中,计算机设备对数据库的日志数据进行抽样采集,获得一个或多个抽样数据。在一些实施例中,日志数据是指数据库的操作行为日志数据,日志数据中包括但不限于针对数据库的某个操作行为的行为时间、行为内容(例如,在数据库中读取、插入、修改、删除的存储数据)、行为结果(例如,是否成功)、行为对象(即数据库中的至少一个存储数据)等。在一些实施例中,可以按照预定的采样率来对数据库的日志数据进行抽样采集,采样方式可以是按照行为时间的先后顺序来进行间隔采样,例如,若采样率为10%,则在该数据库中的每10次已发生的操作行为中采集1次操作行为的日志数据,即若已采集操作行为1的日志数据,则下一次采集的是按照行为时间的先后顺序在该操作行为1之后第十次发生的操作行为2的日志数据。在一些实施例中,采样方式还可以是无顺序随机采样,例如,先采集针对该数据库的所有操作行为的多个日志数据,若采样率为10%,则根据该多个日志数据的数量num,在该多个日志数据中随机抽取num*10%数量的日志数据作为抽样数据。
31.在步骤s12中,计算机设备根据分类分级规则对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类,获取所述抽样数据在所述敏感分类下对应的敏感级别信息。在一些实施例中,分类分级规则中包括多个预定的敏感分类(例如,个人身份信息类、个人财产信息类)及每个敏感分类的识别策略,识别策略用于识别数据中是否包括该敏感分类所对应的敏感分类,具体的识别方式包括但不限于正则表达式识别、关键词识别、模型特征识别等,该分类分级规则还包括分级策略,分级策略用于在若识别到数据中包括该识别策略所对应的敏感分类的时候确定该数据在该敏感分类下对应的敏感级别,敏感级别可以是用数值形式来表征,例如,数值越大,则说明对应的数据越敏感或越不安全,或者,敏感级别还可以用文本形式来表征,例如,“轻度敏感”、“中度敏感”、“重度敏感”等,若根据分类分级规则识别到数据中包括某个识别策略所对应的敏感分类,则将其作为该数据对应的敏感分类,然后继续根据分类分级规则确定该数据在该敏感分类下对应的敏感级别。在一些实施
例中,可以是一个敏感分类仅对应一个敏感级别,若识别到数据中包括某个分类策略所对应的敏感分类,则直接将该敏感分类对应的敏感级别作为该数据在该敏感分类下对应的敏感级别,或者,还可以是一个敏感分类对应多个不同的敏感级别,则此时需要根据分级策略来确定该数据在该敏感分类下对应的敏感级别,具体的确定方式包括但不限于语义分析方式、关键词提取方式,模型特征方式等,例如,通过语义分析的方式来确定该数据在该敏感分类下对应的敏感级别,或者,该敏感分类预定设定了若干个关键词与敏感级别之间的映射关系,根据该数据中所包括的关键词所映射的敏感级别,确定该数据在该敏感分类下对应的敏感级别,或者,将该数据输入已训练的该敏感分类对应的敏感级别模型,得到该敏感级别模型输出的该数据在该敏感分类下对应的敏感级别。
32.在步骤s13中,计算机设备根据所述敏感级别信息,针对至少一个抽样数据打上敏感标记,并存储所述至少一个抽样数据,其中,所述敏感标记包括所述每个抽样数据对应的敏感分类及敏感级别信息。在一些实施例中,可以是根据抽样数据对应的敏感级别,将敏感级别满足预定的级别阈值的抽样数据确定为敏感数据,例如,将对应的敏感级别大于或等于预定的级别数值阈值的抽样数据确定为敏感数据,或者,还可以将所有识别到包括分类分级规则中的至少一个敏感分类的抽样数据确定为敏感数据。在一些实施例中,针对敏感数据(即至少一个抽样数据)打上对应的敏感标记,该敏感标记包括该敏感数据所对应的敏感分类及敏感级别,并对该敏感数据进行存储。在一些实施例中,用户可以对存储的敏感数据进行检索得到需求数据,或者,还可以对存储的敏感数据进行资产可视化分析并通过报表导出。在一些实施例中,还支持外部调用存储的敏感数据和/或支持将存储的敏感数据外送。本技术可以通过预设的分类分级规则对数据库的日志数据进行智能分类分级,并自动打上对应的敏感标记,且可以灵活选择所使用的分类分级规则,从而实现智能流程化的形式。
33.在一些实施例中,所述步骤s11包括:计算机设备通过已部署在数据库上的插件对所述数据库的日志数据进行抽样采集,获得一个或多个抽样数据。在一些实施例中,可以通过在数据库上部署(或者安装)插件来对数据库的日志数据进行自动抽样采集,该插件属于半侵入式的软件应用,成本低,便捷性好,同时可扩展性强,通过该插件直接进行数据库日志数据的获取,具备更精准的效果。
34.在一些实施例中,所述方法还包括:计算机设备确定所述数据库对应的分类分级规则。在一些实施例中,需要先确定针对该数据库所使用的分类分级规则,具体的确定方式可以是获得用户在多个默认分类分级规则中选择的所述数据库对应的分类分级规则,或者,还可以是通过对所述数据库中的存储数据进行语义分析,确定所述数据库对应的存储数据特征,根据所述存储数据特征,自动确定与所述存储数据特征相匹配的分类分级规则。
35.在一些实施例中,所述确定所述数据库对应的分类分级规则,包括:获得用户在多个默认分类分级规则中选择的所述数据库对应的分类分级规则。在一些实施例中,预置了多个默认分类分级规则,用户可以在该多个默认分类分级规则中自由灵活选择一个作为该数据库对应的分类分级规则。例如,分类分级规则可以是按照个人信息保护进行分类的规则,其包括个人身份信息、个人财产信息等多个敏感分类,又例如,分类分级规则还可以是按照电信运营商行业进行分类的规则,其包括用户基本资料、位置数据、消费信息等多个敏感分类。
36.在一些实施例中,所述确定所述数据库对应的分类分级规则,包括:通过对所述数据库中的存储数据进行语义分析,确定所述数据库对应的存储数据特征;根据所述存储数据特征,确定与所述存储数据特征相匹配的分类分级规则。在一些实施例中,可以先通过对数据库中的存储数据进行语义分析,分析得到数据库中的存储数据特征,该存储数据特征用于表征该数据库中主要存储了何种类型何种特点的数据,然后根据该存储数据特征,在多个默认分类分级规则中自动确定适合这种类型这种特点的存储数据的分类分级规则,并将其作为该数据库对应的分类分级规则,例如,若该存储数据特征表征该数据库中主要存储了对话类型的消息文本数据,则适合这种对话类型的消息文本数据的分类分级规则可以是按照社交信息包含进行分类的规则,其包括个人聊天信息、个人空间发布信息、个人资料信息等多个敏感分类。
37.在一些实施例中,所述根据所述存储数据特征,确定与所述存储数据特征相匹配的分类分级规则,包括:根据所述存储数据特征,确定所述数据库对应的涉及敏感场景信息;根据所述涉及敏感场景信息,确定与所述涉及敏感信息相匹配的分类分级规则。在一些实施例中,可以先根据该存储数据特征,确定该数据库所涉及的敏感场景信息,然后根据该敏感场景信息,在多个默认分类分级规则中自动确定适合该敏感场景信息的分类分级规则,例如,若该存储数据特征表征该数据库中主要存储了商品链接、商品价格、收货地址等类型的数据,则可以确定该数据库所涉及的敏感场景为购物场景,并在多个默认分类分级规则中自动确定适合该购物场景的分类分级规则,其包括个人消费信息、个人支付信息、个人联系方式信息、个人地址信息等多个敏感分类。
38.在一些实施例中,所述分类分级规则包括分类策略和敏感级别策略;其中,所述步骤s12包括:计算机设备根据所述分类策略对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类;根据所述敏感级别策略,确定所述抽样数据在所述敏感分类下对应的敏感级别信息。在一些实施例中,分类策略中通常包括预先设定的多个敏感分类,分类策略用于识别抽样数据中是否包括该分类策略中的某个或某几个敏感分类,具体的识别方式包括但不限于正则表达式识别、关键词识别、模型特征识别等。在一些实施例中,一个抽样数据可以对应多个敏感分类,即若根据分类策略识别到抽样数据中包括某个敏感分类,则可以直接将其作为该抽样数据对应的其中一个敏感分类。在一些实施例中,一个抽样数据仅可以对应一个敏感分类,则若根据分类分级规则识别到抽样数据中包括多个不同的敏感分类,需要在该多个不同的敏感分类确定其中的一个敏感分类作为该抽样数据对应的敏感分类,例如,每个敏感分类对应不同的识别可信度或匹配度,可以在该多个不同的敏感分类中对应的识别可信度或匹配度最高的敏感分类作为该抽样数据对应的敏感分类。在一些实施例中,在确定出抽样数据对应的敏感分类之后,进一步根据敏感级别策略,确定该抽样数据在该敏感分类下对应的敏感级别,敏感级别可以是用数值形式来表征,例如,数值越大,则说明对应的数据越敏感或越不安全,或者,敏感级别还可以用文本形式来表征,例如,“轻度敏感”、“中度敏感”、“重度敏感”等。在一些实施例中,敏感级别策略中可以包括每个敏感分类分别对应的敏感级别,可以直接将抽样数据所对应的敏感分类对应的敏感级别作为该抽样数据在该敏感分类下对应的敏感级别。在一些实施例中,敏感级别策略中可以包括每个敏感分类对应的敏感级别的具体确定方式,该具体确定方式包括但不限于语义分析方式、关键词提取方式,模型特征方式等,在确定出抽样数据对应的敏感分类之后,需要根据该敏感
分类对应的敏感级别确定方式,来具体确定该抽样数据在该敏感分类下对应的敏感级别,例如,通过语义分析的方式来确定该数据在该敏感分类下对应的敏感级别,或者,该敏感分类预定设定了若干个关键词与敏感级别之间的映射关系,根据该数据中所包括的关键词所映射的敏感级别,确定该数据在该敏感分类下对应的敏感级别,或者,将该数据输入已训练的该敏感分类对应的敏感级别模型,得到该敏感级别模型输出的该数据在该敏感分类下对应的敏感级别。在一些实施例中,若抽样数据对应多个敏感分类,则需要先分别确定该抽样数据在每个敏感分类下对应的敏感级别,然后再根据该多个敏感级别来确定该抽样数据在该多个敏感分类下所对应的敏感级别,例如,若敏感级别是数值形式,则可以将多个敏感级别数值所对应的平均值作为该抽样数据在该多个敏感分类下所对应的敏感级别。
39.在一些实施例中,所述敏感级别策略包括所述分类策略下的每个敏感分类对应的第一敏感级别信息;其中,所述根据所述敏感级别策略,确定所述抽样数据在所述敏感分类下对应的敏感级别信息,包括:根据所述敏感级别策略,获得所述敏感分类对应的第一敏感级别信息;根据所述第一敏感级别信息,确定所述抽样数据在所述敏感分类下对应的敏感级别信息。在一些实施例中,每个敏感分类对应一个敏感级别,敏感级别策略中包括分类策略下的每个敏感分类对应的第一敏感级别。在一些实施例中,在确定出抽样数据对应的敏感分类之后,可以直接将该敏感分类对应的第一敏感级别作为该抽样数据在该敏感分类下对应的敏感级别,或者,可以将该敏感分类对应的第一敏感级别输入预定的函数关系式,将该函数关系式的输出作该抽样数据在该敏感分类下对应的敏感级别。
40.在一些实施例中,所述敏感级别策略还包括所述分类策略下的每个敏感分类对应的多个子敏感分类及每个子敏感分类对应的第二敏感级别信息;其中,所述根据所述第一敏感级别信息,确定所述抽样数据在所述敏感分类下对应的敏感级别信息。包括:根据所述敏感级别策略,确定所述抽样数据在所述敏感分类下对应的子敏感分类;根据所述第一敏感级别信息及所述子敏感分类对应的第二敏感级别信息,确定所述抽样数据在所述敏感分类下对应的敏感级别信息。在一些实施例中,每个敏感分类还会对应多个子敏感分类,每个子敏感分类对应一个敏感级别,敏感级别策略还包括分类策略下的每个敏感分类所对应的多个子敏感分类及每个子敏感分类对应的第二敏感级别。在一些实施例中,在确定出抽样数据对应的敏感分类之后,需要根据敏感级别策略来确定该抽样数据在该敏感分类下对应的子敏感分类,具体的确定方式包括但不限于正则表达式识别、关键词识别、语义分析、模型特征识别等,通过敏感级别策略可以识别出该抽样数据属于该敏感分类下的哪个具体的子敏感分类,然后根据该敏感分类对应的第一敏感级别和该抽样数据所属的子敏感分类对应的第二敏感级别,来确定该抽样数据在该敏感分类下对应的敏感级别,例如,若敏感级别是数值形式,则可以将该第一敏感级别与该第二敏感级别的平均值或最大值或最小值作为该抽样数据在该敏感分类下对应的敏感级别,或者,还可以将该第一敏感级别和该第二敏感级别输入一个预定的函数关系式,然后将该函数关系式的输出作为该抽样数据在该敏感分类下对应的敏感级别。
41.在一些实施例中,所述敏感级别策略包括所述分类策略下的每个敏感分类对应的多个子敏感分类及每个子敏感分类对应的第三敏感级别信息;其中,所述根据所述敏感级别策略,确定所述抽样数据在所述敏感分类下对应的敏感级别信息,包括:根据所述敏感级别策略,确定所述抽样数据在所述敏感分类下对应的子敏感分类;根据所述子敏感分类对
应的第三敏感级别信息,确定所述抽样数据在所述敏感分类下对应的敏感级别信息。在一些实施例中,第三敏感级别与前文所述的第二敏感级别相同或相似,在此不再赘述。在一些实施例中,在确定出抽样数据对应的敏感分类之后,再根据敏感级别策略来确定该抽样数据在该敏感分类下对应的子敏感分类,然后可以仅根据该子敏感分类对应的第三敏感级别,来确定该抽样数据在该敏感分类下对应的敏感级别,例如,将该子敏感分类对应的第三敏感级别作为该抽样数据在该敏感分类下对应的敏感级别。
42.在一些实施例中,所述方法还包括:获取用户对已存储的目标抽样数据的复核结果;若所述目标抽样数据对应的敏感分类及敏感级别信息中的至少一项与所述复核结果不一致,根据所述复核结果调整所述目标抽样数据的敏感标记。在一些实施例中,可以向用户呈现所有敏感数据(即至少一个抽样数据)供该用户复核,或者,还可以仅向用户呈现识别可信度或匹配度低于或等于预定阈值的敏感数据供该用户复核,其中,复核是指用户手动核查该敏感数据所被打上的敏感标记是否准确。在一些实施例中,若该用户针对目标敏感数据(即目标抽样数据)的复核结果指示该目标敏感数据所被打上的敏感标记不准确,即若该目标敏感数据所对应的敏感分类及敏感级别中的至少一项与该复核结果不一致,则需要根据该复核结果来调整该目标敏感数据的敏感标记,其中,具体的调整方式包括但不限于修改该敏感标记中的敏感分类、修改该敏感标记中的敏感级别信息、针对该目标敏感数据去除该敏感标记,并取消存储该目标敏感数据。
43.在一些实施例中,所述调整所述目标抽样数据的敏感标记包括以下至少一项:修改所述敏感标记中的敏感分类;修改所述敏感标记中的敏感级别信息;针对所述目标抽样数据去除所述敏感标记,并取消存储所述目标抽样数据。在一些实施例中,若目标敏感数据对应的复核后的敏感级别不满足预定的级别阈值,例如,复核后的敏感级别小于预定的级别数值阈值,则针对该目标敏感数据删除其所被打上的敏感标记,并取消对该目标敏感数据进行存储。在一些实施例中,若复核结果指示目标敏感数据中不包括该分类分级规则中的任何一个预定的敏感分类,则针对该目标敏感数据删除其所被打上的敏感标记,并取消对该目标敏感数据进行存储。
44.在一些实施例中,所述方法还包括:计算机设备根据所述敏感级别信息,调整所述数据库的抽样率,使得后续使用调整后的抽样率对所述数据库的新日志数据进行抽样采集。在一些实施例中,可以根据抽样数据对应的敏感级别,计算得到敏感级别满足预定的级别阈值的目标抽样数据(例如,该目标抽样数据可以是该至少一个被打上敏感标记的抽样数据即敏感数据)的数量与抽样采集到的一个或多个抽样数据的总数的比例,例如,计算得到敏感级别大于或等于预定的级别数值阈值的抽样数据的数量与抽样采集到的一个或多个抽样数据的总数的比例,若该比例数值大于或等于预定的第一比值阈值,则可以提高该数据库的原有抽样率,可以按照默认的幅度增加原有抽样率,或者,还可以根据该比例数值的大小动态确定原有抽样率的提高幅度,若该比例数值小或等于预定的第二比值阈值,则可以降低该数据库的原有抽样率,可以按照默认的幅度降低原有抽样率,或者,还可以根据该比例数值的大小动态确定原有抽样率的降低幅度,然后后续在需要对该数据库再次进行抽样采集的时候,会使用该调整后的抽样率来对该数据库新产生的新日志数据再次进行抽样采集。
45.图2示出根据本技术一个实施例的一种用于标记敏感数据的方法流程图。
46.如图2所示,该智能数据分类分级系统包括审计日志及数据库资产采集模块、数据分类分级引擎、智能策略配置模块、手动复核模块、存储模块、资产检索及分析模块,审计日志及数据库资产采集模块用于通过插件化形式对数据库的日志数据进行抽样采集,智能策略配置模块用于智能配置数据分类分级引擎所使用的分类分级规则,数据分类分级引擎用于利用分类分级规则对日志数据进行敏感数据识别,手动复核模块用于对日志数据的识别结果进行手动复核,存储模块用于对识别数据进行存储,资产检索及分析模块用于调用存储资产对识别数据进行检索以及对识别数据进行可视化分析。
47.图3示出根据本技术一个实施例的一种用于标记敏感数据的计算机设备结构图,该设备包括一一模块11、一二模块12和一三模块13。一一模块11,用于对数据库的日志数据进行抽样采集,获得一个或多个抽样数据;一二模块12,用于根据分类分级规则对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类,获取所述抽样数据在所述敏感分类下对应的敏感级别信息;一三模块13,用于根据所述敏感级别信息,针对至少一个抽样数据打上敏感标记,并存储所述至少一个抽样数据,其中,所述敏感标记包括所述每个抽样数据对应的敏感分类及敏感级别信息。
48.一一模块11,用于对数据库的日志数据进行抽样采集,获得一个或多个抽样数据。在一些实施例中,日志数据是指数据库的操作行为日志数据,日志数据中包括但不限于针对数据库的某个操作行为的行为时间、行为内容(例如,在数据库中读取、插入、修改、删除的存储数据)、行为结果(例如,是否成功)、行为对象(即数据库中的至少一个存储数据)等。在一些实施例中,可以按照预定的采样率来对数据库的日志数据进行抽样采集,采样方式可以是按照行为时间的先后顺序来进行间隔采样,例如,若采样率为10%,则在该数据库中的每10次已发生的操作行为中采集1次操作行为的日志数据,即若已采集操作行为1的日志数据,则下一次采集的是按照行为时间的先后顺序在该操作行为1之后第十次发生的操作行为2的日志数据。在一些实施例中,采样方式还可以是无顺序随机采样,例如,先采集针对该数据库的所有操作行为的多个日志数据,若采样率为10%,则根据该多个日志数据的数量num,在该多个日志数据中随机抽取num*10%数量的日志数据作为抽样数据。
49.一二模块12,用于根据分类分级规则对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类,获取所述抽样数据在所述敏感分类下对应的敏感级别信息。在一些实施例中,分类分级规则中包括多个预定的敏感分类(例如,个人身份信息类、个人财产信息类)及每个敏感分类的识别策略,识别策略用于识别数据中是否包括该敏感分类所对应的敏感分类,具体的识别方式包括但不限于正则表达式识别、关键词识别、模型特征识别等,该分类分级规则还包括分级策略,分级策略用于在若识别到数据中包括该识别策略所对应的敏感分类的时候确定该数据在该敏感分类下对应的敏感级别,敏感级别可以是用数值形式来表征,例如,数值越大,则说明对应的数据越敏感或越不安全,或者,敏感级别还可以用文本形式来表征,例如,“轻度敏感”、“中度敏感”、“重度敏感”等,若根据分类分级规则识别到数据中包括某个识别策略所对应的敏感分类,则将其作为该数据对应的敏感分类,然后继续根据分类分级规则确定该数据在该敏感分类下对应的敏感级别。在一些实施例中,可以是一个敏感分类仅对应一个敏感级别,若识别到数据中包括某个分类策略所对应的敏感分类,则直接将该敏感分类对应的敏感级别作为该数据在该敏感分类下对应的敏感级别,或者,还可以是一个敏感分类对应多个不同的敏感级别,则此时需要根据分级策略来确定
该数据在该敏感分类下对应的敏感级别,具体的确定方式包括但不限于语义分析方式、关键词提取方式,模型特征方式等,例如,通过语义分析的方式来确定该数据在该敏感分类下对应的敏感级别,或者,该敏感分类预定设定了若干个关键词与敏感级别之间的映射关系,根据该数据中所包括的关键词所映射的敏感级别,确定该数据在该敏感分类下对应的敏感级别,或者,将该数据输入已训练的该敏感分类对应的敏感级别模型,得到该敏感级别模型输出的该数据在该敏感分类下对应的敏感级别。
50.一三模块13,用于根据所述敏感级别信息,针对至少一个抽样数据打上敏感标记,并存储所述至少一个抽样数据,其中,所述敏感标记包括所述每个抽样数据对应的敏感分类及敏感级别信息。在一些实施例中,可以是根据抽样数据对应的敏感级别,将敏感级别满足预定的级别阈值的抽样数据确定为敏感数据,例如,将对应的敏感级别大于或等于预定的级别数值阈值的抽样数据确定为敏感数据,或者,还可以将所有识别到包括分类分级规则中的至少一个敏感分类的抽样数据确定为敏感数据。在一些实施例中,针对敏感数据(即至少一个抽样数据)打上对应的敏感标记,该敏感标记包括该敏感数据所对应的敏感分类及敏感级别,并对该敏感数据进行存储。在一些实施例中,用户可以对存储的敏感数据进行检索得到需求数据,或者,还可以对存储的敏感数据进行资产可视化分析并通过报表导出。在一些实施例中,还支持外部调用存储的敏感数据和/或支持将存储的敏感数据外送。本技术可以通过预设的分类分级规则对数据库的日志数据进行智能分类分级,并自动打上对应的敏感标记,且可以灵活选择所使用的分类分级规则,从而实现智能流程化的形式。
51.在一些实施例中,所述一一模块11用于:通过已部署在数据库上的插件对所述数据库的日志数据进行抽样采集,获得一个或多个抽样数据。在此,相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方式包含于此。
52.在一些实施例中,所述设备还用于:确定所述数据库对应的分类分级规则。在此,相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方式包含于此。
53.在一些实施例中,所述确定所述数据库对应的分类分级规则,包括:获得用户在多个默认分类分级规则中选择的所述数据库对应的分类分级规则。在此,相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方式包含于此。
54.在一些实施例中,所述确定所述数据库对应的分类分级规则,包括:通过对所述数据库中的存储数据进行语义分析,确定所述数据库对应的存储数据特征;根据所述存储数据特征,确定与所述存储数据特征相匹配的分类分级规则。在此,相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方式包含于此。
55.在一些实施例中,所述根据所述存储数据特征,确定与所述存储数据特征相匹配的分类分级规则,包括:根据所述存储数据特征,确定所述数据库对应的涉及敏感场景信息;根据所述涉及敏感场景信息,确定与所述涉及敏感信息相匹配的分类分级规则。在此,相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方式包含于此。
56.在一些实施例中,所述分类分级规则包括分类策略和敏感级别策略;其中,所述一二模块12用于:根据所述分类策略对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类;根据所述敏感级别策略,确定所述抽样数据在所述敏感分类下对应的敏感级别信息。在此,相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方式包含于此。
57.在一些实施例中,所述敏感级别策略包括所述分类策略下的每个敏感分类对应的
第一敏感级别信息;其中,所述根据所述敏感级别策略,确定所述抽样数据在所述敏感分类下对应的敏感级别信息,包括:根据所述敏感级别策略,获得所述敏感分类对应的第一敏感级别信息;根据所述第一敏感级别信息,确定所述抽样数据在所述敏感分类下对应的敏感级别信息。在此,相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方式包含于此。
58.在一些实施例中,所述敏感级别策略还包括所述分类策略下的每个敏感分类对应的多个子敏感分类及每个子敏感分类对应的第二敏感级别信息;其中,所述根据所述第一敏感级别信息,确定所述抽样数据在所述敏感分类下对应的敏感级别信息。包括:根据所述敏感级别策略,确定所述抽样数据在所述敏感分类下对应的子敏感分类;根据所述第一敏感级别信息及所述子敏感分类对应的第二敏感级别信息,确定所述抽样数据在所述敏感分类下对应的敏感级别信息。在此,相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方式包含于此。
59.在一些实施例中,所述敏感级别策略包括所述分类策略下的每个敏感分类对应的多个子敏感分类及每个子敏感分类对应的第三敏感级别信息;其中,所述根据所述敏感级别策略,确定所述抽样数据在所述敏感分类下对应的敏感级别信息,包括:根据所述敏感级别策略,确定所述抽样数据在所述敏感分类下对应的子敏感分类;根据所述子敏感分类对应的第三敏感级别信息,确定所述抽样数据在所述敏感分类下对应的敏感级别信息。在此,相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方式包含于此。
60.在一些实施例中,所述设备还用于:获取用户对已存储的目标抽样数据的复核结果;若所述目标抽样数据对应的敏感分类及敏感级别信息中的至少一项与所述复核结果不一致,根据所述复核结果调整所述目标抽样数据的敏感标记。在此,相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方式包含于此。
61.在一些实施例中,所述调整所述目标抽样数据的敏感标记包括以下至少一项:修改所述敏感标记中的敏感分类;修改所述敏感标记中的敏感级别信息;针对所述目标抽样数据去除所述敏感标记,并取消存储所述目标抽样数据。在此,相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方式包含于此。
62.在一些实施例中,所述设备还用于:根据所述敏感级别信息,调整所述数据库的抽样率,使得后续使用调整后的抽样率对所述数据库的新日志数据进行抽样采集。在此,相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方式包含于此。
63.除上述各实施例介绍的方法和设备外,本技术还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机代码,当所述计算机代码被执行时,如前任一项所述的方法被执行。
64.本技术还提供了一种计算机程序产品,当所述计算机程序产品被计算机设备执行时,如前任一项所述的方法被执行。
65.本技术还提供了一种计算机设备,所述计算机设备包括:
66.一个或多个处理器;
67.存储器,用于存储一个或多个计算机程序;
68.当所述一个或多个计算机程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如前任一项所述的方法。
69.图4示出了可被用于实施本技术中所述的各个实施例的示例性系统;
70.如图4所示在一些实施例中,系统300能够作为各所述实施例中的任意一个设备。在一些实施例中,系统300可包括具有指令的一个或多个计算机可读介质(例如,系统存储器或nvm/存储设备320)以及与该一个或多个计算机可读介质耦合并被配置为执行指令以实现模块从而执行本技术中所述的动作的一个或多个处理器(例如,(一个或多个)处理器305)。
71.对于一个实施例,系统控制模块310可包括任意适当的接口控制器,以向(一个或多个)处理器305中的至少一个和/或与系统控制模块310通信的任意适当的设备或组件提供任意适当的接口。
72.系统控制模块310可包括存储器控制器模块330,以向系统存储器315提供接口。存储器控制器模块330可以是硬件模块、软件模块和/或固件模块。
73.系统存储器315可被用于例如为系统300加载和存储数据和/或指令。对于一个实施例,系统存储器315可包括任意适当的易失性存储器,例如,适当的dram。在一些实施例中,系统存储器315可包括双倍数据速率类型四同步动态随机存取存储器(ddr4sdram)。
74.对于一个实施例,系统控制模块310可包括一个或多个输入/输出(i/o)控制器,以向nvm/存储设备320及(一个或多个)通信接口325提供接口。
75.例如,nvm/存储设备320可被用于存储数据和/或指令。nvm/存储设备320可包括任意适当的非易失性存储器(例如,闪存)和/或可包括任意适当的(一个或多个)非易失性存储设备(例如,一个或多个硬盘驱动器(hdd)、一个或多个光盘(cd)驱动器和/或一个或多个数字通用光盘(dvd)驱动器)。
76.nvm/存储设备320可包括在物理上作为系统300被安装在其上的设备的一部分的存储资源,或者其可被该设备访问而不必作为该设备的一部分。例如,nvm/存储设备320可通过网络经由(一个或多个)通信接口325进行访问。
77.(一个或多个)通信接口325可为系统300提供接口以通过一个或多个网络和/或与任意其他适当的设备通信。系统300可根据一个或多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的一个或多个组件进行无线通信。
78.对于一个实施例,(一个或多个)处理器305中的至少一个可与系统控制模块310的一个或多个控制器(例如,存储器控制器模块330)的逻辑封装在一起。对于一个实施例,(一个或多个)处理器305中的至少一个可与系统控制模块310的一个或多个控制器的逻辑封装在一起以形成系统级封装(sip)。对于一个实施例,(一个或多个)处理器305中的至少一个可与系统控制模块310的一个或多个控制器的逻辑集成在同一模具上。对于一个实施例,(一个或多个)处理器305中的至少一个可与系统控制模块310的一个或多个控制器的逻辑集成在同一模具上以形成片上系统(soc)。
79.在各个实施例中,系统300可以但不限于是:服务器、工作站、台式计算设备或移动计算设备(例如,膝上型计算设备、手持计算设备、平板电脑、上网本等)。在各个实施例中,系统300可具有更多或更少的组件和/或不同的架构。例如,在一些实施例中,系统300包括一个或多个摄像机、键盘、液晶显示器(lcd)屏幕(包括触屏显示器)、非易失性存储器端口、多个天线、图形芯片、专用集成电路(asic)和扬声器。
80.需要注意的是,本技术可在软件和/或软件与硬件的组合体中被实施,例如,可采
用专用集成电路(asic)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本技术的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本技术的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,ram存储器,磁或光驱动器或软磁盘及类似设备。另外,本技术的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
81.另外,本技术的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本技术的方法和/或技术方案。本领域技术人员应能理解,计算机程序指令在计算机可读介质中的存在形式包括但不限于源文件、可执行文件、安装包文件等,相应地,计算机程序指令被计算机执行的方式包括但不限于:该计算机直接执行该指令,或者该计算机编译该指令后再执行对应的编译后程序,或者该计算机读取并执行该指令,或者该计算机读取并安装该指令后再执行对应的安装后程序。在此,计算机可读介质可以是可供计算机访问的任意可用的计算机可读存储介质或通信介质。
82.通信介质包括藉此包含例如计算机可读指令、数据结构、程序模块或其他数据的通信信号被从一个系统传送到另一系统的介质。通信介质可包括有导的传输介质(诸如电缆和线(例如,光纤、同轴等))和能传播能量波的无线(未有导的传输)介质,诸如声音、电磁、rf、微波和红外。计算机可读指令、数据结构、程序模块或其他数据可被体现为例如无线介质(诸如载波或诸如被体现为扩展频谱技术的一部分的类似机制)中的已调制数据信号。术语“已调制数据信号”指的是其一个或多个特征以在信号中编码信息的方式被更改或设定的信号。调制可以是模拟的、数字的或混合调制技术。
83.作为示例而非限制,计算机可读存储介质可包括以用于存储诸如计算机可读指令、数据结构、程序模块或其它数据的信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动的介质。例如,计算机可读存储介质包括,但不限于,易失性存储器,诸如随机存储器(ram,dram,sram);以及非易失性存储器,诸如闪存、各种只读存储器(rom,prom,eprom,eeprom)、磁性和铁磁/铁电存储器(mram,feram);以及磁性和光学存储设备(硬盘、磁带、cd、dvd);或其它现在已知的介质或今后开发的能够存储供计算机系统使用的计算机可读信息/数据。
84.在此,根据本技术的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本技术的多个实施例的方法和/或技术方案。
85.对于本领域技术人员而言,显然本技术不限于上述示范性实施例的细节,而且在不背离本技术的精神或基本特征的情况下,能够以其他的具体形式实现本技术。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本技术的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本技术内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献