一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种互联网重要基础设施知识图谱构建方法与装置与流程

2021-10-16 04:24:00 来源:中国专利 TAG:互联网 图谱 网络安全 基础设施 装置

技术特征:
1.一种互联网重要基础设施知识图谱构建方法,其特征在于,包括以下步骤:步骤s101:基于对所述互联网重要基础设施的要素分析,构建包含用户角色层、网络服务层、地理链路层和脆弱信息层的互联网重要基础设施本体模型;所述互联网重要基础设施是包含域名系统、web服务和网络地址进行互联网信息交换的重要服务集合;步骤s102:获取所述互联网重要基础设施的各项数据,针对所述各项数据包含的结构化、半结构化数据,基于预设提取规则,进行知识抽取;步骤s103:使用neo4j图数据库存储所述知识图谱,具有全库导入和增量导入两种导入方式,根据导入场景的不同,使用相应的导入方式,形成互联网信息基础设施知识图谱。2.如权利要求1所述的互联网重要基础设施知识图谱构建方法,其特征在于,在所述网络服务层中,首先创建节点dns区域,而后针对该dns区域的ns记录和mx记录,创建名称服务器和邮件服务器实体节点,并创建子域名节点;结合dns和现实网络结构,确定dns区域的ns记录、mx记录的关系,dns区域和子域名之间属于控制关系;并添加子域名和子域名之间的cnmae记录和外链关系;针对开启web服务的子域名,根据使用软件服务的版本,判断其可能存在的漏洞,进而通过关系使得漏洞与漏洞节点相关联。3.如权利要求2所述的互联网重要基础设施知识图谱构建方法,其特征在于,所述步骤s102:获取所述互联网重要基础设施的各项数据,针对所述各项数据包含的结构化、半结构化数据,基于预设提取规则,进行知识抽取,包括:对alexa排名前一百万域名的记录进行查询获取,并基于正则表达式对每类数据进行知识抽取,形成网络服务层知识;采用命令获取方式,基于 linux 下 whois命令向 whois 数据库发送查询请求,获取域名的 whois数据;whois数据存在thin和thick两种模式,其中thick模式中所有域名的whois数据格式相同;thin模式中,每个域名的whois数据没有统一的格式,针对thick模式的whois数据基于正则表达式编写知识提取规则进行数据抽取;针对thin模式的数据,使用基于条件随机场构建的模型进行抽取;基于抽取到的数据,形成用户角色层知识;基于爬虫获取每一个ip地址对应的 as 自治域和地理位置信息,形成地理链路层知识;基于爬虫获取的漏洞库的数据,包含了漏洞及与漏洞对应的相关信息,基于正则表达式构成知识抽取规则库,生成与脆弱性相关的实体及关系,通过域名的操作系统、软件版本和开放端口判断可能存在的漏洞,形成网络服务层和脆弱信息层之间的关系。4.一种互联网重要基础设施知识图谱构建装置,其特征在于,所述装置包括:模型建立模块:配置为基于对所述互联网重要基础设施的要素分析,构建包含用户角色层、网络服务层、地理链路层和脆弱信息层的互联网重要基础设施本体模型;所述互联网重要基础设施是包含域名系统、 web 服务和网络地址进行互联网信息交换的重要服务集合;提取模块:配置为获取所述互联网重要基础设施的各项数据,针对所述各项数据包含的结构化、半结构化数据,基于预设提取规则,进行知识抽取;导入模块:配置为使用neo4j图数据库存储所述知识图谱,具有全库导入和增量导入两种导入方式,根据导入场景的不同,使用相应的导入方式,形成互联网信息基础设施知识图谱。5.如权利要求4所述的互联网重要基础设施知识图谱构建装置,其特征在于,在所述网
络服务层中,首先创建节点dns区域,而后针对该dns区域的ns记录和mx记录,创建名称服务器和邮件服务器实体节点,并创建子域名节点;结合dns和现实网络结构,确定dns区域的ns记录、mx记录的关系,dns区域和子域名之间属于控制关系;并添加子域名和子域名之间的cnmae记录和外链关系;针对开启web服务的子域名,根据使用软件服务的版本,判断其可能存在的漏洞,进而通过关系使得漏洞与漏洞节点相关联。6.如权利要求5所述的互联网重要基础设施知识图谱构建装置,其特征在于,所述提取模块,对alexa排名前一百万域名的记录进行查询获取,并基于正则表达式对每类数据进行知识抽取,形成网络服务层知识;采用命令获取方式,基于 linux 下 whois 命令向 whois 数据库发送查询请求,获取域名的 whois数据;whois数据存在thin和thick两种模式,其中thick模式中所有域名的whois数据格式相同;thin模式中,每个域名的whois数据没有统一的格式,针对thick模式的whois数据基于正则表达式编写知识提取规则进行数据抽取;针对thin模式的数据,使用基于条件随机场构建的模型进行抽取;基于抽取到的数据,形成用户角色层知识;基于爬虫获取每一个ip地址对应的 as 自治域和地理位置信息,形成地理链路层知识;基于爬虫获取的漏洞库的数据,包含了漏洞及与漏洞对应的相关信息,基于正则表达式构成知识抽取规则库,生成与脆弱性相关的实体及关系,通过域名的操作系统、软件版本和开放端口判断可能存在的漏洞,形成网络服务层和脆弱信息层之间的关系。7.一种互联网重要基础设施知识图谱构建系统,其特征在于,包括:处理器,用于执行多条指令;存储器,用于存储多条指令;其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行如权利要求1

3之任一项的互联网重要基础设施知识图谱构建装置。8.一种计算机可读存储介质,其特征在于,所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行如权利要求1

3之任一项的互联网重要基础设施知识图谱构建装置。

技术总结
本发明提供一种互联网重要基础设施知识图谱构建方法及装置,所述方法包括:构建互联网重要基础设施本体模型,基于所述互联网重要基础设施本体模型,获取所述互联网基础设施的各项结构化、半结构化数据;基于预设提取规则,从所述结构化、半结构化数据中提取知识,构建知识图谱;使用Neo4j图数据库存储所述知识图谱,具有全库导入和增量导入两种导入方式,根据导入场景的不同,使用相应的导入方式,形成互联网重要基础设施知识图谱。根据本发明的方案,实现将多源异构数据和知识整合成为统一的模型进行分析和利用;实现基于知识图谱的展现方式对网络安全态势进行查询和展现。方式对网络安全态势进行查询和展现。方式对网络安全态势进行查询和展现。


技术研发人员:刘京菊 闫志豪 施凡 薛鹏飞 胡淼 沈毅
受保护的技术使用者:中国人民解放军国防科技大学
技术研发日:2021.09.06
技术公布日:2021/10/15
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜