一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

数据处理方法及装置、电子设备、存储介质与流程

2022-12-10 00:45:23 来源:中国专利 TAG:


1.本技术涉及网络通信技术领域,特别是涉及数据处理方法及装置、电子设备、存储介质。


背景技术:

2.随着网站备案管理工作的深入,要求备案信息的准确率越来越高,而备案信息里的ip地址(internet protocol address,互联网协议地址)的准确性却很难提高,主要原因是当前工信部的备案规则要求只备案一级域名,对应的ip地址却是所有使用的ip地址(包括各子域名对应的ip地址)。
3.当已备案的一级域名中任意一个子域名的ip地址发生了变化,就会造成备案ip地址信息不准确;比如,如果已备案的一级域名启用了新的子域名,并且绑定了一个新的ip地址,则会造成备案ip地址信息不准确。
4.需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。


技术实现要素:

5.鉴于上述问题,提出了本技术以便提供克服上述问题或者至少部分地解决上述问题的数据处理方法及装置、电子设备、存储介质,包括:
6.一种数据处理方法,所述方法包括:
7.获取活跃域名,并将所述活跃域名添加到数据字典中;
8.依次解析所述数据字典中的活跃域名对应的ip地址,并判断所述ip地址是否已备案;
9.当所述ip地址未备案时,则验证所述ip地址是否正常;
10.若正常,则将所述ip地址确定为待备案ip地址。
11.可选地,在所述依次解析所述数据字典中的活跃域名对应的ip地址,并判断所述ip地址是否已备案之前,所述方法还包括:
12.依次判断所述数据字典中的活跃域名与信任度字典中的参考域名是否匹配;所述信任度字典用于存储已备案的ip地址对应的域名;
13.将匹配的活跃域名从所述数据字典中删除。
14.可选地,在所述依次解析所述数据字典中的活跃域名对应的ip地址,并判断所述ip地址是否已备案之后,所述方法还包括:
15.若所述ip地址已备案,则将所述ip地址对应的活跃域名确定为参考域名,并添加到所述信任度字典中。
16.可选地,所述方法还包括:
17.根据所述信任度字典中各个参考域名添加到所述信任度字典中的时长,确定各个所述参考域名的信任度;所述时长越长,对应的信任度越低;
18.将所述信任度小于预设信任度对应的参考域名从所述信任度字典中删除。
19.可选地,所述依次判断所述数据字典中的活跃域名与信任度字典中的参考域名是否匹配,包括:
20.依次判断所述数据字典中的活跃域名与信任度字典中信任度大于预设阈值的参考域名是否匹配。
21.可选地,所述获取活跃域名,并将所述活跃域名添加到数据字典中,包括:
22.获取已备案的域名,并依据所述已备案的域名生成以所述已备案的域名为键、对应列表为值的数据字典;
23.从信安系统获取活跃域名,并根据所述活跃域名对应的已备案的域名,将所述活跃域名添加到所述数据字典对应的列表中。
24.可选地,所述从信安系统获取活跃域名,并根据所述活跃域名对应的已备案的域名,将所述活跃域名添加到所述数据字典对应的列表中,包括:
25.读取信安系统的日志文件,并从所述日志文件中提取活跃域名;
26.将去重处理后的活跃域名添加到所述数据字典对应的列表中。
27.可选地,所述方法还包括:
28.将所述待备案ip地址和对应的相关信息添加到预设数据表中,所述相关信息包括域名;
29.在对应的显示界面中显示所述预设数据表,或将所述预设数据表发送至目标终端。
30.可选地,所述相关信息还包括ip归属;所述方法还包括:
31.当所述ip地址未备案时,根据所述ip地址的内容,确定所述ip地址对应的ip归属。
32.一种数据处理装置,所述装置包括:
33.活跃域名获取模块,用于获取活跃域名,并将所述活跃域名添加到数据字典中;
34.地址解析判断模块,用于依次解析所述数据字典中的活跃域名对应的ip 地址,并判断所述ip地址是否已备案;
35.未备案地址验证模块,用于当所述ip地址未备案时,则验证所述ip地址是否正常;
36.待备案地址确定模块,用于若所述ip地址正常,则将所述ip地址确定为待备案ip地址。
37.可选地,所述装置还包括:
38.活跃域名过滤模块,用于依次判断所述数据字典中的活跃域名与信任度字典中的参考域名是否匹配;所述信任度字典用于存储已备案的ip地址对应的域名;
39.活跃域名删除模块,用于将匹配的活跃域名从所述数据字典中删除。
40.可选地,所述装置还包括:
41.信任度字典更新模块,用于若所述ip地址已备案,则将所述ip地址对应的活跃域名确定为参考域名,并添加到所述信任度字典中。
42.可选地,所述装置还包括:
43.信任度更新模块,用于根据所述信任度字典中各个参考域名添加到所述信任度字典中的时长,确定各个所述参考域名的信任度;所述时长越长,对应的信任度越低;
44.参考域名删除模块,用于将所述信任度小于预设信任度对应的参考域名从所述信
任度字典中删除。
45.可选地,所述活跃域名过滤模块,用于依次判断所述数据字典中的活跃域名与信任度字典中信任度大于预设阈值的参考域名是否匹配。
46.可选地,所述活跃域名获取模块901,包括:
47.数据字典生成子模块,用于获取已备案的域名,并依据所述已备案的域名生成以所述已备案的域名为键、对应列表为值的数据字典;
48.数据字典填充子模块,用于从信安系统获取活跃域名,并根据所述活跃域名对应的已备案的域名,将所述活跃域名添加到所述数据字典对应的列表中。
49.可选地,数据字典填充子模块,包括:
50.提取单元,用于读取信安系统的日志文件,并从所述日志文件中提取活跃域名;
51.去重单元,用于将去重处理后的活跃域名添加到所述数据字典对应的列表中。
52.可选地,所述装置还包括:
53.数据表生成模块,用于将所述待备案ip地址和对应的相关信息添加到预设数据表中,所述相关信息包括域名;
54.发送显示模块,用于在对应的显示界面中显示所述预设数据表,或将所述预设数据表发送至目标终端。
55.可选地,所述相关信息还包括ip归属;所述装置还包括:
56.ip归属确定模块,用于当所述ip地址未备案时,根据所述ip地址的内容,确定所述ip地址对应的ip归属。
57.一种电子设备,包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的数据处理方法的步骤。
58.一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上所述的数据处理方法的步骤。
59.本技术具有以下优点:
60.在本技术实施例中,通过获取活跃域名,并将活跃域名添加到数据字典中;依次解析数据字典中的活跃域名对应的ip地址,并判断ip地址是否已备案;当ip地址未备案时,则验证ip地址是否正常;若正常,则将ip地址确定为待备案ip地址;从而实现将未备案且可以正常使用的ip地址查找出来,以基于查找出来的待备案ip地址来督促对应的负责人进行备案,从而提高备案信息的准确率。
附图说明
61.为了更清楚地说明本技术的技术方案,下面将对本技术的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
62.图1为本技术实施例的一种数据处理系统的系统框图;
63.图2为本技术实施例的一种数据处理系统的连接关系示意图;
64.图3为本技术实施例的一种数据处理方法的步骤流程图;
65.图4为本技术实施例的一种数据处理方法中获取活跃域名的步骤流程示意图;
66.图5为本技术实施例的一种数据处理方法中信任度字典更新的步骤流程示意图;
67.图6为本技术实施例的一种数据处理方法中分析ip地址的步骤流程示意图;
68.图7为本技术实施例的一种数据处理方法中生成记录待备案ip地址的数据表及发送数据表的步骤流程示意图;
69.图8为本技术实施例的一种数据处理方法的业务逻辑示意图;
70.图9为本技术实施例的一种数据处理装置的结构框图。
具体实施方式
71.为使本技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本技术作进一步详细的说明。显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
72.为便于本领域技术人员理解本技术,下面对本技术下述各实施例中涉及的术语或名词做出解释:
73.ip地址:本技术中所指的ip地址是指互联网协议地址,是ip协议提供的一种统一的地址格式,它为互联网商的每一个网络和每一台主机分配一个逻辑地址,以此来在互联网上进行唯一标识,所有的网络通信都是基于ip 地址进行的。
74.域名:本技术实施例中所指的域名是指,是由一串用点分隔的名字组成的互联网上某一台计算机或计算机组的名称,用于在数据传输时对计算机的定位标识(有时也指地理位置)。域名采用分级结构,最高级为根域名,其次为顶级域名,再次为一级域名,二级域名,三级域名等。其中二级以上域名也可以称为一级域名的子域名。例如,“.”为根域名,“.com”、“.cn”为顶级域名,“xx.com”为一级域名,“www.xx.com”为子域名。
75.当前工信部的备案规则要求只备案一级域名,对应的ip地址却是所有使用的ip地址。例如,某购物网站a的一级域名为“xx.com”,而该a网站在使用中有多个二级域名(即子域名)如“www.xx.com”、“buyertrade.xx.com”。各个域名对应使用的ip地址如下表1所示。
76.表1
77.域名ip地址xx.com140.xxx.xxx.96www.xx.com124.xxx.40.232buyertrade.xx.com111.xxx.55.172
78.从表1中可知,域名“xx.com”对应使用的ip地址是140.xxx.xxx.96;域名“www.xx.com”使用的ip地址是124.xxx.xxx.40.232;域名“buyertrade.xx.com”对应使用的ip地址是111.xxx.xx.172。
79.而该a网站在备案时,仅备案一级域名,而备案的ip地址却是所有ip 地址,a网站的备案信息如下表2所示。
80.表2
81.备案域名备案ip地址xx.com140.xxx.xxx.96;124.xxx.40.232;111.xxx.55.172
82.如果在使用a网站的过程中,任意一个子域名的ip地址发生了变化,比如“buyertrade.xx.com”绑定了新的ip地址,就造成的备案ip地址信息不准确;同样如果a网站又启用了新的子域名,而且绑定了一个新的ip地址,也会造成备案ip地址信息不准确。
83.发明人发现,要提高网站备案ip地址准确率,首先要根据备案的域名获取到相应网站的所有子域名,再通过dns解析发现每个域名(包括一级域名和子域名)对应的ip地址,然后将解析得到的ip地址与备案的ip地址进行比较,从而发现未备案ip地址,再引导相关人员基于未备案ip地址进行备案,可以提高网站备案ip地址准确率。
84.因此,本技术实施例的主要技术构思之一在于,通过获取活跃域名,对活跃域名进行解析确定活跃域名对应的ip地址,将该ip地址与已备案的ip 地址进行对比,判断该解析出来的ip地址是否备案,若未备案,则进一步验证该ip地址是否可以正常访问,若可以正常访问,则将该ip地址确定为待备案ip地址,通过待备案ip地址来引导相关负责人进行备案,可以提高网站备案ip地址准确率。
85.参照图1和图2,图1示出了本技术实施例中提供的一种数据处理方法对应的系统框图,即一种数据处理系统(或称提高网站备案ip地址准确率的系统)的系统框图;图2示出了本技术实施例中的数据处理系统与其他网络系统的关系示意图。数据处理系统可以分别与信安系统以及运营商备案系统连接,并且可以对外发送邮件。
86.该数据处理系统包括信安系统日志接入模块、数据分析模块、数据库模块以及数据处理模块。其中,信安系统日志接入模块包括活跃域名提取子模块、提取有效域名子模块以及数据去重子模块等,用于对活跃域名进行采集、清洗去重,得出以已备案域名为键、所有子域名为值的键值对字典(即数据字典)。数据分析模块包括信任度数据更新子模块、数据信任度分析子模块以及数据分析子模块等,用于进行按时间周期(如每日)循环迭代更新信任度值,并通过分析来增补或删除信任度数据(即信任度字典中的参考域名)。数据库模块用于存储信任度数据、本地接入商ip地址段、本地接入增值业务商ip地址段。数据处理模块包括dns解析子模块、数据信任度打分更新及存储子模块,验证子模块、备案域名ip不匹配数据生成子模块、发送邮件子模块、管理页面提示子模块等,用于按时间周期(如每日)循环迭代处置,对从日志提取到的活跃域名进行去重,记录到以已备案的域名为键、所有子域名为值的数据字典中,并利用信任度字典对数据字典中的域名进行清洗,再对数据字典中剩余的域名进行dns解析处理,同时依据解析出的已备案ip地址来更新信任度字典,对未备案的ip地址进行验证,最终获得用于记录与已备案的域名的ip地址不一致的待备案ip地址的预设数据表。
87.下面通过具体的实施例对具体的实现方式进行详细介绍。
88.参照图3,示出了本技术一实施例提供的一种数据处理方法的步骤流程图,该方法的执行主体可以为数据处理系统,也可以为具有数据处理能力的各种服务器/终端设备,也可以为集成在这些服务器/终端设备上的装置或芯片,用于确定待备案ip地址,以有效提高网站备案ip地址准确率。为方便描述,下面以执行主体为数据处理系统为例进行示例性解释说明。该数据处理方法可以包括如下步骤:
89.步骤301,获取活跃域名,并将所述活跃域名添加到数据字典中。
90.本技术实施例采用数据字典来记录活域名的相关信息。通过获取活跃域名的方式来得到网站的各个域名信息。
91.步骤302,依次解析所述数据字典中的活跃域名对应的ip地址,并判断所述ip地址是否已备案。
92.在获取到活跃域名后,可以对每个活跃域名做dns解析,得到各个活跃域名对应的ip地址,进而判断该ip地址是否备案。
93.步骤303,当所述ip地址未备案时,则验证所述ip地址是否正常。
94.当判断出ip地址未备案时,需要进一步验证该ip地址是否可以正常访问。
95.步骤304,若正常,则将所述ip地址确定为待备案ip地址。
96.若上述未备案的ip地址可以正常访问,则将该类的ip地址确定为待备案ip地址。在对所有的ip地址进行分析处理之后,可以确定所有待备案ip 地址,以基于所有待备案ip地址来引导对应的网站进行备案。
97.本技术实施例通过获取活跃域名,并将活跃域名添加到数据字典中;依次解析数据字典中的活跃域名对应的ip地址,并判断ip地址是否已备案;当ip地址未备案时,则验证ip地址是否正常;若正常,则将ip地址确定为待备案ip地址;从而实现将未备案且可以正常使用的ip地址查找出来,以基于查找出来的待备案ip地址来督促对应的接入商进行备案,从而提高备案信息的准确率。
98.下面,将对本示例性实施例中数据处理方法作进一步地说明。
99.在步骤301中,获取活跃域名,并将所述活跃域名添加到数据字典中。
100.本技术实施例中,活跃域名可以指在一定时间内被访问的域名(包括一级域名和子域名)。其中,该一定时间可以根据实际需求进行调整,例如,一定时间可以为最近一天或最近一个月等,也可以与执行本技术数据处理方法的周期相关,示例性地,本技术数据处理方法的执行周期可以是一天,即每天执行一次本技术数据处理方法,则活跃域名是最近一天内被访问的域名。本技术通过提取活跃域名的方式可以得到网站的所有域名,以便后续通过解析域名对应的ip地址来发现未备案的ip地址。
101.需要说明的是,在其他实施例中,也可以通过爬虫爬取已备案的域名对应的网站内容,从而发现网站内链接的子域名,再对发现的子域名的网站进行递归爬取,再获得已备案的域名的子域名。但是当子域名没有在其他子域名或一级域名的网站内建立链接时,采用该实施例爬虫爬取的方式则无法获取到。
102.在本实施例中,数据处理系统可以与信安系统通信连接,信安系统具有访问日志留存的功能,由于接入商网内使用的域名(包含一级域名和子域名) 产生访问,至少会有开发者的测试访问,只要访问就必然经过信安系统,就会有访问日志留存,因此,可以通过信安系统的日志文件中获取活跃域名,并且可以确保获取到所有的域名(包括一级域名和子域名)。
103.为了便于分析ip地址是否已备案,在本技术一可选实施例中,上述获取活跃域名,并将所述活跃域名添加到数据字典中,可以包括:
104.获取已备案的域名,并依据所述已备案的域名生成以所述已备案的域名为键、对应列表为值的数据字典;
105.从信安系统获取活跃域名,并根据所述活跃域名对应的已备案的域名,将所述活跃域名添加到所述数据字典对应的列表中。
106.在本实施例中,数据处理系统可以与运营商的备案系统通信连接,从运营商的备
案系统读取所有已备案的域名,形成以已备案的域名为键,以对应列表为值的数据字典。当数据处理系统初次运行时,即首次执行本实施例的数据处理方法时,生成的数据字典中各个已备案的域名对应的列表为空。通过读取信安系统的日志文件,可以从中提取出活跃域名,并分析提取出的活跃域名,确定该活跃域名属于哪个已备案的域名的子域名,再根据其所属的已备案的域名,将该活跃域名添加到数据字典对应的列表中。
107.进一步地,考虑到日志文件一般存在大量重复的域名,在本技术一可选实施例中,上述从信安系统获取活跃域名,并根据所述活跃域名对应的已备案的域名,将所述活跃域名添加到所述数据字典对应的列表中可以包括:
108.读取信安系统的日志文件,并从所述日志文件中提取活跃域名;
109.将去重处理后的活跃域名添加到所述数据字典对应的列表中。
110.本实施例在将活跃域名添加到数据字典的过程中,对活跃域名进行了去重处理,以减少数据字典中记录的域名的数量,进而减少重复执行相同的步骤。
111.在一示例中,上述将去重处理后的活跃域名添加到所述数据字典对应的列表中,可以包括:
112.判断所述活跃域名是否已存在于所述数据字典对应的列表中;
113.若存在,则忽略所述活跃域名;
114.若不存在,则将所述活跃域名添加到所述数据字典对应的列表中。
115.其中,数据字典对应的列表是指该活跃域名所属的已备案的域名所对应的列表。在本示例中,对从信安系统的日志文件中提取出的每个活跃域名,先判断该活跃域名是否记录在数据字典对应的列表中,若是,则说明该活跃域名为重复提取的,可以忽略该活跃域名,不作处理;若否,则说明该活跃域名是首次提取出的,则将该活跃域名记录到数据字典对应的列表中;从而实现对提取出的活跃域名进行去重处理,以减少数据字典中记录的活跃域名的数量。
116.示例性地,如图4所示,数据处理系统获取活跃域名的流程开始后,可以包括如下步骤:
117.步骤401,读取备案数据,形成以已备案的域名为键、空列表为值的键值对字典(即数据字典);具体地,数据处理系统首次执行时,从备案系统中读取已备案的域名,将已备案的域名全部转小写后,生成以已备案的域名为键,空列表为值的数据字典。
118.步骤402,设置一个线程安全通道ch用于存放并发执行结果的数据;其中,并发执行结果的数据为步骤403的执行结果。
119.步骤403,高并发读取日志文件(默认设置20个线程读取日志文件),每个线程的处理结果(即读取到的活跃域名)按顺序存入通道ch中。
120.步骤404,从通道ch里提取一条域名;具体地,主线程按照通道ch 中存储的活跃域名的顺序依次将通道ch里存储的活跃域名提取出来,并且,每提取出一个活跃域名,就将该活跃域名全部转小写;
121.步骤405,判断域名是否是备案域名的子域名;若是,则执行步骤406;若否,则执行步骤407。
122.步骤406,判断是否存在数据字典对应的列表里;若是,说明该域名已记录到数据字典中,可以不用处理,则执行步骤407;若否,则执行步骤408;
123.步骤407,判断是否还有活跃域名;若是,则执行步骤404;若否,则结束;
124.步骤408,加入到数据字典的对应列表里;即将不存在数据字典对应的列表里的域名,添加到数据字典的对应列表里;返回步骤404继续从通道ch里提取下一条域名。
125.在其他示例中,也可以先从信安系统的日志文件中提取出所有活跃域名,再对所有活跃域名进行去重处理,将去重处理后得到的活跃域名依次添加到数据字典对应的列表中。
126.在其他实施例中,还可以先将从信安系统的日志文件中提取出的所有活跃域名添加到数据字典对应的列表中,然后再对数据字典中各个列表中记录的域名进行去重处理;等等。
127.在步骤302中,依次解析所述数据字典中的活跃域名对应的ip地址,并判断所述ip地址是否已备案。
128.在得到添加了活跃域名的数据字典后,可以依次对数据字典中记录的活跃域名进行dns(domain name system,域名系统)解析,得到对应的ip 地址。数据处理系统可以与运营商的备案系统通信连接,从运营商的备案系统读取所有已备案的域名和已备案的ip地址。依据获得的已备案的ip地址,判断解析出来的ip地址是否已备案。
129.考虑到在实际应用中,ip地址未备案,往往是因为子域名发生变化造成的,比如新启用一个子域名,一般会配一个新的ip地址,而新的ip地址一般不在备案系统里,这样就造成备案ip地址不准确。而已经存在的子域名对应的ip地址一般都很稳定,极少发生变化,因而没必要对这些稳定的子域名高频率地进行重复的核查,为了减少重复核查造成的资源浪费,在本技术一可选实施例中,在上述步骤302之前,还可以包括:
130.依次判断所述数据字典中的活跃域名与信任度字典中的参考域名是否匹配;所述信任度字典用于存储已备案的ip地址对应的域名;
131.将匹配的活跃域名从所述数据字典中删除。
132.本实施例通过信任度字典来减少重复核查,降低了数据的处理量,提高了数据处理效率。具体地,在数据处理系统初次运行时,可以生成一个空的信任度字典,系统启动后,在首次判断数据字典中的活跃域名与信任度字典中的参考域名是否匹配时,由于此时信任度字典为空,因此,需要解析数据字典中的所有活跃域名对应的ip地址,判断ip地址是否备案,若备案,则将该已备案的ip地址对应的活跃域名确定为参考域名,并添加到信任度字典中,因此,信任度字典中记录的是已备案的ip地址对应的域名。当再次执行数据处理方法时,由于信任度字典中已经记录有之前确定出的已备案的 ip地址对应的域名,因此,可以通过信任度字典对当前数据字典中的活跃域名进行筛选,将与信任度字典中存储的参考域名匹配的活跃域名从数据字典中删除,即认为与信任度字典中存储的参考域名匹配的活跃域名对应的ip 地址是已备案的ip地址,因此,不需要对此类的活跃域名进行dns解析,可以提高数据处理的效率。
133.进一步地,为了提高信任度字典中存储的参考域名的可信度,在本技术一可选实施例中,还可以包括:
134.根据所述信任度字典中各个参考域名添加到所述信任度字典中的时长,确定各个所述参考域名的信任度;所述时长越长,对应的信任度越低;
135.将所述信任度小于预设信任度对应的参考域名从所述信任度字典中删除。
136.在本实施例中,将信任度与参考域名的时长相关联,参考域名的时长越长,说明距离最近一次通过dns解析该参考域名对应的ip地址、将该参考域名对应的ip地址与备案系统中已备案的ip地址进行匹配,确定该参考域名对应的ip地址已备案的时间越长,考虑到域名也存在更换绑定的ip地址的可能性,因此,在本技术实施例中,需要对信任度字典中的参考域名进行定期更新,即当参考域名记录到信任度字典中的时长达到预设时长时,将该参考域名从信任度字典中删除,以便下次从日志文件中再次提取到该域名时,需要重新通过dns解析的方式来确认该域名是否备案,从而提高信任度字典的可信度。
137.示例性地,在将参考域名添加到信任度字典时,可以设置该参考域名的信任度为100,参考域名在信任度字典中的时长每增加一天,该参考域名的信任度值减1,假设预设信任度为1,即当参考域名的信任度减为0时,将该参考域名删除。
138.如图5所示,数据处理系统更新信任度字典的流程可以包括如下步骤:
139.步骤501,从数据库提取信任度表形成信任度字典;即数据处理系统通过数据库中的信任度表来存储参考域名,以及参考域名对应的信任度;通过提取信任度表可以生成信任度字典。
140.步骤502,定期对信任度表中的域名的信任度减一,并更新数据库;即根据时间来更新信任度表中参考域名的信任度,示例性地,可以每天对信任度表中的参考域名的信任度减一,同时更新信任度字典。
141.步骤503,把已备案的ip地址对应的域名加入信任度表,并更新数据库;即将dns解析得到的、与已备案ip地址匹配的ip地址对应的域名添加到信任度表中,同时将该新添加的域名对应的信任度设置为最高值,例如100;同时更新信任度字典。
142.步骤504,把信任度低于预设阈值的项删除,并更新数据库。随着时间的推移,信任度表中的参考域名的信任度也在不断降低,当参考域名的信任度低于预设阈值时,则将该信任度低于预设阈值的参考域名所在项(即参考域名和对应的信任度)从信任度表中删除,同时更新信任度字典。
143.可选地,在一些场景中,为进一步提高已备案的ip地址的准确率,上述依次判断所述数据字典中的活跃域名与信任度字典中的参考域名是否匹配,可以包括:
144.依次判断所述数据字典中的活跃域名与信任度字典中信任度大于预设阈值的参考域名是否匹配。
145.在本实施例中,通过将数据字典中的活跃域名与信任度字典中信任度大于预设阈值的参考域名进行匹配,来判断活跃域名对应的ip地址是否备案,与上述示例中,将数据字典中的活跃域名与信任度字典中的参考域名进行匹配,来判断活跃域名对应的ip地址是否备案相比,本实施例通过信任度的预设阈值,可以提高判断结果的准确性。本实施例可以根据不同场景设置不同的信任度的预设阈值,以便实现用同一个信任度字典来适应不同场景对已备案的ip地址的准确率的要求。
146.需要说明的是,在其他实施例中,也可以通过提高预设信任度的方式来提高判断结果的准确性,即通过缩短信任度字典中参考域名的存储时间来提高判断结果的准确性。
147.在步骤303中,当所述ip地址未备案时,则验证所述ip地址是否正常。
148.本技术实施例在确定解析出的ip地址未备案时,需要进一步验证该ip 地址是否正常,即验证该ip地址是否可以正常访问。示例性地,可以通过对解析出该ip地址对应的域
名做http/https(hyper text transferprotocol/hyper text transfer protocol over securesocket layer,超文本传输协议/超文本传输安全协议)验证,即向服务器发送http/https网络请求,根据服务器是否响应该请求来确定该ip地址是否正常。
149.在步骤304中,若正常,则将所述ip地址确定为待备案ip地址。
150.当ip地址未备案且能够正常访问时,则说明该类ip地址是属于需要备案而未备案的ip地址类,因此,将该ip地址确定为待备案ip地址。
151.当ip地址未备案且不能够正常访问时,可以认为该ip地址尚未真正使用,对于此类的ip地址可以不用处理。
152.进一步地,在确定出待备案ip地址后,可以将待备案ip地址和对应的相关信息添加到预设数据表中;在对应的显示界面中显示所述预设数据表,或将所述预设数据表发送至目标终端。示例性地,数据处理系统可以将预设数据表通过邮件等形式发送至目标终端,以便于使用目标终端的工作人员可以接收到该预设数据表,并依据该预设数据表做出相应的处理(如促进待备案ip地址实现备案,或者,对待备案ip地址进行关停处理等)。其中,相关信息可以包括域名,以便于相关工作人员可以直观地得到待备案ip地址和对应的域名,以促使该类待备案的ip地址可以尽快备案。以相关工作人员是运营商的工作人员为例,通过预设数据表中的域名可以确定未备案ip 地址对应的网站,进而通知该网站的负责人对该未备案ip地址进行备案处理。
153.为使相关人员可以更方便地从预设数据表中确定各个待备案ip地址对应的网站,在预设数据表中还可以包括ip归属项,即相关信息还可以包括 ip归属。具体地,当确定ip地址为待备案ip地址时,还可以根据本地接入商的ip地址段,判断该ip地址是否是本地接入商ip地址,若不是,则在ip 归属项中标记为“非本地接入ip”;若是本地接入商ip地址,则进一步判断该ip地址是否是本地接入增值业务商ip地址,若是,则在ip归属项中标记“isp”,若否,则在ip归属项中标记“本地接入”。
154.需要说明的是,对ip地址的ip归属的判断也可以在验证ip地址是否正常之前,即在确定ip地址为未备案的ip地址时,即判断ip地址是本地接入还是非本地接入还是isp。
155.如图6所示,数据处理系统分析ip地址的流程可以包括如下步骤:
156.步骤601,取数据字典里的一条数据;具体地,数据处理系统通过读取日志文件获得活跃域名,并将活跃域名填充到数据字典之后,可以依次读取数据字典中的每条数据,一条数据包括一个已备案的域名,及对应的列表。
157.步骤602,判断是否读到数据;若是,则执行步骤603;若否,则执行步骤607。
158.步骤603,读取列表里的域名;具体地,当读取到数据时,依次读取该数据中的列表里的每条域名。
159.步骤604,判断是否读到域名;若是,则执行步骤605;若否,则返回执行步骤601。
160.步骤605,判断是否在信任度字典里,且信任度大于阈值;具体地,在读取到域名后,判断该域名是否在信任度字典里,若在,还可以进一步判断该域名在信任度字典里的信任度是否大于阈值,若大于阈值,则执行步骤606;反之,若该域名不在信任度字典里,或者该域名在信任度字典里的信任度未大于阈值,则执行步骤603。
161.步骤606,从数据字典的列表里删除此域名;具体地,当读取到的域名在信任度字典里且信任度大于阈值,则认为该域名对应的ip地址是已备案的ip地址,因此,可以将该域
名从数据字典的列表里删除。
162.步骤607,对剩余数据,启动高并发dns解析,按照[备案域名,子域名,[解析出来的ip列表]]形成列表放入通道ch里;具体地,在经过上述步骤后,数据字典的列表里的剩余数据可以认为是无法确定其对应的ip地址是否已备案的域名,此时,需要对此类的域名进行dns解析,由于剩余数据一般有多个,为了提高数据处理效率,可以启动高并发dns解析,并按照[备案域名,子域名,[解析出来的ip列表]]的形式形成列表放入通道ch 里。
[0163]
步骤608,主线程从通道ch里读取数据;具体地,通道ch里可以存储有多条步骤607形成的列表,主线程依次从通道ch里读取每一条列表;
[0164]
步骤609,判断是否读到数据;若是,则执行步骤610;若否,说明通道ch里的数据已全部读取完毕,则结束。
[0165]
步骤610,判断此条数据里的所有ip是否在备案系统对应已备案域名的 ip段里;即判断解析出来的ip地址是否已备案。
[0166]
步骤611,判断是否都在;若是,则执行步骤614;若否,则执行步骤 612。
[0167]
步骤612,对不在备案系统里的ip地址,标记其ip归属;具体地,当判断出ip地址为未备案时,根据本地接入商的ip地址段,判断该ip地址是否是本地接入商ip地址,若不是,则标记其ip归属为“非本地接入ip”;若是,则进一步判断该ip地址是否是本地接入增值业务商ip地址,若是,则标记其ip归属为“isp”,若否,则标记其ip归属为“本地接入”。
[0168]
步骤613,把不在备案系统里的ip地址,按照[备案域名,子域名,ip 地址,ip归属]插入列表;具体地,在得到未备案ip地址的ip归属后,按照 [备案域名,子域名,ip地址,ip归属]生成一条数据,插入到最终输出的预设数据表中。
[0169]
步骤614,在信任度字典插入这条子域名,设置信任度,更新数据库;具体地,当判断出解析出来的ip地址为已备案的ip地址时,则将该ip地址对应的域名添加到信任度字典中,并将你其信任度设置为最高值,本实例中,信任度最高值为100。后续根据信任度字典中的域名的存储时长更新对应的信任度,示例性地,每增加一天,对应的信任度减一。
[0170]
在一可选实施例中,为了将待备案ip地址对应的活跃域名保留在数据字典中,可以将未备案且不能够正常访问的ip地址对应的活跃域名,从数据字典中删除;进而再根据数据字典中最终保留的活跃域名按照预设数据表的格式填入到预设数据表中,最后,将预设数据表邮件发送至管理员对应的目标终端。
[0171]
如图7所示,数据处理系统生成记录待备案ip地址的数据表及发送数据表的流程可以包括如下步骤:
[0172]
步骤701,将ip地址未备案的域名数据列表加入并发任务列表;具体地,数据处理系统通过将解析出来的ip地址与已备案的ip地址进行比对,确定出ip地址未备案时,将该ip地址未备案对应的域名数据列表加入并发任务列表,其中,域名数据列表可以包括ip地址及对应的域名。
[0173]
步骤702,启动高并发http/https的80/8080/443端口访问,每个ip的验证结果放入通道ch中;具体地,并发任务列表中具有多个域名数据列表,采用高并发http/https验证方式,可以对多个域名数据列表进行同时验证,验证结果包括ip地址能够正常访问和不能够正常访问两种。
[0174]
步骤703,主线程读取通道ch数据;具体地,通道ch中存储有多个验证结果,主线程
依次从通道ch中读取每一个验证结果。
[0175]
步骤704,判断是否读到数据;若是,则执行步骤705;若否,则说明通道ch中的数据已读取完毕,执行步骤707。
[0176]
步骤705,判断是否是开办网站;若是,则说明验证结果为能够正常访问,执行步骤703;若否,则说明验证结果不能够正常访问,执行步骤706。
[0177]
步骤706,把此条域名从ip地址未备案的域名数据列表中删除;对于验证结果不能够正常访问的ip地址,说明该ip地址尚未开始使用,可以不做处理,因此,将该ip地址对应的域名数据列表删除,只保留ip地址未备案且能够正常访问的域名数据列表。
[0178]
步骤707,将ip地址未备案的域名数据列表生成excel文件;具体地,可以根据所有ip地址未备案且能够正常访问的域名数据列表,按照指定格式生成excel文件,该excel文件用于记录待备案ip地址及相关信息。
[0179]
步骤708,发送邮件给管理员处理;具体地,数据处理系统可以将生成的excel文件通过邮件的形式发送给管理员,以通知管理员进行处理,进而提高网站备案ip地址的准确性。
[0180]
本技术一可选实施例,数据处理系统通过与运营商的备案系统通信,从备案系统中获取已备案的域名,并生成以已备案的域名为键,对应列表为值的数据字典;数据处理系统还生成一个信任度字典,该信任度字典用于存储参考域名以及对应的信任度,其中,信任度字典首次生成时为空;信任度字典中的参考域名是在数据处理系统运行过程中,通过将解析出的ip地址与已备案的ip地址进行比较,确定出已备案的ip地址,进而将已备案的ip地址对应的域名确定为参考域名添加到信任度字典中;而信任度则根据参考域名在信任度字典中的存储时长来确定,存储时长越长,对应的信任度越低。数据处理系统在运行过程中,通过与信安系统通信,从信安系统的日志文件中提取活跃域名,将提取出的活跃域名去重后添加到数据字典对应的列表中;然后根据信任度字典依次对数据字典各个列表中的各个活跃域名进行匹配,将匹配成功的活跃域名从数据字典中删除;接着,对数据字典中剩余的活跃域名进行dns解析,以确定其对应的ip地址,进而根据已备案的ip地址对解析出来的ip地址进行匹配,若匹配成功,则将匹配成功的ip地址对应的域名添加到信任度字典中,并将该域名从数据字典中删除;若匹配不成功则进一步根据本地接入商ip地址段和本地接入增值业务商地址段,确定ip地址的ip归属是本地接入商、本地接入增值业务商或非本地接入商,并进行 ip归属的标记;接着,对与已备案的ip地址匹配不成功的ip地址进行http 和https验证,验证通过则说明该ip地址为需要备案且未备案的ip地址,即待备案ip地址,将所有待备案ip地址及对应的相关信息按照预设格式整理到预设数据表中;最后数据处理系统可以通过邮件将预设数据表发送至相关人员对应的终端,以便相关人员可以基于预设数据表促进待备案ip实现备案,从而提高网站备案ip地址的准确率。
[0181]
为了方便本领域技术人员理解本方案,下面将结合图8对本技术实施例中的数据处理方法进行示例性解释、说明。
[0182]
图8为本技术实施例提供的数据处理方法的业务逻辑示意图,如图8所示,数据处理系统可以设置为每天3:30am启动定时任务,数据处理系统启动后执行过程如下:
[0183]
步骤

、从运营商的备案系统读取所有已备案的域名,形成以已备案的域名为键、空列表为值的数据字典。然后从信安系统的日志文件中读取活跃域名日志数据,并把相应
的活跃域名添加到数据字典对应的列表中,得到的清洗后的数据字典,对应的样例如图8所示。
[0184]
步骤

、读取存储的信任度数据生成信任度字典,信任度字典对应的样例如图8所示。需要说明的是,系统初次运行时,信任度字典为空。
[0185]
步骤

、读取存储的本地接入商ip地址段。
[0186]
步骤

、读取本地接入增值业务服务商的ip地址段数据。
[0187]
步骤

、遍历数据字典每个列表中的域名,查询是否记录在信任度字典中。
[0188]
步骤

、把信任度字典中存在的,或信任度字典中存在且对应的信任度大于或等于预设阈值的域名从数据字典中删除,即数据字典中保留信任度字典不存在或信任度字典中存在但对应的信任度低于预设阈值的域名从数据字典中删除;经该步骤处理后,数据字典的样例从图8中箭头

起始对应的数据字典更新为箭头

的箭头指向的数据字典。
[0189]
步骤

、对更新后的数据字典每个列表中的域名进行dns解析,并判断解析得到的ip地址是否是已备案的ip地址,若不是已备案的ip地址,则根据已读取的本地接入商ip地址段和本地接入增值业务服务商ip地址段确定该ip地址的ip归属;然后执行步骤

;若是已备案的ip地址,则执行步骤


[0190]
步骤

、将该ip地址添加到信任度字典中,并对其信任度进行赋值。
[0191]
步骤

、将添加到信任度字典中的ip地址确定为信任度数据,以更新系统中存储的信任度数据。
[0192]
步骤

、对ip地址进行http/https验证,将验证通过的ip地址确定为待备案ip地址,并将待备案ip地址及其对应的子域名、已备案的域名以及ip归属填入到用于记录待备案ip地址的数据表中,该数据表的样例如图 8所示。
[0193]
相关人员可以根据该数据表联系相关负责人做备案数据的变更,从而提高网站备案ip地址的准确率。
[0194]
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本技术实施例并不受所描述的动作顺序的限制,因为依据本技术实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本技术实施例所必须的。
[0195]
参照图9,示出了本技术的一种数据处理装置实施例的结构框图,与上述数据处理方法实施例相对应,在本实施例中,该装置可以包括如下模块:
[0196]
活跃域名获取模块901,用于获取活跃域名,并将所述活跃域名添加到数据字典中;
[0197]
地址解析判断模块902,用于依次解析所述数据字典中的活跃域名对应的ip地址,并判断所述ip地址是否已备案;
[0198]
未备案地址验证模块903,用于当所述ip地址未备案时,则验证所述ip 地址是否正常;
[0199]
待备案地址确定模块904,用于若所述ip地址正常,则将所述ip地址确定为待备案ip地址。
[0200]
可选地,所述装置还可以包括:
[0201]
活跃域名过滤模块,用于依次判断所述数据字典中的活跃域名与信任度字典中的参考域名是否匹配;所述信任度字典用于存储已备案的ip地址对应的域名;
[0202]
活跃域名删除模块,用于将匹配的活跃域名从所述数据字典中删除。
[0203]
可选地,所述装置还可以包括:
[0204]
信任度字典更新模块,用于若所述ip地址已备案,则将所述ip地址对应的活跃域名确定为参考域名,并添加到所述信任度字典中。
[0205]
可选地,所述装置还可以包括:
[0206]
信任度更新模块,用于根据所述信任度字典中各个参考域名添加到所述信任度字典中的时长,确定各个所述参考域名的信任度;所述时长越长,对应的信任度越低;
[0207]
参考域名删除模块,用于将所述信任度小于预设信任度对应的参考域名从所述信任度字典中删除。
[0208]
可选地,所述活跃域名过滤模块,可以用于依次判断所述数据字典中的活跃域名与信任度字典中信任度大于预设阈值的参考域名是否匹配。
[0209]
可选地,所述活跃域名获取模块901,可以包括:
[0210]
数据字典生成子模块,用于获取已备案的域名,并依据所述已备案的域名生成以所述已备案的域名为键、对应列表为值的数据字典;
[0211]
数据字典填充子模块,用于从信安系统获取活跃域名,并根据所述活跃域名对应的已备案的域名,将所述活跃域名添加到所述数据字典对应的列表中。
[0212]
可选地,数据字典填充子模块,可以包括:
[0213]
提取单元,用于读取信安系统的日志文件,并从所述日志文件中提取活跃域名;
[0214]
去重单元,用于将去重处理后的活跃域名添加到所述数据字典对应的列表中。
[0215]
可选地,所述装置还可以包括:
[0216]
数据表生成模块,用于将所述待备案ip地址和对应的相关信息添加到预设数据表中,所述相关信息包括域名;
[0217]
发送显示模块,用于在对应的显示界面中显示所述预设数据表,或将所述预设数据表发送至目标终端。
[0218]
可选地,所述相关信息还包括ip归属;所述装置还可以包括:
[0219]
ip归属确定模块,用于当所述ip地址未备案时,根据所述ip地址的内容,确定所述ip地址对应的ip归属。
[0220]
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0221]
本技术实施例还公开了电子设备,包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的数据处理方法的步骤。
[0222]
本技术实施例还公开了计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上所述的数据处理方法的步骤。
[0223]
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
[0224]
本领域内的技术人员应明白,本技术实施例的实施例可提供为方法、装置、或计算
机程序产品。因此,本技术实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0225]
本技术实施例是参照根据本技术实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0226]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0227]
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0228]
本技术实施例中提出的所有获取信息的动作都是在遵照所在地国家相应的数据保护法规政策的前提下,并获得由相应装置所有者给予授权的情况下进行的。
[0229]
尽管已描述了本技术实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本技术实施例范围的所有变更和修改。
[0230]
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
[0231]
以上对本技术所提供的一种数据处理方法及装置、电子设备和存储介质,进行了详细介绍,本文中应用了具体个例对本技术的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本技术的方法及其核心思想;同时,对于本领域的一般技术人员,依据本技术的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本技术的限制。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献