一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

数据中心运维的管理方法、装置和电子设备与流程

2022-07-20 02:32:42 来源:中国专利 TAG:


1.本技术涉及自动化管理技术领域,特别涉及一种实现数据中心运维的管理方法、装置和电子设备。


背景技术:

2.石油行业是一个高科技密集型行业,随着石油行业的不断发展,各类生产信息系统及支撑其运行的机房配电和空调、服务器存储和网络设备的数量不断增加,同时运行于其上的操作系统、数据库和中间件等网络资源的数量也迅速增长,各类网络资源的信息化实施程度,在很大程度上影响着石油行业的竞争能力,因此,将这些网络资源的信息统一整合管理在提高石油行业的竞争力方面起着很大作用。
3.相关技术中,是通过一体化的运维平台将这些网络资源的信息统一整合管理,在管理过程中,技术人员对多个网络资源的运行进行监控,当工作人员发现网络资源发生故障时,工作人员手动对发生故障的网络资源进行修复。
4.相关技术中,由于当网络资源发生故障时,需工作人员对网络资源进行修复,使得工作人员的工作量巨大,很多故障来不及处理,费时费力,进而使得运维平台的整体管理效率较低。


技术实现要素:

5.本技术实施例提供了一种数据中心运维的管理方法、装置和电子设备,能够提高运维平台的整体管理效率。所述技术方案如下:
6.一方面,提供了一种数据中心运维的管理方法,所述方法包括:
7.基于运维平台,为至少一个网络设备分发多个网络资源;
8.基于所述运维平台,确定所述多个网络资源中的至少一个目标网络资源的配置信息;
9.基于所述运维平台,监控所述至少一个目标网络资源在运行时的运行信息;
10.对于每个目标网络资源,响应于所述目标网络资源的运行信息与配置信息不匹配,确定所述目标网络资源出现故障;
11.基于所述目标网络资源的运行信息,确定所述运行信息关联的故障表现场景;
12.基于所述故障表现场景,确定所述故障表现场景关联的自动化脚本;
13.基于所述自动化脚本,修复所述运行信息对应的故障。
14.在一种可能的实现方式中,所述基于所述运维平台,确定所述多个网络资源中的至少一个目标网络资源的配置信息,包括:
15.基于所述运维平台的配置深度发现工具,设定网络资源的搜索范围和资源类型;
16.基于所述搜索范围,搜索位于所述搜索范围内的目标网络设备;
17.基于所述资源类型,从所述目标网络设备中确定资源类型为所述资源类型的至少一个目标网络资源;
18.获取所述至少一个目标网络资源的配置信息。
19.在一种可能的实现方式中,所述方法还包括:
20.基于所述运维平台,对所述至少一个目标网络资源进行补丁部署,得到每个目标网络资源的补丁信息;
21.基于所述运维平台,对所述至少一个目标网络资源进行补丁扫描,得到所述每个目标网络资源的扫描结果;
22.对于每个目标网络资源,当所述目标网络资源的扫描结果与补丁信息不匹配时,确定所述目标网络资源关联的自动补丁脚本,基于所述自动补丁脚本,对所述目标网络资源进行补丁分发。
23.在一种可能的实现方式中,所述方法还包括:
24.从所述至少一个目标网络资源中,确定需要巡检的目标网络资源;
25.基于所述需要巡检的目标网络资源的资源类型,确定所述资源类型关联的自动巡检脚本;
26.基于所述自动巡检脚本,巡检所述需要巡检的目标网络资源,得到巡检报告。
27.在一种可能的实现方式中,所述方法还包括:
28.获取多个自动巡检脚本;
29.对于每个自动巡检脚本,确定所述自动化巡检脚本巡检的资源类型;
30.关联所述资源类型与所述自动巡检脚本。
31.在一种可能的实现方式中,所述方法还包括:
32.对于每个网络设备,确定所述网络设备中的网络资源的运行信息;
33.基于所述网络设备中的网络资源的运行信息,确定所述网络设备中的网络资源的运行参数和利用参数;
34.基于所述网络设备中的网络资源的运行参数和利用参数,对所述网络设备的网络资源的分发进行调整。
35.在一种可能的实现方式中,所述基于所述网络设备中的网络资源的运行参数和利用参数,对所述网络设备的网络资源的分发进行调整,包括:
36.当所述网络设备中的网络资源的运行参数低于预设运行参数时,调整所述目标网络资源的配置信息,以降低所述目标网络资源的配置;
37.当所述网络设备中的网络资源的利用参数低于预设利用参数时,降低为所述网络设备分配的网络资源的数量。
38.在一种可能的实现方式中,所述方法还包括:
39.设定多个故障表现场景;
40.对于每个故障表现场景,获取自动化脚本,所述自动化脚本用于修复所述故障表现场景关联的运行信息;
41.关联所述故障表现场景与所述自动化脚本。
42.另一方面,提供了一种数据中心运维的管理装置,所述装置包括:
43.分发模块,用于基于运维平台,为至少一个网络设备分发多个网络资源;
44.第一确定模块,用于基于所述运维平台,确定所述多个网络资源中的至少一个目标网络资源的配置信息;
45.监控模块,用于基于所述运维平台,监控所述至少一个目标网络资源在运行时的运行信息;
46.第二确定模块,用于对于每个目标网络资源,响应于所述目标网络资源的运行信息与配置信息不匹配,确定所述目标网络资源出现故障;
47.第三确定模块,用于基于所述目标网络资源的运行信息,确定所述运行信息关联的故障表现场景;
48.第四确定模块,用于基于所述故障表现场景,确定所述故障表现场景关联的自动化脚本;
49.修复模块,用于基于所述自动化脚本,修复所述运行信息对应的故障。
50.在一种可能的实现方式中,所述第一确定模块,包括:
51.第一设定单元,用于基于所述运维平台的配置深度发现工具,设定网络资源的搜索范围和资源类型;
52.搜索单元,用于基于所述搜索范围,搜索位于所述搜索范围内的目标网络设备;
53.第一确定单元,用于基于所述资源类型,从所述目标网络设备中确定资源类型为所述资源类型的至少一个目标网络资源;
54.第一获取单元,用于获取所述至少一个目标网络资源的配置信息。
55.在一种可能的实现方式中,所述装置还包括:
56.部署模块,用于基于所述运维平台,对所述至少一个目标网络资源进行补丁部署,得到每个目标网络资源的补丁信息;
57.扫描模块,用于基于所述运维平台,对所述至少一个目标网络资源进行补丁扫描,得到所述每个目标网络资源的扫描结果;
58.第五确定模块,用于对于每个目标网络资源,当所述目标网络资源的扫描结果与补丁信息不匹配时,确定所述目标网络资源关联的自动补丁脚本;
59.分发模块,用于基于所述自动补丁脚本,对所述目标网络资源进行补丁分发。
60.在一种可能的实现方式中,所述装置还包括:
61.第六确定模块,用于从所述至少一个目标网络资源中,确定需要巡检的目标网络资源;
62.第七确定模块,用于基于所述需要巡检的目标网络资源的资源类型,确定所述资源类型关联的自动巡检脚本;
63.巡检模块,用于基于所述自动巡检脚本,巡检所述需要巡检的目标网络资源,得到巡检报告。
64.在一种可能的实现方式中,所述装置还包括:
65.第一获取模块,用于获取多个自动巡检脚本;
66.第八确定模块,用于对于每个自动巡检脚本,确定所述自动化巡检脚本巡检的资源类型;
67.第一关联模块,用于关联所述资源类型与所述自动巡检脚本。
68.在一种可能的实现方式中,所述装置还包括:
69.第九确定模块,用于对于每个网络设备,确定所述网络设备中的网络资源的运行信息;
70.第十确定模块,用于基于所述网络设备中的网络资源的运行信息,确定所述网络设备中的网络资源的运行参数和利用参数;
71.调整模块,用于基于所述网络设备中的网络资源的运行参数和利用参数,对所述网络设备的网络资源的分发进行调整。
72.在一种可能的实现方式中,所述调整模块,包括:
73.第一调整单元,用于当所述网络设备中的网络资源的运行参数低于预设运行参数时,调整所述目标网络资源的配置信息,以降低所述目标网络资源的配置;
74.第二调整单元,用于当所述网络设备中的网络资源的利用参数低于预设利用参数时,降低为所述网络设备分配的网络资源的数量。
75.在一种可能的实现方式中,所述装置还包括:
76.第一设定模块,用于设定多个故障表现场景;
77.第二获取模块,用于对于每个故障表现场景,获取自动化脚本,所述自动化脚本用于修复所述故障表现场景关联的运行信息;
78.第二关联模块,用于关联所述故障表现场景与所述自动化脚本。
79.另一方面,提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储至少一条程序代码,所述至少一条程序代码由所述处理器加载并执行,以实现上述任一实现方式所述的数据中心运维的管理方法的指令。
80.另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储至少一条程序代码,所述至少一条程序代码由处理器加载并执行,以实现上述任一实现方式所述的数据中心运维的管理方法中的步骤。
81.本技术实施例提供的技术方案的有益效果至少包括:
82.本技术实施例提供了一种数据中心运维的管理方法,该方法通过运维平台监控网络资源的运行信息,能够及时确定出现故障的网络资源,故障被确定后,通过与运行信息关联的故障表现场景,能够确定与其关联的自动化脚本,进而能够通过自动化脚本对故障进行修复,这样,该方法通过运维平台实现了对网络资源的故障的自动确定和自动修复,从而避免了人工监控运行信息和修复故障,省时省力,从而提高了运维平台的管理效率。
附图说明
83.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
84.图1是本技术实施例提供的一种运维平台的示意图;
85.图2是本技术实施例提供的一种数据中心运维的管理方法的流程图;
86.图3是本技术实施例提供的另一种数据中心运维的管理方法的流程图;
87.图4是本技术实施例提供的另一种数据中心运维的管理方法的流程图;
88.图5是本技术实施例提供的另一种数据中心运维的管理方法的流程图;
89.图6是本技术实施例提供的另一种数据中心运维的管理方法的流程图;
90.图7是本技术实施例提供的另一种数据中心运维的管理装置的示意图;
91.图8是本技术实施例提供的一种终端的框图;
92.图9是本技术实施例提供的一种服务器的框图。
具体实施方式
93.为使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术实施方式作进一步地详细描述。
94.本技术的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们的任意变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
95.本技术实施例提供了一种运维平台,参见图1,运维平台包括自动化管理模块,监控管理模块、资源管理模块和第三方工具集成模块;其中,自动化管理模块包括故障自愈单元、资源申请单元、自动巡检单元、补丁部署单元、操作管理单元和编排管理单元。监控管理模块包括集中告警管理单元和编排管理单元。资源管理模块包括配置管理单元和自动入库单元。第三方集成工具模块包括监控集成单元、流程集成单元和app集成单元。
96.其中,故障自愈单元、资源申请单元、集中告警管理单元和自动入库单元用于运维平台故障修复;自动巡检单元用于运维平台自动巡检;补丁部署单元用于运维平台补丁分发;操作管理单元用于管理人员对自动运维平台进行操作管理;编排管理单元用于运维平台对脚本和流程的编排。
97.其中,第三方集成工具模块中的监控集成单元、流程集成单元和app集成单元用于与自动化管理模块,监控管理模块和资源管理模块中的各个单元协同作用。
98.本技术实施例提供的运维平台的自动化管理模块,监控管理模块、资源管理模块和第三方工具集成模块的具体应用参见以下申请实施例。
99.本技术实施例提供了一种数据中心运维的管理方法,在本技术实施例中以运维平台故障修复为例进行说明,参见图2,方法包括:
100.步骤201:电子设备基于运维平台,为至少一个网络设备分发多个网络资源。
101.其中,网络设备包括服务器、操作系统、数据库、中间件、虚拟机等中的至少一种。
102.其中,网络资源为能够向网络设备提供计算、存储等服务能力的资源;例如,网络资源可以为cpu的处理速度、内存的容量等。
103.在一种可能的实现方式中,电子设备为与运维平台对接的至少一个网络设备分发多个网络资源。
104.在另一种可能的实现方式中,电子设备为提交网络资源申请请求的至少一个网络设备分发多个网络资源。
105.其中,电子设备在为至少一个网络设备分发多个网络资源时,分发方式包括以下两种:
106.(1)电子设备基于网络资源中默认的配置信息为至少一个网络设备分发多个网络资源。
107.(2)网络资源申请请求中携带多个网络资源的配置信息,电子设备基于多个网络
资源的配置信息,为至少一个网络设备分发多个网络资源。
108.其中,运维平台为虚拟化平台,电子设备基于虚拟机,为至少一个网络设备分发多个网络资源。
109.其中,电子设备在运维平台上进行虚拟机的创建,虚拟机中携带多个网络资源,通过向网络设备分发虚拟机,以实现为网络设备分发多个网络资源。
110.其中,电子设备可以使用vmware vsphere(一种虚拟化平台)、openstack(一种虚拟化平台)等进行虚拟机的创建。
111.例如,电子设备使用vmware vsphere进行虚拟机的创建;其中,虚拟机对接运维平台的集中管理系统vcenter6.0(一种vmware vsphere的版本),来实现虚拟机的自动克隆、配置修改和运行,以及在其上自动部署进行通信的媒介automation agent(自动化代理)。
112.其中,电子设备创建的虚拟机,能够对接运维平台上指定的vmware vsphere的版本,且能够在指定的数据中心、集群、数据存储上克隆虚拟机;且电子设备克隆虚拟机时能指定需要使用的模板或者虚拟机;电子设备能够根据需求调整虚拟机的cpu个数、内存大小、磁盘空间大小、网络配置、虚拟机名、主机名和ip地址等参数,以便于对分发的多个网络资源进行调整;且虚拟机创建后,能自动启动运行。
113.在本技术实施例中,通过使用虚拟机来对网络资源进行分发,可以在一台计算机上模拟多台计算机,而不需要多台物理的计算机;且虚拟机上可以安装各种不同类型的操作系统,还能够将系统恢复到之前的状态,这样当系统发生故障如中毒时,可以直接恢复到以前正常时的状态。
114.步骤202:电子设备基于运维平台,确定多个网络资源中的至少一个目标网络资源的配置信息。
115.本步骤可以通过以下步骤(1)-(4)实现。
116.(1)电子设备基于运维平台的配置深度发现工具,设定网络资源的搜索范围和资源类型。
117.其中,搜索范围可以根据需要进行设置并更改;例如,搜索范围可以基于ip地址范围进行设定。
118.其中,资源类型可以根据需要进行设置并更改;例如,资源类型可以为计算类或存储类。
119.其中,电子设备提供配置深度发现工具,配置深度发现工具具有向导式发现配置功能,在配置深度发现工具的设置页面中,设定网络资源的搜索范围和资源类型。
120.其中,配置深度发现工具可以通过多种传输协议来实现目标网络资源的配置信息的收集,协议可以为icmp(internet control message protocol控制报文协议)、tcp(transmission control protocol,传输控制协议)、snmp(simple network management protocol,简单网络管理协议)、wmi(windows management instrumentation,系统插件)、telnet(远程终端协议)、ssh(secure shell,安全外壳协议)、http(hypertext transfer protocol,超文本传输协议)、dns(domain name system,域名系统)、jdbc(java database connectivity,数据连接库)、jmx(java management extensions,管理拓展)、libvirt(一种管理工具)、xenapi(一种管理接口)等,进而通过多种协议可以收集不同类型的配置信息。
121.(2)电子设备基于搜索范围,搜索位于搜索范围内的目标网络设备。
122.其中,目标网络设备包括服务器、操作系统、数据库、中间件、虚拟机等中的至少一个。
123.(3)电子设备基于资源类型,从目标网络设备中确定资源类型为资源类型的至少一个目标网络资源。
124.其中,资源类型可以根据需要进行设置并更改;当目标网络设备中的网络资源的类型为设定的资源类型时,确定为目标网络资源。
125.(4)电子设备获取至少一个目标网络资源的配置信息。
126.其中,电子设备还可以获取至少一个目标网络资源的配置信息之间的关系,从而可以确定基于配置信息的目标网络资源的各个配置之间是否匹配;例如,获取到内存和显卡的配置信息不匹配,则能够对不匹配的配置进行处理,以优化网络资源。
127.其中,电子设备在确定目标网络资源的过程中,目标网络资源的确定进度和确定进度概要可以简洁直观的显示,从而可以直接观察确定的过程;且电子设备在确定目标网络资源的过程中,提供实时的确定信息的反馈,并可以停止确定进程。
128.其中,电子设备在确定目标网络资源的过程中,能够对当前确定的网络资源的数量按照资源类型进行统计和展现,使得可以直观的了解当前确定的网络资源类型的个数和网络资源的个数。
129.其中,电子设备还包括对网络资源的日志的确定;日志是网络设备在运行操作时产生的事件记录,每个日志为记载着日期、时间、使用者及动作等相关操作的描述。电子设备在确定日志时,能够将日志过滤后进行展现,且能够实现调试、信息、警告、报警4个级别的日志信息,这样,通过对日志的确定,便于后期对网络资源的配置信息进行回顾和分析。
130.其中,电子设备确定目标网络资源的过程完成后或者在确定过程终止时,电子设备将进入确定结果界面,并对确定结果进行分析;当确定的目标网络资源不符合预设结果时,电子设备可以将确定的目标网络资源删除且重新确定目标网络资源,当确定的目标网络资源符合预设结果时,电子设备将获取的至少一个目标网络资源的配置信息存储在配置资源管理数据库中。
131.其中,参见图3,网络设备可以为数据组件,电子设备基于为数据组件分发的网络资源确定目标网络资源,并将目标网络资源存储在配置管理数据库中。
132.其中,电子设备能够以列表的形式展现获取的配置信息,配置信息包括ip地址、类型、名称等,且电子设备能够对获取的配置信息进行过滤,对过滤后的配置信息提供配置项详情的查看,配置项详情包括配置项本身和配置项的子部件的配置信息。
133.其中,电子设备能够将获取的配置信息导出;例如,可以通过excel导出配置信息并且保存在配置管理数据库中。
134.在本技术实施例中,通过电子设备确定网络资源的配置信息以及将配置信息存储在配置资源管理数据库中,实现了对网络资源的自动确定,较传统的通过人工完成网络资源配置信息的识别和入库,网络资源的自动确定将技术人员从海量网络资源、弹性变更的数据识别入库工作中释放出来,进而使技术人员能够投入到资源配置数据维护工作中,实现了网络资源管理工作由粗放型向精细化的进一步转变,进而提高了运维平台的管理效率。
135.步骤203:电子设备基于运维平台,监控至少一个目标网络资源在运行时的运行信息。
136.其中,运行信息包括网络上传和下载速度、主板温度和磁盘使用情况等。
137.其中,运维平台包括监控工具,电子设备基于运维平台的监控工具,对多个网络资源中的至少一个目标网络资源进行监控,且将至少一个目标网络资源在运行时的运行信息存储在告警集中平台中。通过监控网络资源的运行信息,当网络资源出现故障时,能够快速找到故障的原因。
138.其中,电子设备基于运维平台的监控工具,还监控基础资源池中的应用、设备、业务和场地包括的网络设备的运行状态,以便于随时进行查看和处理。
139.继续参见图3,其中,监控工具为采集控件,电子设备基于采集控件的采控平台,对应用、设备、业务和场地包括的网络设备的运行信息进行采集,并收集到集中告警平台中。
140.例如,当网络设备为服务器时,电子设备基于运维平台的监控工具监控服务器硬件;其中,对服务器硬件的监控包括对服务器硬件性能指标的监控,硬件性能指标包括电源、电扇、磁盘和cpu(central processing unit,中央处理器)等。当服务器未设有系统时,可以通过ipmi(intelligent platform management interface,智能平台管理接口)监控服务器;当服务器设有系统时,在linux(一种操作系统)下安装ipmitool(一种平台管理工具)监控服务器;其中,ipmi包括bmc(baseboard management controller,基板管理控制器),bmc为一种嵌入式管理微控制器,ipmi通过bmc可以监控各个传感器的数据并记录各种事件的日志。
141.其中,通过安装yum install-y openipmi ipmitool(一种ipmi的软件)来实现ipmi监控,且不仅可以在服务器本地监控,还能通过网络远程监控和控制服务器;例如,可以远程控制服务器的开机或关机。且ipmi在每个服务器上配置单独的ip地址和访问密码,以保证服务器的安全运行。
142.其中,电子设备还通过ipmi监控服务器的存储设备,获取详细的存储设备的组件的信息;存储设备的组件包括存储池、磁盘、lun(logical unit number,逻辑单元号)、磁盘阵列组和raid(redundant arrays of independent disks,磁盘阵列)控制器等。获取的信息包括设备的位置的信息、厂商的信息、容量利用率的信息、存储分组的信息以及raid的物理和逻辑资产的信息,raid的物理和逻辑资产的信息包括raid控制器的信息、磁盘阵列组的信息、磁盘的信息以及lun的信息等。
143.其中,电子设备还监控磁盘的iops(input/output operations per second,每秒进行读写操作的次数)、读写和缓冲配置等指标,进而获取存储设备的性能,从而基于存储设备的性能,来确定应用系统运行缓慢的原因。
144.步骤204:电子设备对于每个目标网络资源,响应于目标网络资源的运行信息与配置信息不匹配,确定目标网络资源出现故障。
145.继续参见图3,其中,当目标网络资源出现故障时,集中告警平台进行告警并启动故障处理预案。
146.其中,运维平台包括显示工具,当集中告警平台告警时,显示工具出现信息不匹配的窗口,且窗口包括目标网络资源的标识,则确定目标网络资源出现故障。
147.其中,故障处理预案为:电子设备设定多个故障表现场景。故障表现场景可以为死
机、数据丢失等;电子设备对于每个故障表现场景,获取自动化脚本,自动化脚本用于修复故障表现场景关联的运行信息;电子设备关联故障表现场景与自动化脚本。
148.步骤205:电子设备基于目标网络资源的运行信息,确定运行信息关联的故障表现场景。
149.其中,多个故障表现场景与目标网络资源的标识相关联,标识可以为目标网络资源的mac地址(media access control address,媒体存取控制位址),管理信息、应用信息、运维信息、位置信息、关系信息等中的至少一个。
150.步骤206:电子设备基于故障表现场景,确定故障表现场景关联的自动化脚本。
151.步骤207:电子设备基于自动化脚本,修复运行信息对应的故障。
152.其中,终端运行自动化脚本,通过该自动化脚本,修复运行信息对应的故障。
153.本技术实施例提供了一种数据中心运维的管理方法,通过运维平台监控网络资源的运行信息,能够及时确定出现故障的网络资源,故障被确定后,通过与运行信息关联的故障表现场景,能够确定与其关联的自动化脚本,进而通过自动化脚本对故障进行修复,这样,该方法通过运维平台实现了对网络资源的故障的自动确定和自动修复,从而避免了人工进行监控运行信息和修复故障的过程,省时省力,从而提高了运维平台的管理效率。
154.本技术实施例提供了另一种数据中心运维的管理方法,在本技术实施例中以运维平台补丁分发为例进行说明,参见图4,方法包括:
155.步骤401:电子设备基于运维平台,对至少一个目标网络资源进行补丁部署,得到每个目标网络资源的补丁信息。
156.其中,补丁信息包括补丁的名称、补丁的大小和修复的问题等。
157.其中,运维平台包括补丁服务器,补丁服务器用于存放经过测试且有效的补丁。电子设备基于补丁服务器,对至少一个目标网络资源进行补丁部署,得到每个目标网络资源的补丁信息后,将每个目标网络资源的补丁信息存储在配置管理数据库中。
158.步骤402:电子设备基于运维平台,对至少一个目标网络资源进行补丁扫描,得到每个目标网络资源的扫描结果。
159.其中,扫描结果包括补丁的获取情况、补丁的安装情况和是否有漏洞等。
160.其中,运维平台包括监控工具,电子设备基于运维平台的监控工具,对至少一个目标网络资源进行补丁扫描,得到每个目标网络资源的扫描结果。
161.步骤403:电子设备对于每个目标网络资源,当目标网络资源的扫描结果与补丁信息不匹配时,确定目标网络资源关联的自动补丁脚本,基于自动补丁脚本,对目标网络资源进行补丁分发。
162.其中,当扫描结果中的漏洞的级别超过预设的漏洞级别时,确定目标网络资源与补丁信息不匹配;当扫描结果中的漏洞的级别在预设的漏洞级别内时,确定目标网络资源与补丁信息匹配。
163.其中,电子设备对于每个目标网络资源,当目标网络资源的扫描结果与补丁信息不匹配时,确定需要更新补丁的目标网络资源,基于需要更新补丁的目标网络资源,确定目标网络资源关联的自动补丁脚本,基于自动补丁脚本,对目标网络资源进行发放。
164.在本技术实施例中,通过运维平台对目标网络资源进行补丁部署,且对补丁部署后的目标网络资源进行补丁扫描,能够确定与补丁信息不匹配的目标网络资源,这样,该方
法通过运维平台实现了补丁的自动部署和自动分发,从而避免了工作人员对补丁的部署和分发,省时省力,从而提高了运维平台的管理效率。
165.本技术实施例提供了另一种数据中心运维的管理方法,在本技术实施例中以运维平台自动巡检为例进行说明,参见图5,方法包括:
166.步骤501:电子设备从至少一个目标网络资源中,确定需要巡检的目标网络资源。
167.其中,电子设备可以确定使用频率超过预设值的目标网络资源为需要巡检的目标网络资源或用户反映性能问题突出的目标网络资源为需要巡检的目标网络资源。
168.其中,运维平台包括巡检流程工具,电子设备基于运维平台的巡检流程工具,设定巡检的时间;电子设备关联巡检时间和需要巡检的目标网络资源,当到了巡检的时间时,电子设备才对需要巡检的目标网络资源进行巡检。
169.其中,巡检的时间可以根据需要进行设置并更改,在此不做具体限定。例如,巡检时间可以为一天中业务高峰期,即业务数量超过预设值的时间段。
170.继续参见图3,在另一种可能的实现方式中,需要巡检的目标网络资源可以为运维平台的基础平台数据库中的数据组件中的网络资源。
171.步骤502:电子设备基于需要巡检的目标网络资源的资源类型,确定资源类型关联的自动巡检脚本。
172.其中,电子设备中事先关联了资源类型和自动巡检脚本,也即存储了资源类型和自动巡检脚本的对应关系;在本步骤中,电子设备基于需要巡检的目标网络资源的资源类型,直接从资源类型和自动巡检脚本的对应关系中确定资源类型关联的自动巡检脚本。
173.其中,电子设备关联资源类型和自动化巡检脚本的步骤可以通过以下步骤(1)-(3)实现:
174.(1)电子设备获取多个自动巡检脚本。
175.其中,自动巡检脚本用于巡检目标网络资源。
176.(2)电子设备对于每个自动巡检脚本,确定自动化巡检脚本巡检的资源类型。
177.其中,目标网络资源的资源类型至少包括一种,需要巡检的目标网络资源基于资源类型进行分类,资源类型相同的目标网络资源归为一类进行巡检。
178.(3)电子设备关联资源类型与自动巡检脚本。
179.其中,将资源类型的标识与自动巡检脚本关联,以便基于资源类型的标识,及时获取与该资源类型关联的自动巡检脚本。
180.步骤503:电子设备基于自动巡检脚本,巡检需要巡检的目标网络资源,得到巡检报告。
181.其中,电子设备巡检完需要巡检的目标网络资源后,自动生成巡检报告。
182.其中,巡检报告包括多个检查的内容、检查的方法、检查的结果等。例如,检查的其中一项内容为应用程序启动和运行情况,其检查的方法为应用使用测试,其检查的结果为正常。
183.继续参见图3,其中,巡检报告的格式可以为数据报表,进而通过生成的数据报表的展示可以直观清晰的展现巡检结果。
184.在另一种可能的实现方式中,当处理的业务数量超过预设值时,电子设备与人工巡检配合,共同对目标网络资源进行巡检。
185.在本技术实施例中,通过运维平台对网络资源进行巡检,能够基于网络资源的资源类型确定自动巡检脚本,且通过自动巡检脚本巡检网络资源,这样,该方法通过运维平台实现了对网络资源的自动巡检,从而避免了工作人员对网络资源的巡检,省时省力,从而提高了运维平台的管理效率。
186.本技术实施例提供了另一种数据中心运维的管理方法,在本技术实施例中以运维平台自动分析为例进行说明,参见图6,方法包括:
187.步骤601:电子设备对于每个网络设备,确定网络设备中的网络资源的运行信息。
188.其中,运行信息包括网络上传和下载速度、主板温度和磁盘使用情况等。
189.其中,运行信息的来源包括集中告警平台中存储的运行信息和自动巡检报告中的运行信息。
190.步骤602:电子设备基于网络设备中的网络资源的运行信息,确定网络设备中的网络资源的运行参数和利用参数。
191.其中,运行信息包括网络资源的运行参数和利用参数;运行参数包括缓存值、iops等,利用参数为在设定时间内的使用次数。
192.步骤603:电子设备基于网络设备中的网络资源的运行参数和利用参数,对网络设备的网络资源的分发进行调整。
193.本步骤可以通过以下步骤(1)-(2)实现:
194.(1)当网络设备中的网络资源的运行参数低于预设运行参数时,电子设备调整目标网络资源的配置信息,以降低目标网络资源的配置。
195.在另一种可能的实现方式中,当网络设备中的网络资源的运行参数不低于预设运行参数时,电子设备调整目标网络资源的配置信息,以提高目标网络资源的配置。
196.(2)当网络设备中的网络资源的利用参数低于预设利用参数时,电子设备降低为网络设备分配的网络资源的数量。
197.在另一种可能的实现方式中,当网络设备中的网络资源的利用参数不低于预设利用参数时,电子设备提高为网络设备分配的网络资源的数量。
198.其中,电子设备对网络设备的网络资源的分发进行调整之前,下发网络资源调整工单,且计入技术人员的工作考核中,进而督促工作人员对网络资源进行科学的管理。
199.在本技术实施例中,基于对网络资源的运行参数和利用参数的分析,对每个网络设备的网络资源的配置和网络资源的数量进行调整,这样,基于运行信息调整网络资源,实现了科学的合理分配网络资源,不仅降低了网络资源的成本,还提高了网络资源的利用效率。
200.在另一种可能的实现方式中,电子设备还能够基于网络设备中的网络资源的运行信息,制定运维平台容量计划。
201.其中,容量计划包括容量管理范围、容量需求、监控方式和指标、容量预测和容量优化等;容量管理范围可以根据需要进行设置并更改;容量需求根据业务发展、日常运维分析和重大项目的网络资源的运行信息等确定;监控方式和指标根据监控的网络资源的系统和日志、人工监控的阈值、运行信息的分析确定;容量预测根据监控的网络资源的运行信息确定,以便于对后续容量的使用提供科学的预测数据;容量优化根据对运行信息的分析和容量预测确定。
202.在另一种可能的实现方式中,电子设备还能够基于网络设备中的网资源的运行信息,建立用户、网络、前端web(world wide web,全球广域网)、后台数据库的全链路数据流跟踪;且通过采集运维平台在各个模块的延迟和成功率,以优化运维平台,进而提高运维平台的管理效率。
203.在另一种可能的实现方式中,电子设备建立健康度标准,设计分值权重,故障作为否决项,即出现目标网络资源出现故障时,整体降为零分,故障修复后按照权重重新显示分数。其中,对于出现故障的目标网络资源,电子设备获取目标网络资源的运行时间和故障时间;基于运行时间与故障时间的差值与运行时间的比值,得到目标网络资源在单位时间内的可用率百分数,这样,能够通过权重分数和可用率百分数直观的展示目标网络资源的服务能力。
204.在另一种可能的实现方式中,电子设备将运维平台与监控工具、流程工具和油田公司app(手机软件)关联。
205.其中,监控工具包括网络监控、系统监控和服务器监控等,电子设备基于运维平台,将多个监控集中在运维平台的集中告警平台中,便于同时对监控的网络、系统和服务器进行查看和处理。
206.其中,当监控告警时,电子设备能够触发事件管理工单;事件管理工单中包括事件原因,事件位置,事件负责人等信息,进而实现了变更类工单线上闭环,进而使得发生的事件有据可依,便于后期对事件的查询。
207.其中,油田公司app为手机上安装的软件,通过将运维平台与油田公司app关联,使得监控工具监控的网络资源推送至油田公司app,进而可以及时获取到监控报警信息,便于工作人员对监控告警信息的移动查看和处理。
208.在本技术实施例中,通过将监控工具、流程工具和油田公司app集中到运维平台,实现了运维平台的一体化运维,减少了多部门协同处理过程,简化了流程,运行过程可管可控,提高了整体工作效率,降低了运行风险,进而提高了运维平台的运维效率。
209.本技术实施例提供了一种数据中心运维的管理装置,参见图7,装置包括:
210.分发模块701,用于基于运维平台,为至少一个网络设备分发多个网络资源;
211.第一确定模块702,用于基于运维平台,确定多个网络资源中的至少一个目标网络资源的配置信息;
212.第一监控模块703,用于基于运维平台,监控至少一个目标网络资源在运行时的运行信息;
213.第二确定模块704,用于对于每个目标网络资源,响应于目标网络资源的运行信息与配置信息不匹配,确定目标网络资源出现故障;
214.第三确定模块705,用于基于目标网络资源的运行信息,确定运行信息关联的故障表现场景;
215.第四确定模块706,用于基于故障表现场景,确定故障表现场景关联的自动化脚本;
216.修复模块707,用于基于自动化脚本,修复运行信息对应的故障。
217.在一种可能的实现方式中,第一确定模块702,包括:
218.第一设定单元,用于基于运维平台的配置深度发现工具,设定网络资源的搜索范
围和资源类型;
219.搜索单元,用于基于搜索范围,搜索位于搜索范围内的目标网络设备;
220.第一确定单元,用于基于资源类型,从目标网络设备中确定资源类型为资源类型的至少一个目标网络资源;
221.第一获取单元,用于获取至少一个目标网络资源的配置信息。
222.在一种可能的实现方式中,装置还包括:
223.部署模块,用于基于运维平台,对至少一个目标网络资源进行补丁部署,得到每个目标网络资源的补丁信息;
224.扫描模块,用于基于运维平台,对至少一个目标网络资源进行补丁扫描,得到每个目标网络资源的扫描结果;
225.第五确定模块,用于对于每个目标网络资源,当目标网络资源的扫描结果与补丁信息不匹配时,确定目标网络资源关联的自动补丁脚本;
226.分发模块,用于基于自动补丁脚本,对目标网络资源进行补丁分发。
227.在一种可能的实现方式中,装置还包括:
228.第六确定模块,用于从至少一个目标网络资源中,确定需要巡检的目标网络资源;
229.第七确定模块,用于基于需要巡检的目标网络资源的资源类型,确定资源类型关联的自动巡检脚本;
230.巡检模块,用于基于自动巡检脚本,巡检需要巡检的目标网络资源,得到巡检报告。
231.在一种可能的实现方式中,装置还包括:
232.第一获取模块,用于获取多个自动巡检脚本;
233.第八确定模块,用于对于每个自动巡检脚本,确定自动化巡检脚本巡检的资源类型;
234.第一关联模块,用于关联资源类型与自动巡检脚本。
235.在一种可能的实现方式中,装置还包括:
236.第九确定模块,用于对于每个网络设备,确定网络设备中的网络资源的运行信息;
237.第十确定模块,用于基于网络设备中的网络资源的运行信息,确定网络设备中的网络资源的运行参数和利用参数;
238.调整模块,用于基于网络设备中的网络资源的运行参数和利用参数,对网络设备的网络资源的分发进行调整。
239.在一种可能的实现方式中,调整模块,包括:
240.第一调整单元,用于当网络设备中的网络资源的运行参数低于预设运行参数时,调整目标网络资源的配置信息,以降低目标网络资源的配置;
241.第二调整单元,用于当网络设备中的网络资源的利用参数低于预设利用参数时,降低为网络设备分配的网络资源的数量。
242.在一种可能的实现方式中,装置还包括:
243.第一设定模块,用于设定多个故障表现场景;
244.第二获取模块,用于对于每个故障表现场景,获取自动化脚本,自动化脚本用于修复故障表现场景关联的运行信息;
245.第二关联模块,用于关联故障表现场景与自动化脚本。
246.本技术实施例提供了一种电子设备,电子设备包括处理器和存储器,存储器中存储至少一条程序代码,至少一条程序代码由处理器加载并执行,以实现上述任一实现方式的数据中心运维的管理方法的指令。
247.电子设备可以提供为终端或者服务器;在电子设备为终端的情况下,图8示出了本技术一个示例性实施例提供的终端800的结构框图。该终端800可以是便携式移动终端,比如:智能手机、平板电脑、mp3播放器(moving picture experts group audio layer iii,动态影像专家压缩标准音频层面3)、mp4(moving picture experts group audio layer iv,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端800还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
248.通常,终端800包括有:处理器801和存储器802。
249.处理器801可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器801可以采用dsp(digital signal processing,数字信号处理)、fpga(field-programmable gate array,现场可编程门阵列)、pla(programmable logic array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器801也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称cpu(central processing unit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器801可以集成有gpu(graphics processing unit,图像处理器),gpu用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器801还可以包括ai(artificial intelligence,人工智能)处理器,该ai处理器用于处理有关机器学习的计算操作。
250.存储器802可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器802还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器802中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器801所执行以实现本技术中方法实施例提供的数据中心运维的管理方法。
251.在一些实施例中,终端800还可选包括有:外围设备接口803和至少一个外围设备。处理器801、存储器802和外围设备接口803之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口803相连。具体地,外围设备包括:射频电路804、显示屏805、摄像头组件806、音频电路807、定位组件808和电源809中的至少一种。
252.外围设备接口803可被用于将i/o(input/output,输入/输出)相关的至少一个外围设备连接到处理器801和存储器802。在一些实施例中,处理器801、存储器802和外围设备接口803被集成在同一芯片或电路板上;在一些其他实施例中,处理器801、存储器802和外围设备接口803中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
253.射频电路804用于接收和发射rf(radio frequency,射频)信号,也称电磁信号。射频电路804通过电磁信号与通信网络以及其他通信设备进行通信。射频电路804将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路804包括:天线系统、rf收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片
组、用户身份模块卡等等。射频电路804可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2g、3g、4g及5g)、无线局域网和/或wifi(wireless fidelity,无线保真)网络。在一些实施例中,射频电路804还可以包括nfc(near field communication,近距离无线通信)有关的电路,本技术对此不加以限定。
254.显示屏805用于显示ui(user interface,用户界面)。该ui可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏805是触摸显示屏时,显示屏805还具有采集在显示屏805的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器801进行处理。此时,显示屏805还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏805可以为一个,设置在终端800的前面板;在另一些实施例中,显示屏805可以为至少两个,分别设置在终端800的不同表面或呈折叠设计;在另一些实施例中,显示屏805可以是柔性显示屏,设置在终端800的弯曲表面上或折叠面上。甚至,显示屏805还可以设置成非矩形的不规则图形,也即异形屏。显示屏805可以采用lcd(liquid crystal display,液晶显示屏)、oled(organic light-emitting diode,有机发光二极管)等材质制备。
255.摄像头组件806用于采集图像或视频。可选地,摄像头组件806包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及vr(virtual reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件806还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
256.音频电路807可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器801进行处理,或者输入至射频电路804以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端800的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器801或射频电路804的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路807还可以包括耳机插孔。
257.定位组件808用于定位终端800的当前地理位置,以实现导航或lbs(location based service,基于位置的服务)。定位组件808可以是基于美国的gps(global positioning system,全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。
258.电源809用于为终端800中的各个组件进行供电。电源809可以是交流电、直流电、一次性电池或可充电电池。当电源809包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
259.在一些实施例中,终端800还包括有一个或多个传感器810。该一个或多个传感器810包括但不限于:加速度传感器811、陀螺仪传感器812、压力传感器813、指纹传感器814、光学传感器815以及接近传感器816。
260.加速度传感器811可以检测以终端800建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器811可以用于检测重力加速度在三个坐标轴上的分量。处理器801可以根据加速度传感器811采集的重力加速度信号,控制显示屏805以横向视图或纵向视图进行用户界面的显示。加速度传感器811还可以用于游戏或者用户的运动数据的采集。
261.陀螺仪传感器812可以检测终端800的机体方向及转动角度,陀螺仪传感器812可以与加速度传感器811协同采集用户对终端800的3d动作。处理器801根据陀螺仪传感器812采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变ui)、拍摄时的图像稳定、游戏控制以及惯性导航。
262.压力传感器813可以设置在终端800的侧边框和/或显示屏805的下层。当压力传感器813设置在终端800的侧边框时,可以检测用户对终端800的握持信号,由处理器801根据压力传感器813采集的握持信号进行左右手识别或快捷操作。当压力传感器813设置在显示屏805的下层时,由处理器801根据用户对显示屏805的压力操作,实现对ui界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
263.指纹传感器814用于采集用户的指纹,由处理器801根据指纹传感器814采集到的指纹识别用户的身份,或者,由指纹传感器814根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器801授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器814可以被设置在终端800的正面、背面或侧面。当终端800上设置有物理按键或厂商logo时,指纹传感器814可以与物理按键或厂商logo集成在一起。
264.光学传感器815用于采集环境光强度。在一个实施例中,处理器801可以根据光学传感器815采集的环境光强度,控制显示屏805的显示亮度。具体地,当环境光强度较高时,调高显示屏805的显示亮度;当环境光强度较低时,调低显示屏805的显示亮度。在另一个实施例中,处理器801还可以根据光学传感器815采集的环境光强度,动态调整摄像头组件806的拍摄参数。
265.接近传感器816,也称距离传感器,通常设置在终端800的前面板。接近传感器816用于采集用户与终端800的正面之间的距离。在一个实施例中,当接近传感器816检测到用户与终端800的正面之间的距离逐渐变小时,由处理器801控制显示屏805从亮屏状态切换为息屏状态;当接近传感器816检测到用户与终端800的正面之间的距离逐渐变大时,由处理器801控制显示屏805从息屏状态切换为亮屏状态。
266.本领域技术人员可以理解,图8中示出的结构并不构成对终端800的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
267.图9是本公开实施例提供的一种服务器的框图,该服务器900可以为上述实施例中的第一服务器,也可以为上述实施例中的第二服务器。该服务器900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,cpu)901和一个或一个以上的存储器902,其中,存储器902用于存储可执行指令,处理器901被配
置为执行上述可执行指令,以实现上述各个方法实施例提供的集群限流方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
268.在示例性实施例中,还提供了一种包括指令的存储介质,例如包括指令的存储器902,上述指令可由服务器900的处理器901执行以完成上述集群限流方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,非临时性计算机可读存储介质可以是rom(read-only memory,只读存储器)、ram(random access memory,随机存取存储器)、cd-rom(compact disc read-only memory,只读光盘)、磁带、软盘和光数据存储设备等。
269.本技术实施例提供了一种计算机可读存储介质,计算机可读存储介质中存储至少一条程序代码,至少一条程序代码由处理器加载并执行,以实现上述任一实现方式的数据中心运维的管理方法中的步骤。
270.本技术实施例提供了一种数据中心运维的管理方法,该方法通过运维平台监控网络资源的运行信息,能够及时确定出现故障的网络资源,故障被确定后,通过与运行信息关联的故障表现场景,能够确定与其关联的自动化脚本,进而能够通过自动化脚本对故障进行修复,这样,该方法通过运维平台实现了对网络资源的故障的自动确定和自动修复,从而避免了人工进行监控运行信息和修复故障的过程,省时省力,从而提高了运维平台的管理效率。
271.以上所述仅为本技术的可选实施例,并不用以限制本技术,凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献