一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种故障演练方法和装置与流程

2022-07-10 08:03:54 来源:中国专利 TAG:


1.本技术涉及云计算技术,具体涉及一种故障演练方法和装置。本技术同时涉及一种计算机存储介质和电子设备。


背景技术:

2.伴随着海量请求、节假日峰值流量和与日俱增的系统复杂度一起出现的,很有可能是预料之中以及意料之外的各种故障。因此,需要提前模拟产生各种任何可能发生的故障,来观察系统的反应,验证预期策略;进而故障演练就显得格外重要。故障演练是应用高可用能力测评的核心,一次完整的故障演练由演练的对象、对象发生的具体故障、应用的预期故障应对表现、对应用表现的实际观察和判断几部分组成。通过故障演练,能够帮助分布式系统提升容错性和可恢复性。


技术实现要素:

3.本技术提供一种故障演练方法,以解决现有技术中因为故障演练造成资源浪费以及演练对象具有局限性的问题。
4.本技术提供一种故障演练方法,包括:
5.获取基于容器管理平台,确定的故障演练流水线集合;
6.确定所述故障演练流水线集合中,当前故障演练流水线在待演练系统中的故障演练执行状态类型;
7.根据所述故障演练执行状态类型,确定所述当前故障演练流水线下一次对所述待演练系统执行故障演练的时间。
8.在一些实施例中,所述获取基于容器管理平台,确定的故障演练流水线集合,包括:
9.基于所述容器管理平台,定义故障演练流水线;
10.根据所述故障演练流水线确定所述故障演练流水线集合。
11.在一些实施例中,所述基于所述容器管理平台,定义故障演练流水线,包括:
12.基于所述容器管理平台,根据对所述待演练系统的故障演练需求,预先定义故障演练镜像;
13.根据所述故障演练镜像对应的故障演练信息,确定所述故障演练流水线。
14.在一些实施例中,所述基于所述容器管理平台,根据对所述待演练系统的故障演练需求,预先定义故障演练镜像,包括:
15.根据对所述待演练系统的故障注入需求,预先定义故障注入镜像;
16.所述根据所述故障演练镜像对应的故障演练信息,确定所述故障演练流水线,包括:
17.根据所述故障注入镜像对应的故障注入信息,确定所述故障演练流水线。
18.在一些实施例中,所述基于所述容器管理平台,根据对所述待演练系统的故障演
练需求,预先定义故障演练镜像,包括:
19.根据对所述待演练系统的故障告警需求,预先定义故障告警镜像;
20.所述根据所述故障演练镜像对应的故障演练信息,确定所述故障演练流水线,包括:
21.根据所述故障告警镜像对应的故障告警信息,确定所述故障演练流水线。
22.在一些实施例中,所述基于所述容器管理平台,根据对所述待演练系统的故障演练需求,预先定义故障演练镜像,包括:
23.根据对所述待演练系统的故障巡检需求,预先定义故障巡检镜像;
24.所述根据所述故障演练镜像对应的故障演练信息,确定所述故障演练流水线,包括:
25.根据所述故障巡检镜像对应的故障巡检信息,确定所述故障演练流水线。
26.在一些实施例中,所述基于所述容器管理平台,根据对所述待演练系统的故障演练需求,预先定义故障演练镜像,包括:
27.根据对所述待演练系统的故障恢复需求,预先定义故障恢复镜像;
28.所述根据所述故障演练镜像对应的故障演练信息,确定所述故障演练流水线,包括:
29.根据所述故障演练镜像对应的故障恢复信息,确定所述故障演练流水线。
30.在一些实施例中,所述根据所述故障演练执行状态类型,确定所述当前故障演练流水线下一次对所述待演练系统执行故障演练的时间,包括:
31.当所述故障演练执行状态类型为初始状态时,确定所述待演练系统的当前时间是否大于或等于预设的故障演练触发时间;
32.若是,则触发所述故障演练执行;
33.将所述初始状态设置为运行状态;
34.根据所述运行状态,确定所述当前故障演练流水线下一次对所述待演练系统执行故障演练的时间。
35.在一些实施例中,所述根据所述故障演练执行状态类型,确定所述当前故障演练流水线下一次对所述待演练系统执行故障演练的时间,包括:
36.当所述故障演练执行状态类型为运行状态时,确定所述当前故障流水线是否完成所述故障演练;
37.若是,则将所述当前故障流水线的所述故障演练执行状态类型重置为结束状态;
38.根据所述结束状态,确定所述当前故障流水线下一次执行所述故障演练的随机执行时间。
39.在一些实施例中,所述根据所述故障演练执行状态类型,确定所述当前故障演练流水线下一次对所述待演练系统执行故障演练的时间,包括:
40.当所述故障演练执行状态为结束状态时,根据所述容器管理平台中的时间调整参数,确定所述当前故障流水线下一次执行所述故障演练的随机执行时间;
41.将所述结束状态重置为初始状态。
42.在一些实施例中,所述获取基于容器管理平台,确定的故障演练流水线集合,包括:
43.根据所述容器管理平台中配置的定时触发,获取基于容器管理平台,确定的故障演练流水线集合。
44.本技术还提供一种故障演练装置,包括:
45.获取单元,用于获取基于容器管理平台,确定的故障演练流水线集合;
46.第一确定单元,用于确定所述故障演练流水线集合中,当前故障演练流水线在待演练系统中的故障演练执行状态类型;
47.第二确定单元,用于根据所述故障演练执行状态类型,确定所述当前故障演练流水线下一次对所述待演练系统执行故障演练的时间。
48.本技术还提供一种计算机存储介质,用于存储网络平台产生数据,以及对应所述网络平台产生数据进行处理的程序;
49.所述程序在被处理器读取执行时,执行如上所述的基于云原生的故障演练方法。
50.本技术还提供一种电子设备,包括:
51.处理器;
52.存储器,用于存储对网络平台产生数据进行处理的程序,所述程序在被处理器读取执行时,执行如上所述的基于云原生的故障演练方法。
53.与现有技术相比,本技术具有以下优点:
54.本技术提供的一种故障演练方法,一方面:获取通过基于容器管理平台,确定的故障演练流水线集合,并根据不同的故障演练执行状态类型,确定当前故障演练流水线下一次的故障演练时间,从而使得故障演练是基于云原生执行,从而更加节省资源以及演练部署更加灵活。再一方面:基于容器管理平台确定的故障演练流水线集合,在执行故障演练过程中可以对任意系统进行故障演练,即待演练系统可以是任意系统,不受限于故障演练所依赖的平台,避免自依赖问题。再一方面:故障演练流水线的状态流转可以根据设置的随机时间实现,从而进一步提高混沌化要求。再一方面:通过自定义的各种类型故障演练镜像,使得故障演练流程更加灵活。
附图说明
55.图1是本技术提供的一种故障演练方法实施例的流程图;
56.图2是本技术提供的一种故障演练方法实施例中故障演练任务的结构示意图;
57.图3是本技术提供的一种故障演练方法实施例中遍历故障演练流水线集合的示意图;
58.图4是本技术提供的一种故障演练装置实施例的结构示意图;
59.图5是本技术提供一种电子设备实施例的结构示意图。
具体实施方式
60.在下面的描述中阐述了很多具体细节以便于充分理解本技术。但是本技术能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本技术内涵的情况下做类似推广,因此本技术不受下面公开的具体实施的限制。
61.本技术中使用的术语是仅仅出于对特定实施例描述的目的,而非旨在限制本技术。在本技术中和所附权利要求书中所使用的描述方式例如:“一种”、“第一”、和“第二”等,
并非对数量上的限定或先后顺序上的限定,而是用来将同一类型的信息彼此区分。
62.结合上述背景技术的描述可知,系统运行过程中,各类故障可能会随时随地的发生,其中有很多故障无法避免,例如磁盘突然写坏,或者机房突然断网断电等等。这些故障可能会造成巨大损失,因此提升系统对于故障的容忍度成为重要问题。那么,如何了解系统对故障的容错程度或容错能力,故障演练称为一种有效手段,即帮助分布式系统提升容错性和可恢复性的重要手段。
63.现有技术可以通过混沌网络(chaosmesh)实现故障演练,但是chaosmesh在进行故障演练存在以下问题:
64.1、在实现故障演练时,chaosmesh是依赖于自研的流程引擎,并非是基于云原生的方式;
65.2、故障注入后,由于自依赖问题无法在演练流程中进行恢复;
66.3、不支持用户自定义的方式进行故障注入;
67.4、不支持混沌化随机触发的演练方式。
68.基于上述,本技术提供一种基于云原生的故障演练方法,能够解决上述各种缺陷,具体如下:
69.如图1所示,图1是本技术提供的一种故障演练方法实施例的流程图;该故障演练方法实施例包括:
70.步骤s101:获取基于容器管理平台,确定的故障演练流水线集合。
71.所述步骤s101目的在于获取故障演练流水线集合。
72.在对所述步骤s101的具体实现过程描述前,先对涉及的技术名词进行解释。
73.本实施例中,所述容器管理平台可以是基于云原生的容器集群管理开源框架形成的管理平台。所述云原生可以理解为cloudnative,其为一个组合词cloud native。cloud表示应用程序位于云中,而不是传统的数据中心;native表示应用程序从设计之初即考虑到云的环境,原生为云而设计,在云上以最佳姿势运行,充分利用和发挥云平台的弹性 分布式优势。
74.所述容器集群管理开源框架,可以理解为用于自动部署,扩展和管理容器化应用程序的开源系统架构的平台,例如:kubernetes(k8s)。
75.本实施例中,所述步骤s101的具体实现过程可以包括:
76.步骤s101-1:基于所述容器管理平台,定义故障演练流水线。
77.步骤s101-2:根据所述故障演练流水线确定所述故障演练流水线集合。
78.如图2所示,图2是本技术提供的一种故障演练方法实施例中故障演练任务的结构示意图。在本实施例中,所述步骤s101-1可以通过基于k8s中tekton的原生用法,定义故障演练流水线(pipeline)中的任务(task),执行序列(step)等;所述tekton是一个功能强大且灵活的kubernetes(k8s)原生开源框架,用于创建持续集成和交付(ci/cd)系统。所述tekton可以基于k8s的crd定义故障演练流水线(pipeline)。其中,在tekton中,所述ci/cd工作流中的每个操作都会是一个step,然后将step聚合到task中,steps是一系列由任务顺序执行的命令。task定义需要执行的工作,每个任务都在k8s集群上作为pod运行,即:task以pod的形式运行,其中pod可以理解为共享资源的容器,pod中可以包括一个或多个容器。本实施例中,可以通过使用tekton的runafter参数来定义整个故障演练流程的执行顺序,
比如一个task,使用workspace、results等参数传递故障演练流程中的上下文信息。tekton pipeline是一个k8s native的pipeline,任务跑在pod中,通过自定义crd去管理任务与工作流等等。所述pipeline可以由一个或多个task组成。
79.为能够快速定义所述故障演练流水线,本实施例中可以预先定义故障演练镜像,因此所述步骤s101-1的具体实现过程可以包括:
80.步骤s101-11:基于所述容器管理平台,根据对所述待演练系统的故障演练需求,预先定义故障演练镜像;
81.步骤s101-12:根据所述故障演练镜像对应的故障演练信息,确定所述故障演练流水线。
82.所述步骤s101-11可以包括按照如下至少一种预先定义方式进行定义故障演练镜像:
83.第一种包括:
84.步骤s101-11-11:根据对所述待演练系统的故障注入需求,预先定义故障注入镜像;具体地,所述故障注入需求可以包括:打满磁盘、大高负载(或负荷)、宕机、杀进程、网络故障等中的至少一种故障,但不限于上述需求。上述对故障注入镜像的定义示例中可以是其中一种也可以是多种组合。
85.所述步骤s102-12可以包括:
86.步骤s101-12-12:根据所述故障注入镜像对应的故障注入信息,确定所述故障演练流水线。
87.第二种包括:
88.步骤s101-11-21:根据对所述待演练系统的故障告警需求,预先定义故障告警镜像;具体地,可以根据所述故障告警需求,预先定义用于获取开源监控,或者监控、报警和时间的序列数据库组合,例如:普罗米修斯监控;也可以预先定义获取待演练系统自定义监控的镜像;也可以通过调用接口定义用于获取告警信息的镜像。上述对故障告警镜像定义的示例中可以是其中一种也可以是多种组合。
89.所述步骤s101-12可以包括:
90.步骤s101-12-21:根据所述故障告警镜像对应的故障告警信息,确定所述故障演练流水线。
91.第三种包括:
92.步骤s101-11-31:根据对所述待演练系统的故障巡检需求,预先定义故障巡检镜像;具体地,可以根据故障巡检需求预先定义巡检脚本;或者,预先定义在集群中部署的巡检模块,通过所述巡检模块的接口和/或事件获取待演练系统可用性。上述对故障巡检镜像定义的示例中可以是其中一种也可以是多种组合。
93.所述步骤s101-12可以包括:
94.步骤s101-12-32:根据所述故障巡检镜像对应的故障巡检信息,确定所述故障演练流水线。
95.第四种包括:
96.步骤s101-11-41:根据对所述待演练系统的故障恢复需求,预先定义故障恢复镜像;具体地,可以根据故障恢复需求,可以预先定义重置脚本,重启机器等至少一种恢复能
力的镜像。上述对故障恢复镜像的定义示例可以是一种也可以是多种组合。
97.所述步骤s101-12可以包括:
98.步骤s101-12-42:根据所述故障演练镜像对应的故障恢复信息,确定所述故障演练流水线。
99.上述步骤中预先定义的故障演练镜像可以通过tekton流水线执行过程中调度产生的pod拉起,执行对应逻辑,完成故障注入流程。
100.为灵活配置故障演练的触发,所述步骤s101在获取故障演练流水线集合时,可以根据所述容器管理平台中配置的定时触发,获取基于容器管理平台,确定的故障演练流水线集合,例如:采用k8s cronjob实现定义触发的灵活配置,从而能够根据定时调度触发遍历故障演练流水线集合中的每个故障演练流水线,进行故障演练。相应地,也可以通过设置定时触发结束,实现故障演练流水线遍历的结束。
101.步骤s102:确定所述故障演练流水线集合中,当前故障演练流水线在待演练系统中的故障演练执行状态类型。
102.本实施例中,所述步骤s102中的故障演练执行状态类型可以包括:运行状态、初始状态和结束状态中的至少一种状态类型。所述运行状态为处于执行故障演练当中,所述初始状态为尚未执行故障演练。当然还可以包括结束状态,所述结束状态可以理解为执行故障演练已结束或者执行故障演练出现问题而退出等。
103.步骤s103:根据所述故障演练执行状态类型,确定所述当前故障演练流水线下一次对所述待演练系统执行故障演练的时间。
104.如图3所示,根据不同的故障演练执行状态类型所述步骤s103的具体实现过程可以包括如下方式:
105.方式一:
106.步骤s103-11:当所述故障演练执行状态类型为初始状态时,确定所述待演练系统的当前时间是否大于或等于预设的故障演练触发时间;
107.步骤s103-12:若是,则触发所述故障演练的执行。
108.所述步骤s103-13:将所述初始状态重置为运行状态;
109.所述步骤s103-14:根据所述运行状态,确定所述当前故障演练流水线下一次对所述待演练系统执行故障演练的时间。
110.可以理解的是,当所述待演练系统的当前时间大于或等于故障演练触发时间时,说明到达故障演练触发时间时所述当前故障演练流水线未被触发执行,因此,可以直接触发执行,也可以进行随机触发时间的调整或计算,例如将所述当前故障演练流水线可以确定为待故障演练流水线,并等待随机触发时间的到达,此时,可以遍历所述故障演练流水线集合中的下一条故障演练流水线,将其确定为当前故障演练流水线执行上述故障演练执行状态类型的判断。其中,随机时间的计算方式包括但不限于,对每一个流水线预先设定一个最大调度时长,每次计算随机时间是在0到所述最大调度时长内随机取值作为下次调度的时间间隔,从而计算出下一次执行故障演练的调度时间。
111.也就是说,本实施例中,需要对所述故障演练流水线集合中的故障演练流水线进行遍历,确定下一次执行故障演练的时间。
112.当所述待演练系统的当前时间小于故障演练触发时间时,执行下一个故障演练流
水线,即结束所述当前故障演练流水线。
113.在本实施例中,执行故障演练也可以包括:
114.随机计算故障演练执行参数;其中,故障演练执行参数可以包括演练环境、故障注入对象、故障注入范围等,例如:演练的区域范围,注入对象,以及注入对象的范围等等,具体执行参数不限于上述示例;
115.根据所述故障演练执行参数,执行所述故障演练。
116.方式二:
117.步骤s103-21:当所述故障演练执行状态类型为运行状态时,确定所述当前故障流水线是否完成所述故障演练;
118.步骤s103-22:若是,则将所述当前故障流水线的所述故障演练执行状态类型重置为结束状态;
119.步骤s103-23:根据所述结束状态,确定所述当前故障流水线下一次执行所述故障演练的随机执行时间。
120.方式三:
121.步骤s103-31:当所述故障演练执行状态为结束状态时,根据所述容器管理平台中的时间调整参数,确定所述当前故障流水线下一次执行所述故障演练的随机执行时间;
122.步骤s103-32:将所述结束状态重置为初始状态。
123.上述三种方式中对下一次执行所述故障演练的执行时间为随机确定,因此,能够实现故障演练过程中的混沌化。
124.以上是对本技术提供的一种基于云原生的故障演练方法实施例的描述,该实施例中一方面:获取通过基于容器管理平台,确定的故障演练流水线集合,并根据不同的故障演练执行状态类型,确定当前故障演练流水线下一次的故障演练时间,从而使得故障演练是基于云原生执行,从而更加节省资源以及演练部署更加灵活。再一方面:基于容器管理平台确定的故障演练流水线集合,在执行故障演练过程中可以对任意系统进行故障演练,即待演练系统可以是任意系统,不受限于故障演练所依赖的平台,避免自依赖问题。再一方面:故障演练流水线的状态流转可以根据设置的随机时间实现,从而进一步提高混沌化要求。再一方面:通过自定义的各种类型故障演练镜像,使得故障演练流程更加灵活。
125.以上是对本技术提供的一种基于云原生的故障演练方法实施例的具体描述,与前述提供的一种基于云原生的故障演练方法实施例相对应,本技术还公开一种基于云原生的故障演练装置实施例,请参看图4,由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
126.如图4所示,图4是本技术提供的一种故障演练装置实施例的结构示意图,该故障演练装置实施例包括:
127.获取单元401,用于获取基于容器管理平台,确定的故障演练流水线集合。
128.所述获取单元401的具体可以包括:定义子单元和确定子单元;
129.所述定义子单元,用于基于所述容器管理平台,定义故障演练流水线;
130.所述确定子单元,用于根据所述故障演练流水线确定所述故障演练流水线集合。
131.所述定义子单元可以包括:镜像定义子单元,用于基于所述容器管理平台,根据对
所述待演练系统的故障演练需求,预先定义故障演练镜像。
132.所述确定子单元具体可以用于根据所述故障演练镜像对应的故障演练信息,确定所述故障演练流水线。
133.所述镜像定义子单元可以包括如下至少一种子单元:注入镜像定义子单元、告警镜像定义子单元、巡检镜像定义子单元和恢复镜像定义子单元。
134.所述注入镜像定义子单元,用于根据对所述待演练系统的故障注入需求,预先定义故障注入镜像;
135.所述确定子单元具体可以用于根据所述故障注入镜像对应的故障注入信息,确定所述故障演练流水线。
136.所述告警镜像定义子单元,用于根据对所述待演练系统的故障告警需求,预先定义故障告警镜像;
137.所述确定子单元具体可以用于根据所述故障告警镜像对应的故障告警信息,确定所述故障演练流水线。
138.所述巡检镜像定义子单元,用于根据对所述待演练系统的故障巡检需求,预先定义故障巡检镜像;
139.所述确定子单元具体可以用于根据所述故障巡检镜像对应的故障巡检信息,确定所述故障演练流水线。
140.所述恢复镜像定义子单元,用于根据对所述待演练系统的故障恢复需求,预先定义故障恢复镜像;
141.所述确定子单元具体可以用于根据所述故障演练镜像对应的故障恢复信息,确定所述故障演练流水线。
142.在本实施例中,所述获取单元401具体可以用于根据所述容器管理平台中配置的定时触发,获取基于容器管理平台,确定的故障演练流水线集合。
143.第一确定单元402,用于确定所述故障演练流水线集合中,当前故障演练流水线在待演练系统中的故障演练执行状态类型。
144.第二确定单元403,用于根据所述故障演练执行状态类型,确定所述当前故障演练流水线下一次对所述待演练系统执行故障演练的时间。
145.所述第三确定单元403可以包括至少如下三种方式:
146.方式一可以包括:
147.触发时间确定子单元,用于当所述故障演练执行状态类型为初始状态时,确定所述待演练系统的当前时间是否大于故障演练触发时间;
148.随机时间确定子单元,用于根据所述触发时间确定子单元的确定结果为是时,根据所述容器管理平台中时间调整参数,确定随机触发时间;
149.演练时间确定子单元,用于将所述随机触发时间,确定为所述当前故障演练流水线下一次执行所述故障演练的时间。
150.本实施例中还可以包括:
151.触发子单元,用于根据所述随机触发时间,触发所述当前故障演练流水线进行所述故障演练;
152.状态重置子单元,用于将所述初始状态设置为运行状态。
153.方式二可以包括:
154.演练完成确定子单元,用于当所述故障演练执行状态类型为运行状态时,确定所述当前故障流水线是否完成所述故障演练;
155.第一状态重置子单元,用于根据所述演练完成确定子单元的确定结果为是时,将所述当前故障流水线的所述故障演练执行状态类型重置为结束状态;
156.演练时间确定子单元,用于根据所述容器管理平台中的时间调整参数,确定所述当前故障流水线下一次执行所述故障演练的随机执行时间;
157.第二状态重置子单元,用于将所述结束状态调整为所述初始状态。
158.方式三可以包括:
159.状态重置子单元,用于当所述故障演练执行状态为结束状态时,将所述当前故障演练流水线的故障演练执行状态重置为结束状态;
160.演练时间确定子单元,用于根据所述容器管理平台中的时间调整参数,确定所述当前故障流水线下一次执行所述故障演练的随机执行时间。
161.以上是对本技术提供的一种基于云原生的故障演练装置实施例的描述,关于装置实施例的详细内容可以参考上述对应的故障演练方法实施例,此处不再重复赘述。
162.基于上述内容,本技术还提供一种计算机存储介质,用于存储网络平台产生数据,以及对应所述网络平台产生数据进行处理的程序;
163.所述程序在被处理器读取执行时,执行如上述基于云原生的故障演练方法中的步骤,具体为:
164.获取基于容器管理平台,确定的故障演练流水线集合;
165.确定所述故障演练流水线集合中,当前故障演练流水线在待演练系统中的故障演练执行状态类型;
166.根据所述故障演练执行状态类型,确定所述当前故障演练流水线下一次对所述待演练系统执行故障演练的时间。
167.本实施例中,所述获取基于容器管理平台,确定的故障演练流水线集合,包括:
168.基于所述容器管理平台,定义故障演练流水线;
169.根据所述故障演练流水线确定所述故障演练流水线集合。
170.本实施例中,所述基于所述容器管理平台,定义故障演练流水线,包括:
171.基于所述容器管理平台,根据对所述待演练系统的故障演练需求,预先定义故障演练镜像;
172.根据所述故障演练镜像对应的故障演练信息,确定所述故障演练流水线。
173.本实施例中,所述基于所述容器管理平台,根据对所述待演练系统的故障演练需求,预先定义故障演练镜像,包括:
174.根据对所述待演练系统的故障注入需求,预先定义故障注入镜像;
175.所述根据所述故障演练镜像对应的故障演练信息,确定所述故障演练流水线,包括:
176.根据所述故障注入镜像对应的故障注入信息,确定所述故障演练流水线。
177.本实施例中,所述基于所述容器管理平台,根据对所述待演练系统的故障演练需求,预先定义故障演练镜像,包括:
178.根据对所述待演练系统的故障告警需求,预先定义故障告警镜像;
179.所述根据所述故障演练镜像对应的故障演练信息,确定所述故障演练流水线,包括:
180.根据所述故障告警镜像对应的故障告警信息,确定所述故障演练流水线。
181.本实施例中,所述基于所述容器管理平台,根据对所述待演练系统的故障演练需求,预先定义故障演练镜像,包括:
182.根据对所述待演练系统的故障巡检需求,预先定义故障巡检镜像;
183.所述根据所述故障演练镜像对应的故障演练信息,确定所述故障演练流水线,包括:
184.根据所述故障巡检镜像对应的故障巡检信息,确定所述故障演练流水线。
185.本实施例中,所述基于所述容器管理平台,根据对所述待演练系统的故障演练需求,预先定义故障演练镜像,包括:
186.根据对所述待演练系统的故障恢复需求,预先定义故障恢复镜像;
187.所述根据所述故障演练镜像对应的故障演练信息,确定所述故障演练流水线,包括:
188.根据所述故障演练镜像对应的故障恢复信息,确定所述故障演练流水线。
189.本实施例中,所述根据所述故障演练执行状态类型,确定所述当前故障演练流水线下一次对所述待演练系统执行故障演练的时间,包括:
190.当所述故障演练执行状态类型为初始状态时,确定所述待演练系统的当前时间是否大于故障演练触发时间;
191.若是,根据所述容器管理平台中时间调整参数,确定随机触发时间;
192.将所述随机触发时间,确定为所述当前故障演练流水线下一次执行所述故障演练的时间。
193.本实施例中,还包括:
194.根据所述随机触发时间,触发所述当前故障演练流水线进行所述故障演练;
195.将所述初始状态重置为运行状态。
196.本实施例中,所述根据所述故障演练执行状态类型,确定所述当前故障演练流水线下一次对所述待演练系统执行故障演练的时间,包括:
197.当所述故障演练执行状态类型为运行状态时,确定所述当前故障流水线是否完成所述故障演练;
198.若是,则将所述当前故障流水线的所述故障演练执行状态类型重置为结束状态;
199.根据所述容器管理平台中的时间调整参数,确定所述当前故障流水线下一次执行所述故障演练的随机执行时间;
200.将所述结束状态调整为所述初始状态。
201.本实施例中,所述根据所述故障演练执行状态类型,确定所述当前故障演练流水线下一次对所述待演练系统执行故障演练的时间,包括:
202.当所述故障演练执行状态为结束状态时,将所述当前故障演练流水线的故障演练执行状态重置为结束状态;
203.根据所述容器管理平台中的时间调整参数,确定所述当前故障流水线下一次执行
所述故障演练的随机执行时间。
204.本实施例中,所述获取基于容器管理平台,确定的故障演练流水线集合,包括:
205.根据所述容器管理平台中配置的定时触发,获取基于容器管理平台,确定的故障演练流水线集合。
206.基于上述内容,本技术还提供一种电子设备,如图5所示,该电子设备实施例可以包括:
207.处理器501;
208.存储器505,用于存储对网络平台产生数据进行处理的程序,所述程序在被处理器读取执行时,执行如上述的基于云原生的故障演练方法的步骤,具体可以为:
209.获取基于容器管理平台,确定的故障演练流水线集合;
210.确定所述故障演练流水线集合中,当前故障演练流水线在待演练系统中的故障演练执行状态类型;
211.根据所述故障演练执行状态类型,确定所述当前故障演练流水线下一次对所述待演练系统执行故障演练的时间。
212.本实施例中,所述获取基于容器管理平台,确定的故障演练流水线集合,包括:
213.基于所述容器管理平台,定义故障演练流水线;
214.根据所述故障演练流水线确定所述故障演练流水线集合。
215.本实施例中,所述基于所述容器管理平台,定义故障演练流水线,包括:
216.基于所述容器管理平台,根据对所述待演练系统的故障演练需求,预先定义故障演练镜像;
217.根据所述故障演练镜像对应的故障演练信息,确定所述故障演练流水线。
218.本实施例中,所述基于所述容器管理平台,根据对所述待演练系统的故障演练需求,预先定义故障演练镜像,包括:
219.根据对所述待演练系统的故障注入需求,预先定义故障注入镜像;
220.所述根据所述故障演练镜像对应的故障演练信息,确定所述故障演练流水线,包括:
221.根据所述故障注入镜像对应的故障注入信息,确定所述故障演练流水线。
222.本实施例中,所述基于所述容器管理平台,根据对所述待演练系统的故障演练需求,预先定义故障演练镜像,包括:
223.根据对所述待演练系统的故障告警需求,预先定义故障告警镜像;
224.所述根据所述故障演练镜像对应的故障演练信息,确定所述故障演练流水线,包括:
225.根据所述故障告警镜像对应的故障告警信息,确定所述故障演练流水线。
226.本实施例中,所述基于所述容器管理平台,根据对所述待演练系统的故障演练需求,预先定义故障演练镜像,包括:
227.根据对所述待演练系统的故障巡检需求,预先定义故障巡检镜像;
228.所述根据所述故障演练镜像对应的故障演练信息,确定所述故障演练流水线,包括:
229.根据所述故障巡检镜像对应的故障巡检信息,确定所述故障演练流水线。
230.本实施例中,所述基于所述容器管理平台,根据对所述待演练系统的故障演练需求,预先定义故障演练镜像,包括:
231.根据对所述待演练系统的故障恢复需求,预先定义故障恢复镜像;
232.所述根据所述故障演练镜像对应的故障演练信息,确定所述故障演练流水线,包括:
233.根据所述故障演练镜像对应的故障恢复信息,确定所述故障演练流水线。
234.本实施例中,所述根据所述故障演练执行状态类型,确定所述当前故障演练流水线下一次对所述待演练系统执行故障演练的时间,包括:
235.当所述故障演练执行状态类型为初始状态时,确定所述待演练系统的当前时间是否大于故障演练触发时间;
236.若是,根据所述容器管理平台中时间调整参数,确定随机触发时间;
237.将所述随机触发时间,确定为所述当前故障演练流水线下一次执行所述故障演练的时间。
238.本实施例中,还包括:
239.根据所述随机触发时间,触发所述当前故障演练流水线进行所述故障演练;
240.将所述初始状态重置为运行状态。
241.本实施例中,所述根据所述故障演练执行状态类型,确定所述当前故障演练流水线下一次对所述待演练系统执行故障演练的时间,包括:
242.当所述故障演练执行状态类型为运行状态时,确定所述当前故障流水线是否完成所述故障演练;
243.若是,则将所述当前故障流水线的所述故障演练执行状态类型重置为结束状态;
244.根据所述容器管理平台中的时间调整参数,确定所述当前故障流水线下一次执行所述故障演练的随机执行时间;
245.将所述结束状态调整为所述初始状态。
246.本实施例中,所述根据所述故障演练执行状态类型,确定所述当前故障演练流水线下一次对所述待演练系统执行故障演练的时间,包括:
247.当所述故障演练执行状态为结束状态时,将所述当前故障演练流水线的故障演练执行状态重置为结束状态;
248.根据所述容器管理平台中的时间调整参数,确定所述当前故障流水线下一次执行所述故障演练的随机执行时间。
249.本实施例中,所述获取基于容器管理平台,确定的故障演练流水线集合,包括:
250.根据所述容器管理平台中配置的定时触发,获取基于容器管理平台,确定的故障演练流水线集合。
251.在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
252.内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。内存是计算机可读介质的示例。
253.1、计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方
法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
254.2、本领域技术人员应明白,本技术的实施例可提供为方法、系统或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
255.本技术虽然以较佳实施例公开如上,但其并不是用来限定本技术,任何本领域技术人员在不脱离本技术的精神和范围内,都可以做出可能的变动和修改,因此本技术的保护范围应当以本技术权利要求所界定的范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献