一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于快照模式的网关故障检测方法及装置与流程

2022-11-23 14:43:50 来源:中国专利 TAG:


1.本发明涉及通信技术领域,尤其涉及一种基于快照模式的网关故障检测方法及装置。


背景技术:

2.网关是外部业务请求接入内部网络系统的重要接口。随着互联网技术的快速发展,通过网关的业务流量越来越多,网关中任何微小的变化或波动都可能对互联网业务产生巨大影响,因此对网关进行故障检测是十分必要的。
3.目前对网关故障检测的主流方式是对网关运行指标进行监测:通过获取网关运行指标值,将运行指标值与设定阈值进行比较,当运行指标值大于或小于阈值时,触发故障告警。但是由于运行指标点间相互割裂,这种方式缺少对运行指标点之间的关系计算,存在局部性和滞后性等问题,无法快速确定故障发生的原因及故障产生的影响范围。


技术实现要素:

4.有鉴于此,本发明实施例提供一种基于快照模式的网关故障检测方法及装置,以解决目前对网关故障检测的方式存在的局部性和滞后性的问题。
5.为实现上述目的,本发明实施例提供如下技术方案:
6.本发明实施例第一方面公开一种基于快照模式的网关故障检测方法,所述方法包括:
7.当接收到触发故障检测的快照事件时,获取配置文件,所述配置文件中定义计算网关快照所需的信息;
8.依据所述配置文件,计算得到各个网关的快照;
9.结合多个所述快照生成断言,并运行所述断言得到运行结果,所述断言至少包括参数要求;
10.判断所述运行结果是否符合所述参数要求;
11.若所述运行结果不符合所述参数要求,发送告警信息。
12.优选的,所述当接收到触发故障检测的快照事件时,获取配置文件,包括:
13.当接收到事件时,结合预设规则,判断所述事件是否为所述预设规则中规定的触发故障检测的快照事件;
14.若所述事件为所述预设规则中规定的触发故障检测的快照事件,获取配置文件。
15.优选的,所述依据所述配置文件,计算得到各个网关的快照,包括:
16.依据所述配置文件,获取各个网关的配置信息、多个时点数据和业务数据;
17.根据各个所述配置信息、多个所述时点数据和所述业务数据,计算得到各个所述网关的快照。
18.优选的,依据所述配置文件,计算得到各个网关的快照之后,还包括:
19.将多个所述快照存储至数据库中的快照存储区。
20.优选的,所述结合多个所述快照生成断言,并运行所述断言得到运行结果,包括:
21.从所述快照存储区获取多个目标快照和多个所述快照,所述目标快照为接收到所述快照事件前计算得到的,各个所述网关的快照;
22.结合多个所述目标快照和多个所述快照生成断言快照面;
23.基于所述断言快照面生成断言逻辑算子;
24.运行所述断言逻辑算子得到运行结果。
25.本发明实施例第二方面公开一种基于快照模式的网关故障检测装置,所述装置包括:
26.获取单元,用于当接收到触发故障检测的快照事件时,获取配置文件,所述配置文件中定义计算网关快照所需的信息;
27.计算单元,用于依据所述配置文件,计算得到各个网关的快照;
28.运行单元,用于结合多个所述快照生成断言,并运行所述断言得到运行结果,所述断言至少包括参数要求;
29.判断单元,用于判断所述运行结果是否符合所述参数要求;
30.发送单元,用于若所述运行结果不符合所述参数要求,发送告警信息。
31.优选的,所述获取单元,包括:
32.判断模块,用于当接收到事件时,结合预设规则,判断所述事件是否为所述预设规则中规定的触发故障检测的快照事件;
33.第一获取模块,用于若所述事件为所述预设规则中规定的触发故障检测的快照事件,获取配置文件。
34.优选的,所述计算单元,包括:
35.第二获取模块,用于依据所述配置文件,获取各个网关的配置信息、多个时点数据和业务数据;
36.计算模块,用于根据各个所述配置信息、多个所述时点数据和所述业务数据,计算得到各个所述网关的快照。
37.优选的,所述装置还包括:
38.存储单元,用于将多个所述快照存储至数据库中的快照存储区。
39.优选的,所述运行单元,包括:
40.第三获取模块,用于从所述快照存储区获取多个目标快照和多个所述快照,所述目标快照为接收到所述快照事件前计算得到的,各个所述网关的快照;
41.第一生成模块,用于结合多个所述目标快照和多个所述快照生成断言快照面;
42.第二生成模块,用于基于所述断言快照面生成断言逻辑算子;
43.运行模块,用于运行所述断言逻辑算子得到运行结果。
44.基于上述本发明实施例提供的一种基于快照模式的网关故障检测方法及装置,该方法为:当接收到触发故障检测的快照事件时,获取配置文件;依据配置文件,计算得到各个网关的快照;结合多个快照生成断言,并运行断言得到运行结果;判断运行结果是否符合断言中的参数要求;若运行结果不符合参数要求,发送告警信息。根据网关的快照对网关进行全方位的故障检测,快速地定位到故障点及故障产生的影响范围,提高了网关故障检测的效率。
附图说明
45.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
46.图1为本发明实施例提供的一种基于快照模式的网关故障检测方法的流程图;
47.图2为本发明实施例提供的一种基于快照模式的网关故障检测方法的系统示意图;
48.图3为本发明实施例提供的一种基于快照模式的网关故障检测装置的结构框图。
具体实施方式
49.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
50.在本技术中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
51.由背景技术可知,监测网关运行指标是否在设定阈值范围内,若不在预设阈值范围内则触发故障告警。这种方式由于运行指标点间相互割裂,缺少对运行指标点之间的关系计算,造成故障检测存在局部性和滞后性等问题,无法由点到线到面,对故障发生的原因及影响范围无法快速定位。
52.因此,本发明实施例提供一种基于快照模式的网关故障检测方法及装置,当接收到触发故障检测的快照事件时,获取配置文件并依据配置文件计算各个网关的快照;根据各个网关的快照生成断言,运行断言得到运行结果;根据运行结果分析网关是否存在故障。全方位的预测网关是否存在故障,当检测到网关出现故障时快速定位到故障点,提高故障检测的可靠性和效率。
53.参加图1,示出了本发明实施例提供的一种基于快照模式的网关故障检测方法的流程图,该故障检测方法包括:
54.需要说明的是,本发明实施例用于检测网关故障,其中网关为云网络网关,是提供不同网络协议或不同网络区域互联的一种网络基础设施,例如:提供将部署在underlay的服务网络映射至overlay,供租户网络访问的vpc(virtual private cloud,公有云上的一种私有网络)网关。
55.步骤s101:当接收到触发故障检测的快照事件时,获取配置文件。
56.需要说明的是,配置文件通过配置中心采用yaml语言进行编写,配置文件中定义了计算网关快照所需的信息,例如网关的关键配置、协议运行态时点数据、cpu内存等资源消耗时点数据、由session反推的业务数据等。在具体实现中,也可以根据实际情况对配置
文件进行修改或补充。
57.在具体实现步骤s101的过程中,当快照控制中心接收到触发故障检测的快照事件时,获取配置中心预设的配置文件。
58.在具体实现中,当快照控制中心接收到事件时,结合预设规则,判断事件是否为预设规则中规定的触发故障检测的快照事件;若事件为预设规则中规定的触发故障检测的快照事件,获取配置文件;若事件不是预设规则中规定的触发故障检测的快照事件,则无操作。
59.可以理解的是,在预设规则中规定了哪些事件为触发故障检测的快照事件,包括但不限于定时时钟、系统变更、运行指标告警、手工快照等四种事件。其中,定时时钟可以设为每五分钟一次,即每五分钟进行一次快照,则每天共计算288张常规快照。
60.需要说明的是,快照(snapshot)为指定数据集合在某个时间点生成的映像。本发明实施例中的快照包括网关物理指标、网关配置和由网络session推导出的业务属性等。
61.步骤s102:依据配置文件,计算得到各个网关的快照。
62.在具体实现步骤s102的过程中,依据配置文件,获取各个网关的配置信息、多个时点数据和业务数据;基于各个网关的快照agent根据各个配置信息、多个时点数据和业务数据,计算得到各个网关的快照。
63.可以理解的是,计算得到各个网关的快照后,快照控制中心控制各个网关的快照agent将多个快照存储至数据库中的快照存储区。
64.步骤s103:结合多个快照生成断言,并运行断言得到运行结果。
65.需要说明的是,断言至少包括断言逻辑算子、断言快照面和参数要求,其中,参数要求包括预设的第一参数要求和预设的第二参数要求。
66.在具体实现步骤s103的过程中,从快照存储区获取多个目标快照和多个快照,目标快照为接收到快照事件前计算得到的各个网关的快照;结合多个目标快照和多个快照生成断言快照面;基于断言快照面生成断言逻辑算子;运行断言逻辑算子得到运行结果。
67.在一些具体实施例中,可以根据实际情况对断言进行动态修改。
68.可以理解的是,生成的断言快照面包括:同一台网关上针对快照事件的上一快照;同一个网关集群中不同网关,在同一自然日、同一时刻、同一快照事件的快照;同一台网关针对同一快照事件的上一自然日(昨天)的同一时刻的快照等。
69.需要说明的是,基于断言快照面生成的断言逻辑算子是结果为真或为假的逻辑判断式。通过生成断言逻辑算子并进行运行断言逻辑算子得到运行结果,能够判断快照相关逻辑关系是否符合预期。断言逻辑算子主要包括:同一个网关集群中横向的快照是否相等;同一台网关中纵向的快照是否相等;同一台网关在相邻两天的同一时刻的快照之间的差值的绝对值,是否符合预设的第一参数要求;同一个网关集群内,在同一时刻的同一快照的横向比较的波动率是否符合预设的第二参数要求(例如同一网关集群中,不同网关的网络流量值差异不应该超过5%)。
70.在具体实现中,同一个网关集群内,在同一时刻同一快照的横向比较的波动率通过公式(1)计算得到,其中,波动率为标准差除以均值后取百分比。
71.72.其中,均值具体是同一个网关集群内不同网关在同一时刻(如上午10点)的同一快照(如cpu使用率)的均值,或同一台网关在连续自然日(如最近一周)的同一时刻的同一快照的均值。标准差σ通过公式(2)计算得到。
[0073][0074]
其中,若均值是计算同一个网关集群内不同网关在同一时刻(如上午10点)的同一快照(如cpu使用率)的均值,则n为集群数量;若均值具体是同一台网关在连续自然日(如最近一周)的同一时刻的同一快照的均值,则n为自然日数量。
[0075]
步骤s104:判断运行结果是否符合参数要求。若运行结果不符合参数要求,执行步骤s105;若运行结果符合参数要求,执行步骤s106。
[0076]
在具体实现步骤s104的过程中,判断同一个网关集群中横向的快照是否相等;同一台网关中纵向的快照是否相等;同一台网关在相邻两天的同一时刻的快照之间的差值的绝对值,是否符合预设的第一参数要求;同一个网关集群内,在同一时刻的同一快照的横向比较的波动率是否符合预设的第二参数要求,若任意一项不符合参数要求,执行步骤s105;若都符合参数要求,执行步骤s106。
[0077]
步骤s105:发送告警信息。
[0078]
在具体实现步骤s105的过程中,若断言的运行结果不符合参数要求,指示网关出现故障。基于不符合参数要求的运行结果所对应的快照事件,生成告警信息并通过监控报警平台发送告警信息,以提醒预设运维人员对出现故障的网关进行维修。
[0079]
步骤s106:发送正常信息。
[0080]
在具体实现步骤s106的过程中,若断言的运行结果符合参数要求,指示网关没有出现故障,通过监控报警平台输出用于指示网关无故障的正常信息。
[0081]
在一些具体实施例中,根据快照事件类型、快照时间点和快照id等信息构成一条快照事件记录键,存储至数据库中。
[0082]
在本发明实施例中,针对不同网关的横向快照、同一网关的不同时间点的纵向快照生成断言,使得故障检测具备全面性,检测结果更加准确可靠。及时根据检测结果生成相应的反馈信息,使运维人员能够快速获知网关的状态信息,故该故障检测方法具有一定的预测性。
[0083]
为更好地解释说明上述本发明实施例图1的内容,通过图2示出的一种基于快照模式的网关故障检测方法的系统示意图进一步说明:
[0084]
当快照控制中心100接收到触发故障检测的快照事件时,快照控制中心100向多个网关200输出控制流,其中控制流用于控制多个网关200计算对应快照。
[0085]
可以理解的是,快照控制中心100用于接收快照事件,触发计算和分析快照,是整个故障检测的控制中枢。
[0086]
当网关200接收到快照控制中心100输出的控制流时,网关200从配置中心300中获取配置文件;网关200中的快照agent根据配置文件计算快照,将计算得到的快照处理为数据流发送至快照存储区400。
[0087]
需要说明的是,配置中心300用于对需要获取的快照属性进行配置,快照属性存储在zookeeper中,生成配置文件,同时配置中心300在修改了快照属性后及时更新配置文件。
各个网关200通过监听配置中心300,达到各个网关200获取的快照属性一致的目的。
[0088]
快照存储区400接收网关200发送的快照并进行存储。
[0089]
需要说明的是,快照存储区400使用elasticsearch数据库存储快照(json格式),以快速响应kv查询。
[0090]
快照分析引擎500从快照存储区400中获取快照进行分析,其中,可以通过浏览器600在线生成断言,将断言发送至快照分析引擎500,使快照分析引擎500基于断言对快照进行分析;快照分析引擎500将分析结果发送至监控报警平台700。
[0091]
需要说明的是,快照分析引擎500用于对存储的快照进行分析,是故障检测的计算分析引擎。
[0092]
监控报警平台700接收快照分析引擎500发送的分析结果,根据分析结果输出对应的告警信息或正常信息。
[0093]
与上述本发明实施例提供的一种基于快照模式的网关故障检测方法相对应,参见图3,示出了本发明实施例提供的一种基于快照模式的网关故障检测装置的结构框图,该网关故障检测装置包括:获取单元301、计算单元302、运行单元303、判断单元304和发送单元305。
[0094]
获取单元301,用于当接收到触发故障检测的快照事件时,获取配置文件,配置文件中定义计算网关快照所需的信息。
[0095]
计算单元302,用于依据配置文件,计算得到各个网关的快照。
[0096]
运行单元303,用于结合多个快照生成断言,并运行断言得到运行结果,断言至少包括参数要求。
[0097]
判断单元304,用于判断运行结果是否符合参数要求。
[0098]
发送单元305,用于若运行结果不符合参数要求,发送告警信息。
[0099]
在本发明实施例中,依据配置文件计算各个网关的快照,根据快照生成断言,再依据断言的运行结果判断网关是否存在故障,以及定位故障点和故障所影响的范围,提高了故障检测的效率和准确率。
[0100]
优选的,结合图3示出的内容,获取单元301包括:判断模块和第一获取模块。
[0101]
判断模块,用于当接收到事件时,结合预设规则,判断事件是否为预设规则中规定的触发故障检测的快照事件。
[0102]
第一获取模块,用于若事件为预设规则中规定的触发故障检测的快照事件,获取配置文件。
[0103]
优选的,结合图3示出的内容,计算单元302包括第二获取模块和计算模块。
[0104]
第二获取模块,用于依据配置文件,获取各个网关的配置信息、多个时点数据和业务数据。
[0105]
计算模块,用于根据各个配置信息、多个时点数据和业务数据,计算得到各个网关的快照。
[0106]
优选的,结合图3示出的内容,该网关故障检测装置还包括存储单元,用于将多个快照存储至数据库中的快照存储区。
[0107]
优选的,结合图3示出的内容,运行单元303包括第三获取模块、第一生成模块、第二生成模块和运行模块。
[0108]
第三获取模块,用于从快照存储区获取多个目标快照和多个快照,目标快照为接收到快照事件前计算得到的,各个网关的快照。
[0109]
第一生成模块,用于结合多个目标快照和多个快照生成断言快照面。
[0110]
第二生成模块,用于基于断言快照面生成断言逻辑算子。
[0111]
运行模块,用于运行断言逻辑算子得到运行结果。
[0112]
综上所述,本发明实施例提供了一种基于快照模式的网关故障检测方法及装置,当接收到触发故障检测的快照事件时,获取配置文件并依据配置文件计算各个网关的快照;根据各个网关的快照生成断言,运行断言得到运行结果;根据运行结果分析网关是否存在故障。全方位的预测网关是否存在故障,当检测到网关出现故障时快速定位到故障点,提高故障检测的可靠性和效率。
[0113]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
[0114]
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0115]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献