一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于机器学习的网络故障定位方法与流程

2022-12-06 22:14:56 来源:中国专利 TAG:


1.本发明涉及网络故障监测技术领域,特别涉及一种基于机器学习的网络故障定位方法。


背景技术:

2.目前网络运维工程师对故障的判断,主要是通过采集各个网络上各个节点的监控数据,然后逐段分析和排查故障点的方式进行。这种方式存在如下缺点:
3.1、由于某个节点的故障经常会引发全系统的多种告警,运维工程师将面临数据风暴的冲击,很难准确的判断哪个节点的数据是最重要的。因此分析过程需要不断试错,这是导致故障定位缓慢的主要原因。
4.2、故障的定位依赖于工程师对各个节点监控数据的关联推导。这种推导能力是基于工程师个人经验,因此严重依赖工程师个人能力。
5.3、运维工程师不得不在多个监控数据中进行反复切换和比对,导致分析效率很低。
6.综上,当前的网络故障定位方法,是基于运维工程师个人经验的手工分析过程。存在效率低,依赖个人经验,容易出错的问题。


技术实现要素:

7.本发明的目的旨在至少解决所述技术缺陷之一。
8.为此,本发明的目的在于提出一种基于机器学习的网络故障定位方法,以解决背景技术中所提到的问题,克服现有技术中存在的不足。
9.为了实现上述目的,本发明的实施例提供一种基于机器学习的网络故障定位方法,包括如下步骤:
10.步骤s1,输入各个节点告警数据;
11.步骤s2,对输入的各个节点告警数据进行异常告警判断,得到异常节点数据;
12.步骤s3,输入历史告警数据;
13.步骤s4,利用所述历史告警数据进行ai模型训练,生产ai模型;其中,设一个网络共有多个节点,利用所有节点构成一张表,然后每隔时间t读取这一段时间内所有节点产生的告警;当在时间段t内,两个节点同时产生告警,在两个节点之间建立一条连线,表明这两个节点之间存在关联关系,如果这个关系多次出现,就在连线上标明出现的次数和比例作为关系的权重;经过多个时间段的数据训练,获得一个告警关系的树状图,该树状图即为ai模型,由该ai模型取代人工查找数据之间关联关系的过程;
14.步骤s5,利用所述ai模型对所述异常节点数据的故障根因进行推理;
15.步骤s6,根据推理结果得到故障根因。
16.由上述任一方案优选的是,将各个节点告警数据输入,判断是否存在异常告警;如果存在,将异常节点数据输入ai模型中;基于ai模型进行故障根因推理,从而产生故障根因
分析;这些异常告警进一步的用于持续训练ai模型。
17.由上述任一方案优选的是,ai模型训练过程,是将原有通过人工分析的过程转换成算法模型的过程,在网络故障分析中,人工分析的目标是判断节点a的告警事件是否由节点b引起,如此类推查找到引发多个节点告警数据的根本原因,利用历史告警数据训练ai模型,自动产生节点之间的相关关系,替代原有的人工分析方法。
18.由上述任一方案优选的是,在所述步骤s5中,产生ai模型以后,当网络各个节点中有新的数据产生,且数据异常,即通过这个模型进行自动的根因推理,推理过程如下:
19.(1)首先执行广度搜索,在选定时间段内,如果某个树下所有子节点都产生告警,则父节点被判断为问题节点;
20.(2)如果某个树下所有子节点满足如下公式:
21.∑节点告警树*权重w>门限值;则父节点被判断为问题节点;
22.(3)然后执行深度搜索,向上进行搜索,一直到这个问题节点的父节点不是问题节点为止;
23.(4)此节点为根因节点。
24.由上述任一方案优选的是,基于树状关系ai模型,首先进行水平搜索,然后进行垂直搜索,最终定位出故障根因。
25.本发明是通过机器学习的方法替代人工对监控数据进行多维度检索和分析,从而能够实现故障的自动定位。通过机器学习的方法将运维工程师的经验转换成故障定位推理逻辑,从而实现故障定位的自动化。
26.本发明采用ai模型训练替代传统的人工分析故障数据之间关联性方法。通过历史数据训练出ai模型,可以体现手工分析故障的学习过程,从而消除了对工程师熟练程度的要求。
27.本发明可以实现网络故障定位的自动化。ai模型训练模型完成后,只需要通过算法输入数据,就可以自动定位出故障点,从而实现故障定位自动化。
28.本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
29.本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
30.图1为根据本发明实施例的基于机器学习的网络故障定位方法的流程图;
31.图2为根据本发明实施例的基于机器学习的网络故障定位方法的示意图;
32.图3为根据本发明实施例的ai模型的训练过程的示意图;
33.图4a和图4b为根据本发明实施例的基于ai模型进行故障根因推理过程的示意图。
具体实施方式
34.下面详细描述本发明的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
35.本发明提供一种基于机器学习的网络故障定位方法,通过历史已有的各个节点告警数据对ai模型进行训练,建立数据之间的关联性和推理关系,从而取代原有人工查找关联性的过程。训练出的模型用于新的告警数据的分析,自动输出故障根因判断。这个过程分成两步:ai模型训练和故障根因推理(rca)。
36.第一步:使用已有的历史数据训练ai模型。这个模型将自动产生各个节点的相关性,从而替代原有的人工查找关联性。
37.第二步:将训练出的ai模型用于根因推理流程。将各个节点告警数据输入,判断是否存在异常告警。如果存在,就将异常节点数据输入ai模型中。基于ai模型进行故障根因推理,从而产生故障根因分析。这些异常告警可以进一步的用于持续训练ai模型。
38.如图1和图2所示,本发明实施例的基于机器学习的网络故障定位方法,包括如下步骤:
39.步骤s1,输入各个节点告警数据。
40.步骤s2,对输入的各个节点告警数据进行异常告警判断,得到异常节点数据。
41.步骤s3,输入历史告警数据。
42.步骤s4,利用历史告警数据进行ai模型训练,生产ai模型。
43.其中,设一个网络共有多个节点,利用所有节点构成一张表,然后每隔时间t读取这一段时间内所有节点产生的告警;当在时间段t内,两个节点同时产生告警,在两个节点之间建立一条连线,表明这两个节点之间存在关联关系,如果这个关系多次出现,就在连线上标明出现的次数和比例作为关系的权重;经过多个时间段的数据训练,获得一个告警关系的树状图,该树状图即为ai模型,由该ai模型取代人工查找数据之间关联关系的过程。
44.ai模型训练过程就是将原有需要通过人工分析的过程转换成算法模型的过程。在网络故障分析中,人工分析的目标是判断节点a的告警事件是否是由节点b引起的,如此类推找到引发多个节点告警数据的根本原因。因此需要利用历史告警数据来训练一个模型,自动产生节点之间的相关关系,即可替代原有的人工分析方法。ai模型的训练过程如图3所示。
45.假设一个网络共有a~e这样5个节点,用所有节点构成一张表。然后每隔时间t读取这一段时间内所有节点产生的告警。当在时间段t内,两个节点同时产生告警,就在两个节点之间建立一条连线,表明这两个节点之间可能存在关联关系。如果这个关系多次出现,就在连线上标明出现的次数和比例作为关系的权重(w)。例如,在本模型中使用了3个时间段的训练数据,则a-e之间关系出现了2次,权重为2/3;而其他的关联关系都只出现了一次,权重为1/3。
46.这样,经过多个时间段的数据训练,获得一个告警关系的树状图,这就是要获得的ai模型。它取代了过去靠人工查找数据之间关联关系的过程。
47.步骤s5,利用ai模型对所述异常节点数据的故障根因进行推理。
48.具体的,参考图4a和图4b,产生ai模型以后,当网络各个节点中有新的数据产生,且数据异常,即通过这个模型进行自动的根因推理,推理过程如下:
49.(1)首先执行广度搜索,在选定时间段内,如果某个树下所有子节点都产生告警,则父节点被判断为问题节点;
50.(2)如果某个树下所有子节点满足如下公式:
51.∑节点告警树*权重w>门限值;则父节点被判断为问题节点;
52.(3)然后执行深度搜索,向上进行搜索,一直到这个问题节点的父节点不是问题节点为止;
53.(4)此节点为根因节点。
54.步骤s6,根据推理结果得到故障根因。
55.本发明提供的基于机器学习的网络故障定位方法,基于历史网络告警数据产生ai模型的方法。这种模型是基于历史告警数据同时在网络各个节点出现的规律,产生的一种树状关系模型;基于这种树状关系模型,首先进行水平搜索,然后进行垂直搜索,最终定位出故障根因的方法;用于网络故障定位的模型训练和故障根因推理的流程和方法。
56.本发明是通过机器学习的方法替代人工对监控数据进行多维度检索和分析,从而能够实现故障的自动定位。通过机器学习的方法将运维工程师的经验转换成故障定位推理逻辑,从而实现故障定位的自动化。
57.本发明采用ai模型训练替代传统的人工分析故障数据之间关联性方法。通过历史数据训练出ai模型,可以体现手工分析故障的学习过程,从而消除了对工程师熟练程度的要求。
58.本发明可以实现网络故障定位的自动化。ai模型训练模型完成后,只需要通过算法输入数据,就可以自动定位出故障点,从而实现故障定位自动化。
59.在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
60.本领域技术人员不难理解,本发明包括上述说明书的发明内容和具体实施方式部分以及附图所示出的各部分的任意组合,限于篇幅并为使说明书简明而没有将这些组合构成的各方案一一描述。凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
61.尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。本发明的范围由所附权利要求及其等同限定。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献