一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

主机网络健康状况评估方法、装置、设备和存储介质与流程

2022-02-25 21:23:47 来源:中国专利 TAG:


1.本技术涉及网络安全技术领域,涉及但不限于一种主机网络健康状况评估方法、装置、设备和存储介质。


背景技术:

2.相关技术中,一般通过以下方法评估网络健康状况:方法一,将分析出的存在相互影响的多维网络指标输入关联模型或统计学模型中,模型输出综合的主机网络健康度评分来综合评估主机网络的健康状况;方法二,根据网络健康状况的评估需求构建探测报文,通过各类探针的综合探测结果来综合评估主机网络的健康状况。
3.然而方法一中复杂的模型降低了网络健康状况的可解释性,运维人员难以定位异常,处理健康状况问题;方法二中在评估网络指标的维度多的场景下探针开销较大,同时探针探测周期较长存在滞后性。


技术实现要素:

4.有鉴于此,本技术实施例提供一种主机网络健康状况评估方法、装置、设备和存储介质。
5.第一方面,本技术实施例提供一种主机网络健康状况评估方法,所述方法包括:获取主机网络的至少一个网络模块中每一所述网络模块的至少一个网络指标;每一所述网络模块在所述主机网络中的应用功能不同;根据每一所述网络模块的每一所述网络指标,确定对应网络指标的告警信息;根据每一所述网络模块的所述至少一个网络指标的告警信息,确定对应网络模块的健康状况;根据所述至少一个网络模块的健康状况,确定所述主机网络的健康状况。
6.第二方面,本技术实施例提供一种主机网络健康状况评估装置,包括:获取模块,用于获取主机网络的至少一个网络模块中每一所述网络模块的至少一个网络指标;每一所述网络模块在所述主机网络中的应用功能不同;第一确定模块,用于根据每一所述网络模块的每一所述网络指标,确定对应网络指标的告警信息;第二确定模块,用于根据每一所述网络模块的所述至少一个网络指标的告警信息,确定对应网络模块的健康状况;第三确定模块,用于根据所述至少一个网络模块的健康状况,确定所述主机网络的健康状况。
7.第三方面,本技术实施例提供一种电子设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现本技术实施例第一方面所述主机网络健康状况评估方法中的步骤。
8.第四方面,本技术实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现本技术实施例第一方面所述主机网络健康状况评估方法中的步骤。
9.本技术实施例中,通过将主机网络根据应用功能划分多个网络模块,从而能够评估各网络模块对主机网络的影响,更高效且准确地定位主机网络的异常;另外,通过根据告
以及告警内容“cpu的利用率偏高”;在cpu的利用率为90%的情况下,告警信息可以包括告警级别“二级”以及告警内容“cpu的利用率为90%,较高”;在cpu的利用率为95%的情况下,告警信息可以包括告警级别“三级”以及告警内容“cpu的利用率为95%,接近极限”。
27.假设管理网络、虚拟网络、业务网络、存储网络和其他网络这五个网络模块的关键指标分别表示为和其发生异常时相应的告警信息可以分别表示为和
28.步骤106:根据每一所述网络模块的所述至少一个网络指标的告警信息,确定对应网络模块的健康状况;
29.其中,由于告警信息可以反映网络指标的异常程度,因此,可以根据每一网络模块中所有网络指标的告警信息,综合分析对应网络模块中所有网络指标的告警信息以确定对应网络模块的健康状况;需要说明的是,所述网络模块的健康状况可以用来体现网络模块中网络指标的异常数目和异常程度,所述网络指标的异常可以包括内存利用率过高、数据吞吐量过低等;网络模块的异常网络指标越多,或者异常网络指标对应的异常程度越高,网络模块的健康状况越差;网络模块的异常网络指标越少,或者异常网络指标对应的异常程度越低,网络模块的健康状况越好。
30.所述网络模块的健康状况可以用健康度评分或健康等级等表示,健康度评分越高,健康状况越好,健康度评分越低,健康状况越差;健康等级越高,健康状况越好,健康等级越低,健康状况越差(例如健康等级从一级至五级,逐渐降低),例如在健康度评分为100分,或健康等级为一级的情况下,认为网络模块的健康状况为优秀,在健康度评分为50分,或健康等级为四级的情况下,认为网络的模块的健康状况为差。
31.步骤108:根据所述至少一个网络模块的健康状况,确定所述主机网络的健康状况。
32.其中,可以综合分析所有网络模块的健康状况以确定主机网络的健康状况。
33.本技术实施例中,通过将主机网络根据应用功能划分多个网络模块,从而能够评估各网络模块对主机网络的影响,更高效且准确地定位主机网络的异常;另外,通过根据告警信息计算主机网络的健康状况,实现了健康状况和告警的关联,能够更准确地确定主机网络的健康状况。
34.本技术实施例还提供一种主机网络健康状况评估方法,所述方法包括以下步骤:
35.步骤s202:按照所述主机网络中至少一个网元的应用功能,将所述主机网络划分为以下至少之一的网络模块:管理网络、虚拟网络、业务网络、存储网络和其他网络;
36.其中,所述主机网络中包括至少一个网元,所述网元为所述主机网络中的元素或设备,每一所述网络模块的网络指标包括以下至少之一:吞吐量、时延和丢包率;其中,不同网络模块的网络指标对应的网元不同。
37.所述管理网络为所述主机网络中与管控相关的网络;
38.所述虚拟网络为所述主机网络中与跨主机流量相关的网络;
39.所述业务网络为所述主机网络中与上层应用体验相关的网络;
40.所述存储网络为所述主机网络中与存储应用相关的网络;
41.其中,每一所述网络模块中包括至少一个网元;所述其他网络为所述主机网络中除所述管理网络、所述虚拟网络、所述业务网络、所述存储网络外的网络。
42.步骤s204:获取主机网络的至少一个网络模块中每一所述网络模块的至少一个网络指标;每一所述网络模块在所述主机网络中的应用功能不同;
43.步骤s206:对每一所述网络模块的每一所述网络指标进行解析,得到对应网络指标的解析结果;
44.其中,可以在管理器中配置每一所述网络指标的接收和解析功能,以对对应网络指标进行接收和解析;所述解析结果可以包括所述网络指标在第一时段内的多个时刻中每一时刻的值,所述解析结果还可以包括网络指标在第一时段内的多个子时段中每一子时段的值的变化趋势。
45.步骤s208:在网络模块的网络指标的解析结果满足网络指标对应的告警条件的情况下,根据网络指标的解析结果和对应告警条件,生成对应网络指标的告警信息;
46.其中,可以在管理器中配置每一所述网络指标的告警策略,网络指标可以表示为x,网络指标的告警策略可以是a(x),所述告警策略可以是基于阈值的告警,即通过比较网络指标的值与阈值之间的大小关系,产生对应的告警信息,也可以是基于ai(artificial intelligence,人工智能)的告警,即利用训练完成的模型,产生网络指标对应的告警信息。网络指标的告警策略可以是在网络指标的解析结果满足对应的告警条件时,生成告警信息。
47.步骤s210:根据每一所述网络模块的每一所述网络指标的告警信息,对对应网络指标的健康分值进行降分,得到对应网络指标的降分分值;
48.其中,在网络指标无告警信息的情况下,所述降分分值可以为0,在网络指标有告警信息的情况下,所述降分分值可以大于0;可以在管理器中根据不同网络模块中各告警信息的影响程度,为各告警信息设计降分函数。假设管理网络、虚拟网络、业务网络、存储网络和其他网络模块的关键指标分别表示为和其相应的告警信息分别表示为和设计的降分函数分别表示为和假设网络指标的健康分值(又可以称为原始健康度评分)为100,则可以根据网络指标的告警信息和降分函数,确定对应网络指标的降分分值。
49.步骤s212:根据每一所述网络模块的所述至少一个网络指标的降分分值,确定对应网络模块的健康状况;
50.其中,可以利用预先给定的第一综合策略对每一网络模块的每一所述网络指标的健康度评分进行综合计算,得到对应网络模块的健康度,还可以直接根据每一所述网络模块的所有网络指标的告警信息,和对应网络指标的降分函数利用第一综合策略得到对应网络模块的健康度得分,进而确定网络模块的健康状况。
51.在一个实施例中,所述第一综合策略可以是第一权值分配策略;可以确定每一所述网络模块的第一权值分配策略;其中,所述第一权值分配策略与对应网络模块的应用功能有关;不同的网络模块对应的第一权值分配策略不同,可以根据网络模块中网络指标的重要度不同,为网络模块中的网络指标赋予不同的权重(即第一权值),网络指标的重要度越高,赋予的第一权值越大;根据每一所述网络模块的第一权值分配策略,为对应网络模块
的每一所述网络指标分配第一权值;根据每一网络模块的每一所述网络指标的降分分值和对应网络指标的第一权值,确定对应网络模块的健康度,进而确定对应网络模块的健康状况。
52.其中,可以将网络指标的健康分值与降分分值的差值,确定为对应网络指标的健康度(即健康度评分),可以先计算某一网络模块中每一网络指标的健康度评分与对应网络指标的第一权值的乘积,再计算该网络模块中所述网络指标的乘积之和,将所述乘积之和确定为该网络模块的健康度;还可以先确定某一网络模块中每一网络指标的降分分值与对应网络指标的第一权值的乘积,再计算该网络模块中所述网络指标的乘积之和,将所述乘积之和确定为该网络模块的总降分分值,将网络模块的健康分值(例如可以是100)与总降分分值的差值,确定为对应网络模块的健康度。
53.步骤s214:根据所述至少一个网络模块的健康状况,确定所述主机网络的健康状况;
54.其中,假设管理网络、虚拟网络、业务网络、存储网络和其他网络的健康度得分分别表示为ωm,ωv,ωe,ωs和ωo,则可以利用设计的主机网络的健康度的综合策略e(ωm,ωv,ωe,ωs,ωo)计算主机网络的健康度,进而可以根据主机网络的健康度,确定主机网络的健康状况。
55.在一个实施例中,所述综合策略e(ωm,ωv,ωe,ωs,ωo)可以是第二权值分配策略,可以确定所述主机网络的第二权值分配策略;根据所述第二权值分配策略,为所述至少一个网络模块中每一所述网络模块分配第二权值;根据所述至少一个网络模块中每一所述网络模块的健康度和对应网络模块的第二权值,确定所述主机网络的健康度。例如可以将每一网络模块的健康度和对应第二权值的乘积之和,确定为所述主机网络的健康度,进而可以根据主机网络的健康度,确定主机网络的健康状况。
56.在一个实施例中,可以先确定所述主机网络的应用场景;根据所述应用场景与每一所述网络模块之间的关联度,确定主机网络的第二权值分配策略。
57.其中,所述应用场景可以是虚拟机之间通过主机网络的虚拟网络进行通信的应用场景,则可以确定虚拟网络这一网络模块与应用场景的关联度较大,其他网络模块与应用场景的关联度较小;所述应用场景还可以是存储设备之间通过主机网络的存储网络进行通信的应用场景,则可以确定存储网络这一网络模块与应用场景的关联度较大,其他网络模块与应用场景的关联度较小;所述应用场景还可以是多个网络模块的复合场景等。
58.可以根据应用场景与网络模块之间的关联度递减的顺序,对网络模块进行排序,为排序靠前(即与应用场景的关联度较大)的网络模块分配较大的第二权值,为排序靠后的网络模块分配较小的第二权值。
59.步骤s216:根据每一所述网络模块的每一所述网络指标的告警信息,确定对应网络指标的降分原因;
60.步骤s218:将每一所述网络模块中降分分值大于预设降分阈值的网络指标确定为目标网络指标;
61.步骤s220:根据每一所述网络模块的每一所述目标网络指标的降分原因,确定所述主机网络降分的根本原因;
62.其中,可以将降分分值大于0的网络指标确定为目标网络指标,假设目标网络指标
为内存使用率和数据吞吐量,内存使用率的降分原因可以是内存使用率过高,数据吞吐量的降分原因可以是数据吞吐量较低;则主机网络降分的根本原因是内存使用率过高和数据吞吐量较低。
63.步骤s222:输出所述主机网络的健康状况和每一所述网络模块的健康状况;
64.步骤s224:输出每一所述网络模块中目标网络指标的降分原因;
65.步骤s226:输出所述主机网络降分的根本原因。
66.本技术实施例中,通过按照主机网络中网元的应用功能将主机网络划分为多个网络模块,从而能够评估不同网络模块对主机网络影响程序的差异性,在对主机网络的降分原因进行分析时,可以提供层次化的定位能力,提高健康度问题分析的效率和准确性;根据网络指标的解析结果是否满足网络指标的告警条件,生成对应的告警信息,从而使得告警信息能够更准确地反映网络指标的的异常;通过利用网络指标对应的告警信息,对网络指标的健康分值进行降分,从而能够使得到的网络指标的健康度评分更准确、能够更直观地反映网络指标的健康状况;通过根据网络指标的重要性,为同一网络模块中的不同网络指标分配不同的权值,从而可以提高该网络模块的健康度确定的准确性;通过根据主机网络的应用场景,为不同的网络模块分配不同的权值,从而可以提高主机网络的健康状况确定的准确性;通过根据每一网络模块的降分原因,确定主机网络的降分原因,从而能够更准确地确定主机网络的降分原因;通过分别输出主机网络、网络模块的健康状况以及主机网络、网络模块的降分原因,从而能够更直观地体现主机网络及各模块的健康状况和降分原因。
67.本技术实施例还提供一种主机网络健康状况评估方法,所述方法包括以下步骤:
68.步骤s302:获取主机网络的至少一个网络模块中每一所述网络模块的至少一个网络指标;每一所述网络模块在所述主机网络中的应用功能不同;
69.步骤s304:对每一所述网络模块的每一所述网络指标进行解析,得到对应网络指标的解析结果;
70.其中,每一所述网络指标的解析结果包括对应网络指标的取值;在所述网络指标为丢包率的情况下,所述丢包率可以是2%、10%和25%等;在所述网络指标为内存空闲率的情况下,所述内存空闲率可以是40%、65%和90%等。
71.步骤s306:确定每一所述告警条件对应的第一参考取值;
72.其中,在所述网络指标为丢包率的情况下,所述第一参考取值可以是2%、5%和10%等;在所述网络指标为内存空闲率的情况下,所述第一参考取值可以是30%、10%和5%等。
73.步骤s308:在每一所述网络指标的取值与对应的第一参考取值满足特定的大小关系的情况下,根据对应网络指标的值,生成对应网络指标的告警信息。
74.其中,告警条件可以是每一所述网络指标的取值与对应的第一参考取值满足特定的大小关系。在所述网络指标为丢包率的情况下,所述特定的大小关系可以是每一所述网络指标的取值大于对应的第一参考取值,假设所述丢包率为10%、所述丢包率对应的第一参考取值为2%,则由于丢包率的值大于对应的第一参考取值,则可以生成告警信息“丢包率为10%,丢包率较高”。
75.在所述网络指标为内存空闲率的情况下,所述特定的大小关系可以是每一所述网络指标的取值小于对应的第一参考取值,假设所述内存空闲率为5%、所述内存空闲率对应
的第一参考取值为10%,则由于内存空闲率的值小于对应的第一参考取值,则可以生成告警信息“内存空闲率为5%,内存不足”。
76.步骤s310:根据每一所述网络模块的每一所述网络指标的告警信息,对对应网络指标的健康分值进行降分,得到对应网络指标的降分分值;
77.步骤s312:根据每一所述网络模块的所述至少一个网络指标的降分分值,确定对应网络模块的健康度;
78.首先,可以先根据每一所述网络模块的每一所述网络指标的降分分值,确定对应网络指标的健康度,假设网络指标为内存空闲率,内存空闲率对应的第一参考取值为20%,内存空闲率对应的降分函数可以是:内存空闲率在小于5%,降分分值为90分,内存空闲率的健康度评分为10分(100分减去90分);内存空闲率在5%至10%之间,降分分值为60分,内存空闲率的健康度评分为40分(100分减去40分);内存空闲率在10%至15%之间,降分分值为40分,内存空闲率的健康度评分为60分(100分减去40分);内存空闲率在15%至20%之间,降分分值为20分,内存空闲率的健康度评分为80分(100分减去20分)。
79.其次,可以根据每一所述网络模块的至少一个网络指标的健康度,确定对应网络模块的健康度,例如可以将每一网络指标的健康度与对应的第一权值相乘,得到对应网络指标的乘积,再将网络模块中所有网络指标的乘积之和作为网络模块的健康度。
80.步骤s314:根据所述至少一个网络模块的健康度,确定所述主机网络的健康度。
81.本技术实施例中,通过根据网络指标的取值,以及网络指标的取值与参考取值的大小关系,生成网络指标的告警信息,从而能够更便捷、更准确地生成网络指标的告警信息;通过根据网络指标的告警信息,确定网络指标的降分分值,进一步确定网络指标的健康度评分,从而可以更便捷、更准确地确定网络指标的健康度。
82.本技术实施例还提供一种主机网络健康度评估方法,所述方法包括以下步骤:
83.步骤s402:获取主机网络的至少一个网络模块中每一所述网络模块的至少一个网络指标;每一所述网络模块在所述主机网络中的应用功能不同;
84.步骤s404:对每一所述网络模块的每一所述网络指标进行解析,得到对应网络指标的解析结果;
85.其中,每一所述网络指标的解析结果包括对应网络指标的取值和变化趋势;所述变化趋势可以是递增或者递减等。
86.步骤s406:确定每一所述告警条件对应的第二参考取值;
87.步骤s408:在每一所述网络指标的取值与对应的第二参考取值满足特定的大小关系、且对应网络指标的变化趋势为第一变化趋势的情况下,根据对应网络指标的取值和变化趋势,生成对应网络指标的告警信息;
88.在所述网络指标为丢包率的情况下,所述第二参考取值可以小于所述第一参考取值,所述第二参考取值可以是1%、4%和8%等,所述第一变化趋势可以是递增;在所述网络指标为内存空闲率的情况下,所述第二参考取值可以大于所述第一参考取值,所述第二参考取值可以是40%、20%和10%等,所述第一变化趋势可以是递减。
89.在所述网络指标为丢包率的情况下,所述特定的大小关系可以是每一所述网络指标的取值大于对应的第二参考取值,假设所述丢包率为10%,且所述丢包率处于递增趋势、所述丢包率对应的第二参考取值为1%,则由于丢包率的值大于对应的第一参考取值、且由
于丢包率处于递增趋势,则可以生成告警信息“丢包率为10%,呈递增趋势,丢包率较高”。
90.在所述网络指标为内存空闲率的情况下,所述特定的大小关系可以是每一所述网络指标的值小于对应的第二参考取值,所述第二参考取值可以大于第一参考阈值,假设所述内存空闲率为5%、且内存空闲率处于递减趋势,所述内存空闲率对应的第一参考取值为20%,则由于内存空闲率的值小于对应的第一参考取值,且内存空闲率处于递减趋势,则可以生成告警信息“内存空闲率为5%,呈递减趋势,内存不足”。
91.步骤s410:根据每一所述网络模块的每一所述网络指标的告警信息,对对应网络指标的健康分值进行降分,得到对应网络指标的降分分值;
92.步骤s412:根据每一所述网络模块的所述至少一个网络指标的降分分值,确定对应网络模块的健康度;
93.其中,还可以根据每一所述网络模块的每一所述网络指标的告警信息和已训练的降分模型,确定对应网络指标的健康度;例如可以利用历史时刻确定出的多个网络指标的告警信息和对应的健康度评分对初始降分模型进行训练,得到已训练的降分模型,从而可以在向已训练的降分模型中输入网络指标的告警信息的情况下,由已训练的降分模型输出网络指标的健康度评分,再根据所述至少一个网络指标的健康度,确定对应网络模块的健康度。
94.步骤s414:根据所述至少一个网络模块的健康度,确定所述主机网络的健康度。
95.本技术实施例中,通过根据网络指标的值,以及网络指标的取值与参考取值的大小关系、网络指标的变化趋势,生成网络指标的告警信息,从而能够更便捷、更准确地生成网络指标的告警信息;通过根据网络指标的告警信息和降分模型,确定网络指标的健康度评分,从而可以更便捷、更准确、更智能地确定网络指标的健康度。
96.相关技术中,网络健康度评估主要包括指标加权、模型评分和主动探针等方法,各类方法的介绍如下:
97.(1)指标加权:主机根据需求采集相应网络指标,所述网络指标包括网卡状态、网口吞吐和丢包、协议栈状态、网络中断、tcp/udp信息等,分析各网络指标对主机网络的影响程度来设计网络指标的权重,将各网络指标计算评分后利用权重进行加权从而得到主机网络健康度。
98.(2)模型评分:由于主机网络各网络指标存在关联特性,将各网络指标独立进行加权不够准确,所以利用关联模型或统计学模型等来进行综合评分,模型的输入为分析出的存在相互影响的多维网络指标,模型的输出为综合的主机网络的健康度评分,能够更准确地反映主机网络健康度情况。
99.(3)主动探针:根据网络健康度的评估需求构建探测报文,比如利用探测报文的路径来反映网络配置情况、利用探测报文的时延标记来反映网络的处理性能等,通过各类探针的综合探测结果来综合评估主机网络的健康度情况。
100.相关技术中,网络健康度评估能够反映网络的情况,但各类方法存在其自身的缺点:
101.(1)指标加权:通过权重进行加权虽然简单直接,但难以获得准确的指标权重,从而导致无法判定网络健康度评分的可信程度,限制了网络健康度的使用场景,本技术实施例可以直接通过告警信息计算主机网络健康度评分,能直观地反映主机网络存在的问题,
实现网络健康度评分和告警关联。
102.(2)模型评分:利用关联模型或统计学方法能更好地实现多维指标之间的加权,但复杂的模型降低了网络健康度评分的可解释性,导致运维人员难以处理健康度问题,本技术实施例可以通过主机网络模块的准确划分实现模块的健康度评估,直观反映模块存在的问题,并利用告警信息进行健康度关联,实现网络健康度评分的可解释性。
103.(3)主动探针:主动方式需要向网络注入探针报文,在评估网络指标维度多的场景下探针开销较大,同时探针探测周期较长存在滞后性,本技术实施例可以通过配置合理的告警策略,直接反应关键指标的异常情况,网络健康度评分计算过程中及时获取当前网络告警信息以感知主机网络状态,从而实现快速准确的主机网络健康度评估。
104.在产品侧,本技术实施例可用于主机网络健康度的评估,可以在服务器(比如超融合设备主机)中评估主机网络的健康情况;图2为本技术实施例一种管理器评估主机的网络健康度的方法流程示意图,参见图2,可以根据主机网络的应用特点将主机网络分为管理网络、虚拟网络、业务网络、存储网络和其他网络几个网络模块,每一网络模块包括对应的网络接口(即网口)。
105.超融合设备主机(简称主机)201中包括管理网口2011、虚拟网口2012、业务网口2013、存储网口2014、其他网口2015,管理器202的指标采集模块2021可以根据设计的监控需求通过管理网口2011采集超融合设备主机201的管理网络指标,通过虚拟网口2012采集超融合设备主机201的虚拟网络指标,通过业务网口2013采集超融合设备主机201的业务网络指标,通过存储网口2014采集超融合设备主机201的存储网络指标,通过其他网口2015采集超融合设备主机201的其他网络指标等;所述超融合设备主机201还包括虚拟机(virtual machine,vm)2016、内核协议栈2017和数据面2018。
106.管理器202的告警生成模块2022可以根据预先给定的告警策略对采集的网络指标的值表数据进行判断并产生告警信息;然后针对每类网络模块,根据对应类网络模块设计的告警降分函数计算每个网络模块的网络健康度评分,即不同网络模块的健康度评估维度不同,可以分别计算管理网络健康度2023、虚拟网络健康度2024、业务网络健康度2025、存储网络健康度2026和其他网络健康度2027;最后,综合所有网络模块的健康度情况,基于预先给定的综合策略获得主机网络健康度评分2028。当主机网络存在告警信息时,主机网络健康度能通过评分直接反应当前的网络异常;当主机网络的告警逐渐消除时,主机网络健康度评分能实现具有可解释性的变化;同时,根据各网络模块的健康度评分情况,能直接定位主机网络健康度较低情况下的根因位置,为进一步问题排查提供准确的参考。
107.在技术侧,本技术实施例提出一种主机网络健康度评估方法。根据主机网络的应用特点将主机网络分为管理网络、虚拟网络、业务网络、存储网络和其他网络几个子网络模块,分别为各子网络模块设计关键指标监控和告警策略,并根据告警严重程度设计各告警的降分函数,各网络模块根据网络模块的告警情况计算网络模块的健康度评分,以反映网络模块的健康度;综合所有网络模块的健康度情况,考虑主机所有的网络指标的告警信息,根据设计的综合策略计算得到主机网络的健康度评分,从而直观准确地反映主机网络的健康情况。
108.图3为本技术实施例一种主机网络的健康度评估方法的流程示意图,参见图3,所述方法包括以下步骤:
109.步骤301:主机配置网络指标采集策略,管理器配置网络指标对应的告警策略;
110.其中,主机网络健康度评估过程中需要根据主机网络的告警情况进行计算,所以需要分析各网络模块的关键指标,在主机中配置相应的指标采集策略。同时在管理器中需要配置相应的指标接收和解析功能,根据不同网络指标特点设置相应的告警策略,从而生成相应的网络指标告警信息。图4为本技术实施例一种网络指标采集策略和告警策略的设计和配置方法的流程示意图,参见图4,步骤301对应的所述方法可以包括以下步骤401至404:
111.步骤401:分析主机网络关键指标及告警策略;
112.其中,根据主机网络健康度评估的目的和主机网络的采集能力,分析网络关键指标x,并制定相应指标的告警策略a(x),告警策略可以是基于阈值的告警,即比较网络指标的值与预设的阈值之间的大小关系,并在所述大小关系满足特定大小关系的情况下,生成对应的告警信息;也可以是基于ai的告警,即比较网络指标的值与预设的阈值之间的大小关系,并确定网络指标的变化趋势,根据所述大小关系和变化趋势生成告警信息。
113.步骤402:在主机配置不同网络模块对应的网络指标采集功能;
114.其中,可以根据分析的关键网络指标,在主机配置不同网络模块即管理网络、虚拟网络、业务网络、存储网络和其他网络相应的网络指标采集功能。
115.步骤403:在管理器配置不同网络模块对应的网络指标收集和解析功能;
116.其中,可以根据分析的关键网络指标,在控制器(即管理器)配置不同网络模块即管理网络、虚拟网络、业务网络、存储网络和其他网络指标的收集和解析功能。
117.步骤404:在管理器中配置每个网络模块的每个网络指标的告警策略。
118.其中,根据制定的告警策略配置网络指标的告警能力,能够提供主机网络指标的告警信息。
119.步骤302:根据每一网络模块的告警信息,计算对应网络模块的健康度评分;
120.其中,可以根据主机网络的不同应用功能将其分为管理网络、虚拟网络、业务网络、存储网络和其他网络五个部分,在各网络模块中对其告警信息影响程度进行评估,设计相应的告警降分函数以为各网络模块健康度提供计算基础,降分函数的形式可以为分段降分、模型降分或ai降分等,分段降分即根据网络指标的值对网络指标进行分段,例如5%至10%为一段,10%至15%为一段,不同分段的网络指标对应的降分分值不同;模型降分即为向训练完成的模型输入网络指标的告警信息,提供训练完成的模型输出对应的网络指标的健康度;ai降分可以是综合考虑当前吞吐量、丢包率和时延等,确定每一网络指标的降分分值,得到对应网络指标的健康度;降分函数保证在没有告警信息时不产生降分值。各网络模块分别计算其健康度评分,从而提供各网络模块的健康度情况。图5为本技术实施例一种各网络模块的健康度评分计算方法的流程示意图,参见图5,步骤302对应的所述方法可以包括以下步骤501至507:
121.步骤501:分析并指定网络指标对应的告警降分函数;
122.其中,可以根据不同网络模块中各告警信息的影响程度,为各告警信息设计降分函数。假设管理网络、虚拟网络、业务网络、存储网络和其他网络模块的关键指标分别为和其相应的告警信息分别为其相应的告警信息分别为和
设计的降分函数分别为设计的降分函数分别为和降分函数根据各网络模块指标对模块的影响程度制定。
123.步骤502:获取管理网络的告警信息,并计算管理网络模块的健康度评分;
124.其中,可以获取管理网络的所有告警信息及其对应的降分函数,给定管理网络模块各网络指标的综合策略直接综合得到管理网络模块的健康度得分。
125.步骤503:获取虚拟网络的告警信息,并计算虚拟网络模块的健康度评分;
126.其中,可以获取虚拟网络的所有告警信息及其对应的降分函数,给定虚拟网络模块各网络指标的综合策略直接综合得到虚拟网络模块的健康度得分。
127.步骤504:获取业务网络的告警信息,并计算业务网络模块的健康度评分;
128.其中,可以获取业务网络的所有告警信息及其对应的降分函数,给定业务网络模块各网络指标的综合策略直接综合得到业务网络模块的健康度得分。
129.步骤505:获取存储网络的告警信息,并计算存储网络模块的健康度评分;
130.其中,可以获取存储网络的所有告警信息及其对应的降分函数,给定存储网络模块各网络指标的综合策略直接综合得到存储网络模块的健康度得分。
131.步骤506:获取其他网络的告警信息,并计算其他网络模块的健康度评分;
132.其中,可以获取其他网络的所有告警信息及其对应的降分函数,给定其他网络模块各网络指标的综合策略直接综合得到其他网络模块的健康度得分。
133.步骤507:输出各网络模块的健康度评分。
134.其中,可以输出计算的管理网络、虚拟网络、业务网络、存储网络和其他网络模块的模块健康度评分,同时输出相应的降分信息以供后续根因分析使用。
135.步骤303:综合各网络模块的健康度评分,计算主机网络健康度评分;
136.主机网络根据应用功能分为管理网络、虚拟网络、业务网络、存储网络和其他网络五个网络模块进行模块健康度评估,不同网络模块对主机网络的影响存在差异性,比如管理网络健康程度对管控体验影响显著、虚拟网络健康程度对跨主机流量影响显著、业务网络健康程度对上层应用体验影响显著、存储网络健康程度对存储应用影响显著、其他网络健康度则涉及其他相关的网络状态,因此设计综合的计算策略能够提供准确的主机网络健康度评估。图6为本技术实施例一种主机网络的健康度评估处理方法的流程示意图,参见图6,步骤303对应的所述方法可以包括以下步骤601至603:
137.步骤601:分析并设计主机网络健康度的综合计算策略;
138.其中,可以根据不同网络模块对主机网络健康的影响程度,设计主机网络健康度的综合策略e(ωm,ωv,ωe,ωs,ωo)。
139.步骤602:获取各网络模块健康度信息,综合计算主机网络的健康度评分;
140.其中,所述网络模块的健康度信息又可以称为网络模块的健康度结果,例如可以是网络模块的健康度评分,可以利用综合策略,对各网络模块的健康度评分进行处理,得到主机网络的健康度评分。
141.步骤603:输出主机网络的健康度评分,并输出相应的降分信息以供模块根因定位使用。
142.步骤304:展示主机网络和/或网络模块的健康度,并定位主机网络的降分根因。
143.其中,主机网络健康度展示需要展示主机网络健康度的评分、各网络模块的健康度评分以及各网络模块的降分详细情况。当主机网络健康度存在降分时,会检测各网络模块具体的健康度情况,从而定位具体的降分项目及原因,实现准确的根因定位。同时,当主机网络的告警信息全部处理完成后,此时主机网络健康度不会有降分情况,从而保证了主机网络健康度的可解释性。图7为本技术实施例一种主机网络的降分根因定位方法的流程示意图,参见图7,步骤304对应的所述方法可以包括以下步骤701至708:
144.步骤701:展示主机网络健康度评分以及各网络模块的健康度评分,同时提供每个模块的降分细节信息。
145.步骤702:判断主机网络健康度是否存在降分情况,如果存在降分情况,则执行步骤703;
146.步骤703:分析管理网络健康度评分,针对存在该模块的降分情况收集所有的降分项目及原因。
147.步骤704:分析虚拟网络健康度评分,针对存在该模块的降分情况收集所有的降分项目及原因。
148.步骤705:分析业务网络健康度评分,针对存在该模块的降分情况收集所有的降分项目及原因。
149.步骤706:分析存储网络健康度评分,针对存在该模块的降分情况收集所有的降分项目及原因。
150.步骤707:分析其他网络健康度评分,针对存在该模块的降分情况收集所有的降分项目及原因。
151.步骤708:收集所有降分项目及原因,输出主机网络健康度降分根因。
152.本技术实施例相比于相关技术中主机指标采集方案具有以下几个优势:
153.(1)基于告警信息评估的主机网络健康度评分:直接根据主机网络的告警信息计算主机网络健康度,实现健康度评估结果与告警的关联,保证了健康度评分的可解释性,同时为健康度的根因定位提供准确信息;
154.分析主机网络各网络模块的告警情况,综合考虑所有告警信息,根据预先设定的告警降分函数计算所有告警综合的降分结果,从而实现准确的主机网络健康度评分计算,与告警信息直接关联,保证评分结果的可解释性。
155.(2)基于应用功能的网络模块划分及其健康度评估:将主机网络根据应用功能划分模块能够评估不同模块对主机网络影响程度的差异性,同时在根因分析过程中提供层次化的定位能力,提高健康度问题分析的效率和准确性。
156.根据虚拟化环境中主机各网络模块承担的应用功能进行划分,将主机网络健康度
分为管理网络、虚拟网络、业务网络、存储网络和其他网络几个维度进行网络模块健康度评估,针对不同功能模块特点设计相应的健康度评估维度,通过各模块告警信息实现准确的主机网络各网络模块健康度评估,并与模块告警信息直接关联。
157.需要说明的是,本技术实施例中,如果以软件功能模块的形式实现上述的主机网络健康度评估方法,并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得电子设备(可以是手机、平板电脑、台式机、个人数字助理、导航仪、数字电话、视频电话、电视机、传感设备等)执行本技术各个实施例所述方法的全部或部分。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read only memory,rom)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本技术实施例不限制于任何特定的硬件和软件结合。
158.基于前述的实施例,本技术实施例提供一种主机网络健康度评估装置,该装置包括所包括的各模块,可以通过设备中的处理器来实现;当然也可通过具体的逻辑电路实现;在实施的过程中,处理器可以为中央处理器(cpu,central processing unit)、微处理器(mpu,microprocessor unit)、数字信号处理器(dsp,digital signal processing)或现场可编程门阵列(fpga,field programmable gate array)等。
159.图8为本技术实施例一种主机网络健康度评估装置的组成结构示意图,如图8所示,所述装置800包括获取模块801、第一确定模块802、第二确定模块803、第三确定模块804,其中:
160.获取模块801,用于获取主机网络的至少一个网络模块中每一所述网络模块的至少一个网络指标;每一所述网络模块在所述主机网络中的应用功能不同;
161.第一确定模块802,用于根据每一所述网络模块的每一所述网络指标,确定对应网络指标的告警信息;
162.第二确定模块803,用于根据每一所述网络模块的所述至少一个网络指标的告警信息,确定对应网络模块的健康状况;
163.第三确定模块804,用于根据所述至少一个网络模块的健康状况,确定所述主机网络的健康状况。
164.在一个实施例中,所述第一确定模块802,包括:解析子模块,用于对每一所述网络模块的每一所述网络指标进行解析,得到对应网络指标的解析结果;生成子模块,用于在网络模块的网络指标的解析结果满足网络指标对应的告警条件的情况下,根据网络指标的解析结果和对应告警条件,生成对应网络指标的告警信息。
165.在一个实施例中,每一所述网络指标的解析结果包括对应网络指标的取值;所述生成子模块,包括:第一确定单元,用于确定每一所述告警条件对应的第一参考取值;第一生成单元,用于在每一所述网络指标的值与对应的第一参考取值之间满足特定的大小关系的情况下,根据对应网络指标的取值,生成对应网络指标的告警信息。
166.在一个实施例中,每一所述网络指标的解析结果包括对应网络指标的取值和变化趋势;所述生成子模块,包括:第二确定单元,用于确定每一所述告警条件对应的第二参考取值;第二生成单元,用于在每一所述网络指标的取值与对应的第二参考取值满足特定的大小关系、且对应网络指标的变化趋势为第一变化趋势的情况下,根据对应网络指标的取
值和变化趋势,生成对应网络指标的告警信息。
167.在一个实施例中,所述第二确定模块803,包括:降分子模块,用于根据每一所述网络模块的每一所述网络指标的告警信息,对对应网络指标的健康分值进行降分,得到对应网络指标的降分分值;第一确定子模块,用于根据每一所述网络模块的所述至少一个网络指标的降分分值,确定对应网络模块的健康状况。
168.在一个实施例中,所述第一确定子模块,包括:第三确定单元,用于确定每一所述网络模块的第一权值分配策略;其中,所述第一权值分配策略与对应网络模块的应用功能有关;第四确定单元,用于根据每一所述网络模块的第一权值分配策略,为对应网络模块的每一所述网络指标分配第一权值;第五确定单元,用于根据每一网络模块的每一所述网络指标的降分分值和对应网络指标的第一权值,确定对应网络模块的健康状况。
169.在一个实施例中,所述装置还包括:第四确定模块,用于根据每一所述网络模块的每一所述网络指标的告警信息,确定对应网络指标的降分原因;第五确定模块,用于将每一所述网络模块中降分分值大于预设降分阈值的网络指标确定为目标网络指标;第六确定模块,用于根据每一所述网络模块的每一所述目标网络指标的降分原因,确定所述主机网络降分的根本原因。
170.在一个实施例中,所述装置还包括:第一输出模块,用于输出所述主机网络的健康状况和每一所述网络模块的健康状况;第二输出模块,用于输出每一所述网络模块中目标网络指标的降分原因;第三输出模块,用于输出所述主机网络降分的根本原因。
171.在一个实施例中,所述第三确定模块803,包括:第二确定子模块,用于确定所述主机网络的应用场景;第三确定子模块,用于根据所述应用场景与每一所述网络模块之间的关联度,确定所述主机网络的第二权值分配策略;分配子模块,用于根据所述第二权值分配策略,为所述至少一个网络模块中每一所述网络模块分配第二权值;第四确定子模块,用于根据所述至少一个网络模块中每一所述网络模块的健康状况和对应网络模块的第二权值,确定所述主机网络的健康状况。
172.在一个实施例中,所述主机网络中包括至少一个网元,所述装置还包括:划分模块,用于按照所述主机网络中至少一个网元的应用功能,将所述主机网络划分为以下至少之一的网络模块:管理网络、虚拟网络、业务网络、存储网络和其他网络;
173.每一所述网络模块的网络指标包括以下至少之一:吞吐量、时延和丢包率;其中,不同网络模块的网络指标对应的网元不同。
174.需要说明的是,本技术实施例中,如果以软件功能模块的形式实现上述的主机网络健康度评估方法,并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得电子设备(可以是手机、平板电脑、台式机、个人数字助理、导航仪、数字电话、视频电话、电视机、传感设备等)执行本技术各个实施例所述方法的全部或部分。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read only memory,rom)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本技术实施例不限制于任何特定的硬件和软件结合。
175.以上装置实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本技术装置实施例中未披露的技术细节,请参照本技术方法实施例
的描述而理解。
176.对应地,本技术实施例提供一种电子设备,图9为本技术实施例电子设备的一种硬件实体示意图,如图9所示,该设备900的硬件实体包括:包括存储器901和处理器902,所述存储器901存储有可在处理器902上运行的计算机程序,所述处理器902执行所述程序时实现上述实施例主机网络健康度评估方法中的步骤。
177.存储器901配置为存储由处理器902可执行的指令和应用,还可以缓存待处理器902以及设备900中各模块待处理或已经处理的数据(例如,图像数据、音频数据、语音通信数据和视频通信数据),可以通过闪存(flash)或随机访问存储器(random access memory,ram)实现。
178.对应地,本技术实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中提供的主机网络健康度评估方法中的步骤。
179.这里需要指出的是:以上存储介质和设备实施例的描述,与上述方法实施例的描述是类似的,具有同设备实施例相似的有益效果。对于本技术存储介质和方法实施例中未披露的技术细节,请参照本技术设备实施例的描述而理解。
180.应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本技术的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本技术的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本技术实施例的实施过程构成任何限定。上述本技术实施例序号仅仅为了描述,不代表实施例的优劣。
181.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
182.在本技术所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
183.上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。另外,在本技术各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
184.本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过
程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(read only memory,rom)、磁碟或者光盘等各种可以存储程序代码的介质。或者,本技术上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得计算机设备(可以是手机、平板电脑、台式机、个人数字助理、导航仪、数字电话、视频电话、电视机、传感设备等)执行本技术各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、rom、磁碟或者光盘等各种可以存储程序代码的介质。
185.本技术所提供的几个方法实施例中所揭露的方法,在不冲突的情况下可以任意组合,得到新的方法实施例。本技术所提供的几个产品实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的产品实施例。本技术所提供的几个方法或设备实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的方法实施例或设备实施例。
186.以上所述,仅为本技术的实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以所述权利要求的保护范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献