一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种服务器报警溯源方法、装置及存储介质与流程

2022-07-13 16:04:40 来源:中国专利 TAG:


1.本发明涉及一种服务器报警溯源方法、装置及存储介质,属于云数据处理技术领域。


背景技术:

2.云数据中心运维层次复杂,包含主机设备层、信息平台层、服务调用层,运维场景与业务强相关;且云数据中心网络关系也十分复杂,应用调用关系较多。随着主机设备层、信息平台层、服务调用层中各自报警保护机制中设置的报警逻辑,出现大量的报警信息冗余、报警阈值设置不合理、大量关联报警信息无法分析根源的报警泛滥问题。当某次业务出现故障报警时,会由于业务关联,造成大量相关的报警信息同时并发,导致报警信息溯源困难、无法快速定位到根本故障原因。


技术实现要素:

3.本发明的目的在于克服现有技术中的不足,提供一种服务器报警溯源方法、装置及存储介质,能够实现服务器报警信息溯源、快速定位根本故障原因。
4.为达到上述目的,本发明是采用下述技术方案实现的:
5.第一方面,本发明提供了一种服务器报警溯源方法,包括:
6.采集服务器报警信息;
7.根据服务器报警信息及预构建的服务器报警传播知识图谱,依据因果关联性检索获取所有可能的报警传播路径;
8.通过所述服务器报警传播知识图谱检索所有可能的报警传播路径中两两报警传播路径的交集路径;
9.计算所有交集路径发生可能性;
10.根据交集路径发生可能性计算结果分析获取所述服务器报警信息的报警传播路径。
11.结合第一方面,进一步的,根据服务器业务领域知识和历史报警记录,通过人工或数据挖掘的方法构建所述服务器报警传播知识图谱;
12.所述服务器报警传播知识图谱中至少包含服务器报警信息、服务器报警信息实体、以及服务器报警信息与服务器报警信息实体间可能存在的因果关系。
13.结合第一方面,进一步的,采集服务器报警信息后,对服务器报警信息进行过滤,以获取相应的服务器报警信息实体集合;
14.基于服务器报警信息实体集合中的服务器报警信息实体、以及服务器报警传播知识图谱中存储的因果关系获取所有可能的报警传播路径。
15.结合第一方面,进一步的,所述交集路径发生可能性通过公式(1)计算获取:
16.p(l
cd
)=p(lc) p(ld)
ꢀꢀꢀ
(1)
17.式中:l
cd
表示可能的报警传播路径lc与可能的报警传播路径ld的交集路径;p(l
cd
)
表示交集路径l
cd
发生可能性;p(lc)表示可能的报警传播路径lc发生可能性;p(ld)表示可能的报警传播路径ld发生可能性。
18.结合第一方面,进一步的,可能的报警传播路径发生可能性通过公式(2)计算获取:
[0019][0020]
其中,p(li)为可能的报警传播路径li发生可能性,为传播链最终的报警证据,为报警传播路径li上的n个相连报警信息实体,为与最近的直接相关报警信息实体,为报警传播路径最远的报警信息实体;为报警证据与直接相关报警信息实体之间的条件概率;为与之间的条件概率,以此类推;a
alarm
为服务器报警信息集合;为报警信息实体的先验概率;为报警信息实体的先验概率;为报警信息实体与的因果关系强度;为可能的报警传播路径li中的第j个报警信息实体;为可能的报警传播路径li中的第j-1个报警信息实体;为第i条可能的报警传播路径最终对应的报警证据。
[0021]
结合第一方面,进一步的,根据交集路径发生可能性计算结果,分析获取所述服务器报警信息的报警传播路径的方法包括:
[0022]
比较交集路径发生可能性计算结果,选取最大的m个可能性计算结果所对应的交集路径作为所述服务器报警信息的报警传播路径;
[0023]
其中,m为自定义的大于等于1的正整数。
[0024]
第二方面,本发明提供一种服务器报警溯源装置,包括:
[0025]
采集模块:用于采集服务器报警信息;
[0026]
第一获取模块:用于根据服务器报警信息及预构建的服务器报警传播知识图谱,依据因果关联性检索获取所有可能的报警传播路径;
[0027]
第二获取模块:用于通过所述服务器报警传播知识图谱检索所有可能的报警传播路径中两两报警传播路径的交集路径;
[0028]
计算模块:用于计算所有交集路径发生可能性;
[0029]
第三获取模块:用于根据交集路径发生可能性计算结果分析获取所述服务器报警信息的报警传播路径。
[0030]
结合第二方面,进一步的,所述装置还包括:
[0031]
构建模块:用于根据服务器业务领域知识和历史报警记录,通过人工或数据挖掘的方法构建所述服务器报警传播知识图谱;
[0032]
所述服务器报警传播知识图谱中至少包含服务器报警信息、服务器报警信息实体、以及服务器报警信息与服务器报警信息实体间可能存在的因果关系。
[0033]
结合第二方面,进一步的,所述装置还包括
[0034]
过滤模块:用于对服务器报警信息进行过滤,以获取相应的服务器报警信息实体集合;
[0035]
所述第一获取模块基于服务器报警信息实体集合中的服务器报警信息实体、以及服务器报警传播知识图谱中存储的因果关系获取所有可能的报警传播路径。
[0036]
第三方面,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面任一项所述方法的步骤。
[0037]
与现有技术相比,本发明所达到的有益效果:
[0038]
本发明提供的服务器报警溯源方法、装置及存储介质,根据服务器报警信息通过对服务器报警知识图谱进行检索,实现最终的报警溯源,可以压缩海量关联报警信息,极大地降低了服务器运维中大量关联报警信息的处理工作,从而快速定位根本故障原因,为服务器故障的排除提供了决策依据。
附图说明
[0039]
图1是本发明实施例提供的一种服务器报警溯源方法的流程图。
具体实施方式
[0040]
下面通过附图以及具体实施例对本发明技术方案做详细的说明,应当理解本技术实施例以及实施例中的具体特征是对本技术技术方案的详细的说明,而不是对本技术技术方案的限定,在不冲突的情况下,本技术实施例以及实施例中的技术特征可以相互组合。
[0041]
实施例一:
[0042]
参见图1,是本发明实施例提供的一种服务器报警溯源方法,包括如下步骤:
[0043]
步骤一:采集服务器报警信息;
[0044]
步骤二:根据服务器报警信息及预构建的服务器报警传播知识图谱,依据因果关联性检索获取所有可能的报警传播路径;
[0045]
步骤三:通过所述服务器报警传播知识图谱检索所有可能的报警传播路径中两两报警传播路径的交集路径;
[0046]
步骤四:计算所有交集路径发生可能性;
[0047]
步骤五:根据交集路径发生可能性计算结果分析获取所述服务器报警信息的报警传播路径。
[0048]
本发明实施例中所述服务器报警传播知识图谱是根据服务器业务领域知识和历史报警记录,通过人工或数据挖掘的方法构建获取的。所述服务器报警传播知识图谱中至少包含服务器报警信息、服务器报警信息实体、以及服务器报警信息与服务器报警信息实体间可能存在的因果关系。基于该服务器报警传播知识图谱中存储的因果关系,即可搜索所有可能的报警传播路径。
[0049]
作为本发明的一种实施例,采集服务器报警信息后,对服务器报警信息进行过滤,以获取相应的服务器报警信息实体集合;
[0050]
基于服务器报警信息实体集合中的服务器报警信息实体、以及服务器报警传播知识图谱中存储的因果关系获取所有可能的报警传播路径。
[0051]
以neo4j图数据库的cypher语句为例,查询所有最终导致a1发生的报警事件ai:
[0052]
match(e:alarm{name:a1})《-[r:cause*..]-[a:alarm]return e,r,a
[0053]
其中a1即标识当前检测到报警的报警信息实体a1。alarm表示e实体的类型为报警信息,cause表示关系r的类型为原因类,cause*..则表示多层原因查询。
[0054]
所述交集路径发生可能性通过公式(1)计算获取:
[0055]
p(l
cd
)=p(lc) p(ld)
ꢀꢀꢀ
(1)
[0056]
式中:l
cd
表示可能的报警传播路径lc与可能的报警传播路径ld的交集路径;p(l
cd
)表示交集路径l
cd
发生可能性;p(lc)表示可能的报警传播路径lc发生可能性;p(ld)表示可能的报警传播路径ld发生可能性。
[0057]
可能的报警传播路径发生可能性通过公式(2)计算获取:
[0058][0059]
其中,p(li)为可能的报警传播路径li发生可能性,为传播链最终的报警证据,为报警传播路径li上的n个相连报警信息实体,为与最近的直接相关报警信息实体,为报警传播路径最远的报警信息实体;为报警证据与直接相关报警信息实体之间的条件概率;为与之间的条件概率,以此类推;a
alarm
为服务器报警信息集合;为报警信息实体的先验概率;为报警信息实体的先验概率;为报警信息实体与的因果关系强度;为可能的报警传播路径li中的第j个报警信息实体;为可能的报警传播路径li中的第j-1个报警信息实体;为第i条可能的报警传播路径最终对应的报警证据。
[0060]
作为本发明的一种实施例,根据交集路径发生可能性计算结果,分析获取所述服务器报警信息的报警传播路径的方法包括:
[0061]
比较交集路径发生可能性计算结果,选取最大的m个可能性计算结果所对应的交集路径作为所述服务器报警信息的报警传播路径;
[0062]
其中,m为自定义的大于等于1的正整数。如通过报警传播路径可能计算后,选择的m条报警路径为[l1,l2...li,...lm],第i条报警传播路径为则最终的报警溯源结果l=l1∩l2∩...li∩,...∩lm。当没有交集时,即则减小m的值,重新计算。
[0063]
下面结合具体示例对本发明实施例提供的交集路径发生可能性计算方法做进一步说明,具体如下:
[0064]
一般的,服务器多层业务报警日志为b={b1,b2,...bi...},bi∈{0,1},通过筛选后,可以得到其中已经出现的报警信息为例如:当前发生的报警信息为a={a3,a4,a6}。
[0065]
然后,通过知识图谱检索,查询相关的报警传播路径为:
[0066]
l1=a1→
a2→
a3→
a4[0067]
l2=a1→
a2→
a5→
a6[0068]
报警传播知识图谱中各报警事件的先验概率和之间的因果强度分别为:
[0069]
p(a1)=0.01,p(a2)=0.005,p(a3)=0.004,p(a4)=0.01,p(a5)=0.002,p(a6)=0.003,p(a2|a1)=0.3,p(a3|a2)=0.2,p(a4|a3)=0.4,p(a5|a2)=0.3,p(a6|a5)=0.4;
[0070]
各报警传播路径的发生可能性计算为:
[0071][0072][0073]
通过报警传播知识图谱检索,得到传播路径的交集路径l
12
={a1,a2},报警传播路径l
12
的发生可能性为:
[0074]
p(l
12
)=p(l1) p(l2)=0.15 0.12=0.27
[0075]
所以当前报警信息a={a3,a4,a6}条件下,报警溯源结果为l
12
={a1,a2},发生可能性为0.27。
[0076]
实施例二:
[0077]
本发明实施例提供一种服务器报警溯源装置,可以用于实施实施例一所述的方法,该装置可以由软件和/或硬件的方式实现,该装置可以集成在终端中,例如:任一具备通信功能的智能手机,平板电脑或计算机设备。本发明实施例提供的一种服务器报警溯源装置,具体包括:
[0078]
采集模块:用于采集服务器报警信息;
[0079]
第一获取模块:用于根据服务器报警信息及预构建的服务器报警传播知识图谱,依据因果关联性检索获取所有可能的报警传播路径;
[0080]
第二获取模块:用于通过所述服务器报警传播知识图谱检索所有可能的报警传播路径中两两报警传播路径的交集路径;
[0081]
计算模块:用于计算所有交集路径发生可能性;
[0082]
第三获取模块:用于根据交集路径发生可能性计算结果分析获取所述服务器报警信息的报警传播路径。
[0083]
结合第二方面,进一步的,所述装置还包括:
[0084]
构建模块:用于根据服务器业务领域知识和历史报警记录,通过人工或数据挖掘的方法构建所述服务器报警传播知识图谱;
[0085]
所述服务器报警传播知识图谱中至少包含服务器报警信息、服务器报警信息实体、以及服务器报警信息与服务器报警信息实体间可能存在的因果关系。
[0086]
作为本发明的一种实施例,所述装置还包括
[0087]
过滤模块:用于对服务器报警信息进行过滤,以获取相应的服务器报警信息实体集合;
[0088]
所述第一获取模块基于服务器报警信息实体集合中的服务器报警信息实体、以及服务器报警传播知识图谱中存储的因果关系获取所有可能的报警传播路径。
[0089]
本发明实施例提供服务器报警溯源装置与实施例一提供的服务器报警溯源方法基于相同的技术构思,能够产生如实施例一所述的有益效果,在本实施例中未详尽描述的内容可以参见实施例一。
[0090]
实施例三:
[0091]
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现实施例一所述方法的步骤。
[0092]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0093]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0094]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0095]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0096]
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献