一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

处理故障的方法、装置及系统与流程

2022-06-05 15:32:10 来源:中国专利 TAG:


1.本技术涉及通信领域,特别涉及一种处理故障的方法、装置及系统。


背景技术:

2.通信网络往往包括多个网元,网元在运行的过程中可能会发生故障,所以处理故障是对通信网络运维过程中的一项重要工作。
3.为了能够处理网元中的故障,可以在通信网络中部署网元管理系统(element management system,ems),ems可以与至少一个网元通信。技术人员可以手动为ems配置故障处理规则,这样ems可以通过该故障处理规则处理该至少一个网元中发生的故障。
4.在实现本技术的过程中,发明人发现现有技术至少存在以下问题:
5.在ems中故障处理规则只能由人工根据经验进行各ems的单独配置,各ems配置好的故障处理规则不具有可学习和更新性,从而导致对ems的故障处理规则的配置既效率低,又不实时。


技术实现要素:

6.本技术提供了一种处理故障的方法、装置及系统,以提高配置故障处理规则的效率和实时性。所述技术方案如下:
7.第一方面,本技术提供了一种处理故障的方法,在所述方法中:运营支撑系统oss接收至少一个网元管理系统ems发送的故障信息,该故障信息包括类型信息集合、第一关系集合、故障的根因告警信息、针对该故障的处理建议信息和由该故障引起的多个异常事件的时间信息,该类型信息集合包括该多个异常事件的类型信息,第一关系集合包括该多个异常事件之间的关系。oss将包括相同类型信息集合、根因告警信息和处理建议信息的故障信息聚合成故障信息集合,将该故障信息集合中的每条故障信息中的第一关系集合取交集得到第二关系集合,以及根据每条故障信息中的时间信息确定时间长度,该时间长度是产生该故障引起的异常事件的持续时长。oss向至少一个ems发送故障处理规则,该故障处理规则包括第二关系集合、该时间长度、第一故障信息中的类型信息集合、根因告警信息和处理建议信息,第一故障信息是该故障信息集合中的任意一条故障信息,该故障处理规则用于指示至少一个ems处理该故障。
8.由于ems发送的故障信息包括第一关系集合和多个异常事件的时间信息,这样oss可以将故障信息集合中的各故障信息包括的第一关系集合取交集得到第二关系集合,以及基于故障信息集合中的各故障信息包括的时间信息确定时间长度,从而可以得到一条包括第二关系集合和该时间长度等内容的故障处理规则。由于oss可以接收不同ems发送的故障信息,并基于各ems的故障信息生成故障处理规则,丰富了生成故障处理所需的数据,不仅使得生成的故障处理规则具有可学习性和更新性,还提高生成故障处理规则的效率,oss向至少一个ems发送该故障处理规则,从而提高在ems中配置故障处理规则的效率和实时性。
9.在一种可能的实现方式中,该多个异常事件之间的关系使用至少一条类型关系数
据表示,每条类型关系数据包括该多个异常事件中的两个异常事件的类型信息和该两个异常事件的类型信息之间的关系,该两个异常事件所在对象之间存在该关系。由于第一关系集合中的异常事件之间的关系用类型关系数据来表示,这样oss直接可以对故障信息集合中的各故障信息包括的第一关系集合取交集,从而提高生成故障处理规则的效率。
10.在另一种可能的实现方式中,该故障信息还包括该多个异常事件中的每个异常事件所在对象的对象信息;该多个异常事件之间的关系使用至少一条对象关系数据表示,每条对象关系数据包括存在关系的两个对象的对象信息和该关系,每个异常事件所在的对象包括该两个对象。oss根据该至少一条对象关系数据、每个异常事件的对象信息和类型信息,获取该故障信息对应的类型关系数据集合,该类型关系数据集合包括至少一条类型关系数据,每条类型关系数据包括该多个异常事件中的两个异常事件的类型信息和该两个异常事件的类型信息之间的关系,该两个异常事件所在对象之间存在该关系。oss将该故障信息集合中的每条故障信息对应的类型关系数据集合取交集得到第二关系集合。
11.由于第一关系集合中的异常事件之间的关系用至少一条对象关系数据来表示,以及故障信息还包括每个异常事件的对象信息,这样oss利用该至少一条对象关系数据、每个异常事件的对象信息和类型信息,不仅可以生成故障处理规则,还可以基于该至少一条对象关系数据和每个异常事件的对象信息实现其他应用。例如,oss可以基于该至少一条对象关系数据生成对象拓扑图,或者,基于该至少一条对象关系数据和每个异常事件的对象信息确定需要维修的对象。
12.在另一种可能的实现方式中,多个异常事件的时间信息是该多个异常事件的产生时间的时间跨度。oss从每条故障信息中的时间跨度中选择最大时间跨度作为该时间长度。由于故障信息中的时间信息是一个时间跨度,这样可以减小故障信息的数据量,另外,oss选择最大的时间跨度作为该时间长度,这样使该时间长度能够覆盖由该故障引起的各异常事件。
13.在另一种可能的实现方式中,该多个异常事件的时间信息是该多个异常事件中的每个异常事件的产生时间。oss根据每条故障信息包括的时间信息,分别获取每条故障信息对应的异常事件的产生时间的时间跨度。oss从获取的时间跨度中选择最大时间跨度作为该时间长度。由于该故障信息中包括每个异常事件的产生时间,这样oss基于各故障信息中的异常事件的产生时间,不仅可以得出故障处理规则中的时间长度,还可以实现其他应用。例如,可以显示故障信息中的异常事件的产生时间,以给运维人员观看,或者,基于故障信息中的异常事件的产生时间确定ems做根因定位的过程和/或确定需要维修的对象。
14.在另一种可能的实现方式中,该多个异常事件的类型包括告警类型、性能越限类型和/或网元异常日志类型。
15.在另一种可能的实现方式中,oss基于该至少一条对象关系数据生成对象拓扑图,显示该对象拓扑图,以供运维人员查看。
16.第二方面,本技术提供了一种处理故障的方法,在所述方法中,网元管理系统ems获取ems所管理的至少一个网元上报的由第一故障引起的多个第一异常事件信息,以及获取第一故障的根因告警信息和处理建议信息,第一异常事件信息包括第一异常事件的类型信息、产生时间和所在对象的对象信息。ems基于每个第一异常事件的对象信息获取第一关系集合,第一关系集合包括该多个第一异常事件之间的关系。ems向运营支撑系统oss发送
第一故障信息,第一故障信息包括类型信息集合、第一时间信息、第一关系集合、该根因告警信息和该处理建议信息,类型信息集合包括每个第一异常事件的类型信息,第一时间信息包括该多个第一异常事件的产生时间或该多个第一异常事件的产生时间的时间跨度,第一故障信息用于oss生成第一故障处理规则,第一故障处理规则用于指示接收第一故障处理规则的至少一个ems处理第一故障。
17.其中,第一故障处理规则包括第二关系集合、第一时间长度、故障信息集合中的任一条第一故障信息中的类型信息集合、根因告警信息和处理建议信息,第一故障信息集合包括oss接收的多条第一故障信息且该多条第一故障信息中的每条第一故障信息包括相同的类型信息集合、根因告警信息和处理建议信息,第二关系集合是oss接收的该多条第一故障信息中的第一关系集合的交集,第一时间长度是oss基于该多条第一故障信息中的第一时间信息得到的,第一时间长度是产生第一故障引起的第一异常事件的持续时长。
18.由于ems向oss发送的故障信息包括第一关系集合和多个异常事件的时间信息,这样oss可以将第一故障信息集合中的各第一故障信息包括的第一关系集合取交集得到第二关系集合,以及基于第一故障信息集合中的各第一故障信息包括的时间信息确定第一时间长度,从而可以得到一条包括第二关系集合和第一时间长度等内容的故障处理规则。由于oss可以接收不同ems发送的第一故障信息,并基于各ems的第一故障信息生成故障处理规则,丰富了生成故障处理所需的数据,不仅使得生成的故障处理规则具有可学习性和更新性,还提高生成故障处理规则的效率,oss向ems发送该故障处理规则,从而提高在ems中配置故障处理规则的效率和实时性。
19.在一种可能的实现方式中,该多个第一异常事件之间的关系使用至少一条类型关系数据表示,每条类型关系数据包括该多个第一异常事件中的两个第一异常事件的类型信息和该两个第一异常事件的类型信息之间的关系,该两个第一异常事件所在对象之间存在该关系,ems包括网络拓扑图。ems基于该网络拓扑图和/或每个第一异常事件的对象信息和类型信息,获取第一关系集合。由于ems获取的第一关系集合中的异常事件之间的关系用类型关系数据来表示,这样oss对第一故障信息集合中的各故障信息包括的第一关系集合取交集,从而提高生成故障处理规则的效率。
20.在另一种可能的实现方式中,该多个第一异常事件之间的关系使用至少一条对象关系数据表示,每条对象关系数据包括存在关系的两个对象的对象信息和该关系,该多个第一异常事件中的每个第一异常事件所在的对象包括该两个对象,该ems包括网络拓扑图。ems基于该网络拓扑图和/或每个第一异常事件的对象信息,获取第一关系集合。由于ems获取的第一关系集合包括至少一条对象关系数据,这样oss利用第一关系集合,不仅可以生成故障处理规则,还可以基于第一关系集合实现其他应用。例如,oss可以基于第一关系集合生成对象拓扑图,或者,基于第一关系集合确定需要维修的对象。
21.在另一种可能的实现方式中,第一故障信息还包括每个第一异常事件的对象信息。这样oss利用第一关系集合、每个异常事件的对象信息和类型信息,可以生成故障处理规则。
22.在另一种可能的实现方式中,该多个第一异常事件的类型包括告警类型、性能越限类型和/或网元异常日志类型。
23.在另一种可能的实现方式中,ems接收第一故障处理规则,基于第一故障处理规则
获取该至少一个网元上报的由第二故障引起的多个第二异常事件信息,第一故障和第二故障是同类型故障,第二异常事件信息包括第二异常事件的类型信息、产生时间和所在对象的对象信息。ems基于每个第二异常事件的对象信息获取第三关系集合,第三关系集合包括该多个第二异常事件之间的关系。ems向oss发送第二故障信息,第二故障信息包括第二时间信息、第三关系集合、该类型信息集合、该根因告警信息和该处理建议信息,第二时间信息包括该多个第二异常事件的产生时间或该多个第二异常事件的产生时间的时间跨度。
24.其中,oss可以基于第二故障信息用于生成第二故障处理规则,第二故障处理规则包括第四关系集合、第二时间长度、该类型信息集合、该根因告警信息和该处理建议信息,第四关系集合是oss接收的多条第二故障信息中的第三关系集合的交集,该多条第二故障信息均包括该类型信息集合、该根因告警信息和该处理建议信息,第二时间长度是oss基于该多条第二故障信息中的第二时间信息得到的,第二时间长度是产生第二故障引起的第二异常事件的持续时长。ems接收第二故障处理规则,将第一故障处理规则更新为第二故障处理规则。这样可以oss可以基于不同ems的第二故障信息,产生故障处理规则并向ems发送该故障处理规则,以使ems可以及时更新故障处理规则,使得故障处理规则具有实时性,并提高更新的效率。
25.第三方面,本技术提供了一种处理故障的装置,用于执行第一方面或第一方面的任意一种可能的实现方式中的由oss执行的方法。具体地,所述装置包括用于执行第一方面或第一方面的任意一种可能的实现方式中的由oss执行的方法的单元。
26.第四方面,本技术提供了一种处理故障的装置,用于执行第二方面或第二方面的任意一种可能的实现方式中的由ems执行的方法。具体地,所述装置包括用于执行第二方面或第二方面的任意一种可能的实现方式中的由ems执行的方法的单元。
27.第五方面,本技术提供了一种处理故障的装置,所述装置包括收发器、处理器和存储器。其中,所述收发器、所述处理器以及所述存储器之间可以通过内部连接相连。所述存储器用于存储程序,所述处理器用于执行所述存储器中的程序以及配合收发器,使得所述装置完成第一方面或第一方面的任意可能的实现方式中的由oss执行的方法。
28.第六方面,本技术提供了一种处理故障的装置,所述装置包括收发器、处理器和存储器。其中,所述收发器、所述处理器以及所述存储器之间可以通过内部连接相连。所述存储器用于存储程序,所述处理器用于执行所述存储器中的程序以及配合收发器,使得所述装置完成第二方面或第二方面的任意可能的实现方式中的由ems执行的方法。
29.第七方面,本技术提供了一种计算机程序产品,所述计算机程序产品包括在计算机可读存储介质中存储的计算机程序,并且所述计算程序通过设备进行加载来实现上述第一方面、第二方面、第一方面任意可能的实现方式或第二方面任意可能的实现方式的方法的指令。
30.第八方面,本技术提供了一种计算机可读存储介质,用于存储计算机程序,所述计算机程序通过设备进行加载来执行上述第一方面、第二方面、第一方面任意可能的实现方式或第二方面任意可能的实现方式的方法的指令。
31.第九方面,本技术提供了一种处理故障的系统,所述系统包括第三方面所述的装置和第四方面所述的装置,或者,所述系统包括第五方面所述的装置和第六方面所述的装置。
附图说明
32.图1是本技术实施例提供的一种网络架构示意图;
33.图2是本技术实施例提供的一种处理故障的方法流程图;
34.图3是本技术实施例提供的另一种处理故障的方法流程图;
35.图4是本技术实施例提供的一种处理故障的装置结构示意图;
36.图5是本技术实施例提供的另一种处理故障的装置结构示意图;
37.图6是本技术实施例提供的另一种处理故障的装置结构示意图;
38.图7是本技术实施例提供的另一种处理故障的装置结构示意图;
39.图8是本技术实施例提供的一种处理故障的系统结构示意图。
具体实施方式
40.下面将结合附图对本技术实施方式作进一步地详细描述。
41.参见图1,本技术实施例提供了一种网络架构,包括:
42.运营支撑系统(operations support system,oss)、多个ems和多个网元,每个ems与oss通信,以及每个ems与一个或多个网元通信。
43.oss用于生成至少一个故障处理规则,向与该oss通信的ems发送该至少一个故障处理规则。
44.其中,对于该至少一个故障处理规则中的每个故障处理规则,该故障处理规则用于处理网元产生的故障,每个故障处理规则处理的故障可能不同。
45.对于任一个用于处理故障的故障处理规则,该故障处理规则包括类型信息集合、第一类型关系数据集合、根因告警信息、处理建议信息和时间长度。
46.其中,类型信息集合包括多个类型信息,该多个类型信息是该故障引起的多个异常事件的类型信息。该故障引起的各异常事件的产生时间的时间跨度小于或等于该时间长度。第一类型关系数据集合包括至少一条类型关系数据,每条类型关系数据包括该类型信息集合中的两个类型信息和该两个类型信息之间的关系。根因告警信息包括根因告警事件的类型信息,根因告警事件是该故障直接引起的异常事件,根因告警信息可用于反映出现该故障的原因。处理建议信息用于指示ems或oss如何对该故障进行处理。
47.对于每个ems,以及对于与该ems通信的一个或多个网元,该ems用于根据该至少一个故障处理规则对该一个或多个网元出现的故障进行处理,以使出现故障的网元恢复正常。
48.其中,对于该多个网元中的任意网元,该网元在出现故障时可能产生异常事件,与该网元相关联的其他网元也可能受该故障影响产生异常事件。例如对于正在通信的两个终端,该两个终端之间的业务路径经过多个网元,该业务路径经过的多个网元相互关联,其中一个网元故障并产生异常事件,其他网元也可能受影响,也可能产生异常事件。
49.对于任一个出现故障的网元,为了便于说明,将该出现故障的网元称为第一网元。在第一网元出现故障时,第一网元产生并上报至少一个异常事件。该至少一个异常事件均是由该故障直接或间接引起的。
50.第一网元出现故障可能是第一网元中的某个部件出现故障。第一网元产生的异常事件包括至少一个告警事件,该至少一个告警事件包括由该故障直接引起的告警事件,还
可能包括由该故障间接引起的告警事件。由该故障直接引起的告警事件又可称为根因告警事件,根因告警事件可用于反映该故障出现的原因。
51.可选的,第一网元产生的异常事件还可能包括至少一个性能越限事件和/或至少一个网元异常日志事件等。其中,性能越限事件是第一网元的性能参数的参数值超过参数值阈值时产生的与该性能参数相对应的事件。所谓性能参数的参数值超过参数值阈值是指该性能参数的参数值大于该参数值阈值,或者,该性能参数的参数值小于该参数值阈值。
52.例如,假设第一网元的某个端口出现故障,则第一网元直接产生的告警事件为端口告警事件,即该端口告警事件为该故障直接引起的告警事件,因此该端口告警事件是根因告警事件。由于该端口故障,可能导致经过该端口的链路无法承载业务,第一网元可能还产生链路故障告警事件。该链路故障告警事件就是由该故障间接引起的告警事件。
53.由于第一网元无法在该故障的端口上收发数据,导致该端口的传输速率急剧下降,在该端口的传输速率低于速率阈值时,第一网元可能产生传输速率越限事件,该传输速率越限事件是一种性能越限事件。
54.在该端口出现故障后,第一网元可能产生该故障的日志,第一网元产生的日志可能包括端口异常日志,即第一网元可能产生端口异常日志事件,该端口异常日志事件是网元异常日志事件。所以在第一网元中的端口出现故障时,第一网元产生的异常事件包括端口告警事件、链路故障告警事件、传输速率越限事件和端口异常日志事件。
55.需要说明的是:在该端口出现故障后,第一网元可能产生一条日志,也可能产生多条日志。第一网元产生的每条日志可能对应一个网元异常日志事件,所以第一网元可能产生一个或多个网元异常日志事件。上述列举了第一网元产生端口异常日志事件,第一网元也可能不会产生其他网元异常日志事件,或者,第一网元还可能产生其他网元异常日志事件。例如第一网元还可能产生链路异常日志,即第一网元还可能产生链路异常日志事件。其中,需要说明的是:经过该端口的链路可能有一条或多条,在经过该端口的链路为多条的情况下,第一网元可能产生一个链路异常日志事件,该链路异常日志事件与该多条链路相对应,或者,第一网元也可能产生多个链路异常日志事件,每个链路异常日志事件与一条链路相对应。
56.对于与第一网元通信的其他网元,该其他网元也可能受第一网元出现的故障影响,也可能产生至少一个异常事件。与第一网元通信,并受第一网元出现的故障影响的其他网元可以称为第二网元。
57.例如,仍以上述第一网元中的端口出现故障为例,第二网元中的端口与第一网元的该故障端口之间存在链路,导致第二网元从该链路上无法接收到第一网元发送的数据,第二网元在检测到第一网元中的该故障端口阻塞,第二网元产生远端端口阻塞告警事件。由于第二网元无法通过该链路接收第一网元发送的数据,第二网元可能会产生记录该情况的日志,第二网元产生的日志可能包括链路异常日志,即第二网元产生链路异常日志事件。
58.其中,同第一网元一样,第二网元可能产生一条日志,或者,可能产生多条日志。第二网元产生的每条日志可能对应一个网元异常日志事件,所以第二网元可能产生一个或多个网元异常日志事件。例如,第二网元中的端口与第一网元的该故障端口之间可能存在多条链路,第二网元可能产生与该多条链路相对应的一个链路异常日志事件,或者,产生与每条链路相对应的链路异常日志事件。
59.再例如,在第一网元的风扇故障时,第一网元产生风扇故障告警事件,该风扇故障告警事件是该风扇故障直接引起的异常事件,为根因告警事件。由于第一网元的风扇故障,导致第一网元的单板工作温度上升,在单板工作温度超过温度阈值时,第一网元产生工作温度越限事件(越限即超过限额,可以是大于最大限额或小于最小限额)。该工作温度越限事件是该风扇故障间接引起的异常事件。第一网元还可能产生该风扇故障的日志,使得第一网元可能产生风扇异常日志事件,该风扇异常日志事件也是该风扇故障间接引起的异常事件。
60.对于第二网元中与第一网元中的该单板相连(即通信连接)的端口,第二网元通过该端口接收数据的误码率变高。在误码率高于误码率阈值时,第二网元产生误码率越限事件。
61.在该例子中,第二网元除了产生误码率越限事件外,还可能其他异常事件,如还可能告警事件和/或网元异常日志事件等。例如,在实现时,第二网元还可能产生误码率异常日志,使得第二网元产生误码率异常日志事件。
62.对于每个网元,该网元在产生异常事件后,向与该网元通信的ems发送产生的异常事件的事件信息。其中,异常事件的事件信息包括该异常事件的类型信息、该异常事件的产生时间和该异常事件所在的对象的对象信息。
63.该异常事件的类型信息包括该异常事件属于的事件类型(比如告警类型,性能越限类型或网元异常日志类型等)和该异常事件属于该事件类型的子类型。
64.该异常事件的事件信息还可以包括其他信息。例如,网元异常日志事件的事件信息还可以包括与该网元异常日志事件相对应的日志内容。
65.告警类型的异常事件的事件名称为告警事件。告警类型包括至少一个子类型,例如属于告警类型的子类型包括端口告警类型、链路故障告警类型、远端端口阻塞告警类型和/或风扇故障告警类型等。告警类型的异常事件包括与告警类型的子类型对应事件,例如端口告警事件(对应于端口告警类型)、链路故障告警事件(对应于链路故障告警类型)、远端端口阻塞告警事件(对应于远端端口阻塞告警类型)和/或风扇故障告警事件(对应于风扇故障告警类型)等。
66.性能越限类型的异常事件的事件名称为性能越限事件。性能越限类型包括至少一个子类型,例如属于性能越限类型的子类型包括传输速率越限类型和/或误码率越限类型等。性能越限类型的性能越限事件包括与性能越限类型的子类型对应的事件,例如传输速率越限事件(对应于传输速率越限类型)和/或误码率越限事件(对应于误码率越限类型)等。
67.网元异常日志类型的异常事件的事件名称为网元异常日志事件。网元异常日志类型包括至少一个子类型,例如属于网元异常日志类型的子类型包括链路异常日志类型、误码率异常日志类型和/或风扇异常日志类型等。网元异常日志类型的异常事件包括与网元异常日志类型的子类型对应事件,例如链路异常日志事件(对应于链路异常日志类型)、误码率异常日志事件(对应于误码率异常日志类型)和/或风扇异常日志事件(对应于风扇异常日志类型)等。
68.异常事件所在的对象是产生该异常事件的对象,该对象的对象信息包括该对象的对象标识和/或该对象所在网元的网元标识,还可能包括该对象的描述信息。该对象可能是
一个网元,网元中的部件或网元上建立的链路在该网元侧的端点等。
69.例如,对于上第一网元产生的端口告警事件,该端口告警事件所在的对象为第一网元中的该端口,该对象的对象信息包括该端口的端口标识和第一网元的网元标识。该对象的对象信息还可能包括该端口的描述信息,该描述信息可以用于描述该端口在第一网元中的位置,例如该描述信息包括该端口在第一网元中的槽位位置。
70.对于ems,该ems接收与其通信的至少一个网元发送的多个异常事件的事件信息,基于该多个异常事件的事件信息生成故障信息,向oss发送故障信息,以使oss可以基于故障信息生成故障处理规则。其中,ems生成故障信息以及oss生成故障处理规则的详细过程,将在后续实施例进行详细说明。
71.参见图2,本技术实施例提供了一种处理故障的方法,该方法可以应用图1所示的网络架构,在该方法中,ems生成故障信息,该故障信息包括类型信息集合、对象关系数据集合、根因告警信息和处理建议信息,oss接收ems发送的故障信息,并基于接收的故障信息生成故障处理规则。该方法包括:
72.步骤201:ems接收至少一个网元发送的多个异常事件的事件信息。
73.该至少一个网元中的每个网元与ems通信。例如,该每个网元与ems之间存在网络连接。
74.对于该至少一个网元中的任一个网元,为了便于说明称该网元为第一网元,在第一网元出现故障时,第一网元可能产生至少一个异常事件,以及第二网元也可能产生至少一个异常事件,第二网元是该至少一个网元中除第一网元之外的其他网元。
75.第一网元向ems发送第一网元产生的每个异常事件的事件信息,第二网元也向ems发送第二网元产生的每个异常事件的事件信息。
76.ems接收多个异常事件的事件信息,该多个异常事件包括至少一个告警事件。对于任一个告警事件,该告警事件的事件信息包括该告警事件的类型信息,该告警事件的产生时间和该告警事件所在的对象的对象信息。该告警事件的类型信息包括告警类型和该告警事件属于的告警类型的子类型,该告警事件所在的对象是产生该告警事件的对象,该对象的对象信息包括该对象的对象标识和该对象所在网元的网元标识,还可能包括该对象的描述信息。
77.可选的,该告警事件的事件信息还可能包括该告警事件的事件标识和/或告警级别等信息,该事件标识可以在ems中标识该告警事件。
78.例如,仍以图1所示实施例中列举的第一网元的端口出现故障为例,在第一网元的端口故障时,导致第一网元产生的告警事件包括端口告警事件和链路故障告警事件,第二网元产生的告警事件包括远端端口阻塞告警事件。因此参见下表1,ems接收的告警事件的事件信息包括端口告警事件的事件信息、链路故障告警事件的事件信息和远端端口阻塞告警事件的事件信息。在表1中端口标识port1对应的端口p1是第一网元中的故障端口。端口标识port2对应的端口p2是第二网元中的与该故障端口p1相连的端口。第一链路端点是链路1在第一网元侧的端点,链路1是在第一网元的该故障端口p1和第二网元中的该端口p2之间建立的链路,链路1的链路标识link1,第一链路端点的端点标识为link1-1且位于该故障端口p1中。端口告警事件所在的对象是端口p1,链路故障告警事件所在的对象是第一链路端点,远端端口阻塞事件所在的对象是端口p2。
79.表1
[0080][0081]
该多个异常事件还可能包括至少一个性能越限事件,对于任一个性能越限事件,该性能越限事件的事件信息包括该性能越限事件的类型信息,该性能越限事件的产生时间和该性能越限事件所在的对象的对象信息。该性能越限事件的类型信息包括性能越限类型和该性能越限事件属于的性能越限类型的子类型。可选的,该性能越限事件的事件信息还可能包括该性能越限事件的事件标识和/或性能参数的参数值等信息,该事件标识可以在ems中标识该性能越限事件。
[0082]
例如,在第一网元的端口故障时,导致第一网元产生的性能越限事件包括传输速率越限事件。因此参见下表2,ems接收的性能越限事件的事件信息包括传输速率越限事件的事件信息,传输速率越限事件所在的对象也为端口p1。
[0083]
表2
[0084][0085]
该多个异常事件还可能包括至少一个网元异常日志事件,对于任一个网元异常日志事件,该网元异常日志事件的事件信息包括该网元异常日志事件的类型信息,该网元异常日志事件的产生时间和该网元异常日志事件所在的对象的对象信息。该网元异常日志事件的类型信息包括网元异常日志类型和该网元异常日志事件属于的网元异常日志类型的子类型。可选的,该网元异常日志事件的事件信息还可能包括该网元异常日志事件的事件标识和/或日志内容等信息,该事件标识可以在ems中标识该网元异常日志事件。
[0086]
例如,假设在第一网元的端口故障时,第一网元产生的网元异常日志事件包括端口异常日志事件,第二网元产生的网元异常日志事件包括链路异常日志事件。因此参见下表3,ems接收的网元异常日志事件的事件信息包括端口异常日志事件的事件信息和链路异常日志事件的事件信息,端口异常日志事件所在的对象为端口p1,链路异常日志事件所在
的对象为第二链路端点,第二链路端点是链路1在第二网元侧的端点,第二链路端点位于第二网元的端口p2中。
[0087]
表3
[0088][0089]
步骤202:ems根据多个异常事件的事件信息和ems中的至少一个故障处理规则,确定同一故障引起的至少一个异常事件的事件信息。
[0090]
其中,ems可以在接收到异常事件的事件信息时就开始执行本步骤,或者,定期地执行本步骤。ems在本步骤中使用的该多个异常事件的事件信息包括最新接收的异常事件的事件信息,还可能包括在之前生成故障信息时被排除的异常事件的事件信息,但该多个异常事件中的每个异常事件的产生时间与当前时间之间的时间差值小于指定的时间差阈值。
[0091]
ems存储有网络拓扑图和至少一个故障处理规则,该至少一个故障处理规则可能包括ems接收oss发送的故障处理规则和/或在ems中配置的故障处理规则。oss发送的故障处理规则是oss生成的。
[0092]
在步骤202中,ems可以通过如下2021至2025的操作确定同一故障引起的至少一个异常事件的事件信息。该2021至2025的操作,分别为:
[0093]
2021:ems从该至少一个故障处理规则中选择一个故障处理规则作为目标故障处理规则。
[0094]
目标故障处理规则包括类型信息集合、第一类型关系数据集合、根因告警信息、处理建议信息和时间长度。该类型信息集合包括至少一个子类型集合,该至少一个子类型集合包括告警类型对应的告警类型集合,该告警类型集合包括属于告警类型的至少一个子类型。
[0095]
可选的,该至少一个子类型集合还可能包括性能越限类型对应的性能越限类型集合和/或网元异常日志类型对应的网元异常日志类型集合。该性能越限类型集合包括属于性能越限类型的至少一个子类型,以及该网元异常日志类型集合包括属于网元异常日志类型的至少一个子类型。
[0096]
第一类型关系数据集合包括至少一条类型关系数据,每条类型关系数据包括两个类型信息和该两个类型信息之间的关系。
[0097]
可选的,在实现时,该类型关系数据具体包括两个子类型和该两个子类型之间的关系,该两个子类型可能属于同一事件类型,或者,属于不同事件类型。比如,《端口告警类型,链路故障告警类型,包含关系》;表示,同属于告警类型的端口告警类型和链路故障告警
类型,以及这两个告警类型的关系为包含关系。再比如,《端口告警类型,传输速率越限类型,同网元关系》:表示,端口告警类型和传输速率越限类型以及这两个子类型的关系为同网元关系,端口告警类型和传输速率越限类型属于不同事件类型。
[0098]
根因告警信息包括根因告警事件的类型信息。可选的,根因告警信息包括根因告警事件的子类型。
[0099]
接下来列举一个故障处理规则的例子,例如,ems中保存如表4所示的故障处理规则。参见下表4,该故障处理规则中的类型信息集合包括三个子类型集合,该三个子类型集合分别为告警类型集合、性能越限类型集合和网元异常日志类型集合。告警类型集合包括的子类型为端口告警类型,链路故障告警类型和远端端口阻塞告警类型。性能越限类型集合包括的子类型为传输速率越限类型。网元异常日志类型集合包括的子类型为端口异常日志类型和链路异常日志类型。该故障处理规则中的第一类型关系数据集合包括的类型关系数据为《端口告警类型,链路故障告警类型,同网元关系》,《端口告警类型,传输速率越限类型,同网元关系》,
……
。该故障处理规则中的根因告警信息包括端口告警类型,是根因告警事件的子类型,根因告警事件为端口告警事件。该故障处理规则中的处理建议信息为重启根因告警事件所在端口。该故障处理规则中的时间长度为50秒。
[0100]
表4
[0101][0102]
2022:ems根据该多个异常事件中的每个异常事件的事件信息和目标故障处理规则包括的类型信息集合确定第一集合,第一集合包括该类型信息集合中的每个类型信息对应的异常事件。
[0103]
该多个异常事件中的每个异常事件的事件信息包括类型信息,目标故障处理规则包括类型信息集合。在2022中,确定第一集合的过程可以为:确定该多个异常事件中是否存
在该类型信息集合包括的每个类型信息对应的异常事件,如果存在,则获取第一集合,第一集合包括该类型信息集合中的每个类型信息对应的异常事件;如果不存在,则返回2021重新选择一个故障处理规则作为目标故障处理规则。
[0104]
由于该类型信息集合包括至少一个子类型集合,每个子类型集合包括至少一个子类型,该多个异常事件中的每个异常事件的类型信息也包括子类型,所以在实现时,确定第一集合的过程可以为:确定该多个异常事件中是否存在该类型信息集合包括的每个子类型对应的异常事件,如果存在,则获取第一集合,第一集合包括该类型信息集合中的每个子类型对应的异常事件。
[0105]
其中,该多个异常事件中可能存在不归属于第一集合中的异常事件,对于归属于第一集合中的异常事件,可以在下一次生成故障信息时使用这一部分异常事件。
[0106]
例如,ems接收到上述表1、表2和表3所示的六个异常事件,该六个异常事件分别为端口告警事件、链路故障告警事件、远端端口阻塞告警事件、传输速率越限事件、端口异常日志事件和链路异常日志事件,以及ems存储有如表4所示的目标故障处理规则,目标故障处理规则中的类型信息集合包括六个子类型,该六个子类型为端口告警类型、链路故障告警类型、远端端口阻塞告警类型、传输速率越限类型、端口异常日志类型和链路异常日志类型。其中,表1、表2和表3所示的六个异常事件中包括端口告警类型对应的端口告警事件,链路故障告警类型对应的链路故障告警事件,远端端口阻塞告警类型对应的远端端口阻塞告警事件,传输速率越限类型对应的传输速率越限事件,端口异常日志类型对应的端口异常日志事件和链路异常日志类型对应的链路异常日志事件。因此得到的第一集合包括端口告警事件、链路故障告警事件、远端端口阻塞告警事件、传输速率越限事件、端口异常日志事件和链路异常日志事件。
[0107]
2023:ems根据第一集合和目标故障处理规则包括的时间长度确定第二集合。第二集合是第一集合的子集,第二集合包括的异常事件的产生时间的时间跨度小于或等于目标故障处理规则包括的时间长度。
[0108]
其中,该时间跨度等于第二集合中的最早产生的异常事件的产生时间和最晚产生的异常事件的产生时间之间的时间差。第二集合是第一集合的子集的情况,包括第二集合属于第一集合,或者,第二集合和第一集合相同。
[0109]
在步骤2023中,获取第一集合中的异常事件的产生时间的时间跨度,如果该时间跨度小于或等于目标故障处理规则包括的时间长度,将第一集合作为第二集合。如果该时间跨度大于目标故障处理规则包括的时间长度,从第一集合中去除最早产生异常事件或最晚产生的异常事件。然后,再获取第一集合中的剩余异常事件的产生时间的时间跨度,如果获取的时间跨度小于或等于目标故障处理规则包括的时间长度,将第一集合中的剩余异常事件组成第二集合。如果获取的时间跨度大于目标故障处理规则包括的时间长度,继续从第一集合剩余的异常事件中去除最早产生异常事件或最晚产生的异常事件,并继续重复上述过程,直至第一集合中剩余的异常事件的产生时间的时间跨度小于或等于目标故障处理规则中的时间长度为止。
[0110]
例如,第一集合中的最早产生的异常事件为端口异常事件,最晚产生的异常事件为链路异常日志事件,根据端口异常事件的产生时间t1和链路异常日志事件的产生时间t6获取第一集合中的该六个异常事件的产生时间的时间跨度为t6-t1。假设t6-t1小于或等于
50秒,所以将第一集合作为第二集合,第二集合也包括该六个异常事件,即如表5所示,第二集合包括端口告警事件、链路故障告警事件、远端端口阻塞告警事件、传输速率越限事件、端口异常日志事件和链路异常日志事件。
[0111]
表5
[0112]
第二集合包含的异常事件端口告警事件链路故障告警事件远端端口阻塞告警事件传输速率越限事件端口异常日志事件链路异常日志事件
[0113]
2024:在第二集合包括目标故障处理规则中的类型信息集合中的每个类型信息对应的异常事件的情况下,ems根据网络拓扑图和/或第二集合中的各异常事件的事件信息,获取第二类型关系数据集合。
[0114]
其中,第二类型关系数据集合包括至少一条类型关系数据,每条类型关系数据包括两个类型信息和该两个类型信息之间的关系,该两个类型信息是第二集合中的两个异常事件的类型信息。
[0115]
在第二集合没有包括目标故障处理规则中的某一个或多个类型信息对应的异常事件的情况下,返回2021重新选择一个故障处理规则作为目标故障处理规则。
[0116]
在2024中,对于第二集合中的任意两个异常事件,为了便于说明,将该两个异常事件称为第一异常事件和第二异常事件,根据第一对象的对象标识和所在的网元标识,第二对象的对象标识和所在的网元标识,和/或,网络拓扑图,确定第一对象和第二对象之间是否存在至少一个指定关系。其中,第一对象是第一异常事件所在的对象,第二对象是第二异常事件所在的对象。如果第一对象和第二对象之间存在至少一个指定关系,从该至少一个指定关系中选择一个指定关系作为第一对象和第二对象之间的关系,该关系也是第一异常事件的类型信息与第二异常事件的类型信息之间的关系。从而可以得出一条类型关系数据以及一条对象关系数据,该类型关系数据包括第一异常事件的类型信息、第二异常事件的类型信息和该关系,该对象关系数据包括第一对象的对象信息、第二对象的对象信息和该关系。
[0117]
可选的,该类型关系数据具体包括第一异常事件的子类型、第二异常事件的子类型和该关系,该对象关系数据具体包括第一对象的对象标识、第一对象所在网元的网元标识、第二对象的对象标识、第二对象所在网元的网元标识,以及该关系。
[0118]
可选的,ems从该至少一个指定关系中选择优先级最大或最小的一个指定关系作为第一对象和第二对象之间的关系。
[0119]
可选的,指定关系可以为包含关系,承载关系,同业务关系,邻居关系或同网元关系等。在本技术实施例中定义了包含关系,承载关系,同业务关系,邻居关系和同网元关系的优先级,各关系的优先级不同。例如,接下来列举了一种各关系的优先级大小的实例,该实例为:包含关系》承载关系》同业务关系》邻居关系》同网元关系的优先级;各关系的优先级大小除了上述列举的实例外,还可能是其他实现实例,在此不再一一列举说明。
[0120]
所谓包含关系是指第一对象包括第二对象或第二对象包括第一对象,例如,第一对象是单板,第二对象是单板中的端口,第一对象包括第二对象。所谓承载关系是指第一对象位于第二对象上或第二对象位于第一对象上,例如,第一对象是物理链路,第二对象是逻辑链路,第二对象位于第一对象上。所谓同业务关系是指第一对象和第二对象用于传输相同业务。所谓邻居关系是指在第一对象和第二对象属于两个不同网元且两个网元之间直接相连。所谓同网元关系是第一对象和第二对象位于同一网元。
[0121]
例如,对于第二集合中的任意两个异常事件,假设该两个异常事件为端口告警事件和链路故障告警事件,端口告警事件所在对象为端口p1,端口p1位于第一网元上,端口告警事件的对象标识为端口标识port1;链路故障告警事件所在对象为第一链路端点,第一链路端点也位于第一网元上,链路故障告警事件的对象标识为端点标识link1-1。所以ems根据端口p1的对象标识port1和所在的第一网元标识ne1,第一链路端点的对象标识link1-1和所在的第一网元标识ne1,和/或,网络拓扑图,确定端口p1和第一链路端点之间是否存在至少一个指定关系。其中端口p1位于第一网元上,第一链路端点位于端口p1中,所以端口p1和第一链路端点之间存在包含关系和同网元关系,选择优先级最大的包含关系作为端口p1和第一链路端点之间的关系。从而可以得出一条类型关系数据以及一条对象关系数据,该类型关系数据为《端口告警类型,链路故障告警类型,包含关系》,该对象关系数据为《端口p1的对象信息,第一链路端点的对象信息,包含关系》。
[0122]
可选的,ems通过如下(1)至(4)操作,来确定第一对象和第二对象之间是否存在至少一个指定关系。该(1)至(4)的操作,可以为:
[0123]
(1):ems从第一异常事件的事件信息中获取第一异常事件的类型信息,第一对象的对象标识和所在的网元标识,从第二异常事件的事件信息获取第二异常事件的类型信息,第二对象的对象标识和所在的网元标识。
[0124]
例如,仍以上述第二集合中包括的端口告警事件和链路故障告警事件为例,参见表1,端口告警事件的事件信息中包括端口告警类型,端口p1的端口标识port1(端口p1为对象,端口标识port1为对象标识),以及端口p1所在的网元标识ne1;链路故障告警事件的事件信息包括链路故障告警类型、第一链路端点的端点标识link1-1(第一链路端点为对象,端点标识link1-1为对象标识),以及第一链路端点所在的网元标识ne1。因此,ems从端口告警事件的事件信息中获取端口告警事件的端口告警类型、端口p1的端口标识port1和端口p1所在的网元标识ne1,以及从链路故障告警事件的事件信息中获取链路故障告警事件的链路故障告警类型,第一链路端点的端点标识link1-1和第一链路端点所在的网元标识ne1。
[0125]
再例如,再以上述第二集合包括的端口告警事件和链路异常日志事件为例,参见表3,链路异常日志事件的事件信息中包括链路异常日志类型,第二链路端点的端点标识link1-2(第二链路端点为对象,端点标识link1-2为对象标识),以及第二链路端点所在的网元标识ne2。因此,ems从链路异常日志事件的事件信息中获取链路异常日志类型,第二链路端点的端点标识link1-2和第二链路端点所在的网元标识ne2。
[0126]
(2):ems根据第一对象所在的网元标识和第二对象所在的网元标识,确定第一对象和第二对象是否位于同一网元,如果确定出位于同一网元,执行如下操作(3),如果确定出位于不同网元,执行如下操作(4)。
[0127]
例如,ems根据端口p1所在的网元标识ne1和第一链路端点所在的网元标识ne1,确定端口p1和第一链路端点位于第一网元,即二者位于同一网元,执行如下操作(3)。
[0128]
再例如,ems根据端口p1所在的网元标识ne1和第二链路端点所在的网元标识ne2,确定端口p1和第二链路端点位于不同网元,执行如下操作(4)。
[0129]
(3):ems根据第一对象的对象标识和第二对象的对象标识,确定第一对象和第二对象之间存在的至少一个指定关系,该至少一个指定关系可能包括包含关系和/或同网元关系,结束。
[0130]
ems还在该至少一个指定关系中,选择优先级最大或最小的指定关系作为第一对象和第二对象之间的关系。
[0131]
例如,对于上述列举的端口告警事件和链路故障告警事件,该端口告警事件所在的对象为端口p1,链路故障告警事件所在的对象为第一链路端点。根据第一链路端点的端点标识link1-1和端口p1的端口标识port1,确定端口p1包括第一链路端点,所以确定第一链路端点和端口p1之间存在包含关系和同网元关系,而包含关系的优先级高于同网元关系,所以确定第一链路端点和端口p1之间的关系为包含关系,如此得到一条对象关系数据,该对象关系数据为《第一链路端点的对象信息,端口p1的对象信息,包含关系》,以及得到一条类型关系数据,该类型关系数据为《端口告警类型,链路故障告警类型,包含关系》。
[0132]
(4):ems根据网络拓扑图、第一对象的对象标识和所在的网元标识,第二对象的对象标识和所在的网元标识,确定第一对象和第二对象之间是否存在至少一个指定关系,该至少一个指定关系可能包括邻居关系、同业务关系和/或承载关系。
[0133]
如果第一对象和第二对象之间存在至少一个指定关系,ems从该至少一个指定关系中,选择优先级最大或最小的指定关系作为第一对象和第二对象之间的关系。如果第一对象和第二对象之间不存在指定关系,表明第一对象和第二对象之间没有关系,以及第一异常事件的类型信息和第二异常事件的类型信息之间没有关系。
[0134]
例如,对于上述列举的端口告警事件和链路异常日志事件,该端口告警事件所在的对象为端口p1,链路异常日志事件所在的对象为第二链路端点。端口p1位于第一网元,第二链路端点位于第二网元的端口p2中,第二链路端点与端口p1中的第一链路端点是同一条链路1的两个端点,所以ems根据网络拓扑图、端口p1的端口标识port1和所在第一网元的网元标识ne1,以及第二链路端点的端点标识link1-2和所在第二网元的网元标识ne2,确定端口p1和第二链路端点之间存在邻居关系。将该邻居关系确定为端口p1和第二链路端点之间的关系,如此得到一条对象关系数据,该对象关系数据为《端口p1的对象信息、第二链路端点的对象信息,邻居关系》;以及,得到一条类型关系数据,该类型关系数据为《端口告警类型、远端端口阻塞告警类型,邻居关系》。
[0135]
经过2024的操作后,不仅得到第二类型关系数据集合,还可以得到对象关系数据集合。例如,对于第二集合包括的端口告警事件、链路故障告警事件、远端端口阻塞告警事件、传输速率越限事件、端口异常日志事件和链路异常日志事件。对第二集合中的任意两个异常事件均执行上述过程后,得到如下表6所示的第二类型关系数据集合和如下表7所示的对象关系数据集合。
[0136]
表6
[0137]
第二类型关系数据集合
《端口告警类型,链路故障告警类型,包含关系》《端口告警类型,传输速率越限类型,同网元关系》《链路异常日志类型,远端端口阻塞告警类型,包含关系》《端口告警类型,远端端口阻塞告警类型,邻居关系》《链路故障告警类型,远端端口阻塞告警类型,邻居关系》《传输速率越限类型,远端端口阻塞告警类型,邻居关系》《端口异常日志类型,远端端口阻塞告警类型,邻居关系》《端口告警类型,链路异常日志类型,邻居关系》《链路故障告警类型,链路异常日志类型,同业务关系》《传输速率越限类型,链路异常日志类型,邻居关系》《端口异常日志类型,链路异常日志类型,邻居关系》
[0138]
表7
[0139]
对象关系数据集合《端口p1的对象信息,第一链路端点的对象信息,包含关系》《端口p1的对象信息,端口p2的对象信息,邻居关系》《端口p1的对象信息,第二链路端口的对象信息,邻居关系》《第一链路端点的对象信息,端口p2的对象信息,邻居关系》《第一链路端点的对象信息,第二链路端点的对象信息,同业务关系》《端口p2的对象信息,第二链路端点的对象信息,包含关系》
[0140]
2025:在第二类型关系数据集合包括目标故障处理规则中的第一类型关系数据集合时,确定第二集合中的各异常事件的事件信息是同一故障引起的异常事件的事件信息。
[0141]
其中,在第二类型关系数据集合不包括第一类型关系数据集合时,返回2021重新选择一个故障处理规则作为目标故障处理规则。
[0142]
目标故障处理规则包括类型信息集合和第一类型关系数据集合,第二集合包括的异常事件是该类型信息集合中的每个类型信息对应的异常事件。在第二类型关系数据集合包括第一类型关系数据集合时,表示第一类型关系数据集合中的每条类型关系数据可以与第二集合中的两个异常事件匹配。
[0143]
例如,表6所示的第二类型关系数据集合包括表4所示的目标故障处理规则中的第一类型关系数据集合。对于表4中的第一类型关系数据集合中的任一条类型关系数据,以类型关系数据《端口告警类型,链路故障告警类型,包含关系》为例,第二集合包括端口告警类型对应的端口告警事件和链路故障告警类型对应的链路故障告警事件,表6中所示的第二类型关系数据集合记录了该端口告警事件的端口告警类型和该链路故障告警事件的链路故障告警类型之间的关系也为包含关系,所以《端口告警类型,链路故障告警类型,包含关系》与第二集合中的端口告警事件和链路故障告警事件匹配。同理,该第一类型关系数据集合中的其他每条类型关系数据均与第二集合中的异常事件匹配,所以可以确定第二集合中的端口告警事件的事件信息、链路故障告警事件的事件信息、远端端口阻塞告警事件的事件信息、传输速率越限事件的事件信息、端口异常日志事件的事件信息和链路异常日志事件的事件信息是同一故障引起的异常事件的事件信息。
[0144]
步骤203:ems向oss发送故障信息,该故障信息包括该至少一个异常事件中的每个
异常事件的产生时间和对象信息、该对象关系数据集合、目标故障处理规则中的类型信息集合、根因告警信息和处理建议信息。
[0145]
至少一个异常事件是在步骤202中得到的第二集合中的异常事件。目标故障处理规则是在步骤202中得到的与该至少一个异常事件匹配的故障处理规则,该对象关系数据集合也是在步骤202中得出的对象关系数据集合。目标故障处理规则中的类型信息集合包括的类型信息是该至少一个异常事件中的每个异常事件的类型信息。
[0146]
在步骤203中,ems将该至少一个异常事件中的每个异常事件的产生时间、每个异常事件的对象信息、该对象关系数据集合、目标故障处理规则中的类型信息集合、根因告警信息和处理建议信息组成故障信息,向oss发送该故障信息。
[0147]
例如,在步骤202中,ems确定第二集合中的端口告警事件的事件信息、链路故障告警事件的事件信息、远端端口阻塞告警事件的事件信息、传输速率越限事件的事件信息、端口异常日志事件的事件信息和链路异常日志事件的事件信息是同一故障引起的异常事件的事件信息,以及获取到如表7所示的对象关系数据集合。这样在步骤203中,ems将端口告警事件的产生时间t1和对象信息、链路故障告警事件的产生时间t2和对象信息、远端端口阻塞告警事件的产生时间t3和对象信息、传输速率越限事件的产生时间t4和对象信息、端口异常日志事件的产生时间t5和对象信息、链路异常日志事件的产生时间t6和对象信息、如表6所示的对象关系数据集合、以及如表4所示的目标故障处理规则中的类型信息集合、根因告警信息和处理建议信息组成如下表8所示的故障信息。
[0148]
表8
[0149][0150]
其中,需要说明的是:对于该故障信息包括的类型信息集合、该至少一个异常事件中的每个异常事件的产生时间和对象信息,由于该类型信息集合包括的类型信息是该每个异常事件的类型信息,所以该类型信息集合、该每个异常事件的产生时间和对象信息共同构成该每个异常事件的事件信息。所以该故障信息实质包括该每个异常事件的事件信息、该对象关系数据集合、该根因告警信息和该处理建议信息。
[0151]
例如,参见上述表8所示的故障信息,表8中包括端口告警事件的对象信息、产生时间t1和端口告警类型,链路故障告警事件的对象信息、产生时间t2和链路故障告警类型,远端端口阻塞告警事件的对象信息、产生时间t3和远端端口阻塞告警类型,传输速率超限事件的对象信息、产生时间t4和传输速率越限类型,端口异常日志事件的对象信息、产生时间t5和端口异常日志类型,以及链路异常日志事件的对象信息、产生时间t6和链路异常日志类型。所以表8所示的故障信息实质包括端口告警事件的事件信息,链路故障告警事件的事件信息,远端端口阻塞告警事件的事件信息,传输速率超限事件的事件信息,端口异常日志事件的事件信息,链路异常日志事件的事件信息、如表7所示的对象关系数据集合、以及如表4所示的目标故障处理规则中的根因告警信息和处理建议信息。
[0152]
可选的,对于该至少一个异常事件中的任一个异常事件,在该异常事件的事件信
息中除了包括该异常事件的类型信息、产生时间和对象信息外,还可能包括其他信息,该故障信息还可以包括该其他信息。例如,以上述端口告警事件为例,端口告警事件的事件信息中除了包括端口告警事件的类型信息、产生时间和对象信息外,还包括事件标识event1和告警级别l1,所以表8所示的故障信息还可以包括该事件标识event1和告警级别l1。
[0153]
可选的,该故障信息还包括第二类型关系数据集合。
[0154]
可选的,ems还可以获取故障发生位置信息、故障开始时间和故障结束时间等中的一个或多个。该故障信息还可能包括故障发生位置信息、故障开始时间和故障结束时间等中的一个或多个。
[0155]
故障发生位置信息包括产生根因告警事件的网元的位置。可选的,故障发生位置信息可以为该网元的地理位置。例如,可以为该网元的经纬度坐标或该网元所在地的名称等。
[0156]
故障开始时间可以为根因告警事件的产生时间。另外,在网元中的故障消失后,网元会通知ems故障消失,所以该故障结束时间是ems接收故障消失的通知的时间。
[0157]
在ems匹配出目标故障处理规则后,ems还可以根据目标故障处理规则包括的处理建议信息,对网元产生故障进行处理。例如,假设目标故障处理规则为如表4所示的故障处理规则,根据目标故障处理规则的处理建议信息“重启根因告警事件所在端口”,重启第一网元中的端口p1。
[0158]
其中,ems可能确定多个故障引起的异常事件的事件信息,根据每个故障引起的异常事件的事件信息生成每个故障对应的故障信息,向oss发送每个故障对应的故障信息。
[0159]
其中,与oss通信的ems可能为多个,即可能有一个或多个ems向oss发送生成的故障信息。
[0160]
步骤204:oss接收多个故障信息,在该多个故障信息中,将包括相同类型信息集合、根因告警信息和处理建议信息的故障信息聚合成故障信息集合。
[0161]
其中,该多个故障信息中的每个故障信息包括的类型信息集合、根因告警信息和处理建议信息可能均相同,所以oss可能将该多个故障信息聚合成一个故障信息集合。或者,该多个故障信息中的每个故障信息包括的类型信息集合、根因告警信息和处理建议信息可能不均相同,所以oss可能将该多个故障信息聚合成多个故障信息集合。
[0162]
其中,oss得到的每个故障信息集合与故障相对应。
[0163]
例如,oss接收的多个故障信息中包括如表8所示的故障信息,对于表8所示的故障信息包括的类型信息集合、根因告警信息和处理建议信息,oss从接收的该多个故障信息中,将包括该类型信息集合、该根因告警信息和该处理建议信息的各故障信息聚合成故障信息集合。所以该故障信息集合中的每条故障信息中的类型信息集合均包括端口告警类型、链路故障告警类型、远端端口阻塞告警类型、传输速率越限类型、端口异常日志类型和链路异常日志类型。该故障信息集合中的每条故障信息包括的根因告警信息均是端口告警类型,该故障信息集合中的每条故障信息包括的处理建议信息均是重启根因告警事件所在端口。
[0164]
其中,需要说明的是:oss在接收到故障信息后,基于故障信息包括对象关系数据集合绘制对象拓扑图,显示该对象拓扑图,该故障信息包括的根因告警信息、处理建议信息、每个异常事件的产生时间、对象信息和类型信息等内容,以供运维人员查看。
[0165]
可选的,oss根据该对象拓扑图,该故障信息包括的根因告警信息、处理建议信息、每个异常事件的类型信息、产生时间和/或对象信息等内容,确定ems做根因定位的过程,和/或,确定需要维修的对象和该对象所在的网元,以提示运维人员对该对象进行维修。
[0166]
步骤205:对于该故障信息集合中的每条故障信息,oss基于该故障信息包括的对象关系数据集合和各异常事件的对象信息,获取该故障信息对应的第二类型关系数据集合。
[0167]
该故障信息集合是在步骤202中聚合得到的一个或多个故障信息集合中的任意一个故障信息集合。
[0168]
在步骤205中,对于该故障信息包括的任意两个异常事件,为了便于说明,将该两个异常事件称为第一异常事件和第二异常事件。如果对象关系数据集合存在包括第一异常事件的对象信息和第二异常事件的对象信息的对象关系数据,将该对象关系数据包括的关系作为第一异常事件的类型信息和第二异常事件的类型信息之间的关系,从而得到一条类型关系数据,该类型关系数据为包括第一异常事件的类型信息、第二异常事件的类型信息和该关系。如果对象关系数据集合不存在包括第一异常事件的对象信息和第二异常事件的对象信息的对象关系数据,得出第一异常事件的类型信息和第二异常事件的类型信息之间没有关系。对该故障信息中的其他任意两个异常事件重复上述过程,从而得到多条不同的类型关系数据,该多条类型关系数据构成该故障信息对应的第二类型关系数据集合。
[0169]
例如,以表8所示的故障信息为例,对于表8包括的任意两个故障事件,假设该两个故障事件为端口告警事件和链路故障告警事件,端口告警事件所在的对象为端口p1,链路故障告警事件所在的对象为第一链路端点。表8包括的对象关系数据集合中存在一条对象关系数据《端口p1的对象信息,第一链路端点的对象信息,包含关系》,也就是说表8包括的对象关系数据集合中存在包括端口告警事件的对象信息和链路故障告警事件的对象信息的对象关系数据。因此,得到一条类型关系数据,该类型关系数据包括端口告警事件的类型信息、链路故障告警事件的类型信息和包含关系,该类型关系数据可以表示为《端口告警类型、链路故障告警类型,包含关系》。对表8中的其他任意两个异常事件重复上述过程,最后得到如表6所示的第二类型关系数据集合。
[0170]
其中,步骤205是一个可选的步骤,对于故障信息集合中的任意一条故障信息,在该故障信息中包括第二类型关系数据集合的情况下,就可以不需要执行步骤205的操作。
[0171]
步骤206:oss基于该故障信息包括的各异常事件的产生时间,获取该故障信息对应的时间跨度,该时间跨度为该各异常事件的产生时间的时间跨度。
[0172]
在步骤206中,oss从该故障信息中读取最晚产生的异常事件的产生时间和最早产生的异常事件的产生时间,基于读取的两个产生时间确定该故障信息对应的时间跨度。
[0173]
例如,对于表8所示的故障信息,oss从该故障信息中读取最晚产生的链路异常日志事件的产生时间t6和最早产生的端口告警事件的产生时间t1,基于产生时间t6和t1确定该故障信息对应的时间跨度为t6-t1。
[0174]
可选的,上述步骤205和步骤206之间没有先后执行顺序,也就是说,oss可以先执行步骤205,再执行步骤206;或者,oss同时执行步骤205和步骤206;或者,oss先执行步骤206,再执行步骤205。
[0175]
步骤207:oss对该故障信息集合中的故障信息对应的第二类型关系数据集合取交
集得到第三类型关系数据集合,以及从该故障信息集合中的故障信息对应的时间跨度中选择最大时间跨度。
[0176]
在步骤207中,oss可以通过如下2071至2073的操作来实现,该2071至2073的操作分别为:
[0177]
2071:oss将该故障信息集合划分为多个子集合,每个子集合包括的故障信息对应的第二类型关系数据集合和时间跨度均相同。
[0178]
在2071中oss可以按第二类型关系数据集合和时间跨度,对该故障信息集合中的故障信息进行归类,将对应相同的第二类型关系数据集合和时间跨度归类为一类并组成一个子集合。
[0179]
2072:oss从该划分的子集合中选择满足第一指定条件的多个子集合,第一指定条件是该多个子集合包括的故障信息总数目与该故障信息集合包括的故障信息总数目之间的比例超过指定比例。
[0180]
在2072中选择子集合的过程可以为:oss从该划分的子集合中选择包括故障信息数目最多的m个子集合,m为大于或等于2的整数。计算该m个子集合包括的故障信息总数目与该故障信息集合包括的故障信息总数目之间的比例,在该比例超过指定比例,执行如下2073的操作。
[0181]
在该比例未超过指定比例,oss从剩余未选择的子集合中选择包括的故障信息数目最多的n个子集合,n为大于或等于1的整数,此时总共选择m n个子集合。计算该m n个子集合包括的故障信息总数目与该故障信息集合包括的故障信息总数目之间的比例,在该比例超过指定比例,执行如下2073的操作。在该比例未超过指定比例,从剩余未选择的子集合中选择包括的故障信息数目最多的n个子集合,此时总共选择m 2n个子集合,再执行上述计算比例和选择子集合的操作,直至选择的子集合包括的故障信息总数目与故障信息集合包括的故障信息总数目之间的比例超过指定比例为止。
[0182]
该指定比例可以为0.9、0.8或0.7等。
[0183]
2073:oss对选择的子集合中的每个故障信息对应的第二类型关系数据集合取交集得到第三类型关系数据集合,以及从选择的子集合中的每个故障信息对应的时间跨度中选择最大时间跨度。
[0184]
其中,该最大时间跨度是该故障信息集合对应的故障引起的异常事件的持续时长。
[0185]
步骤208:oss向至少一个ems发送故障处理规则,该故障处理规则包括第三类型关系数据集合、该最大时间跨度、第一故障信息包括的类型信息集合、根因告警信息和处理建议信息,第一故障信息是该故障信息集合中的任意一条故障信息。
[0186]
在步骤208中,oss将第三类型关系数据集合、该最大时间跨度、第一故障信息包括的类型信息集合、根因告警信息和处理建议信息组成故障处理规则,向与该oss通信的至少一个ems发送该故障处理规则。
[0187]
第三类型关系数据集合中的每条类型关系数据包括两个类型信息,oss判断第三类型关系数据集合包括的类型信息是否包括第一故障信息中的类型信息集合中的全部类型信息。如果包括该类型信息集合中的全部类型信息,则将第三类型关系数据集合、该最大时间长度、第一故障信息包括的类型信息集合、根因告警信息和处理建议信息组成故障处
理规则。如果没有包括该类型信息集合中的全部类型信息,则丢弃第三类型关系数据集合、该最大时间跨度和该故障信息集合。
[0188]
在步骤204中可能聚合得到多个故障信息集合,oss对每个故障信息集合执行上述步骤205至208的操作,可能得到一个或多个故障处理规则,然后向与该oss通信的至少一个ems发送该一个或多个故障处理规则。
[0189]
oss向与该oss通信的ems发送故障处理规则后,ems接收该故障处理规则,并保存该故障处理规则。之后,还可以使用该故障处理规则匹配由同一故障引起的异常事件的事件信息,和/或,处理网元出现的故障,即ems继续从上述步骤201开始执行。
[0190]
可选的,ems保存该故障处理规则的操作,可以为:对于该故障处理规则中的类型信息集合、根因告警信息和处理建议信息,在ems本地保存有包括该类型信息集合、该根因告警信息和该处理建议信息的故障处理规则时,将ems本地保存的包括该类型信息集合、该根因告警信息和该处理建议信息的故障处理规则更新为该故障处理规则。在ems本地没有保存包括该类型信息集合、该根因告警信息和该处理建议信息的故障处理规则时,直接保存该故障处理规则。
[0191]
在本技术实施例中,ems接收多个异常事件的事件信息,使用ems中包括的故障处理规则识别由同一故障引起的每个异常事件的事件信息,基于该每个异常事件的事件信息,得到故障信息,该故障信息包括由该每个异常事件的类型信息、每个异常事件的产生时间、每个异常事件的对象信息、对象关系数据集合、该故障处理规则中的根因告警信息和处理建议信息。由于该故障信息包括每个异常事件的类型信息、对象信息和对象关系数据集合,从而oss可以根据每个异常事件的类型信息、对象信息和对象关系数据集合可以得出不同异常事件的类型信息之间的关系,进而可以生成故障处理规则,将该故障处理规则发送给不同的ems。由于不同ems均可接收用于处理故障的故障处理规则,从而不同的ems可以对该故障进行处理。由于oss接收不同ems发送的多个故障信息,可以基于大量故障信息自动生成故障处理规则,使得故障处理规则具有可学习性和更新性,提高了生成故障处理规则的精度,以及提高了生成故障处理规则的效率。oss将生成的故障处理规则发送给不同的ems,这样可以提高在ems配置故障处理规则的效率和实时性,也保证不同的ems可以基于该故障处理规则,处理与该故障处理规则相对应的故障。
[0192]
参见图3,本技术实施例提供了一种处理故障的方法,该方法可以应用图1所示的网络架构,在该方法中,ems生成故障信息,该故障信息包括类型信息集合、第二类型关系数据集合、根因告警信息、处理建议信息和时间跨度,oss接收ems发送的故障信息,并根据接收的故障信息生成故障处理规则。该方法包括:
[0193]
步骤301-302:分别与步骤201-202相同,在此不再详细说明。
[0194]
经过步骤302,ems可以得出由同一故障引起的至少一个异常事件的事件信息、第二类型关系数据信集合以及与该至少一个异常事件匹配的目标故障处理规则。
[0195]
例如,仍以ems接收到上述表1、表2和表3所示的端口告警事件、链路故障告警事件、远端端口阻塞告警事件、传输速率越限事件、端口异常日志事件和链路异常日志事件为例,ems对该六个异常事件经过上述步骤301至步骤302的处理后,得出该六个异常事件是由同一故障引起的异常事件,以及得出如表4所示的与该六个异常事件匹配的目标故障处理规则和如表6所示的第二类型关系数据集合。
[0196]
步骤303:ems向oss发送故障信息,该故障信息包括时间跨度、第二类型关系数据集合、目标故障处理规则中的类型信息集合、根因告警信息和处理建议信息,该时间跨度是该至少一个异常事件中的每个异常事件的产生时间的时间跨度。
[0197]
在步骤303中,ems基于该至少一个异常事件中的每个异常事件的产生时间获取时间跨度,将该时间跨度、第二类型关系数据集合、目标故障处理规则中的类型信息集合、根因告警信息和处理建议信息组成故障信息,向oss发送该故障信息。
[0198]
例如,ems基于端口告警事件的产生时间t1、链路故障告警事件的产生时间t2、远端端口阻塞告警事件的产生时间t3、传输速率越限事件的产生时间t4、端口异常日志事件的产生时间t5和链路异常日志事件的产生时间t6,获取时间跨度为t6-t1。将该时间跨度t6-t1、如表6所示的第二类型关系数据集合、如表4所示的目标故障处理规则中的类型信息集合、根因告警信息和处理建议信息组成如下表9所示的故障信息。
[0199]
表9
[0200][0201]
其中,由于故障信息中包括的事件类型集合的数据量小于该至少一个异常事件的事件信息的数据量,所以本步骤中的故障信息的数据量较小,可以减小故障信息的数据量,从而可以减小对网络资源的占用。
[0202]
其中,ems可能确定多个故障引起的异常事件的事件信息,根据每个故障引起的异常事件的事件信息生成每个故障对应的故障信息,向oss发送每个故障对应的故障信息。
[0203]
其中,与oss通信的ems可能为多个,即可能有一个或多个ems向oss发送生成的故障信息。
[0204]
步骤304:oss接收多个故障信息,在该多个故障信息中,将包括相同类型信息集合、根因告警信息和处理建议信息的故障信息聚合成第一故障信息集合。
[0205]
oss聚合得到第一故障信息集合的详细实现过程,可以参见图2所示实施例中的步骤204中的相关内容,在此不再详细说明。
[0206]
其中,需要说明的是:oss接收的多个故障信息中可能存在部分故障信息完全相同。
[0207]
步骤305:oss对第一故障信息集合中的故障信息包括的第二类型关系数据集合取交集得到第三类型关系数据集合,以及从该故障信息集合中的故障信息包括的时间跨度中选择最大时间跨度。
[0208]
在步骤305中,oss可以通过如下3051至3053的操作来实现,该3051至3053的操作分别为:
[0209]
3051:对于第一故障信息集合中的任意相同的多条故障信息,oss统计该多条故障信息的信息条数,在第一故障信息集合中进行去重处理得到第二故障信息集合,使得在第二故障信息集合中保留的每条故障信息不同。
[0210]
其中,去重后得到的第二故障信息集合中的每条故障信息对应一个信息条数。
[0211]
3052:oss从去重后的故障信息集合中选择满足第二指定条件的多个故障信息,第二指定条件是该多个故障信息对应的信息条数累加值与第二故障信息集合包括的每条故障信息对应的信息条数的总累加值之间的比例超过指定比例。
[0212]
在3052中选择多个故障信息的过程可以为:oss从第二故障信息集合中选择对应信息条数最多的m个故障信息,m为大于或等于2的整数。计算该m个故障信息对应的信息条数的累加值与第二故障信息集合包括的每条故障信息对应的信息条数的总累加值之间的比例,在该比例超过指定比例,执行如下3053的操作。
[0213]
在该比例未超过指定比例,oss从第二故障信息集合中剩余未选择的故障信息中选择对应信息条数最多的n个故障信息,n为大于或等于1的整数,此时总共选择m n个故障信息。计算该m n个故障信息对应的信息条数的累加值与该总累加值之间的比例,在该比例超过指定比例,执行如下2053的操作。在该比例未超过指定比例,从第二故障信息集合中剩余未选择的故障信息中选择对应信息条数最多的n个故障信息,此时总共选择m 2n个故障信息,再执行上述计算比例和选择故障信息的操作,直至选择的多个故障信息满足第二指定条件时为止。
[0214]
3053:oss对选择的每个故障信息包括的第二类型关系数据集合取交集得到第三类型关系数据集合,以及从选择的每个故障信息包括的时间跨度中选择最大时间跨度。
[0215]
其中,该最大时间跨度是该故障信息集合对应的故障引起的异常事件的持续时长。
[0216]
步骤306:oss向至少一个ems发送故障处理规则,该故障处理规则包括第三类型关系数据集合、该最大时间跨度、第一故障信息包括的类型信息集合、根因告警信息和处理建
议信息,第一故障信息是第二故障信息集合中的任意一条故障信息。
[0217]
在步骤306中,oss将第三类型关系数据集合、该最大时间跨度、第一故障信息包括的类型信息集合、根因告警信息和处理建议信息组成故障处理规则,向与该oss通信的至少一个ems发送该故障处理规则。
[0218]
第三类型关系数据集合中的每条类型关系数据包括两个类型信息,oss判断第三类型关系数据集合包括的类型信息是否包括第一故障信息中的类型信息集合中的全部类型信息。如果包括该类型信息集合中的全部类型信息,则将第三类型关系数据集合、该最大时间长度、第一故障信息包括的类型信息集合、根因告警信息和处理建议信息组成故障处理规则。如果没有包括该类型信息集合中的全部类型信息,则丢弃第三类型关系数据集合、该最大时间跨度和该故障信息集合。
[0219]
在步骤304中可能聚合得到多个故障信息集合,oss对每个故障信息集合执行上述步骤305的操作,可能得到一个或多个故障处理规则,然后向与该oss通信的至少一个ems发送该一个或多个故障处理规则。
[0220]
oss向与该oss通信的ems发送故障处理规则后,ems接收该故障处理规则,并保存该故障处理规则。之后,还可以使用该故障处理规则匹配由同一故障引起的异常事件的事件信息,和/或,处理网元出现的故障,即ems继续从上述步骤301开始执行。
[0221]
可选的,ems保存该故障处理规则的操作,可以为:对于该故障处理规则中的类型信息集合、根因告警信息和处理建议信息,在ems本地保存有包括该类型信息集合、该根因告警信息和该处理建议信息的故障处理规则时,将ems本地保存的包括该类型信息集合、该根因告警信息和该处理建议信息的故障处理规则更新为该故障处理规则。在ems本地没有保存包括该类型信息集合、该根因告警信息和该处理建议信息的故障处理规则时,直接保存该故障处理规则。
[0222]
在本技术实施例中,ems接收多个异常事件的事件信息,使用ems中包括的故障处理规则识别由同一故障引起的异常事件的事件信息,根据该故障引起的异常事件的事件信息,生成故障信息,该故障信息包括类型信息集合、第二类型关系数据集合、根因告警信息和处理建议信息。由于该故障信息包括第二类型关系数据集合,oss可以根据故障信息中的第二类型关系数据集合生成故障处理规则,将该故障处理规则发送给不同的ems。由于不同ems均可接收用于处理故障的故障处理规则,从而不同的ems可以对该故障进行处理。由于oss接收不同ems发送的多个故障信息,可以基于大量故障信息自动生成故障处理规则,使得故障处理规则具有可学习性和更新性,提高了生成故障处理规则的精度,以及提高了生成故障处理规则的效率。oss将生成的故障处理规则发送给不同的ems,这样可以提高在ems中配置故障处理规则的效率和实时性,也保证不同的ems可以基于该故障处理规则,处理与该故障处理规则相对应的故障。
[0223]
参见图4,本技术实施例提供了一种处理故障的装置400,所述装置400可以部署在上述图1、图2或图3所示实施例提供的oss中,包括:
[0224]
接收单元401,用于接收至少一个网元管理系统ems发送的故障信息,该故障信息包括类型信息集合、第一关系集合、故障的根因告警信息、针对该故障的处理建议信息和由该故障引起的多个异常事件的时间信息,该类型信息集合包括该多个异常事件的类型信息,第一关系集合包括该多个异常事件之间的关系;
[0225]
处理单元402,用于将包括相同类型信息集合、根因告警信息和处理建议信息的故障信息聚合成故障信息集合,将该故障信息集合中的每条故障信息中的第一关系集合取交集得到第二关系集合,以及根据该每条故障信息中的时间信息确定时间长度,该时间长度是产生该故障引起的异常事件的持续时长;
[0226]
发送单元403,用于向至少一个ems发送故障处理规则,该故障处理规则包括第二关系集合、该时间长度、第一故障信息中的类型信息集合、根因告警信息和处理建议信息,第一故障信息是该故障信息集合中的任意一条故障信息,该故障处理规则用于指示该至少一个ems处理该故障。
[0227]
可选的,处理单元402取交集以及确定时间长度的详细实现过程,可以参见图2所示实施例中的步骤204至步骤207以及图3所示实施例的步骤304和步骤305中的相关内容,在此不再详细说明。
[0228]
可选的,该多个异常事件之间的关系使用至少一条类型关系数据表示,每条类型关系数据包括该多个异常事件中的两个异常事件的类型信息和该两个异常事件的类型信息之间的关系,该两个异常事件所在对象之间存在该关系。
[0229]
可选的,该故障信息还包括该多个异常事件中的每个异常事件所在对象的对象信息;该多个异常事件之间的关系使用至少一条对象关系数据表示,每条对象关系数据包括存在关系的两个对象的对象信息和该关系,每个异常事件所在的对象包括该两个对象;
[0230]
处理单元402,还用于:
[0231]
根据该至少一条对象关系数据、每个异常事件的对象信息和类型信息,获取该故障信息对应的类型关系数据集合,该类型关系数据集合包括至少一条类型关系数据,每条类型关系数据包括该多个异常事件中的两个异常事件的类型信息和该两个异常事件的类型信息之间的关系,该两个异常事件所在对象之间存在该关系;
[0232]
将该故障信息集合中的每条故障信息对应的类型关系数据集合取交集得到第二关系集合。
[0233]
可选的,处理单元402获取该故障信息对应的类型关系数据集合的详细实现过程,可以参见图2所示实施例中的步骤205中的相关内容,在此不再详细说明。
[0234]
可选的,该多个异常事件的时间信息是该多个异常事件的产生时间的时间跨度;
[0235]
处理单元402,用于从该每条故障信息中的时间跨度中选择最大时间跨度作为该时间长度。
[0236]
可选的,该多个异常事件的时间信息是该多个异常事件中的每个异常事件的产生时间;
[0237]
处理单元402,用于根据每条故障信息包括的时间信息,分别获取每条故障信息对应的异常事件的产生时间的时间跨度;从获取的时间跨度中选择最大时间跨度作为该时间长度。
[0238]
可选的,该多个异常事件的类型包括告警类型、性能越限类型和/或网元异常日志类型。
[0239]
可选的,处理单元402,还用于:
[0240]
基于该至少一条对象关系数据生成对象拓扑图,显示该对象拓扑图。
[0241]
在本技术实施例中,由于接收单元接收的故障信息包括第一关系集合和多个异常
事件的时间信息,这样处理单元可以基于故障信息中的第一关系集合和时间信息生成故障处理规则。由于接收单元可以接收不同ems发送的故障信息,处理单元基于各ems的故障信息生成故障处理规则,丰富了生成故障处理所需的数据,不仅使得故障处理规则具有可学习性和更新性,还提高生成故障处理规则的效率,发送单元向至少一个ems发送该故障处理规则,从而提高在ems中配置故障处理规则的效率和实时性。
[0242]
参见图5,本技术实施例提供了一种处理故障的装置500,所述装置500可以部署在上述图1、图2或图3所示实施例提供的ems中,包括:
[0243]
处理单元501,用于获取所述装置500所管理的至少一个网元上报的由第一故障引起的多个第一异常事件信息,以及获取第一故障的根因告警信息和处理建议信息,第一异常事件信息包括第一异常事件的类型信息、产生时间和所在对象的对象信息;
[0244]
处理单元501,还用于基于每个第一异常事件的对象信息获取第一关系集合,第一关系集合包括该多个第一异常事件之间的关系;
[0245]
发送单元502,用于向运营支撑系统oss发送第一故障信息,第一故障信息包括类型信息集合、第一时间信息、第一关系集合、该根因告警信息和该处理建议信息,该类型信息集合包括每个第一异常事件的类型信息,第一时间信息包括该多个第一异常事件的产生时间或该多个第一异常事件的产生时间的时间跨度,第一故障信息用于oss生成第一故障处理规则,第一故障处理规则用于指示接收第一故障处理规则的至少一个网元管理系统ems处理第一故障;
[0246]
其中,第一故障处理规则包括第二关系集合、第一时间长度、故障信息集合中的任一条第一故障信息中的类型信息集合、根因告警信息和处理建议信息,第一故障信息集合包括oss接收的多条第一故障信息且该多条第一故障信息中的每条第一故障信息包括相同的类型信息集合、根因告警信息和处理建议信息,第二关系集合是oss接收的该多条第一故障信息中的第一关系集合的交集,第一时间长度是oss基于该多条第一故障信息中的第一时间信息得到的,第一时间长度是产生第一故障引起的第一异常事件的持续时长。
[0247]
可选的,处理单元501获取由第一故障引起的多个第一异常事件信息的详细实现过程,可以参见图2所示实施例中的步骤202的相关内容,在此不再详细说明。
[0248]
可选的,处理单元501获取第一关系集合的详细实现过程,可以参见图2所示实施例中的步骤2024的相关内容,在此不再详细说明。
[0249]
可选的,该多个第一异常事件之间的关系使用至少一条类型关系数据表示,每条类型关系数据包括该多个第一异常事件中的两个第一异常事件的类型信息和该两个第一异常事件的类型信息之间的关系,该两个第一异常事件所在对象之间存在该关系,所述装置500包括网络拓扑图;
[0250]
处理单元501,用于基于该网络拓扑图和/或每个第一异常事件的对象信息和类型信息,获取第一关系集合。
[0251]
可选的,处理单元501获取至少一条类型关系数据的详细实现过程,可以参见图2所示实施例中的步骤2024的相关内容,在此不再详细说明。
[0252]
可选的,该多个第一异常事件之间的关系使用至少一条对象关系数据表示,每条对象关系数据包括存在关系的两个对象的对象信息和该关系,该多个第一异常事件中的每个第一异常事件所在的对象包括该两个对象,所述装置500包括网络拓扑图;
[0253]
处理单元501,用于基于网络拓扑图和/或每个第一异常事件的对象信息,获取第一关系集合。
[0254]
可选的,处理单元501获取至少一条对象关系数据的详细实现过程,可以参见图2所示实施例中的步骤2024的相关内容,在此不再详细说明。
[0255]
可选的,第一故障信息还包括每个第一异常事件的对象信息。
[0256]
可选的,该多个第一异常事件的类型包括告警类型、性能越限类型和/或网元异常日志类型。
[0257]
可选的,所述装置500还包括:接收单元503,
[0258]
接收单元503,用于接收第一故障处理规则;
[0259]
处理单元501,还用于基于第一故障处理规则获取至少一个网元上报的由第二故障引起的多个第二异常事件信息,第一故障和第二故障是同类型故障,第二异常事件信息包括第二异常事件的类型信息、产生时间和所在对象的对象信息;基于每个第二异常事件的对象信息获取第三关系集合,第三关系集合包括该多个第二异常事件之间的关系;
[0260]
发送单元502,还用于向oss发送第二故障信息,第二故障信息包括第二时间信息、第三关系集合、该类型信息集合、该根因告警信息和该处理建议信息,第二时间信息包括该多个第二异常事件的产生时间或该多个第二异常事件的产生时间的时间跨度,第二故障信息用于触发oss生成第二故障处理规则,第二故障处理规则包括第四关系集合、第二时间长度、该类型信息集合、该根因告警信息和该处理建议信息,第四关系集合是oss接收的多条第二故障信息中的第三关系集合的交集,该多条第二故障信息均包括该类型信息集合、该根因告警信息和该处理建议信息,第二时间长度是oss基于该多条第二故障信息中的第二时间信息得到的,第二时间长度是产生第二故障引起的第二异常事件的持续时长;
[0261]
接收单元503,还用于接收第二故障处理规则;
[0262]
处理单元501,还用于将第一故障处理规则更新为第二故障处理规则。
[0263]
在本技术实施例中,由于处理单元基于每个第一异常事件的对象信息获取第一关系集合,第一关系集合包括该多个第一异常事件之间的关系,这样发送单元向oss发送的故障信息包括第一关系集合和多个异常事件的时间信息。如此oss可以将第一故障信息集合中的各第一故障信息包括的第一关系集合取交集得到第二关系集合,以及基于第一故障信息集合中的各第一故障信息包括的时间信息确定第一时间长度,从而可以得到一条包括第二关系集合和第一时间长度等内容的故障处理规则。由于oss可以接收不同ems发送的第一故障信息,并基于各ems的第一故障信息生成故障处理规则,丰富了生成故障处理所需的数据,不仅使得生成的故障处理规则具有可学习性和更新性,还提高生成故障处理规则的效率,oss向ems发送该故障处理规则,从而提高在ems中配置故障处理规则的效率和实时性。
[0264]
参见图6,本技术实施例提供了一种处理故障的装置600示意图。该装置600可以是上述任一实施例中的oss。该装置600包括至少一个处理器601,内部连接602,存储器603以及至少一个收发器604。
[0265]
该装置600是一种硬件结构的装置,可以用于实现图7所述的装置700中的功能模块。例如,本领域技术人员可以想到图4所示的装置400中的处理单元402可以通过该至少一个处理器601调用存储器603中的代码来实现,图4所示的装置400中的接收单元401和发送单元403可以通过该收发器604来实现。
[0266]
可选的,该装置600还可用于实现上述任一实施例中oss的功能。
[0267]
可选的,上述处理器601可以是一个通用中央处理器(central processing unit,cpu),网络处理器(network processor,np),微处理器,特定应用集成电路(application-specific integrated circuit,asic),或一个或多个用于控制本技术方案程序执行的集成电路。
[0268]
上述内部连接602可包括一通路,在上述组件之间传送信息。可选的,内部连接602为单板或总线等。
[0269]
上述收发器604,用于与其他设备或通信网络通信。
[0270]
上述存储器603可以是只读存储器(read-only memory,rom)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,ram)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory,eeprom)、只读光盘(compact disc read-only memory,cd-rom)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过总线与处理器相连接。存储器也可以和处理器集成在一起。
[0271]
其中,存储器603用于存储执行本技术方案的应用程序代码,并由处理器601来控制执行。处理器601用于执行存储器603中存储的应用程序代码,以及配合至少一个收发器604,从而使得该装置600实现本专利方法中的功能。
[0272]
在具体实现中,作为一种实施例,处理器601可以包括一个或多个cpu,例如图6中的cpu0和cpu1。
[0273]
在具体实现中,作为一种实施例,该装置600可以包括多个处理器,例如图6中的处理器601和处理器607。这些处理器中的每一个可以是一个单核(single-cpu)处理器,也可以是一个多核(multi-cpu)处理器。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。
[0274]
参见图7,本技术实施例提供了一种处理故障的装置700示意图。该装置700可以是上述任一实施例中的ems。该装置700包括至少一个处理器701,内部连接702,存储器703以及至少一个收发器704。
[0275]
该装置700是一种硬件结构的装置,可以用于实现图7所述的装置700中的功能模块。例如,本领域技术人员可以想到图5所示的装置500中的处理单元501可以通过该至少一个处理器701调用存储器703中的代码来实现,图5所示的装置900中的发送单元502和接收单元503可以通过该收发器704来实现。
[0276]
可选的,该装置700还可用于实现上述任一实施例中ems的功能。
[0277]
可选的,上述处理器701可以是一个通用中央处理器(central processing unit,cpu),网络处理器(network processor,np),微处理器,特定应用集成电路(application-specific integrated circuit,asic),或一个或多个用于控制本技术方案程序执行的集成电路。
[0278]
上述内部连接702可包括一通路,在上述组件之间传送信息。可选的,内部连接702
为单板或总线等。
[0279]
上述收发器704,用于与其他设备或通信网络通信。
[0280]
上述存储器703可以是只读存储器(read-only memory,rom)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,ram)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory,eeprom)、只读光盘(compact disc read-only memory,cd-rom)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过总线与处理器相连接。存储器也可以和处理器集成在一起。
[0281]
其中,存储器703用于存储执行本技术方案的应用程序代码,并由处理器701来控制执行。处理器701用于执行存储器703中存储的应用程序代码,以及配合至少一个收发器704,从而使得该装置700实现本专利方法中的功能。
[0282]
在具体实现中,作为一种实施例,处理器701可以包括一个或多个cpu,例如图7中的cpu0和cpu1。
[0283]
在具体实现中,作为一种实施例,该装置700可以包括多个处理器,例如图7中的处理器701和处理器707。这些处理器中的每一个可以是一个单核(single-cpu)处理器,也可以是一个多核(multi-cpu)处理器。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。
[0284]
参见图8,本技术实施例提供了一种故障处理的系统800,所述系统800包括如图4所述的装置400和如图5所述的装置500,或者,所述系统800包括如图6所述的装置600和如图7所述的装置700。
[0285]
其中,如图4所述的装置400或如图6所述的装置600可以为oss801,如图5所述的装置500或如图7所述的装置700可以为ems802。
[0286]
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
[0287]
以上所述仅为本技术的可选实施例,并不用以限制本技术,凡在本技术的原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献