一种故障预测方法及装置、电子设备、存储介质与流程

2022-11-14 16:08:51 来源：中国专利 TAG：

1.本技术涉及数据处理技术领域，尤其涉及一种故障预测方法及装置、电子设备、存储介质。

背景技术：

2.云计算、区块链和第六代移动通信等新技术的发展带动了海量的服务器新需求，服务器也朝着集约化一体化管理演进。同时，虚拟化的服务器资源带来了更高效的资源利用率，但过于复杂的内部结构让开发人员很难迅速调试和测试，也为故障检测带来了很大困难。因此，如何通过快速且准确的定位故障，判断故障发生的时间和类型是未来十分意义的研究方向。

技术实现要素：

3.为解决上述技术问题，本技术的实施例提供了一种故障预测方法及装置、电子设备、计算机可读存储介质、计算机程序产品。
4.根据本技术实施例的一个方面，提供了一种故障预测方法，包括：获取设备运行过程中产生的日志文件；其中，所述日志文件包括日志数据的时间戳信息和类别信息；根据所述日志数据的时间戳信息和类别信息，对所述日志数据进行特征分析，得到用于表征所述日志数据的重要性参数；根据所述重要性参数对所述日志数据进行语义编码处理得到目标语义编码结果；根据所述目标语义编码结果确定所述设备发生故障的预测信息。
5.根据本技术实施例的一个方面，一种故障预测装置，包括：获取模块，用于获取设备运行过程中产生的日志文件；其中，所述日志文件包括日志数据的时间戳信息和类别信息；分析模块，用于根据所述日志数据的时间戳信息和类别信息，对所述日志数据进行特征分析，得到用于表征所述日志数据的重要性参数；处理模块，用于根据所述重要性参数对所述日志数据进行语义编码处理得到目标语义编码结果；确定模块，用于根据所述目标语义编码结果确定所述设备发生故障的预测信息。
6.在另一示例性实施例中，所述日志数据的数量为多条；所述根据所述日志数据的时间戳信息和类别信息，对所述日志数据进行特征分析，得到用于表征所述日志数据的重要性参数，包括：根据各条日志数据的时间戳信息和类别信息，生成向量矩阵；根据所述向量矩阵进行特征分析，得到用于表征所述日志数据的重要性参数。
7.在另一示例性实施例中，所述日志文件还包括日志数据的属性信息；所述根据各条日志数据的时间戳信息和类别信息，生成向量矩阵，包括：对各条日志数据的时间戳信息、类别信息，以及属性信息进行向量化处理，得到所述各条日志数据对应的词向量；根据所述各条日志数据对应的词向量生成所述向量矩阵。
8.在另一示例性实施例中，所述根据所述向量矩阵进行特征分析，得到用于表征所述日志数据的重要性参数，包括：对所述向量矩阵中含有的特征元素进行数据分析预处理，得到数据分析预处理后的向量矩阵；其中，所述数据分析预处理包括异常特征元素的剔除
处理、重复特征元素的剔除处理，以及不完整特征元素的填充处理中的至少一种；对所述数据分析预处理后的向量矩阵中含有的特征元素进行特征分析，得到所述向量矩阵中每个特征元素对应的重要性参数
9.在另一示例性实施例中，所述日志文件还包括日志数据的属性信息；所述根据所述重要性参数对所述日志数据进行语义编码处理得到目标语义编码结果，包括：获取向量矩阵；其中，所述向量矩阵是根据所述日志数据的时间戳信息、类别信息，以及属性信息得到的；对所述向量矩阵进行语义编码处理得到语义编码结果；根据所述重要性参数对所述语义编码结果进行调整，得到所述目标语义编码结果。
10.在另一示例性实施例中，所述日志数据的数量为多条；所述根据所述重要性参数对所述语义编码结果进行调整，得到所述目标语义编码结果，包括：将所述重要性参数作为权重，并根据所述权重对所述语义编码结果进行加权运算，得到各条日志数据对应的目标语义编码结果。
11.在另一示例性实施例中，所述根据所述目标语义编码结果确定所述设备发生故障的预测信息，包括：对所述目标语义编码结果进行解码处理，得到解码结果；将所述解码结果的值作为预测信息，其中，所述预测信息为所述设备发生故障的概率值，故障的类别与日志文件中多条日志数据对应。
12.根据本技术实施例的一个方面，一种电子设备，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述电子设备如前实现所述的故障预测方法。
13.根据本技术实施例的一个方面，一种计算机可读存储介质，其上存储有计算机可读指令，当所述计算机可读指令被计算机的处理器执行时，使计算机执行如上所述的故障预测方法。
14.根据本技术实施例的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述各种可选实施例中提供的故障预测方法。
15.在本技术的实施例所提供的技术方案中，在获取设备运行过程中产生的日志文件后，识别日志文件包括的日志数据的时间戳信息和类别信息，时间戳信息和类别信息能够增加后续对日志数据进行理解以及处理时的速度，并小幅提升特征分析的准确性。之后，根据日志数据的时间戳信息和类别信息，对日志数据进行特征分析，得到用于表征日志数据的重要性参数，重要性参数体现的是日志数据与设备故障的相关性，根据重要性参数对日志数据进行语义编码处理得到目标语义编码结果，最后根据目标语义编码结果确定设备发生故障的预测信息，完成故障预测，进行报错。这样，通过增设的与日志数据对应的重要性参数提升了故障预测的准确性，并配合日志数据的时间戳信息和类别信息能够快速且准确的定位设备的故障。
16.应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本技术。
附图说明
17.此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本技术的实施例，并与说明书一起用于解释本技术的原理。显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域普通技术者来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。在附图中：
18.图1是本技术涉及的一种实施环境的示意图；
19.图2是图1所示实施环境中的服务器在一个实施例中的模块结构示意图；
20.图3是本技术的一示例性实施例示出的一种故障预测方法的流程图；
21.图4是图3所示实施例中的步骤s302在一个示例性实施例中的流程图；
22.图5是图4所示实施例中的步骤s401在一个示例性实施例中的流程图；
23.图6是图4所示实施例在一个示例性实施例中对向量矩阵中的各个元素向量进行卷积处理的流程图；
24.图7是图3所示实施例中的步骤s303至步骤s304在图6所示的示例性实施例中的流程图；
25.图8是本技术的一示例性实施例示出的应用故障预测方法的运维系统的结构示意图；
26.图9是本技术的一示例性实施例中设置有位置编码和类型编码的向量矩阵的示意图；
27.图10是本技术的一示例性实施例示出的一种故障预测装置的框图；
28.图11是适于用来实现本技术实施例的电子设备的计算机系统的结构示意图。
具体实施方式
29.这里将详细的对示例性实施例执行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本技术相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本技术的一些方面相一致的装置和方法的例子。
30.附图中所示的方框图仅仅是功能实体，不一定必须与物理上独立的实体相对应。即，可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
31.附图中所示的流程图仅是示例性说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解，而有的操作/步骤可以合并或部分合并，因此实际执行的顺序有可能根据实际情况改变。
32.在本技术中提及的“多个”是指两个或者两个以上。“和/或”描述关联对象的关联关系，表示可以存在三种关系，例如，a和/或b可以表示：单独存在a，同时存在a和b，单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
33.相关技术中，云计算、区块链和第六代移动通信等新技术的发展带动了海量的服务器新需求，服务器也朝着集约化一体化管理演进。同时，虚拟化的服务器资源带来了更高效的资源利用率，但过于复杂的内部结构让开发人员很难迅速调试和测试，也为故障检测带来了很大困难。
34.现如今通常通过深度学习模型基于记录了程序运行时的变量和执行状态的日志数据定位异常请求，从而执行故障诊断。但是由于深度学习模型的适用数据格式的限制，需要将日志序列看成文本数据，而每条日志对应一个单词，通过对标注好的异常日志和正常日志训练模型，导致深度神经网络可解释性不足。其中，可解释性指的是在明确模型预测的对象的同时，还应该明确模型是怎样给出预测结果的，例如基于深度学习模型开发一个帮助医生判定病人风险的应用，除了最终的判定结果之外，还需要了解模型产生这样的判定是基于病人哪些因素的考虑，可解释性越大，模型的可靠性越高。
35.因此，如何通过快速且准确的定位故障，判断故障发生的时间和类型是未来十分意义的研究方向。
36.为了解决如上问题，本技术的实施例提出了一种故障预测方法及装置、电子设备、计算机可读存储介质主要涉及数据处理技术，以下将对这些实施例进行详细说明。
37.首先请参阅图1，图1是本技术涉及的一种实施环境的示意图。该实施环境包括终端10和服务器20，终端10和服务器20之间通过有线或者无线网络进行通信。
38.服务器20用于对需要进行故障预测的日志文件进行处理，通过获取设备运行过程中产生的日志文件；其中，日志文件包括日志数据的时间戳信息和类别信息；根据日志数据的时间戳信息和类别信息，对日志数据进行特征分析，得到用于表征日志数据的重要性参数；根据重要性参数对日志数据进行语义编码处理，得到目标语义编码结果；根据目标语义编码结果确定设备发生故障的预测信息，并将所得到的预测信息传输至终端10进行展示并进行相应的故障报错。相比于现有技术的故障预测的方案，本实施环境所提供的故障预测方法能够提高故障预测的准确性以及预测速度。
39.需说明的是，图1所示实施环境中的终端10可以是智能手机、平板、笔记本电脑、计算机等任意的电子设备；服务器20服务器可以是独立的服务器，也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(contentdeliverynetwork，cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器，本处不进行限制。
40.请参阅图2，图2是图1所示实施环境中的服务器20在一个实施例中的模块结构示意图。
41.服务器20包括有前处理单元21和预测单元22，其中预测单元22是采用seq2seq(sequencetosequence，序列到序列)模型架构的循环神经网络对数据进行处理。前处理单元21获取设备运行过程中产生的日志文件，日志文件包括日志数据的时间戳信息和类别信息；再根据日志数据的时间戳信息和类别信息，对日志数据进行特征分析，得到用于表征日志数据的重要性参数。前处理单元21将重要性参数传输至预测单元22中，预测单元22根据重要性参数对日志数据进行语义编码处理，得到目标语义编码结果；最后根据目标语义编码结果确定设备发生故障的预测信息。通过上述的前处理单元21和预测单元22，基于增设的与日志数据对应的重要性参数提升了故障预测的准确性，并配合日志数据的时间戳信息和类别信息能够快速且准确的定位设备的故障。
42.图3是本技术的一示例性实施例示出的故障预测方法的流程图。该方法可以应用于图1所示的实施环境，并由图1所示实施例环境中的服务器20具体执行。而在其它的实施环境中，该方法可以由其它实施环境中的设备执行，本实施例不对此进行限制。
43.如图3所示，在一示例性实施例中，该故障预测方法可以包括步骤s301至步骤s304，详细介绍如下：
44.步骤s301，获取设备运行过程中产生的日志文件；其中，日志文件包括日志数据的时间戳信息和类别信息。
45.日志数据是在程序中嵌入的输出代码所产生的文本数据，它记录了程序运行时的变量和执行状态等关键信息。能够通过设备运行过程中产生的包括日志数据的日志文件，定位异常请求，追踪程序执行逻辑，执行细粒度的故障诊断。
46.本技术提供的该实施例中，为了更快的了解日志数据，增强预测单元应用的循环神经网络模型对日志数据的理解，在获取设备运行过程中产生的日志文件后，识别出日志文件包括日志数据的时间戳信息和类别信息，从而提高对日志文件的理解度、收敛速度和读取准确性。
47.步骤s302，根据日志数据的时间戳信息和类别信息，对日志数据进行特征分析，得到用于表征日志数据的重要性参数。
48.在得到日志数据的时间戳信息和类别信息，对日志数据进行特征分析，该特征分析针对的特征包括但不限于日志数据的时间戳信息和类别信息，具体的，基于日志数据的各项特征以及预设的各类日志数据对设备故障检测的关联性，这样，通过重要性计算后，越能影响设备故障检测的日志数据的重要性参数的值越大，反之越小。
49.步骤s303，根据重要性参数对日志数据进行语义编码处理，得到目标语义编码结果。
50.预测单元采用的循环神经网络模型增设有注意力机制，将步骤s302中通过特征分析阶段得到的重要性参数作为注意力机制的参数。具体的，预测单元对获取到的日志数据进行语义编码处理，之后注意力机制通过重要性参数对语义编码处理后的日志数据进行影响，进而得到目标语义编码结果。这样，通过特征分析阶段得到的重要性参数对日志数据的语义编码结果进行影响，提高了预测单元应用的循环神经网络模型的可解释性，基于上述的注意力机制使得循环神经网络模型能够和要处理的日志数据更为匹配，因此收敛速度更快，模型对数据处理的准确度也更高。
51.步骤s304，根据目标语义编码结果确定设备发生故障的预测信息。
52.最后预测单元采用seq2seq模型架构将通过步骤s303得到的目标语义编码结果进行解码处理，得到设备发生故障的预测信息，预测信息为概率值，日志文件中的每种类别的日志数据对应一种故障类别，即得到的预测信息为日志文件对应的设备故障类型出现的概率值，并根据预测信息表征的概率值对相应需要报错的故障进行报错。
53.由上可知，在本实施例提供的方法中，在获取设备运行过程中产生的日志文件后，识别日志文件包括的日志数据的时间戳信息和类别信息，时间戳信息和类别信息能够增加循环神经网络模型对日志数据的理解以及处理时的速度，并小幅提升特征分析的准确性。之后，预测单元根据日志数据的时间戳信息和类别信息，对日志数据进行特征分析，得到用于表征日志数据的重要性参数，重要性参数体现的是日志数据与设备故障的相关性，根据重要性参数作为注意力机制的参数对日志数据进行语义编码处理的结果进行影响，进而得到目标语义编码结果，最后预测单元根据目标语义编码结果确定设备发生故障的预测信息，完成故障预测，进行报错。这样，通过增设的与日志数据对应的重要性参数提升了故障
预测的准确性，并配合日志数据的时间戳信息和类别信息能够快速且准确的定位设备的故障。
54.请参阅图4，图4是图3所示实施例中的步骤s302在一个示例性实施例中的流程图。如图4所示，步骤s302具体可以包括步骤s401至步骤s403，通过上述步骤来确得到各条日志数据对应的重要性参数，详细介绍如下：
55.步骤s401，根据各条日志数据的时间戳信息和类别信息，生成向量矩阵。
56.本技术提供的实施例中，日志文件包括的日志数据的数量为多条，且日志数据为字符信息。由于循环神经网络是无法理解字符型信息的，故本实施例中为了预测单元采用的循环神经网络能够理解日志数据，将日志数据以及日志数据的时间戳信息和类别信息向量化，得到每条日志数据对应的词向量，进而得到由多条词向量形成的向量矩阵，并通过加入的类别信息以及时间戳信息，增强了循环神经网络模型对数据即向量矩阵的理解。
57.步骤s402，对向量矩阵中含有的特征元素进行数据分析预处理，得到数据分析预处理后的向量矩阵。
58.前处理单元包括有特征工程的功能子模块，特征工程对向量矩阵中含有的特征元素进行数据分析预处理，得到数据分析预处理后的向量矩阵。
59.其中，数据分析预处理可以通过pandas工具进行实现，包括异常特征元素的剔除处理、重复特征元素的剔除处理，以及不完整特征元素的填充处理中的至少一种。pandas工具名称来自于面板数据(paneldata)和python数据分析(dataanalysis)，pandas就是为解决数据分析任务而创建，能够纳入了大量库和一些标准的数据模型，提供了高效地操作大型数据集所需的工具。
60.步骤s403，对数据分析预处理后的向量矩阵中含有的特征元素进行特征分析，得到向量矩阵中每个特征元素对应的重要性参数。
61.前处理单元的特征工程还会对数据分析预处理后的向量矩阵中含有的特征元素进行特征分析，以此得到向量矩阵中每个特征元素对应的重要性参数。本实施例中，特征分析就是基于特征元素进行特征的重要性计算，从而得到相应的重要性参数。
62.本技术提供的实施例中，可以通过随机森林算法进行特征重要性计算，随机森林算法能通过不断的学习和串行构建树枝的方式学习到每个日志数据的重要性，这样通过重要性计算后，越能影响设备故障检测的日志数据的重要性参数的值越大，反之越小。其中，随机森林是一种由决策树构成的集成算法，具有可以判断特征的重要程度、实现简单且即使数据存在特征遗失仍可以维持准确度的特点。
63.本实施例中，在得到日志数据对应的向量数据后，对其进行数据分析处理以及重要性参数的计算，得到每条日志数据对于故障检测的重要性，在预测单元中通过重要性参数对语义编码处理后的日志数据进行影响，进而得到能够确定预测信息的目标语义编码结果，通过在前处理单元得到的重要性参数，能够使得预测单元的收敛速度更快，输出的对故障进行预测的预测信息的准确度也更高。
64.请参阅图5，图5是图4所示实施例中的步骤s401在一个示例性实施例中的流程图。如图5所示，步骤s401具体可以包括步骤s501至步骤s502，详细介绍如下：
65.步骤s501，对各条日志数据的时间戳信息、类别信息，以及属性信息进行向量化处理，得到各条日志数据对应的词向量。
66.设备运行产生的日志文件还包括有日志数据的属性信息，在将多条日志数据转化为向量矩阵时，将属性信息作为矩阵中元素向量的词编码，再将获取到的每条日志数据的时间戳信息和类别信息记录在对应的词编码后，由对应的时间戳信息、类别信息以及词编码形成与日志数据匹配的词向量。这样，在向量矩阵中每条元素向量中增加单独记录时间戳信息和类别信息的位置，以此增强循环神经网络模型对数据即向量矩阵的理解。
67.步骤s502，根据各条日志数据对应的词向量生成向量矩阵。
68.由于日志文件中包括有多条日志数据，故通过上述步骤得到每条日志数据对应的词向量后，基于所有日志数据对应的词向量得到为词嵌入矩阵的向量矩阵。
69.由上可知，在本实施例提供的方法中，在将各条日志数据转换为循环神经网络可以理解的向量矩阵时，将获取到的每条日志数据的时间戳信息和类别信息记录在对应的词编码后，形成与日志数据匹配的词向量，再有多条词向量得到向量矩阵，这样，在向量矩阵中每条元素向量中增加单独记录时间戳信息和类别信息的位置，能够增强循环神经网络模型对数据即向量矩阵的理解，并提高循环神经网络对日志文件的收敛速度，进而通过基于该向量矩阵计算得到的重要性参数影响预测单元输出的预测信息，小幅度提升预测准确性。
70.在本技术的另一示例性实施例中，前处理单元会将日志数据对应的向量矩阵进行卷积处理后，与计算得到的重要性参数传输至预测单元，如图6所示，图6是图4所示实施例在一个示例性实施例中对向量矩阵中的各个元素向量进行卷积处理的流程图。
71.如图6所示，故障检测方法还可以包括步骤s601至步骤s603，通过上述步骤来得到经卷积处理后能够适用于预测单元的数据结构，详细介绍如下：
72.步骤s601，对向量矩阵进行多通道卷积处理，得到卷积结果。
73.为了更好的理解力日志文件的信息内容，本实施例提供的故障预测方法，在将各条日志数据对应的向量矩阵传输至预测单元进行预测前，会对向量矩阵进行多通道卷积处理，得到卷积结果。
74.由于本技术提供的向量矩阵每一行元素向量对应一条日志信息，故采用了一维卷积，即数据只有一个轴，卷积核的宽度等于向量矩阵的宽度，且只会在矩阵长度方向移动。并且卷积的卷积核的长度采用多长度类型，例如3，4，5三种类型，实现多通道卷积，这样能够从多个角度挖掘日志数据上下文信息，捕获大量局部特征。值得一提的是，由于本技术采用多个卷积核类型的多通道卷积的方式对向量矩阵进行卷积处理，但是超出卷积核类型长度的文本数据的特征提取会存在不足，例如，在采用3，4，5三种类型的军机和卷积核长度时，在超过5的长文本上表现能力会显著变弱，那么该日志文件中日志数据的更多时序特征的提取则在后续的seq2seq结构的循环神经网络中来体现。
75.步骤s602，对卷积结果进行池化处理，得到池化结果。
76.由于需要将经由前处理单元处理后的日志数据传输至预测单元，而预测单元采用的seq2seq结构模型拥有海量的参数，故本技术的该实施例为了降低系统以及数据处理的复杂度，将通过多通道卷积处理得到的卷积结果进行最大池化处理，将不同卷积核得到的变长日志数据转换为同样长度，以使卷积结果的长度大幅压缩至预设长度，该预设长度可以与向量矩阵中的元素向量的长度一致，便于后续预测单元对数据进行处理。
77.步骤s603，将池化结果和重要性参数均转换为句子结构。
78.为了便于数据的处理并匹配seq2seq结构的batchsize(一次训练所抓取的数据样本数量)，本技术的该实施例中，还包括将各条日志数据找前处理单元中对应得到的池化结果和重要性参数，转换为一个个句子结构的数据送入到预测单元采用的循环神经网络中。另外，本实施例中转换为句子结构的同时，将池化结果和重要性参数的序列长度固定为预设序列长度，例如将池化结果和重要性参数的序列长度转变为预设序列长度30字，并且转换后的重要性参数之间是相互独立的，只与之相关的日志数据相对应。
79.这样，输入池化结果和重要性参数至预测单元时，由于预设序列长度的句子结构是为了匹配seq2seq结构的一次训练所抓取的数据样本数量，也就是说预测单元接收的待处理的信息，也是按照与预设序列长队对应的数据数量为一组输入的，例如预设序列长度为三十时，池化结果以三十个日志数据对应的池化结果为一组输入预测单元中，每个句子结构对应的重要性参数也同样以三十个一组为单位传输至注意力机制中。
80.本实施例转换各条日志数据为包含有时间戳信息和类别信息的向量矩阵后，再通过前处理单元中设置的卷积层对向量矩阵进行多通道卷积处理，并为了降低包括有seq2seq的整体系统以及数据处理的复杂度，还设置有池化层对卷积后的向量矩阵进行池化处理，将所有的日志数据转换为相同的长度，便于后续处理；并且为了匹配预测单元，将池化结果和重要性参数均转换为预设序列长度句子结构。这样，前处理单元通过对池化结果和重要性参数针对预测单元的适应性转换以及在预测单元中的应用，将前处理单元和预测单元之间相互融合，进一步增加了模型的可解释性以及数据处理的效率。
81.请参阅图7，图7是图3所示实施例中的步骤s303至步骤s304在图6所示的示例性实施例中的流程图。如图7所示，步骤s303具体可以包括步骤s701至步骤s705，通过上述步骤通过预测单元实现对设备发生故障的预测，详细介绍如下：
82.步骤s701，识别出池化结果的特征信息，将池化结果的特征信息以及池化结果转换为数值类的数据，得到数值类结果。
83.由于预测单元采用的循环神经网络只能理解数值型数据，若是字符的话是无法理解的，而本技术输入的由设备产生的日志文件实际上是字符，因此需要将其转化为数值类数据。具体的，因上述对向量矩阵进行卷积处理得到卷积结果就是一个特征提取的过程，故预测单元能够从前处理单元传输的池化结果中识别出特征信息，识别后将该特征信息以及池化结果转换为数值类的数据，得到数值类结果。
84.步骤s702，获取基于数值类结果得到的特征向量，并将特征向量进行格式转换得到特征张量。
85.上述得到的数值类结果实质上为数字构成的向量，而其中包含了从池化结果提取出的特征信息，故基于数值类结果能够得到特征向量。而常见的深度学习框架都需要把向量转换为张量的格式才能送到循环神经网络中进行处理，因此进一步的，在得到特征向量后，将其进行格式转换得到特征张量，即蕴含了日志文件的特征信息的数值化数据。
86.步骤s703，对特征张量进行语义编码，得到语义编码结果。
87.预测单元应用的seq2seq模型是以编码(encode)和解码(decode)为代表的架构方式，对应的，本技术提供的该实施例中，设置有编码器和解码器，编码器对循环神经网络能够理解的特征张量进行语义编码，得到语义编码结果。
88.其中，编码器采用了循环神经网络来得到语义编码结果，循环神经网络是由多个
网元构成的，而特征张量输入到循环神经网络处理顺序不是并行而是串行的，可以理解为从左到右依次处理，因此每个网元经过处理后都有对应能输出的隐藏状态(提取有隐藏信息，故也可以称作为隐藏状态)，本实施例保留记录了所有信息的最后一个隐藏状态，编码器的隐藏状态由于保存了经过编码的语义信息，故将编码器最后输出的隐藏状态作为语义编码结果。
89.步骤s704，将重要性参数作为权重，并根据权重对语义编码结果进行加权运算，得到各条日志数据对应的目标语义编码结果。
90.本实施例中，将重要性参数作为权重，体现为通过预测单元的重要性参数改变注意力机制的运行参数，具体为，通过重要性参数判断该日志数据对设备故障预测的影响度，影响度越大也就是重要程度越高的日志数据，会被注意力机制予以较大的权重，即注意力机制予以日志数据的权重与其重要参数的值的大小成正比。
91.进一步地，日志数据是以句子结构输入至预测单元的，每个句子结构中包括有与预设序列长度对应数据数量的池化结果，并且每个句子结构中的每组池化结果之间是存在权重区分的，每个池化结果在该组中所占权重，就是每个池化结果对应的日志数据在该组中对故障预测的相对影响度。
92.这样，在根据权重对语义编码结果进行加权运算时，便是通过注意力机制对句子结构的语义编码结果进行加权运算，本实施例中采用乘性加权模型，即以乘法形式进行加权，具体公式为：c＝∑
iai
vi，其中，α表征为注意力机制，v表征为一句子结构中各个池化结果的权重形成的权重矩阵，通过上述公式进行乘法加权之后，得到的c表征为某一个句子结构整体的权重，将该权重作为目标语义编码结果，传输至解码器。
93.步骤s705，对目标语义编码结果进行解码处理，得到解码结果，将解码结果的值作为预测信息。
94.其中，预测信息为设备发生故障的概率值，是一个数值型的数据，即不同类别故障检测的概率，故障的类别与日志文件中多条日志数据对应，实际上是将故障检测相关的运维问题转换为了文本分类问题，最后输出的预测信息是每种故障类别的概率，每种文本类型代表了一种故障的出现。预测信息的结果是由编码器和注意力机制共同影响的，即是由编码器输出的作为语义编码结果的隐藏状态和重要性参数共同影响的。
95.解码器对目标语义编码结果进行解码处理，得到解码结果。解码器也采用了循环神经网络，对数据的处理也是从左到右依次进行的，它所有在右边的网络都接收了左边网络的输入，输出是一个概率分布。
96.由此，通过本实施例的方法，本技术通过前处理单元中得到的重要性参数对预测单元中编码器输出的语义编码进行加权影响，得到目标语义编码结果，进而解码器对目标语义编码结果进行解码处理得到预测信息。
97.这样本技术该实施例的技术方案通过前处理单元的特征工程得到重要性参数后，依据表征日志数据对故障检测的影响度的重要性参数修改注意力机制的参数，因此预测单元能够和要处理的数据更为匹配，因此收敛速度更快，准确度也更高；并且通过重要性参数和增设的注意力机制，将预测单元的注意力机制和前处理单元的特征工程进行融合，提高了所用模型的可解释性。
98.图8是图2所示实施例中的前处理单元和预测单元，在一示例性实施例示出的一种
应用本技术提供的故障预测方法的包括前处理单元和预测单元的运维系统的结构示意图。如图8，该系统包括前处理单元810和预测单元820，前处理单元810包括嵌入模块811、卷积模块812和特征工程813，卷积模块812中还包含有卷积层8121和池化层8122；预测单元820包括编码器821、注意力机制822和解码器823。
99.嵌入模块811，用于获取设备运行过程中产生的日志文件，日志文件包括日志数据的属性信息、时间戳信息和类别信息；将属性信息向量化写入向量矩阵的词编码处，将时间戳信息和类别信息向量化后分别写入增设的位置编码和类型编码处，得到每条日志数据对应的词向量，多条日志数据的词向量形成向量矩阵，如图9所示，图9为本技术的一示例性实施例中设置有位置编码和类型编码的向量矩阵的示意图，以此通过时间戳信息和类别信息增加模型对数据即向量矩阵的理解。
100.卷积模块812，用于接收嵌入模块811传输的向量矩阵，在卷积层8121对向量矩阵进行多通道卷积，得到的卷积结果在池化层8122进行最大池化处理，将不同卷积核得到的变长日志数据转换为同样的预设长度，得到池化结果，以降低系统以及数据处理的复杂度。
101.特征工程813，用于接收嵌入模块811传输的向量矩阵，对向量矩阵中含有的特征元素进行数据分析预处理，数据分析预处理包括异常特征元素的剔除处理、重复特征元素的剔除处理，以及不完整特征元素的填充处理中的至少一种；之后通过随机森林算法对数据分析预处理后的向量矩阵中含有的特征元素进行特征分析，得到向量矩阵中每个特征元素对应的重要性参数。其中，越能影响设备故障检测的日志数据的重要性参数的值越大，反之越小。
102.预测单元820的编码器821，用于接收卷积模块812输出的池化结果，识别出池化结果的特征信息，将池化结果的特征信息以及池化结果转换为循环神经网络能够理解的数值类的数据，得到数值类结果，并获取基于数值类结果得到的特征向量，将特征向量进行格式转换得到循环神经网络能够处理的张量格式的特征张量；进而通过循环神经网络的多个网元对循环神经网络能够理解的特征张量进行语义编码，将循环神经网络输出的最后一个隐藏状态作为语义编码结果。
103.注意力机制822，用于接收特征工程813输出的重要性参数，并将注意力机制822本身的运行参数修改为重要性参数；通过重要参数对编码器821输出的语义编码结果进行乘法加权运算，得到各条日志数据对应的目标语义编码结果。
104.解码器823，用于对目标语义编码结果进行解码处理，得到解码结果，将解码结果的值作为预测信息，将故障检测相关的运维问题转换为了文本分类问题，最后输出的预测信息是每种故障类别的概率，每种文本类型代表了一种故障的出现。
105.由此，通过上述实施例提供的运维系统实施本技术提供的故障检测方法，通过嵌入模块811添加了时间戳信息和类别信息的写入，让循环神经网络模型在第一时间便对日志文件的日志数据内容有所理解；在前处理单元810的特征工程813得到重要性参数后，依据表征日志数据对故障检测的影响度的重要性参数修改注意力机制822的运行参数，因此预测单元820能够和要处理的数据更为匹配，因此收敛速度更快，对故障检测准确度也更高；并且通过重要性参数和增设的注意力机制，能够将预测单元的注意力机制和前处理单元的特征工程进行融合，提高了所用模型的可解释性。
106.图10是本技术的一示例性实施例示出的一种故障预测装置1000的框图。如图10所
示，该装置包括：
107.获取模块1001，用于获取设备运行过程中产生的日志文件；其中，日志文件包括日志数据的时间戳信息和类别信息；分析模块1002，用于根据日志数据的时间戳信息和类别信息，对日志数据进行特征分析，得到用于表征日志数据的重要性参数；处理模块1003，用于根据重要性参数对日志数据进行语义编码处理得到目标语义编码结果；确定模块1004，用于根据目标语义编码结果确定设备发生故障的预测信息。
108.该装置应用本技术提供的故障预测方法，通过获取模块1001获取的日志数据的时间戳信息和类别信息，提升了对日志数据的处理速度，并通过处理模块1003中分析得到的重要性参数提升了故障预测的准确性，以此使得确定模块1004能够快速且准确的定位设备的故障。
109.在另一示例性的实施例中，获取模块1001，还用于对各条日志数据的时间戳信息、类别信息，以及属性信息进行向量化处理，得到各条日志数据对应的词向量；根据各条日志数据对应的词向量生成向量矩阵。
110.在另一示例性的实施例中，分析模块1002，还用于对向量矩阵中含有的特征元素进行数据分析预处理，得到数据分析预处理后的向量矩阵；其中，数据分析预处理包括异常特征元素的剔除处理、重复特征元素的剔除处理，以及不完整特征元素的填充处理中的至少一种；对数据分析预处理后的向量矩阵中含有的特征元素进行特征分析，得到向量矩阵中每个特征元素对应的重要性参数。
111.在另一示例性的实施例中，处理模块1003，还用于获取向量矩阵；其中，向量矩阵是根据日志数据的时间戳信息、类别信息，以及属性信息得到的；对向量矩阵进行语义编码处理得到语义编码结果；将重要性参数作为权重，并根据权重对语义编码结果进行加权运算，得到各条日志数据对应的目标语义编码结果。
112.在另一示例性的实施例中，确定模块1004，还用于对目标语义编码结果进行解码处理，得到解码结果；将解码结果的值作为预测信息，其中，预测信息为设备发生故障的概率值，故障的类别与日志文件中多条日志数据对应。
113.需要说明的是，上述实施例所提供的故障预测装置与上述实施例所提供的故障预测方法属于同一构思，其中各个模块和单元执行操作的具体方式已经在方法实施例中进行了详细描述，此处不再赘述。上述实施例所提供的故障预测装置在实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能，本处也不对此进行限制。
114.本技术的实施例还提供了一种电子设备，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当一个或多个程序被一个或多个处理器执行时，使得电子设备实现上述各个实施例中提供的故障预测方法。
115.图11示出了适于用来实现本技术实施例的电子设备的计算机系统的结构示意图。需要说明的是，图11示出的电子设备的计算机系统1100仅是一个示例，不应对本技术实施例的功能和使用范围带来任何限制。
116.如图11所示，计算机系统1100包括中央处理单元(centralprocessingunit，cpu)1101，其可以根据存储在只读存储器(read－onlymemory，rom)1102中的程序或者从储存部分1108加载到随机访问存储器(randomaccessmemory，ram)1103中的程序而执行各种适当
的动作和处理，例如执行上述实施例中的方法。在ram1103中，还存储有系统操作所需的各种程序和数据。cpu1101、rom1102以及ram1103通过总线1104彼此相连。输入/输出(input/output，i/o)接口1105也连接至总线1104。
117.以下部件连接至i/o接口1105：包括键盘、鼠标等的输入部分1106；包括诸如阴极射线管(cathoderaytube，crt)、液晶显示器(liquidcrystaldisplay，lcd)等以及扬声器等的输出部分1107；包括硬盘等的储存部分1108；以及包括诸如lan(localareanetwork，局域网)卡、调制解调器等的网络接口卡的通信部分1109。通信部分1109经由诸如因特网的网络执行通信处理。驱动器1110也根据需要连接至i/o接口1105。可拆卸介质1111，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器1110上，以便于从其上读出的计算机程序根据需要被安装入储存部分1108。
118.特别地，根据本技术的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本技术的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的计算机程序。在这样的实施例中，该计算机程序可以通过通信部分1109从网络上被下载和安装，和/或从可拆卸介质1111被安装。在该计算机程序被中央处理单元(cpu)1101执行时，执行本技术的系统中限定的各种功能。
119.需要说明的是，本技术实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是电、磁、光、电磁、红外线或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(erasableprogrammablereadonlymemory，eprom)、闪存、光纤、便携式紧凑磁盘只读存储器(compactdiscread－onlymemory，cd－rom)、光存储器件、磁存储器件或者上述的任意合适的组合。在本技术中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输，包括但不限于：无线、有线等等，或者上述的任意合适的组合。
120.附图中的流程图和框图，图示了按照本技术各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，上述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。
121.描述于本技术实施例中所涉及到的单元和模块可以通过软件的方式实现，也可以通过硬件的方式来实现，所描述的单元和模块也可以设置在处理器中。其中，这些单元和模块的名称在某种情况下并不构成对该单元和模块本身的限定。
122.本技术的另一方面还提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如前的故障预测方法。该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的，也可以是单独存在，而未装配入该电子设备中。
123.本技术的另一方面还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述各个实施例中提供的故障预测方法。
124.以上仅为本技术的较佳实施例而已，并不用以限制本技术，凡在本技术的精神和原则之内所做的任何修改、等同替换或改进等，均应包含在本技术的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：文档分类方法、装置、计算机设备和存储介质与流程

一种故障预测方法及装置、电子设备、存储介质与流程

相关文献

最热文献