用于时间序列数据的基于簇的分类的制作方法

2021-10-22 08:18:00 来源：中国专利 TAG：

本公开涉及用于分析时间序列数据的设备和方法。

背景技术

在各个技术领域，需要监控机器或机器系统的操作。例如，在石油或天然气生产领域，为了提供预防性维护并从而确保高可用性，可以监控大量泵，通常是电潜泵(ESP)。

为了有效地监控大量机器，需要利用至少部分基于人工智能(AI)的监控机制。这种基于AI的机制可以分析通过监控多台机器获取的时间序列数据，自动识别异常行为，并触发措施以解决导致异常行为的问题，例如，通过向操作员发出警告。当监控泵时，基于AI的机制可以例如自动将检测到的异常分类为例如堵塞、泄漏、轴损坏等。

AI机制可以基于预定义的规则，例如，由领域专家制定，和/或基于机器学习。然而，制定和维护适当的规则通常是一项复杂的任务。另一方面，机器学习方法通常对应于黑盒方法。也就是说，机器学习过程所训练的AI机制的输出可能难以理解并且通常不会对其决策或分类的原因提供进一步的解释。此外，机器学习过程通常需要相当大量的人工准备的训练数据，而准备这样的训练数据可能是一个繁琐的过程。更进一步，当利用机器学习时，只有在机器学习过程至少在一定程度上完成后才能应用AI机制，因此通常不可能立即解决新的行为类型。

WO 2017/034512 A1描述了时间序列数据的交互式分析，涉及基于机器学习和用户交互的时间序列数据的自动分割和聚类。

WO 2018/140337 A1描述了一种用于机器状态监控和故障诊断的半监督方法，涉及将时间序列数据划分为段簇并将段簇聚类为簇原型，该簇原型用于学习预测类别标签的判别模型。用户可以在创建段簇后手动为其提供标签。

US 2007/279490 Al使用两级训练过程，挖掘监视视频以检测异常事件。在第一级，对视频流的部段进行无监督聚类，将一组异常事件与用户反馈相结合以生成干净的训练集。在第二组中，使用干净的训练集来训练更精确的模型。

因此，需要允许有效且准确地对由监控机器获取的时间序列数据进行分类的技术。

技术实现要素：

鉴于上述需要，本公开提供如权利要求1所限定的设备和如权利要求10所限定的方法。从属权利要求定义了进一步的实施例。

根据一个实施例，提供了一种用于分析时间序列数据的设备。该设备被配置为：

-获取在机器(例如泵、磨机、电动机、内燃机和/或涡轮机)上监控的时间序列数据；

-将时间序列数据分割为多个时间段；

-确定估计具有相同的时间序列数据动态的时间段的簇；

-检查与时间段的至少一个相关联的标签信息是否可用；

-如果与时间段的至少一个相关联的标签信息可用，则基于与时间段的至少一个相关联的标签信息对簇进行分类；

-如果簇的时间段都没有关联的标签信息，则将簇的时间序列数据的至少一部分呈现给用户；以及

-基于响应于呈现时间序列数据的至少一部分而接收到的用户输入，对簇进行分类并生成与簇的时间段相关联的标签信息，所生成的标签信息指示对簇进行分类的结果。

通过这种方式，该设备可以通过利用现有的标签信息对显示类似动态的其他时间序列数据实现时间序列数据的有效分类，同时可以通过调用用户输入以对时间序列进行分类并生成新的标签信息来处理新的行为类型。因此用户例如领域专家或机器学习专家，可以以直观和有效的方式管理新标签信息的生成，并且能够在常规监控操作期间有效地学习在时间序列数据中识别的新行为类型。

根据一个实施例，该设备被配置为基于时间序列数据动态的概率模型确定时间序列数据的和簇的时间段。通过这种方式，可以以精确且可再现的方式评估不同时间的时间序列数据的相似性。

根据一个实施例，该设备进一步被配置为：

-如果簇的两个或更多个时间段具有冲突的关联标签信息，则将簇的时间序列数据的至少一部分呈现给用户。

因此，可以以有效且直观的方式解决冲突的分类。

根据一个实施例，该设备进一步被配置为：

-如果簇的两个或更多个时间段具有冲突的关联标签信息，则选择标签信息的非冲突部分，并基于所选的标签信息的非冲突部分对簇进行分类。该设备可以被配置为基于与标签信息相关联的时间段的累积时间长度来选择标签信息的非冲突部分。可替代地或另外地，该设备可以被配置为基于时间序列数据动态的概率模型来选择标签信息的非冲突部分。

通过这种方式，可以自动解决标签信息的冲突，或者设备可以高效地帮助用户解决标签信息的冲突。

根据一个实施例，该设备被配置为通过将簇分配到多个类别中的一个类别来对簇进行分类，这些类别包括：机器的正常运行、机器的异常运行、未知的动态和冲突的标签信息。然而，应注意，也可以使用其他类别，例如不同类型的异常运行或不同类型的常规运行。这些类别可以在常规监控操作期间实现对机器的有效监控和对时间序列数据中所识别的学习新行为类型的有效管理。

根据进一步的实施例，提供了一种分析时间序列数据的方法。该方法包括：

-获取在机器(例如泵、磨机、电动机、内燃机和/或涡轮机)上监控的时间序列数据；

-将时间序列数据分割为多个时间段；

-确定估计具有相同的时间序列数据动态的时间段的簇；

-检查与时间段的至少一个相关联的标签信息是否可用；

-如果与时间段的至少一个相关联的标签信息可用，则基于与时间段的至少一个相关联的标签信息对簇进行分类；

-如果簇的时间段都没有关联的标签信息，则将簇的时间序列数据的至少一部分呈现给用户；以及

-基于响应于呈现时间序列数据的至少一部分而接收到的用户输入，对簇进行分类并生成与簇的时间段相关联的标签信息，所生成的标签信息指示对簇进行分类的结果。

通过这种方式，该方法可以通过利用现有的标签信息对显示类似动态的其他时间序列数据实现时间序列数据的有效分类，同时可以通过调用用户输入以对时间序列进行分类并生成新的标签信息来处理新的行为类型。因此用户例如领域专家或机器学习专家，可以以直观和有效的方式管理新标签信息的生成，并且能够在常规监控操作期间有效地学习在时间序列数据中识别的新行为类型。

根据一个实施例，该方法进一步包括：

-基于时间序列数据动态的概率模型确定时间序列数据的时间段和簇。

通过这种方式，该方法可以使得能够以精确且可再现的方式评估不同时间的时间序列数据的相似性。

根据一个实施例，该方法进一步包括：

-如果簇的两个或更多个时间段具有冲突的关联标签信息，则将簇的时间序列数据的至少一部分呈现给用户。

通过这种方式，该方法可以使得能够以有效且直观的方式解决冲突分类。

根据一个实施例，该方法进一步包括：

-如果簇的两个或更多个时间段具有冲突的关联标签信息，则选择标签信息的非冲突部分，并基于所选的标签信息的非冲突部分对簇进行分类。选择标签信息的非冲突部分可以基于与标签信息相关联的时间段的累积时间长度和/或基于时间序列数据动态的概率模型。

通过这种方式，既可以自动解决标签信息的冲突，也可以高效的帮助用户解决标签信息的冲突。

根据一个实施例，该方法进一步包括：

-通过将簇分配到多个类别中的一个类别来对簇进行分类，这些类别包括：机器的正常运行、机器的异常运行、未知的动态和冲突的标签信息。

然而，应注意，也可以使用其他类别，例如不同类型的异常运行或不同类型的常规运行。这些类别可以在常规监控操作期间实现对机器的有效监控和对时间序列数据中所识别的学习新行为类型的有效管理。

在该设备或方法的上述实施例中，机器可包括泵。在这种情况下，时间序列数据可以包括以下中的至少一种：泵的电机温度、泵的入口温度、泵的工作功率、泵内的压力、泵外的压力。因此，该设备或方法可用于实现泵的增强监控，例如，通过基于AI的机制。

附图说明

下面，将参考附图更详细地描述本公开的实施例。

图1示意性地示出了可以根据本公开的实施例进行分析的时间序列数据的示例。

图2示意性地示出了根据本公开的实施例的监控系统。

图3示出了用于示意性示出根据本公开的实施例的方法的流程图。

图4示出了用于示意性示出根据本公开的设备的结构的框图。

具体实施方式

应注意，在以下实施例的详细描述中，附图仅是示意性的并且图示的元件不一定按比例示出。相反，附图旨在说明部件的功能和协作。这里，应理解，功能块、设备、部件或其他物理或功能元件的任何连接或耦连也可以通过间接的连接或耦连来实现，例如，经由一个或多个中间元件。元件或部件的连接或耦连可以例如通过基于有线、无线连接和/或基于有线和无线连接的组合来实现。功能块可以由专用硬件、由安装在可编程硬件上的固件和/或软件、和/或由专用硬件与固件或软件的组合来实现。

图1示意性地示出了时间序列数据的示例。时间序列数据可以例如由电潜泵(ESP)上的传感器提供。时间序列数据可以例如包括在ESP内部测量的压力，诸如ESP的头部压力。此外，时间序列数据可以包括在ESP外部测量的压力，诸如环空压力或对地压力。更进一步，时间序列数据可以包括ESP的工作功率，例如，在电机电流方面。

图1进一步示出了时间序列数据的示例性簇11、12。每个簇11、12对应于时间序列数据的多个时间段，这些时间段被估计为表现出类似的时间序列数据动态。簇11例如可以包括时间序列数据表现出对应于ESP的正常运行的动态的时间段，而簇12可以包括时间序列数据表现出对应于ESP的异常运行的动态的时间段。应注意，图1所示的簇11、12仅为示例性的，在实际场景中，可以在时间序列数据中识别出更多的簇。即使两个簇表现出不同的时间序列数据动态，它们也可能属于同一类别，例如，正常运行或异常运行。通常，簇将包含时间序列数据的多个时间段，这些时间段发生在不同的时间。

图2示意性地示出了配备有分析工具200的监控系统，该分析工具被配置为根据所示构思来执行时间序列数据的分类。

如图所示，分析工具200从机器100接收时间序列数据。如上所述，机器100可以是泵，特别是ESP。然而，应当理解，分析工具200还可以用于分析在其他类型的机器(例如，工业磨机、涡轮机或内燃机)上监控的时间序列数据。

在示出的示例中，分析工具200设置有用于存储在机器上监控的时间序列数据的存储器210。然后将时间序列数据提供给分割级220。分割级220将时间序列数据分割成时间序列数据表现出某种类型的动态或行为的多个时间段。分割可以基于将一个或多个概率模型拟合到时间序列数据。概率模型可以例如基于高斯混合模式。结果，分割级220输出时间序列数据的多个时间段230。此外，分割级220还识别时间段230的簇。簇对应于表现出类似的时间序列数据动态的时间段组，例如，如图1示例中的簇11、12。例如，可以根据匹配相同概率模型的时间段来识别簇。结果，分割级220输出描述所识别的簇的簇信息240。

簇信息240被提供给分类级250。分类级250将簇分类为不同的类别。在示出的示例中，这些类别包括“正常运行”、“异常运行”、“未知行为”和“冲突”。结果，分类级250输出簇分类信息270。

分类基于存储在存储器260中的标签信息。对于某个时间段，标签信息可以指示较早分类的结果。较早的分类可以是基于用户输入的手动分类，例如领域专家进行的手动分类，或者可以是由分析工具200本身或由一些其他自动分析系统进行的自动或半自动分类。然而，对于簇的某些时间段，还可能没有标签信息可用。

如果对于簇的某个时间段，标签信息可用并且指示某个分类，则分类级250可以根据相同的分类对簇的其他时间段进行分类。例如，如果对于簇的其中一个时间段，标签信息指示“常规运行”类别中的分类，那么该簇的其他时间段乃至整个簇都可以被分类为“常规运行”类别。类似地，如果对于簇的其中一个时间段，标签信息指示“异常运行”类别中的分类，那么该簇的其他时间段乃至整个簇都可以被分类为“异常运行”类别。

另一方面，如果没有可用于簇的时间段的标签信息，则分类级250可以首先将簇分类在类别“未知行为”中。然后可以在用户界面280上呈现簇的时间序列数据的至少一部分，例如，在一个或多个时间段上，以提醒由用户10例如领域专家进行输入。时间序列数据在用户界面280上的呈现也可以由解释性信息补充，例如，何时或多久观察到相应的行为，或测量的时间序列数据的可靠性信息，例如，就平均值和标准差而言。

基于用户输入，然后可以将簇重新分类为类别“正常运行”和“异常运行”中的一种并且将相应标签信息提供给存储器260。

在某些情况下，簇的时间段也可能存在冲突的标签信息。例如，对于簇的一个或多个时间段，标签信息可以指示较早分类为类别“常规运行”，而对于簇的一个或多个其他时间段，标签信息可以指示较早分类为类别“异常运行”。在这种情况下，分类级250可以首先将簇分类在类别“冲突”中。然后可以在用户界面280上呈现簇的时间序列数据的至少一部分以提醒用户10输入。时间序列数据在用户界面280上的呈现也可以由解释性信息补充，例如，何时或多久观察到相应的行为，或测量的时间序列数据的可靠性信息，例如，就平均值和标准差而言。

基于用户输入，可以解决标签信息的冲突，然后可以将簇重新分类为类别“正常运行”和“异常运行”中的一种并且将相应标签信息提供给存储器260。

在一些场景中，经由用户界面280提供的用户输入也可以用于调整在分割级220中使用的参数，例如，根据在分割过程中要考虑的相关特征的定义。

分析工具200可以对新到达的时间序列数据重复这些过程，从而不断地积累进一步的标签信息并提炼现有的标签信息。累积和提炼的标签信息进而增加了能够将新到达的时间序列数据自动分类到“正常运行”类别或“异常运行”类别中的可能性，并避免提醒进一步的用户输入。

图3示出了用于说明可用于在设备中实现所示构思的方法的流程图，诸如在上述分析工具200中。该方法可以例如通过由设备的一个或多个处理器执行程序代码来实现。程序代码可以被存储在设备的存储器中。

在框310处，设备获取在机器诸如上述机器100上监控的时间序列数据。该机器可以对应于或包括以下中的至少一种：泵例如ESP、磨机、电动机、内燃机或涡轮机。如果机器包括泵，则时间序列数据可以包括以下中的至少一种：泵的电机温度、泵的入口温度、泵的工作功率、泵内的压力、泵外的压力。

在框320处，设备将时间序列数据分割成多个时间段。时间序列数据的时间段可以基于时间序列数据动态的概率模型来确定。

在框330处，设备确定估计具有相同的时间序列数据动态的时间段的簇。簇可以基于时间序列数据动态的概率模型，例如，基于用于在框320处分割时间序列数据的相同概率模型来确定。

该设备然后基于与簇的至少一个时间段相关联的标签信息对簇进行分类。这可能涉及将簇分配到多个类别中的一个类别，这些类别包括：机器的正常运行、机器的异常运行、未知的动态和冲突的标签信息。

在框340处，设备检查标签信息对于簇的至少一个时间段是否可用。

如果在框340处发现标签信息可用于簇的至少一个时间段，则设备继续框350并基于与至少一个时间段相关联的标签信息对簇进行分类。这可能涉及将簇的其他尚不可用标签信息的时间段分类为可用标签信息所指示的类别中。

如果在框340处发现没有可用于簇的时间段的标签信息，则设备继续框360并向用户呈现簇的时间序列数据的至少一部分。在框370处，设备然后基于响应于在框360处呈现时间序列数据而接收到的用户输入对簇进行分类。此外，设备生成与簇的时间段相关联的标签信息。所生成的标签信息指示分类簇的结果。

在某些情况下，簇的两个或更多个时间段可能具有冲突的关联标签信息。同样在这种情况下，设备可以向用户呈现簇的时间序列数据的至少一部分并且基于响应于呈现时间序列数据而接收到的用户输入对簇进行分类。可替代地或另外地，设备可以选择标签信息的非冲突部分并基于所选的标签信息的非冲突部分对簇进行分类。选择标签信息的非冲突部分可以基于与标签信息相关联的时间段的累积时间长度和/或基于时间序列数据动态的概率模型，例如，用于在框320处分割时间序列数据的相同概率模型或在框330处用于簇的相同概率模型。

可以重复图4的方法400以识别和分类时间序列数据中的多个簇以及新获取的时间序列数据。

图4示出了用于示意性地说明设备400的结构的框图。设备400可以例如用于实现上述分析工具200。在所示示例中，设备400包括至少一个处理器410和存储器420。进一步地，设备400包括至少一个数据接口430，该数据接口可以用于获取上述时间序列数据和初始标签信息。此外，设备400还可以包括用户界面440，用户界面用于向用户呈现时间序列数据并接收用户输入，例如对没有现有标签信息的簇进行分类、解决冲突的分类或定义标签信息。设备400的部件，即至少一个处理器410、存储器420、至少一个数据接口440和用户界面440，可以例如通过数据总线450或设备400的类似内部通信基础设施彼此耦接。通过由至少一个处理器410执行程序代码，设备400可以被配置为根据分析工具200的上述功能进行操作和/或实施如结合图3所解释的方法300。

应当理解，示例的以上描述旨在说明并且所说明的构思易于进行各种修改。例如，所说明的构思可以应用于监控各种类型机器或机器系统以及可以在机器或机器系统上监控的各种类型的数据，并且可以以各种方式利用时间序列数据的分类。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：用于使用聚类收缩的混合算法系统和方法与流程
下一篇：具有预定信息层的磁性PUF的制作方法

用于时间序列数据的基于簇的分类的制作方法

相关文献

最热文献