一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

训练针对工业应用的人工智能模块的制作方法

2022-11-12 23:25:20 来源:中国专利 TAG:


1.本发明总体涉及工业系统。特别地,本发明涉及一种生成用于训练针对工业应用(诸如用于监测和/或控制工业系统)的人工智能模块(下文中被称为“ai模块”)的训练数据集的计算机实现的方法。本发明还涉及对应的计算机程序和存储这种计算机程序的计算机可读介质。此外,本发明涉及使用用于训练ai模块的训练数据集,以及涉及用训练数据集训练ai模块的计算机实现的方法。此外,本发明涉及包括用这种训练数据集训练的ai模块的计算机,以及用于监测和/或控制工业系统的计算机和/或经训练的ai模块的用途。


背景技术:

2.诸如例如工厂、电厂、制炼厂、电转变站、中继站、电力供应站、变电站、工业驾驶系统、工厂系统、制造系统、驱动器、马达等工业系统通常包括一个或多个组件,该一个或多个组件可以在工业系统的操作期间被监测和/或被控制以确保工业系统的正确功能,并且可靠地检测工业系统的失灵和/或故障。例如,工业驾驶系统可以包括在工业系统的操作期间被监测和/或被控制的一个或多个驱动器、马达、负载、变压器、变速箱、泵、通风设备、加热设备、空调设备、控制器、运动控制和机械。针对此目的,与工业系统的一个或多个组件有关的诸如传感器数据的数据可以被分析以确定工业系统是否充分发挥功能并且正常工作。
3.为了分析这种数据或数据集,诸如例如人工神经网络的人工智能模块(“ai模块”)可以被使用。为了可靠地确定工业系统是否充分发挥功能并且正常工作或者为了可靠地检测(或预测)工业系统的一个或多个组件的故障,ai模块应当用合适并且全面的训练数据集被训练,该训练数据集应当优选地覆盖全部可想到的工业系统的工作场景、操作场景、故障场景和/或故障模式。然而通常地,在工业应用中用于训练ai模块的数据可能是不足的,特别是针对工业系统的某些故障场景和/或过程转换的数据可以是稀少的。因此,利用这种(有限的)训练数据集训练的用于监测和/或控制工业系统的ai模块的用途可以是有限的。


技术实现要素:

4.因此希望可以提供用于训练工业应用(诸如监测和/或控制工业系统)中的ai模块的经改进的和/或丰富的训练数据集,以及提供用于监测和/或控制工业系统的经改进的(经训练的)ai模块。
5.这通过独立权利要求的主题来实现,其中在从属权利要求以及以下描述中描述了另一实施例。
6.根据本公开的一方面,提供了生成用于训练针对工业应用(诸如用于监测和/或控制工业系统)的人工智能模块(ai模块)的训练数据集的计算机实现的方法,例如用于工业应用、用于监测工业系统、用于控制工业系统和/或用于预测工业系统的行为。该方法包括:
[0007]-在存储装置上提供数据第一数据集和第二数据集,其中第一数据集包括指示、描述和/或表示工业系统的第一操作状况的一个或多个第一数据元素,其中第二数据集包括指示、描述和/或表示工业系统的第二操作状况的一个或多个第二数据元素,其中第一操作
状况基本上匹配第二操作状况;
[0008]-确定用于将第一数据集中的一个或多个第一数据元素转换和/或转变为第二数据集中的一个或多个第二数据元素的数据转换;
[0009]-将所确定的数据转换应用于第一数据集中的一个或多个数据元素和/或应用于一个或多个另一数据集中的一个或多个另一数据元素,从而生成至少一个经转换的数据集;以及
[0010]-基于至少一个经转换的数据集中的至少一部分来生成用于训练ai模块的训练数据集。
[0011]
通过确定数据转换以及将数据转换应用到一个或多个第一数据元素和/或一个或多个另一数据元素,用于训练ai模块的全面的训练数据集可以被生成,该训练数据集可以覆盖工业系统的多个场景并且可以被用于全面地训练ai模块。这种经训练的ai模块则可以被用于监测和/或控制工业系统,例如以便确保工业系统的正确功能和/或可靠地检测工业系统和/或其中的一个或多个组件的失灵和/或故障。
[0012]
一般地,ai模块可以指代被配置为基于一个或多个输入和/或输入数据来提供分类结果的分类器和/或分类器电路装置,该输入和/或输入数据诸如例如指示工业系统的操作的数据、测量数据、操作数据和/或模拟数据。其中,根据本公开的ai模块可以指代任何类型的人工智能设备和/或电路装置,例如在一个或多个处理器和/或数据处理设备上使用和/或运行一个或多个机器学习算法。这种机器学习算法和/或ai模块可以基于例如逻辑回归、支持向量方法、提升方法(boosting)、朴素贝叶斯方法、贝叶斯网络、k邻近算法、人工神经网络、卷积神经网络、核密度估计、高斯回归、生成对抗网络、和积网络、对抗神经网络等。
[0013]
在本公开的上下文中,工业系统可以指代任何类型的工业系统,诸如例如工厂、电厂、制炼厂、电转变站、中继站、电力供应站、变电站、工业驾驶系统、工厂系统、制造系统、驱动器、马达等。此外,工业系统的操作状况可以指示、描述和/或表示工业系统的状态和/或工作状态,诸如例如运行状态、空闲状态、关闭状态等。备选地或附加地,工业系统的操作状况可以指示、描述和/或表示影响工业系统的操作的环境因素和/或参数,诸如例如在至少部分工业系统中的温度、压力、液位、通风和/或液体的流速。
[0014]
在本公开的上下文中,第一操作状况基本上匹配第二操作状况可以意味着第一操作状况与第二操作状况相似和/或等同。因此,第一数据集和第二数据集(和/或第一数据元素和第二数据元素)可以描述工业系统的相似、等同和/或匹配的操作状况。因此,在工业系统的第一和第二操作状况方面,第一和第二数据集(和/或第一和第二数据元素)可以是可比较的和/或相互匹配的。因此,可以得出用于将一个或多个第一数据元素转换为为一个或多个第二数据元素的有意义的数据转换。然而应当注意,第一和第二数据集可以在一个或多个另一操作状况中互不相同,即如本文中下方将详细描述的第一和第二操作状况以外的操作状况。
[0015]
一般地,第一数据集和第二数据集可以指代指示、描述和/或表示工业系统的操作的数据集。其中,第一数据集和第二数据可以具有相同的源和/或可以是相同的数据类型。例如,第一和第二数据集可以指代相同工业系统的测量数据(也被称为操作数据),诸如例如在工业系统的操作期间获取的传感器数据,或模拟工业系统(或其中的一个或多个组件)的操作的模拟数据。备选地,第一和第二数据集(和/或另一数据集)可以具有不同的源和/
或不同的数据类型。例如,第一数据集可以指代第一工业系统的测量数据并且第二数据集可以指代与第一工业系统不同的第二工业系统的测量数据。备选地或附加地,第一和第二数据集中的一个数据集可以指代工业系统的测量数据,并且第一和第二数据集中的另一数据集可以指代工业系统的模拟数据。备选地或附加地,第一数据集和第二数据集可以在第一和第二操作状况以外的一个或多个操作状况中不同。例如,第一和第二数据集中的一个数据集可以包括与第一和第二数据集中的另一数据集相比附加的数据或数据元素。这种附加的数据或数据元素可以是例如故障数据、来自工业系统的一个或多个附加组件的数据、与环境参数相关的数据、警报数据、事件数据等。因此,第一和第二数据集可以相对于第一和第二操作状况基本上互相匹配,但是第一和第二数据集可以可选地在一个或多个附加操作状况方面互不相同。
[0016]
相似地,另一数据集可以指代指示、描述和/或表示工业系统的操作的数据集。例如,另一数据集可以指代工业系统的测量数据、操作数据和/或模拟数据。
[0017]
一般地,用于将一个或多个第一数据元素转换为一个或多个第二数据元素的数据转换可以允许将一个或多个第一数据元素转变为一个或多个第二数据元素。例如,这可以意味着经转换的数据集可以包括相比于一个或多个第一数据元素更接近地类似一个或多个第二数据元素的一个或多个数据元素。因此,术语“数据转换”是被广泛地理解并且例如不需要意味着对第一数据元素的数据转换的应用会精确地导致转换为第二数据元素。相反,通过对一个或多个第一数据元素应用数据转换(和/或另一数据元素),来接近和/或模仿第二数据元素。
[0018]
通过示例的方式,第一数据集和第二数据集可以在以下方面互不相同:例如仅在数据集中的一个数据集中存在噪声、在数据集中的一个数据集中缺失值、由数据集的数据元素描述的测量曲线的形状、和/或由数据集的一个或多个数据元素表示的参数的值。这种差异可以由数据转换反映和/或被包括在数据转换中,使得通过应用数据转换,第一和第二数据集中的上述差异在经转换的数据集中被反映和/或被重现。
[0019]
因此,确定数据转换可以包括将一个或多个第一数据元素与一个或多个第二数据元素比较。备选地或附加地,确定数据转换可以包括确定一个或多个第一数据元素与一个或多个第二数据元素之间的偏差和/或差异。通过将所确定的数据转换应用于一个或多个第一数据元素和/或一个或多个另一数据元素以及通过生成经转换的数据集,第一数据集和第二数据集之间的差异和/或偏差可以被减轻,使得经转换的数据集更接近地类似第二数据集,因为第一数据集类似第二数据集。一般地,可以允许例如基于人造数据集生成多个经转换的数据集,经转换的数据集可以被组合在用于训练ai模块的全面的训练数据集中。
[0020]
例如,这可以允许使用模拟数据以补充用于训练ai模块的测量数据,反之亦然。备选地或附加地,基于将数据转换应用于来自多个不同工业系统和/或不同模拟的数据中的一个或多个,来自多个不同工业系统和/或不同模拟的数据可以被结合。备选地或附加地,包括故障数据的数据集可以与非故障数据集或没有故障数据的数据集相组合,如将在本文中下方详细描述的。
[0021]
根据实施例,生成训练数据集包括:
[0022]-提供用于训练ai模块的初始训练数据集;以及
[0023]-用至少一个经转换的数据集的至少一部分来补充、加强和/或丰富初始训练数据
集。
[0024]
其中,初始训练数据集可以包括初始训练数据,该初始训练数据可以可选地包括第二数据集。通过补充初始训练数据集,可以提供允许全面地训练ai模块的经改进的训练数据集,使得经训练的ai模块可以标识工业系统的多个不同操作场景和/或操作状况。
[0025]
根据实施例,补充初始训练数据集包括将至少一个经转换的数据集的至少一部分添加到初始训练数据集。备选地或附加地,补充初始训练数据集包括用至少一个经变换的数据集的至少一部分代替初始训练数据集的至少一部分。这样,初始训练数据集可以被有效地丰富、加强、补充和/或改进。
[0026]
根据实施例,该方法还包括例如基于处理第一数据集,在第一数据集中标识和/或选择指示工业系统的第一操作状况的一个或多个第一数据元素。该方法还包括例如基于处理第二数据集,在第二数据集中标识和/或选择指示工业系统的第二操作状况的一个或多个第二数据元素。一个或多个第一和第二数据元素可以被标识和/或选择,使得在第一和第二操作状况方面第一数据元素基本上匹配第二数据元素。因此,第一和第二数据集可以被搜索以用于匹配跨第一和第二数据集上的数据元素(例如,数据序列)。
[0027]
根据实施例,第一数据集中的一个或多个第一数据元素是时间相关的。备选地或附加地,第二数据集中的一个或多个第二数据元素是时间相关的。换句话说,第一和/或第二数据集可以包括时间相关的数据元素和/或可以对应于时间序列或数据元素的时间序列。
[0028]
根据实施例,该方法还包括相对于工业系统的至少一个操作参数,将一个或多个第一数据元素与一个或多个第二数据元素进行匹配,其中至少一个操作参数指示工业系统的操作。其中,至少一个操作参数可以是指示例如事件、状态、状况、工作状况、操作时间、时间和/或工业系统的工作状态。备选地或附加地,至少一个操作参数可以是指示潜在地影响工业系统的操作的环境因素或影响,诸如至少部分工业系统中的温度、压力、液位、通风和/或液体的流速。基于匹配一个或多个第一和第二数据元素,互相相关联和/或相对应的数据元素对可以被标识,该标识可以允许针对这些数据元素对来确定准确的数据转换。
[0029]
根据实施例,至少一个操作参数是工业系统的操作时间。备选地或附加地,一个或多个第一数据元素相对于工业系统的操作时间与一个或多个第二数据元素进行匹配。
[0030]
根据实施例,针对一个或多个第一数据元素中的每个第一数据元素按元素(element-wise)确定数据转换。因此,经转换的数据集可以包括一个或多个转换(或经转换的)数据元素,每个转换数据元素对应于第一数据元素中的一个第一数据元素和/或由数据转换转换的另一数据元素中的一个另一数据元素。
[0031]
根据实施例,确定数据转换包括确定一个或多个第一数据元素与一个或多个第二数据元素之间的函数关系。例如,这种函数关系可以指代允许将一个或多个第一数据元素转变为一个或多个第二数据元素的数学关系。
[0032]
例如,数据转换可以包括数据元素的增加、数据元素的移除、数据元素的调整、数据元素的缩放、将数据元素转换到不同的参考系统或坐标系统中等。
[0033]
根据实施例,使用例如在ai模块中实现的机器学习算法来确定数据转换。通过示例的方式使用核密度估计、高斯回归、人工神经网络、生成对抗网络、和积网络和对抗神经网络中的至少一个来确定数据转换。然而,任何其他机器学习算法可以被使用。因此,数据
转换可以通过可以在ai模块中被实现的机器学习算法来被学习。经训练的机器学习算法或ai模块则可以被用于将数据转换应用于一个或多个第一数据元素和/或一个或多个另一数据集中的一个或多个另一数据元素,以生成一个或多个经转换的数据集。多个经转换的数据集则可以被组合在训练数据集中。
[0034]
根据实施例,数据转换以非概率性的方式被确定。例如,基于回归和/或基于解决回归问题,数据转换可以被确定。
[0035]
根据实施例,第一数据集和第二数据集中的至少一个数据集包括描述模拟工业系统(例如在模拟计算中)的操作的模拟数据,其中第一数据集和第二数据集中的至少一个数据集包括描述工业系统的实际操作的操作数据。其中,操作数据可以指代测量数据,例如包括工业系统的传感器数据、致动器数据、控制数据、和/或事件数据。
[0036]
根据实施例,第一数据集包括描述模拟工业系统的操作(例如在第一操作状况处)的模拟数据,并且第二数据集包括描述工业系统的实际操作的操作数据。例如,第一数据元素可以是模拟数据元素以及第二数据元素可以是操作数据元素。此外,确定数据转换包括确定第二数据集中的一个或多个第二数据元素的噪声,使得通过对例如一个或多个第一数据元素和/或一个或多个另一数据集中的一个或多个另一数据元素应用数据转换,重现经转换的数据集中的噪声。因此,通过对一个或多个第一数据元素和/或对一个或多个另一数据集中的一个或多个另一数据元素应用数据转换,使一个或多个第二数据元素的噪声可以被添加到一个或多个第一数据元素和/或一个或多个另一数据集中的一个或多个另一数据元素中,例如使得经转换的数据集包括该噪声。
[0037]
根据实施例,所确定的噪声表示一个或多个第二数据元素的测量噪声,诸如例如测量或传感器信号的统计波动。备选地或附加地,所确定的噪声表示影响工业系统的实际操作的环境影响,诸如例如附加的部件运行、附加的泵运行、工业系统的部分的温度、环境温度等。因此,在本公开的上下文中,术语噪声将被广泛地理解为例如包括测量噪声以及其他在一个或多个第二数据元素中反映的特点或环境影响。
[0038]
根据实施例,第一数据集和第二数据集中的至少一个数据集包括描述工业系统的操作故障的故障数据,其中第一数据集和第二数据集中的至少一个数据集包括描述工业系统的标称或正常的操作的标称操作数据。标称操作数据可以指代缺少故障数据的数据。
[0039]
根据实施例,第一数据集包括描述工业系统的标称操作的标称操作数据,并且第二数据集包括描述工业系统的操作故障的故障数据,其中确定数据转换包括在第二数据集中确定描述工业系统的操作故障的故障数据,使得通过对一个或多个第一数据元素和/或对一个或多个另一数据集中的一个或多个另一数据元素应用数据转换,来重现经转换的数据集中的工业系统的操作故障。因此,通过对一个或多个第一数据元素和/或对一个或多个另外中的数据集的一个或多个另一数据元素应用数据转换,工业系统的操作故障可以被添加到一个或多个第一数据元素和/或一个或多个另一数据集中的一个或多个另一数据元素中,例如使得经转换的数据集包括和/或反映工业系统的操作故障。
[0040]
根据本公开的另一方面,提供了一种计算机程序,在该计算机程序由计算机的一个或多个处理器执行时,指示计算机执行生成用于训练人工智能模块的训练数据集的方法的步骤,如上文中和下文中所述。
[0041]
根据本公开的另一方面,提供了一种非暂态计算机可读介质,存储该计算机程序,
在该计算机程序由计算机的一个或多个处理器执行时,指示计算机执行生成用于训练人工智能模块的训练数据集的方法的步骤,如上文中和下文中所述。
[0042]
本公开的另一方面涉及根据如上文中和下文中所描述的生成训练数据集的方法生成的训练数据集在训练可用于监测和/或控制工业系统的人工智能模块中的用途。
[0043]
根据本公开的另一方面,提供了一种训练人工智能模块(ai模块)的计算机实现的方法。该方法包括
[0044]-根据生成用于训练人工智能模块的训练数据集的方法来生成训练数据集,如上文中和下文中所述;以及
[0045]-用所生成的训练数据集来训练ai模块。
[0046]
根据本公开的另一方面,提供了一种计算机,包括ai模块,用于监测和/或控制工业过程,其中该计算机被配置为训练ai模块和/或其中该ai模块根据训练ai模块的方法而被训练,如上文中和下文中所述。
[0047]
本公开的另一方面涉及根据如上文中和下文中所述的训练ai模块的方法训练的ai模块在监测和/或控制工业系统中的用途。
[0048]
本公开的另一方面涉及根据如上文中和下文中所述的训练ai模块的方法训练的具有ai模块的计算机,在监测和/或控制工业系统中的用途。
[0049]
参考本公开的一方面的在上文中和下文中所述的任何特征、功能、步骤和/或元件同样适用于本公开的如上文中和下文中所述的任何其他方面。
[0050]
参考下文中所述的示例性实施例,本公开的这些和其他方面将是明显的并被说明。
附图说明
[0051]
下面将参考附图中示出的示例性实施例更详细地解释本公开的主题,其中:
[0052]
图1示出了根据示例性实施例的具有ai模块的计算机;
[0053]
图2示出了根据示例性实施例说明生成用于训练ai模块的训练数据集的方法的步骤的流程图;
[0054]
图3示出了根据示例性实施例说明训练人工智能模型的方法的步骤的流程图;
[0055]
图4a至图4c根据示例性实施例说明生成用于训练ai模块的训练数据集的方法的步骤;
[0056]
图5示出了根据示例性实施例说明生成用于训练ai模块的训练数据集的方法的步骤的流程图;
[0057]
图6a至图6e根据示例性实施例说明生成用于训练ai模块的训练数据集的方法的步骤;
[0058]
图7a至图7b根据示例性实施例说明生成用于训练ai模块的训练数据集的方法的步骤;
[0059]
图8示出了根据示例性实施例说明生成用于训练ai模块的训练数据集的方法的步骤的流程图;以及
[0060]
图9示出了根据示例性实施例说明生成用于训练ai模块的训练数据集的方法的步骤的流程图。
[0061]
附图仅是示意性的并且不是真实比例。原则上,相同或相似的部分在附图中用相同或相似的附图标记被提供。
具体实施方式
[0062]
图1示出了根据示例性实施例具有人工智能模块10的计算机100。
[0063]
计算机100还包括用于存储数据的数据存储装置102。例如,第一数据集、第二数据集、经转换的数据集、初始训练数据集、训练数据集、一个或多个另一数据集和/或其他数据可以被存储在数据存储装置102上。
[0064]
计算机100还包括处理电路装置104,该处理电路装置104包括用于数据处理的一个或多个处理器105。此外,计算机程序和/或软件指令可以被存储在数据存储装置102中,在该计算机程序和/或软件指令由处理电路装置104执行时,指令计算机100执行根据本公开的生成训练数据集的方法和/或训练ai模块10的方法。
[0065]
一般地,ai模块10可以指代被配置为基于一个或多个输入和/或输入数据来提供分类结果的分类器和/或分类器电路装置10,该输入和/或输入数据诸如例如指示工业系统的操作的数据、测量数据和/或模拟数据。其中,ai模块10可以指代任何类型的人工智能设备和/或电路装置,例如在一个或多个处理器(例如处理器105或其他处理器)和/或数据处理设备上使用和/或运行一个或多个机器学习算法。这种机器学习算法和/或ai模块10可以基于例如逻辑回归、支持向量方法、提升方法、朴素贝叶斯方法、贝叶斯网络、k邻近算法、人工神经网络、卷积神经网络、核密度估计、高斯回归、生成对抗网络、和积网络、对抗神经网络等。
[0066]
计算机100和/或ai模块10可以被配置用于生成训练ai模块10的训练数据集和/或用于训练ai模块10,如上文中和下文中所详细描述的。备选地或附加地,计算机100和/或ai模块10可以被配置为监测和/或控制工业系统。
[0067]
图2示出了根据示例性实施例说明生成用于训练ai模块10的训练数据集的方法的步骤的流程图。
[0068]
步骤s1包括在数据存储器102上提供第一数据集和第二数据集,其中第一数据集包括指示工业系统的第一操作状况的一个或多个第一数据元素,其中第二数据集包括指示工业系统的第二操作状况的一个或多个第二数据元素,其中第一操作状况基本上匹配第二操作状况。
[0069]
步骤s2包括确定用于将第一数据集中的一个或多个第一数据元素转换为第二数据集中的一个或多个第二数据元素的数据转换。
[0070]
步骤s3包括对第一数据集中的一个或多个第一数据元素和/或对一个或多个另一数据集中的一个或多个另一数据元素应用所确定的数据转换,从而生成一个或多个经转换的数据集。
[0071]
步骤s4包括基于一个或多个经转换的数据集中的至少一部分来生成用于训练ai模块10的训练数据集。
[0072]
图3示出了根据示例性实施例说明训练人工智能模型的方法的步骤的流程图,特别是使用根据图2的方法和/或根据本公开的各种方面生成的训练数据集。
[0073]
步骤s1包括生成训练数据集,例如参考图2和/或参考本公开的一个或多个方面所
述。
[0074]
步骤s2包括用所生成的训练数据集来训练ai模块10,例如,至少一个机器学习算法可以被使用用于处理训练数据集,例如以便调整ai模块10的一个或多个权重和/或参数值。备选地或附加地,该训练可以基于有监督学习、半监督学习、无监督学习、深度学习和/或强化学习。
[0075]
图4a至图4c根据示例性实施例说明生成用于训练ai模块10的训练数据集的方法的步骤。
[0076]
在图4a至图4c示出的示例中,包括多个第一数据元素13的第一数据集12与包括多个第二数据元素15的第二数据集14被说明并且互相比较。第一数据集12和第二数据集14对应例如时序数据的等距抽样的数据。
[0077]
第一数据集12对应描述模拟工业系统的操作的模拟数据12,以及第二数据集14对应描述工业系统的实际操作的操作数据14或测量数据14。
[0078]
例如,图4a示出对来自模拟器的等距抽样的第一数据元素13与工业系统操作期间测量或确定的第二数据元素15的比较。模拟器数据、第一数据元素13和/或第一数据集12由于环境影响(例如诸如温度影响),不包括测量噪声或其他噪声效果,并且在第一数据集12上训练的机器学习模型和/或ai模块10可能不能够对在工业系统的操作期间发生的噪声数据执行准确的预测(反之亦然)。
[0079]
图4b说明了第一数据元素13与第二数据元素15的匹配。因为在图4a至图4c的示例中第一和第二数据集12、14是等距抽样的,所以来自第一数据集12的每个数据元素13都可以与来自第二数据集14的数据元素15进行匹配。由图4c中的三角形指示的,这使得例如能够确定、得出和/或学习噪声和/或噪声分布,该噪声和/或噪声分布可以被添加到例如另一模拟器数据、一个或多个另一数据集和/或第一数据集12中,以便更接近地类似第二数据集14。
[0080]
因此,基于对第一数据元素13与第二数据元素15的比较,用于将第一数据元素13转变和/或转换为第二数据元素15的数据转换可以被确定。在对第一数据集12中的数据元素13和/或对一个或多个另一数据集中的一个或多个另一数据元素(诸如另一模拟数据和/或另一操作数据)应用所确定的数据转换时,更接近地类似于第二数据集14的一个或多个经转换的数据集可以被生成。在图4a至图4c中说明的示例中,这种数据转换包括对第一数据集和/或(多个)另一数据集的噪声的添加,使得在(多个)经转换的数据集中反映和/或重现噪声。
[0081]
所确定的数据转换、噪声和/或噪声分布则可以被应用于另一数据集和/或另一数据元素,其可以被用于训练ai模块10,如图4c中所示。因此,与工业系统的真实数据相似的新的序列可以从经学习的噪声分布中抽样,如图4c中所说明。
[0082]
数据转换、噪声和/或数据分布的确定和/或学习可以通过使用ai模块10和/或尤其类似核密度估计、高斯回归和/或对抗神经网络的方法来实现。应当注意图4a至图4c将该确定和/或学习说明为单变量的,但是在大部分情况下其可以是多变量的,例如考虑一些信号并且特别是设定点值并且还有可能如一般天气状况、警报、事件、产生的产品以及更多的非时间序列数据的嵌入(embedding)。
[0083]
在备选的学习方法中,数据转换可能不是通过从模拟中学习原始数据元素13周围
的分布来处理的,而是作为(非概率性)回归问题。
[0084]
一般地,如果第一数据集12和第二数据集14在操作状况(例如第一和第二操作状况)方面上是充分可比较的,以便被一起呈现给机器学习算法和/或ai模块10,则可以是有利的。
[0085]
图5示出了根据示例性实施例说明生成用于训练ai模块10的训练数据集的方法的步骤的流程图。特别地,图5说明了以下过程,寻找合适的数据集12、14,确定数据转换(或学习数据转换),借助另一模拟数据的帮助生成附加的训练数据或经转换的数据集,转换另一模拟的数据,训练例如用于工业系统的预测、监测和/或控制的ai模块10和/或机器学习模型,以及使用经训练的ai模块10和/或应用机器学习模型。
[0086]
例如,在步骤s1中稳定状态可以在例如第一数据集12和/或第二数据集14的数据集中被搜索到,以及在步骤s2中可以可选地应用算子(operator)改变。此外,在步骤s3中可以匹配第一与第二数据集12、14和/或数据元素13、15。例如,模拟数据12可以被生成用于匹配工业系统的稳定状态(在图5中说明为工厂)。可选地,在步骤s4中算子改变可以被应用于第二数据集。此外,在步骤s5中基于第一和第二数据集12、14来生成转换样本(例如在图4a至4c中所说明),以及可以被存储在数据存储装置102中。在步骤s6,从所存储的转换样例中,该转换样本可以对应于匹配第一与第二数据集12、14和/或匹配第一与第二数据元素13、15,数据转换可以被得出,例如使用ai模块10学习。此外,在步骤s7中,附加的模拟数据,即另一(多个)数据集可以被生成,并且被存储在数据存储装置102中。在步骤s6中确定的数据转换则可以在步骤s8中被应用于这些附加的模拟数据或另一数据集以生成经转换的数据和/或经转换的(多个)数据集,以及以生成训练数据集,例如基于组合多个经转换的数据集。使用训练数据集,在步骤s9中用于监测和/或控制工业系统的ai模块10可以被训练。此外,在步骤10中经训练的ai模块10则可以被用于监测、控制和/或预测工业系统的行为。
[0087]
应当注意,虽然在图4a至图5的示例中第一数据集12对应于模拟数据,但该过程也可以被颠倒以将操作数据转换为类似模拟器数据以及将经转换的数据提供给可以(主要的)在模拟器数据上被训练的ai模块10和/或机器学习模型。
[0088]
此外,在图5中说明的方法也可以在学习如何将数据从不同的工业系统时被应用,例如从诸如小规模实验工厂的工厂a,转换到诸如大规模生产工厂的工厂b,。
[0089]
图6a至图6e说明了根据示例性实施例生成用于训练ai模块10的训练数据集的方法的步骤。特别地,图6a至图6c图示本公开的示例性用例以用于在工业系统中实现针对泄漏检测的数据驱动流量指示器。图6a至图6e各自图示出了数据元素的快速傅里叶变换的幅度作为以任意单位频率的函数。
[0090]
流量测量可以是控制和/或监测工业系统或工厂的操作的重要组件。因为流量引起的振动信号可以与体积流速有关,所以振动数据可以被充分利用以开发用于泄漏检测的数据驱动流量指示器。
[0091]
为了开发这种流量指示器,例如可以使用处理模拟器或试验装置来收集例如初始训练数据集的训练数据,其中传感器可以被安装在沿着试验装置管道的感兴趣的不同位置。通过运行控制试验,系统可以被运行在例如“不中断地流动”和“有泄漏地流动”的不同状态中。给定不同的流量状态,可以例如基于将原始振动数据的快速傅里叶变换(fft)映射到这些状态来训练分类模型和/或ai模块10。
[0092]
针对数据驱动的流量检测器,其成功可以取决于其在现实世界设置中的相关性。因此,ai模块10具有高的泛化能力可以是有利的,因为即使在数据驱动的流量检测器没有被暴露在训练数据集或初始训练数据集中的情况下,其也能够可靠地检测流量。然而,使用过程模拟器或试验装置完成的试验可以不包括测量噪声或其他归因于环境影响的噪声效果,诸如例如归因于在工业系统中运行的附加泵的频率的激励。
[0093]
例如,图6a示出了显示不中断流量的在试验装置处完成的试验的试验数据的fft。图6b示出了在工业系统的操作期间操作或现实数据的fft。如可以看见的,图6a中示出的试验数据的fft的幅度小于图6b中的幅度。附加地,图6b中示出的操作或现实数据的fft中出现附加数据元素和/或附加频率20。
[0094]
针对图6a和图6b,针对试验装置与现实工厂的系统配置被设置为相同的,差异在于现实设置包括附加泵操作,该附加泵操作导致附加频率20。通过看这些附图,可以观察到两个附图中相同的频率都被激发,然而,图6b的现实工厂数据具有一些附加的频率20的激励并且具有大约两倍的幅度。因此,在图6a中示出的来自试验装置的数据上训练的机器学习模型和/或ai模块10可能无法在给出的图6b中示出的现实含噪声的工厂上执行的很好。
[0095]
虽然有可能在模拟中以及在试验装置处进行多个控制试验,但是在现实工厂或工业系统处进行相似的试验可以造成包括成本、安全性和资源的某些限制。实际地,即使给出机会,非常有限数目的试验可以在现实工厂或工业系统处进行。通过控制试验,在现实或操作数据与人造的或模拟的数据之间的数据序列、数据集和/或数据元素可以更容易的被匹配。
[0096]
然而,根据本公开,在这种不同数据集之间的数据转换可以被确定。数据转换则可以被应用于一个或多个另一数据集以加强用于训练机器学习模型和/或ai模块10的初始训练数据集。该过程在图6c至图6e中被绘出。
[0097]
特别地,图6c示出了来自与图6a中所绘的试验相似的模拟试验的模拟数据。其中,图6c中的数据所示对应于第一数据集12。此外,图6d示出了具有附加数据元素或频率20的工业系统的操作数据或测量数据,该附加数据元素或频率20可以被当做本公开上下文中的噪声或噪声效果。其中,图6d中所示出的数据可以对应于第二数据集14。基于第一数据集12与第二数据集14的比较,可以包括导致图6d中所示出的频率20的附加的噪声或噪声效果的数据转换可以被确定。所确定的数据转换则可以被应用于第一数据集12和/或另一数据集以生成如图6e中示例性示出的一个或多个经转换的数据集,其中由于数据转换的应用,附加数据元素或频率20被重现、反映和/或包括。输出的经加强或经转换的数据集则可以被用于生成训练数据集以训练可能具有更高泛化能力以及因此更好地适用于实际工厂或工业系统的机器学习模型和/或ai模块10。
[0098]
图7a和图7b根据示例性实施例说明生成用于训练ai模块的训练数据集的方法的步骤。特别地,图7a和图7b说明了本公开的示例性用例用于加强和/或丰富故障数据。图7a和图7b的每个图示出了数据元素的信号的幅度作为以任意单位时间的函数。
[0099]
图7a中所示出的第一数据集12可以指代来自工业系统的运作良好的或标称操作的标称操作数据。图7b中所示出的第二数据集14可以指代或包括存在故障或过程异常的故障数据。通常,这种异常的(即有故障的)事件或数据是缺乏的。然而,这种数据可以根据本公开被生成。
[0100]
例如,使用无故障的数据集的特性,数据集的一个或多个有故障的片段或分段可以被转换,反之亦然。为了生成无故障的数据元素,可以使用例如经验分布、核密度估计和/或生成模型(诸如例如生成对抗网络、变分自动编码器)来估计无故障的数据集的分布。这样,数据转换可以被得出。随后,该分布估计和/或数据转换可以被用于(例如与现存有故障的数据元素或数据集结合)生成新的有故障的数据元素或数据集。例如,可以通过估计无故障的数据时间序列12中的每个点或数据元素周围的标准差22来完成,随后对在正负两个标准差22的范围内(大约数据的95%)的有故障的数据时间序列或数据集14的平均数周围的点和数据元素进行采样。这可以假定有故障的数据集14具有大约和无故障的数据集12大约相同的方差,但是以不同的值为中心。
[0101]
图8示出了根据示例性实施例说明生成用于训练ai模块10的训练数据集的方法的步骤的流程图。
[0102]
在图8中,x
1,...,m
指示不同的故障模式和/或故障场景,以及n是来自每个模式的示例、数据元素和/或数据集的数目。图8中的粗箭头指向更复杂的示例、数据元素和/或数据集的生成。
[0103]
例如关于机器学习阶段,图8说明了模型训练和/或ai模块10的训练,以及经转换的(多个)数据集和/或(多个)训练数据集的生成。在图8中,x(和y或k)可以指代数据标签,使得x
1,...,m
可以指示不同的故障模式以及y或k指示正常数据。给定输入数据,该模型和/或ai模块10可以预测标签x和y或k的概率。
[0104]
在此情况下,被用于学习将被转换为有故障的数据的分布的正常数据可以优选地匹配有故障的数据的操作状况以正确的捕获分布。这可以通过基于操作状况(如每分钟转数或通常用于转动设备的功率消耗)或处理状况(如流量、温度或压力)的接近度来选择的数据来实现。
[0105]
在图8的步骤s1中,例如具有多个操作模式的无故障的传感器数据可以被确定。传感器数据可以被用作第一和/或第二数据集。在步骤s2中,可以基于例如通过核密度估计来确定数据转换。在步骤s3中数据转换可以被应用于图8中由x
n,m
指示的有故障的示例、数据元素和或数据集,以便生成图8中由带读音符号~的x
n,m
指示的经转换的数据集。
[0106]
图9示出了根据示例性实施例说明生成用于训练ai模块10的训练数据集的方法的步骤的流程图。
[0107]
在步骤s1中,例如第一数据集12的一个或多个数据集针对感兴趣的数据元素和/或序列被搜索到。因为某个数据特性,诸如例如过程值、设置点的改变、针对资产(如泵)的某个负载情况,和/或外部原因(诸如例如像管道泄漏的故障的存在),数据元素和/或序列可以是令人感兴趣的。如果对应的第二数据集14存在或第二数据集14可以由模拟和/或试验生成,则这可以被检查到。在步骤s2中模仿在第一数据集12中找到的序列中存在的配置和/或序列的第二数据集14可以被生成。如果第二数据集14例如仅是历史数据集并且新数据不能由模拟和/或试验来生成,则在步骤s2’中的第二数据集14中可以搜索相似的序列。
[0108]
在下一步骤s3中,初步训练数据集可以被生成,在步骤s4中该初步训练数据集可以被用于确定和/或学习用于将第一数据集12的数据元素转换为第二数据集14的数据元素的数据转换,反之亦然。例如,来自第一和第二数据集12、14的数据元素可以被与例如来自数据集中的一个数据集的预测器序列以及来自另一数据集的标签序列进行匹配。
[0109]
使用该初步训练数据集,机器学习算法和/或ai模块10可以被训练以执行数据转换,例如通过借助高斯回归、核密度估计、和积网络或生成对抗网络学习概率分布p(a|b),或通过简单地学习回归函数将值从一个数据集映射到其他数据集。
[0110]
在步骤s5中一旦数据转换被学习和/或确定,一个或多个经转换的数据集可以被生成以及例如被合并到训练数据集。备选地,在步骤s5’中来自第一或第二数据集12、14中的一个数据集的数据元素可以被转换而不匹配第一和第二数据集12、14中的另一数据集中的序列,以便在步骤s6中创建用于在步骤s7中训练针对主要的机器学习任务(诸如例如机器学习模型用于预测性维护、过程监测、时间序列预测等)的ai模块10(组合的)的训练数据集。
[0111]
虽然已经在附图和前文描述中详细说明和描述了本发明,但这种说明和描述应被认为是说明性或示例性的而不是限制性的;本发明不限于所公开的实施例。所公开实施例的其他变形可以由本领域技术人员理解和实现以及通过研究附图、本公开以及所附权利要求来实践所要求保护的发明。
[0112]
在权利要求中,词语“包括”不排除其他元素或步骤,并且不定冠词“一”或“一个”不排除多个。在互不相同的从属权利要求中叙述某些措施的事实并不表示不能有利地使用这些措施的组合。权利要求中的任何附图标记不应当被解释为对范围的限制。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献