一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于工业数据处理的方法、装置和机器可读存储介质与流程

2022-05-17 20:24:53 来源:中国专利 TAG:


1.本说明书的实施例涉及工业领域,并且具体地,涉及用于工业数据处理的方法、装置、计算设备和机器可读存储介质。


背景技术:

2.近年来,随着人工智能领域的研究越来越深入,作为其主要研究方向之一的机器学习技术也得以快速发展。目前,机器学习技术已经应用于各个领域并且表现出优越的性能。因此,期望的是,能够将机器学习技术应用于现代工业系统,以促进工业系统的智能化发展。
3.然而,由于在工业领域中相对薄弱的数字化基础以及相对专业的技术知识等各种因素,导致机器学习在工业领域中的应用面临着极大的挑战。


技术实现要素:

4.考虑到现有技术的上述问题,本说明书的实施例提供了用于工业数据处理的方法、装置、计算设备和机器可读存储介质。
5.一方面,本说明书的实施例提供了一种用于工业数据处理的方法,包括针对在工业过程中发生过的警报,执行以下数据标注过程:确定所述警报对应的标签值;基于所述警报的历史发生时间,获取在所述工业过程中产生的历史数据集,其中,所述历史数据集包括与所述警报的发生相关联的过程观测变量值;以及基于所述标签值和所述历史数据集,生成用于机器学习的标注数据集。
6.该实施例中能够高效地实现对工业数据的标注,极大地增强工业领域的数字化基础,从而有效地促进机器学习技术在工业领域中的应用。
7.在一个实施例中,确定所述警报对应的标签值,包括:从预先确定的标签数据中获取所述警报对应的标签值,其中,所述标签数据包括在所述工业过程中发生过的至少一种警报对应的标签值,每种警报对应的标签值是不相同的。
8.在该实施例中,每种警报可以通过其标签值来唯一地标识,使得在标注数据集中能够清楚地区分开各种警报,有利于后续的机器学习。
9.在一个实施例中,所述标签数据是通过如下方式来确定的:从警报管理数据库中获取历史警报信息,其中,所述历史警报信息是在警报管理生命周期的合理化阶段处理之后得到的警报信息,所述历史警报信息用于指示所述至少一种警报;以及针对所述至少一种警报进行编码,以得到所述标签数据。
10.在该实施例中,合理化阶段可以用于识别出满足在警报指导原则中阐述的要求的警报。因此,历史警报信息可以被认为是可信警报信息,其能够可靠地指示在工业过程中发生过的至少一种警报,从而能够增强标注数据集的置信度,进而提升后续机器学习训练的可靠性。
11.在一个实施例中,针对所述至少一种警报进行编码包括:针对所述至少一种警报
进行独热编码。
12.在该实施例中,通过独热编码方式来得到各种警报对应的标签值,能够使得标签值的分布更为合理,从而更加适于机器学习领域。
13.在一个实施例中,所述历史数据集包括在所述警报发生的预设时间段内的过程观测变量值,所述预设时间段的结束时间点是所述警报被确认的时间点。
14.在该实施例中,由于在警报被确认之前的预设时间段内的过程观测变量值通常可以包含能够反映该警报的特征信息,因此,选择该时间段内的过程观测变量值将有利于后续的机器学习训练。
15.在一个实施例中,所述预设时间段是在过程警报响应时间线上的在所述警报被确认的时间点之前的过程响应时间。
16.在该实施例中,过程响应时间内的过程观测变量值实际上能够反映出要发生警报的特征,因此,该时间段内的过程观测变量值对于机器学习是有用的。
17.在一个实施例中,基于所述标签值和所述历史数据集,生成标注数据集,包括:将所述标签值与所述历史数据集进行关联,以生成所述标注数据集。
18.该实施例能够以简单高效的方式实现对工业数据的标注。
19.在一个实施例中,所述方法还包括:针对所述警报,执行以下数据样本生成过程:针对所述警报的每个历史发生时间,重复所述数据标注过程,以得到针对所述警报的每个历史发生时间的标注数据集;以及生成针对所述警报的数据样本,其中,所述数据样本包括针对所述警报的每个历史发生时间的标注数据集。
20.在该实施例中,将针对在不同时间处发生的警报来获取相应的标注数据集,进而形成针对这种警报的数据样本,这样的数据样本能够全面地反映与警报相关联的特征信息。
21.在一个实施例中,所述方法还包括:针对在所述工业过程中发生过的每种警报,执行所述数据样本生成过程,以得到针对每种警报的数据样本;以及生成训练样本,其中,所述训练样本包括针对每种警报的数据样本,所述训练样本用于训练与警报管理相关联的机器学习模型。
22.在该实施例中,能够有效地得到可在工业领域中应用的训练样本,从而能够促进机器学习技术在工业领域中的应用。
23.另一方面,本说明书的实施例提供了一种用于工业数据处理的装置,包括针对在工业过程中发生过的警报来执行数据标注过程的以下单元:确定单元,用于确定所述警报对应的标签值;数据获取单元,用于基于所述警报的历史发生时间,获取在所述工业过程中产生的历史数据集,其中,所述历史数据集包括与所述警报的发生相关联的过程观测变量值;以及标注单元,用于基于所述标签值和所述历史数据集,生成用于机器学习的标注数据集。
24.在一个实施例中,所述确定单元进一步用于:从预先确定的标签数据中获取所述警报对应的标签值,其中,所述标签数据包括在所述工业过程中发生过的至少一种警报对应的标签值,每种警报对应的标签值是不相同的。
25.在一个实施例中,所述装置还包括:信息获取单元,用于从警报管理数据库中获取历史警报信息,其中,所述历史警报信息是在警报管理生命周期的合理化阶段处理之后得
到的警报信息,所述历史警报信息用于指示所述至少一种警报;以及编码单元,用于针对所述至少一种警报进行编码,以得到所述标签数据。
26.在一个实施例中,所述编码单元进一步用于:针对所述至少一种警报进行独热编码。
27.在一个实施例中,所述历史数据集包括在所述警报发生的预设时间段内的过程观测变量值,所述预设时间段的结束时间点是所述警报被确认的时间点。
28.在一个实施例中,所述预设时间段是在过程警报响应时间线上的在所述警报被确认的时间点之前的过程响应时间。
29.在一个实施例中,所述标注单元进一步用于:将所述标签值与所述历史数据集进行关联,以生成所述标注数据集。
30.在一个实施例中,所述装置还包括样本生成单元;其中,所述确定单元、所述数据获取单元、所述标注单元和所述样本生成单元用于通过如下方式来执行数据样本生成过程:所述确定单元、所述数据获取单元和所述标注单元用于针对所述警报的每个历史发生时间,重复所述数据标注过程,以得到针对所述警报的每个历史发生时间的标注数据集;所述样本生成单元,用于生成针对所述警报的数据样本,其中,所述数据样本包括针对所述警报的每个历史发生时间的标注数据集。
31.在一个实施例中,所述确定单元、所述数据获取单元、所述标注单元和所述样本生成单元用于针对在所述工业过程中发生过的每种警报,执行所述数据样本生成过程,以得到针对每种警报的数据样本;以及所述样本生成单元进一步用于生成训练样本,其中,所述训练样本包括针对每种警报的数据样本,所述训练样本用于训练与警报管理相关联的机器学习模型。
32.另一方面,本说明书的实施例提供了一种计算设备,包括:至少一个处理器;与所述至少一个处理器进行通信的存储器,其上存储有可执行代码,所述可执行代码在被所述至少一个处理器执行时使得所述至少一个处理器实现上述方法。
33.另一方面,本说明书的实施例提供了一种机器可读存储介质,其存储有可执行代码,所述可执行代码在被执行时使得机器执行上述方法。
附图说明
34.通过结合附图对本说明书的实施例的更详细的描述,本说明书的实施例的上述以及其它目的、特征和优势将变得更加明显,其中,在本说明书的实施例中,相同的附图标记通常代表相同的元素。
35.图1是根据一个实施例的用于工业数据处理的方法的示意性流程图。
36.图2是根据一个实施例的用于训练样本生成的过程的示意性流程图。
37.图3进一步示出了图2中的数据样本生成过程的示意性流程图。
38.图4进一步示出了图3中的数据标注过程的示意性流程图。
39.图5是根据一个实施例的用于工业数据处理的示例性图示。
40.图6是根据一个实施例的用于工业数据处理的装置的示意性框图。
41.图7是根据一个实施例的用于工业数据处理的计算设备的硬件结构图。
42.附图标记列表:
43.102:确定警报对应的标签值
44.104:获取在工业过程中产生的历史数据集
45.106:基于标签值和历史数据集,生成用于机器学习的标注数据集
46.200:训练样本生成过程
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
300:数据样本生成过程
47.202:训练样本生成步骤
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
400:数据标注过程
48.302:数据样本生成步骤
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
402:标签值确定步骤
49.404:数据集获取步骤
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
406:标注步骤
50.500a:过程警报响应时间线
51.(1):正常运行
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2):警报未被确认
52.(3):警报被确认
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4):允许响应时间
53.(5):确认延迟
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6):操作员响应延迟
54.(7):过程响应时间
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8):过程响应时间
55.500b:警报管理生命周期
56.502:指导原则
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
504:识别
57.506:合理化
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
508:详细设计
58.510:实施
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
512:操作
59.514:维护
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
516:监测和评估
60.518:变更管理
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
520:审查
61.500c:工业数据标注的示例
62.600:装置
63.602:确定单元
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
604:数据获取单元
64.606:标注单元
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
608:信息获取单元
65.610:编码单元
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
612:样本生成单元
66.700:计算设备
67.702:处理器
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
704:存储器
68.706:通信接口
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
708:总线
具体实施方式
69.现在将参考各个实施例讨论本文描述的主题。应当理解的是,讨论这些实施例仅是为了使得本领域技术人员能够更好地理解并且实现本文描述的主题,并非是对权利要求书中所阐述的保护范围、适用性或者示例的限制。可以在不脱离权利要求书的保护范围的情况下,对所讨论的元素的功能和排列进行改变。各个实施例可以根据需要,省略、替换或者添加各种过程或组件。
70.如本文中使用的,术语“包括”以及其变型表示开放的术语,含义是“包括但不限于”。术语“基于”表示“至少部分地基于”。术语“一个实施例”和“一实施例”表示“至少一个实施例”。术语“另一个实施例”表示“至少一个其它实施例”。术语“第一”、“第二”等可以指代不同的或相同的对象。下面可以包括其它的定义,无论是明确的还是隐含的,除非上下文中明确地指明,否则一个术语的定义在整个说明书中是一致的。
71.目前,机器学习技术可以被认为是促进工业领域数字化的主要驱动力之一。机器
学习技术通常可以包括有监督学习和无监督学习。在有监督学习中,训练样本通常是带有标签的数据。有监督学习通常可以包括分类和回归两类任务。在无监督学习中,训练样本是不包含标签的数据。无监督学习通常可以包括聚类和降维两类任务。
72.如今,基于机器学习的各种处理方法已经广泛应用于工业领域,比如预测性维护和故障诊断。预测性维护通常可以被认为是分类或回归任务,而故障诊断可以被认为是分类任务。这些任务可以通过有监督学习模型来实现。然而,如前所述,有监督学习模型一般是通过带有标签的数据来训练的,而工业过程中产生的数据通常是不带标签的数据。因此,为了在工业领域中应用有监督学习技术,需要对工业数据进行标注。如今,工业数据的标注主要依赖于人工完成。然而,在很多情况下,工业数据的复杂性导致人工标注通常是不现实的。例如,对于大量的传感器数据,即使是专家,也可能难以直接分辨出要标注的异常数据。
73.鉴于此,本文的实施例提供了用于工业数据处理的技术方案。在该技术方案中,基于在工业过程中发生过的警报的相关信息以及与该警报相关联的历史过程数据,生成用于机器学习的标注数据集。由此,能够高效地实现对工业数据的标注,进而实现对工业领域的机器学习模型的训练。可见,本文的技术方案能够有效地增强工业领域的数字化基础,使得在工业领域(尤其是过程工业)中应用机器学习技术更加可行,进而推动工业数字化的加速发展。
74.下面将结合附图来详细地描述各个具体实施例。
75.图1是根据一个实施例的用于工业数据处理的方法的示意性流程图。例如,图1的方法可以包括针对在工业过程中发生过的警报,执行数据标注过程,其包括以下步骤102、104和106。
76.如图1所示,在步骤102中,可以确定警报对应的标签值。
77.例如,通过该标签值可以唯一地标识该警报。
78.在步骤104中,可以基于警报的历史发生时间,获取在工业过程中产生的历史数据集。
79.历史数据集可以包括与警报的发生相关联的过程观测变量值。
80.在步骤106中,可以基于标签值和历史数据集,生成用于机器学习的标注数据集。
81.从上述可知,在该实施例中,可以确定工业过程中发生过的警报对应的标签值,并且获取与警报相关联的历史数据集,进而基于标签值和历史数据集来生成用于机器学习的标注数据集。由此,能够高效地实现对工业数据的标注,极大地增强工业领域的数字化基础,从而有效地促进机器学习技术在工业领域中的应用。
82.在本文中,工业过程可以包括各种现有的工业过程以及未来可能出现的新的工业过程,本文对此不作限定。
83.另外,本文中提到的警报可以包括在工业过程中可能发生的任何警报,在不同的工业过程中,警报的形式可能也是不同的。但是,本文对此不作限定。
84.在一个实施例中,在步骤102中,可以从预先确定的标签数据中获得警报对应的标签值。标签数据可以包括在工业过程中发生过的至少一种警报对应的标签值。此处,不同警报对应的标签值是不相同的,这样,每种警报可以通过其标签值来唯一地标识,使得在标注数据集中能够清楚地区分开各种警报。
85.在本文中,标签数据可以通过各种适用的方式来获得。例如,在一个实施例中,可
以从警报管理数据库中获取历史警报信息。历史警报信息可以用于指示在工业过程中发生过的至少一种警报。然后,可以针对至少一种警报进行编码,从而得到标签数据。
86.应当理解的是,此处至少一种警报可以表示至少一种类型的警报。各种类型的警报可以具有对应的唯一标签值,从而能够将各种类型的警报区分开。
87.另外,还应明白的是,在工业过程中,每种类型的警报可能发生不止一次。对于每次发生的警报,通常可以通过标签值以及其具体发生时间来区分。
88.例如,可以通过各种适用的工业通信协议来从警报管理系统的警报管理数据库中获得历史警报信息。比如,工业通信协议可以包括用于过程控制的ole(ole for process control,opc)警报与事件、opc统一架构(unified architecture,ua)警报与条件等各种协议。此处,ole可以指代对象链接和嵌入(object linking and embedding)。
89.警报管理系统可以遵循国际仪器、系统和自动化协会(instrument,system and automation,isa)颁布的isa-18.2标准中规定的警报管理生命周期。在警报管理生命周期中,合理化阶段可以用于识别出满足在警报指导原则中阐述的要求的警报。
90.此处,历史警报信息可以是通过合理化阶段处理而得到的警报信息,因此,历史警报信息可以被认为是可信警报信息,其能够可靠地指示在工业过程中发生过的至少一种警报,从而能够增强标注数据集的置信度,进而提升后续机器学习训练的可靠性。
91.然后,标签数据可以通过各种适用的编码方式来得到。例如,可以针对至少一种警报进行独热编码(one-hot coding),来得到各种警报对应的标签值。
92.独热编码也可以被称为一位有效编码,其可以被理解为通过n位状态寄存器来对n个状态进行编码,每个状态都有其独立的寄存器位,并且在任何时候,仅有一位是有效的。这种编码方式适合处理离散型特征,使用独热编码,将离散特征的取值扩展到了欧式空间,从而使得特征之间的距离计算更加合理。在本文中,可以认为各种警报属于离散型特征,因此通过独热编码方式来得到各种警报对应的标签值,能够使得标签值的分布更为合理,从而更加适于机器学习领域。
93.当然,在本文的技术方案中,还可以采用其它编码方式来得到各种警报对应的标签值,本文对此不作限定。
94.在一个实施例中,在步骤104中,可以首先确定警报的历史发生时间。例如,警报的历史发生时间可以是从警报管理数据库中获得的。比如,在一种情况下,历史警报信息可以包含警报的发生时间戳(例如,警报被确认的时间点)。
95.然后,可以基于警报的历史发生时间,从生产过程数据库中获取在工业过程中产生的历史数据集。例如,可以通过各种适用的工业通信协议来从生产过程数据库中获取历史数据集。比如,工业通信协议可以包括opc警报与事件、opc ua警报与条件等各种协议。
96.历史数据集可以是与警报的发生相关联的。例如,历史数据集可以包括在警报发生的预设时间段内的过程观测变量值。该预设时间段的结束时间点可以是警报被确认的时间点。也就是说,该预设时间段可以是从警报被确认的时间点向前追溯的某个时间段。该预设时间段可以是根据实际的工业过程、经验、需求等各种因素来设定的。
97.通常,在警报被确认之前,过程观测变量值可能已经发生变化,但是由于过程响应通常会滞后,因此在警报被确认时可能已经经历了一段时间。这样,该时间段内的过程观测变量值通常可能包含某些特征信息,其暗示将发生警报。因此,该时间段内的过程观测变量
值可以用于进行后续的机器学习。
98.本文中,过程观测变量值可以是指在工业过程中过程观测变量随着时间而产生的各个值。
99.在一个实施例中,上述预设时间段可以是在过程警报响应时间线上的在警报被确认的时间点之前的过程响应时间(process deadtime)。例如,过程警报响应时间线可以遵循isa-18.2标准。
100.根据isa-18.2标准,过程响应时间可以是从警报被确认的时间点向前追溯的某个时间段。因此,过程响应时间内的过程观测变量值实际上能够反映出要发生警报的特征。
101.应当理解的是,针对不同的工业过程,过程响应时间的具体取值是不同的,本文对此不作限定。
102.在得到标签值和历史数据集之后,可以生成标注数据集。标注数据集可以采用在机器学习领域中各种适用的方式来生成。例如,在一个实施例中,在步骤106中,可以将标签值和历史数据集进行关联,来生成标注数据集。关于两者的关联方式,可以采用机器学习领域中的任何适用的方式,本文对此不作限定。比如,可以通过两个文件来分别存储标签值和历史数据集,但是通过某项信息将这两者进行关联,从而整体形成标注数据集。这样,能够简单高效地实现对工业数据的标注。
103.如前所述,每种类型的警报在工业过程的运行期间可能发生多次。每次发生的警报可以通过标签值和其发生时间来标识。
104.因此,在一个实施例中,前述的步骤102-106可以看作是针对警报的单次发生而进行的数据标注过程。在一些情况下,警报可能多次发生。因此,对于某种警报而言,可以针对这种警报的每次发生来重复前述的步骤102-106,从而得到针对这种警报的不同发生时间的标注数据集,进而形成针对这种警报的数据样本。
105.具体地,可以针对警报的每个历史发生时间,重复上述数据标注过程,从而得到针对这种警报的每个历史发生时间的标注数据集。然后,可以生成针对这种警报的数据样本。数据样本可以包括针对这种警报的每个历史发生时间的标注数据集。为了下文便于描述,可以将这种数据样本的生成过程简单称为数据样本生成过程。
106.在一些情况下,也可以根据实际需求来指定某个时间段,这样可以针对警报在该指定的时间段内的多次发生,生成数据样本。例如,该指定的一段时间可以是一周、一个月、三个月、一年等等,其可以根据实际需求等各种因素来设定。这样,可以灵活地满足各种需求,比如针对数据样本的数据量限制。
107.还可以理解的是,在工业过程中可能涉及各种类型的警报。因此,在一个实施例中,还可以针对在工业过程中发生的各种类型的警报来生成数据样本,从而得到最终的训练样本。如前所述,在一些情况下,可以针对指定的时间段来生成这样的训练样本。
108.具体地,可以针对工业过程中发生过的每种警报,执行前述数据样本生成过程,以得到针对每种警报的数据样本。然后,可以生成训练样本,训练样本可以包括针对每种警报的数据样本。训练样本可以用来训练与警报管理相关联的机器学习模型,例如,前述的预测性维护模型或故障诊断模型等。该机器学习模型可以属于有监督学习模型。在完成训练之后,这样的机器学习模型可以用于预测工业过程中的警报或故障等,由此可以提前进行相应的维护或修复工作,从而能够提高工业过程的效率和安全性。
109.为了便于理解,下面结合具体示例进行描述。应当明白的是,以下示例仅是为了帮助本领域技术人员更好地理解本文的技术方案,而并不对该技术方案的范围进行限制。
110.图2是根据一个实施例的用于训练样本生成的过程的示意性流程图。
111.如前所述,用于机器学习的训练样本可以包括针对在工业过程中发生过的各种警报的数据样本。如上提到的,在一些情况下,训练样本可以是针对工业过程在指定的时间段内的过程观测数据来得到的,这样可以将训练样本的数据量控制在期望的范围内或者用于其它目的,本文对此不作限制。
112.例如,用于训练样本生成的过程200可以包括针对各种警报的数据样本生成过程300和训练样本生成步骤202。在训练样本生成步骤202中,可以生成包括针对各种警报的数据样本的训练样本。
113.图3进一步示出了图2中的数据样本生成过程300的示意性流程图。
114.在针对每种警报的数据样本生成过程300中,可以针对这种警报的每个历史发生时间,重复数据标注过程400。然后,数据样本生成过程300可以包括数据样本生成步骤302。在数据样本生成步骤302中,可以生成数据样本,其包括针对每种警报的不同历史发生时间的标注数据集。
115.图4进一步示出了图3中的数据标注过程400的示意性流程图。
116.对于数据标注过程400,其可以包括标签值确定步骤402、数据集获取步骤404和标注步骤406。步骤402、404和406的具体实现方式可以参照上面关于图1中描述的步骤102、104和106的描述,此处不再赘述。
117.图5是根据一个实施例的用于工业数据处理的示例性图示。图5的示例可以是基于isa-18.2标准来描述的。然而,应当明白的是,本文的技术方案还可以遵循其它适用的工业标准,并不限于本文举例说明的isa-18.2标准。
118.在图5中,方框500a示出了过程警报响应时间线,方框500b示出了警报管理生命周期,方框500c示出了工业数据标注的一个具体示例。
119.方框500b可以是根据isa-18.2标准的警报管理生命周期,其适用于各种工业过程,因此,此处将进行简单的描述。
120.如方框500b所示,整个警报管理生命周期可以包括:建立警报指导原则阶段502;警报识别阶段504;警报合理化阶段506;详细设计阶段508;实施阶段510;操作阶段512;维护阶段514;监测和评估阶段516;变更管理阶段518;审查阶段520。
121.在警报合理化阶段506中,可以确保警报满足在阶段502中建立的指导原则,该阶段一般可以包括优先化、分类、设置确定和文档编制等任务。可见,经过警报合理化阶段处理之后的警报信息可以被认为是可信警报信息。
122.在方框500a中示出的过程警报响应时间线可以遵循isa-18.2标准,因此,此处将简单地描述该时间线上的各个过程。
123.如方框500a所示,在过程警报响应时间线上,纵轴可以表示过程观测,横轴可以表示时间,其中,线段(9)可以表示过程观测随着时间的变化情况。
124.在整个时间线上,通常可以包括三个部分,第一部分(1)可以表示工业过程正常运行,第二部分(2)可以表示警报未被确认,第三部分(3)可以表示警报被确认。
125.具体地,在方框500a中,还示出了警报阈值和结果阈值。当过程观测数据超过警报
阈值时,可以表明已经产生了警报。但是,过程对警报的响应通常需要一定的时间。例如,时间段(4)可以表示允许响应时间,其中,时间段(5)可以表示确认延迟,时间段(6)可以表示操作员响应延迟。此外,时间段(7)可以表示在操作员采取相应的动作之后的过程响应时间(process deadtime)。
126.时间段(8)可以表示在警报被确认之前的过程响应时间(process deadtime)。可以从方框500a中看出,时间段(8)的结束时间点为警报被确认的时间点。
127.通常,在过程观测数据被确认之前,过程观测数据可能已经包含着与警报相关联的某些特征信息,其对于预测警报或故障等是有用的。因此,在本文中,可以选择在警报被确认之前的过程响应时间(即时间段(8))内的过程观测数据作为待标注的数据集。
128.为了更加容易理解,下面结合方框500c的示例进行描述。
129.在方框500c中,示出了关于工业数据标注的一个具体示例。如方框500c所示,可以从警报管理系统的警报管理数据库中获取历史警报信息。此处,假设历史警报信息指示在工业过程中发生过的三种警报。然后,可以通过独热编码方式来得到标签数据,此处假设标签数据可以包括三种警报对应的标签值,其可以由如下的方式来表示:
[0130][0131]
其中,第一列的值(即100)可以表示第一警报,第二列的值(即010)可以表示第二警报,第三列的值(即001)可以表示第三警报。应理解的是,此处将标签数据表示为矩阵形式仅是为了便于说明,在实践中,标签数据可以采用各种适用的表示形式,本文对此不作限定。
[0132]
可以假设基于方框500a所示的时间线得到过程观测的原始数据集,其可以包括随着时间变化的过程观测变量值。在该示例中,假设该原始数据集可以由如下的矩阵来表示:
[0133][0134]
其中,该矩阵的第一行可以表示过程观测变量x1随着时间t1、t2、
……
tm、
……
的过程观测变量值;第二行可以表示过程观测变量x2随着时间t1、t2、
……
tm、
……
的过程观测变量值;其它行也是类似的,此处不再赘述。
[0135]
下面以针对第一警报的数据标注为例进行说明。
[0136]
可以基于第一警报的某个历史发生时间,从过程数据库中获取在第一警报被确认之前的过程响应时间(例如,时间段(8))内的过程观测变量值。例如,历史警报信息可以包括第一警报的历史发生时间。
[0137]
例如,在方框500c的示例中,可以从上述的原始数据集中获取在时间段(8)内的过程观测变量值,此处假设在时间段内的过程观测变量值可以由如下的矩阵表示:
[0138][0139]
然后,可以将第一警报对应的标签值与在时间段(8)内的过程观测变量值进行关联,从而形成与第一警报的该次发生相关联的标注数据集。
[0140]
应当理解的是,上述关于具体矩阵的描述仅是举例说明,并不限制本文的技术方案的范围。
[0141]
在一些情况下,在工业过程中每种警报可能会发生多次。因此,以上过程可以说明针对单次发生的某种警报,如何得到相应的标注数据集。在一些实施例中,可以针对某种警报的每次发生,得到其相应的标注数据集,这些标注数据集可以共同形成针对该警报的数据样本。
[0142]
另外,在一些实施例中,可以针对所有警报,得到其相应的数据样本,针对所有警报的数据样本可以共同形成训练样本。
[0143]
训练样本可以用于训练与警报管理相关联的机器学习模型,尤其是有监督机器学习模型,比如预测性维护或故障诊断模型等等。经过训练的这种模型可以提前提供关于工业过程的异常状态的指示,由此可以进行预先维护或排除故障等等,从而增加工业系统的安全性和生产效率。
[0144]
从上述可以看出,各个实施例的技术方案能够高效地实现对工业数据的标注,增强工业领域的数字化基础,有效地提升工业数据的价值。由此,能够加速机器学习技术在工业领域的应用进展。
[0145]
图6是根据一个实施例的用于工业数据处理的装置的示意性框图。在图6中,虚线框可以表示可选的单元。
[0146]
如图6所示,装置600可以包括确定单元602、数据获取单元604和标注单元606。确定单元602、数据获取单元604和标注单元606可以针对工业过程中发生过的警报来执行数据标注过程。
[0147]
具体地,确定单元602可以确定警报对应的标签值。
[0148]
数据获取单元604可以基于警报的历史发生时间,获取在工业过程中产生的历史数据集。历史数据集可以包括与警报的发生相关联的过程观测变量值。
[0149]
标注单元606可以基于标签值和历史数据集,生成用于机器学习的标注数据集。
[0150]
在一个实施例中,确定单元602可以从预先确定的标签数据中获取警报对应的标签值。标签数据可以包括在工业过程中发生过的至少一种警报对应的标签值,各种警报对应的标签值是不相同的。
[0151]
在一个实施例中,装置600还可以包括信息获取单元608和编码单元610。
[0152]
信息获取单元608可以从警报管理数据库中获取历史警报信息。历史警报信息可以是在警报管理生命周期的合理化阶段处理之后得到的警报信息。历史警报信息可以用于指示上述至少一种警报。
[0153]
编码单元610可以针对至少一种警报进行编码,以得到标签数据。
[0154]
在一个实施例中,编码单元610可以针对至少一种警报进行独热编码。
[0155]
在一个实施例中,历史数据集可以包括在警报发生的预设时间段内的过程观测变量值,预设时间段的结束时间点是警报被确认的时间点。
[0156]
在一个实施例中,该预设时间段是在过程警报响应时间线上的在警报被确认的时间点之前的过程响应时间。
[0157]
在一个实施例中,标注单元606可以将标签值与历史数据集进行关联,以生成标注数据集。
[0158]
在一个实施例中,装置600还可以包括样本生成单元612。
[0159]
确定单元602、数据获取单元604、标注单元606和样本生成单元612可以执行数据样本生成过程。
[0160]
具体地,确定单元602、数据获取单元604和标注单元606可以针对警报的每个历史发生时间,重复数据标注过程,以得到针对警报的每个历史发生时间的标注数据集。
[0161]
样本生成单元612可以生成针对警报的数据样本,其中,数据样本包括针对警报的每个历史发生时间的标注数据集。
[0162]
在一个实施例中,确定单元602、数据获取单元604、标注单元606和样本生成单元612可以针对在工业过程中发生过的每种警报,执行数据样本生成过程,以得到针对每种警报的数据样本。
[0163]
样本生成单元612进一步可以生成训练样本。训练样本可以包括针对每种警报的数据样本,训练样本可以用于训练与警报管理相关联的机器学习模型。
[0164]
装置600的各个单元可以执行图1至4的方法实施例中的相应步骤,因此,为了描述的简洁,装置600的各个单元的具体操作和功能此处不再赘述。
[0165]
上述装置600可以采用硬件实现,也可以采用软件实现,或者可以通过软硬件的组合来实现。例如,装置600在采用软件实现时,其可以通过其所在设备的处理器将存储器(比如非易失性存储器)中对应的可执行代码读取到内存中运行来形成。
[0166]
图7是根据一个实施例的用于工业数据处理的计算设备的硬件结构图。如图7所示,计算设备700可以包括至少一个处理器702、存储器704和通信接口706,并且至少一个处理器702、存储器704和通信接口706经由总线708连接在一起。至少一个处理器702执行在存储器704中存储或编码的至少一个可执行代码(即,上述以软件形式实现的元素)。
[0167]
在一个实施例中,在存储器704中存储的可执行代码在被至少一个处理器702执行时,使得计算设备实现以上结合图1-4描述的各种过程。
[0168]
计算设备700可以采用本领域任何适用的形式来实现,例如,其包括但不限于台式计算机、膝上型计算机、智能电话、平板计算机、消费电子设备、可穿戴智能设备等等。
[0169]
本说明书的实施例还提供了一种机器可读存储介质。该机器可读存储介质可以存储有可执行代码,可执行代码在被机器执行时使得机器实现上面参照图1-4描述的方法实施例的具体过程。
[0170]
例如,机器可读存储介质可以包括但不限于随机存取存储器(random access memory,ram)、只读存储器(read-only memory,rom)、电可擦除可编程只读存储器(electrically-erasable programmable read-only memory,eeprom)、静态随机存取存储器(static random access memory,sram)、硬盘、闪存等等。
[0171]
应当理解的是,本说明书中的各个实施例均采用递进的方式来描述,各个实施例
之间相同或相似的部分相互参见即可,每个实施例重点说明的都是与其它实施例的不同之处。例如,对于上述关于装置的实施例、关于计算设备的实施例以及关于机器可读存储介质的实施例而言,由于它们基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0172]
上文对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0173]
上述各流程和各系统结构图中不是所有的步骤和单元都是必须的,可以根据实际的需要忽略某些步骤或单元。上述各实施例中描述的装置结构可以是物理结构,也可以是逻辑结构,即,有些单元可能由同一物理实体实现,或者,有些单元可能分别由多个物理实体实现,或者,可以由多个独立设备中的某些部件共同实现。
[0174]
在整个本说明书中使用的术语“示例性”意味着“用作示例、实例或例示”,并不意味着比其它实施例“优选”或“具有优势”。出于提供对所描述技术的理解的目的,具体实施方式包括具体细节。然而,可以在没有这些具体细节的情况下实施这些技术。在一些实例中,为了避免对所描述的实施例的概念造成难以理解,公知的结构和装置以框图形式示出。
[0175]
以上结合附图详细描述了本公开内容的实施例的可选实施方式,但是,本公开内容的实施例并不限于上述实施方式中的具体细节,在本公开内容的实施例的技术构思范围内,可以对本公开内容的实施例的技术方案进行多种变型,这些变型均属于本公开内容的实施例的保护范围。
[0176]
本公开内容的上述描述被提供来使得本领域任何普通技术人员能够实现或者使用本公开内容。对于本领域普通技术人员来说,对本公开内容进行的各种修改是显而易见的,并且,也可以在不脱离本公开内容的保护范围的情况下,将本文所定义的一般性原理应用于其它变型。因此,本公开内容并不限于本文所描述的示例和设计,而是与符合本文公开的原理和新颖性特征的最广范围相一致。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献