一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于验证分析众包环境中的设备故障模型的协同系统和方法与流程

2023-02-06 10:38:57 来源:中国专利 TAG:


1.本发明涉及分析模型的验证。更具体地,本发明涉及一种用于在众包环境中登录和验证分析模型的系统。


背景技术:

2.对于投资于设备的成本有效操作的工业装备制造商和组织,使用各种软件应用来执行监测与其相关的装备操作的健康状况的艰巨任务。设备的示例可以包括建筑机器,诸如卡车、起重机、运土车辆、采矿车辆、反铲挖土机、材料处理设备、运输设备、石油和精炼设备、耕作设备等。装备维护措施已经变得非常复杂,产生大量的数据,其中这些数据的某些方面可以由不同的应用重复地提取、存储、修改和分析。例如,第一应用可以对车队中的一组装备进行健康检查。健康检查可以基于几个因素,诸如机器传感器数据、诊断或警告内容、维护和修理历史、应用分段和严重性、机器年龄和服务时间。机器健康检查或评估操作可通过具有端对端解决方案的应用来进行,即,其中评估技术人员或用户可首先收集并存储来自各种数据源的数据,且其次提取、修改并分析前述数据,且最后存储、查看并评估分析及相关结果输出。
3.还可以理解,相同的数据通常由不同用户执行的许多其他应用生成和使用,在当前示例中,每个应用期望与评估无关的特定端到端解决方案,而是生成独立的端到端解决方案。例如,工地项目经理、材料供应厂商和装备车队经理可以各自访问相同的数据,但是具有分离的端到端解决方案。
4.采用其中数据被再生或存储多次并用于各种端到端解决方案的策略是典型的,然而,当它存储、访问、提取和修改相同或相同的数据时,它消耗了有价值的计算机和人力资源。此外,由于当前为不同的端到端解决方案再生数据,因此可能会有机会丢失,因为没有端到端解决方案受益于由其他端到端解决方案执行的操作生成的输出,因为通常从每个应用生成的分析结果、修改的数据和知识是独立和分开存储的。存在一种需求,其中模块化应用能够从公共位置提取感兴趣的数据、对所提取的数据进行分析操作,并将分析模型和相关联的分析结果存储在其他用户可访问的公共位置。
5.当前的商业状况监测软件通常提供端到端解决方案,并且一些甚至提供api以与外部开发的分析模型集成。然而,使用此类软件不是成本有效的,因为通常只有一部分软件代码专用于开发和验证新的分析模型。例如,如果用户决定创建新的分析模型,利用当前的商业软件,用户将最终用每个分析模型生成大部分新代码。如当前所代表的,商业分析软件浪费了有价值的计算资源,因为当生成新的分析模型时,大部分代码被替换。此外,如果实际上仅使用少量代码来创建新的分析模型,则在每次生成大部分新代码时数据的成本有效使用是低效的。其他商业和开放源选项可具有可用于开发和验证分析模型的特征,但它们通常需要数据科学家或软件工程师以高成本进行大量集成工作,并且通常导致提供较不通用的软件选项。
6.验证分析模型的当前过程通常涉及数据科学家、状况监测顾问(cma)和非数据科
学家之间的密切合作,这些非数据科学家可以是各自具有大量产品和行业知识的状况监测专家。因此,目前存在很少或不存在有效且成本有效地实时进行分析模型验证的手段,其中数据科学家和非数据科学家可以建设性地与cma交互以生成分析模型。
7.由于其涉及数据科学家在开发分析模型中的作用,这些个人通常使用商业软件、特别开发的内部软件,或诸如jupyter笔记本的开源网络应用来开发分析模型。此外,对于数据科学家来说,考虑众包来生成分析模型是不常见的,并且此外,通常缺乏允许数据科学家在开发分析模型中与众包交互的商业解决方案。因此,需要开发一种容易使用的应用,其中多个数据科学家可以容易地迁移模型,并与cma协调地实时参考基准数据来验证这些迁移的模型。
8.由于其涉及当前数据科学家的建模过程的输入通用性,分区化的分析建模是无效的,因为这些过程缺乏与其他分析模型的开发者共享有价值的洞察力并且受益于其他分析模型的开发者的洞察力的能力。
9.此外,诸如基于python的模型的当前平台的此类集成能力在商业工具中不容易获得,尽管一些商业软件具有诸如api的有限手段来与外部开发的python模型集成。即使具有该有限的功能,具有api也不是成本有效的。
10.美国behzadi等人于2019年8月29日提交的专利申请第2019,0265,971号(“'971专利申请”)公开了一种用于数据处理和企业应用的方法。本技术描述了一种用于企业应用的通用软件应用开发平台,其中通过首先使用不同数据类型或数据结构集成来自各种源的数据,随后使用模型驱动的体系结构生成数据的抽象表示和数据的相关性来生成应用。'971专利申请建议算法、数据和数据相关性的抽象表示使得能够使用多个算法中的一者或多者来处理数据,而不需要知道多个算法或不同数据类型或数据结构的结构、逻辑或相互关系。描述了一种供应网络风险分析模型,用于为管理团队生成建议和选项,以减轻供应链的高风险区域,并改进供应商规划和供应商组合管理,以在需要时创建适当的冗余、备份和恢复选项。因此,使用现成商用软件或开放源选项的当前分析建模在特征方面缺乏通用性,并且几乎不具有集成来自多个源的模型和输入的任何手段。此外,当前的分析建模缺乏全套输入,因为几乎没有将众包分析输入与传统工程和数据科学输入集成的手段和任何非科学家的输入。


技术实现要素:

11.一种用于动态地创建和验证预测性分析模型以将数据转换成可执行洞察的计算机实现的系统,该系统包括:分析服务器,该分析服务器通信地连接至:(a)被配置为用于获取从电气系统输出的实时数据的传感器,和(b)被配置为用于显示一组分析服务器操作的标记的终端;该分析学服务器包括:用于识别事件的事件识别电路、用于基于分析专业知识选择性地标记其中发生所标识的事件的至少一个时间序列数据区域(数据区域)的标记电路、用于将其中标记了识别的事件的数据区域与其中未标记识别的事件的数据区域进行比较的决策引擎、用于基于分析专业知识构建体现由选择性标记生成的分类的预测性分析模型的分析建模引擎、通信地连接至该分析服务器并且被配置为用于显示通过执行该预测性分析模型而生成的视觉记号的终端,和用于基于来自至少一个领域专家的反馈来验证该预测模型的反馈引擎。
12.一种用于动态地创建和验证预测性分析模型以将数据转换成可执行洞察的方法,该方法包括:识别事件,基于分析专业知识选择性地对所识别的事件发生的至少一个时间序列数据区域(数据区域)标记,将识别的事件标记的数据区域与识别的事件未标记的数据区域进行比较,基于分析专业知识构建体现通过选择性标记生成的分类的预测性分析模型,显示通过执行预测性分析模型生成的视觉记号,以及基于来自至少一个领域专家的反馈验证预测模型。
13.下面在标题为“具体实施方式”的部分中描述本发明的这些和其他特征、方面和实施例。
附图说明
14.图1显示了根据公开的发明的实施例的数据视图特征的示例性界面100。
15.图2a、2b、2c和2d图示了其中用户通过分别根据客户名称、站点、机器和异常过滤数据来进行搜索的界面。
16.图3-4示出了通过选择感兴趣的机器和特定频道来过滤感兴趣的数据的示例性界面。
17.图5图示了根据公开的发明的一个实施例的添加频道功能。
18.图6示出了用于两个数据频道的数据可视化的示例性界面。
19.图7描绘了根据本发明的一个实施例的界面700,由此用户可以通过选择特定的异常来过滤感兴趣的数据。
20.图8指示了示例性界面800,其中用户可查看具有选择的异常的机器并编辑选择的异常的默认频道。
21.图9列举了最近报告了选择的异常的机器列表的示例。
22.图10图示了根据公开的发明的实施例的用户从已报告选择的异常的机器列表中选择机器的方式。
23.图11指示根据本发明的一个实施例的负载缺省频道选项。
24.图12显示了用于选择的异常的默认频道列表的示例。
25.图13示出了选择的数据频道的示例性视觉表示。
26.图14指示根据公开的发明的一个实施例的时间线上的异常。
27.图15描绘了根据公开的发明的一个实施例的时间线上的异常。
28.图16示出了根据本发明的一个实施例的用户的各种数据可视化选项。
29.图17表示响应于用户选择保存当前视图选项的示例性保存视图选项。
30.图18图示了根据本发明的一个实施例的用户可以切换到先前保存的视图的方式。
31.图19示出了根据本发明的一个实施例的先前保存的视图的各种属性。
32.图20图示了用于创建导出的频道的示例性界面。
33.图21描绘了根据公开的发明的一个实施例的用户可以创建、编辑、保存或发布导出的频道的界面。
34.图22示出了根据公开的发明的优选实施例的用户可以修改和测试用于导出新频道的算法的示例性界面。
35.图23显示了允许用户启动车队创建过程的界面。
36.图24指示用户可以配置新车队设置的说明性车队设置界面。
37.图25列举了根据本发明的一个实施例的要添加到车队的机器的列表。
38.图26示出了其中新创建的车队被添加到车队设置界面的示例性界面。
39.图27显示了根据本发明的一个实施例的用户可以从各种数据操作中选择数据操作的界面。
40.图28指示了用户可以通过其提供用于生成直方图的参数的示例性界面。
41.图29显示了由公开的系统的一个实施例生成的示例性直方图。
42.图30图示了根据公开的系统的一个实施例的各种组件的系统图。
43.图31图示了根据公开的系统的一个实施例的过程的流程图。
具体实施方式
44.为什么是python:
45.python是工程师和数据科学家广泛使用的编程语言,用于开发高价值高级分析模型。典型分析模型的当前登录和验证过程是耗时且乏味的过程,尤其是当验证必须参与可能是经销商雇员并且与生成高级分析模型的数据科学家相比通常拥有不相似的背景的状况监测顾问和cma时。
46.许多高级数据科学家使用jupypter笔记本开发他们的模型,jupypter笔记本是一种可以执行python或r语法和库的自由形式的文本编辑网络应用。换句话说,包括数据搜索、数据摄取、数据准备、算法开发、模型执行、结果查看等的所有任务通常需要使用python语法来译码。jupyter是高级数据科学家广泛使用的分析工具。然而,被接受为社区成员的非数据科学家被设想参与分析模型的开发和验证。因此,可以理解,对于诸如cma、工程师、主题专家等非数据科学家社区成员,jupper不是容易使用的工具。
47.为什么是众包:
48.公开的系统集成分析众包环境所使用的各种数据源、数据视图和基于规则的故障模型以用于验证。公开的系统支持覆盖有很少或没有滞后的异常的时间序列数据的瞬时可视化。公开的系统提供了实时覆盖有异常的时间序列数据的动态可视化。社区成员具有实时创建和实验分析模型的能力。实验可以例如包括选择要由新创建的分析模型处理的数据,以及在处理选择的数据之后查看由新创建的模型生成的数据可视化界面。新创建的分析模型可以使用导出的频道,如结合图21详细讨论的。
49.如图23所示,该系统考虑了社区输入,即除了来自数据科学家社区的输入之外,来自非数据科学家社区成员的输入,其中社区成员将具有以下能力:存储和共享用于创建导出频道的模板、存储和共享模型执行结果,并且经由如图23所示的数据可视化来进行比较分析。
50.通过有效地利用(1)众包社区的专家、(2)更广泛的数据科学家社区、(3)状况监测顾问(cma)和从多年的手对系统的使用导出的经销商社区专家,由所公开的系统生成稳健的分析模型。有趣的是,这些社区中的每一者都给系统带来了不同的洞察力,并且共同形成了可靠的知识库。
51.因此,提出了协作因特网应用来利用多个社区(众包、数据科学家、状况监测顾问和经销商)的洞察力。社区然后可以贡献他们的专家和领域知识以增加公开的系统的分析
能力。例如,经销商通常非常了解a)他们出售的产品和b)他们出售产品的客户。
52.此类知识被认为是竞争优势。在没有来自经销商的反馈的情况下,数据科学家可能不知道客户正在寻找访问什么数据以及客户想要针对什么异常查看数据可视化。公开的系统可以使分析开发和部署过程流水线化以动态生产分析模型。
53.为什么要协作:
54.公开的系统向社区成员提供验证和修改公开的分析模型的能力。共同和反复地,社区成员可以增加故障模型的数量、准确性、有效性和影响。例如,数据科学家社区、非数据科学家社区和众包社区可以在几天而不是几个月内访问即查看、编辑、测试和分发任何发布的分析模型。
55.访问的容易性导致可用故障模型的数量增加,这进而可以基本上辅助机器学习。同样,公开的系统预期向社区成员提供对任何发布的故障模型的免费访问,从而避免与当前缺乏所公开系统的鲁棒通用性的商业软件包相关联的高成本。此外,公开的系统实现了更有效的验证过程生成以及cmasd在验证模型中的更多参与。该增加的效率和模型的准确性导致更高的推荐产出。
56.参考图1,示出了根据公开的发明的一个实施例的示例性界面100。术语“用户”在本技术中用于表示将使用根据本发明的系统的数据科学家或非数据科学家社区成员(例如,cma)。响应于用户选择选择行业选项102以指定用户正寻求对其进行数据分析的行业,行业下拉列表104被填充在界面100上。通过选择查看选项106,用户可以查看图2a中所示的界面200。通过选择创建选项108,数据科学家可以创建、微调和回测分析模型。单个用户界面可以同时显示数据可视化1以及被执行以生成数据可视化的python代码。类似地,通过选择部署选项110,数据科学家可以创建使用哪个云服务器选项来识别运行什么资产、运行多长时间、运行多频繁的部署配置。通过选择管理选项112,管理助手可以获得用于认证和数据/特征权利的访问。
57.现在转到图2a,示出了显示四个全局过滤器210、220、230和240的显示界面200。用户可以在过滤数据之后通过以下步骤查看感兴趣的数据:(1)在客户名称选择区域210中选择特定客户名称,(2)在地点选择区域220中选择地点,(3)在机器选择区域230中选择机器,或(4)从异常选择区域240中选择异常。在用户通过客户名称进行搜索时,系统搜索第一数据库以检索与特定客户有关的信息,并使用第一全局过滤器,诸如客户名称来显示遥测数据。
58.用户可以通过从客户名称202的下拉列表中选择客户名称来提供客户名称,或者用户可以在客户名称输入区域210中手动输入客户名称。响应于用户选择客户名称,在界面200上填充与选择的客户相关联的站点列表220、机器列表230和异常列表240。
59.现在转到图2b,图示了界面200,由此用户可以通过按站点名称过滤数据来进行搜索。用户可以通过在站点名称输入区域220中输入期望的站点名称或者通过从站点名称204的下拉列表中选择站点名称来提供站点名称。图2b中的界面200指示了若干站点名称,作为示例而非限制,这些站点名称是bma峰位下降、ravensworth、glendell marc。
60.可替代地,如图2c所示,用户可通过在界面200上按机器名过滤数据来搜索数据。机器名称可以被输入到机器名称输入区域230中,或者通过从机器名称下拉列表206中选择机器名称。如图2c所示,示例性机器名称下拉列表206列举了若干机器名称,但作为示例不
限于ssp00448、ssp00169、ssp00170。
61.类似地,用户可以通过异常名称来过滤数据,如图2d中的界面200所示。用户可以通过在异常输入区域240中输入期望的异常名称或者通过从异常名称的下拉列表208中选择异常名称来提供异常名称。在异常名称208的列表中示出了异常的几个示例性名称,但是作为示例而不限于制动压力v2、左轮速度和制动蓄能器压力。
62.用户可以通过选择机器和感兴趣的特定频道来过滤感兴趣的数据,如图3-4所示,然而,当频道是来自机器的信号(时间序列数据)时,对于警报可以考虑异常。提供了通过在时间序列数据的顶部覆盖异常来显示内容的用户界面,并且该用户界面为用户进行验证提供了重要的目的。
63.参考图3,示出了根据公开的发明的一个实施例的指示机器330的选择和选择的机器330的频道302的选择的界面300。例如,响应于用户在机器选择区域330中选择机器ssp000337,则将在频道选择区域302中显示与ssp000337机器相关联的频道列表。换句话说,通过在频道选择区域302中选择引擎速度频道,可以在界面300上显示关于引擎速度频道的ssp000337的时间序列数据。
64.根据公开的发明的一个实施例,为了过滤来自期望机器的期望信道的数据,用户可以执行以下步骤:(1)识别在该机器选择区域中显示的感兴趣的机器,(2)识别该频道选择区域中的感兴趣的频道,以及(3)将选择的频道拖到该可视化区域上,(4)使得来自选择的频道的针对选择的机器的数据在该数据可视化区域中的视觉显示。此类现象显示在图4中。参考图4,界面400指示响应于用户生成的示例性界面:(1)在机器选择区域430中选择机器“ssp000337”((2)在频道选择区域402中选择“引擎速度”频道,以及(3)在数据可视化区域404中拖动选择的“引擎速度”频道(4))使得从“引擎速度”频道为ssp000337机器视觉显示408数据可视化区域404中的数据。
65.对于可视显示器408,在数据显现区404中,由参考数字412指示的x轴表示参数xxx,而y轴由参考数字406指示并表示参数yyy。在用户在数据可视化区域404中拖动所选频道之后,对于在x轴412和y轴406上选择的参数,在由附图标记408指示的区域中图形化地表示来自所选频道的数据,其中x轴指示时间、y轴代表频道名称,诸如以每分钟转数(rpm)测量的引擎速度。用户可以经由范围选择工具410放大、缩小或改变对特定数据范围的聚焦。
66.现在转到图5所示的界面500,示出了根据所公开的本发明的一个实施例的添加频道功能。有利地,如果用户对查看由先前选择的频道产生的数据与由界面500上的附加/另一(尚未选择的)频道产生的数据之间的比较的图形表示感兴趣,则用户可以选择添加频道选项504。在选择添加频道选项时,用户可以再次在频道选择区域502中选择另一个感兴趣的频道,并且将新选择的频道拖到可视化区域508的未占用部分以生成图6所示的界面600。
67.在图6中,示例性界面600图示了指示数据可视化的分割显示的数据可视化区域608。数据可视化区域608的第一部分608a包含先前选择的“左后制动油温”频道的数据可视化表示,而数据可视化区域608的第二部分608b包含新选择的“右后制动油温”频道的数据可视化表示。可以理解,用户可以容易地调整可视化条高度,并且通过使用时间线上的选择器工具,用户可以切掉选择的数据区域。
68.可替代地,用户可以仅通过选择特定的异常来对过滤感兴趣的数据感兴趣,在该情况下,用户可以在图7所示的界面700上的异常选择区域740处从异常的下拉列表中选择
感兴趣的异常。在选择了期望的异常之后,用户可以选择异常处理程序工具702来生成图8所示的界面800。
69.现在转到图8,其中在界面800上为用户呈现两种选择。用户选择说明“什么机器具有异常”的选项810来显示图9所示的界面900。可替代地,通过选择选项820,用户可以为选择的异常改变默认频道列表。
70.现在参考图9,图示了显示过去已经具有选择的异常908的机器的列表的界面900。用户可以在特定的时间跨度内过滤显示在界面900上的机器列表,例如,用户可以通过分别选择选项902、904和906为机器列表中的每个机器选择查看机器在过去的年、过去的月和过去的星期中报告异常的日期。该特征有助于识别警报显示的精确时间,警报显示的持续时间和采取治疗措施以解决最初导致警报显示的问题的时间。
71.可替代地,在另一个实施例中,然而在图9中未示出,用户还可以通过机器已经报告选择的异常的频率来过滤数据。例如,用户可以选择机器列表来列举每年一次、每月一次或每周一次报告异常的机器。该特征是有利的,因为用户能够将需要立即关注的机器(诸如每周一次报告异常的机器)与不需要立即关注的机器(例如每年一次报告异常的机器)相对照。一旦被cma验证,警报或异常数据就变成“基本事实”。基本事实是标注数据,并且可能被定义为,在数据科学家能够训练监督式机器学习模型之前必须具有的数据。大量的基本事实数据将可能导致产生更精确的机器学习模型。
72.分析迭代可以在模型验证过程期间进行,以防止“边缘场景”,并基于统计和/或工程经验和产品/行业知识产生最优阈值。边缘场景可以被定义为接近可接受的设计限制的情况,该可接受的设计限制可能受到用户的选择性消除。在开始时,分析模型可以不使用精确的公式来迅速地检测特定故障的发生,然而,它可以由数据科学家社区和非数据科学家社区的成员迭代地微调。
73.此类迭代方法试图从主题专家(诸如数据科学家社区的成员)输入以识别各种使用情况。在该上下文中,使用情况在其最简单的形式中可以是关联列表,通常定义反映装备状态系统的关联推断之间的交互以实现目标。在系统工程中,可以在比软件工程中更高的水平上使用使用情况,通常代表任务或利益相关者目标。然后可以在系统建模语言(sysml)中或作为合同声明来捕获详细需求。
74.此外,迭代法基于从非数据科学家社区接收的反馈调整分析模型的算法,其中反馈包括那些案例的结果。使数据科学家与主题专家密切合作将实现对可应用资产最佳工作并增加用户吞吐量的最佳警报标准。
75.应当理解,用户可以从显示在界面900上的机器列表中选择特定的机器,如图10所示。界面1000示出了报告选择的异常的机器列表,其中用户已经选择了由附图标记1002表示的机器“ssp00337”。
76.再次参考图10,示出了用户从已经报告选择的异常的机器列表中选择机器。响应于用户选择界面1000上的机器1002,显示图11所示的界面1100。
77.参考图11,每个异常都具有与其相关联的经过滤的频道列表,并且通过在界面1100上选择加载默认频道选项1102,用户能够查看如图1200所示的选择的异常的默认频道列表。
78.现在参考图12,界面1200显示用于选择的异常的默认频道列表,并且用户可以从
默认频道列表1202中将感兴趣的数据频道拖放到可视化区域1204上以生成选择的数据频道的视觉表示,如图13中的界面1300所示。
79.现在参考图13,示出了界面1300,其中在选择由附图标记1302和1304指示的两个频道之后,用户已经将选择的频道1302和1304拖到数据可视化区域1306上以生成数据可视化表示1308。另外,在界面1300上示出了时间线1310,其示出了用户可以将为选择的机器识别的异常查看为由时间线1310上的图标表示。在图14中的界面1400上更详细地示出了日期线1310。
80.图14描绘了根据公开的发明的一个实施例的时间线上的异常。通过在时间线1408上向左和向右滚动,用户可以看到由异常图标1402识别的异常。因此,当如图4所示发生异常时,时间线1408可视地表示异常图标1402以及对应的日期1406。用户可以选择异常图标1402,使得选择器工具1404快速聚焦并在界面1400上指示。选择器工具1404在由异常图标1402指示的异常已经发生的时间之前和之后的时间间隔期间显示数据。该事件在图15中示出。
81.图15描绘了根据公开的发明的一个实施例的时间线上的异常。现在转到图15,界面1500示出了10月5日从8.24.30到8.26.30的数据可视化。此可视化可用于识别由参考数字1502指示的特定时间跨度中的数据趋势。公开的系统不仅可视化数据而且将该数据缩小到特定异常的能力在调试异常机器行为的原因中尤其有用。
82.此外,用户可通过将给定异常标注为好或坏或甚至异常来提供关于特定异常的反馈。当异常提供对用户重要的事件的警报时,该异常可被表征为良好的异常。相反,当异常提供对用户不重要的事件的警报时,异常可被分类为不良异常。另外,用户可以添加反映某种异常为何好或坏的评论,并且甚至提供为了改善不良异常而要采取的步骤。
83.一旦用户在选择频道以显现感兴趣的数据之前选择机器和/或异常,这些参数的组合定义视图。在该情况下,在界面1500上,用户可以选择特定的资产1510,随后在右上角下拉菜单上选择特定的故障模型1520。然后,用户可以从宏时间线视图1540中选择特定的异常1530,在宏时间线视图1540上显示若干绿色点。每个绿色点代表报告异常时的示例。对于频道,用户可以通过点击照亮按钮1550来选择用于该故障模型的频道,或者用户创建查看模板。可选地,用户可以根据用户的需要添加附加频道。客户的需求经常随时间和应用而改变。然而,对于相同的应用,用户可能通过创建、保存并随后访问所保存的视图来重复地生成相同的视图以访问相同/相似的信息。
84.参考图16,示出了根据本发明的一个实施例的用户的各种数据可视化选项。为了节省用户必须创建同一视图所作出的努力,公开的系统经由图16的界面1600提供若干功能,诸如保存当前视图、我保存的视图、直方图等。用户可以选择选项1602来突出显示给定的异常。
85.通过从下拉菜单1604中选择“保存当前视图”选项1606。换言之,用户可以保存新创建的当前视图,如在界面1600上所示,以供将来经由图17所示的界面1700使用。用户可以经由下拉菜单1604中的各种选项来选择具有执行其他操作的能力,该其他操作诸如示出图形标签、示出选择的数据文件、google地图中的视图数据和3d运动中的视图。
86.现在转到图17,通过用户选择界面1600上的保存当前视图选项1606来生成界面1700上的保存视图窗口1702。用户提供将视图保存在视图名称输入区域1704中的名称。在
窗口1702上填充选择的频道的列表,此后用户可以通过选择选项1706来删除任何列出的频道。类似地,用户可以通过选择添加新频道选项1708来添加新的期望频道。
87.被保存的视图的代码被显示在代码显示区域1710中。如下面更详细描述的,用户能够通过改变代码显示区域1710中的代码来微调视图参数。在提供期望的视图名称、期望的频道和期望的代码修改之后,用户可以选择保存选项1712来保存新创建的或新修改的视图以供后续使用。值得注意的是,除非用户想要创建全新的视图,典型地,用户对基于用户应用的定制需要对代码进行小但显著的改变感兴趣。应当理解,用户不需要知道诸如python、r、sas、sql等计算机语言来进行代码改变。
88.可替代地,如图18所示,用户可以通过选择界面1800切换到先前保存的视图,显示保存的视图选项1802。现在参考图18,使用先前保存的视图1802,用户可以选择观看先前保存的视图之一。响应于用户选择选项1802,显示所有先前选择的视图的下拉列表1804。用户可以从视图中选择一个选项。当从先前保存的视图1804的下拉列表中选择选项之一时,则为用户显示关于选择的视图的细节。该过程在图19中示出。
89.参照图19,解释用户先前保存的视图的属性。界面1900显示视图选择区域1902,其显示先前已由用户保存的视图。当用户从视图选择区域1902中列出的视图中选择特定视图时,在界面1900上显示与选择的和先前保存的视图有关的各种属性,诸如视图名称1904,已为保存的视图选择的频道列表1906,和保存的视图的软件代码1908。用户可以选择删除选项1910来删除所保存的视图,或者选择选项1912来加载选择的视图。该特征特别有价值,因为这是个性化或定制的视图模板,其中用户可以保存新视图并修改现有视图。用户可以通过从视图的下拉列表中选择该视图而容易地上载该视图,而不是用户必须从头开始重复地创建该视图。
90.图20示出了用户创建导出的频道的能力。导出的频道是使用来自原始数据集的原始频道的计算或数据集,其由用户创建,可以由相同或不同应用中的相同用户或其他用户重新使用。响应于用户在界面2000上选择导出的频道选项2002,启动界面2100的显示。另外,用户可以选择创建车队选项2004来生成下面结合图24讨论的界面。
91.现在转到图21,由此用户可以创建、编辑、保存或发布导出的频道,在界面2100上显示现有频道的列表2106。当用户选择特定频道时,在界面2100上显示一组频道属性,包括但不限于频道名称2104、频道描述2108、频道输入2110和删除输入选项2112。这允许用户删除特定输入、添加新输入选项2114和公式输入区域2116。通过修改公式输入区域2116中的代码,用户可以创建新的导出的频道。
92.然后,用户可以通过将新创建的导出的频道命名为第一名字来保存该频道。类似地,用户可以发布导出的频道。在发布之前,可以例如通过进一步修改算法/公式来修改新创建的导出的频道,并且可以将其再次保存在第一名字下。然而,如果用户希望修改所发布的导出的频道,则用户可以修改所发布的导出的频道,并将修改后的导出的频道保存的导出的频道,其中第一名称不同于第二名称。换句话说,修订的导出的频道是现有导出的频道的新修订。
93.通过从任何选择的导出的频道中选择视图修订历史选项2118,用户可以查看所做的改变,查看谁做了它们,但是如果需要,用户可以中止更新,并回退到先前版本。可以理解,如果用户希望创建新的导出的频道,则用户可以选择“新”选项2102并提供上述频道属
性集合,诸如频道名称、描述、输入和公式。
94.参照图22,示出了示例性界面2200,在输入公式2202之后,用户可通过选择测试选项2204来测试输入的代码。应当理解,用户不需要知道任何特定的编程语言语法来修改或提供公式以修改导出的频道或生成新的导出的频道。
95.在译码新算法之后,通过测试选项2204,用户可以在特定机器上测试新写入的导出的频道。在成功测试新导出的频道之后,在界面2200上显示成功执行通知2206。在成功测试导出的频道之后,用户可以通过选择添加到我的列表选项2210来保存新编写的算法以供他或她个人使用。
96.可替代地,用户可以通过选择保存和发布选项2208来保存和发布算法,以立即将新导出的频道添加到用户的频道列表。如果新导出的频道被保存为专用频道,则新导出的频道被添加到用户的频道列表。
97.同样,如果新导出的频道被保存为公共频道,则新导出的频道被添加到用户的频道列表和其他用户的频道列表。在发布新导出的频道之后,其他用户可以容易地将新导出的频道添加到他们各自的频道列表中。这节省了宝贵的计算资源并改进了计算机,因为一个用户的洞察容易传达给其他用户,从而节省了时间并提高了生产率。
98.值得注意的是,用户修改现有公式并提供新公式的能力有利地为非程序员提供了改变公式以满足用户自定义应用的需要的机会。因此,非程序员用户可以使用分析工具的修改版本,其中该修改被配置为满足用户应用的定制需要,而无需让用户从零开始编写分析工具的代码。
99.参考图23,将描述显示界面2300,其允许用户启动车队创建过程。当用户选择创建车队选项2302时,可以使用图3所示的界面2400来启动车队创建过程。
100.现在转到图24,显示界面2400,其中为了建立车队,用户在界面2400上选择创建新车队选项2402。然后,用户可以在车队名称输入区域2404中指定车队名称,并在车队描述输入区域2406中提供描述。用户在界面2400上选择“编辑机器列表”选项2408,填充图25所示的界面2500。
101.现在描述图25,其中在机器显示在机器显示区域2502中的情况下,用户可以将任何或所有列出的机器添加到用户试图创建的车队。用户可以选择将机器显示区域2502中显示的所有或一些机器添加到选择的机器显示区域2506,并最终将选择的机器添加到由用户创建的车队。
102.为了将特定机器添加到新车队,用户可以简单地选择感兴趣的机器,并将选择的机器从区域2502拖放到区域2506。可替代地,用户可以通过选择选择所有机器选项2504将区域2502中显示的所有机器添加到新车队。相反,用户可以通过选择选择所有机器选项2508来取消先前选择的机器的选择。在选择要添加到新车队的机器之后,用户可以选择取消选项2510以中止将选择的机器添加到新车队。可替代地,用户可以选择完成选项2512以将选择的机器添加到新车队。如果用户选择完成选项2512,则显示车队设置界面2600。
103.现在参考图26,示出了界面2600,其示出了显示新创建的车队“bma峰值降低”的车队选择区域2602。先前添加到新创建的车队中的机器显示在选择的机器显示区域2604中。在创建车队并选择机器之后,用户可以通过选择删除选项2606来删除新创建的车队。
104.可替代地,用户可以通过选择取消选项2608来中止车队创建,或者用户选择保存
选项2610来最终创建新车队。一旦创建,车队在车队列表中为用户可见。与上述查看操作类似,用户可以选择、编辑或删除先前创建的车队。
105.数据可视化是重要的,因为它提供了验证给定分析模型并生成与客户共享的视觉证据的途径。直方图是分析工具为用户可视化数据的一种方式。
106.转到图27,界面2700示出下拉列表2702,该下拉列表2702允许用户为车队选择各种数据操作,诸如获得选择的数据的直方图的选项,并查看所保存的直方图。当用户为车队选项2704选择获取直方图时,如图28所示显示界面2800。
107.现在参考图28,示出了界面2800,其中用户可以提供用于生成直方图的参数,诸如名称、描述、时间跨度、箱、频道等。另外,用户可以通过经由选项2802选择一组机器车队来选择生成直方图。可替代地,用户可以通过选择选项2804用于生成直方图的一组机器。因此,界面2800允许用户可视化选择的车队或选择的数据的直方图。用户可以通过选择删除直方图选项2806来中止直方图创建。可替代地,用户可以通过选择创建直方图选项2808来进行直方图生成。在创建期望的直方图之后,用户可以通过选择视图绘图选项2810来查看直方图。
108.现在转向图29,显示了界面2900,其示出了由公开的系统的实施例生成的示例性直方图。
109.现在讨论图30,其示出了根据公开的系统的一个实施例的各种组件的系统图。数据3004通常从许多来源接收,例如数据可以来自在不同位置运行的装备,数据也可以从外部来源接收,诸如经销商数据库或外部创建的标注数据。
110.一旦接收到,数据就被发送到至少两个位置,框3002和3014。换句话说,数据被发送到(或通过)一组批准的分析模型3002。另外,数据也被发送到框3014,在框3014,非数据科学家社区可以基于(1)他们在使用装备(2)的过程中发展的洞察力来构建新的分析模型,以满足他们各自应用的需要。在框3016,非数据科学家社区可以测试和验证新构建的分析模型。一旦测试完成并且如果在框3018处批准新创建的分析模型用于生产,则将新建的分析模型存储在我的sql数据库3012中。
111.可替代地,如果在块3018处,新构建的分析模型未被批准用于生产。随后,在非数据科学家分析模型再循环到尚未完善的模型的非数据科学家社区池中之后,过程移动到框3014。众包社区成员可以一起工作以试图克服这些模型中的缺陷。协作是众包社区的显著益处。其中虽然每个社区成员可能不具有对所有问题的回答,但共同地,社区可能具有或提出对大多数问题的回答。
112.通常,在框3016,在测试和验证新构建的分析模型的过程期间创建的日志可以存储在我的sql数据库3012中。如果非数据科学家社区成员决定仅为了个人使用而保留新创建的分析模型,则新批准的分析模型分析模型存储在mysql数据库3012中。然而,如果非数据科学家社区成员同意发布新批准的分析模型,则在框3002,除了存储在mysql数据库3012中之外,新批准的分析模型被发布并可用于社区成员,并合并到批准的模型数据库中。
113.先前创建的所有分析模型在存储或批准的模型数据库3002中被测试和批准。接收到的数据通常由至少一个经核准的模型来处理,更具体地,在框3006处,执行与至少一个经核准的模型相关联的代码以生成数据可视化。基于代码执行的结果,在框3008创建记录和记录所遇到的异常或其他类似日志的日志。acm数据库3010存储在框3008中生成的日志,该
日志指示在执行批准的分析模型期间发生的异常。类似地,acm数据库3010还可以存储在框3006中生成的数据可视化。acm数据库3010被配置与根据公开的发明的一个实施例的应用相关的所有数据。
114.因此,公开了一种用于动态地创建和验证预测性分析模型以将数据变换成可执行洞察的计算机实现的系统。该系统包括:分析学服务器,该分析服务器通信地连接至:被配置为用于获取从电气系统输出的实时数据的传感器,和被配置为用于显示一组分析服务器操作的标记的终端;
115.分析服务器包括:事件识别电路,用于识别事件的发生;标记电路,用于基于分析专业知识选择性地标记至少一个时间序列数据区域(数据区域),其中识别的事件发生。另外,分析服务器包括决策引擎,该决策引擎用于将识别的事件被标记的数据区域与识别的事件未被标记的数据区域进行比较。
116.分析建模引擎也是分析引擎的一部分,并且用于基于分析专业知识来构建体现由选择性标记生成的分类的预测性分析模型。此外,终端可通信地连接到分析服务器并且被配置为显示通过执行预测性分析模型而生成的视觉记号。此外,反馈引擎也是公开的系统的一部分,用于基于来自至少一个领域专家的反馈来验证预测模型。
117.工业实用性
118.现在参考图31,公开了根据系统的一个实施例的过程的流程图。当在框3102处从数据科学家社区成员或在框3106处从非数据科学家社区成员接收到数据可视化请求时,过程3100开始。数据可视化请求通常可以包含三个子部分,首先识别要被可视化的输入数据,诸如要被可视化的数据的频道,识别要被捕获的数据的异常。
119.结合图2a-2d描述了识别要可视化数据的客户、站点、机器或异常的过程。数据可视化请求的第二部分是识别输入数据将被变换的方式。该现象结合图21进行讨论。数据可视化请求的第三部分定义了要显示变换数据的方式,例如在图3-5中所讨论的。
120.在方框3104,经由数据存储器或数据仓库访问所请求的数据,该数据仓库存放各种类型的数据,诸如与各种行业有关的数据,该行业包括但不限于能源、制造、航空、汽车、化学、制药、电信、零售、保险、保健、金融服务、公共部门和其他行业。
121.尽管公开的发明是关于机器性能数据可视化来描述的,但是本领域普通技术人员将理解公开的发明可应用于许多其他领域的事实。
122.在框3108,分析器或分析服务器可以确定数据可视化请求的来源。如果过程在框3110确定分析模型已经由数据科学家以计算机编程语言呈现并且通过测试被批准,则过程可以移动到框3114以确定分析模型是否需要修改。
123.在框3118,如果确定所请求的修改是次要的,则过程移动到框3120,以改变编程语言中的代码,从而在分析模型中实现期望的修改。此后,该过程移动到框3122,在框3124处执行经修改的代码之前测试并验证该代码。然后,在3126处可视化数据之后,过程在3128处退出。
124.可替代地,如果在框3130,如果确定所请求的修改是主要的,则过程移动到框3132以启动软件开发项目和测试。一旦软件被开发,过程移动到框3134以执行新开发的分析代码。在框3126可视化数据之后,根据新开发的软件模型,过程在3128退出。
125.然而,如果在框3112处,该过程确定分析模型已经由非数据科学家呈现,并且以非
计算机编程语言编写并且经由测试被批准,则该过程移动到框3136以经由根据公开的发明的一个实施例的用户界面修改用于分析模型的代码。
126.接下来,在框3138处,该过程测试并验证经由用户界面修改的代码,并继续执行修改的代码以使数据可视化,并可选地在框3140处保存修改的代码以供后续使用。另外,在框3142提示非数据科学家社区成员可选地发布代码之后,过程在框3128退出。分析模型的发布可以帮助其他社区成员,因此他们可以通过迭代修改来使用和改进代码,以最终提高所得分析模型的质量。
127.公开的系统具有许多优点。公开的系统的一些示例性有利特征包括但不限于:一种自由形式的python语法编辑器,其提供高性能集成可视化、导出的频道功能性、数据创建功能性、反馈回路能力等。另外,公开的系统有利地结合了三个单独的模块化功能:数据管理、分析建模和在单个集成应用中显示用户界面。
128.公开的系统可以增加分析能力,同时增加部署效率以产生竞争优势。公开的系统可以更快地提供故障模型。通常,开发平均复杂度的分析模型需要几个月的时间。如上所述,使用公开的系统,用户可以即时地创建、测试和部署故障模型。
129.因为非数据科学家社区用户具有直接改变仅构成由数据科学家社区编写的代码的10%的算法的能力,所以节省了宝贵的计算资源和人力资源,否则所述人力资源将被耗尽以修改代码的剩余90%。因此,公开的系统为计算机本身提供了改进。
130.所有社区成员、数据科学家和非数据科学家都很可能受益于新发布的分析模型,因为他们很可能(1)很容易照原样使用所发布的分析模型(2)对所发布的分析模型进行较小修改以基于所发布的分析模型生成新的分析模型,以满足他们各自客户的需要(3)基于所发布的分析模型/在所发布的分析模型之上构建其他分析模型,或基于从已发布的分析模型获得的见解构建新的分析模型。
131.同样地,众包社区也共享发布分析模型的社区成员(通常是主题专家或终端用户系统专家)的洞察力,并且又将该洞察力和知识应用于经由众包生成的未来分析模型。创建和共享越来越精确的分析模型的迭代过程对于所有涉及的各方确实是极其有益和有价值的。此类演进的分析模型还可能执行极好的预测分析并防止未来的损坏。
132.公开的系统导致更精确的预测分析,因为公布的模型的以异常日志的形式由模型验证证据支持。瞬时共享直方图的能力可以使社区成员有机会验证公布的或即将公布的分析模型的声称的准确性。
133.因为公开的系统利用数据科学家社区和非数据科学家社区之间的途径,公开的系统导致分析模型的容量增加。社区成员之间的信息和洞察交换可能产生引导、请求和随后产生附加的故障模型。
134.应当理解,前面的描述提供了公开的系统和技术的示例。然而,可以设想,本发明的其他实现可以在细节上不同于前述示例。对本发明或其示例的所有引用旨在引用在该点处讨论的特定示例,并且不旨在暗示对更一般地本发明的范围的任何限制。关于某些特征的区别和贬低的所有语言都旨在缺乏对这些特征的偏好,但除非另外指明,否则并不完全将其从本发明的范围中排除。
135.除非本文另有说明,否则本文对值的范围的叙述仅旨在用作个别地提及落在该范围内的每个单独值的速记方法,并且将每个单独值并入说明书中,如同其在本文中被个别
地叙述一样。本文描述的所有方法可以以任何合适的顺序进行,除非本文另有说明或与上下文明显抵触。
136.在描述本发明的上下文中(特别是在所附权利要求的上下文中),术语“一个”和“一种”以及“该”和“至少一个”和类似指示物的使用应被解释为涵盖单数和复数,除非在本文中另有说明或与上下文明显抵触。在一个或多个项目(例如,“a和b中的至少一个”)的列表之后使用术语“至少一个”应被解释为意指选自所列项目(a或b)的一个项目或所列项目(a和b)中的两个或多个的任何组合,除非本文另有说明或与上下文明显矛盾。
137.因此,本发明包括适用法律允许的所附权利要求书中所述主题的所有修改和等效物。此外,上述要素在其所有可能的变化中的任何组合都被本发明所涵盖,除非本文另有说明或与上下文明显抵触。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献