用于机器人流程自动化的基于人工智能层的过程提取的制作方法

2022-06-01 15:12:53 来源：中国专利 TAG：

用于机器人流程自动化的基于人工智能层的过程提取
1.相关申请的交叉引用
2.本技术要求2019年12月9日提交的申请号为16/707,505的美国非临时专利申请和2019年10月15日提交的申请号为62/915,351的美国临时专利申请的权益。这些较早提交的申请的主题通过引用其整体而并入本文。
技术领域
3.本发明总体上涉及机器人流程自动化(rpa)，更具体地涉及用于rpa的基于人工智能(ai)层的过程提取。

背景技术：

4.可以使用rpa机器人从业务计算系统中收集大量数据。然而，这些数据本身并不能促进rpa或者促进对其的改进。事实上，企业可能知道也可能不知道能够从rpa中获益的过程。因此，用于分析rpa的数据并且从中提取过程的改进机制可以是有益的。

技术实现要素：

5.本发明的某些实施例可以针对当前rpa技术尚未被完全标识、理解或者解决的现有技术中的问题和需求提供解决方案。例如，本发明的一些实施例涉及用于rpa的基于ai层的过程提取。
6.在实施例中，一种用于使用多个ai层针对rpa执行基于ai的过程提取的计算机实现的方法包括：由计算系统取回由监听器收集的数据。计算机实现的方法还包括：由计算系统通过多个ai层运行由监听器收集的数据，以处理收集的数据。当超过置信度阈值的潜在rpa过程被标识时，计算机实现的方法还包括：由计算系统针对被标识的rpa过程生成rpa工作流，并且生成机器人，机器人被配置为针对被标识的rpa过程执行生成的rpa工作流。
7.在另一实施例中，计算机程序被体现在非暂态计算机可读介质上。程序被配置为使至少一个处理器：通过多个ai层运行由多个监听器收集的数据，以处理收集的数据并且标识收集的数据中超过置信度阈值的一个或多个潜在rpa过程。程序被配置为使至少一个处理器：当被标识rpa过程超过置信度阈值时，针对被标识的rpa过程生成rpa工作流。
8.在又一实施例中，一种装置包括：存储计算机程序指令的存储器，计算机程序指令用于针对rpa使用多个ai层执行基于ai层的过程提取；以及至少一个处理器，至少一个处理器可通信地耦合到存储器，并且被配置为执行计算机程序指令。指令被配置为使至少一个处理器：通过多个ai层运行由多个监听器收集的数据，以处理收集的数据并且标识收集的数据中超过置信度阈值的一个或多个rpa过程。指令还被配置为使至少一个处理器：当被标识rpa过程超过置信度阈值时，针对被标识的rpa过程生成rpa工作流。收集的数据以串行、并行或者串行和并行两者的组合被运行通过多个ai层。
附图说明
9.为了便于理解本发明某些实施例的优点，将参考附图中所示的具体实施例，对上文简要描述的本发明进行更详细的描述。虽然应当理解，这些附图仅描绘了本发明的典型实施例，因此不被认为是对其范围的限制，但是将通过使用附图利用附加的特征和细节来描述和解释本发明，在附图中：
10.图1是图示根据本发明实施例的rpa系统的架构图。
11.图2是图示根据本发明实施例的已部署的rpa系统的架构图。
12.图3是图示根据本发明实施例的设计器、活动和驱动器之间关系的架构图。
13.图4是图示根据本发明实施例的rpa系统的架构图。
14.图5是图示根据本发明实施例的被配置为执行用于rpa的基于多个ai层的过程提取的计算系统的架构图。
15.图6是图示根据本发明实施例的被配置为使用多个ai层针对rpa执行基于ai的过程提取的系统的架构图。
16.图7是图示根据本发明实施例的使用ai层针对rpa的基于ai的过程提取的过程的流程图。
17.图8是图示根据本发明实施例的使用ai层针对rpa的基于ai的过程提取的过程的流程图。
具体实施方式
18.一些实施例涉及用于rpa的基于ai层的过程提取。这样的实施例可以分析由rpa机器人和/或其他源收集的数据以标识能够被用以建议或者自动生成rpa工作流的模式。这些ai层可以被用以识别其中包含的用户或者业务系统过程的模式。每个ai层可以“感知”数据中的不同特性，并且每个ai层可以被单独使用或者与其他ai层配合使用以建议rpa工作流。
19.图1是图示根据本发明实施例的rpa系统100的架构图。rpa系统100包括允许开发方设计和实现工作流的设计器110。设计器110可以提供用于应用集成以及自动化第三方应用、管理信息技术(it)任务和商业it过程的解决方案。设计器110可以促进自动化项目的开发，该自动化项目是业务过程的图形表示。简而言之，设计器110促进工作流和机器人的开发和部署。
20.自动化项目通过给予开发方对执行顺序和在工作流中开发的自定义步骤集之间的关系的控制，来启用基于规则的过程的自动化，在本文中工作流被限定为“活动”。设计器110的实施例的一个商业示例是uipath studio
tm
。每个活动可以包括动作，诸如点击按钮、读取文件、写入记录面板等。在一些实施例中，工作流可以是嵌套的或者嵌入的。
21.工作流的一些类型可以包括但不限于序列、流程图、有限状态机(fsm)和/或全局异常处理程序。序列可以特别适合线性过程，使能够从一个活动流向另一活动，而不会使工作流变得混乱。流程图可以特别适合更复杂的业务逻辑，通过多个分支逻辑操作符以更多样化的方式启用决策的集成和活动的连接。fsm可以特别适合大型工作流。fsm可以在它们的执行中使用有限数目的状态，这些状态由条件(即，转换)或者活动触发。全局异常处理程序可以特别适合用于在遇到执行错误时确定工作流行为以及用于调试过程。
22.一旦在设计器110中开发出工作流之后，指挥方120协调业务过程的执行，指挥方
120协调一个或多个机器人130执行设计器110中已开发的工作流。指挥方120的实施例的一个商业示例是uipath orchestrator
tm
。指挥方120促进管理环境中资源的创建、监控和部署。指挥方120可以充当与第三方解决方案和应用的集成点。
23.指挥方120可以管理机器人130的编队、从集中点连接和执行机器人130。可以被管理的机器人130的类型包括但不限于：有人值守机器人132、无人值守机器人134、开发机器人(类似于无人值守机器人134，但用于开发和测试目的)和非生产机器人(类似于有人值守机器人132，但用于开发和测试目的)。有人值守机器人132由用户事件触发，并且在同一计算系统上与人类一起工作。有人值守机器人132可以与指挥方120一起用于集中式过程部署和记录介质。有人值守机器人132可以帮助人类用户完成各种任务，并且可以由用户事件触发。在一些实施例中，过程不能从这种类型的机器人上的指挥方120启动，和/或它们不能在锁定的屏幕下运行。在某些实施例中，有人值守机器人132只能从机器人托盘或者从命令提示符来启动。在一些实施例中，有人值守机器人132应当在人类的监督下运行。
24.无人值守机器人134在虚拟环境中无人值守地运行并且可以自动化数个过程。无人值守机器人134可以负责远程执行、监控、调度和针对工作队列提供支持。在一些实施例中，针对所有机器人类型的调试可以在设计器110中运行。有人值守机器人和无人值守机器人两者可以自动化各种系统和应用，包括但不限于大型机、web应用、vm、企业应用(例如，由sales等生产的应用)、以及计算系统应用(例如，桌面和膝上型应用、移动设备应用、可穿戴计算机应用等)。
25.指挥方120可以具有各种功能，包括但不限于供应、部署、配置、排队、监控、记录和/或提供互连性。供应可以包括：创建和维护机器人130与指挥方120之间的连接(例如，web应用)。部署可以包括：确保将数据包版本正确地递送给指定的机器人130用于执行。配置可以包括机器人环境和过程配置的维护和递送。排队可以包括：提供队列和队列项的管理。监控可以包括：跟踪机器人标识数据和维护用户许可。记录可以包括：将记录存储到和索引到数据库(例如，sql数据库)和/或另一存储机制(例如，提供存储和快速查询大型数据集的能力的elastic)。指挥方120可以通过充当针对第三方解决方案和/或应用的集中通信点来提供互连性。
26.机器人130是运行设计器110内置工作流的执行代理。(多个)机器人130的一些实施例的一个商业示例是uipath robots
tm
。在一些实施例中，机器人130默认安装微软服务控制管理器(scm)管理的服务。因此，此类机器人130可以在本地系统账户下打开交互式会话，并且具有服务的权限。
27.在一些实施例中，机器人130可以以用户模式安装。针对这种机器人130，这意味着它们具有与已经安装的给定机器人130的用户相同的权利。此功能也可以用于高密度(hd)机器人，确保机器中的每个机器的最大潜能得到充分利用。在一些实施例中，可以在hd环境中配置任何类型的机器人130。
28.某些实施例中的机器人130分为多个组件，每个组件专用于特定的自动化任务。一些实施例中的机器人组件包括但不限于scm管理的机器人服务、用户模式机器人服务、执行方、代理和命令行。scm管理的机器人服务对会话进行管理和监控，并且充当指
挥方120与执行主机(即，机器人130在其上被执行的计算系统)之间的代理。这些服务可以被委托并且管理针对机器人130的凭证。本地系统下的scm启动控制台应用。
29.在一些实施例中，用户模式机器人服务管理和监控会话，并且充当指挥方120与执行主机之间的代理。用户模式机器人服务可以被委托并且管理针对机器人130的凭证。如果没有安装scm管理的机器人服务，则应用可以自动启动。
30.执行方可以在会话下运行给定作业(即，它们可以执行工作流)。执行方可以知道每个监控器的每英寸点数(dpi)设置。代理可以是在系统托盘窗口中显示可用作业的呈现基础(wpf)应用。代理可以是服务的客户端。代理可以请求启动或者停止作业以及更改设置。命令行是服务的客户端。命令行是控制台应用，其可以请求启动作业并且等待其输出。
31.如上所述地将机器人130的组件分开有助于开发方、支持用户和计算系统更轻松地运行、标识和跟踪每个组件正在执行什么。可以以这种方式为每个组件配置特殊行为，诸如针对执行方和服务设置不同的防火墙规则。在一些实施例中，执行方可以总是知道每个监控器的dpi设置。因此，工作流可以在任何dpi处执行，而无论创建工作流的计算系统的配置如何。在一些实施例中，来自设计器110的项目也可以独立于浏览器缩放级别。对于不知道dpi或者故意地标记为不知道的应用，在一些实施例中可以禁用dpi。
32.图2是图示根据本发明实施例的已部署rpa系统200的架构图。在一些实施例中，rpa系统200可以是图1的rpa系统100，或者可以是其部分。应当注意，客户端侧、服务器侧或两者可以包括任何期望数目的计算系统，而不脱离本发明的范围。在客户端侧，机器人应用210包括执行方212、代理214和设计器216。然而，在一些实施例中，设计器216可以不在计算系统210上运行。执行方212正在运行过程。多个业务项目可以同时运行，如图2所示。在本实施例中，代理214(例如，服务)是针对所有执行方212的单联系点。本实施例中的所有消息都被记录到指挥方230中，指挥方230经由数据库服务器240、索引器服务器250或两者进一步处理它们。如上关于图1所述，执行方212可以是机器人组件。
33.在一些实施例中，机器人代表机器名称与用户名之间的关联。机器人可以同时管理多个执行方。在支持同时运行的多个交互式会话的计算系统(例如，服务器2012)上，可以存在同时运行的多个机器人，每个机器人使用唯一的用户名在单独的会话中运行。这就是上面提到的hd机器人。
34.代理214还负责发送机器人的状态(例如，定期地发送指示机器人仍在运行的“心跳”消息)和下载要执行的数据包的所需版本。在一些实施例中，代理214与指挥方230之间的通信总是由代理214发起。在通知场景中，代理214可以打开随后由指挥方230用来向机器人发送命令(例如，开始、停止等)的websocket通道。
35.在服务器侧，包括了表示层(web应用232、开放数据协议(odata)代表状态传输(rest)应用编程接口(api)端点234以及通知和监控236)、服务层(api实现/业务逻辑238)和持久层(数据库服务器240和索引器服务器250)。指挥方230包括web应用232、odata rest api端点234、通知和监控236以及api实现/业务逻辑238。在一些实施例中，用户在指挥方
220的界面中执行的大多数动作(例如，经由浏览器220)是通过调用各种api来执行的。这种动作可以包括但不限于在机器人上启动作业、在队列中添加/移除数据、调度作业以进行无人值守运行等，而不脱离本发明的范围。web应用232是服务器平台的可视层。在本实施例中，web应用232使用超文本标记语言(html)和javascript(js)。然而，在不脱离本发明的范围的情况下，可以使用任何期望的标记语言、脚本语言或者任何其他格式。在本实施例中，用户经由浏览器220与来自web应用232的网页交互，以便执行各种动作来控制指挥方230。例如，用户可以创建机器人组、向机器人分配数据包、分析每个机器人的和/或每个过程的记录、启动和停止机器人等。
36.除了web应用232，指挥方230还包括公开odata rest api端点234的服务层。然而，可以包括其他端点，而不脱离本发明的范围。rest api由web应用232和代理214两者消费。在本实施例中，代理214是客户端计算机上的一个或多个机器人的监管方。
37.本实施例中的rest api涵盖配置、记录、监控和排队功能。在一些实施例中，配置端点可以用于限定和配置应用用户、许可、机器人、资产、发布和环境。记录rest端点可以用于记录不同的信息，诸如错误、由机器人发送的明确消息以及其他特定于环境的信息。如果在指挥方230中使用启动作业命令，则机器人可以使用部署rest端点来查询应该被执行的数据包版本。排队rest端点可以负责队列和队列项管理，诸如向队列添加数据、从队列获取事务(transaction)、设置事务的状态等。
38.监控rest端点可以监控web应用232和代理214。通知和监控api 236可以是rest端点，其用于注册代理214、向代理214递送配置设置、以及用于从服务器和代理214发送/接收通知。在一些实施例中，通知和监控api 236也可以使用websocket通信。
39.在本实施例中，持久层包括服务器对——数据库服务器240(例如，sql服务器)和索引器服务器250。本实施例中的数据库服务器240存储机器人、机器人组、相关过程、用户、角色、调度等的配置。在一些实施例中，该信息通过web应用232而被管理。数据库服务器240可以管理队列和队列项。在一些实施例中，数据库服务器240可以存储由机器人记录的消息(附加于索引器服务器250或者代替索引器服务器250)。
40.索引器服务器250(其在一些实施例中为可选的)存储并且索引由机器人记录的信息。在某些实施例中，可以通过配置设置来禁用索引器服务器250。在一些实施例中，索引器服务器250使用elastic(其是开源项目全文搜索引擎)。由机器人记录的消息(例如，使用记录消息或者写入行等的活动)可以通过(多个)记录rest端点而被发送到索引器服务器250，在索引器服务器250处它们被索引用于将来使用。
41.图3是图示根据本发明实施例的设计器310、活动320、330和驱动器340之间的关系300的架构图。如上所述，开发方使用设计器310来开发由机器人执行的工作流。工作流可以包括用户限定的活动320和ui自动化活动330。一些实施例能够标识图像中的非文本视觉成分，这在本文中被称为计算机视觉(cv)。与这些组件相关的一些cv活动可以包括但不限于点击、键入、获取文本、悬停、元素存在、刷新范围、突出显示等。在一些实施例中，点击使用例如cv、光学字符标识(ocr)、模糊文本匹配和多锚点来标识元素，并且点击元素。键入可以使用上述和元素中的类型来标识元素。获取文本可以标识特定文本的位置并且使用ocr对其扫描。悬停可以标识元素并且悬停在其上。元素存在可以使用上述技术来检查元素是否存在于屏幕上。在一些实施例中，可能有数百甚至数千个活动可以在设计器310中实现。然
而，任何数目和/或类型的活动都是可用的，而不脱离本发明的范围。
42.ui自动化活动330是以较低等级代码编写的特殊较低等级活动的子集(例如，cv活动)并且有益于与屏幕的互动。ui自动化活动330经由驱动器340来促进这些交互，该驱动器340允许机器人与期望的软件交互。例如，驱动器340可以包括os驱动器342、浏览器驱动器344、vm驱动器346、企业应用驱动器348等。
43.驱动器340可以在较低等级处与os互动，寻找挂钩，监控密钥等。它们可以促进与等的集成。例如，“点击”活动经由驱动器340在这些不同的应用中执行相同的角色。
44.图4是图示根据本发明实施例的rpa系统400的架构图。在一些实施例中，rpa系统400可以是或者可以包括图1和/或图2的rpa系统100和/或200。rpa系统400包括运行机器人的多个客户端计算系统410。计算系统410能够经由运行在其上的web应用来与指挥方计算系统420通信。指挥方计算系统420转而又能够与数据库服务器430和可选的索引器服务器440通信。
45.关于图1和图3，应注意的是，虽然在这些实施例中使用了web应用，可以使用任何合适的客户/服务器软件，而不脱离本发明范围。例如，指挥方可以运行与客户端计算系统上的非基于网络的客户软件应用通信的服务器侧应用。
46.图5是图示根据本发明实施例的被配置为执行用于rpa的基于多个ai层的过程提取的计算系统500的架构图。在一些实施例中，计算系统500可以是本文描绘和/或描述的计算系统中的一个或多个计算系统。计算系统500包括总线505或者用于传递信息的其他通信机制，以及耦合到总线505用于处理信息的(多个)处理器510。(多个)处理器510可以是任何类型的通用处理器或者专用处理器，包括中央处理单元(cpu)、专用集成电路(asic)、现场可编程门阵列(fpga)、图形处理单元(gpu)、其多个实例和/或其任何组合。(多个)处理器510还可以具有多个处理核，并且这些核中的至少一些核可以被配置为执行特定功能。在一些实施例中可以使用多并行处理。在某些实施例中，(多个)处理器510中的至少一个处理器可以是包括模拟生物神经元的处理元件的神经形态电路。在一些实施例中，神经形态电路可以不需要冯诺依曼计算架构的典型组件。
47.计算系统500还包括存储器515，用于存储信息和要由(多个)处理器510执行的指令。存储器515可以由随机存取存储器(ram)、只读存储器(rom)、闪存、高速缓存、诸如磁盘或者光盘静态存储器或者任何其他类型的非暂态计算机可读介质或者其组合的任意组合组成。非暂态计算机可读介质可以是能够由(多个)处理器510访问的任何可用介质，并且可以包括易失性介质、非易失性介质或两者。介质也可以是可移除的、不可移除的或两者。
48.附加地，计算系统500包括通信设备520，诸如收发器，以经由无线和/或有线连接提供对通信网络的访问。在一些实施例中，通信设备520可以被配置为使用频分多址(fdma)、单载波fdma(sc-fdma)、时分多址(tdma)、码分多址(cdma)、正交频分复用(ofdm)、正交频分多址(ofdma)、全局移动通信系统(gsm)、通用分组无线业务(gprs)、通用移动电信系统(umts)、cdma2000、宽带cdma(w-cdma)、高速下行链路分组接入(hsdpa)、高速上行链路分组接入(hsupa)、高速分组接入(hspa)高级lte(lte-a)、802.11x、wi-fi、zigbee、超宽带(uwb)、802.16x、802.15、家庭节点b(hnb)、蓝牙、射频标识(rfid)、红外数据协会(irda)、近场通信(nfc)、第五代(5g)、新无线电(nr)、它们的任何组合、和/或任何其他当前存在的或
者未来实现的通信标准和/或协议，而不脱离本发明的范围。在一些实施例中，通信设备520可以包括一个或多个天线，这些天线是单一的、阵列的、相控的、切换的、波束成形的、波束控制的、它们的组合，和/或任何其他天线配置，而不脱离本发明的范围。
49.(多个)处理器510还经由总线505耦合至显示器525，诸如等离子显示器、液晶显示器(lcd)、发光二极管(led)显示器、场发射显示器(fed)、有机发光二极管(oled)显示器、柔性oled显示器、柔性基板显示器、投影显示器、4k显示器、高清显示器、显示器、面内切换(ips)显示器或者任何其他适用于向用户显示信息的显示器。显示器525可以被配置为触摸(触觉)显示器、三维(3d)触摸显示器、多输入触摸显示器、多点触摸显示器等。使用电阻、电容、表面声波(saw)电容、红外、光学成像、色散信号技术、声脉冲标识、受抑全内反射等。可以使用任何合适的显示设备和触觉i/o，而不脱离本发明的范围。
50.键盘530和光标控制设备535(诸如，计算机鼠标、触摸板等)还耦合至总线505，以使用户能够与计算系统500交互。然而，在某些实施例中，可以不存在物理键盘和鼠标，并且用户可以仅通过显示器525和/或触摸板(未示出)来与设备交互。根据设计选择，可以使用任何类型和组合的输入设备。在某些实施例中，不存在物理输入设备和/或显示器。例如，用户可以经由与计算系统500通信的另一计算系统远程地与计算系统500交互，或者计算系统500可以自主地操作。
51.存储器515存储由(多个)处理器510执行时提供功能的软件模块。这些模块包括用于计算系统500的操作系统540。这些模块还包括过程提取模块545，过程提取模块被配置为执行本文描述的全部或者部分过程或者其派生物。计算系统500可以包括包括附加功能的一个或多个附加功能模块550。
52.本领域技术人员将理解，“系统”可以被具化为服务器、嵌入式计算系统、个人计算机、控制台、个人数字助理(pda)、蜂窝电话、平板计算设备、量子计算系统或者任何其他合适的计算设备或者设备组合，而不脱离本发明范围。将上述功能表示为由“系统”执行并且不旨在以任何方式限制本发明的范围，而是旨在提供本发明的多个实施例中的一个示例。实际上，本文公开的方法、系统和设备可以以与计算技术(包括云计算系统)一致的局部化和分布式形式来实现。
53.应注意的是，本说明书中描述的一些系统特征已作为模块而被表示，以便更具体地强调其实现独立性。例如，模块可以被实现为硬件电路，包括定制的超大规模集成(vlsi)电路或门阵列、诸如逻辑芯片、晶体管或者其他分立元件的现成半导体。模块也可以在可编程硬件设备中实现，例如现场可编程门阵列、可编程阵列逻辑、可编程逻辑设备、图形处理单元等。
54.模块也可以至少部分地在软件中实现，用于由各种类型的处理器执行。可执行代码的标识的单元可以例如包括计算机指令的一个或多个物理块或逻辑块，其可以例如被组织为对象、程序或者功能。然而，标识的模块的可执行文件不需要在物理上位于一起，而是可以包括存储在不同位置的不同指令，当这些指令在逻辑上结合在一起时，构成该模块并且实现针对该模块的所描述目的。此外，模块可以存储在计算机可读介质上，计算机可读介质可以是例如硬盘驱动、闪存设备、ram、磁带和/或用于存储数据的任何其他这种非暂态计算机可读介质，而不脱离本发明的范围。
55.实际上，可执行代码模块可以为单个指令或者多个指令，甚至可以在多个不同代
码段上、不同程序中以及跨多个存储设备中分布。类似地，操作数据在本文可以在模块内被标识和示出，并且可以以任何合适的形式被具化并且被组织在任何合适类型的数据结构内。操作数据可以作为单个数据集来收集，或者可以分布在不同的位置，包括在不同的存储设备上，并且可以至少部分地仅作为系统或者网络上的电子信号而存在。
56.图6是图示根据本发明实施例的被配置为使用多个ai层针对rpa执行基于ai的过程提取的系统600的架构图。系统600可以包括任何期望的数据源，诸如台式计算机602、平板计算机604和智能电话606，视频摄像头608。然而，可以使用任何期望的计算系统，包括但不限于智能手表、膝上型计算机、物联网(iot)设备、车辆计算系统、带有麦克风的监听设备、电子传感器等，而不脱离本发明范围。
57.在本实施例中每个计算系统602、604、606、608上都安装有监听器610。监听器610可以是经由rpa设计器应用、操作系统的一部分、用于个人计算机(pc)或者智能电话的可以下载应用、或者任何其他软件和/或硬件生成的机器人，而不脱离本发明的范围。实际上，在一些实施例中，一个或多个监听器610的逻辑部分地或者完全地经由物理硬件来实现。
58.监听器610生成数据，该数据之后经由网络620(例如，局域网(lan)、移动通信网络、卫星通信网络、互联网、其任何组合等)被发送至服务器630。被记录的数据可以包括但不限于哪些按钮曾被点击、鼠标曾被移动到哪里、在字段中曾输入的文本、一个窗口曾被最小化而另一窗口曾被打开、与窗口相关联的应用等。由监听器610生成的数据可以与以下相关但不限于：与计算系统的用户交互、音频、视频、光、热、运动、加速度、辐射等。在一些实施例中，服务器630可以运行指挥方方应用，并且数据可以作为心跳消息的部分被周期性地发送。在某些实施例中，一旦预先确定的数量的数据已经被收集、在预先确定的时间段已经过去后、或者在这两种情况下，数据可以被发送至服务器630。服务器630将从监听器610接收的数据存储在数据库640中。
59.当由人类用户(例如，rpa工程师或者数据科学家)指示时、当预先确定的数量的数据已经被收集时、当自上次分析以来预先确定的数量的时间已过去时等，服务器630访问在数据库640中存储的数据，并且通过多个ai层632运行数据。在一些实施例中ai层632处理日志数据并且标识其中潜在具有相关联的置信度的一个或多个潜在过程。在某些实施例中，每个单独的ai层632可以具有相关联的置信度阈值，以便提供正面的过程标识。在一些实施例中，可以给每个ai层632分配权重，诸如当ai层632具有不同的精度时。如果ai层632的集体置信水平超过某个阈值，则可以生成工作流。
60.ai层632可以执行统计建模(例如，隐马尔可夫模型(hmm))并且利用深度学习技术(例如，长短期记忆(lstm)深度学习、先前隐藏状态的编码等)并且执行案例标识以标识过程的原子实例。例如，对于发票处理，完成一张发票可以是一个案例。因此，系统确定一个案例在哪里结束，下一个案例在哪里开始。例如，打开电子邮件可以是案例的开始，并且可以分析案例的模式以确定变化和共性。
61.在一些实施例中，可以列出已被标识的过程用于用户审阅，并且可以按照各种因素进行排序，包括但不限于：指示给定过程针对rpa的适合程度的rpa得分(例如，基于自动化的复杂度、执行时间、对关键绩效指标的感知到的收益，诸如生成的收入、节省的收入、节省的时间等)、过程名称、总记录时间、曾执行过程的用户的数目、过程执行时间(例如，最少时间或者最多时间)等。当用户点击给定过程时，可以显示过程工作流，包括步骤、参数和互
连。在某些实施例中，可以仅使用从聚类角度看似乎重要的过程活动。
62.如果已存在类似过程，服务器630可以标识此相似性，并且知道已被标识的过程应当替代工作效果不佳的现有过程。例如，过程之间的相似性可以由共同的开始和结束以及其间采取的步骤中的一些统计共性而被确定。共性可以通过熵、过程检测目标函数的最小化等而被确定。
63.熵是对正在处理的信息的随机性的一种度量，熵越高，就越难从该信息中得出任何结论。因此，较低的熵表示较高的通用性。目标函数帮助ai算法达到实现给定目标的“胜利状态”。在一些实施例中，可以自动设置目标函数阈值，并且如果曾被系统标识为不相似的过程被用户指示为相似的，则这可以在训练期间被修改。服务器630然后可以自动生成包括被标识的过程的工作流，生成实现工作流的机器人(或者替代机器人)，并且将所生成的机器人推送到计算系统602、604、606、608以在其上执行。
64.备选地，在某些实施例中，可以经由计算系统650上的设计器应用652向rpa工程师展示来自ai层632的建议过程。rpa工程师然后能够审查工作流，做出任何期望的改变，然后经由机器人将工作流部署到计算系统602、604、606、608，或者使机器人被部署。例如，部署可以经由在服务器630或者另一服务器上运行的指挥方应用来发生，该指挥方应用可以将实现过程的机器人推送到计算系统602、604、606、608。在一些实施例中，该工作流部署可以经由设计方应用中的自动化管理器功能来实现，并且rpa工程师可以仅点击按钮以在机器人中实现过程。
65.ai层
66.在某些实施例中，可以使用多个ai层。每个ai层都是在日志数据上运行的算法(或者模型)，ai模型本身可以是在训练数据中训练的经训练的人工“神经元”的深度学习神经网络(dlnn)。层可以串行、并行或者串行和并行。例如，考虑具有四个ai层的实施例。在串行实现中，数据可以运行通过第1层，第1层的输出运行通过第2层，第2层的输出运行通过第3层，第3层的输出运行通过第4层。在并行实现中，数据可以单独地运行通过第1层至第4层。在组合实现中，数据可以被馈送串行通过第1层和第2层，然后输出并行通过第3层和第4层，数据可以并行通过第1层和第2层，来自第1和第2的每个层的输出可以被馈送串行通过第3层和第4层。
67.人工智能层可以包括但不限于序列提取层、聚类检测层、视觉成分检测层、文本识别层(例如，光学字符标识ocr)、音频-到文本转换层等。然而，可以使用任何期望数目的层，而不脱离本发明的范围的情况下。使用多层可以允许系统开发屏幕或者过程中正在发生的事情的全局画面。例如，一个ai层可以执行ocr，另一可以检测按钮等。
68.模式可以由ai层单独确定，或者由多个ai层共同确定。可以使用用户动作方面的概率或者输出。例如，为了确定按钮的细节、其文本、用户曾点击的位置等，系统可能需要知道按钮在哪里、它的文本、在屏幕上的位置等。
69.序列提取层可以从收集的数据中标识计算系统或者其用户(如适用)倾向于采取的相同或者相似的动作序列。例如，如果在呼叫之后，用户倾向于打开某个软件应用程序，输入来自该呼叫的摘要，然后生成包括摘要的电子邮件，则序列提取层可以标识该模式并且推荐包括自动记录呼叫、将呼叫音频转换成文本、打开应用程序、将文本输入到应用程序中、并且提示用户查看其内容的逻辑的工作流序列。如果被确认，该工作流可以包括用于自
动生成和发送具有该内容的电子邮件的逻辑。
70.聚类层可以基于相似性或者不相似性来检测数据集中某一类型或者类别的数据点倾向于以某一结构和分组(grouping)出现。在一些实施例中，这可以是无监管的机器学习技术。样例可以明确地归入类别。备选地，概率分布可以用于整个类别。
71.视觉成分检测层可以检测图像中的视觉成分，并且在来自计算系统(或者特定类型的计算系统)的数据中的检测到的成分中寻找共同模式。在一些实施例中，这可以是寻找视觉成分和它们之间的关系的cv模型。
72.文本识别层可以识别图像中的文本，并且在来自计算系统(或者特定类型的计算系统)的数据中的检测到的文本中寻找共同模式。例如，如果图像包括具有特定字段的文档，并且用户倾向于用特定名称、单词或者短语填充该字段，则文本识别层可以确定该条目应该在工作流中自动化。例如，自动化可以包括基于文本字段在坐标中的屏幕位置点击文本字段并且输入文本“uipath”的工作流步骤。
73.音频-到文本转换层可以将数据中的音频文件转换为计算系统可以理解形式的数字文本(例如，ascii、unicode等)。该层然后可以确定某些单词或者短语倾向于出现。当给定特定用户活动的上下文时，这可以指示用户对软件应用程序的特定部分感到沮丧。然后可以建议识别(多个)短语的频率模式的自动化，并且在用户说出(多个)短语时打开帮助窗口。例如，如果用户说脏话，这可以表明他或者她对该软件感到沮丧。
74.由ai层632执行的分析可以视为提取过程的“检测侧”。在由ai层632执行分析之后，由该分析生成的机器人形式的自动化可以被推送到计算系统602、604、606、608。在一些实施例中，机器人可以仅被推出到单个计算系统，或者具有特定类型或者硬件能力的计算系统。然后，机器人可以通过实现它来执行提取过程的“致动侧”。
75.图7是图示根据本发明实施例的使用ai层针对rpa的基于ai的过程提取的过程700的流程图。过程开始于在710处取回由计算系统监听器收集的数据。在一些实施例中，来自监听器的数据包括：与计算系统的用户交互、音频、视频、光、热、运动、加速度、辐射、或者其任何组合。在720处数据运行通过多个ai层以开发数据的全局图像。ai层包括序列提取层、聚类检测层、视觉成分检测层、文本识别层、音频-到文本转换层、或者其任何组合。在730处ai层处理数据并且标识其中超过置信度阈值的一个或多个潜在过程。在一些实施例中，每个单独的ai层具有基于其估计的准确度的相关联的修正值。在某些实施例中，仅当已经超过针对所有层的集体置信度阈值时，才生成工作流。在740处针对超过置信度阈值的(多个)过程生成(多个)工作流，并且在750处从(多个)工作流中生成机器人。
76.图8是图示根据本发明实施例的使用ai层针对rpa的基于ai的过程提取的过程800的流程图。过程开始于在810处取回由监听器从多个计算系统收集的数据。在一些实施例中，由监听器收集的数据包括：与相应的用户计算系统的用户交互、音频、视频、光、热、运动、加速度、辐射、或者其任何组合。
77.在820处，由监听器收集的数据运行通过多个ai层，以处理收集的数据，并且标识收集的数据中超过置信阈值的一个或多个rpa过程。在一些实施例中，多个ai层包括序列提取层、聚类检测层、视觉成分检测层、文本识别层、音频-到文本转换层、或者其任何组合。在某些实施例中，每个单独的ai层具有基于其估计的准确度的相关联的修正值。在一些实施例中，rpa工作流仅在已经超过所有ai层的集体置信度阈值时才被生成。在某些实施例中，
多个ai层被配置为执行统计建模并且利用深度学习技术来标识集合中超过置信度阈值的一个或多个潜在rpa过程。在一些实施例中，所收集的数据串行、并行、或者以串行ai层和并行ai层两者的组合运行通过多个ai层。
78.当在830处超过置信度阈值的rpa过程被标识时，在840处针对被标识的rpa过程生成rpa工作流，并且在850处针对被标识的rpa过程生成被配置为执行生成的rpa工作流的机器人。当在860处与被标识的潜在rpa过程相似的现有rpa过程被标识时，在870处确定与被标识的所述rpa过程相比，现有rpa过程工作得不佳(即，被标识的过程更好)。如果是，则在880处通过利用生成的机器人替换执行现有rpa过程的现有机器人，利用被标识的潜在rpa过程替换现有rpa过程。在一些实施例中，通过熵、过程检测目标函数的最小化、或者其组合来确定现有过程和被标识的潜在rpa过程之间的相似性。
79.根据本发明的实施例，图7和图8中执行的过程步骤可以由计算机程序执行，针对(多个)处理器的指令进行编码，以执行图7和图8中描述的至少部分过程。计算机程序可以被具化在非暂态计算机可读介质上。计算机可读介质可以是但不限于硬盘驱动器、闪存设备、ram、磁带和/或用于存储数据的任何其他这样的介质或者介质的组合。计算机程序可以包括用于控制计算系统的(多个)处理器(例如，图5的计算系统500的(多个)处理器510)以实现图7和图8中描述的全部或者部分过程步骤的编码指令，该编码指令也可以存储在计算机可读介质上。
80.计算机程序可以在硬件、软件或者混合实施方式中实现。计算机程序可以由彼此可操作通信的模块组成，并且被设计为传递信息或者指令以显示。计算机程序可以被配置为在通用计算机、asic或者任何其他合适的设备上运行。
81.容易理解的是，本发明各种实施例的组件，如本文附图中一般描述和说明的，可以按各种不同配置进行排列和设计。因此，如附图中所示，本发明的实施例的详细描述不旨在限制所要求保护的本发明的范围，而仅是本发明的所选择的实施例的代表。
82.本说明书中描述的本发明的特征、结构或者特性可以在一个或多个实施例中以任何合适的方式进行组合。例如，在整个说明书中，对“某些实施例”、“一些实施例”或者类似语言的引用意味着结合本实施例所描述的特定特征、结构或者特性包括在本发明的至少一个实施例中。因此，在整个说明书中出现的短语“在某些实施例中”、“在一些实施例中”、“在其他实施例中”或者类似语言不必然都指同一组实施例，并且所描述的特征、结构或者特性可以以任何合适的方式组合在一个或多个实施例中。
83.应注意，贯穿本说明书中提及的特征、优点或者类似语言并且不意味着本发明可以实现的所有特征和优点应当位于本发明的任何单个实施例中。相反，关于特征和优点的语言被理解为意味着结合实施例描述的特定特征、优点或者特性被包括在本发明的至少一个实施例中。因此，贯穿本说明书的特征和优点的讨论以及类似的语言可以但不必然指同一实施例。
84.此外，本发明的所述特征、优点和特性可以在一个或多个实施例中以任何合适的方式进行组合。相关领域的技术人员将认识到，本发明可以在没有特定实施例的一个或多个具体特征或者优点的情况下实践。在其他实例中，可以在某些实施例中认识到附加的特征和优点，这些特征和优点可能不存在于本发明的所有实施例中。
85.本领域普通技术人员将容易理解，上述本发明可以利用不同顺序的步骤和/或利
用不同于所公开配置的硬件元件而被实践。因此，尽管已经基于这些优选实施例描述了本发明，但是对于本领域的技术人员，在保持在本发明的精神和范围内的同时，某些修改、变型和备选结构将是明显的。因此，为了确定本发明的界限和边界，应当参考所附权利要求。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：调整环控设备的方法及建立环控设备的比对数据库方法

用于机器人流程自动化的基于人工智能层的过程提取的制作方法

相关文献

最热文献