一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

网络自动化脚本的爬虫的制作方法

2022-03-01 08:04:59 来源:中国专利 TAG:

技术特征:

1.一种用于构建用以在网站上执行由查询描述的任务的UI脚本的方法,所述方法包括:

接收所述查询以及所述网站的统一资源定位符(URL),所述查询指定要执行的任务并且所述网站包括具有UI元素的一个或多个网页;

创建用以执行任务代理运行的任务代理,所述任务代理运行包括所述一个或多个网页中的UI元素的不同动作序列;

分析所述网页在执行在所述任务代理运行中执行的UI元素的每个动作后的状态;

基于所述网页在执行所述UI元素的动作后的状态来向所述任务代理运行分配分数;以及

基于所述任务代理运行的所分配的分数来生成用于执行由所述查询描述的所述任务的所述UI脚本。

2.如权利要求1所述的方法,其中所述查询是自然语言查询。

3.如权利要求1所述的方法,其中所述查询由用户通过客户端计算设备上的数字助理来提交。

4.如权利要求1所述的方法,其中所述基于所分配的分数来生成用于执行由所述查询描述的所述任务的所述UI脚本包括:

从所述任务代理运行中生成小任务,所述小任务包括由所述任务代理运行对所述UI元素执行的动作序列;

将所述任务代理运行的分数分配给所述小任务;

基于所述分数来从所述小任务中选择应答小任务;以及

将所述应答小任务存储为所述UI脚本。

5.如权利要求1所述的方法,其中所述分数基于执行动作后的所述一个或多个网页中的文本相对于所述查询中的文本的相似度来分配给所述任务代理运行。

6.如权利要求1所述的方法,其中所述分数基于所执行的UI元素相对于所述一个或多个网页中的另一UI元素的动作局部性来分配给所述任务代理运行。

7.如权利要求1所述的方法,其中所述分数基于所执行的UI元素相对于所述一个或多个网页中的先前执行的UI元素的动作方向性来分配给所述任务代理运行。

8.如权利要求1所述的方法,其中所述查询由开发者通过用于客户端计算设备上的过程自动化的工具来提交。

9.如权利要求8所述的方法,进一步包括:

分析所述查询的语义;

识别所述查询的文本;

将参数分配给所述查询的经识别文本;以及

使用所分配的参数来参与所述UI元素中的至少一者。

10.如权利要求1所述的方法,进一步包括由物联网(IoT)设备或机器人来执行所述UI脚本。

11.如权利要求1所述的方法,进一步包括将所述任务代理训练成主任务代理。

12.如权利要求11所述的方法,进一步包括将所述任务代理训练成与附加子任务代理交互以执行所述任务代理运行的各部分。

13.如权利要求11所述的方法,其中所述分数分配基于所述UI元素的动作中的至少一者来加权的奖励。

14.一种用于构建用以应答对网站的查询的UI脚本的计算设备,所述计算设备包括:

包含有用于生成任务代理的指令的存储器,所述任务代理执行所述网站的网页中的UI元素上的动作的各种任务代理运行;以及

被编程为执行以下操作的一个或多个处理器:

接收所述查询以及所述网站的统一资源定位符(URL),所述查询指定要执行的任务并且所述网站包括具有UI元素的一个或多个网页;

创建用以执行任务代理运行的任务代理,所述任务代理运行包括所述一个或多个网页中的UI元素的不同动作序列;

分析所述网页在执行在所述任务代理运行中执行的UI元素的每个动作后的状态;

基于所述网页在执行所述UI元素的动作后的状态来向所述任务代理运行分配分数;以及

基于所述任务代理运行的所分配的分数来生成用于执行由所述查询描述的所述任务的所述UI脚本。

15.如权利要求14所述的计算设备,其中所述基于所分配的分数来生成用于应答所述查询的所述UI脚本包括:

从所述任务代理运行中生成小任务,所述小任务包括由所述任务代理在所述UI元素中执行的动作序列;

将所述任务代理运行的分数分配给所述小任务;

基于所述分数来从所述小任务中选择应答小任务;以及

将所述应答小任务存储为所述UI脚本。

16.如权利要求14所述的计算设备,其中所述一个或多个处理器被进一步编程为:

将所述代理训练成主任务代理;以及

控制所述主任务代理以指示子任务代理在所述UI元素中执行至少一个动作。

17.如权利要求14所述的计算设备,其中所述一个或多个处理器被进一步编程为:

分析所述查询的语义;

识别所述查询的文本;

将参数分配给所述查询的经识别文本;以及

使用所分配的参数来参与所述UI元素中的至少一者。

18.如权利要求14所述的计算设备,其中所述查询是自然语言查询。

19.如权利要求14所述的计算设备,其中所述分数基于执行UI元素的动作后的所述网页中的文本相对于所述查询的文本的相似度来分配。

20.一种或多种包含有计算机可执行指令的计算机存储存储器,所述计算机可执行指令用于构建用以应答对网站的查询的UI脚本,所述一种或多种计算机存储存储器包括:

查询解析器,其被配置成接收所述查询以及所述网站的统一资源定位符(URL),所述查询指定要执行的任务并且所述网站包括具有UI元素的一个或多个网页;

代理生成器,其被配置成创建用以执行不同任务代理运行的任务代理,所述任务代理运行包括所述一个或多个网页中的UI元素的动作序列;

奖励模块,其被配置成分析所述网页的状态并基于执行由所述任务代理执行的所述UI元素的每个动作后的状态来向所述任务代理运行分配分数;

强化学习(RL)模块,其被配置成基于所述网页的状态和所述分数来选择用于所述任务代理运行的动作;以及

后处理模块,其被配置成分析所述任务代理运行的分数并选择应答所述查询的应答小任务。


技术总结
对于指定要对网站执行的任务的给定输入查询,在不具有关于该网站或该查询的任何先前知识的情况下,对正确的动作序列(或UI脚本)进行机器学习。为了学习正确的UI脚本,创建任务代理,该任务代理执行多个任务代理运行,包括对网站上的UI元素(例如,按钮、文本域、菜单等)的不同动作序列。在执行对UI元素的每一个动作后监视网页的状态。创建小任务,这些小任务包括对于每一个任务代理所执行的动作序列以及分配给小任务的分数,并且基于分数来从这些小任务中选择正确的UI脚本(例如,具有最高分数的小任务)。

技术研发人员:O·里瓦;李元春;
受保护的技术使用者:微软技术许可有限责任公司;
技术研发日:2020.05.25
技术公布日:2022.03.01
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献