一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种任务处理方法、装置、设备及存储介质

2022-05-31 17:46:01 来源:中国专利 TAG:

技术特征:
1.一种用于强化学习任务的任务处理方法,其特征在于,所述方法包括:在接收到强化学习任务的情况下,基于所述强化学习任务的任务描述信息,确定用于处理所述强化学习任务所需的配置资源;基于所述配置资源,生成针对所述强化学习任务的第一容器;在所述第一容器中创建用于处理所述强化学习任务的任务处理引擎,所述任务处理引擎包括用于任务处理中进行任务统筹的第一组件;基于所述任务处理引擎处理所述强化学习任务。2.根据权利要求1所述的方法,其特征在于,在所述基于所述强化学习任务的任务描述信息,确定用于处理所述强化学习任务的所需的配置资源之前,所述方法包括:在接收到强化学习任务的情况下,拦截所述强化学习任务;基于预设的准入条件,对所述强化学习任务进行校验;在确定所述强化学习任务满足所述准入条件的情况下,确定接收到所述强化学习任务。3.根据权利要求1所述的方法,其特征在于,所述基于所述配置资源,生成针对所述强化学习任务的第一容器,包括:获取当前可用的至少一个资源节点,并确定各资源节点中当前可用的剩余资源,其中,所述剩余资源包括所述资源节点中当前可用的图形处理单元的数量;从至少一个资源节点中确定第一资源节点,其中,所述第一资源节点中的剩余资源满足处理所述强化学习任务所需的配置资源;在所述第一资源节点中生成针对所述强化学习任务的第一容器。4.根据权利要求3所述的方法,其特征在于,所述在所述第一容器中创建用于处理所述强化学习任务的任务处理引擎,包括:基于所述任务描述信息指示的所述配置资源,在所述强化学习任务需要在所述第一资源节点进行处理的情况下,在所述第一容器中创建第一组件,以搭建用于处理所述强化学习任务的任务处理引擎。5.根据权利要求3所述的方法,其特征在于,所述基于所述任务处理引擎处理所述强化学习任务,包括:在所述强化学习任务的各任务环节需要在所述第一资源节点进行处理的情况下,控制所述第一组件运行任务处理逻辑,以处理所述强化学习任务。6.根据权利要求3所述的方法,其特征在于,所述基于所述任务处理引擎处理所述强化学习任务,包括:在所述强化学习任务的各任务环节需要在不同资源节点中处理的情况下,在接收到所述第一组件发送的组件创建请求后,基于所述配置资源指示的所述强化学习任务所需的计算资源和存储资源,分别从所述至少一个资源节点中除所述第一资源节点之外的其他资源节点中确定出满足所述强化学习任务所需的配置资源的至少一个第二资源节点和至少一个第三资源节点;基于所述存储资源,在所述至少一个第二资源节点中生成至少一个第二容器,并在所述第二容器中创建第二组件;所述任务处理引擎包括创建的至少一个第二组件;基于所述计算资源,在所述至少一个第三资源节点中生成至少一个第三容器,并在所
述第三容器中创建第三组件;所述任务处理引擎包括创建的至少一个第三组件;基于所述第一组件、所述至少一个第二组件和所述至少一个第三组件,处理所述强化学习任务。7.根据权利要求6所述的方法,其特征在于,所述在所述第二容器中创建第二组件,并在所述第三容器中创建第三组件之后,所述方法包括:将每个所述第二组件的地址和端口,以及每个所述第三组件的地址和端口发送给所述第一组件。8.根据权利要求6所述的方法,其特征在于,所述方法包括:在接收到所述第一组件发送的针对所述至少一个第二组件和/或所述至少一个第三组件的组件处理请求的情况下,针对所述至少一个第二组件和/或所述至少一个第三组件,执行与所述组件处理请求对应的处理,所述组件处理请求包括增加和/或删除组件。9.根据权利要求6所述的方法,其特征在于,在需要生成的第三组件为强化学习组件的情况下,所述基于所述计算资源,在所述至少一个第三资源节点中生成至少一个第三容器,并在所述第三容器中创建第三组件;所述任务处理引擎包括创建的至少一个第三组件,包括:确定每个所述第三资源节点中图形处理单元的可用数量;基于所述配置资源指示的所述强化学习任务所需的计算资源,确定针对所述强化学习任务所需的图形处理单元的使用数量;若所述至少一个第三资源节点中存在图形处理单元的可用数量大于或者等于所述使用数量的目标资源节点,基于所述使用数量,在所述目标资源节点中生成至少两个第三容器;在所述至少两个第三容器中的任一第三容器中创建数据聚合管理组件,并在所述至少两个第三容器除所述任一第三容器外的其他第三容器中创建第三组件;若所述至少一个第三资源节点中不存在图形处理单元的可用数量大于或者等于所述使用数量的目标资源节点,基于所述使用数量,在所述至少一个第三资源节点中生成至少两个第三容器;在所述至少两个第三容器中的任一第三容器中创建数据聚合管理组件,并在所述至少两个第三容器除所述任一第三容器外的其他第三容器中创建第三组件。10.根据权利要求1所述的方法,其特征在于,在所述基于所述任务处理引擎处理所述强化学习任务之后,所述方法包括:若在处理所述强化学习任务的过程中发生异常,生成异常提示信息;将所述异常提示信息推送给提交所述强化学习任务的用户。11.根据权利要求1-10任一所述的方法,其特征在于,所述方法包括:基于所述第一容器中所述第一组件的运行状态,对所述强化学习任务的处理进程进行任务状态标记。12.根据权利要求11所述的方法,其特征在于,所述基于所述第一容器中所述第一组件的运行状态,对所述强化学习任务的处理进程进行任务状态标记,包括以下至少一种情况:在所述第一组件被创建完毕的情况下,将所述强化学习任务标记为已创建状态;在所述第一组件处于运行中的情况下,将所述强化学习任务标记为正在处理的状态;在所述第一组件运行结束的情况下,将所述强化学习任务标记为已完成状态;在所述第一组件运行的过程中,若发生异常的情况下,将所述强化学习任务标记为异
常状态。13.一种用于强化学习任务的任务处理装置,其特征在于,所述装置包括:任务接收模块,用于在接收到强化学习任务的情况下,基于所述强化学习任务的任务描述信息,确定用于处理所述强化学习任务所需的配置资源;容器生成模块,用于基于所述配置资源,生成针对所述强化学习任务的第一容器;引擎创建模块,用于在所述第一容器中创建用于处理所述强化学习任务的任务处理引擎,所述任务处理引擎包括用于任务处理中进行任务统筹的第一组件;任务处理模块,用于基于所述任务处理引擎处理所述强化学习任务。14.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至12中任一项所述的用于强化学习任务的任务处理方法的步骤。15.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至12中任一项所述的用于强化学习任务的任务处理方法的步骤。

技术总结
本公开提供了一种用于强化学习任务的任务处理方法、装置、设备及存储介质,可以通过强化学习任务的任务描述信息,通过解析出所需的配置资源,进而生成针对强化学习任务的第一容器,在第一容器中创建用于处理强化学习任务的任务处理引擎,任务处理引擎包括用于任务处理中进行任务统筹的第一组件,以实现处理强化学习任务。这样,通过容器搭建任务处理引擎,将任务处理引擎置于容器中,依托于容器的单一性和隔离性,使得各任务使用的资源之间无干扰,保证任务处理的性能,而且对于任务处理引擎的维护和检测等,可以通过容器的配置等方面进行实现,在决策智能引擎之外即可完成,有效降低对于引擎底层代码的变动和入侵,降低决策智能引擎的负担。擎的负担。擎的负担。


技术研发人员:李青坪 李健文 吴保东 牛雅哲 刘宇 翟季冬
受保护的技术使用者:清华大学
技术研发日:2022.03.17
技术公布日:2022/5/30
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献