一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

作业热迁移的方法、装置、电子设备及存储介质与流程

2022-02-21 03:53:48 来源:中国专利 TAG:

技术特征:
1.一种作业热迁移的方法,其特征在于,所述方法包括:资源调度系统的节点管理器向资源管理器发送通知消息,所述通知消息指示所述节点管理器所在的源节点上运行的目标作业的任务需要热迁移;所述资源管理器基于所述通知消息获取所述资源调度系统中其他节点的负载信息,基于所述负载信息确定所述任务热迁移的目的节点;所述资源管理器获取所述目的节点的节点信息,向所述源节点发送所述节点信息;所述源节点基于所述节点信息,将所述任务热迁移至所述目的节点。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:在所述源节点上的所述任务启动运行时,将所述源节点上的所述任务挂载至远程磁盘;将所述任务运行时产生的相关数据写入所述远程磁盘;在所述将所述任务热迁移至所述目的节点的步骤完成时,将所述目的节点上迁移后的所述任务挂载至所述远程磁盘,并断开所述源节点上的所述任务与所述远程磁盘之间的挂载。3.根据权利要求1或2所述的方法,其特征在于,所述源节点基于所述节点信息,将所述任务热迁移至所述目的节点的步骤,包括:生成所述任务的快照数据;将所述快照数据拷贝至所述节点信息指示的所述目的节点;所述目的节点配置容器网络,以在所述快照数据拷贝完成时建立所述目的节点上的宿主机与容器的网络连接,所述容器用于运行迁移后的所述任务;其中,所述目的节点配置的容器网络的配置信息与所述源节点中容器网络的配置信息相同。4.根据权利要求3所述的方法,其特征在于,在所述将所述快照数据拷贝至所述目的节点的步骤之后,所述方法还包括:将所述任务继续运行服务生成的更新快照数据存入内存分区,并同步至所述目的节点。5.根据权利要求1或2所述的方法,其特征在于,所述目标作业是离线作业,所述资源调度系统的节点管理器向资源管理器发送通知消息的步骤,包括:所述节点管理器获取所述源节点上运行的在线作业的资源使用率;在所述资源使用率大于预设使用率阈值时,所述节点管理器发送所述通知消息。6.根据权利要求1或2所述的方法,其特征在于,所述确定所述任务热迁移的目的节点的步骤之后,所述方法还包括:所述资源管理器接收所述目的节点的节点管理器发送的心跳数据,基于所述心跳数据在所述目的节点上分配运行所述任务所需的资源。7.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:在将所述任务热迁移至所述目的节点未完成之前,所述资源管理器若接收到新作业的资源申请请求,则基于所述目的节点以外的其他节点的节点管理器汇报的可用资源信息,将所述其他节点中的至少一个节点上的资源分配给所述新作业对应的应用管理器;所述应用管理器获取分配的资源后,与所述至少一个节点的节点管理器通信,以启动
所述新作业对应的任务。8.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:若资源管理器接收到所述源节点发送的热迁移结束指令,则删除资源管理器中所述目标作业的任务在所述源节点上的资源分配记录。9.一种作业热迁移的装置,其特征在于,所述装置包括:消息发送模块,用于使资源调度系统的节点管理器向资源管理器发送通知消息,所述通知消息指示所述节点管理器所在的源节点上运行的目标作业的任务需要热迁移;节点确定模块,用于使所述资源管理器基于所述通知消息获取所述资源调度系统其他节点的负载信息,基于所述负载信息确定所述任务热迁移的目的节点;节点信息处理模块,用于使所述资源管理器获取所述目的节点的节点信息,向所述源节点发送所述节点信息;作业迁移模块,用于使所述源节点基于所述节点信息,将所述任务热迁移至所述目的节点。10.一种电子设备,其特征在于,包括处理器和存储介质,所述存储介质存储有能够被所述处理器执行的可执行指令,所述处理器被所述可执行指令促使实现:如权利要求1-8中任一项所述作业热迁移的方法。11.一种计算机可读存储介质,其特征在于,所述存储介质存储有可执行指令,在被处理器调用和执行时实现:如权利要求1-8中任一项所述作业热迁移的方法。

技术总结
本公开涉及一种作业热迁移的方法、装置、电子设备及存储介质,方法包括:资源调度系统的节点管理器向资源管理器发送通知消息,通知消息指示节点管理器所在的源节点上运行的目标作业的任务需要热迁移;资源管理器获取系统中其他节点的负载信息,基于负载信息确定任务热迁移的目的节点;资源管理器向源节点发送目的节点的节点信息;源节点基于节点信息将任务热迁移至目的节点。本公开实施例方案使得目标作业可以继续在目的节点上运行,而不是完全被腾退掉,实现了目标作业的持续运行,尤其是针对需要长时间训练的作业,极大地缩短了作业的整体运行时间,提升了作业运行效率;同时可为源节点上其他作业空出资源,提高其他作业的任务的运行效率。务的运行效率。务的运行效率。


技术研发人员:李亚坤 张扬 刘纬 张云尧
受保护的技术使用者:北京字节跳动网络技术有限公司
技术研发日:2021.08.13
技术公布日:2022/1/21
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献