一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于在虚拟化环境中利用检查点认证进行虚拟机迁移的方法与流程

2022-07-10 14:10:19 来源:中国专利 TAG:

技术特征:
1.一种计算机实施的方法,其迁移正在执行访问人工智能ai加速器的虚拟功能的应用程序的源虚拟机vm-s,所述方法包括:将所述vm-s的一种状态的检查点存储到所述vm-s的多种状态的存储装置中,其中,所述vm-s的每种状态包括所述vm-s的资源的状态、所述应用程序的状态、以及所述ai加速器的将ai资源映射到所述vm-s的虚拟功能的状态;响应于接收到迁移所述vm-s和所述虚拟功能的命令以及接收到对要用于执行所述迁移的状态的检查点的选择:记录、然后停止一个或多个正在执行的ai任务;使用所选择的检查点将所述vm-s、所述应用程序、所述一个或多个ai任务和所述虚拟功能迁移到目标主机上的目标vm(vm-t);以及响应于从目标管理程序接收到所述检查点由所述目标管理程序成功地验证并且所述迁移成功地完成的通知,vm-s的管理程序命令所述目标主机的管理程序重新开始所记录的一个或多个ai任务以及重新开始所述应用程序。2.根据权利要求1所述的方法,其中,所述虚拟功能将所述ai加速器的资源映射到所述vm-s,且所述vm-s的用户是能够访问其资源通过所述虚拟功能被映射到所述vm-s的所述ai加速器的资源的唯一用户。3.根据权利要求2所述的方法,其中,所述虚拟功能将多个ai加速器的资源映射到所述vm-s,并且所述检查点包括所述多个ai加速器之间的通信配置,且所述vm-s的用户是能够访问通过所述虚拟功能被映射到所述vm-s的所述多个ai加速器的资源的唯一用户。4.根据权利要求1所述的方法,其进一步包括:响应于从所述目标管理程序接收到所述vm-s的迁移完成并且已成功地重新开始所述一个或多个所记录的ai任务的通知:至少擦除所述ai加速器的安全存储器,包括任何ai推理、ai模型、安全计算的中间计算、或其部分;以及擦除与所述虚拟功能相关联的所述vm-s的存储器以及由所述应用程序对所述虚拟功能的任何调用。5.根据权利要求1所述的方法,其中,验证包括验证所述检查点的签名和新鲜性日期,包括:使用所述vm-s的公钥来解密所述检查点的签名;确定所述检查点的日期和时间戳在阈值日期和时间范围内;以及验证所述vm-s的检查点的哈希。6.根据权利要求1所述的方法,其中,所述检查点包括:一个或多个正在执行的ai任务的记录;通信地联接到所述vm-s的一个或多个ai加速器内资源的配置信息;所述检查点的日期和时间戳;以及所述vm-s的存储器的快照,包括虚拟功能调度信息和所述一个或多个ai加速器内的通信缓冲器。7.一种用可执行指令编程的计算机可读介质,所述可执行指令在由具有通信地联接到至少一个人工智能ai处理器的至少一个硬件处理器的处理系统执行时,执行迁移正在执行
访问所述至少一个ai处理器的虚拟功能的应用程序的源虚拟机vm-s的操作,所述操作包括:将所述vm-s的一种状态的检查点存储到所述vm-s的多种状态的存储装置中,其中,所述vm-s的每种状态包括所述vm-s的资源的状态、所述应用程序的状态、以及所述ai加速器的将ai资源映射到所述vm-s的虚拟功能的状态;响应于接收到迁移所述vm-s和所述虚拟功能的命令以及接收到对要用于执行所述迁移的状态的检查点的选择:记录、然后停止一个或多个正在执行的ai任务;使用所选择的检查点将所述vm-s、所述应用程序、所述一个或多个ai任务和所述虚拟功能迁移到目标主机上的目标vm(vm-t);以及响应于从目标管理程序接收到所述检查点由所述目标管理程序成功地验证并且所述迁移成功地完成的通知,vm-s的管理程序命令所述目标主机的管理程序重新开始所记录的一个或多个ai任务以及重新开始所述应用程序。8.根据权利要求7所述的计算机可读介质,其中,所述虚拟功能将所述ai加速器的资源映射到所述vm-s,且所述vm-s的用户是能够访问其资源通过所述虚拟功能被映射到所述vm-s的所述ai加速器的资源的唯一用户。9.根据权利要求8所述的计算机可读介质,其中,所述虚拟功能将多个ai加速器的资源映射到所述vm-s,并且所述检查点包括所述多个ai加速器之间的通信配置,且所述vm-s的用户是能够访问通过所述虚拟功能被映射到所述vm-s的所述多个ai加速器的资源的唯一用户。10.根据权利要求7所述的计算机可读介质,其中,所述操作进一步包括:响应于从所述目标管理程序接收到所述vm-s的迁移完成并且已成功地重新开始所述一个或多个所记录的ai任务的通知:至少擦除所述ai加速器的安全存储器,包括任何ai推理、ai模型、安全计算的中间计算、或其部分;以及擦除与所述虚拟功能相关联的所述vm-s的存储器以及由所述应用程序对所述虚拟功能的任何调用。11.根据权利要求7所述的计算机可读介质,其中,验证包括验证所述检查点的签名和新鲜性日期,包括:使用所述vm-s的公钥来解密所述检查点的签名;确定所述检查点的日期和时间戳在阈值日期和时间范围内;以及验证所述vm-s的检查点的哈希。12.根据权利要求7所述的计算机可读介质,其中,所述检查点包括:一个或多个正在执行的ai任务的记录;通信地联接到所述vm-s的一个或多个ai加速器内资源的配置信息;所述检查点的日期和时间戳;以及所述vm-s的存储器的快照,包括虚拟功能调度信息和所述一个或多个ai加速器内的通信缓冲器。13.一种系统,其包括联接到用指令编程的存储器的至少一个硬件处理器,所述指令在
由通信地联接到人工智能ai加速器的所述至少一个硬件处理器执行时致使所述系统执行用于迁移正在执行访问所述ai加速器的虚拟功能的应用程序的源虚拟机vm-s的操作,所述操作包括:将所述vm-s的一种状态的检查点存储到所述vm-s的多种状态的存储装置中,其中,所述vm-s的每种状态包括所述vm-s的资源的状态、所述应用程序的状态、以及所述ai加速器的虚拟功能的状态;响应于接收到迁移所述vm-s和所述虚拟功能的命令以及接收到对要用于执行所述迁移的状态的检查点的选择:记录、然后停止一个或多个正在执行的ai任务;使用所选择的检查点将所述vm-s、所述应用程序、所述一个或多个ai任务和所述虚拟功能迁移到目标主机上的目标vm(vm-t);以及响应于从目标管理程序接收到所述检查点由所述目标管理程序成功地验证并且所述迁移成功地完成的通知,vm-s的管理程序命令所述目标主机的管理程序重新开始所记录的一个或多个ai任务以及重新开始所述应用程序。14.根据权利要求13所述的系统,其中,所述虚拟功能将所述ai加速器的资源映射到所述vm-s,且所述vm-s的用户是能够访问其资源通过所述虚拟功能被映射到所述vm-s的所述ai加速器的资源的唯一用户。15.根据权利要求14所述的系统,其中,所述虚拟功能将多个ai加速器的资源映射到所述vm-s,并且所述检查点包括所述多个ai加速器之间的通信配置,且所述vm-s的用户是能够访问通过所述虚拟功能被映射到所述vm-s的所述多个ai加速器的资源的唯一用户。16.根据权利要求13所述的系统,其中,所述操作进一步包括:响应于从所述目标管理程序接收到所述vm-s的迁移完成并且已成功地重新开始所述一个或多个所记录的ai任务的通知:至少擦除所述ai加速器的安全存储器,包括任何ai推理、ai模型、安全计算的中间计算、或其部分;以及擦除与所述虚拟功能相关联的所述vm-s的存储器以及由所述应用程序对所述虚拟功能的任何调用。17.根据权利要求13所述的系统,其中,验证包括验证所述检查点的签名和新鲜性日期,包括:使用所述vm-s的公钥来解密所述检查点的签名;确定所述检查点的日期和时间戳在阈值日期和时间范围内;以及验证所述vm-s的检查点的哈希。18.根据权利要求13所述的系统,其中,所述检查点包括:一个或多个正在执行的ai任务的记录;通信地联接到所述vm-s的一个或多个ai加速器内资源的配置信息;所述检查点的日期和时间戳;以及所述vm-s的存储器的快照,包括虚拟功能调度信息和所述一个或多个ai加速器内的通信缓冲器。19.一种系统,其包括联接到用指令编程的存储器的至少一个硬件处理器,所述指令在
由所述至少一个硬件处理器执行时致使所述系统执行用于迁移正在执行访问人工智能ai加速器的虚拟功能的应用程序的源虚拟机vm-s的操作,所述操作包括:由目标主机的管理程序从与虚拟功能vf相关联的源虚拟机vm-s接收检查点,所述vf将人工智能ai处理器资源映射到所述vm-s;以及接收托管作为目标虚拟机vm-t的所述vm-s的请求;由所述目标主机的管理程序根据所述检查点来分配和配置用于托管作为所述vm-t的所述vm-s和所述vm-s的vf的资源;由所述目标主机的管理程序接收所述vm-s的数据帧并存储所述数据帧以生成所述vm-t;由所述目标主机的管理程序接收所述vm-s的未完成的ai任务的记录状态,并且在vm-t上重新开始所述未完成的ai任务。20.根据权利要求19所述的系统,其中,所述操作进一步包括:验证从所述vm-s接收到的检查点,其中,验证包括:利用所述vm-s的公钥来解密所述检查点的签名;确定所述检查点的日期和时间戳落在预定范围内;重新计算所述检查点的哈希并确定所述经重新计算的哈希是否与存储在所述检查点中的哈希匹配;以及响应于对所述检查点的成功验证,继续进行将所述vm-s迁移到作为vm-t的所述目标主机的管理程序。21.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-6中任一项所述的方法。

技术总结
公开了用于迁移具有虚拟功能的虚拟机(VM)的系统和方法,该虚拟功能将人工智能(AI)加速器的资源映射到VM。用于AI加速器的驱动程序可以生成对AI加速器做出调用的VM过程的检查点,并且该检查点可以包括通过虚拟功能被映射到AI加速器的资源的列表和配置。驱动程序还可以访问AI加速器的代码、数据和存储器,以生成AI加速器状态的检查点。当VM迁移到新主机时,则可以使用这些检查点帧中的任一者或两者以确保在具有适当的AI加速器资源的新主机上恢复VM可以在新主机上被成功地恢复。可以基于事件来捕获一个或两个检查点帧,以预计到需要迁移VM。迁移VM。迁移VM。


技术研发人员:赵志彪 程越强
受保护的技术使用者:百度(美国)有限责任公司
技术研发日:2021.11.11
技术公布日:2022/7/9
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献