一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

算力机及其处理方法与流程

2022-08-03 02:13:47 来源:中国专利 TAG:


1.本发明涉及云计算技术领域,特别是涉及一种算力机及其处理方法。


背景技术:

2.随着高性能计算、人工智能技术的快速发展,自动驾驶、图像识别、基因检测、区块链等领域对算力的要求不断增加。在此基础上,产业界提出了“算力网络”这一新型资源整合方案,通过网络分发服务节点的算力信息、存储信息、算法信息等,结合网络状态(如路径、时延)等信息,针对客户需求,提供最佳的资源分配及网络连接方案,并实现整网资源的最优化使用。
3.算力网络利用云网融合技术以及sdn(softwaredefinednetwork软件定义网络)/nfv(network functions virtualization网络功能虚拟化)等新型网络技术,将边缘计算节点、云计算节点以及含广域网在内的各类网络资源深度融合在一起,减少边缘计算节点的管控复杂度,并通过集中控制或者分布式调度方法与云计算节点的计算和存储资源、广域网的网络资源进行协同,组成新一代信息基础设施,为客户提供包含计算、存储和连接的整体算力服务,并根据业务特性提供灵活、可调度的按需服务。
4.目前,由于不同的算力网络管理操作、所需的性能、提供的业务和服务不同,因此算力节点被限制于一个算力网络,比如一个算力机用于一个算力云,这样,算力机即使在空闲的时候也无法移动到其他资源短缺的算力云,造成资源浪费。


技术实现要素:

5.本发明要解决的技术问题是:现有技术中算力机不可灵活地、动态地迁移到其他算力云、导致资源浪费。
6.为解决上述技术问题,本发明提供了一种算力机及其处理方法。
7.一种算力机,包括:算力处理装置、网络接口和云聚合器,所述算力处理装置连接所述网络接口和所述云聚合器,所述网络接口和所述云聚合器通过网络连接至少两个算力云;
8.所述算力处理装置通过所述网络接口与所述算力云通讯,在处于空闲状态时,若检测到任一个算力云的算力需求,则加入对应算力云的算力资源池,所述云聚合器接收所述算力云分配的计算任务并转换成本机计算指令,所述算力处理装置处理所述本机计算指令。
9.在其中一个实施例中,所述算力处理装置包括处理器和算力板,所述处理器连接所述算力板和所述网络接口,所述算力板连接所述云聚合器;
10.所述处理器通过所述网络接口与所述算力云通讯,在处于空闲状态时,若检测到任一个算力云的算力需求,则加入对应算力云的算力资源池;
11.所述算力板接收所述云聚合器发送的本机计算指令并处理。
12.在其中一个实施例中,所述算力板包括控制器和多个算力芯片,所述控制器连接
所述处理器、所述云聚合器和多个所述算力芯片;
13.所述控制器接收所述云聚合器发送的本机计算指令,将所述本机计算指令发送至所述算力芯片进行处理。
14.在其中一个实施例中,所述云聚合器包括访问接口和转换模块,所述访问接口连接所述转换模块,且通过网络连接所述算力云,所述转换模块连接所述算力处理装置。
15.在其中一个实施例中,所述云聚合器还包括账户管理模块,所述账户管理模块连接所述转换模块。
16.在其中一个实施例中,所述云聚合器还包括监控模块,所述监控模块连接所述转换模块和所述算力处理装置。
17.在其中一个实施例中,所述云聚合器还包括策略模块,所述策略模块连接所述监控模块、所述账户管理模块和所述转换模块。
18.在其中一个实施例中,上述算力机还包括存储器和输入输出口中的至少一种,所述存储器和所述输入输出口连接所述算力处理装置。
19.一种所述算力机的处理方法,包括:
20.在处于空闲状态时,检测所连接的算力云是否有算力需求;
21.若是,则加入有算力需求的算力云的算力资源池;
22.获取由云聚合器接收所加入的算力云分配的计算任务后转换得到的本机计算指令;
23.处理所述本机计算指令。
24.在其中一个实施例中,所述检测所连接的算力云是否有算力需求,包括:
25.判断是否接收到任一个算力云的添加算力机请求;
26.若是,则确定发送所述添加算力机请求的算力云有算力需求;
27.若否,则向所连接的算力机发送询问消息,所述询问消息用于询问是否增加算力机;
28.在接收到任一个算力机根据所述询问消息返回的肯定答复消息时,确定返回所述肯定答复消息的算力机有算力需求;
29.在接收到所有算力机根据所述询问消息返回的否定答复消息时,确定没有算力需求。
30.在其中一个实施例中,所述在处于空闲状态时,检测所连接的算力云是否有算力需求之前,还包括:
31.与所连接的算力云交互双方的设备特性和状态信息。
32.与现有技术相比,上述方案中的一个或多个实施例可以具有如下优点或有益效果:
33.空闲状态时加入有算力需求的算力云,通过使用云聚合器连接算力云,将算力云发送的计算任务转换成本算力机可以理解的指令,使得不同算力云的计算任务都可以被本算力机处理,从而一个算力机可以在不同算力云之间动态迁移,即一个算力机可以适用于多个算力云,避免资源浪费。
附图说明
34.通过结合附图阅读下文示例性实施例的详细描述可更好地理解本公开的范围。其中所包括的附图是:
35.图1为一个实施例中算力机的结构框图;
36.图2为另一个实施例中算力机的结构框图;
37.图3为一个实施例中算力板的结构框图;
38.图4为一个实施例中云聚合器的结构框图;
39.图5为一个实施例中算力机与算力云的连接关系示意图;
40.图6为一个实施例中算力机的处理方法的流程示意图;
41.图7为另一个实施例中算力机的处理方法的流程示意图。
具体实施方式
42.为使本发明的目的、技术方案和优点更加清楚,以下将结合附图及实施例来详细说明本发明的实施方法,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。
43.在一个实施例中,提供了一种算力机,如图1所示,该算力机包括:算力处理装置110、云聚合器120和网络接口130,算力处理装置110连接网络接口130和云聚合器120,网络接口130和云聚合器120通过网络连接至少两个算力云。其中,算力云是一种云平台,不同的算力云可以是进行不同类型的计算任务,也可以是进行相同类型的计算任务。图1中,算力云a和算力云b为两个不同的算力云。
44.算力处理装置110通过网络接口130与算力云通讯,在处于空闲状态时,若检测到任一个算力云的算力需求,则加入对应算力云的算力资源池。其中,算力需求是添加算力机的需求;检测到任一个算力云的算力需求,则加入有算力需求的这个算力云的算力资源池。比如,若检测到算力云a有算力需求,则加入算力云a的算力资源池。其中,空闲状态是没有执行运算任务的状态。
45.云聚合器120接收算力云分配的计算任务并转换成本机计算指令,算力处理装置110处理本机计算指令。具体地,云聚合器120接收所加入的算力云所分配的计算任务,将计算任务转换成本算力机可以处理的指令得到本机计算指令,并发送至算力处理装置110,由算力处理装置110进行处理。
46.上述算力机,空闲状态时加入有算力需求的算力云,通过使用云聚合器120连接算力云,将算力云发送的计算任务转换成本算力机可以理解的指令,使得不同算力云的计算任务都可以被本算力机处理,从而一个算力机可以在不同算力云之间动态迁移,即一个算力机可以适用于多个算力云,避免资源浪费。
47.在其中一个实施例中,算力处理装置110检测所连接的算力云是否有算力需求,包括:判断是否接收到任一个算力云的添加算力机请求;若是,则确定发送添加算力机请求的算力云有算力需求;若否,则向所连接的各算力机发送询问消息,询问消息用于询问是否增加算力机;在接收到任一个算力机根据询问消息返回的肯定答复消息时,确定返回肯定答复消息的算力机有算力需求;在接收到所有算力机根据询问消息返回的否定答复消息时,确定没有算力需求。
48.其中,肯定答复消息是指示有添加算力机需求的消息;否定答复消息是指示没有添加算力机需求的消息。通过在未接收到添加算力机请求时,主动询问各算力云是否添加算力机,可以更精确地确定是否有算力需求。
49.具体地,若是接收到多个算力云的算力机请求,或者接收到多个算力云的肯定答复消息,则根据预设定的加入规则选择其中一个算力云进行加入。比如,可以是随机选择一个算力云加入其算力资源池,或者是选择最先接收到算力机请求/肯定答复消息的算力云进行加入。
50.在其中一个实施例中,算力处理装置110在处于空闲状态时,检测所连接的算力云是否有算力需求之前,还与所连接的算力云交互双方的设备特性和状态信息。通过交互设备特性和状态信息,实现同步信息。比如,以图1中连接算力云a和算力云b为例,算力处理装置110与算力云a交互双方的设备特性和状态信息,还与算力云b交互双方的设备特性和状态信息。
51.在其中一个实施例中,如图2所示,算力处理装置110包括处理器111和算力板112,处理器111连接算力板112和网络接口130,算力板112连接云聚合器120。处理器111通过网络接口130与算力云通讯,在处于空闲状态时,若检测到任一个算力云的算力需求,则加入对应算力云的算力资源池。算力板112接收云聚合器120发送的本机计算指令并处理。
52.算力板112是算力机的运算部件。通过采用处理器111和算力板112分别进行处理和运算,处理和运算效率高。
53.在其中一个实施例中,如图3所示,算力板112包括控制器和多个算力芯片,控制器连接处理器111、云聚合器120和多个算力芯片;控制器接收云聚合器120发送的本机计算指令,将本机计算指令发送至算力芯片进行处理。
54.其中,控制器包括指令执行单元;算力芯片包括指令缓存单元、数据缓存单元和专用运算单元。指令缓存单元存储从控制器获得的指令,专用运算单元从指令缓存单元提取指令执行,数据缓存单元存储计算数据和计算结果。专用运算单元执行包括但不限于矩阵计算(或矩阵计算中涉及到的乘累加、激活运算、向量运算等)、加密算法、哈希算法、零知识证明算法等计算密集型任务。
55.控制器可以接收处理器111(中央处理单元)发出的代码,其中包括算力芯片的专用运算单元执行的指令。指令执行单元将指令发送到算力芯片的指令缓存单元,由其中的专用运算单元运行该指令。
56.在其中一个实施例中,云聚合器120包括访问接口和转换模块,访问接口连接转换模块,且通过网络连接算力云,转换模块连接算力处理装置110。具体地,转换模块可以是连接算力板112中的控制器。
57.其中,访问接口用于设置算力机和算力云之间的通讯协议,传输运算相关数据包括指令、原始数据、计算结果;传输管理相关的数据,如资源请求、登录信息、设备状态、算力云状态、支付信息等。
58.其中,转换模块用于实现算力云对算力机的一致性和透明性,将上述访问接口之间的交互数据进行转换翻译;如将不同算力云的不同指令格式转换成相同的算力机可以理解的指令格式,或将算力机发出的设备状态转换成符合不同算力云要求的不同数据格式。
59.在其中一个实施例中,参考图4,云聚合器120还包括账户管理模块,账户管理模块
连接转换模块。其中,账户管理模块用于算力机在不同算力云的账户/登录和支付管理。
60.在其中一个实施例中,参考图4,云聚合器120还包括监控模块,监控模块连接转换模块和算力处理装置110。具体地,监控模块可以是连接算力板112中的控制器。
61.监控模块用于收集算力机运行状态,包括但不限于cpu/内存/存储的设备参数、计算/存储资源利用率、设备预定计划、算力机适合的任务类型、专用运算单元功能、服务价格等;算力云可在需要增加计算资源时向算力机请求算力机信息,或由本模块定时或状态发生变化时向算力云报告。监控模块获取算力云资源请求,包括算力云需要资源的时间段、愿意提供的价格、算力云的业务类型、所需的运算函数类型,以及网络连接成本等。
62.在其中一个实施例中,参考图4,云聚合器120还包括策略模块,策略模块连接监控模块、账户管理模块和转换模块。
63.其中,策略模块用于根据监控模块提供的信息,采用人工智能/专家系统/策略数据库进行分析,制定利益最大化的业务策略,选择所要加入的算力云、加入的时长等。
64.在其中一个实施例中,上述算力机还可以包括存储器和输入输出口中的至少一种,存储器和输入输出口连接算力处理装置110。算力处理装置110可以将需要存储的数据发送至存储器进行存储,可以通过输入输出口连接其他设备,提高使用性能。具体地,请继续参考图2,存储器140和输入输出口150可以是连接处理器111。
65.为更好说明算力机的应用,以算力机在两个算力云之间迁移为例,如图5所示。算力云a/b可以用于高性能计算、深度神经网络训练、区块链共识证明等用途。算力云a与b可以是进行同类型的计算任务,如同样是深度神经网络训练,或者是不同类型的计算任务,如算力云a是用于深度神经网络训练,算力云b是用于区块链共识证明。两个算力云进行不同类型的计算任务时,算力机中的计算部件需要对两种或多种应用进行适配,取得性能和适用性的平衡。深度神经网络训练算力部件可以针对神经网络中典型的、高计算密集型的计算任务(例如矩阵计算或矩阵计算中涉及到的乘累加、激活运算、向量运算等)进行特殊的优化;区块链共识证明算力部件对区块链中常用的各种算法,如加密算法、哈希算法、零知识证明算法等进行优化。
66.当算力云a需要增加算力资源时将算力机加入该算力云的算力资源池,将任务分配给该算力机进行计算,并根据算力机使用情况支付算力机所有者报酬;任务结束后,算力机可请求算力云释放设备,算力云从算力资源池中移除该设备;算力机可以请求加入其他算力云b或者等待其他算力云b的请求。该算力机具有唯一标识与物理设备关联,如全局唯一标识符(guid),或其他本地唯一或统计上可能唯一的标识符,如网卡mac(媒体访问控制)地址、主板id、cpu id和bios编号等。
67.在一个实施例中,提供了一种上述算力机的处理方法,可以应用于算力处理装置,如图6所示,该方法包括:
68.s110:在处于空闲状态时,检测所连接的算力云是否有算力需求。
69.若有算力云有算力需求,则执行步骤s130;否则,重复执行步骤s110。
70.s130:加入有算力需求的算力云的算力资源池。
71.s150:获取由云聚合器接收所加入的算力云分配的计算任务后转换得到的本机计算指令。
72.s170:处理本机计算指令。
73.上述算力机的处理方法,空闲状态时加入有算力需求的算力云,通过云聚合器将算力云发送的计算任务转换成本算力机可以理解的指令,使得不同算力云的计算任务都可以被本算力机处理,从而一个算力机可以在不同算力云之间动态迁移,即一个算力机可以适用于多个算力云,避免资源浪费。
74.在其中一个实施例中,检测所连接的算力云是否有算力需求的步骤包括:判断是否接收到任一个算力云的添加算力机请求;若是,则确定发送添加算力机请求的算力云有算力需求;若否,则向所连接的算力机发送询问消息,询问消息用于询问是否增加算力机;在接收到任一个算力机根据询问消息返回的肯定答复消息时,确定返回肯定答复消息的算力机有算力需求;在接收到所有算力机根据询问消息返回的否定答复消息时,确定没有算力需求。
75.在其中一个实施例中,在步骤s110之前,上述算力机的处理方法还包括:与所连接的算力云交互双方的设备特性和状态信息。
76.以一个详细的实施例进行说明,如图7所示,算力机与所连接的至少两个算力云之间交互双方的设备特性和状态信息,以同步信息;算力机在检测到没有运算任务,即处于空闲状态时,判断是否接收到算力云的添加算力机请求;若是,则请求加入该算力云,制定策略、加入算力云,然后传输数据/指令,进行运算。若没有接收到算力云的添加算力机请求,则查询算力云,询问算力云是否有增加算力机的需求,若有,则请求加入对应的算力云,若没有,则重新同步信息。
77.以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
78.虽然本发明所公开的实施方式如上,但所述的内容只是为了便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属技术领域内的技术人员,在不脱离本发明所公开的精神和范围的前提下,可以在实施的形式上及细节上作任何的修改与变化,但本发明的保护范围,仍须以所附的权利要求书所界定的范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献