一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于数据中心冷却系统的统一无风扇散热器的制作方法

2022-03-16 03:33:39 来源:中国专利 TAG:


1.至少一个实施例涉及冷却系统,包括用于操作这些冷却系统的系统和方法。在至少一个实施例中,这样的冷却系统可以用在包含一个或更多个机架或计算服务器的数据中心中。


背景技术:

2.数据中心冷却系统使用风扇来使空气循环通过服务器组件。某些超级计算机或其他高容量计算机可使用水或其他冷却系统而不是空气冷却系统来将热量从数据中心的服务器组件或机架吸走到数据中心外部的区域。冷却系统可以包括数据中心区域内的冷却器,其可以包括数据中心自身外部的区域。进一步,数据中心外部的区域可以包括冷却塔或其他外部热交换器,该冷却塔或其他外部热交换器接收来自数据中心的加热的冷却剂并且通过强制空气或其他装置将热量散发到环境(或外部冷却介质)。冷却的冷却剂再循环回到数据中心中。冷却器和冷却塔一起形成冷却设施。
附图说明
3.图1示出了经受在至少一个实施例中描述的改进的示范性数据中心冷却系统;
4.图2示出了根据至少一个实施例的与数据中心冷却系统的统一无风扇散热器相关联的服务器级特征;
5.图3a示出了根据至少一个实施例的与数据中心冷却系统的统一无风扇散热器相关联的机架级特征;
6.图3b示出了根据至少一个实施例的与数据中心冷却系统的统一无风扇散热器相关联的液体到液体热交换器的特征;
7.图4示出了根据至少一个实施例的与数据中心冷却系统的统一无风扇散热器相关联的数据中心级特征;
8.图5示出了根据至少一个实施例的与图2-4的数据中心冷却系统相关联的方法;
9.图6示出了根据至少一个实施例的分布式系统;
10.图7示出了根据至少一个实施例的示例性数据中心;
11.图8示出了根据至少一个实施例的客户端-服务器网络;
12.图9示出了根据至少一个实施例的计算机网络;
13.图10a示出了根据至少一个实施例的联网计算机系统;
14.图10b示出了根据至少一个实施例的联网计算机系统;
15.图10c示出了根据至少一个实施例的联网计算机系统;
16.图11示出了根据至少一个实施例的系统环境的一个或更多个组件,在该系统环境中,服务可被提供为第三方网络服务;
17.图12示出了根据至少一个实施例的云计算环境;
18.图13示出了根据至少一个实施例的由云计算环境提供的一组功能抽象层;
19.图14示出了根据至少一个实施例的芯片级的超级计算机;
20.图15示出了根据至少一个实施例的机架模块级的超级计算机;
21.图16示出了根据至少一个实施例的机架级的超级计算机;
22.图17示出了根据至少一个实施例的整个系统级的超级计算机;
23.图18a示出了根据至少一个实施例的推理和/或训练逻辑;
24.图18b示出了根据至少一个实施例的推理和/或训练逻辑;
25.图19示出了根据至少一个实施例的神经网络的训练和部署;
26.图20示出了根据至少一个实施例的网络的系统的架构;
27.图21示出了根据至少一个实施例的网络的系统的架构;
28.图22示出了根据至少一个实施例的控制平面协议栈;
29.图23示出了根据至少一个实施例的用户平面协议栈;
30.图24示出了根据至少一个实施例的核心网的组件;
31.图25示出了根据至少一个实施例的支持网络功能虚拟化(nfv)的系统的组件;
32.图26示出了根据至少一个实施例的处理系统;
33.图27示出了根据至少一个实施例的计算机系统;
34.图28示出了根据至少一个实施例的系统;
35.图29示出了根据至少一个实施例的示例性集成电路;
36.图30示出了根据至少一个实施例的计算系统;
37.图31示出了根据至少一个实施例的apu;
38.图32示出了根据至少一个实施例的cpu;
39.图33示出了根据至少一个实施例的示例性加速器集成切片;
40.图34a-34b示出了根据至少一个实施例的示例性图形处理器;
41.图35a示出了根据至少一个实施例的图形核心;
42.图35b示出了根据至少一个实施例的gpgpu;
43.图36a示出了根据至少一个实施例的并行处理器;
44.图36b示出了根据至少一个实施例的处理集群;
45.图36c示出了根据至少一个实施例的图形多处理器;
46.图37示出了根据至少一个实施例的编程平台的软件栈;
47.图38示出了根据至少一个实施例的图37的软件栈的cuda实现;
48.图39示出了根据至少一个实施例的图37的软件栈的rocm实现;
49.图40示出了根据至少一个实施例的图37的软件栈的opencl实现;
50.图41示出了根据至少一个实施例的由编程平台支持的软件;以及
51.图42示出了根据至少一个实施例的用于在图37-40的编程平台上执行的编译代码。
具体实施方式
52.在以下描述中,阐述了许多具体细节以提供对至少一个实施例的更透彻的理解。然而,对于本领域的技术人员将显而易见的是,可以在没有一个或更多个这些具体细节的情况下实践本发明构思。
53.在至少一个实施例中,鉴于由当今计算组件中的变化的计算负载引起的突然的高热需求,高密度服务器的空气冷却可能不是有效的或可能是无效的。在至少一个实施例中,由于要求在不同的冷却要求的最小值到最大值之间变化或趋于该范围,所以必须使用适当的冷却系统以经济的方式满足这些要求。在至少一个实施例中,为了中等到高的冷却要求,可以使用液体冷却系统。在至少一个实施例中,不同的冷却要求还反映数据中心的不同的热特征。在至少一个实施例中,从组件、服务器和机架产生的热量被统一称为热特征或冷却要求,因为冷却要求必须完全解决热特征。
54.在至少一个实施例中,公开了一种数据中心液体冷却系统。在至少一个实施例中,数据中心冷却系统解决相关联的计算或数据中心设备中的热特征,诸如图形处理单元(gpu)中、交换机中、双列直插式存储器模块(dimm)或中央处理单元(cpu)中。此外,在至少一个实施例中,相关联的计算或数据中心设备可以是在其上具有一个或更多个gpu、交换机或cpu的处理卡。在至少一个实施例中,gpu、交换机和cpu中的每一个可以是计算设备的发热特征。在至少一个实施例中,gpu、cpu或交换机可以具有一个或更多个核心,并且每个核心可以是发热特征。
55.在至少一个实施例中,gpu、交换机、cpu和存储装置的高热密度机架的冷却可以依赖于液体冷却剂,例如包括添加剂的水或单独的水。在至少一个实施例中,可使用空气冷却来冷却较低发热服务器/交换机组件。在至少一个实施例中,本文的数据中心冷却系统解决了来自组合数据中心中的液体冷却和空气冷却的问题,诸如与解决两种需要所需的底层各种冷却设备的复杂性相关的问题。在至少一个实施例中,本数据中心冷却系统能够替换复杂且机械的设备,诸如冷却剂分配单元(cdu)、计算机机房空调(crac)、计算机机房空气处理器(crah)、后门热交换器(rdhx)和过冷热交换器(schx),其全部部分地或相当大地依赖于基于风扇的散热。在至少一个实施例中,crah/crac/rdhx/schx组件支持空气冷却并且cdu支持液体冷却。在至少一个实施例中,空气和液体冷却的所有组件都放置有统一的(unified)无风扇散热器,该无风扇散热器经由空气-液体热交换器用作用于经空气冷却的组件的空气源冷却,同时经由液体-液体热交换器为液体冷却的冷板和浸没式冷却系统的液体提供冷却。
56.在至少一个实施例中,考虑使用冷或热通道包含方案的数据中心设计,将统一的无风扇散热器放置在数据中心中的机架排的上方或下方。在至少一个实施例中,来自数据中心冷却器站或设施或来自液体侧经济冷却塔的主冷却回路的主冷却剂可以被提供到散热器中。在至少一个实施例中,散热器可包括用于热空气行进的路径,其中热空气由数据中心的服务器风扇、组件风扇、机架安装的风扇或壁扇驱动。在至少一个实施例中,该路径可以是多个散热片,用于保持来自热空气的热量。在至少一个实施例中,提供用于主冷却剂充分冷却热空气的路径。在至少一个实施例中,提供另一路径,用于主冷却剂冷却返回到机架排壳体的冷通道的辅助冷却剂或第二冷却剂,用于液体冷却的组件。在至少一个实施例中,可提供用于冷却空气返回到机架排的冷通道的又一路径,使得上面提到的风扇可使冷却空气循环。在至少一个实施例中,热空气和辅助冷却剂的冷却在散热器的各自的热交换器中同时发生。在至少一个实施例中,同时冷却在散热器内串联或并联发生,使得主冷却剂首先用于冷却辅助冷却剂,随后冷却热空气,或者使得主冷却剂同时冷却辅助冷却剂和冷空气两者。在至少一个实施例中,辅助冷却剂与一个或更多个服务器、冷板或机架相关联,并且
流过服务器和机架歧管。
57.在至少一个实施例中,本公开能够实现用于不同热交换器的散热器中的区段或部分。在至少一个实施例中,统一无风扇散热器适于与数据中心的一个或更多个机架配合,并且可表示适于冷却空气和液体的单个单元。在至少一个实施例中,统一无风扇散热器适于消除数据中心级风扇,并且可为高热密度机架提供统一的空气和液体冷却,同时降低冷却单元的资金成本、操作成本、数据中心占用空间,所有这些都同时提高了数据中心电力使用效率(pue)。
58.在至少一个实施例中,本文的散热器涉及通过替换冷却剂分配单元(cdu)、计算机机房空调(crac)、计算机机房空气处理器(crah)、后门热交换器(rdhx)和过冷热交换器(schx)来简化数据中心的冷却。在至少一个实施例中,代替这样的特征,散热器由来自冷却器设施的主冷却回路支撑,以将主冷却剂直接供应到散热器功能。在至少一个实施例中,散热器可以是用于空气和液体的统一热交换器,并且位于一个或更多个机架的上方或下方。在至少一个实施例中,散热器基本上用作空气到液体热交换器,主冷却剂用于通过行进通过散热器的散热片内、之间或周围的路径从机架吸走热量。在至少一个实施例中,散热器的一部分用作液体到液体热交换器,其支撑一个或更多个辅助冷却回路,所述辅助冷却回路具有从数据中心的计算组件、服务器或机架提取热量的相应辅助冷却剂。在至少一个实施例中,除了简化冷却过程之外,这里的散热器还减少了辅助冷却剂在到达计算组件、服务器或机架之前必须流动的流线和距离。在至少一个实施例中,由于辅助冷却剂可以直接负责从数据中心的计算组件、服务器或机架吸收热量,因此与主冷却剂交换所吸收的热量的路径越短,其冷却相应设备的能力就越快。
59.在至少一个实施例中,数据中心的一个或更多个机架顶部或下方的无风扇散热器支持作为空气到液体热交换器的第一配置,其中主冷却回路从该无风扇散热器移除第一量的热量,以及支撑作为具有辅助冷却回路的液体-液体热交换器的第二配置,所述辅助冷却回路与横穿所述无风扇散热器的所述主冷却回路交换第二量的热量。
60.在至少一个实施例中,数据中心冷却系统主要由外部冷却器组成,该外部冷却器具有基于风扇的冷却并且进一步由不同冷却管线和基于辅助风扇的系统支撑,诸如冷却剂分配单元(cdu),计算机机房空调(crac)、计算机机房空气处理器(crah)、后门热交换器(rdhx),和过冷热交换器(schx),大部分由本发明的散热器和相关的最小组件代替。在至少一个实施例中,用作位于一个或更多个机架顶部或下方的热交换器的散热器是无风扇的。在至少一个实施例中,这减少了从上述许多替换组件产生的噪声。
61.在至少一个实施例中,图1示出了具有经受本文描述的改进的冷却系统的示例性数据中心100。在至少一个实施例中,数据中心100可以是具有机架110和辅助设备的一个或更多个机房102,所述机架和辅助设备用于容纳一个或更多个服务器托盘上的一个或更多个服务器。在至少一个实施例中,数据中心100由位于数据中心100外部的冷却塔104支持。在至少一个实施例中,冷却塔104通过作用于主冷却回路106而从数据中心100内散热。在至少一个实施例中,在主冷却回路106和第二或辅助冷却回路108之间使用冷却分配单元(cdu)112,以使得能够将热量从第二或辅助冷却回路108提取到主冷却回路106。在至少一个实施例中,在一方面,辅助冷却回路108可以根据需要自始至终访问进入服务器托盘中的不同管路(plumbing)。在至少一个实施例中,回路106、108被示出为线图,但普通技术人员
将认识到,可以使用一个或更多个管路特征。在至少一个实施例中,柔性聚氯乙烯(pvc)管可以与相关联的管路系统一起使用,以便使流体沿着回路106、108中的每一个移动。在至少一个实施例中,可以使用一个或更多个冷却剂泵来维持回路106、108内的压力差,以使得冷却剂能够根据不同位置(包括房间中、一个或更多个机架110中和/或机架110内的服务器箱或服务器托盘中)中的温度传感器移动。
62.在至少一个实施例中,主冷却回路106和辅助冷却回路108中的冷却剂可以至少是水和添加剂,例如乙二醇或丙二醇。在操作中,在至少一个实施例中,主冷却回路和辅助冷却回路中的每一个都具有它们自己的冷却剂。在至少一个实施例中,辅助冷却回路中的冷却剂可专用于服务器托盘或机架110中的组件的要求。在至少一个实施例中,cdu 112能够独立地或同时地对回路106、108中的冷却剂进行复杂控制。在至少一个实施例中,cdu可以适于控制流速,使得冷却剂被适当地分配以提取机架110内产生的热量。在至少一个实施例中,从辅助冷却回路108提供更多柔性管道(tubing)114以进入每个服务器托盘并向电气和/或计算组件提供冷却剂。
63.在至少一个实施例中,电气和/或计算组件可互换地用来指代受益于本数据中心冷却系统的发热组件。在至少一个实施例中,形成辅助冷却回路108的一部分的管道118可以被称为室歧管。在至少一个实施例中,从管道118延伸的管道116也可以是辅助冷却回路108的一部分,但是可以称为排歧管。在至少一个实施例中,管路114作为辅助冷却回路108的一部分进入机架,但是可以称为机架冷却歧管。在至少一个实施例中,排歧管116沿着数据中心100中的排延伸到所有机架。在至少一个实施例中,可通过本公开的至少一个实施例改进包括歧管118、116和114的辅助冷却回路108的管路。在至少一个实施例中,可以在数据中心102内的主冷却回路中提供冷却器120,以支持在冷却塔之前的冷却。在至少一个实施例中,在主控制回路中存在附加回路的程度上,本领域普通技术人员在阅读本公开时将认识到,这些附加回路提供机架外部和辅助冷却回路外部的冷却;并且可以与用于本公开的主冷却回路合在一起。
64.在至少一个实施例中,在操作中,机架110的服务器托盘内产生的热量可经由第二冷却回路108的排歧管114的柔性管被传递到离开机架110的冷却剂。在至少一个实施例中,来自cdu 112的用于冷却机架110的第二冷却剂(在辅助冷却回路108中)朝向机架110移动。在至少一个实施例中,来自cdu 112的第二冷却剂从具有管道118的室歧管的一侧经由排歧管116传递到机架110的一侧,并经由管道114通过服务器托盘的一侧。在至少一个实施例中,用过的或返回的第二冷却剂(或从计算组件带走热量的离开的第二冷却剂)从服务器托盘的另一侧离开(诸如在循环通过服务器托盘或通过服务器托盘上的组件之后进入用于服务器托盘的机架的左侧并离开机架的右侧)。在至少一个实施例中,离开服务器托盘或机架110的用过的第二冷却剂从管道114的不同侧(诸如排出侧)出来并且移动到平行但也是排歧管116的排出侧。在至少一个实施例中,从排歧管116,用过的第二冷却剂在室歧管118的平行部分中移动,以与进入的第二冷却剂(其也可以是更新的第二冷却剂)相反的方向行进,并且朝向cdu 112。
65.在至少一个实施例中,用过的第二冷却剂经由cdu 112与主冷却回路106中的主冷却剂交换其热量。在至少一个实施例中,用过的第二冷却剂被更新(诸如当与用过的第二冷却剂阶段的温度相比时相对冷却)并且准备好循环回到通过第二冷却回路108到达计算组
件。在至少一个实施例中,cdu 112中的各种流动和温度控制特征使得能够控制从用过的第二冷却剂交换的热量或者第二冷却剂流入和流出cdu 112的流。在至少一个实施例中,cdu 112还能够控制主冷却回路106中的主冷却剂的流动。
66.在至少一个实施例中,散热器可以与一个或更多个机架相关联。在至少一个实施例中,散热器的第一部分可适于用作具有主冷却回路的空气-液体热交换器,以从一个或更多个机架吸走第一热量。在至少一个实施例中,散热器的第二部分可适于用作辅助冷却回路的液体-液体热交换器,以与主冷却回路交换第二热量。在至少一个实施例中,散热器可以适于为数据中心执行补充或经济的冷却。在至少一个实施例中,包括泵或阀的流量控制器可用于调节不同路径(诸如数据中心的cdu和散热器)之间的流量。在至少一个实施例中,可以控制流量控制器以使辅助冷却剂流到散热器并返回到计算设备、服务器托盘或机架。在至少一个实施例中,可以控制流量控制器以使辅助冷却剂流到cdu并返回到计算设备、服务器托盘或机架。在至少一个实施例中,可以控制流量控制器以使辅助冷却剂流到散热器和cdu两者。
67.在至少一个实施例中,这些泵和阀可以具有机械组件和电气组件。在至少一个实施例中,对于电泵,从电组件提供信号,该电组件可以在该电泵内或远离该泵。在至少一个实施例中,该信号可以引起泵开始或改变速度以控制通过电动泵的冷却剂的流速或流量。在至少一个实施例中,当该流量控制器是阀时,该开启和关闭是由输入到电组件的信号控制的,该电组件可以在该阀内或者远离该阀。
68.在至少一个实施例中,如图2中所示的服务器级特征200可以与数据中心冷却系统的统一无风扇散热器250相关联。在至少一个实施例中,图2是机架的服务器托盘202和相关联的统一无风扇散热器250的平面图的框图。在至少一个实施例中,散热器250与服务器托盘或箱202相关联,并且因此与数据中心的一个或更多个机架相关联。在至少一个实施例中,服务器托盘或箱202包括一个或更多个流动回路214a、b,所述流回路与来自其中安装有服务器托盘或箱202的机架的机架歧管的辅助冷却剂相关联。在至少一个实施例中,散热器250是一个或更多个服务器箱或托盘的形状因子。在至少一个实施例中,可使得辅助冷却剂经由服务器歧管204流入服务器托盘或箱202中。在至少一个实施例中,服务器歧管204中具有到冷板210a-d的入口冷却剂和从冷板210a-d的出口冷却剂的分离,或者可缓冲所有入口冷却剂和出口冷却剂,从而实现均匀的温度。
69.在至少一个实施例中,冷板210a-d与计算设备220a-d相关联。在至少一个实施例中,辅助冷却剂可流入歧管204并可经由入口管线210到达冷板210a、b,并可经由中间管线216和出口管线212离开冷板210a、b。在至少一个实施例中,第二冷却回路214b可以在功能上类似于第一冷却回路214a,或者可以由与第一冷却回路214a不同的冷却剂源和服务器歧管支撑。在至少一个实施例中,当第二冷却回路214b由至少不同的冷却剂源支撑时,不同冷却剂源的不同冷却剂流入和流出服务器歧管204,服务器歧管204中具有分离以经由管线208a、b以类似于第一冷却回路214a的线206a、b的方式处理不同冷却剂。在至少一个实施例中,入口管线206a、b和出口管线208a、208b经由分流器(diverter)耦接到散热器250。
70.在至少一个实施例中,该分流器是流量控制器或包括流量控制器。在至少一个实施例中,流量控制器适于经由散热器侧的入口管线264和出口管线266并经由服务器托盘侧的入口管线206a、b和出口管线208a、b来控制服务器托盘202与散热器250之间的流动。在至
少一个实施例中,服务器托盘202与散热器250之间的流经由机架歧管,诸如图3的机架歧管。在至少一个实施例中,散热器250具有第一部分或区域260,其具有辅助冷却回路262。在至少一个实施例中,区域260外部的共同区域是包括散热片258的第二部分或区域。在至少一个实施例中,相对于具有辅助冷却回路262的散热器的区域,散热器的任何区域可被称为第一区域,并且具有散热片258的散热器的任何区域可被称为第二区域。
71.在至少一个实施例中,第二区域中的散热片258能够实现第二区域中的空气到液体热交换器的功能。在至少一个实施例中,主冷却回路256通过第二区域,并具有入口管线252和出口管线254,以使主冷却剂在其中通过。在至少一个实施例中,第一区域中的辅助冷却回路262实现第一区域中的液体到液体热交换器的功能。在至少一个实施例中,经过第一区域和第二区域两者的主冷却回路的主冷却剂可以来自数据中心外部的冷却器设施。在至少一个实施例中,主回路256中的主冷却剂适于经由散热片从一个或更多个机架吸走第一热量,并且适于经由与辅助冷却剂接合而从辅助冷却吸收第二热量。在至少一个实施例中,该接合可以是经由传导接口或一个散热接口。
72.在至少一个实施例中,第一区域260可邻近进入散热器250的主冷却回路的入口。在至少一个实施例中,这使得能够有效地从辅助冷却剂中去除热量。在至少一个实施例中,主冷却回路256横穿第一区域260,然后横穿具有散热器250的多个散热片的第二区域。在至少一个实施例中,辅助冷却回路位于靠近主冷却回路进入散热器的第一支路(diversion)的入口的第一区域中。在至少一个实施例中,主冷却回路的第二支路横穿具有散热器的多个散热片的第二区域。在至少一个实施例中,这使得主冷却回路能够具有至少两个平行的分支。在至少一个实施例中,平行分支使得主冷却剂能够同时流入第一区域和第二区域,使得热量的有效移除同时发生在两个区域中。在至少一个实施例中,热的有效去除至少参考在主冷却剂进入时主冷却剂与第一区域和第二区域中的每一个之间能够实现的温度差。在至少一个实施例中,当主冷却剂串联作用以首先从第一区域吸取热量时,那么其从第二区域吸取热量的能力被减少在主冷却剂达到饱和之前剩下的待吸取的热量。在至少一个实施例中,在饱和之后,主冷却剂可能不能有效地减少任一区域中的热量。
73.在至少一个实施例中,第一热量部分地是从服务器托盘202中的计算设备220a-d辐射的热量。在至少一个实施例中,由于与设备220a-d相关联的风扇和/或散热器的结果,热量被辐射掉。在至少一个实施例中,作为与服务器托盘202相关联的服务器风扇的结果,诸如在服务器托盘202的顶盖上辐射热量。在至少一个实施例中,由于与机架相关联的服务器内的壁扇或者由于安装在机架本身上的壁扇而辐射热量。在至少一个实施例中,如果位于机架上方,热量朝向散热器202向上辐射。在至少一个实施例中,散热器具有开口268,以使得热量能够通过散热片258上升。在至少一个实施例中,散热片258将热量保持在其中。在至少一个实施例中,当主冷却剂在曲折路径中流动通过散热器250时,通过主冷却回路256的主冷却剂吸收热量。
74.在至少一个实施例中,散热器250具有用作液体至液体热交换器的第二部分或区域260。在至少一个实施例中,辅助冷却剂可直接或经由机架歧管进入由辅助回路262和主冷却回路256的下方(或上方)主回路形成的液体-液体热交换器的辅助回路262中。在至少一个实施例中,主冷却回路的单独分叉路径可以单独地且同时地服务于第一区域和第二区域。在至少一个实施例中,第二部分或区域260中的液体-液体热交换器使得具有辅助冷却
剂的至少一个辅助冷却回路262能够与主冷却回路256(或来自主冷却回路256的分叉分支)交换第二热量。在至少一个实施例中,第二热量与一个或更多个机架的至少一个计算组件220a-d相关联。在至少一个实施例中,另一个服务器级cdu可以在与冷板210a-d相关联的第一冷却剂和与机架歧管相关联的第二冷却剂之间交换热量,并且第二冷却剂可以可操作地用作在散热器250中被冷却的辅助冷却剂。在至少一个实施例中,这种安排等同于从服务器托盘(具有或不具有机架歧管)引导使用的辅助冷却剂。
75.在至少一个实施例中,主冷却回路可以分叉成两个流。在至少一个实施例中,主冷却回路的第一流可用于从散热片258吸收热量,并且主冷却回路的第二流可用于从辅助冷却回路262吸收热量。在至少一个实施例中,这两个流使得到达散热器250的相应第一和第二区域的主冷却剂的起始温度相等。在至少一个实施例中,该配置表示用于散热器250的并行冷却配置。在至少一个实施例中,当在散热器250中实现主冷却回路的单个流时,主冷却剂首先从辅助冷却回路262吸收热量,然后继续从散热片258吸收或提取热量。在至少一个实施例中,该配置表示用于散热器250的串联冷却配置。在至少一个实施例中,主冷却回路256的入口管线252和出口管线254从与托管机架的数据中心外部的冷却器或冷却设施相关联的主要主冷却回路分支。在至少一个实施例中,主要主冷却回路的另一分支可以与cdu相关联。
76.在至少一个实施例中,如图3a所示的机架级特征300可以与数据中心冷却系统的统一无风扇散热器320相关联。在至少一个实施例中,机架级特征300示出了来自图2的散热器的侧视图。在至少一个实施例中,散热器320内的主冷却回路340的曲线形路径是对角线定向的。在至少一个实施例中,散热器320内的主冷却回路340是水平定向的或竖直定向的,并且可以采用除了曲线形路径之外的其他路径。在至少一个实施例中,机架级特征300包括具有用于一个或更多个机架歧管或机架冷却歧管314a、314b的分支304、306的机架302。在至少一个实施例中,机架歧管314a、314b被示出为用于冷却剂的进入和流出的单个歧管,但分支304、306之一上的并且具有多个内部通道的单个歧管可以用于接收和流出辅助冷却回路的冷却剂。在至少一个实施例中,通道使得冷却剂能够从一个排歧管流动到服务器歧管或直接流动到服务器托盘,并且使得冷却剂能够从服务器歧管或服务器托盘流出到一个排歧管。
77.在至少一个实施例中,机架歧管314a、314b具有分叉的入口310a、b和出口312a,b。在至少一个实施例中,分叉的入口和出口实现从机架302到散热器320并返回到机架302的局部冷却回路;或者从机架302到cdu并且回到机架302的数据中心冷却回路。在至少一个实施例中,局部冷却回路和数据中心冷却回路两者可以同时利用被引导到散热器320和cdu的不同水平的冷却剂来操作。在至少一个实施例中,可以在任何时间操作局部冷却回路或数据中心冷却回路中的仅一个。
78.在至少一个实施例中,来自cdu的辅助冷却剂可以经由分叉的入口310a和入口管线310进入入口侧机架歧管314a。在至少一个实施例中,散热器320和机架302之间可存在没有cdu的辅助冷却回路。在至少一个实施例中,辅助冷却剂继续冷却服务器托盘308内的一个或更多个计算设备332或经由线路320冷却服务器托盘308。在至少一个实施例中,辅助冷却剂经由管线318离开回到出口侧机架歧管314。在至少一个实施例中,用于进入和离开的这些机架歧管是在同一分支304、306上。在至少一个实施例中,辅助冷却剂经由出口管线
312和分叉的出口312a离开机架歧管314b。
79.在至少一个实施例中,流量控制器310c、312c实现机架302与散热器320之间的局部冷却回路。在至少一个实施例中,机架歧管314b的出口侧上的流量控制器312c将辅助冷却剂分流至散热器320的辅助回路338。在至少一个实施例中,流量控制器310c、312c可以是用于将辅助冷却剂从包括cdu并且与主冷却回路相关联的第一路径分流到与散热器相关联的第二路径的至少一个流量控制器。在至少一个实施例中,来自与冷却设施相关联的主冷却回路的主冷却剂经由入口管线322进入散热器320。在至少一个实施例中,主冷却剂的一部分流过分支326,而主冷却剂的剩余部分流过主冷却回路的另一分支340。在至少一个实施例中,这使得能够在辅助冷却回路338中同时冷却散热片和辅助冷却剂。
80.在至少一个实施例中,主冷却回路水平地、竖直地或对角地横穿散热器320的多个散热片324。在至少一个实施例中,多个散热片324保持来自一个或更多个机架302的热量。在至少一个实施例中,主冷却剂从机架302吸收第一热量,其中第一热量至少部分地由散热器的多个散热片324中的保持的热量表示。在至少一个实施例中,具有来自一个或更多个计算设备322(经由相关联的散热器和/或风扇334)、服务器托盘风扇330或其他机架相关的风扇的热量的热空气336可以穿过散热器320的散热片340。在至少一个实施例中,散热片340保持来自热空气336的热量。在至少一个实施例中,多个散热片324然后适于允许主冷却回路盘绕通过多个散热片。在至少一个实施例中,散热片与主冷却回路物理接触以实现传导热传递,或者在主冷却回路中以实现散热热传递。在至少一个实施例中,散热器320的多个散热片324相对于一个或更多个机架302的发热特征或表面332对准,使得它可以有效地保持来自发热表面的热量。在至少一个实施例中,通过使得尽可能多的热空气336能够接合散热片324的表面来实现有效性。
81.在至少一个实施例中,辅助冷却回路适于提供与关联于数据中心冷却系统的冷却分配单元(cdu)的第二辅助冷却回路并发的或分离的补充或经济冷却。在至少一个实施例中,可在移动数据中心环境中使用散热器320,而无需访问高容量冷却器设施。然而,在至少一个实施例中,散热器320可用于支持现有的数据中心冷却系统以便经济或补充冷却。
82.在至少一个实施例中,当确定通过散热器320的最大冷却能力可解决冷却要求或热特征时,可接合散热器。在至少一个实施例中,散热器320可由所提供的流量控制器310c、312c接合,使得可实现具有从机架302到散热器320且回到机架302的路径的局部冷却回路。在至少一个实施例中,当确定散热器320的最大冷却能力可部分地解决冷却要求或热特征时,可接合散热器,但也可接合cdu。在至少一个实施例中,这表示数据中心冷却系统中的经济冷却。在至少一个实施例中,散热器320可通过流量控制器310c、312c与cdu接合。在至少一个实施例中,结果是局部和数据中心组合的冷却回路,其具有用于辅助冷却剂的一部分的从机架302到散热器320并返回到机架302的第一路径;以及用于辅助冷却剂的另一部分的从机架302到cdu(例如在图4中)并回到机架302的第二路径。在至少一个实施例中,这表示数据中心冷却系统中的补充冷却。
83.在至少一个实施例中,流量控制器310c、312c与至少一个辅助冷却回路相关联,以通过使得来自第二辅助冷却回路的附加冷却剂的并流或单独流能够与第二冷却剂组合或分开地在辅助冷却剂旁边流动,来控制补充或经济的冷却。在至少一个实施例中,散热器可以位于机架302之上或之下。在至少一个实施例中,可以使得主冷却回路能够在一个或更多
个机架上方或在与辅助冷却回路相关联的排歧管旁边横穿。在至少一个实施例中,当散热器320位于机架302下方时,与计算设备、服务器和机架相关联的风扇可适于吸取机架下部和下方的热空气。
84.在至少一个实施例中,如图3b中所示出的液体到液体热交换器的特征350可以与数据中心冷却系统的统一无风扇散热器320相关联。在至少一个实施例中,具有图3b中所示出的特征350的液体到液体热交换器可以用于图2的热交换器260的替代方案中。在至少一个实施例中,特征350表示板式液体-液体热交换器。在至少一个实施例中,特征350包括在其周边上具有衬垫或密封件的前盖352,以及在其周边上具有相应的衬垫或相应的密封件的后盖354。在至少一个实施例中,存在板356、358以通过每个相应板的启用(enabled)部分370分配主冷却剂或辅助冷却剂。
85.在至少一个实施例中,盖352、354和板356、358包括可以是自密封端口的贯通端口。在至少一个实施例中,主冷却剂通过端口362a流入热交换器,然后经由通路364a、经由通路364b流动,并经由端口362b流出热交换器。在至少一个实施例中,二辅助冷却剂通过端口360a流入热交换器,然后经由路径366a、路径366b流动,并且经由端口360b流出热交换器。在至少一个实施例中,板356、358中的替代板用于主冷却剂或辅助冷却剂。在至少一个实施例中,板356具有启用部分370,其将主冷却剂从路径364a引导到相应板的启用部分。在至少一个实施例中,垫圈或密封件372防止主冷却剂穿入辅助冷却剂的路径366a、366b中。在至少一个实施例中,启用部分370将主冷却剂从启用部分引导到路径364b,用于离开热交换器。在至少一个实施例中,板358具有类似的启用部分,所述启用部分将辅助冷却剂从用于接收辅助冷却剂的路径366a引导到用于辅助冷却剂流出的路径366b。在至少一个实施例中,用于辅助冷却剂的板358具有相应的密封件或衬垫,以防止辅助冷却剂与主冷却剂混合。
86.在至少一个实施例中,启用部分370将主冷却剂或辅助冷却剂扩散到相应板内的尽可能多的表面区域中。在至少一个实施例中,用于主冷却剂的板356使得它们将用于辅助冷却剂的板358夹在中间。在至少一个实施例中,板的表面能够通过主冷却剂间接散热或传导冷却辅助冷却剂。在至少一个实施例中,机架歧管的分叉的出口到达入口端口360a并且离开出口端口360b以便在机架中再循环或另外在cdu中冷却。在至少一个实施例中,主冷却剂进入入口端口362a并离开出口端口362b。在至少一个实施例中,各个冷却剂分布在各个板的各个启用部分中,在板之间提供大的表面面积用于液体到液体热交换。在至少一个实施例中,离开出口端口362b的主冷却剂被引导到空气到液体热交换器,以从散热片324接收进一步的热量。在至少一个实施例中,离开出口端口362b的主冷却剂从散热器被引导到冷却设施,或被引导回到主冷却回路,在主冷却回路中,主冷却剂与先前从主冷却回路分支到空气-液体热交换器的主冷却剂混合,并返回到主冷却回路中的混合点。
87.在至少一个实施例中,如图4中所示的数据中心级特征400可与数据中心冷却系统的统一无风扇散热器420相关联。在至少一个实施例中,主冷却回路422被分支422a、422b到cdu 406和散热器420。在至少一个实施例中,数据中心的冷却回路中包括在冷却器设施408中冷却的主冷却剂的管路的任何部分被称为主冷却回路,用于至少是主冷却回路的一部分或组件,除非另有说明。在至少一个实施例中,在没有cdu 406的情况下使用散热器420。在至少一个实施例中,这样,主冷却回路422仅使主冷却剂循环到散热器420并返回到冷却器
设施408。在至少一个实施例中,这些来自主冷却回路422的分支在此仍然被称为主冷却回路,或者单独地或者全部合在一起。
88.在至少一个实施例中,主冷却回路422、422a使用空气到液体热交换器420a使用主冷却剂来从一个或更多个机架404吸收第一热量。在至少一个实施例中,主冷却剂还用于使用液体-液体热交换器420b从辅助冷却回路的辅助冷却剂交换第二热量。在至少一个实施例中,主冷却回路与冷却器设施408相关联,并且辅助冷却回路与一个或更多个机架404中的至少一个计算设备相关联,如图2和图3所示。
89.在至少一个实施例中,该辅助冷却回路是指运载辅助冷却剂或不同于该主冷却剂的任何冷却剂的所有管路。在至少一个实施例中,可以有多个热交换器和隔离辅助冷却剂的其他组件,以提供多个较小的冷却回路。在至少一个实施例中,这些多个较小的冷却回路在此仍然被称为辅助冷却回路,单独地或者全部合在一起。
90.在至少一个实施例中,主冷却回路横穿具有空气到液体热交换器420a和液体到液体热交换器420b的散热器420的多个散热片。在至少一个实施例中,多个散热片保留来自至少一个计算设备的热量,并且主冷却剂从多个散热片的保留的热量吸收一个或更多个机架的第一热量。在至少一个实施例中,辅助冷却剂可经由cdu 406与排歧管410之间的入口管线412和出口管线414从cdu 406接合。在至少一个实施例中,流量控制器424允许cdu 406从数据中心冷却系统接合或脱离,所述数据中心冷却系统然后可以仅依赖于散热器420。
91.在至少一个实施例中,排歧管410与机架404之间的流动由相应的入口管线416和出口管线418支撑。在至少一个实施例中,流量控制器424可与入口管线416和出口管线418中的每一个上的流量控制器一起使用,并且与机架歧管相关联的流量控制器可全部用于控制数据中心冷却系统中的补充冷却或经济冷却。在至少一个实施例中,这些流量控制器中的一些可从cdu 406移除或脱离辅助冷却剂,使得机架404仅与散热器420接合。在至少一个实施例中,如果cdu 406重新接合,则这些流量控制器中的一些流量控制器可与和机架歧管相关联的流量控制器一起使用,以实现附加冷却剂的并流或单独流,使得散热器420和cdu 406两者同时可用。在至少一个实施例中,附加冷却剂可以是类似于在具有散热器420的机架404中使用的辅助冷却剂的辅助冷却剂。在至少一个实施例中,具有cdu的辅助冷却回路可被称为第二辅助冷却回路,散热器的辅助冷却回路形成第一辅助冷却回路,并且使得附加冷却剂可与第二冷却剂组合或者可分开地在第二冷却剂旁边流动。
92.在至少一个实施例中,至少一个处理器可以与图2-4中的每一个中讨论的相应的流量控制器接合,以接合或脱离用于主冷却回路和用于一个或更多个辅助冷却回路的各个回路、cdu、散热器和分叉管线。在至少一个实施例中,流量控制器的电气组件可接收来自至少一个处理器的信号,并且可引起机械反应以节流或增加通过各个回路的冷却剂的流量,从cdu到cdu,从散热器与到散热器,以及通过用于主冷却回路和用于辅助冷却回路的分叉管线。
93.在至少一个实施例中,至少一个处理器中的每一个具有推理和/或训练逻辑1815,代码和/或数据存储1801,用于存储前向和/或输出权重和/或输入/输出数据,和/或在一个或更多个实施例的各方面中用于配置被训练和/或用于推理的神经网络的神经元或层的其他参数。在至少一个实施例中,训练逻辑1815可以包括或被耦合到代码和/或数据存储1801以存储图形代码或其他软件以控制定时和/或顺序,其中,将加载权重和/或其他参数信息
来配置逻辑,包括整数和/或浮点单元(统称为算术逻辑单元(alu))。在至少一个实施例中,代码(诸如图代码)基于这样的代码所对应的神经网络的架构将权重或其他参数信息加载到处理器alu中。在至少一个实施例中,代码和/或数据存储1801存储神经网络的每个层的权重参数和/或输入/输出数据,该神经网络在使用一个或更多个实施例的各方面的训练和/或推理期间在输入/输出数据和/或权重参数的前向传播期间与一个或更多个实施例结合训练或使用。在至少一个实施例中,代码和/或数据存储1801的任何部分可与其他芯片上或芯片外数据存储装置一起包含,包含处理器的l1、l2或l3高速缓存存储器或系统存储器。
94.在至少一个实施例中,至少一个处理器的推理和/或训练逻辑1815是用于在服务器级、机架级和排级中的一个或更多个处控制流量控制器的建筑物管理系统(bms)的一部分。在至少一个实施例中,确定进行补充或经济的冷却(或两者);或接合空气到液体热交换器或液体到液体热交换器(或两者)可被提供给推理和/或训练逻辑1815的一个或更多个神经网络,以使一个或更多个神经网络推理哪些流量控制器平滑地接合或脱离。在至少一个实施例中,一个或更多个神经网络可被训练成通过来自计算设备、服务器或机架的先前相关联的热特征或冷却要求以及由散热器在其热交换器中的每一个和两者中指示的冷却容量或能力来作出推理。在至少一个实施例中,由空气到液体热交换器满足的先前冷却要求可使得一个或更多个神经网络通过调整流量控制器以接合空气到液体热交换器来对要满足的将来类似冷却要求(考虑来自其的小变化)作出类似推理。在至少一个实施例中,类似地,由液体到液体热交换器满足的先前冷却要求可使得一个或更多个神经网络通过调整流量控制器以接合液体到液体热交换器来对要满足的将来的类似冷却要求(考虑来自其的小变化)作出类似推理。在至少一个实施例中,一个或更多个神经网络可以确定并向流量控制器(诸如向与流量控制器相关联的电组件)发送选择,以使得适当的热交换器接合或脱离。
95.在至少一个实施例中,在图5中示出了与图2至图4的数据中心冷却系统相关联的方法500。在至少一个实施例中,步骤502提供与数据中心的一个或更多个机架相关联的散热器。在至少一个实施例中,该方法的进一步步骤504使得散热器的第一部分能够用作空气到液体热交换器。在至少一个实施例中,方法的步骤506使散热器的第二部分能够用作液体至液体热交换器。在至少一个实施例中,步骤508确定一个或更多个机架的当前热特征需要补充或经济的冷却。
96.在至少一个实施例中,当步骤508导致肯定的确定时,可以执行步骤510。在至少一个实施例中,可以通过步骤504和506启用热交换器。在至少一个实施例中,步骤510使得使用主冷却剂的主冷却回路能够从一个或更多个机架吸走第一热量。进一步,在至少一个实施例中,步骤512使得具有辅助冷却剂的至少一个辅助冷却回路能够与主冷却回路交换第二热量,第二热量与一个或更多个机架的至少一个计算组件相关联。
97.在至少一个实施例中,方法500的另一个步骤或子步骤包括使用至少一个流量控制器提供用于辅助冷却剂的支路,该支路旨在返回到与主冷却回路相关联的冷却分配单元(cdu),使得辅助冷却剂流到散热器。在至少一个实施例中,方法500的另一步骤或子步骤包括使主冷却回路能够横穿散热器的多个散热片。在至少一个实施例中,多个散热片保持来自一个或更多个机架的热量。在至少一个实施例中,主冷却剂适于从散热器的多个散热片中的保持的热量吸收第一热量。在至少一个实施例中,方法500的另一步骤或子步骤包括将至少一个辅助冷却回路定位在靠近主冷却回路进入散热器的入口的第一区域中。在至少一
个实施例中,主冷却回路适于横穿第一区域,然后横穿具有散热器的多个散热片的第二区域。在至少一个实施例中,方法500的另一步骤或子步骤包括将至少一个辅助冷却回路定位在第一区域中,所述第一区域靠近主冷却回路进入散热器的第一支路的入口。在至少一个实施例中,提供主冷却回路的第二支路以横穿具有散热器的多个散热片的第二区域。
98.在至少一个实施例中,方法500的进一步的步骤或子步骤包括实现用于散热器的多个散热片。在至少一个实施例中,多个散热片保持来自与一个或更多个机架的计算设备和服务器托盘相关联的风扇的热量。在至少一个实施例中,多个散热片适于允许主冷却回路盘绕通过多个散热片。在至少一个实施例中,方法500的进一步步骤或子步骤包括将散热器的多个散热片与一个或更多个机架的发热表面对准,并且使多个散热片能够保持来自发热表面的热量。在至少一个实施例中,方法500的进一步的步骤或子步骤包括提供至少一个辅助冷却回路作为补充或经济的冷却,所述补充或经济的冷却与数据中心冷却系统的冷却分配单元(cdu)相关联的第二辅助冷却回路并发地或分开地操作。在至少一个实施例中,方法500的进一步的步骤或子步骤包括:通过使得来自所述第二辅助冷却回路的附加冷却剂的并流或单独流能够与所述辅助冷却剂结合或分开地在所述辅助冷却剂旁边流动,来使用与所述至少一个辅助冷却回路相关联的流量控制器控制所述补充冷却或经济冷却。在至少一个实施例中,方法500的另一步骤或子步骤包括:将具有空气到液体热交换器和液体到液体热交换器的散热器定位在一个或更多个机架的上方或下方。在至少一个实施例中,可以使得主冷却回路能够在一个或更多个机架上方或在与辅助冷却回路相关联的排歧管旁边横穿。
99.服务器和数据中心
100.以下附图阐述了但不限于可以用于实现至少一个实施例的基于示例性网络服务器和数据中心的系统。
101.图6示出了根据至少一个实施例的分布式系统600。在至少一个实施例中,分布式系统600包括一个或更多个客户端计算设备602、604、606和608,其被配置成在一个或更多个网络610上执行和操作客户端应用,诸如网络(web)浏览器、专有客户端和/或其变体。在至少一个实施例中,服务器612可以经由网络610与远程客户端计算设备602、604、606和608通信地耦合。
102.在至少一个实施例中,服务器612可适于运行一个或更多个服务或软件应用,诸如可管理跨多个数据中心的单点登录(sso)访问的会话活动的服务和应用。在至少一个实施例中,服务器612还可以提供其他服务,或者软件应用可以包括非虚拟和虚拟环境。在至少一个实施例中,这些服务可作为基于web的服务或云服务或在软件即服务(saas)模型下被提供给客户端计算设备602、604、606和/或608的用户。在至少一个实施例中,操作客户端计算设备602、604、606和/或608的用户又可以利用一个或更多个客户端应用来与服务器612交互以利用由这些组件提供的服务。
103.在至少一个实施例中,系统600的软件组件618、620和622在服务器612上实现。在至少一个实施例中,系统600的一个或更多个组件和/或由这些组件提供的服务也可由客户端计算设备602、604、606和/或608中的一个或更多个来实现。在至少一个实施例中,操作客户端计算设备的用户然后可以利用一个或更多个客户端应用来使用由这些组件提供的服务。在至少一个实施例中,这些组件可以用硬件、固件、软件或其组合来实现。应当理解,各
种不同的系统配置是可能的,其可以不同于分布式系统600。因此,图6所示的实施例是用于实现实施例系统的分布式系统的至少一个实施例,并且不旨在是限制性的。
104.在至少一个实施例中,客户端计算设备602、604、606和/或608可以包括不同类型的计算系统。在至少一个实施例中,客户端计算设备可以包括便携式手持设备(例如,蜂窝电话、计算平板、个人数字助理(pda))或可穿戴设备(例如,google 头戴式显示器),运行软件(如microsoft windows )和/或多种移动操作系统(如ios),windows phone、android、blackberry 10、palm os和/或其变体。在至少一个实施例中,设备可以支持不同应用,诸如不同互联网相关的应用、电子邮件、短消息服务(sms)应用,并且可以使用不同其他通信协议。在至少一个实施例中,客户端计算设备还可以包括通用个人计算机,通过至少一个实施例的方式,所述通用个人计算机包括运行不同版本的microsoftapple 和/或linux操作系统的个人计算机和/或膝上型计算机。
105.在至少一个实施例中,客户端计算设备可以是运行多种可商购的或类似unix的操作系统中的任一种的工作站计算机,包括但不限于多种gnu/linux操作系统,如google chrome os。在至少一个实施例中,客户端计算设备还可以包括能够通过(一个或更多个)网络610进行通信的电子设备,如瘦客户端计算机、启用互联网的游戏系统(例如,具有或不具有手势输入设备的微软xbox游戏控制台)、和/或个人消息传递设备。尽管图6中的分布式系统600被示为具有四个客户端计算设备,但可支持任何数量的客户端计算设备。其他设备(诸如具有传感器的设备等)可与服务器612交互。
106.在至少一个实施例中,分布式系统600中的网络610可以是能够使用各种可用协议中的任何协议来支持数据通信的任何类型的网络,包括但不限于tcp/ip(传输控制协议/互联网协议)、sna(系统网络架构)、ipx(互联网分组交换)、appletalk和/或其变体。在至少一个实施例中,网络610可以是局域网(lan),基于以太网、令牌环、广域网、互联网、虚拟网络、虚拟专用网(vpn)的网络、内联网、外联网、公共交换电话网络(pstn)、红外网络、无线网络(例如,在电气与电子学会(ieee)802.11协议组、和/或任何其他无线协议中的任一者下运行的网络),和/或这些和/或其他网络的任何组合。
107.在至少一个实施例中,服务器612可以由一个或更多个通用计算机、专用服务器计算机(通过至少一个实施例的方式,包括pc(个人计算机)服务器、服务器、中程服务器、大型计算机、机架式服务器等)、服务器场、服务器群集或任何其他适当的安排和/或组合组成。在至少一个实施例中,服务器612可包括运行虚拟操作系统的一个或更多个虚拟机或涉及虚拟化的其他计算架构。在至少一个实施例中,可以虚拟化一个或更多个灵活的逻辑存储设备池,以便为服务器维护虚拟存储设备。在至少一个实施例中,虚拟网络可由服务器612使用软件定义的联网来控制。在至少一个实施例中,服务器612可适于运行一个或更多个服务或软件应用。
108.在至少一个实施例中,服务器612可以运行任何操作系统,以及任何可商购的服务器操作系统。在至少一个实施例中,服务器612还可以运行多种附加服务器应用和/或中层应用中的任一种,包括http(超文本传输协议)服务器、ftp(文件传输协议)服务器、cgi(公
共网关接口)服务器、服务器、数据库服务器和/或其变体。在至少一个实施例中,示例性数据库服务器包括但不限于从oracle、microsoft、sybase、ibm(国际商业机器)和/或其变体可商购的那些。
109.在至少一个实施例中,服务器612可包括一个或更多个应用以分析和合并从客户端计算设备602、604、606和608的用户接收的数据馈送和/或事件更新。在至少一个实施例中,数据馈送和/或事件更新可以包括但不限于,从一个或更多个第三方信息源和连续数据流接收的馈送、更新或实时更新,其可以包括与传感器数据应用、金融报价器、网络性能测量工具(例如,网络监视和业务管理应用)相关的实时事件,点击流分析工具、汽车交通监测和/或其变化。在至少一个实施例中,服务器612还可以包括用于经由客户端计算设备602、604、606和608的一个或更多个显示设备来显示数据馈送和/或实时事件的一个或更多个应用。
110.在至少一个实施例中,分布式系统600还可包括一个或更多个数据库614和616。在至少一个实施例中,数据库可提供用于存储诸如用户交互信息、使用模式信息、适配规则信息和其他信息之类的信息的机制。在至少一个实施例中,数据库614和616可以驻留在各种位置中。在至少一个实施例中,数据库614和616中的一个或更多个可以驻留在服务器612本地(和/或驻留在服务器612中)的非瞬态存储介质上。在至少一个实施例中,数据库614和616可以远离服务器612并且经由基于网络或专用连接与服务器612通信。在至少一个实施例中,数据库614和616可以驻留在存储区域网络(san)中。在至少一个实施例中,用于执行归属于服务器612的功能的任何必要的文件可以在适当时本地存储在服务器612上和/或远程存储。在至少一个实施例中,数据库614和616可以包括关系数据库,诸如适于响应于sql格式化的命令而存储、更新和检索数据的数据库。
111.图7示出了根据至少一个实施例的示例性数据中心700。在至少一个实施例中,数据中心700包括但不限于数据中心基础设施层710、框架层720、软件层730和应用层740。
112.在至少一个实施例中,如图7所示,数据中心基础设施层710可以包括资源协调器712、分组的计算资源714和节点计算资源(“节点c.r.”)716(1)-716(n),其中“n”表示任何完整的正整数。在至少一个实施例中,节点c.r.716(1)-716(n)可以包括但不限于任意数量的中央处理单元(“cpu”)或其他处理器(包括加速器、现场可编程门阵列(“fpga”)、图形处理器等)、存储器设备(例如,动态只读存储器)、存储设备(例如,固态硬盘或磁盘驱动器)、网络输入/输出(“nw i/o”)设备、网络交换机、虚拟机(“vm”)、功率模块和冷却模块等。在至少一个实施例中,节点c.r.716(1)-716(n)中的一个或更多个节点c.r.可以是具有一个或更多个上述计算资源的服务器。
113.在至少一个实施例中,分组的计算资源714可以包括容纳在一个或更多个机架内的节点c.r.的单独分组(未示出),或者容纳在各个地理位置的数据中心内的许多机架(也未示出)。分组的计算资源714内的节点c.r.的单独分组可以包括可以被配置或分配为支持一个或更多个工作负载的分组的计算、网络、存储器或存储资源。在至少一个实施例中,可以将包括cpu或处理器的几个节点c.r.分组在一个或更多个机架内,以提供计算资源来支持一个或更多个工作负载。在至少一个实施例中,一个或更多个机架还可以包括任意数量的电源模块、冷却模块和网络交换机,以任意组合。
114.在至少一个实施例中,资源协调器712可以配置或以其他方式控制一个或更多个
节点c.r.716(1)-716(n)和/或分组的计算资源714。在至少一个实施例中,资源协调器712可以包括用于数据中心700的软件设计基础结构(“sdi”)管理实体。在至少一个实施例中,资源协调器712可以包括硬件、软件或其某种组合。
115.在至少一个实施例中,如图7所示,框架层720包括但不限于作业调度器732、配置管理器734、资源管理器736和分布式文件系统738。在至少一个实施例中,框架层720可以包括支持软件层730的软件752和/或应用程序层740的一个或更多个应用程序742的框架。在至少一个实施例中,软件752或应用程序742可以分别包括基于web的服务软件或应用程序,例如由amazon web services、google cloud和microsoft azure提供的服务或应用程序。在至少一个实施例中,框架层720可以是但不限于一种免费和开放源软件网络应用框架,例如可以利用分布式文件系统738来进行大范围数据处理(例如“大数据”)的apache sparktm(以下称为“spark”)。在至少一个实施例中,作业调度器732可以包括spark驱动器,以促进对数据中心700的各个层所支持的工作负载进行调度。在至少一个实施例中,配置管理器734可以能够配置不同的层,例如软件层730和包括spark和用于支持大规模数据处理的分布式文件系统738的框架层720。在至少一个实施例中,资源管理器736能够管理映射到或分配用于支持分布式文件系统738和作业调度器732的集群或分组计算资源。在至少一个实施例中,集群或分组计算资源可以包括数据中心基础设施层710上的分组的计算资源714。在至少一个实施例中,资源管理器736可以与资源协调器712协调以管理这些映射的或分配的计算资源。
116.在至少一个实施例中,包括在软件层730中的软件752可以包括由节点c.r.716(1)-716(n)的至少一部分,分组计算资源714和/或框架层720的分布式文件系统738使用的软件。一种或更多种类型的软件可以包括但不限于internet网页搜索软件、电子邮件病毒扫描软件、数据库软件和流视频内容软件。
117.在至少一个实施例中,应用层740中包括的一个或更多个应用程序742可以包括由节点c.r.716(1)-716(n)的至少一部分、分组的计算资源714和/或框架层720的分布式文件系统738使用的一种或更多种类型的应用程序。一种或更多种类型的应用程序可以包括但不限于cuda应用程序、5g网络应用程序、人工智能应用程序、数据中心应用程序、和/或其变体。
118.在至少一个实施例中,配置管理器734、资源管理器736和资源协调器712中的任何一个可以基于以任何技术上可行的方式获取的任意数量和类型的数据来实现任意数量和类型的自我修改动作。在至少一个实施例中,自我修改动作可以减轻数据中心700的数据中心操作员做出可能不好的配置决定并且可以避免数据中心的未充分利用和/或执行差的部分。
119.图8示出了根据至少一个实施例的由互连的多个网络服务器计算机802形成的客户端-服务器网络804。在至少一个实施例中,每个网络服务器计算机802存储其他网络服务器计算机802和链接到广域网804中的客户端计算机806和网络808可访问的数据。在至少一个实施例中,当客户端计算机806和一个或更多个网络808与网络804连接和断开连接时,以及当一个或更多个干线服务器计算机802被添加或从网络804移除时,客户端-服务器网络804的配置可随时间改变。在至少一个实施例中,当客户端计算机806和网络808与网络服务器计算机802连接时,客户端-服务器网络包括这样的客户端计算机806和网络808。在至少
一个实施例中,术语计算机包括能够接受数据、将规定的过程应用于数据以及提供过程的结果的任何设备或机器。
120.在至少一个实施例中,客户端-服务器网络804存储网络服务器计算机802、远程网络808和客户端计算机806可访问的信息。在至少一个实施例中,网络服务器计算机802由主框架计算机小型计算机和/或各自具有一个或更多个处理器的微型计算机形成。在至少一个实施例中,服务器计算机802通过有线和/或无线传输介质(诸如导电线、光纤电缆)和/或微波传输介质、卫星传输介质或其他导电、光学或电磁波传输介质链接在一起。在至少一个实施例中,客户端计算机806通过类似的有线或无线转移介质访问网络服务器计算机802。在至少一个实施例中,客户端计算机806可以使用调制解调器和标准电话通信网络链接到客户端-服务器网络804中。在至少一个实施例中,替代性的运营商系统(如电缆和卫星通信系统)还可以用于链接到客户端-服务器网络804中。在至少一个实施例中,可以使用其他私有或时间共享的载波系统。在至少一个实施例中,网络804是全局信息网络,诸如互联网。在至少一个实施例中,网络是使用与互联网类似的协议但具有添加的安全措施和受限的访问控制的私有内联网。在至少一个实施例中,网络804是使用专有通信协议的私有或半私有网络。
121.在至少一个实施例中,客户端计算机806是任何终端用户计算机,并且还可以是具有一个或更多个微处理器的大型计算机、小型计算机或微型计算机。在至少一个实施例中,服务器计算机802有时可用作访问另一服务器计算机802的客户端计算机。在至少一个实施例中,远程网络808可以是局域网、通过用于互联网的独立服务提供商(isp)被添加到广域网中的网络、或通过具有固定或随时间改变的配置的有线或无线传送介质互连的另一组计算机。在至少一个实施例中,客户端计算机806可以独立地或通过远程网络808链接到网络804中并且访问网络804。
122.图9示出了根据至少一个实施例的连接一个或更多个计算机的计算机网络908。在至少一个实施例中,网络908可以是任何类型的电连接计算机组,包括例如以下网络:互联网、内联网、局域网(lan)、广域网(wan)或这些网络类型的互连组合。在至少一个实施例中,网络908内的连接可以是远程调制解调器、以太网(ieee802.3)、令牌环(ieee802.5)、光纤分布式数据链路接口(fddi)、异步传输模式(atm)或任何其他通信协议。在至少一个实施例中,链接到网络的计算设备可以是台式机、服务器、便携式、手持式、机顶盒、个人数字助理(pda)、终端、或任何其他期望的类型或配置。在至少一个实施例中,取决于它们的功能性,网络连接的设备可以在处理能力、内部存储器和其他性能方面广泛地变化。
123.在至少一个实施例中,网络内的通信以及去往或来自连接到网络的计算设备的通信可以是有线或无线的。在至少一个实施例中,网络908可以至少部分地包括世界范围的公共互联网,其通常根据客户端-服务器模型根据传输控制协议/互联网协议(tcp/ip)规范连接多个用户。在至少一个实施例中,客户端-服务器网络是用于在两个计算机之间通信的主导模型。在至少一个实施例中,客户端计算机(“客户端”)向服务器计算机(“服务器”)发出一个或更多个命令。在至少一个实施例中,服务器通过访问可用网络资源并根据客户端命令向客户端返回信息来履行客户端命令。在至少一个实施例中,客户端计算机系统和驻留在网络服务器上的网络资源被分配网络地址,用于在网络的元件之间的通信期间识别。在至少一个实施例中,从其他网络连接系统到服务器的通信将包括作为通信的一部分的相关
服务器/网络资源的网络地址,使得数据/请求的适当目的地被识别为接收者。在至少一个实施例中,当网络908包括全球互联网时,网络地址是tcp/ip格式的ip地址,其可至少部分地将数据路由到电子邮件账户、网站或驻留在服务器上的其他互联网工具。在至少一个实施例中,驻留在网络服务器上的信息和服务可以通过域名(例如www.site.com)映射到网络服务器的ip地址对客户端计算机的web浏览器可用。
124.在至少一个实施例中,多个客户端902、904和906经由对应的通信链路连接至网络908。在至少一个实施例中,这些客户端中的每一个可以经由任何期望形式的通信(诸如经由拨号调制解调器连接、电缆链路、数字用户线(dsl)、无线或卫星链路、或任何其他形式的通信)来访问网络908。在至少一个实施例中,每个客户端可以使用与网络908兼容的任何机器(例如,个人计算机(pc)、工作站、专用终端、个人数据助理(pda)或其他类似的设备)进行通信。在至少一个实施例中,客户端902、904和906可以位于或可以不位于相同的地理区域中。
125.在至少一个实施例中,多个服务器910、912和914连接到网络918以服务于与网络918通信的客户端。在至少一个实施例中,每个服务器通常是管理网络资源并对客户端命令作出响应的强大的计算机或设备。在至少一个实施例中,服务器包括存储程序指令和数据的计算机可读数据存储媒质,诸如硬盘驱动器和ram存储器。在至少一个实施例中,服务器910、912、914运行响应于客户端命令的应用程序。在至少一个实施例中,服务器910可以运行用于响应对html页面的客户端请求的web服务器应用,并且还可以运行用于接收和路由电子邮件的邮件服务器应用。在至少一个实施例中,在服务器910上还可以运行其他应用程序,如用于将音频/视频数据流式传输至客户端的ftp服务器或媒体服务器。在至少一个实施例中,不同的服务器可以专用于执行不同的任务。在至少一个实施例中,服务器910可以是为不同用户管理与网站相关的资源的专用web服务器,而服务器912可以专用于提供电子邮件(email)管理。在至少一个实施例中,其他服务器可以专用于媒体(音频、视频等)、文件传输协议(ftp)或通常通过网络可用或提供的任何两个或更多个服务的组合。在至少一个实施例中,每个服务器可以在与其他服务器的位置相同或不同的位置中。在至少一个实施例中,可存在为用户执行镜像任务的多个服务器,从而减轻拥塞或最小化定向到和来自单个服务器的流量。在至少一个实施例中,服务器910、912、914在维护和通过网络918递送第三方内容的业务中的web托管提供者的控制下。
126.在至少一个实施例中,web托管提供商向两个不同类型的客户端递送服务。在至少一个实施例中,可被称为浏览器的一种类型从服务器910、912、914请求内容,诸如网页、电子邮件消息、视频剪辑等。在至少一个实施例中,第二类型(其可以被称为用户)雇佣web托管提供商来维护网络资源(诸如网站)并使其可用于浏览器。在至少一个实施例中,用户与web托管提供商签订合同,以根据用户期望利用的服务器资源的量使存储器空间、处理器容量和通信带宽可用于他们期望的网络资源。
127.在至少一个实施例中,为了使web托管提供商为这两个客户端提供服务,必须适当地配置管理由服务器托管的网络资源的应用程序。在至少一个实施例中,程序配置过程涉及定义参数集,所述参数集至少部分地控制应用程序对浏览器请求的响应并且还至少部分地定义特定用户可用的服务器资源。
128.在一个实施例中,内联网服务器916经由通信链路与网络908通信。在至少一个实
施例中,内联网服务器916与服务器管理器918通信。在至少一个实施例中,服务器管理器918包括在服务器910、912、914中使用的应用程序配置参数的数据库。在至少一个实施例中,用户经由内联网916修改数据库920,并且服务器管理器918与服务器910、912、914交互以修改应用程序参数,使得它们匹配数据库的内容。在至少一个实施例中,用户通过经由计算机902连接到内联网916并且输入诸如用户名和密码的认证信息来登录到内联网服务器916。
129.在至少一个实施例中,当用户希望注册新服务或修改现有服务时,内联网服务器916对用户进行认证并向用户提供允许用户访问特定应用程序的配置参数的交互式屏幕显示/控制面板。在至少一个实施例中,向用户呈现描述用户的网站或其他网络资源的配置的方面的多个可修改文本框。在至少一个实施例中,如果用户期望增加在服务器上为其网站保留的存储器空间,则向用户提供其中用户指定期望的存储器空间的字段。在至少一个实施例中,响应于接收到该信息,内联网服务器916更新数据库920。在至少一个实施例中,服务器管理器918将该信息转发到适当的服务器,并且在应用程序操作期间使用新的参数。在至少一个实施例中,内联网服务器916被配置来向用户提供对用户已与web托管服务提供商签订的托管网络资源(例如,网页、电子邮件、ftp站点、媒体站点等)的配置参数的访问。
130.图10a示出了根据至少一个实施例的联网计算机系统1000a。在至少一个实施例中,联网计算机系统1000a包括多个节点或个人计算机(“pc”)1002、1018、1020。在至少一个实施例中,个人计算机或节点1002包括处理器1014、存储器1016、摄像机1004、麦克风1006、鼠标1008、扬声器1010和监视器1012。在至少一个实施例中,pc1002、1018、1020可以各自运行例如给定公司内的内部网络的一个或更多个桌面服务器,或者可以是不限于特定环境的通用网络的服务器。在至少一个实施例中,网络的每个pc节点有一个服务器,使得网络的每个pc节点表示具有特定网络url地址的特定网络服务器。在至少一个实施例中,每个服务器默认为该服务器的用户的默认网页,该默认网页本身可包含指向该服务器上该用户的进一步子页面、或者指向网络上的其他服务器或其他服务器上的页面的嵌入式url。
131.在至少一个实施例中,节点1002、1018、1020和网络的其他节点经由介质1022互连。在至少一个实施例中,介质1022可以是诸如综合服务数字网(“isdn”)的通信信道。在至少一个实施例中,联网计算机系统的不同节点可以通过不同通信介质连接,包括局域网(“lan”)、简易老式电话线(“pots”),有时被称为公共交换电话网络(“pstn”)、和/或其变体。在至少一个实施例中,网络的不同节点还可以构成经由诸如互联网的网络互连的计算机系统用户。在至少一个实施例中,(在给定实例处从网络的特定节点运行的)网络上的每个服务器在网络内具有唯一地址或标识,该唯一地址或标识可以根据url指定。
132.在至少一个实施例中,多个多点会议单元(“mcu”)因此可以用于向会议系统的各个节点或“端点”和从会议系统的各个节点或“端点”传输数据。在至少一个实施例中,除了各种其他通信介质(诸如,通过互联网连接的节点)之外,节点和/或mcu可通过isdn链路或通过局域网(“lan”)互连。在至少一个实施例中,会议系统的节点通常可以直接连接到通信介质(如lan)或通过mcu,并且会议系统可以包括其他节点或元件,如路由器、服务器和/或其变体。
133.在至少一个实施例中,处理器1014是通用可编程处理器。在至少一个实施例中,联网计算机系统1000a的节点的处理器还可以是专用视频处理器。在至少一个实施例中,节点
的不同外围设备和组件(诸如节点1002的那些)可以与其他节点的那些不同。在至少一个实施例中,节点1018和节点1020可以被配置为与节点1002相同或不同。在至少一个实施例中,除了pc系统之外,节点可以在任何合适的计算机系统上实现。
134.图10b示出了根据至少一个实施例的联网计算机系统1000b。在至少一个实施例中,系统1000b示出了网络(如lan 1024),该网络可以用于互连可以彼此通信的各种节点。在至少一个实施例中,附接到lan1024的是多个节点,诸如pc节点1026、1028、1030。在至少一个实施例中,节点还可经由网络服务器或其他装置连接到lan。在至少一个实施例中,系统1000b包括其他类型的节点或元件,至少一个实施例包括路由器、服务器和节点。
135.图10c示出根据至少一个实施例的联网计算机系统1000c。在至少一个实施例中,系统1000c示出了具有跨骨干通信网络(诸如互联网1032)的通信的www系统,骨干通信网络可用于互连网络的各种节点。在至少一个实施例中,www是在互联网之上操作的一组协议,并且允许图形界面系统在其上操作以便通过互联网访问信息。在至少一个实施例中,附接到www中的互联网1032的是多个节点,例如pc1040、1042、1044。在至少一个实施例中,节点通过www http服务器(诸如服务器1034、1036)与www的其他节点对接。在至少一个实施例中,pc1044可以是形成网络1032的节点的pc,并且pc1044本身运行它的服务器1036,尽管为了说明的目的在图10c中单独地示出pc1044和服务器1036。
136.在至少一个实施例中,www是一种分布式类型的应用程序,其特征为www http、www的协议,它在互联网的传输控制协议/互联网协议(“tcp/ip”)之上运行。在至少一个实施例中,www因此可以由在互联网上运行的一组协议(即,http)作为其“主干”来表征。”137.在至少一个实施例中,web浏览器是在网络的节点上运行的应用,在兼容www类型的网络系统中,允许特定服务器或节点的用户查看这样的信息,并因此允许用户使用嵌入在从理解http的网络上的服务器可获得的文档或文件中的超文本链接来搜索链接在一起的图形和基于文本的文件。在至少一个实施例中,当用户使用诸如互联网的网络上的另一服务器来检索与第一节点相关联的第一服务器的给定网页时,所检索的文档可具有嵌入在其中的不同超文本链接,并且在检索用户的本地创建页面的本地副本。在至少一个实施例中,当用户点击超文本链接时,本地存储的与所选择的超文本链接相关的信息通常足以允许用户的机器打开通过互联网到由超文本链接指示的服务器的连接。
138.在至少一个实施例中,多于一个用户可通过lan(诸如lan1038,如关于www http服务器1034所示)耦合到每个http服务器。在至少一个实施例中,系统1000c还可以包括其他类型的节点或元件。在至少一个实施例中,www http服务器是在诸如pc的机器上运行的应用。在至少一个实施例中,每个用户可以被认为具有唯一的“服务器”,如关于pc1044所示。在至少一个实施例中,服务器可以被认为是诸如www http服务器1034的服务器,该服务器为lan或多个节点或多个lan提供对网络的访问。在至少一个实施例中,存在多个用户,每个用户具有台式pc或网络的节点,每个台式pc潜在地为其用户建立服务器。在至少一个实施例中,每个服务器与特定网络地址或url相关联,当被访问时,该特定网络地址或url为该用户提供默认网页。在至少一个实施例中,网页可以包含进一步的链接(嵌入式url),其指向该服务器上的该用户的进一步的子页面,或者指向网络上的其他服务器或者指向网络上的其他服务器上的页面。
139.云计算和服务
140.以下附图阐述但不限于可以用于实现至少一个实施例的示例性的基于云的系统。
141.在至少一个实施例中,云计算是一种计算风格,其中动态可扩展和经常虚拟化的资源作为服务通过互联网来提供。在至少一个实施例中,用户不需要具有支持他们的技术基础设施的知识、技术基础设施的专业知识或对技术基础设施的控制,该技术基础设施可以被称为“在云中”。在至少一个实施例中,云计算将基础设施合并为服务、平台合并为服务、软件合并为服务、以及具有依赖于互联网的常见主题以满足用户的计算需求的其他变型。在至少一个实施例中,典型的云部署(诸如在私有云(例如,企业网络)中)或公共云(例如,互联网)中的数据中心(dc)可由数千个服务器(或可替代地,vm)、数百个以太网、光纤信道或以太网光纤信道(fcoe)端口、交换和存储基础设施等组成。在至少一个实施例中,云还可以由网络服务基础设施组成,如ipsec vpn集线器、防火墙、负载平衡器、广域网(wan)优化器等。在至少一个实施例中,远程订户可以通过经由vpn隧道(如ipsec vpn隧道)连接来安全地访问云应用和服务。
142.在至少一个实施例中,云计算是一种用于使能对可配置计算资源(例如,网络、服务器、存储装置、应用程序和服务)的共享池的方便、按需的网络访问的模型,所述可配置计算资源可以用最小的管理努力或服务提供商交互来快速配置和释放。
143.在至少一个实施例中,云计算的特征在于按需自助服务,其中消费者可根据需要自动地单方面供应计算能力,诸如服务器时间和网络存储,而无需与每个服务提供者的人类互动。在至少一个实施例中,云计算的特征在于广泛的网络访问,其中能力在网络上可用并且通过标准机制来访问,所述标准机制促进由异构的瘦或厚客户端平台(例如,移动电话、膝上型计算机和pda)的使用。在至少一个实施例中,云计算的特征在于资源池,其中提供者的计算资源被池化以使用多租户模型服务于多个消费者,其中不同的物理和虚拟资源根据消费者需求被动态地签署和重新分配。在至少一个实施例中,存在位置独立性的感觉,因为消费者通常对所提供的资源的确切位置没有控制或知识,但可能能够在较高抽象级别(例如,国家、州或数据中心)指定位置。
144.在至少一个实施例中,资源包括存储、处理、存储器、网络带宽和虚拟机。在至少一个实施例中,云计算的特征在于快速弹性,其中能力可被快速且弹性地供应(在一些情况下是自动地)以快速缩小和快速释放以快速放大。在至少一个实施例中,对于消费者,可用于供应的能力通常显得不受限制并且可以在任何时间以任何数量购买。在至少一个实施例中,云计算由测量的服务来表征,其中云系统通过在适合于服务类型(例如,存储、处理、带宽和活动用户账户)的某种抽象级别处利用计量能力来自动地控制和优化资源使用。在至少一个实施例中,资源使用可以被监控、控制和报告,从而为所利用的服务的提供者和消费者两者提供透明度。
145.在至少一个实施例中,云计算可与不同服务相关联。在至少一个实施例中,云软件即服务(saas)可以指代提供给消费者的能力是使用在云基础设施上运行的提供者的应用的服务。在至少一个实施例中,应用可通过诸如web浏览器(例如,基于web的电子邮件)的瘦客户端接口从不同客户端设备访问。在至少一个实施例中,消费者不管理或控制包括网络、服务器、操作系统、存储或甚至各个应用能力的底层云基础结构,可能的例外是有限的用户特定的应用配置设置。
146.在至少一个实施例中,云平台即服务(paas)可以指这样的服务:其中提供给消费
者的能力是将消费者创建或获取的应用部署到云基础设施上,这些应用是使用由提供者支持的编程语言和工具创建的。在至少一个实施例中,消费者不管理或控制包括网络、服务器、操作系统或存储的底层云基础结构,但是具有对所部署的应用以及可能的应用托管环境配置的控制。
147.在至少一个实施例中,云基础架构即服务(iaas)可以指这样的服务:其中向消费者提供的能力是提供处理、存储、网络和消费者能够部署和运行可包括操作系统和应用的任意软件的其他基本计算资源。在至少一个实施例中,消费者不管理或控制底层云基础结构,而是具有对操作系统、存储、所部署的应用的控制,以及对选择的联网组件(例如,主机防火墙)的可能有限的控制。
148.在至少一个实施例中,可以不同方式部署云计算。在至少一个实施例中,私有云可指仅针对组织操作的云基础结构。在至少一个实施例中,私有云可由组织或第三方管理,并且可存在于场所内或场所外。在至少一个实施例中,社区云可以指由若干组织共享并且支持具有共享关注(例如,任务、安全要求、策略和合规性考虑)的特定社区的云基础结构。在至少一个实施例中,社区云可由组织或第三方管理,并且可存在于场所内或场所外。在至少一个实施例中,公共云可以指代对一般公众或大型产业组可用并且由提供云服务的组织拥有的云基础结构。在至少一个实施例中,混合云可以指的是云基础架构是两个或更多个云(私有、社区或公共的)的组成部分,这些云仍然是唯一的实体,但是通过实现数据和应用便携性的标准化或专有技术(例如,用于云之间的负载平衡的云突发)绑定在一起。在至少一个实施例中,云计算环境是面向服务的,关注于状态、低耦合、模块性和语义互操作性。
149.图11示出根据至少一个实施例的系统环境1100的一个或更多个组件,其中服务可被提供为第三方网络服务。在至少一个实施例中,第三方网络可被称为云、云网络、云计算网络和/或其变体。在至少一个实施例中,系统环境1100包括一个或更多个客户端计算设备1104、1106和1108,客户端计算设备1104、1106和1108可被用户用来与提供第三方网络服务(其可被称为云计算服务)的第三方网络基础设施系统1102交互。在至少一个实施例中,第三方网络基础设施系统1102可包括一个或更多个计算机和/或服务器。
150.应了解,图11中所描绘的第三方网络基础设施系统1102可具有除了所描绘的那些组件之外的其他组件。进一步地,图11描绘了第三方网络基础设施系统的实施例。在至少一个实施例中,第三方网络基础设施系统1102可具有比图11中描绘的更多或更少的组件,可组合两个或更多个组件,或可具有不同的组件配置或布置。
151.在至少一个实施例中,客户端计算设备1104、1106和1108可被配置成操作客户端应用,诸如web浏览器,可由客户端计算设备的用户用来与第三方网络基础设施系统1102交互以使用由第三方网络基础设施系统1102提供的服务的专有客户端应用或一些其他应用。尽管示例性系统环境1100被示为具有三个客户端计算设备,但是可以支持任何数量的客户端计算设备。在至少一个实施例中,其他设备诸如具有传感器的设备等。可与第三方网络基础设施系统1102交互。在至少一个实施例中,(一个或更多个)网络1110可以促进客户端计算设备1104、1106和1108与第三方网络基础设施系统1102之间的通信和数据交换。
152.在至少一个实施例中,由第三方网络基础设施系统1102提供的服务可包括按需提供给第三方网络基础设施系统的用户的服务的主机。在至少一个实施例中,还可以提供不同服务,包括但不限于在线数据存储和备份解决方案、基于web的电子邮件服务、托管的办
公套件和文档协作服务、数据库管理和处理、管理的技术支持服务、和/或其变体。在至少一个实施例中,由第三方网络基础设施系统提供的服务可以动态地扩展以满足其用户的需要。
153.在至少一个实施例中,由第三方网络基础设施系统1102提供的服务的特定实例可被称为“服务实例”。在至少一个实施例中,通常,经由通信网络(如互联网)从第三方网络服务提供商系统对用户可用的任何服务被称为“第三方网络服务。”在至少一个实施例中,在公共第三方网络环境中,组成第三方网络服务提供商系统的服务器和系统不同于客户自己的场所内服务器和系统。在至少一个实施例中,第三方网络服务提供商系统可以托管应用,并且用户可以通过通信网络(如互联网)按需、订购和使用应用。
154.在至少一个实施例中,计算机网络第三方网络基础设施中的服务可包括对存储、托管数据库、托管网络服务器、软件应用或由第三方网络供应商提供给用户的其他服务的受保护的计算机网络访问。在至少一个实施例中,服务可包括通过互联网对第三方网络上的远程存储装置的密码保护的访问。在至少一个实施例中,服务可以包括基于网络服务的托管关系数据库和脚本语言中间件引擎,以便由联网开发者私人使用。在至少一个实施例中,服务可包括对托管在第三方网络供应商的网站上的电子邮件软件应用的访问。
155.在至少一个实施例中,第三方网络基础设施系统1102可包括以自助、基于订阅、可弹性扩展、可靠、高度可用和安全方式递送给客户的一组应用、中间件和数据库服务提供。在至少一个实施例中,第三方网络基础设施系统1102还可以提供“大数据”相关的计算和分析服务。在至少一个实施例中,术语“大数据”通常用于指可以由分析师和研究人员存储和操纵的极大数据集,以便使大量数据可视化、检测趋势、和/或以其他方式与数据交互。在至少一个实施例中,大数据和相关应用可以由基础设施系统在许多级别上和以不同规模托管和/或操纵。在至少一个实施例中,并行链接的数十个、数百个或数千个处理器可对此类数据起作用以便呈现该数据或模拟对数据或其所表示的内容的外力。在至少一个实施例中,这些数据集可涉及结构化数据(诸如在数据库中或以其他方式根据结构化模型组织的结构化数据)和/或非结构化数据(例如,电子邮件、图像、数据blob(二进制大对象)、网页、复杂事件处理)。在至少一个实施例中,通过利用实施例的能力来将更多(或更少)计算资源相对快速地聚焦到目标上,第三方网络基础设施系统可以更好地可用于基于来自企业的需求在大数据集上执行任务,政府机构、研究组织、私人个人、喜欢提醒的个人或组织的组、或其他实体。
156.在至少一个实施例中,第三方网络基础设施系统1102可以被适配成自动地提供、管理和跟踪顾客对由第三方网络基础设施系统1102提供的服务的订阅。在至少一个实施例中,第三方网络基础设施系统1102可以经由不同的部署模型提供第三方网络服务。在至少一个实施例中,可在公共第三方网络模型下提供服务,其中第三方网络基础设施系统1102由销售第三方网络服务的组织拥有,并且使得服务可用于一般公众或不同的行业企业。在至少一个实施例中,可在私用第三方网络模型下提供服务,在该私用第三方网络模型中,第三方网络基础设施系统1102仅针对单个组织操作,并且可为组织内的一个或更多个实体提供服务。在至少一个实施例中,第三方网络服务也可在社区第三方网络模型下提供,其中第三方网络基础设施系统1102和第三方网络基础设施系统1102提供的服务由相关社区中的若干组织共享。在至少一个实施例中,也可在混合第三方网络模型下提供第三方网络服务,
该混合第三方网络模型是两个或更多个不同模型的组合。
157.在至少一个实施例中,由第三方网络基础设施系统1102提供的服务可包括在软件即服务(saas)类别、平台即服务(paas)类别、基础设施即服务(iaas)类别或包括混合服务的其他服务类别下提供的一个或更多个服务。在至少一个实施例中,客户经由订阅订单可订购由第三方网络基础设施系统1102提供的一个或更多个服务。在至少一个实施例中,第三方网络基础设施系统1102然后执行处理以在客户的订阅订单中提供服务。
158.在至少一个实施例中,由第三方网络基础设施系统1102提供的服务可以包括但不限于应用服务、平台服务和基础设施服务。在至少一个实施例中,应用服务可由第三方网络基础设施系统经由saas平台提供。在至少一个实施例中,saas平台可被配置为提供属于saas类别的第三方网络服务。在至少一个实施例中,saas平台可以提供在集成开发和部署平台上构建并递送一套按需应用的能力。在至少一个实施例中,saas平台可以管理和控制用于提供saas服务的底层软件和基础设施。在至少一个实施例中,通过利用由saas平台提供的服务,客户可利用在第三方网络基础设施系统上执行的应用。在至少一个实施例中,客户可以获得应用服务,而不需要客户购买单独的许可证和支持。在至少一个实施例中,可提供各种不同的saas服务。在至少一个实施例中,这可以包括但不限于为大组织的销售性能管理、企业集成和商业灵活性提供解决方案的服务。
159.在至少一个实施例中,平台服务可由第三方网络基础设施系统1102经由paas平台提供。在至少一个实施例中,paas平台可被配置为提供属于paas类别的第三方网络服务。在至少一个实施例中,平台服务可以包括但不限于使组织能够将现有应用合并在共享的公共架构上的服务,以及建立利用由平台提供的共享服务的新应用的能力。在至少一个实施例中,paas平台可以管理和控制用于提供paas服务的底层软件和基础设施。在至少一个实施例中,客户可获取由第三方网络基础设施系统1102提供的paas服务,而无需客户购买单独的许可证和支持。
160.在至少一个实施例中,通过利用由paas平台提供的服务,客户可采用由第三方网络基础设施系统支持的编程语言和工具,并且还控制所部署的服务。在至少一个实施例中,由第三方网络基础设施系统提供的平台服务可包括数据库第三方网络服务、中间件第三方网络服务和第三方网络服务。在至少一个实施例中,数据库第三方网络服务可支持共享服务部署模型,所述共享服务部署模型使组织能够汇聚数据库资源并以数据库第三方网络的形式向客户提供数据库作为服务。在至少一个实施例中,在第三方网络基础设施系统中,中间件第三方网络服务可以为客户提供平台以开发和部署不同业务应用,并且第三方网络服务可以为客户提供平台以部署应用。
161.在至少一个实施例中,各种不同的基础设施服务可由第三方网络基础设施系统中的iaas平台提供。在至少一个实施例中,基础设施服务促进利用由saas平台和paas平台提供的服务的客户对底层计算资源(诸如存储、网络和其他基础计算资源)的管理和控制。
162.在至少一个实施例中,第三方网络基础设施系统1102还可包括用于提供用于向第三方网络基础设施系统的客户提供不同服务的资源的基础设施资源1130。在至少一个实施例中,基础设施资源1130可包括硬件(诸如服务器、存储和联网资源)的预集成和优化的组合以执行由paas平台和saas平台提供的服务和其他资源。
163.在至少一个实施例中,第三方网络基础设施系统1102中的资源可由多个用户共享
并且按照需求动态地重新分配。在至少一个实施例中,可以向不同时区中的用户分配资源。在至少一个实施例中,第三方网络基础设施系统1102可以使得第一时区中的第一组用户能够利用第三方网络基础设施系统的资源持续指定小时数,并且随后使得能够将相同资源重新分配给位于不同时区中的另一组用户,从而使资源利用率最大化。
164.在至少一个实施例中,可提供由第三方网络基础设施系统1102的不同组件或模块共享的多个内部共享服务1132,以实现由第三方网络基础设施系统1102提供服务。在至少一个实施例中,这些内部共享服务可包括但不限于安全和身份服务,集成服务、企业库服务、企业管理器服务、病毒扫描和白名单服务,高可用性、备份和恢复服务、用于使能第三方网络支持的服务、电子邮件服务,通知服务、文件传输服务和/或其变体。
165.在至少一个实施例中,第三方网络基础设施系统1102可在第三方网络基础设施系统中提供第三方网络服务(例如,saas、paas和iaas服务)的全面管理。在至少一个实施例中,第三方网络管理功能可包括用于供应、管理和跟踪由第三方网络基础设施系统1102接收的客户的订阅的能力和/或其变体。
166.在至少一个实施例中,如图11所示,第三方网络管理功能可以由一个或更多个模块提供,诸如订单管理模块1120、订单协调模块1122、订单供应模块1124、订单管理和监控模块1126和身份管理模块1128。在至少一个实施例中,这些模块可包括或使用一个或更多个计算机和/或服务器来提供,所述一个或更多个计算机和/或服务器可以是通用计算机、专用服务器计算机、服务器群、服务器群集或任何其他适当的布置和/或组合。
167.在至少一个实施例中,在步骤1134,客户使用客户端设备,诸如客户端计算设备1104、1106或1108可通过请求由第三方网络基础设施系统1102提供的一个或更多个服务并对由第三方网络基础设施系统1102提供的一个或更多个服务的订阅下订单来与第三方网络基础设施系统1102交互。在至少一个实施例中,客户可访问第三方网络用户界面(ui),诸如第三方网络ui1112、第三方网络ui1114和/或第三方网络ui1116,并经由这些ui进行订购订单。在至少一个实施例中,由第三方网络基础设施系统1102响应于客户下订单而接收的订单信息可包括识别客户和由第三方网络基础设施系统1102提供的、客户想要订阅的一个或更多个服务的信息。
168.在至少一个实施例中,在步骤1136,从客户接收的订单信息可存储在订单数据库1118中。在至少一个实施例中,如果这是新订单,则可以为订单创建新记录。在至少一个实施例中,订单数据库1118可以是由第三方网络基础设施系统1118操作的并且结合其他系统元件操作的若干数据库之一。
169.在至少一个实施例中,在步骤1138,可以将一个订购信息转发到一个订购管理模块1120,该订购管理模块可以被配置成用于执行与一个订购相关的计费和记账功能,如验证一个订购,并且在验证后,预订一个订购。
170.在至少一个实施例中,在步骤1140,关于订单的信息可被传送到订单协调模块1122,该订单协调模块1122被配置为为由客户下订单协调服务和资源的供应。在至少一个实施例中,订单协调模块1122可以使用订单供应模块1124的服务进行供应。在至少一个实施例中,订单协调模块1122使得能够管理与每个订单相关联的业务过程,并且应用业务逻辑来确定订单是否应继续进行到供应。
171.在至少一个实施例中,在步骤1142,当接收到新订阅的订单时,订单协调模块1122
向订单供应模块1124发送分配资源和配置满足订阅订单所需的资源的请求。在至少一个实施例中,订单供应模块1124实现由客户订购的服务的资源分配。在至少一个实施例中,订单供应模块1124提供由第三方网络基础设施系统1100提供的第三方网络服务与用于供应用于提供所请求的服务的资源的物理实施层之间的抽象级别。在至少一个实施例中,这使得订单协调模块1122能够与实施细节隔离,所述实施细节例如是服务和资源实际上是实时供应的还是预先供应的并且仅在请求时分配/分配。
172.在至少一个实施例中,在步骤1144,一旦服务和资源被供应,可以向预订客户发送指示所请求的服务现在准备好使用的通知。在至少一个实施例中,信息(例如.链接)可以被发送到客户,其使客户能够开始使用所请求的服务。
173.在至少一个实施例中,在步骤1146,客户的订阅订单可由订单管理和监控模块1126管理和跟踪。在至少一个实施例中,订单管理和监控模块1126可以被配置成收集关于订阅服务的客户使用的使用统计。在至少一个实施例中,可以针对所使用的存储量、所传输的数据量、用户数量、以及系统上电时间和系统下电时间的量和/或其变化来收集统计。
174.在至少一个实施例中,第三方网络基础设施系统1100可包括身份管理模块1128,该身份管理模块1128被配置成提供身份服务,诸如第三方网络基础设施系统1100中的访问管理和授权服务。在至少一个实施例中,身份管理模块1128可控制关于希望利用由第三方网络基础设施系统1102提供的服务的客户的信息。在至少一个实施例中,这样的信息可以包括认证这样的客户的身份的信息和描述那些客户被授权相对于不同系统资源(例如,文件、目录、应用、通信端口、存储器段等)执行哪些动作的信息。在至少一个实施例中,身份管理模块1128还可包括管理关于每个顾客的描述性信息以及关于可如何访问和修改该描述性信息和可由谁来访问和修改该描述性信息。
175.图12示出了根据至少一个实施例的云计算环境1202。在至少一个实施例中,云计算环境1202包括一个或更多个计算机系统/服务器1204,诸如个人数字助理(pda)或蜂窝电话1206a、台式计算机1206b、膝上型计算机1206c和/或汽车计算机系统1206n的计算设备与该一个或更多个计算机系统/服务器1204通信。在至少一个实施例中,这允许基础设施、平台和/或软件作为服务从云计算环境1202提供,以便不需要每个客户端单独地维护这样的资源。应当理解,图12中示出的计算设备1206a-n的类型旨在仅是说明性的,并且云计算环境1202可通过任何类型的网络和/或网络/可寻址连接(例如,使用web浏览器)与任何类型的计算机化设备通信。
176.在至少一个实施例中,可被表示为云计算节点的计算机系统/服务器1204可与许多其他通用或专用计算系统环境或配置一起操作。在至少一个实施例中,可以适合于与计算机系统/服务器1204一起使用的计算系统、环境和/或配置包括,但不限于个人计算机系统、服务器计算机系统、瘦客户机、厚客户机,手持式或膝上型设备、多处理器系统、基于微处理器的系统、机顶盒、可编程消费电子产品,网络pc、小型计算机系统、大型计算机系统和包括任何上述系统或设备的分布式云计算环境,和/或其变体。
177.在至少一个实施例中,计算机系统/服务器1204可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般上下文中描述。在至少一个实施例中,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、逻辑、数据结构等。在至少一个实施例中,示例性计算机系统/服务器1204可以在分布式大声计算环境中实践,
其中任务由通过通信网络链接的远程处理设备来执行。在至少一个实施例中,在分布式云计算环境中,程序模块可位于包括存储器存储设备的本地和远程计算机系统存储媒质两者中。
178.图13示出了根据至少一个实施例的由云计算环境1202(图12)提供的一组功能抽象层。应预先理解,图13中所示的组件、层和功能仅旨在是说明性的,并且组件、层和功能可以变化。
179.在至少一个实施例中,硬件和软件层1302包括硬件和软件组件。在至少一个实施例中,硬件组件包括大型机、不同基于risc(精简指令集计算机)架构的服务器、不同计算系统、超级计算系统、存储设备、网络、联网组件和/或其变体。在至少一个实施例中,软件组件包括网络应用服务器软件、不同应用服务器软件、不同数据库软件、和/或其变体。
180.在至少一个实施例中,虚拟化层1304提供抽象层,从该抽象层可以提供以下示例性虚拟实体:虚拟服务器、虚拟存储、虚拟网络(包括虚拟私有网络)、虚拟应用、虚拟客户端和/或其变体。
181.在至少一个实施例中,管理层1306提供不同功能。在至少一个实施例中,资源供应提供用于在云计算环境内执行任务的计算资源和其他资源的动态获取。在至少一个实施例中,计量提供了在云计算环境内利用资源时的使用跟踪,以及针对这些资源的消费的计费或发票。在至少一个实施例中,资源可以包括应用软件许可证。在至少一个实施例中,安全性为用户和任务提供身份验证,以及对数据和其他资源的保护。在至少一个实施例中,用户界面为用户和系统管理员两者提供对云计算环境的访问。在至少一个实施例中,服务水平管理提供云计算资源分配和管理,使得满足所需的服务水平。在至少一个实施例中,服务水平协议(sla)管理提供云计算资源的预安排和采购,根据sla预期该云计算资源的未来要求。
182.在至少一个实施例中,工作负载层1308提供利用云计算环境的功能。在至少一个实施例中,可以从该层提供的工作负载和功能包括:地图和导航、软件开发和管理、教育服务、数据分析和处理、交易处理和服务递送。
183.超级计算
184.以下附图阐述了但不限于可以用于实施至少一个实施例的示例性的基于超级计算机的系统。
185.在至少一个实施例中,超级计算机可以指展现出基本上平行性并且包括至少一个芯片的硬件系统,其中,系统中的芯片通过网络互连并且被放置在分层组织的外壳中。在至少一个实施例中,用若干机架填充机房的大型硬件系统是超级计算机的至少一个实施例,每个机架包含若干板/机架模块,每个板/机架模块包含全部由可扩展网络互连的若干芯片。在至少一个实施例中,这种大型硬件系统的单个机架是超级计算机的至少一个其他实施例。在至少一个实施例中,展现出基本上平行性并且包含若干硬件组件的单个芯片可以同样被认为是超级计算机,因为随着特征大小可能减小,可以结合在单个芯片中的硬件量也可能增加。
186.图14示出了根据至少一个实施例的芯片级的超级计算机。在至少一个实施例中,在fpga或asic芯片内部,在被称为线程单元的有限状态机(1404)内执行主计算。在至少一个实施例中,任务和同步网络(1402)连接有限状态机并且被用于以正确的顺序分派线程和
执行操作。在至少一个实施例中,使用存储器网络(1406,1410)来访问多级分区的片上高速缓存层级(1408,1412)。在至少一个实施例中,使用存储器控制器(1416)和片外存储器网络(1414)来访问片外存储器。在至少一个实施例中,当设计不适合于单个逻辑芯片时,i/o控制器(1418)用于跨芯片通信。
187.图15示出根据至少一个实施例的在岩石模块级别的超级计算机。在至少一个实施例中,在机架模块内,存在连接至构成主加速器存储器的一个或更多个dram单元(1504)的多个fpga或asic芯片(1502)。在至少一个实施例中,每个fpga/asic芯片使用板上的宽总线用差分高速信令连接到其相邻的fpga/asic芯片(1506)。在至少一个实施例中,每个fpga/asic芯片还连接到至少一个高速串行通信电缆。
188.图16示出了根据至少一个实施例的机架级的超级计算机。图17示出了根据至少一个实施例的整个系统级的超级计算机。在至少一个实施例中,参见图16和图17,在机架中的机架模块之间并且跨整个系统的机架,使用高速串行光学或铜电缆(1602,1702)来实现可扩展的、可能不完整的超立方体网络。在至少一个实施例中,加速器的fpga/asic芯片中的一个通过pci-express连接被连接到主机系统(1704)。在至少一个实施例中,主机系统包括应用的软件部分在其上运行的主机微处理器(1708)以及由与加速器上的存储器保持一致的一个或更多个主机存储器dram单元(1706)组成的存储器。在至少一个实施例中,主机系统可以是机架之一上的单独模块,或可以与超级计算机的模块之一集成。在至少一个实施例中,立方连接循环拓扑提供通信链路以为大型超级计算机创建超立方网络。在至少一个实施例中,机架模块上的小组fpga/asic芯片可充当单个超立方体节点,使得与单个芯片相比,每组的外部链路的总数增加。在至少一个实施例中,一个组包含机架模块上的芯片a、b、c和d,该机架模块具有连接环形组织中的a、b、c和d的内部宽差分总线。在至少一个实施例中,存在将机架模块连接到外部世界的12条串行通信电缆。在至少一个实施例中,机架模块上的芯片a连接至串行通信电缆0、1、2。在至少一个实施例中,芯片b连接至电缆3、4、5。在至少一个实施例中,芯片c连接至6、7、8。在至少一个实施例中,芯片d连接至9、10、11。在至少一个实施例中,构成机架模块的整个组{a,b,c,d}可以形成超级计算机系统内的超立方体节点,其中高达212=4096个机架模块(16384fpga/asic芯片)。在至少一个实施例中,为了使芯片a在组{a,b,c,d}的链路4上向外发送消息,必须首先用板上差分宽总线连接将消息路由到芯片b。在至少一个实施例中,在链路4上到达去往芯片a的组{a,b,c,d}(即,到达b)的消息也必须首先被路由到组{a,b,c,d}内部的正确目的地芯片(a)。在至少一个实施例中,还可以实现其他大小的并行超级计算机系统。
189.人工智能
190.以下附图阐述了但不限于可以用于实现至少一个实施例的示例性的基于人工智能的系统。
191.图18a示出了用于执行与一个或更多个实施例相关联的推理和/或训练操作的推理和/或训练逻辑1815。下面结合图18a和/或18b提供关于推理和/或训练逻辑1815的细节。
192.在至少一个实施例中,推理和/或训练逻辑1815可以包括但不限于,代码和/或数据存储器1801,用于存储前向和/或输出权重和/或输入/输出数据,和/或在一个或更多个实施例的各方面中用于配置被训练和/或用于推理的神经网络的神经元或层的其他参数。在至少一个实施例中,训练逻辑1815可以包括或被耦合到代码和/或数据存储设备1801以
存储图形代码或其他软件以控制定时和/或顺序,其中,将加载权重和/或其他参数信息来配置逻辑,包括整数和/或浮点单元(统称为算术逻辑单元(alu))。在至少一个实施例中,代码(诸如图形代码)基于这样的代码所对应的神经网络的架构将权重或其他参数信息加载到处理器alu中。在至少一个实施例中,代码和/或数据存储设备1801存储神经网络的每个层的权重参数和/或输入/输出数据,该神经网络在使用一个或更多个实施例的各方面的训练和/或推理期间在输入/输出数据和/或权重参数的前向传播期间与一个或更多个实施例结合训练或使用。在至少一个实施例中,代码和/或数据存储装置1801的任何部分可与其他芯片上或芯片外数据存储装置一起包含,包含处理器的l1、l2或l3高速缓冲存储器或系统存储器。
193.在至少一个实施例中,代码和/或数据存储装置1801的任何部分可在一个或一个以上处理器或其他硬件逻辑装置或电路内部或外部。在至少一个实施例中,代码和/或代码和/或数据存储设备1801可以是高速缓冲存储器、动态随机可寻址存储器(“dram”)、静态随机可寻址存储器(“sram”)、非易失性存储器(例如,闪存)或其他存储设备。在至少一个实施例中,代码和/或代码和/或数据存储装置1801是在处理器内部还是外部的选择,在至少一个实施例中,或包括dram、sram、闪存或一些其他存储类型可以取决于片上相对于片外的可用存储,正在执行的训练和/或推理功能的等待时间要求、在神经网络的推理和/或训练中使用的数据的批量大小,或这些因素的一些组合。
194.在至少一个实施例中,推理和/或训练逻辑1815可以包括但不限于:代码和/或数据存储设备1805,所述代码和/或数据存储设备用于存储与在一个或更多个实施例的多个方面中被训练和/或用于推理的神经网络的神经元或层相对应的后向和/或输出权重和/或输入/输出数据。在至少一个实施例中,代码和/或数据存储设备1805存储神经网络的每一层的权重参数和/或输入/输出数据,该神经网络在使用一个或更多个实施例的各方面的训练和/或推理期间的输入/输出数据和/或权重参数的向后传播期间与一个或更多个实施例结合训练或使用。在至少一个实施例中,训练逻辑1815可以包括或被耦合到代码和/或数据存储设备1805以存储图形代码或其他软件来控制定时和/或顺序,其中,将加载权重和/或其他参数信息来配置逻辑,包括整数和/或浮点单元(统称为算术逻辑单元(alu))。
195.在至少一个实施例中,代码(诸如图形代码)致使基于这样的代码所对应的神经网络的架构将权重或其他参数信息加载到处理器alu中。在至少一个实施例中,代码和/或数据存储设备1805的任何部分可与其他片上或片外数据存储设备包括在一起,包括处理器的l1、l2或l3高速缓存或系统存储器。在至少一个实施例中,代码和/或数据存储设备1805的任何部分可以在一个或更多个处理器或其他硬件逻辑设备或电路的内部或外部。在至少一个实施例中,代码和/或数据存储设备1805可以是高速缓冲存储器、dram、sram、非易失性存储器(例如,闪存)或其他存储设备。在至少一个实施例中,代码和/或数据存储设备1805是处理器内部还是外部的选择,在至少一个实施例中,或包括dram、sram、闪存或一些其他存储类型可以取决于片上相对于片外的可用存储,正在执行的训练和/或推理功能的等待时间要求、在神经网络的推理和/或训练中使用的数据的批量大小,或这些因素的一些组合。
196.在至少一个实施例中,代码和/或数据存储1801和代码和/或数据存储1805可为单独的存储结构。在至少一个实施例中,代码和/或数据存储1801和代码和/或数据存储1805可以是组合的存储结构。在至少一个实施例中,代码和/或数据存储装置1801和代码和/或
数据存储装置1805可部分组合和部分分离。在至少一个实施例中,代码和/或数据存储1801和代码和/或数据存储1805的任何部分可与其他片上或片外数据存储(包括处理器的l1、l2或l3高速缓存或系统存储器)包括在一起。
197.在至少一个实施例中,推理和/或训练逻辑1815可以包括但不限于,一个或更多个算术逻辑单元(“alu”)1810,包括整数和/或浮点单元,至少部分地基于或指示来执行逻辑和/或数学运算,训练和/或推理代码(例如,图形代码),其结果可以产生存储在激活存储设备1820中的激活(例如,来自神经网络内的层或神经元的输出值),所述激活是存储在代码和/或数据存储设备1801和/或代码和/或数据存储设备1805中的输入/输出和/或权重参数数据的函数。在至少一个实施例中,响应于执行指令或其他代码,根据由alu 1810执行的线性代数和/或基于矩阵的数学来生成存储在激活存储设备1820中的激活,其中,存储在代码和/或数据存储设备1805和/或数据存储设备1801中的权重值与其他值一起被用作操作数,诸如偏置值、梯度信息、动量值或其他参数或超参数,其中的任何或全部可被存储在代码和/或数据存储1805或代码和/或数据存储1801或芯片上或芯片外的另一存储中。
198.在至少一个实施例中,(一个或更多个)alu 1810包括在一个或更多个处理器或其他硬件逻辑器件或电路内,而在另一个实施例中,(一个或更多个)alu 1810可以在处理器或使用它们的其他硬件逻辑器件或电路(例如,协处理器)的外部。在至少一个实施例中,alu 1810可以包括在处理器的执行单元内或者以其他方式在可由处理器的执行单元访问的alu堆内,所述处理器的执行单元在同一处理器内或分布在不同类型的不同处理器(例如,中央处理单元、图形处理单元、固定功能单元等)之间。在至少一个实施例中,代码和/或数据存储设备1801、代码和/或数据存储设备1805,并且激活存储设备1820可以共享处理器或其他硬件逻辑设备或电路,而在另一个实施例中,它们可以在不同的处理器或其他硬件逻辑器件或电路中,或相同和不同处理器或其他硬件逻辑设备或电路的某种组合。在至少一个实施例中,激活存储设备1820的任何部分可以与其他片上或片外数据存储设备包括在一起,所述其他片上或片外数据存储设备包括处理器的l1、l2或l3高速缓存或系统存储器。此外,推理和/或训练代码可与处理器或其他硬件逻辑或电路可访问的其他代码一起存储,并使用处理器的获取、解码、调度、执行、引退和/或其他逻辑电路来获取和/或处理。
199.在至少一个实施例中,激活存储装置1820可以是高速缓冲存储器、dram、sram、非易失性存储器(例如,闪存)或其他存储装置。在至少一个实施例中,激活存储装置1820可以完全或部分地在一个或更多个处理器或其他逻辑电路之内或外部。在至少一个实施例中,选择激活存储装置1820是在处理器内部还是外部,在至少一个实施例中,或包括dram、sram、闪存或一些其他存储类型可以取决于片上相对于片外的可用存储,正在执行的训练和/或推理功能的等待时间要求、在神经网络的推理和/或训练中使用的数据的批量大小,或这些因素的一些组合。
200.在至少一个实施例中,图18a中所示出的推理和/或训练逻辑1815可以与专用集成电路(“asic”)结合使用,如来自谷歌的处理单元、来自graphcore
tm
的推理处理单元(ipu)、或来自英特尔公司的(例如,“lake crest”)处理器。在至少一个实施例中,图18a中所示出的推理和/或训练逻辑1815可以结合中央处理单元(“cpu”)硬件、图形处理单元(“gpu”)硬件或其他硬件(如现场可编程门阵列(“fpga”))使用。
201.图18b示出了根据至少一个实施例的推理和/或训练逻辑1815。在至少一个实施例中,推理和/或训练逻辑1815可包括但不限于其中计算资源是专用的或以其他方式结合与神经网络内的一个或更多个神经元层相对应的权重值或其他信息排他地使用的硬件逻辑。在至少一个实施例中,图18b中所示出的推理和/或训练逻辑1815可以结合专用集成电路(asic)(如来自谷歌的处理单元、来自graphcore
tm
的推理处理单元(ipu)、或来自英特尔公司的(例如,“湖牙”)处理器来使用。在至少一个实施例中,图18b中示出的推理和/或训练逻辑1815可结合中央处理单元(cpu)硬件、图形处理单元(gpu)硬件或其他硬件(诸如现场可编程门阵列(fpga))使用。在至少一个实施例中,推理和/或训练逻辑1815包括但不限于代码和/或数据存储设备1801以及代码和/或数据存储设备1805,其可以用于存储代码(例如,图形代码)、权重值和/或其他信息,包括偏置值、梯度信息、动量值和/或其他参数或超参数信息。在图18b中所说明的至少一个实施例中,代码和/或数据存储装置1801和代码和/或数据存储装置1805中的每一者分别与专用计算资源(例如,计算硬件1802和计算硬件1806)相关联。在至少一个实施例中,计算硬件1802和计算硬件1806中的每一个包括一个或更多个alu,该一个或更多个alu仅分别对存储在代码和/或数据存储1801和代码和/或数据存储1805中的信息执行数学函数(诸如线性代数函数),其结果被存储在激活存储1820中。
202.在至少一个实施例中,每个代码和/或数据存储器1801和1805以及相应的计算硬件1802和1806,分别对应于神经网络的不同层,使得来自代码的一个存储/计算对1801/1802和/或数据存储1801和计算硬件1802的所得激活作为输入被提供给代码的下一个存储/计算对1805/1806和/或数据存储1805和计算硬件1806,以便反映神经网络的概念组织。在至少一个实施例中,存储/计算对1801/1802和1805/1806中的每一个可对应于多于一个神经网络层。在至少一个实施例中,继存储/计算对1801/1802和1805/1806之后或与存储/计算对1801/1802和1805/1806并行的附加存储/计算对(未示出)可被包括在推理和/或训练逻辑1815中。
203.图19示出根据至少一个实施例的深度神经网络的训练和部署。在至少一个实施例中,使用训练数据集1902来训练未经训练的神经网络1906。在至少一个实施例中,训练框架1904是pytorch框架,而在其他实施例中,训练框架1904是tensorflow、boost、caffe、microsoftcognitivetoolkit/cntk、mxnet、chainer、keras、deeplearning4j或其他训练框架。在至少一个实施例中,训练框架1904对未经训练的神经网络1906进行训练,并使其能够使用本文中所描述的处理资源来训练以生成经训练的神经网络1908。在至少一个实施例中,权重可以随机选择或通过使用深度置信网络进行预训练来选择。在至少一个实施例中,训练可以以受监督、部分受监督或无监督的方式来执行。
204.在至少一个实施例中,使用监督学习来训练未经训练的神经网络1906,其中训练数据集1902包括与用于输入的期望输出配对的输入,或者其中训练数据集1902包括具有已知输出的输入,并且神经网络1906的输出被手动地分级。在至少一个实施例中,以受监督的方式来训练未经训练的神经网络1906,并且处理来自训练数据集1902的输入,并将结果输出与预期或期望输出的集合进行比较。在至少一个实施例中,然后错误通过未经训练的神经网络1906传播回去。在至少一个实施例中,训练框架1904调整控制未经训练的神经网络1906的权重。在至少一个实施例中,训练框架1904包括用于监视未经训练的神经网络1906
朝向模型(诸如经训练的神经网络1908)收敛多好的工具,该模型适于基于输入数据(诸如新数据集1912)来生成正确答案(诸如结果1914)。在至少一个实施例中,训练框架1904重复地训练未经训练的神经网络1906,同时使用损失函数和调整算法(诸如随机梯度下降)来调整权重以细化未经训练的神经网络1906的输出。在至少一个实施例中,训练框架1904训练未经训练的神经网络1906,直到未经训练的神经网络1906实现所期望的准确度。在至少一个实施例中,经训练的神经网络1908然后可被部署来实现任何数量的机器学习操作。
205.在至少一个实施例中,使用无监督学习来训练未经训练的神经网络1906,其中未经训练的神经网络1906尝试使用未经标记的数据来训练其自身。在至少一个实施例中,无监督学习训练数据集1902将包括输入数据而没有任何相关联的输出数据或“基础真值”数据。在至少一个实施例中,未经训练的神经网络1906可以学习训练数据集1902内的分组,并且可以确定各个输入如何与未经训练的数据集1902相关。在至少一个实施例中,无监督训练可被用于在经训练的神经网络1908中生成能够执行在减少新数据集1912的维度中有用的操作的自组织映射。在至少一个实施例中,无监督训练还可用于执行异常检测,其允许识别新数据集1912中偏离新数据集1912的正常模式的数据点。
206.在至少一个实施例中,可以使用半监督学习,半监督学习是其中在训练中数据集1902包括已标记数据和未标记数据的混合的技术。在至少一个实施例中,训练框架1904可被用于执行增量学习,诸如通过转移学习技术。在至少一个实施例中,增量学习使得经训练的神经网络1908能够适应新的数据集1912,而无需忘记在初始训练期间滴注在经训练的神经网络1408内的知识。
207.5g网络
208.以下附图阐述了但不限于可以用于实现至少一个实施例的示例性5g基于网络的系统。
209.图20示出了根据至少一个实施例的网络的系统2000的架构。在至少一个实施例中,系统2000被示为包括用户设备(ue)2002和ue2004。在至少一个实施例中,ue2002和2004被示为智能电话(例如,可连接到一个或更多个蜂窝网络的手持触摸屏移动计算设备),但还可包括任何移动或非移动计算设备,诸如个人数字助理(pda)、寻呼机、膝上型计算机、台式计算机、无线手持机或包括无线通信接口的任何计算设备。
210.在至少一个实施例中,ue 2002和ue 2004中的任何一个可包括物联网(iot)ue,该iotue可包括为利用短暂ue连接的低功率iot应用设计的网络接入层。在至少一个实施例中,iot ue可利用诸如用于经由公共陆地移动网络(plmn)、基于邻近的服务(prose)或设备到设备(d2d)通信、传感器网络或iot网络与mtc服务器或设备交换数据的机器对机器(m2m)或机器类型通信(mtc)的技术。在至少一个实施例中,m2m或mtc数据交换可以是机器发起的数据交换。在至少一个实施例中,iot网络描述互连iot ue,该iot ue可包括具有短寿命连接的可唯一标识的嵌入式计算设备(在互联网基础结构内)。在至少一个实施例中,iot ue可执行后台应用(例如,保活消息、状态更新等)以促进iot网络的连接。
211.在至少一个实施例中,ue 2002和ue 2004可以被配置为与无线电接入网(ran)2016连接(例如,通信地耦合)。在至少一个实施例中,ran2016在至少一个实施例中可以是演进的通用移动电信系统(umts)陆地无线电接入网络(e-utran)、nextgenran(ngran)或一些其他类型的ran。在至少一个实施例中,ue 2002和ue 2004分别利用连接2012和连接
2014,每个连接包括物理通信接口或层。在至少一个实施例中,连接2012和2014被示为空中接口,以实现通信耦合,并且可以与蜂窝通信协议一致,诸如全球移动通信系统(gsm)协议,码分多址(cdma)网络协议、即按即讲(ptt)协议、基于蜂窝的ptt(poc)协议,通用移动电信系统(umts)协议、3gpp长期演进(lte)协议、第五代(5g)协议,新无线电(nr)协议及其变型。
212.在至少一个实施例中,ue2002和2004还可经由prose接口2006直接交换通信数据。在至少一个实施例中,prose接口2006可替代地被称为边链路接口,其包括一个或更多个逻辑信道,包括但不限于物理边链路控制信道(pscch)、物理边链路共享信道(pssch)、物理边链路发现信道(psdch)和物理边链路广播信道(psbch)。
213.在至少一个实施例中,ue2004被示为配置成经由连接2008接入接入点(ap)2010。在至少一个实施例中,连接2008可以包括本地无线连接,诸如与任何ieee802.11协议一致的连接,其中ap2010将包括无线保真路由器。在至少一个实施例中,ap2010被示为连接到互联网而不连接到无线系统的核心网。
214.在至少一个实施例中,ran2016可包括启用连接2012和2014的一个或更多个接入节点。在至少一个实施例中,这些接入节点(an)可被称为基站(bs)、节点b、演进型节点b(enb)、下一代节点b(gnb)、ran节点等,并且可包括地面站(例如,地面接入点)或提供地理区域(例如,小区)内的覆盖的卫星站。在至少一个实施例中,ran2016可包括用于提供宏蜂窝小区的一个或更多个ran节点(例如,宏ran节点2018)和用于提供毫微微蜂窝小区或微微蜂窝小区(例如,与宏蜂窝小区相比具有较小覆盖区域、较小用户容量、或较高带宽的蜂窝小区)的一个或更多个ran节点(例如,低功率(lp)ran节点2020)。
215.在至少一个实施例中,ran节点2018和2020中的任一个可终止空中接口协议并且可为ue2002和2004的第一联系点。在至少一个实施例中,ran节点2018和2020中的任一个可实现ran2016的不同逻辑功能,包括但不限于无线电网络控制器(rnc)功能,诸如无线电承载管理、上行链路和下行链路动态无线电资源管理和数据分组调度和移动性管理。
216.在至少一个实施例中,ue 2002和ue 2004可被配置为使用正交频分复用(ofdm)通信信号根据多种通信技术通过多载波通信信道彼此通信或者与ran节点2018和ran节点2020中的任一个通信,诸如但不限于正交频分多址(ofdma)通信技术(例如,用于下行链路通信)或单载波频分多址(sc-fdma)通信技术(例如,用于上行链路和prose或边链路通信),和/或其变体。在至少一个实施例中,ofdm信号可包括多个正交子载波。
217.在至少一个实施例中,下行链路资源网格可以用于从ran节点2018和2020中的任一个到ue2002和2004的下行链路传输,而上行链路传输可以利用类似的技术。在至少一个实施例中,网格可以是称为资源网格或时频资源网格的时频网格,其是每个时隙中的下行链路中的物理资源。在至少一个实施例中,这种时间频率平面表示是ofdm系统的常见实践,这使得其对于无线电资源分配直观。在至少一个实施例中,资源网格的每列和每行分别对应于一个ofdm符号和一个ofdm子载波。在至少一个实施例中,时域中的资源网格的持续时间对应于无线电帧中的一个时隙。在至少一个实施例中,资源网格中的最小时间-频率单元被表示为资源元素。在至少一个实施例中,每个资源网格包括多个资源块,其描述某些物理信道到资源元素的映射。在至少一个实施例中,每个资源块包括资源元素的集合。在至少一个实施例中,在频域中,这可以表示当前可以被分配的最小数量的资源。在至少一个实施例中,存在使用这样的资源块传送的若干不同的物理下行链路信道。
218.在至少一个实施例中,物理下行链路共享信道(pdsch)可以携带用户数据和更高层信令给ue 2002和2004。在至少一个实施例中,物理下行链路控制信道(pdcch)可承载关于与pdsch信道相关的传输格式和资源分配的信息等。在至少一个实施例中,其还可以向ue2002和2004通知与上行链路共享信道有关的传输格式、资源分配和harq(混合自动重传请求)信息。在至少一个实施例中,通常,下行链路调度(将控制和共享信道资源块分配给小区内的ue 2002)可以在ran节点2018和2020中的任一个处基于从ue 2002和2004中的任一个反馈的信道质量信息来执行。在至少一个实施例中,下行链路资源分配信息可以在用于(例如分配给)ue2002和2004中的每一个的pdcch上发送。
219.在至少一个实施例中,pdcch可以使用控制信道元素(cce)来传送控制信息。在至少一个实施例中,在被映射到资源元素之前,pdcch复值符号可以首先被组织成四元组,然后可以使用子块交织器对其进行置换以用于速率匹配。在至少一个实施例中,可以使用这些cce中的一个或更多个来传送每个pdcch,其中每个cce可以对应于被称为资源元素组(reg)的四个物理资源元素的九个集合。在至少一个实施例中,四个正交相移键控(qpsk)符号可以被映射到每个reg。在至少一个实施例中,取决于下行链路控制信息(dci)的大小和信道条件,可以使用一个或更多个cce来发送pdcch。在至少一个实施例中,可以有在lte中定义的具有不同数目的cce的四个或更多个不同的pdcch格式(例如,聚合等级,l=1、2、4或8)。
220.在至少一个实施例中,使用pdsch资源的增强型物理下行链路控制信道(epdcch)可以用于控制信息传输。在至少一个实施例中,可以使用一个或更多个增强型控制信道元素(ecce)来发送epdcch。在至少一个实施例中,每个ecce可以对应于被称为增强资源元素组(ereg)的四个物理资源元素的九个集合。在至少一个实施例中,ecce在一些情况下可以具有其他数目的ereg。
221.在至少一个实施例中,ran2016被示为经由s1接口2022通信地耦合至核心网(cn)2038。在至少一个实施例中,cn 2038可以是演进的分组核心(epc)网络、nextgen分组核心(npc)网络或一些其他类型的cn。在至少一个实施例中,s1接口2022被分成两部分:s1-u接口2026,其携带ran节点2018和2020与服务网关(s-gw)2030之间的业务数据;以及s1-移动性管理实体(mme)接口2024,其为ran节点2018和2020与mme2028之间的信令接口。
222.在至少一个实施例中,cn2038包括mme2028、s-gw2030、分组数据网络(pdn)网关(p-gw)2034和归属订户服务器(hss)2032。在至少一个实施例中,mme2028可以在功能上类似于传统服务通用分组无线电服务(gprs)支持节点(sgsn)的控制平面。在至少一个实施例中,mme2028可以管理接入中的移动性方面,例如网关选择和跟踪区域列表管理。在至少一个实施例中,hss 2032可以包括用于网络用户的数据库,该数据库包括用于支持网络实体处理通信会话的订阅相关信息。在至少一个实施例中,cn2038可以包括一个或更多个hss2032,这取决于移动用户的数量、设备的容量、网络的组织等。在至少一个实施例中,hss2032可以提供对路由/漫游、认证、授权、命名/寻址解析、位置依赖性等的支持。
223.在至少一个实施例中,s-gw2030可以终止朝向ran2016的s1接口2022,并且在ran2016和cn2038之间路由数据分组。在至少一个实施例中,s-gw2030可以是用于ran间节点切换的本地移动性锚点,并且还可以提供用于3gpp间移动性的锚点。在至少一个实施例中,其他责任可以包括合法拦截、收费和一些策略强制执行。
224.在至少一个实施例中,p-gw2034可以终止朝向pdn的sgi接口。
225.在至少一个实施例中,p-gw2034可以经由互联网协议(ip)接口2042在epc网络2038和外部网络(诸如包括应用服务器2040(或者称为应用功能(af))的网络)之间路由数据分组。在至少一个实施例中,应用服务器2040可以是提供使用核心网络(例如,umts分组服务(ps)域、lte ps数据服务等)的ip承载资源的应用的元件。在至少一个实施例中,p-gw2034被示出为经由ip通信接口2042通信地耦合到应用服务器2040。在至少一个实施例中,应用服务器2040还可被配置为经由cn2038支持ue2002和2004的一个或更多个通信服务(例如,互联网协议语音(voip)会话、ptt会话、群组通信会话、社交网络服务等)。
226.在至少一个实施例中,p-gw2034还可以是用于策略实施和收费数据收集的节点。在至少一个实施例中,策略和计费执行功能(pcrf)2036是cn2038的策略和计费控制元件。在至少一个实施例中,在非漫游场景中,在与ue的互联网协议连接性接入网络(ip-can)会话相关联的本地公共陆地移动网络(hplmn)中可以存在单个pcrf。在至少一个实施例中,在具有本地流量突破的漫游场景中,可存在与ue的ip-can会话相关联的两个pcrf:hplmn内的归属pcrf(h-pcrf)和受访公共陆地移动网络(vplmn)内的受访pcrf(v-pcrf)。在至少一个实施例中,pcrf2036可以经由p-gw2034通信地耦合到应用服务器2040。在至少一个实施例中,应用服务器2040可以用信号通知pcrf2036指示新的服务流,并选择适当的服务质量(qos)和计费参数。在至少一个实施例中,pcrf2036可以将这个规则配置到具有适当的业务流模板(tft)和标识符的qos类(qci)的策略和计费执行功能(pcef)(未示出)中,所述pcef开始由应用服务器2040指定的qos和计费。
227.图21示出了根据一些实施例的网络的系统2100的架构。在至少一个实施例中,系统2100被示为包括ue2102、5g接入节点或ran节点(被示为(r)an节点2108),用户面功能(upf 2104),数据网络(dn 2106),在至少一个实施例中,运营商服务、互联网接入或第三方服务、以及5g核心网络(5gc)(示为cn2110)。
228.在至少一个实施例中,cn2110包括认证服务器功能(ausf2114);核心接入和移动性管理功能(amf2112);会话管理功能(smf2118);网络暴露功能(nef2116);策略控制功能(pcf2122);网络功能(nf)储存库功能(nrf2120);统一数据管理(udm2124);以及应用功能(af2126)。在至少一个实施例中,cn2110还可包括未示出的其他元件,诸如结构化数据存储网络功能(sdsf)、非结构化数据存储网络功能(udsf)及其变型。
229.在至少一个实施例中,upf2104可充当rat内和rat间移动性的锚点、互连到dn2106的外部pdu会话点、和支持多宿主pdu会话的分支点。在至少一个实施例中,upf2104还可以执行分组路由和转发、分组检查、实施策略规则的用户平面部分、合法拦截分组(up收集);业务量使用报告、为用户平面(例如)执行qos处理。分组过滤、门控、ul/dl速率执行、执行上行链路业务验证(例如,sdf到qos流映射)、上行链路和下行链路中的传输级分组标记、以及下行链路分组缓冲和下行链路数据通知触发。在至少一个实施例中,upf2104可包括上行链路分类器以支持将业务流路由到数据网络。在至少一个实施例中,dn2106可表示不同网络运营商服务、互联网接入或第三方服务。
230.在至少一个实施例中,ausf2114可以存储用于ue2102的认证的数据,并且处理与认证相关的功能。在至少一个实施例中,ausf2114可以促进用于不同接入类型的公共认证帧。
231.在至少一个实施例中,amf2112可以负责注册管理(例如,用于注册ue2102等)、连接管理、可达性管理、移动性管理、和amf相关事件的合法拦截、以及接入认证和授权。在至少一个实施例中,amf2112可以为smf2118提供sm消息的传输,并且充当用于路由sm消息的透明代理。在至少一个实施例中,amf2112还可以提供ue2102与sms功能(smsf)(图21未示出)之间的短消息服务(sms)消息的传输。在至少一个实施例中,amf2112可以充当安全锚定功能(sea),其可以包括与ausf2114和ue2102的交互以及接收作为ue2102认证过程的结果而建立的中间密钥。在至少一个实施例中,在使用基于usim的认证的情况下,amf2112可以从ausf2114取回安全材料。在至少一个实施例中,amf2112还可以包括安全上下文管理(scm)功能,其从sea接收它用来导出接入网络专用密钥的密钥。此外,在至少一个实施例中,amf2112可以是rancp接口的终止点(n2参考点)、nas(ni)信令的终止点,并且执行nas加密和完整性保护。
232.在至少一个实施例中,amf2112还可以支持通过n3互通功能(iwf)接口与ue2102的nas信令。在至少一个实施例中,n3iwf可以用于提供对不可信实体的访问。在至少一个实施例中,n3iwf可以是控制平面和用户平面的n2和n3接口的端接点,因此,可针对pdu会话和qos处理来自smf和amf的n2信令,对ipsec和n3隧道报文进行封装/解封装,在上行标记n3个用户面报文,并且考虑到与通过n2接收的这种标记相关联的qos要求,实施对应于n3数据包标记的qos。在至少一个实施例中,n3iwf还可以在ue2102和amf2112之间中继上行链路和下行链路控制平面nas(ni)信令,并且在ue2102和upf2104之间中继上行链路和下行链路用户平面分组。在至少一个实施例中,n3iwf还提供用于与ue2102的ipsec隧道建立的机制。
233.在至少一个实施例中,smf2118可负责会话管理(例如,会话建立、修改和释放,包括upf和an节点之间的隧道保持);ue ip地址分配和管理(包括可选的授权);up功能的选择和控制;在upf处配置流量支路以将流量路由到合适的目的地;朝向策略控制功能的接口终止;策略强制执行和qos的控制部分;合法拦截(用于sm事件和到li系统的接口);nas消息的sm部分的终止;下行链路数据通知;an特定sm信息的发起者,其经由amf在n2上发送到an;确定会话的ssc模式。在至少一个实施例中,smf2118可包括以下漫游功能:处理本地实施以应用qosslab(vplmn);收费数据收集和收费接口(vplmn);合法拦截(在vplmn中用于sm事件并且接口到li系统);支持与外部dn交互以传输用于由外部dn进行的pdu会话授权/认证的信令。
234.在至少一个实施例中,nef2116可以提供用于安全地暴露由3gpp网络功能为第三方提供的服务和能力、内部暴露/再暴露、应用功能(例如,af2126)、边缘计算或雾计算系统等的装置。在至少一个实施例中,nef2116可认证、授权和/或节流af。在至少一个实施例中,nef2116还可以转换与af2126交换的信息和与内部网络功能交换的信息。在至少一个实施例中,nef2116可以在af服务标识符和内部5gc信息之间转换。在至少一个实施例中,nef2116还可以基于其他网络功能的暴露能力从其他网络功能(nf)接收信息。在至少一个实施例中,该信息可作为结构化数据存储在nef2116处,或使用标准化接口存储在数据存储nf处。在至少一个实施例中,所存储的信息然后可由nef2116重新暴露给其他nf和af,和/或用于其他目的,诸如分析。
235.在至少一个实施例中,nrf2120可以支持服务发现功能,从nf实例接收nf发现请求,以及向nf实例提供所发现的nf实例的信息。在至少一个实施例中,nrf2120还维护可用
nf实例及其支持的服务的信息。
236.在至少一个实施例中,pcf2122可向控制平面功能提供策略规则以实施它们,并且还可支持统一策略框架以管理网络行为。在至少一个实施例中,pcf2122还可实施前端(fe)来访问udm2124的udr中与策略决定相关的订阅信息。
237.在至少一个实施例中,udm2124可处理订阅相关信息以支持网络实体处理通信会话,并且可存储ue2102的订阅数据。在至少一个实施例中,udm2124可以包括两个部分,应用fe和用户数据存储库(udr)。在至少一个实施例中,udm可以包括udm fe,该udm fe负责处理凭证、位置管理、订阅管理等。在至少一个实施例中,若干不同前端可在不同交易中服务同一用户。在至少一个实施例中,udm-fe访问udr中存储的子脚本信息,并进行认证凭证处理;用户标识增强;接入授权;注册/移动性管理;以及订阅管理。在至少一个实施例中,udr可与pcf2122交互。
238.在至少一个实施例中,udm2124还可支持sms管理,其中sms-fe实现如前所述的类似应用逻辑。
239.在至少一个实施例中,af2126可以提供对业务量路由、对网络能力暴露(nce)的接入的应用影响,并且与策略框架交互以用于策略控制。在至少一个实施例中,nce可以是允许5gc和af2126经由nef2116向彼此提供信息的机制,其可以用于边缘计算实现。在至少一个实施例中,网络运营商和第三方服务可被托管在ue2102的附着接入点附近,以通过减少的端到端等待时间和传输网络上的负载来实现高效的服务递送。在至少一个实施例中,对于边缘计算实现,5gc可选择靠近ue2102的upf2104,并经由n6接口执行从upf2104到dn2106的话务引导。在至少一个实施例中,这可以基于由af2126提供的ue订阅数据、ue位置和信息。在至少一个实施例中,af2126可以影响upf(重新)选择和业务量路由。在至少一个实施例中,基于运营商部署,当af2126被认为是可信实体时,网络运营商可以允许af2126直接与相关nf交互。
240.在至少一个实施例中,cn2110可以包括smsf,其可以负责sms订阅检查和验证,并且中继去往/来自ue2102的sm消息到/来自其他实体,例如sms-gmsc/iwmsc/sms路由器。在至少一个实施例中,sms还可以与amf2112和udm2124交互以用于ue2102可用于sms传送的通知过程(例如,设置ue不可达标志,并且当ue2102可用于sms时通知udm2124)。
241.在至少一个实施例中,系统2100可以包括以下基于服务的接口:namf:由amf展现的基于服务的接口;nsmf:smf展现的基于业务的接口;nnef:nef展现的基于业务的接口;npcf:pcf展现的基于业务的接口;nudm:udm展现的基于业务的接口;naf:af展现的基于业务的接口;nnrf:nrf展现的基于业务的接口;nausf:ausf展现的基于业务的接口。
242.在至少一个实施例中,系统2100可以包括以下参考点:n1:ue和amf之间的参考点;n2:(r)an和amf之间的参考点;n3:(r)an和upf之间的参考点;n4:smf和upf之间的参考点;n6:upf和数据网络之间的参考点。在至少一个实施例中,nf中的nf服务之间可能存在更多的参考点和/或基于服务的接口,为清楚起见,这些接口和参考点如何被省略。在至少一个实施例中,ns参考点可以在pcf与af之间;n7参考点可以在amf与smf之间;n11参考点在amf与smf之间等等。在至少一个实施例中,cn2110可以包括nx接口,nx接口是mme和amf2112之间的cn间接口,以便实现cn2110和cn7221之间的互通。
243.在至少一个实施例中,系统2100可包括多个ran节点(诸如(r)an节点2108),其中,
在连接到5gc 410的两个或更多个(r)an节点2108(例如,gnb)之间定义xn接口,在连接到cn2110的(r)an节点2108(例如gnb)和enb(例如宏ran节点)之间,和/或连接到cn2110的两个enb之间。
244.在至少一个实施例中,xn接口可以包括xn用户平面(xn-u)接口和xn控制平面(xn-c)接口。在至少一个实施例中,xn-u可以提供用户面pdu的非瓜尔胶递送,并且支持/提供数据转发和流控制功能。在至少一个实施例中,xn-c可提供管理和错误处理功能、管理xn-c接口的功能;处于连接模式(例如,cm-connected)的ue2102的移动性支持包括管理一个或更多个(r)an节点2108之间的连接模式的ue移动性的功能。在至少一个实施例中,移动性支持可包括从旧(源)服务(r)an节点2108到新(目标)服务(r)an节点2108的上下文传送;以及控制旧(源)服务(r)an节点2108至新(目标)服务(r)an节点2108之间的用户平面隧道。
245.在至少一个实施例中,xn-u的协议栈可以包括在互联网协议(ip)传输层上构建的转换端口网络层和在udp和/或(一个或更多个)ip层之上以承载用户平面pdu的gtp-u层。在至少一个实施例中,xn-c协议栈可以包括应用层信令协议(称为xn应用协议(xn-ap))和建立在sctp层上的传输网络层。在至少一个实施例中,sctp层可以在ip层之上。在至少一个实施例中,sctp层提供应用层消息的有保证的传递。在至少一个实施例中,在传输ip层中,点对点传输被用于递送信令pdu。在至少一个实施例中,xn-u协议栈和/或xn-c协议栈可以与本文中示出和描述的用户平面和/或控制平面协议栈相同或相似。
246.图22是根据一些实施例的控制平面协议栈的图示。在至少一个实施例中,控制平面2200被示为ue 2002(或可替代地,ue 2004)、ran 2016和mme 2028之间的通信协议栈。
247.在至少一个实施例中,phy层2202可以通过一个或更多个空中接口发送或接收由mac层2204使用的信息。在至少一个实施例中,phy层2202还可以执行链路自适应或自适应调制和编码(amc)、功率控制、小区搜索(例如,用于初始同步和切换目的)和由较高层(例如,rrc层2210)使用的其他测量。在至少一个实施例中,phy层2202还可以进一步对传输信道执行错误检测、传输信道的前向纠错(fec)编码/解编码、物理信道的调制/解调、交织、速率匹配、映射到物理信道、以及多输入多输出(mimo)天线处理。
248.在至少一个实施例中,mac层2204可执行逻辑信道和传输信道之间的映射,将来自一个或更多个逻辑信道的mac服务数据单元(sdu)复用到要经由传输信道递送到phy的传输块(tb)上,从经由传输信道从phy递送的传输块(tb)解复用到一个或更多个逻辑信道的mac sdu,将mac sdu复用到tb上、调度信息报告、通过混合自动重传请求(hard)的纠错,以及逻辑信道优先化。
249.在至少一个实施例中,rlc层2206可在多种操作模式下操作,包括:透明模式(tm)、非确认模式(um)和确认模式(am)。在至少一个实施例中,rlc层2206可以执行上层协议数据单元(pdu)的传输、通过针对am数据传输的自动重复请求(arq)的纠错、以及用于um和am数据传输的rlc sdu的级联、分段和重组。在至少一个实施例中,rlc层2206还可以执行用于am数据传输的rlc数据pdu的重新分段,对用于um和am数据传输的rlc数据pdu进行重排序,检测用于um和am数据传输的重复数据,丢弃用于um和am数据传输的rlc sdu,检测am数据传输的协议错误,以及执行rlc重建。
250.在至少一个实施例中,pdcp层2208可以执行ip数据的报头压缩和解压缩,维持pdcp序列号(sn),在重建较低层时执行较高层pdu的序列内递送,在为映射在rlc am上的无
线电承载重建较低层时消除较低层sdu的复制,对控制面数据进行加密和解密,对控制面数据进行完整性保护和完整性验证,基于控制定时器的数据丢弃,并执行安全操作(例如,加密、解密、完整性保护、完整性验证等)。
251.在至少一个实施例中,rrc层2210的主要服务和功能可包括系统信息的广播(例如,包括在与非接入层(nas)相关的主信息块(mib)或系统信息块(sib)中),与接入层(as)有关的系统信息的广播、ue与e-utran之间的rrc连接的寻呼、建立、维持和释放(例如,rrc连接寻呼、rrc连接建立、rrc连接修改和rrc连接释放),点对点无线承载的建立、配置、维护和释放,包括密钥管理的安全功能,无线电接入技术(rat)间移动性,以及用于ue测量报告的测量配置。在至少一个实施例中,所述mib和sib可包括一个或更多个信息元素(ie),每个信息元素可包括单独的数据字段或数据结构。
252.在至少一个实施例中,ue 2002和ran 2016可以利用uu接口(例如,lte-uu接口)来经由包括phy层2202、mac层2204、rlc层2206、pdcp层2208和rrc层2210的协议栈交换控制平面数据。
253.在至少一个实施例中,非接入层(nas)协议(nas协议2212)形成ue 2002与mme 2028之间的控制平面的最高层。在至少一个实施例中,nas协议2212支持ue 2002的移动性和会话管理过程以建立和维持ue2002与p-gw 2034之间的ip连接。
254.在至少一个实施例中,si应用协议(s1-ap)层(si-ap层2222)可以支持si接口的功能并且包括基本过程(ep)。在至少一个实施例中,ep是ran2016和cn2028之间的交互单元。在至少一个实施例中,s1-ap层服务可以包括两个群组:ue关联服务和非ue关联服务。在至少一个实施例中,这些服务器执行功能,包括但不限于:e-utran无线电接入承载(e-rab)管理、ue能力指示、移动性、nas信令传输、ran信息管理(rim)和配置转移。
255.在至少一个实施例中,流控制传输协议(sctp)层(可替代地称为流控制传输协议/互联网协议(sctp/ip)层)(sctp层2220)可以部分地基于ip层2218所支持的ip协议来确保ran2016与mme2028之间的信令消息的可靠传递。在至少一个实施例中,l2层2216和l1层2214可以指由ran节点和mme用来交换信息的通信链路(例如,有线或无线)。
256.在至少一个实施例中,ran2016和一个或更多个mme2028可以利用s1-mme接口来经由包括l1层2214、l2层2216、ip层2218、sctp层2220和s1-ap层2222的协议栈交换控制平面数据。
257.图23是根据至少一个实施例的用户平面协议栈的图示。在至少一个实施例中,用户平面2300被示为ue2002、ran2016、s-gw2030和p-gw2034之间的通信协议栈。在至少一个实施例中,用户平面2300可以利用与控制平面2200相同的协议层。在至少一个实施例中,ue 2002和ran 2016可以利用uu接口(例如,lte-uu接口)来经由包括phy层2202、mac层2204、rlc层2206、pdcp层2208的协议栈来交换用户平面数据。
258.在至少一个实施例中,用于用户平面的通用分组无线电服务(gprs)调谐协议(gtp-u)层(gtp-u层2304)可以用于在gprs核心网络内和在无线电接入网络和核心网络之间携带用户数据。在至少一个实施例中,所传输的用户数据可以是ipv4、ipv6或ppp格式中的任何格式的数据包。在至少一个实施例中,udp和ip安全(udp/ip)层(udp/ip层2302)可以提供数据完整性的校验和、用于在源和目的地寻址不同功能的端口号、以及对所选数据流的加密和认证。在至少一个实施例中,ran2016和s-gw2030可以利用s1-u接口来经由包括l1
层2214、l2层2216、udp/ip层2302和gtp-u层2304的协议栈来交换用户平面数据。在至少一个实施例中,s-gw2030和p-gw2034可以利用s5/s8a接口来经由包括l1层2214、l2层2216、udp/ip层2302和gtp-u层2304的协议栈交换用户平面数据。在至少一个实施例中,如以上关于图22所讨论的,nas协议支持ue 2002的移动性和会话管理过程以建立和维持ue 2002与p-gw 2034之间的ip连接。
259.图24示出了根据至少一个实施例的核心网络的组件2400。在至少一个实施例中,cn2038的组件可以在一个物理节点或单独的物理节点中实现,所述单独的物理节点包括用于从机器可读或计算机可读介质(例如,非暂态机器可读存储介质)读取和执行指令的组件。在至少一个实施例中,网络功能虚拟化(nfv)用于经由存储在一个或更多个计算机可读存储介质(以下进一步详细描述)中的可执行指令来虚拟化任何或所有的上述网络节点功能。在至少一个实施例中,cn2038的逻辑实例可以被称为网络切片2402(例如,网络切片2402被示出为包括hss2032、mme2028和s-gw2030)。在至少一个实施例中,cn2038的一部分的逻辑实例可以被称为网络子切片2404(例如,网络子切片2404被示出为包括p-gw2034和pcrf2036)。
260.在至少一个实施例中,nfv架构和基础设施可以用于将一个或更多个网络功能虚拟化到包括行业标准服务器硬件、存储硬件或交换机的组合的物理资源上,所述网络功能可替代地由专用硬件执行。在至少一个实施例中,nfv系统可用于执行一个或更多个epc组件/功能的虚拟或可重新配置的实现方式。
261.图25是示出了根据至少一个实施例的用于支持网络功能虚拟化(nfv)的系统2500的组件的框图。在至少一个实施例中,系统2500被示为包括虚拟化基础设施管理器(被示为vim2502)、网络功能虚拟化基础设施(如nfvi2504所示)、vnf管理器(如vnfm2506所示)、虚拟化网络功能(示出为vnf2508)、元件管理器(示出为em2510)、nfv协调器(示出为nfvo2512)、以及网络管理器(示为nm2514)。
262.在至少一个实施例中,vim2502管理nfvi2504的资源。在至少一个实施例中,nfv12504可包括用于执行系统2500的物理或虚拟资源和应用(包括管理程序)。在至少一个实施例中,vim2502可以利用nfvi2504来管理虚拟资源的生命周期(例如,与一个或更多个物理资源相关联的虚拟机(vm)的创建、维护和拆除)、跟踪vm实例、跟踪性能、vm实例和相关联的物理资源的故障和安全性、以及向其他管理系统暴露vm实例和相关联的物理资源。
263.在至少一个实施例中,vnfm 2506可以管理vnf 2508。在至少一个实施例中,vnf2508可以用于执行epc组件/功能。在至少一个实施例中,vnfm2506可以管理vnf2508的生命周期并且跟踪vnf2508的虚拟方面的性能、故障和安全性。在至少一个实施例中,em2510可以跟踪vnf2508的功能方面的性能、故障和安全性。在至少一个实施例中,来自vnfm 2506和em 2510的跟踪数据可以包括(在至少一个实施例中)由vim 2502或nfvi 2504使用的性能测量(pm)数据。在至少一个实施例中,vnfm 2506和em 2510两者可以放大/缩小系统2500的vnf的数量。
264.在至少一个实施例中,nfvo2512可协调、授权、释放和占用nfvi2504的资源,以便提供所请求的服务(例如,执行epc功能、组件或切片)。在至少一个实施例中,nm2514可提供负责管理网络的终端用户功能包,该网络可包括具有vnf、非虚拟化网络功能或两者的网络元件(vnf的管理可经由em2510发生)。
265.基于计算机的系统
266.以下各图提出但不限于可用于实现至少一个实施例的示例性的基于计算机的系统。
267.图26示出了根据至少一个实施例的处理系统2600。在至少一个实施例中,系统2600包括一个或更多个处理器2602和一个或更多个图形处理器2608,并且可以是单处理器台式机系统、多处理器工作站系统或具有大量处理器2602或处理器核心2607的服务器系统。在至少一个实施例中,处理系统2600是结合在片上系统(soc)集成电路内的处理平台,以用于移动、手持或嵌入式设备。
268.在至少一个实施例中,处理系统2600可以包括或结合在基于服务器的游戏平台中,包括游戏和媒体控制台的游戏控制台、移动游戏控制台、手持游戏控制台或在线游戏控制台。在至少一个实施例中,处理系统2600是移动电话、智能电话、平板计算设备或移动互联网设备。在至少一个实施例中,处理系统2600还可包括与可穿戴设备耦合或集成在可穿戴设备中,例如智能手表可穿戴设备、智能眼镜设备、增强现实设备或虚拟现实设备。在至少一个实施例中,处理系统2600是电视或机顶盒设备,其具有一个或更多个处理器2602以及由一个或更多个图形处理器2608生成的图形界面。
269.在至少一个实施例中,一个或更多个处理器2602每个包括一个或更多个处理器核心2607,以处理指令,该指令在被执行时执行针对系统和用户软件的操作。在至少一个实施例中,一个或更多个处理器核心2607中的每一个被配置为处理特定指令集2609。在至少一个实施例中,指令集2609可以促进复杂指令集计算(cisc)、精简指令集计算(risc),或通过超长指令字(vliw)进行计算。在至少一个实施例中,多个处理器核心2607可以各自处理不同的指令集2609,该指令集2609可以包括有助于仿真其他指令集的指令。在至少一个实施例中,处理器核心2607还可以包括其他处理设备,例如数字信号处理器(dsp)。
270.在至少一个实施例中,处理器2602包括高速缓存存储器(cache)2604。在至少一个实施例中,处理器2602可以具有单个内部高速缓存或多个级别的内部高速缓存。在至少一个实施例中,高速缓存存储器在处理器2602的各个组件之间共享。在至少一个实施例中,处理器2602还使用外部高速缓存(例如,三级(l3)高速缓存或最后一级高速缓存(llc))(未示出),其可以使用已知的高速缓存一致性技术在处理器核心2607之间共享该逻辑。在至少一个实施例中,处理器2602中另外包括寄存器文件2606,处理器2602可以包括用于存储不同类型的数据的不同类型的寄存器(例如,整数寄存器、浮点寄存器、状态寄存器和指令指针寄存器)。在至少一个实施例中,寄存器文件2606可以包括通用寄存器或其他寄存器。
271.在至少一个实施例中,一个或更多个处理器2602与一个或更多个接口总线2610耦合,以在处理器2602与系统2600中的其他组件之间传输通信信号,例如地址、数据或控制信号。在至少一个实施例中,接口总线2610在一个实施例中可以是处理器总线,例如直接媒体接口(dmi)总线的版本。在至少一个实施例中,接口总线2610不限于dmi总线,并且可以包括一个或更多个外围组件互连总线(例如,pci,pci express)、存储器总线或其他类型的接口总线。在至少一个实施例中,处理器2602包括集成存储器控制器2616和平台控制器集线器2630。在至少一个实施例中,存储器控制器2616促进存储设备与处理系统2600的其他组件之间的通信,而平台控制器集线器(pch)2630通过本地i/o总线提供到输入/输出(i/o)设备的连接。
santa clara,california)获得的处理器家族、xeontm、xscaletm和/或strongarmtm,core
tm
或nervana
tm
微处理器,尽管也可以使用其他系统(包括具有其他微处理器的pc、工程工作站、机顶盒等)。在至少一个实施例中,计算机系统2700可以执行可从华盛顿州雷蒙德市的微软公司(microsoft corporation of redmond,wash.)获得的windows操作系统版本,尽管其他操作系统(在至少一个实施例中unix和linux)、嵌入式软件和/或图形用户界面也可以使用。
276.在至少一个实施例中,计算机系统2700可以用在其他设备中,例如手持设备和嵌入式应用。手持设备的至少一个实施例的一些包括蜂窝电话、互联网协议(internet protocol)设备、数码相机、个人数字助理(“pda”)和手持pc。在至少一个实施例中,嵌入式应用可以包括微控制器、数字信号处理器(“dsp”)、soc、网络计算机(“netpc”)、机顶盒、网络集线器、广域网(“wan”)交换机,或根据至少一个实施例可以执行一个或更多个指令的任何其他系统。
277.在至少一个实施例中,计算机系统2700可包括但不限于处理器2702,该处理器2702可包括但不限于一个或更多个执行单元2708,其可以配置为执行计算统一设备架构(“cuda”)(由加利福尼亚州圣克拉拉的nvidia corporation开发)程序。在至少一个实施例中,cuda程序是用cuda编程语言编写的软件应用程序的至少一部分。在至少一个实施例中,计算机系统2700是单处理器台式机或服务器系统。在至少一个实施例中,计算机系统2700可以是多处理器系统。在至少一个实施例中,处理器2702可以包括但不限于cisc微处理器、risc微处理器、vliw微处理器、实现指令集组合的处理器,或任何其他处理器设备,在至少一个实施例中,诸如数字信号处理器。在至少一个实施例中,处理器2702可以耦合到处理器总线2710,该处理器总线2710可以在处理器2702与计算机系统2700中的其他组件之间传输数据信号。
278.在至少一个实施例中,处理器2702可以包括但不限于1级(“l1”)内部高速缓存存储器(“cache”)2704。在至少一个实施例中,处理器2702可以具有单个内部高速缓存或多级内部缓存。在至少一个实施例中,高速缓存存储器可以驻留在处理器2702的外部。在至少一个实施例中,处理器2702可以包括内部和外部高速缓存的组合。在至少一个实施例中,寄存器文件2706可以在各种寄存器中存储不同类型的数据,包括但不限于整数寄存器、浮点寄存器、状态寄存器和指令指针寄存器。
279.在至少一个实施例中,包括但不限于执行整数和浮点运算的逻辑的执行单元2708,其也位于处理器2702中。处理器2702还可以包括微码(“ucode”)只读存储器(“rom”),用于存储某些宏指令的微代码。在至少一个实施例中,执行单元2708可以包括用于处理封装指令集2709的逻辑。在至少一个实施例中,通过将封装指令集2709包括在通用处理器2702的指令集中,以及要执行指令的相关电路,可以使用通用处理器2702中的封装数据来执行许多多媒体应用程序使用的操作。在至少一个实施例中,可以通过使用处理器的数据总线的全宽度来在封装的数据上执行操作来加速和更有效地执行许多多媒体应用程序,这可能不需要在处理器的数据总线上传输较小的数据单元来一次对一个数据元素执行一个或更多个操作。
280.在至少一个实施例中,执行单元2708也可以用在微控制器、嵌入式处理器、图形设
备、dsp和其他类型的逻辑电路中。在至少一个实施例中,计算机系统2700可以包括但不限于存储器2720。在至少一个实施例中,存储器2720可以被实现为dram设备、sram设备、闪存设备或其他存储设备。存储器2720可以存储由处理器2702可以执行的由数据信号表示的指令2719和/或数据2721。
281.在至少一个实施例中,系统逻辑芯片可以耦合到处理器总线2710和存储器2720。在至少一个实施例中,系统逻辑芯片可以包括但不限于存储器控制器集线器(“mch”)2716,并且处理器2702可以经由处理器总线2710与mch 2716通信。在至少一个实施例中,mch 2716可以提供到存储器2720的高带宽存储器路径2718以用于指令和数据存储以及用于图形命令、数据和纹理的存储。在至少一个实施例中,mch 2716可以在处理器2702、存储器2720和计算机系统2700中的其他组件之间启动数据信号,并且在处理器总线2710、存储器2720和系统i/o 2722之间桥接数据信号。在至少一个实施例中,系统逻辑芯片可以提供用于耦合到图形控制器的图形端口。在至少一个实施例中,mch 2716可以通过高带宽存储器路径2718耦合到存储器2720,并且图形/视频卡2712可以通过加速图形端口(accelerated graphics port)(“agp”)互连2714耦合到mch 2716。
282.在至少一个实施例中,计算机系统2700可以使用系统i/o 2722作为专有集线器接口总线来将mch 2716耦合到i/o控制器集线器(“ich”)2730。在至少一个实施例中,ich 2730可以通过本地i/o总线提供与某些i/o设备的直接连接。在至少一个实施例中,本地i/o总线可以包括但不限于用于将外围设备连接到存储器2720、芯片组和处理器2702的高速i/o总线。示例可以包括但不限于音频控制器2729、固件集线器(“flash bios”)2728、无线收发器2726、数据存储2724、包含用户输入2725的传统i/o控制器2723和键盘接口、串行扩展端口2777(例如usb)和网络控制器2734。数据存储2724可以包括硬盘驱动器、软盘驱动器、cd-rom设备、闪存设备或其他大容量存储设备。
283.在至少一个实施例中,图27示出了包括互连的硬件设备或“芯片”的系统。在至少一个实施例中,图27可以示出示例性soc。在至少一个实施例中,图27中示出的设备可以与专有互连、标准化互连(例如,pcie)或其某种组合互连。在至少一个实施例中,系统2700的一个或更多个组件使用计算快速链路(cxl)互连来互连。
284.图28示出了根据至少一个实施例的系统2800。在至少一个实施例中,系统2800是利用处理器2810的电子设备。在至少一个实施例中,系统2800可以是,例如但不限于,笔记本电脑、塔式服务器、机架服务器、刀片服务器、膝上型计算机、台式机、平板电脑、移动设备、电话、嵌入式计算机或任何其他合适的电子设备。
285.在至少一个实施例中,系统2800可以包括但不限于通信地耦合到任何合适数量或种类的组件、外围设备、模块或设备的处理器2810。在至少一个实施例中,处理器2810使用总线或接口耦合,诸如i2c总线、系统管理总线(“smbus”)、低引脚数(lpc)总线、串行外围接口(“spi”)、高清音频(“hda”)总线、串行高级技术附件(“sata”)总线、usb(1、2、3版)或通用异步接收器/发送器(“uart”)总线。在至少一个实施例中,图28示出了系统,该系统包括互连的硬件设备或“芯片”。在至少一个实施例中,图28可以示出示例性soc。在至少一个实施例中,图28中所示的设备可以与专有互连线、标准化互连(例如,pcie)或其某种组合互连。在至少一个实施例中,图28的一个或更多个组件使用计算快速链路(cxl)互连线来互连。
286.在至少一个实施例中,图28可以包括显示器2824、触摸屏2825、触摸板2830、近场
通信单元(“nfc”)2845、传感器集线器2840、热传感器2846、快速芯片组(“ec”)2835、可信平台模块(“tpm”)2838、bios/固件/闪存(“bios,fw flash”)2822、dsp 2860、固态磁盘(“ssd”)或硬盘驱动器(“hdd”)2820、无线局域网单元(“wlan”)2850、蓝牙单元2852、无线广域网单元(“wwan”)2856、全球定位系统(gps)2855、相机(“usb 3.0相机”)2854(例如usb 3.0相机)或以至少一个实施例lpddr3标准实现的低功耗双倍数据速率(“lpddr”)存储器单元(“lpddr3”)2815。这些组件可以各自以任何合适的方式实现。
287.在至少一个实施例中,其他组件可以通过以上讨论的组件通信地耦合到处理器2810。在至少一个实施例中,加速度计2841、环境光传感器(“als”)2842、罗盘2843和陀螺仪2844可以可通信地耦合到传感器集线器2840。在至少一个实施例中,热传感器2839、风扇2837、键盘2846和触摸板2830可以通信地耦合到ec 2835。在至少一个实施例中,扬声器2863、耳机2864和麦克风(“mic”)2865可以通信地耦合到音频单元(“音频编解码器和d类放大器”)2864,其又可以通信地耦合到dsp 2860。在至少一个实施例中,音频单元2864可以包括但不限于音频编码器/解码器(“编解码器”)和d类放大器。在至少一个实施例中,sim卡(“sim”)2857可以通信地耦合到wwan单元2856。在至少一个实施例中,组件(诸如wlan单元2850和蓝牙单元2852以及wwan单元2856)可以被实现为下一代形式因素(ngff)。
288.图29示出了根据至少一个实施例的示例性集成电路2900。在至少一个实施例中,示例性集成电路2900是soc,其可使用一个或更多个ip核心制造。在至少一个实施例中,集成电路2900包括一个或更多个应用处理器2905(例如,cpu)、至少一个图形处理器2910,并且可以另外包括图像处理器2915和/或视频处理器2920,其中任意一个可能是模块化ip核心。在至少一个实施例中,集成电路2900包括外围或总线逻辑,其包括usb控制器2925、uart控制器2930、spi/sdio控制器2935和i2s/i2c控制器2940。在至少一个实施例中,集成电路2900可以包括显示设备2945耦合到高清多媒体接口(hdmi)控制器2950和移动工业处理器接口(mipi)显示接口2955中的一个或更多个。在至少一个实施例中,存储可以由闪存子系统2960提供,包括闪存和闪存控制器。在至少一个实施例中,可以经由存储器控制器2965提供存储器接口以用于访问sdram或sram存储器设备。在至少一个实施例中,一些集成电路还包括嵌入式安全引擎2970。
289.图30示出了根据至少一个实施例的计算系统3000。在至少一个实施例中,计算系统3000包括处理子系统3001,其具有经由可以包括存储器集线器3005的互连路径通信的一个或更多个处理器3002和系统存储器3004。在至少一个实施例中,存储器集线器3005可以是芯片组组件内的单独组件,也可以集成在一个或更多个处理器3002内。在至少一个实施例中,存储器集线器3005通过通信链路3006与i/o子系统3011耦合。在至少一个实施例中,i/o子系统3011包括i/o集线器3007,其可以使计算系统3000能够接收来自一个或更多个输入设备3008的输入。在至少一个实施例中,i/o集线器3007可以使能显示控制器,其包括在一个或更多个处理器3002中,用于向一个或更多个显示设备3010a提供输出。在至少一个实施例中,与i/o集线器3007耦合的一个或更多个显示设备3010a可以包括本地、内部或嵌入式显示设备。
290.在至少一个实施例中,处理子系统3001包括经由总线或其他通信链路3013耦合到存储器集线器3005的一个或更多个并行处理器3012。在至少一个实施例中,通信链路3013可以是许多基于标准的通信链路技术或协议中的一种,例如但不限于pcie,或者可以是针
3100是将不限于3110和3140集成到单个芯片上的处理单元。在至少一个实施例中,一些任务可以被分配给核心复合体3110,而其他任务可以被分配给图形复合体3140。在至少一个实施例中,核心复合体3110被配置为执行与apu 3100相关联的主控制软件,例如操作系统。在至少一个实施例中,核心复合体3110是apu 3100的主处理器,其控制和协调其他处理器的操作。在至少一个实施例中,核心复合体3110发出控制图形复合体3140的操作的命令。在至少一个实施例中,核心复合体3110可以被配置为执行从cuda源代码派生的主机可执行代码,并且图形复合体3140可以被配置为执行从cuda源代码派生的设备可执行代码。
298.在至少一个实施例中,核心复合体3110包括但不限于核心3120(1)-3120(4)和l3高速缓存3130。在至少一个实施例中,核心复合体3110可以包括但不限于任意数量的核心3120以及任意数量和类型的高速缓存的任何组合。在至少一个实施例中,核心3120被配置为执行特定指令集架构(“isa”)的指令。在至少一个实施例中,每个核心3120是cpu核心。
299.在至少一个实施例中,每个核心3120包括但不限于获取/解码单元3122,整数执行引擎3124,浮点执行引擎3126和l2高速缓存3128。在至少一个实施例中,获取/解码单元3122获取指令,对这些指令进行解码,生成微操作,并将单独的微指令分派给整数执行引擎3124和浮点执行引擎3126。在至少一个实施例中,获取/解码单元3122可以同时分派一个微指令到整数执行引擎3124和另一微指令到浮点执行引擎3126。在至少一个实施例中,整数执行引擎3124执行不限于整数和存储器操作。在至少一个实施例中,浮点引擎3126执行不限于浮点和向量运算。在至少一个实施例中,获取-解码单元3122将微指令分派给单个执行引擎,该执行引擎代替整数执行引擎3124和浮点执行引擎3126两者。
300.在至少一个实施例中,每个核心3120(i)可以访问包括在核心3120(i)中的l2高速缓存3128(i),其中i是表示核心3120的特定实例的整数。在至少一个实施例中,包括在核心复合体3110(j)中的每个核心3120经由包括在核心复合体3110(j)中的l3高速缓存3130(j)连接到包括在核心复合体3110(j)中的其他核心3120,其中j是表示核心复合体3110的特定实例的整数。在至少一个实施例中,包括在核心复合体3110(j)中的核心3120可以访问包括在核心复合体3110(j)中的所有l3高速缓存3130(j),其中j是表示核心复合体3110的特定实例的整数。在至少一个实施例中,l3高速缓存3130可以包括但不限于任意数量的切片(slice)。
301.在至少一个实施例中,图形复合体3140可以被配置为以高度并行的方式执行计算操作。在至少一个实施例中,图形复合体3140被配置为执行图形管线操作,诸如绘制命令、像素操作、几何计算以及与将图像渲染至显示器相关联的其他操作。在至少一个实施例中,图形复合体3140被配置为执行与图形无关的操作。在至少一个实施例中,图形复合体3140被配置为执行与图形有关的操作和与图形无关的操作。
302.在至少一个实施例中,图形复合体3140包括但不限于任意数量的计算单元3150和l2高速缓存3142。在至少一个实施例中,计算单元3150共享l2高速缓存3142。在至少一个实施例中,l2高速缓存3142被分区。在至少一个实施例中,图形复合体3140包括但不限于任意数量的计算单元3150以及任意数量(包括零)和类型的高速缓存。在至少一个实施例中,图形复合体3140包括但不限于任意数量的专用图形硬件。
303.在至少一个实施例中,每个计算单元3150包括但不限于任意数量的simd单元3152和共享存储器3154。在至少一个实施例中,每个simd单元3152实现simd架构并且被配置为
并行执行操作。在至少一个实施例中,每个计算单元3150可以执行任意数量的线程块,但是每个线程块在单个计算单元3150上执行。在至少一个实施例中,线程块包括但不限于任意数量的执行线程。在至少一个实施例中,工作组是线程块。在至少一个实施例中,每个simd单元3152执行不同的线程束(warp)。在至少一个实施例中,线程束是一组线程(例如16个线程),其中线程束中的每个线程属于单个线程块,并且被配置为基于单个指令集来处理不同的数据集。在至少一个实施例中,可以使用预测(predication)来禁用线程束中的一个或更多个线程。在至少一个实施例中,通道是线程。在至少一个实施例中,工作项是线程。在至少一个实施例中,波前是线程束。在至少一个实施例中,线程块中的不同波前可一起同步并经由共享存储器3154进行通信。
304.在至少一个实施例中,结构3160是系统互连,其促进跨核心复合体3110、图形复合体3140、i/o接口3170、存储器控制器3180、显示控制器3192和多媒体引擎3194的数据和控制传输。在至少一个实施例中,除了结构3160之外或代替结构3160,apu 3100还可以包括但不限于任意数量和类型的系统互连,该结构3160促进跨可以在apu 3100内部或外部的任意数量和类型的直接或间接链接的组件的数据和控制传输。在至少一个实施例中,i/o接口3170表示任意数量和类型的i/o接口(例如,pci,pci-extended(“pci-x”),pcie,千兆以太网(“gbe”),usb等)。在至少一个实施例中,各种类型的外围设备耦合到i/o接口3170。在至少一个实施例中,耦合到i/o接口3170的外围设备可以包括但不限于键盘,鼠标,打印机,扫描仪,操纵杆或其他类型的游戏控制器、媒体记录设备、外部存储设备、网络接口卡等。
305.在至少一个实施例中,显示控制器amd92在一个或更多个显示设备(例如液晶显示器(lcd)设备)上显示图像。在至少一个实施例中,多媒体引擎240包括但不限于任意数量和类型的与多媒体相关的电路,例如视频解码器、视频编码器、图像信号处理器等。在至少一个实施例中,存储器控制器3180促进apu 3100与统一系统存储器3190之间的数据传输。在至少一个实施例中,核心复合体3110和图形复合体3140共享统一系统存储器3190。
306.在至少一个实施例中,apu 3100实现种存储器子系统,其包括但不限于任意数量和类型的存储器控制器3180和可以专用于一个组件或在多个组件之间共享的存储器设备(例如,共享存储器3154)。组件。在至少一个实施例中,apu 3100实现高速缓存子系统,其包括但不限于一个或更多个高速缓存存储器(例如,l2高速缓存1628,l3高速缓存3130和l2高速缓存3142),每个高速缓存存储器可以是组件私有的或在任意数量的组件(例如,核心3120,核心复合体3110,simd单元3152,计算单元3150和图形复合体3140)之间共享。
307.图32示出了根据至少一个实施例的cpu 3200。在至少一个实施例中,cpu 3200由加利福尼亚州圣克拉拉市的amd公司开发。在至少一个实施例中,cpu 3200可以被配置为执行应用程序。在至少一个实施例中,cpu 3200被配置为执行主控制软件,例如操作系统。在至少一个实施例中,cpu 3200发出控制外部gpu(未示出)的操作的命令。在至少一个实施例中,cpu 3200可以被配置为执行从cuda源代码派生的主机可执行代码,并且外部gpu可以被配置为执行从这种cuda源代码派生的设备可执行代码。在至少一个实施例中,cpu 3200包括但不限于任意数量的核心复合体3210,结构3260,i/o接口3270和存储器控制器amad80。
308.在至少一个实施例中,核心复合体3210包括但不限于核心3220(1)-3220(4)和l3高速缓存3230。在至少一个实施例中,核心复合体3210可以包括但不限于任意数量的核心3220以及任意数量和类型的高速缓存的任何组合。在至少一个实施例中,核心3220被配置
为执行特定isa的指令。在至少一个实施例中,每个核心3220是cpu核心。
309.在至少一个实施例中,每个核心3220包括但不限于获取/解码单元3222,整数执行引擎3224,浮点执行引擎3226和l2高速缓存3228。在至少一个实施例中,获取/解码单元3222获取指令,对这些指令进行解码,生成微操作,并将单独的微指令分派给整数执行引擎3224和浮点执行引擎3226。在至少一个实施例中,获取/解码单元3222可以同时分派一个微指令至整数执行引擎3224和另一微指令至浮点执行引擎3226。在至少一个实施例中,整数执行引擎3224执行不限于整数和存储器操作。在至少一个实施例中,浮点引擎3226执行不限于浮点和向量运算。在至少一个实施例中,获取-解码单元3222将微指令分派给单个执行引擎,该引擎代替整数执行引擎3224和浮点执行引擎3226两者。
310.在至少一个实施例中,每个核心3220(i)可以访问包括在核心3220(i)中的l2高速缓存3228(i),其中i是表示核心3220的特定实例的整数。在至少一个实施例中,包括在核心复合体3210(j)中的每个核心3220经由包括在核心复合体3210(j)中的l3高速缓存3230(j)连接到核心复合体3210(j)中的其他核心3220,其中j是表示核心复合体3210的特定实例的整数。在至少一个实施例中,包括在核心复合体3210(j)中的核心3220可以访问包括在核心复合体3210(j)中的所有l3高速缓存3230(j),其中j是表示核心复合体3210的特定实例的整数。在至少一个实施例中,l3高速缓存3230可以包括但不限于任意数量的切片。
311.在至少一个实施例中,结构3260是系统互连,其促进跨核心复合体3210(1)-3210(n)(其中n是大于零的整数)、i/o接口3270和存储器控制器3280的数据和控制传输。在至少一个实施例中,除了结构3260之外或代替结构3260,cpu 3200还可以包括但不限于任意数量和类型的系统互连,该结构3260促进跨可以在cpu 3200内部或外部的任意数量和类型的直接或间接链接的组件的数据和控制传输。在至少一个实施例中,i/o接口3270表示任意数量和类型的i/o接口(例如pci,pci-x,pcie,gbe,usb等)。在至少一个实施例中,各种类型的外围设备耦合到i/o接口3270。在至少一个实施例中,耦合到i/o接口3270的外围设备可以包括但不限于显示器,键盘,鼠标,打印机,扫描仪,操纵杆或其他类型的游戏控制器、媒体记录设备、外部存储设备、网络接口卡等。
312.在至少一个实施例中,存储器控制器3280促进cpu 3200与系统存储器3290之间的数据传输。在至少一个实施例中,核心复合体3210和图形复合体3240共享系统存储器3290。在至少一个实施例中,cpu 3200实现存储器子系统,其包括但不限于任意数量和类型的存储器控制器3280和可以专用于一个组件或在多个组件之间共享的存储器设备。在至少一个实施例中,cpu 3200实现了高速缓存子系统,其包括但不限于一个或更多个高速缓存存储器(例如,l2高速缓存3228和l3高速缓存3230),每个高速缓存存储器可以是组件私有的或在任意数量的组件(例如,核心3220和核心复合体3210)之间共享。
313.图33示出了根据至少一个实施例的示例性加速器集成切片3390。如本文所使用的,“切片”包括加速器集成电路的处理资源的指定部分。在至少一个实施例中,加速器集成电路代表多个图形加速模块种的多个图形处理引擎提供高速缓存管理、存储器访问、环境管理和中断管理服务。图形处理引擎可以各自包括单独的gpu。可选地,图形处理引擎可包括gpu内的不同类型的图形处理引擎,例如图形执行单元、媒体处理引擎(例如,视频编码器/解码器)、采样器和blit引擎。在至少一个实施例中,图形加速模块可以是具有多个图形处理引擎的gpu。在至少一个实施例中,图形处理引擎可以是集成在通用封装、线卡或芯片
上的各个gpu。
314.系统存储器3314内的应用程序有效地址空间3382存储进程元素3383。在一个实施例中,响应于来自处理器3307上执行的应用程序3380的gpu调用3381而存储进程元素3383。进程元素3383包含对应应用程序3380的处理状态。包含在进程元素3383中的工作描述符(wd)3384可以是应用程序请求的单个作业或可能包含指向作业队列的指针。在至少一个实施例中,wd 3384是指向应用程序有效地址空间3382中的作业请求队列的指针。
315.图形加速模块3346和/或各个图形处理引擎可以由系统中的全部或部分进程共享。在至少一个实施例中,可以包括用于建立处理状态并将wd 3384发送到图形加速模块3346以在虚拟化环境中开始作业的基础设施。
316.在至少一个实施例中,专用进程编程模型是针对实现的。在该模型中,单个进程拥有图形加速模块3346或个体图形处理引擎。由于图形加速模块3346由单个进程拥有,因此管理程序为拥有的分区初始化加速器集成电路,并且当分配图形加速模块3346时操作系统对加速器集成电路进行初始化以用于拥有的分区。
317.在操作中,加速器集成切片3390中的wd获取单元3391获取下一个wd 3384,其中包括要由图形加速模块3346的一个或更多个图形处理引擎完成的工作的指示。来自wd 3384的数据可以存储在寄存器3345被存储器管理单元(mmu)3339、中断管理电路3347和/或环境管理电路3348使用,如图所示。mmu 3339的至少一个实施例包括用于访问os虚拟地址空间3385内的段/页表3386的段/页面漫游电路。中断管理电路3347可以处理从图形加速模块3346接收到的中断事件(int)3392。当执行图操作时,由图形处理引擎产生的有效地址3393由mmu 3339转换为实际地址。
318.在一个实施例中,为每个图形处理引擎和/或图形加速模块3346复制相同的寄存器组3345,并且可以由系统管理程序或操作系统来初始化。这些复制的寄存器中的每一个都可以包含在加速器集成切片3390中。表1中显示了可由管理程序初始化的示例性寄存器。
319.表1

管理程序初始化的寄存器
320.3420b、高速缓存3425a-3425b和电路互连3430a-3430b。在至少一个实施例中,一个或更多个mmu 3420a-3420b提供用于图形处理器3410的虚拟到物理地址的映射,包括用于顶点处理器3405和/或片段处理器3415a-3415n,其可以引用存储在存储器中的顶点或图像/纹理数据,除了存储在一个或更多个高速缓存3425a-3425b中的顶点或图像/纹理数据之外。在至少一个实施例中,一个或更多个mmu 3420a-3420b可以与系统内的其他mmu同步,包括与图5的一个或更多个应用处理器505、图像处理器515和/或视频处理器520相关联的一个或更多个mmu,使得每个处理器505-520可以参与共享或统一的虚拟存储器系统。在至少一个实施例中,一个或更多个电路互连3430a-3430b使图形处理器3410能够经由soc的内部总线或经由直接连接与soc内的其他ip核心相连接。
330.在至少一个实施例中,图形处理器3440包括图34a的图形处理器3410的一个或更多个mmu 3420a-3420b、高速缓存3425a-3425b和电路互连3430a-3430b。在至少一个实施例中,图形处理器3440包括一个或更多个着色器核心3455a-3455n(例如,3455a、3455b、3455c、3455d、3455e、3455f、至3455n-1和3455n),其提供了统一的着色器核心架构,其中单个核心或类型或核心可以执行所有类型的可编程着色器代码,包括用于实现顶点着色器、片段着色器和/或计算着色器的着色器程序代码。在至少一个实施例中,多个着色器核心可以变化。在至少一个实施例中,图形处理器3440包括核心间任务管理器3445,其充当线程分派器以将执行线程分派给一个或更多个着色器核心3455a-3455n和分块单元3458,以加速基于图块渲染的分块操作,其中在图像空间中细分了场景的渲染操作,例如,以利用场景内的局部空间一致性或优化内部缓存的使用。
331.图35a示出了根据至少一个实施例的图形核心3500。在至少一个实施例中,图形核心3500可以包括在图24的图形处理器2410内。在至少一个实施例中,图形核心3500可以是图34b中统一的着色器核心3455a-3455n。在至少一个实施例中,图形核心3500包括共享指令高速缓存3502、纹理单元3518和高速缓存/共享存储器3520,它们是图形核心3500内的执行资源所共有的。在至少一个实施例中,图形核心3500可以包括多个切片(slice)3501a-3501n或每个核心的分区,图形处理器可以包括图形核心3500的多个实例。切片3501a-3501n可以包括支持逻辑,该支持逻辑包括本地指令高速缓存3504a-3504n、线程调度器3506a-3506n、线程分派器3508a-3508n和一组寄存器3510a-3510n。在至少一个实施例中,切片3501a-3501n可以包括一组附加功能单元(afu)3512a-3512n、浮点单元(fpu)3514a-3514n、整数算术逻辑单元(alu)3516a-3516n、地址计算单元(acu)3513a-3513n、双精度浮点单元(dpfpu)3515a-3515n和矩阵处理单元(mpu)3517a-3517n。
332.在一个实施例中,fpu 3514a-3514n可以执行单精度(32位)和半精度(16位)浮点运算,而dpfpu 3515a-3515n可以执行双精度(64位)浮点运算点操作。在至少一个实施例中,alu 3516a-3516n可以以8位、16位和32位精度执行可变精度整数运算,并且可以被配置用于混合精度运算。在至少一个实施例中,mpu 3517a-3517n还可被配置用于混合精度矩阵运算,包括半精度浮点运算和8位整数运算。在至少一个实施例中,mpu 3517a-3517n可以执行各种矩阵操作以加速cuda程序,包括使得能够支持加速的通用矩阵到矩阵乘法(gemm)。在至少一个实施例中,afu 3512a-3512n可以执行浮点数或整数单元不支持的附加逻辑运算,包括三角运算(例如,sine、cosine等)。
333.图35b示出了在至少一个实施例中的通用图形处理单元(gpgpu)3530。在至少一个
实施例中,gpgpu 3530是高度并行的并且适合于部署在多芯片模块上。在至少一个实施例中,gpgpu 3530可以被配置为使得高度并行的计算操作能够由gpu阵列来执行。在至少一个实施例中,gpgpu 3530可以直接链路到gpgpu 3530的其他实例,以创建多gpu集群以提高用于cuda程序的执行时间。在至少一个实施例中,gpgpu 3530包括主机接口3532以实现与主机处理器的连接。在至少一个实施例中,主机接口3532是pcie接口。在至少一个实施例中,主机接口3532可以是厂商专用的通信接口或通信结构。在至少一个实施例中,gpgpu 3530从主机处理器接收命令,并使用全局调度器3534将与那些命令相关联的执行线程分派给一组计算集群3536a-3536h。在至少一个实施例中,计算集群3536a-3536h共享高速缓存存储器3538。在至少一个实施例中,高速缓存存储器3538可以用作计算集群3536a-3536h内的高速缓存存储器的高级高速缓存。
334.在至少一个实施例中,gpgpu 3530包括经由一组存储器控制器3542a-3542b与计算集群3536a-3536h耦合的存储器3544a-3544b。在至少一个实施例中,存储器3544a-3544b可以包括各种类型的存储器设备,包括动态随机存取存储器(dram)或图形随机存取存储器,例如同步图形随机存取存储器(sgram),包括图形双倍数据速率(gddr)存储器。
335.在至少一个实施例中,计算集群3536a-3536h各自包括一组图形核心,诸如图35a的图形核心3500,其可以包括多种类型的整数和浮点逻辑单元,可以以各种精度执行计算操作,包括适合与cuda程序相关的计算。在至少一个实施例中,每个计算集群3536a-3536h中的浮点单元的至少一个子集可以配置为执行16位或32位浮点运算,而不同的浮点单元的子集可以配置为执行64位浮点运算。
336.在至少一个实施例中,gpgpu 3530的多个实例可以被配置为操作为计算集群。在至少一个实施例中,计算集群3536a-3536h可以实现用于同步和数据交换的任何技术上可行的通信技术。在至少一个实施例中,gpgpu 3530的多个实例通过主机接口3532进行通信。在至少一个实施例中,gpgpu 3530包括i/o集线器3539,其将gpgpu 3530与gpu链路3540耦合,使得能够直接连接至gpgpu 3530的其他的实例。在至少一个实施例中,gpu链路3540耦合到专用gpu到gpu桥接器,其使得能够在gpgpu 3530的多个实例之间进行通信和同步。在至少一个实施例中,gpu链路3540与高速互连耦合,以向其他gpgpu或并行处理器发送和接收数据。在至少一个实施例中,gpgpu 3530的多个实例位于单独的数据处理系统中,并经由可经由主机接口3532访问的网络设备进行通信。在至少一个实施例中,gpu链路3540可被配置为能够连接到主机处理器,附加或替代主机接口3532。在至少一个实施例中,gpgpu 3530可以配置为执行cuda程序。
337.图36a示出了根据至少一个实施例的并行处理器3600。在至少一个实施例中,并行处理器3600的各种组件可以使用一个或更多个集成电路设备来实现,例如可编程处理器、专用集成电路(asic)或fpga。
338.在至少一个实施例中,并行处理器3600包括并行处理单元3602。在至少一个实施例中,并行处理单元3602包括i/o单元3604,其使得能够与其他设备进行通信,包括并行处理单元3602的其他实例。在至少一个实施例中,i/o单元3604可以直接连接到其他设备。在至少一个实施例中,i/o单元3604通过使用集线器或交换机接口(例如,存储器集线器1405)与其他设备连接。在至少一个实施例中,存储器集线器1405与i/o单元3604之间的连接形成通信链路。在至少一个实施例中,i/o单元3604与主机接口3606和存储器交叉开关3616连
接,其中主机接口3606接收用于执行处理操作的命令,而存储器交叉开关3616接收用于执行存储器操作的命令。
339.在至少一个实施例中,当主机接口3606经由i/o单元3604接收命令缓冲区时,主机接口3606可以引导工作操作以执行那些命令到前端3608。在至少一个实施例中,前端3608与调度器3610耦合,调度器3610配置成将命令或其他工作项分配给处理阵列3612。在至少一个实施例中,调度器3610确保在将任务分配给处理阵列3612中的处理阵列3612之前,处理阵列3612被正确地配置并且处于有效状态。在至少一个实施例中,调度器3610通过在微控制器上执行的固件逻辑来实现。在至少一个实施例中,微控制器实现的调度器3610可配置成以粗粒度和细粒度执行复杂的调度和工作分配操作,从而实现对在处理阵列3612上执行的线程的快速抢占和环境切换。在至少一个实施例中,主机软件可以证明用于通过多个图形处理门铃之一在处理阵列3612上进行调度的工作负载。在至少一个实施例中,工作负载然后可以由包括调度器3610的微控制器内的调度器3610逻辑在处理阵列3612上自动分配。
340.在至少一个实施例中,处理阵列3612可以包括多达“n”个处理集群(例如,集群3614a、集群3614b到集群3614n)。在至少一个实施例中,处理阵列3612的每个集群3614a-3614n可以执行大量并发线程。在至少一个实施例中,调度器3610可以使用各种调度和/或工作分配算法将工作分配给处理阵列3612的集群3614a-3614n,其可以根据每种程序或计算类型产生的工作负载而变化。在至少一个实施例中,调度可以由调度器3610动态地处理,或者可以在配置为由处理阵列3612执行的程序逻辑的编译期间部分地由编译器逻辑来辅助。在至少一个实施例中,可将处理阵列3612的不同的集群3614a-3614n分配用于处理不同类型的程序或用于执行不同类型的计算。
341.在至少一个实施例中,处理阵列3612可以配置成执行各种类型的并行处理操作。在至少一个实施例中,处理阵列3612配置成执行通用并行计算操作。在至少一个实施例中,处理阵列3612可以包括执行处理任务的逻辑,该处理任务包括对视频和/或音频数据的过滤,执行建模操作,包括物理操作以及执行数据转换。
342.在至少一个实施例中,处理阵列3612配置成执行并行图形处理操作。在至少一个实施例中,处理阵列3612可以包括附加逻辑以支持这种图形处理操作的执行,包括但不限于执行纹理操作的纹理采样逻辑,以及镶嵌逻辑和其他顶点处理逻辑。在至少一个实施例中,处理阵列3612可以配置成执行与图形处理有关的着色器程序,例如但不限于顶点着色器、曲面细分着色器、几何着色器和像素着色器。在至少一个实施例中,并行处理单元3602可以经由i/o单元3604从系统存储器传送数据以进行处理。在至少一个实施例中,在处理期间,可以在处理期间将传送的数据存储到片上存储器(例如,并行处理器存储器3622),然后将其写回到系统存储器。
343.在至少一个实施例中,当并行处理单元3602用于执行图处理时,调度器3610可以配置成将处理工作负载划分为近似相等大小的任务,以更好地将图形处理操作分配给处理阵列3612的多个集群3614a-3614n。在至少一个实施例中,处理阵列3612的部分可以配置成执行不同类型的处理。在至少一个实施例中,第一部分可以配置成执行顶点着色和拓扑生成,第二部分可以配置成执行镶嵌和几何着色,并且第三部分可以配置成执行像素着色或其他屏幕空间操作,以生成用于显示的渲染图像。在至少一个实施例中,可以将由集群
3620n之间的业务流。
348.在至少一个实施例中,可以在单个插入卡上提供并行处理单元3602的多个实例,或者可以将多个插入卡互连。在至少一个实施例中,并行处理单元3602的不同实例可以配置成相互操作,即使不同实例具有不同数量的处理核心,不同数量的本地并行处理器存储器和/或其他配置差异。在至少一个实施例中,并行处理单元3602的一些实例可以包括相对于其他实例而言更高精度的浮点单元。在至少一个实施例中,结合并行处理单元3602或并行处理器3600的一个或更多个实例的系统可以以各种配置和形式因素来实现,包括但不限于台式机、膝上型计算机或手持式个人计算机、服务器、工作站、游戏机和/或嵌入式系统。
349.图36b示出了根据至少一个实施例的处理集群3694。在至少一个实施例中,处理集群3694被包括在并行处理单元内。在至少一个实施例中,处理集群3694是图36的处理集群3614a-3614n之一的实例。在至少一个实施例中,处理集群3694可以配置成并行执行许多线程,其中术语“线程”是指在特定的一组输入数据上执行的特定程序的实例。在至少一个实施例中,单指令多数据(simd)指令发布技术用于支持大量线程的并行执行而无需提供多个独立的指令单元。在至少一个实施例中,使用单指令多线程(simt)技术来支持并行执行大量一般同步的线程,这使用了公共指令单元,该公共指令单元配置成向每个处理集群3694内的一组处理引擎发出指令。
350.在至少一个实施例中,可以通过将处理任务分配给simt并行处理器的管线管理器3632来控制处理集群3694的操作。在至少一个实施例中,管线管理器3632从图36的调度器3610接收指令,通过图形多处理器3634和/或纹理单元3636管理这些指令的执行。在至少一个实施例中,图形多处理器3634是simt并行处理器的示例性实例。然而,在至少一个实施例中,处理集群3694内可以包括不同架构的各种类型的simt并行处理器。在至少一个实施例中,在处理集群3694内可以包括图形多处理器3634的一个或更多个实例。在至少一个实施例中,图形多处理器3634可以处理数据,并且数据交叉开关3640可以用于将处理后的数据分发到多个可能的目的(包括其他着色器单元)地之一。在至少一个实施例中,管线管理器3632可以通过指定要经由数据交叉开关3640分配的处理后的数据的目的地来促进处理后的数据的分配。
351.在至少一个实施例中,处理集群3694内的每个图形多处理器3634可以包括相同的一组功能执行逻辑(例如,算术逻辑单元、加载存储单元(lsu)等)。在至少一个实施例中,可以以管线方式配置功能执行逻辑,其中可以在先前的指令完成之前发出新的指令。在至少一个实施例中,功能执行逻辑支持多种运算,包括整数和浮点算术、比较操作、布尔运算、移位和各种代数函数的计算。在至少一个实施例中,可以利用相同的功能单元硬件来执行不同的操作,并且可以存在功能单元的任何组合。
352.在至少一个实施例中,传送到处理集群3694的指令构成线程。在至少一个实施例中,跨一组并行处理引擎执行的一组线程是线程组。在至少一个实施例中,线程组在不同的输入数据上执行程序。在至少一个实施例中,线程组内的每个线程可被分配给图形多处理器3634内的不同处理引擎。在至少一个实施例中,线程组可包括比图形多处理器3634内的多个处理引擎更少的线程。在至少一个实施例中,当线程组包括的线程数少于处理引擎的数量时,一个或更多个处理引擎在正在处理该线程组的循环期间可能是空闲的。在至少一个实施例中,线程组还可以包括比图形多处理器3634内的多个处理引擎更多的线程。在至
少一个实施例中,当线程组包括比图形多处理器3634内的处理引擎的数量更多的线程时,可以在连续的时钟周期内执行处理。在至少一个实施例中,可以在图形多处理器3634上同时执行多个线程组。
353.在至少一个实施例中,图形多处理器3634包括内部高速缓存存储器,以执行加载和存储操作。在至少一个实施例中,图形多处理器3634可以放弃内部高速缓存并使用处理集群3694内的高速缓存存储器(例如,l1高速缓存3648)。在至少一个实施例中,每个图形多处理器3634还可以访问分区单元(例如,图36a的分区单元3620a-3620n)内的l2高速缓存,这些分区单元在所有处理集群3694之间共享并且可以用于在线程之间传输数据。在至少一个实施例中,图形多处理器3634还可以访问片外全局存储器,其可以包括本地并行处理器存储器和/或系统存储器中的一个或更多个。在至少一个实施例中,并行处理单元3602外部的任何存储器都可以用作全局存储器。在至少一个实施例中,处理集群3694包括图形多处理器3634的多个实例,它们可以共享可以存储在l1高速缓存3648中的公共指令和数据。
354.在至少一个实施例中,每个处理集群3694可以包括配置成将虚拟地址映射为物理地址的mmu 3645。在至少一个实施例中,mmu 3645的一个或更多个实例可以驻留在图36的存储器接口3618内。在至少一个实施例中,mmu 3645包括一组页表条目(pte),其用于将虚拟地址映射到图块(谈论有关图块的更多信息)的物理地址以及可选地映射到高速缓存行索引。在至少一个实施例中,mmu 3645可以包括地址转换后备缓冲区(tlb)或可以驻留在图形多处理器3634或l1高速缓存3648或处理集群3694内的高速缓存。在至少一个实施例中,处理物理地址以分配表面数据访问局部性,以便在分区单元之间进行有效的请求交织。在至少一个实施例中,高速缓存行索引可以用于确定对高速缓存线的请求是命中还是未命中。
355.在至少一个实施例中,可以配置处理集群3694,使得每个图形多处理器3634耦合到纹理单元3636,以执行纹理映射操作,例如,可以涉及确定纹理样本位置、读取纹理数据以及过滤纹理数据。在至少一个实施例中,根据需要从内部纹理l1高速缓存(未示出)或从图形多处理器3634内的l1高速缓存中读取纹理数据,并从l2高速缓存、本地并行处理器存储器或系统存储器中获取纹理数据。在至少一个实施例中,每个图形多处理器3634将处理后的任务输出到数据交叉开关3640,以将处理后的任务提供给另一处理集群3694以进行进一步处理或将处理后的任务存储在l2高速缓存、本地并行处理器存储器、或经由存储器交叉开关3616的系统存储器中。在至少一个实施例中,光栅前操作单元(prerop)3642配置成从图形多处理器3634接收数据,将数据引导至rop单元,该rop单元可以与本文所述的分区单元(例如,图36的分区单元3620a-3620n)一起定位。在至少一个实施例中,prerop 3642单元可以执行用于颜色混合的优化、组织像素颜色数据以及执行地址转换。
356.图36c示出了根据至少一个实施例的图形多处理器3696。在至少一个实施例中,图形多处理器3696是图36b的图形多处理器3634。在至少一个实施例中,图形多处理器3696与处理集群3694的管线管理器3632耦合。在至少一个实施例中,图形多处理器3696具有执行管线,该执行管线包括但不限于指令高速缓存3652、指令单元3654、地址映射单元3656、寄存器文件3658、一个或更多个gpgpu核心3662和一个或更多个lsu3666。gpgpu核心3662和lsu 3666与高速缓存存储器3672和共享存储器3670通过存储器和高速缓存互连3668耦合。
357.在至少一个实施例中,指令高速缓存3652从管线管理器3632接收要执行的指令
流。在至少一个实施例中,将指令高速缓存在指令高速缓存3652中并将其分派以供指令单元3654执行。在一个实施例中,指令单元3654可以分派指令作为线程组(例如,线程束),将线程组的每个线程分配给gpgpu核心3662内的不同执行单元。在至少一个实施例中,指令可以通过在统一地址空间内指定地址来访问任何本地、共享或全局地址空间。在至少一个实施例中,地址映射单元3656可以用于将统一地址空间中的地址转换成可以由lsu 3666访问的不同的存储器地址。
358.在至少一个实施例中,寄存器文件3658为图形多处理器3696的功能单元提供了一组寄存器。在至少一个实施例中,寄存器文件3658为连接到图形多处理器3696的功能单元(例如,gpgpu核心3662、lsu 3666)的数据路径的操作数提供了临时存储。在至少一个实施例中,在每个功能单元之间划分寄存器文件3658,使得为每个功能单元分配寄存器文件3658的专用部分。在至少一个实施例中,寄存器文件3658在图形多处理器3696正在执行的不同线程组之间划分。
359.在至少一个实施例中,gpgpu核心3662可以各自包括用于执行图多处理器3696的指令的fpu和/或alu。gpgpu核心3662在架构上可以相似或架构可能有所不同。在至少一个实施例中,gpgpu核心3662的第一部分包括单精度fpu和整数alu,而gpgpu核心的第二部分包括双精度fpu。在至少一个实施例中,fpu可以实现用于浮点算法的ieee754-3608标准或启用可变精度浮点算法。在至少一个实施例中,图形多处理器3696可以另外包括一个或更多个固定功能或特殊功能单元,以执行特定功能,诸如复制矩形或像素混合操作。在至少一个实施例中,gpgpu核心3662中的一个或更多个也可以包括固定或特殊功能逻辑。
360.在至少一个实施例中,gpgpu核心3662包括能够对多组数据执行单个指令的simd逻辑。在至少一个实施例中,gpgpu核心3662可以物理地执行simd4、simd8和simd9指令,并且在逻辑上执行simd1、simd2和simd32指令。在至少一个实施例中,用于gpgpu核心的simd指令可以在编译时由着色器编译器生成,或者在执行针对单程序多数据(spmd)或simt架构编写和编译的程序时自动生成。在至少一个实施例中,可以通过单个simd指令来执行为simt执行模型配置的程序的多个线程。在至少一个实施例中,可以通过单个simd8逻辑单元并行执行执行相同或相似操作的八个simt线程。
361.在至少一个实施例中,存储器和高速缓存互连3668是将图形多处理器3696的每个功能单元连接到寄存器文件3658和共享存储器3670的互连网络。在至少一个实施例中,存储器和高速缓存互连3668是交叉开关互连,其允许lsu 3666在共享存储器3670和寄存器文件3658之间实现加载和存储操作。在至少一个实施例中,寄存器文件3658可以以与gpgpu核心3662相同的频率操作,从而在gpgpu核心3662和寄存器文件3658之间进行数据传输的延迟非常低。在至少一个实施例中,共享存储器3670可以用于启用在图形多处理器3696内的功能单元上执行的线程之间的通信。在至少一个实施例中,在至少一个实施例中,高速缓存存储器3672可以用作数据高速缓存,以高速缓存在功能单元和纹理单元3636之间通信的纹理数据。在至少一个实施例中,共享存储器3670也可以用作程序管理的高速缓存。在至少一个实施例中,除了存储在高速缓存存储器3672中的自动高速缓存的数据之外,在gpgpu核心3662上执行的线程还可以以编程方式将数据存储在共享存储器中。
362.在至少一个实施例中,如本文所述的并行处理器或gpgpu通信地耦合到主机/处理器核心,以加速图形操作、机器学习操作、图案分析操作以及各种通用gpu(gpgpu)功能。在
至少一个实施例中,gpu可以通过总线或其他互连(例如,诸如pcie或nvlink的高速互连)通信地耦合到主机处理器/核心。在至少一个实施例中,gpu可以与核心集成在相同的封装或芯片上,并通过内部处理器总线/互连(即,封装或芯片的内部)通信地耦合到核心。在至少一个实施例中,不管gpu连接的方式如何,处理器核心可以以wd包含的命令/指令序列的形式向gpu分配工作。在至少一个实施例中,gpu然后使用专用电路/逻辑来有效地处理这些命令/指令。
363.通用计算
364.以下各图阐述但不限于在通用计算中用来实现至少一个实施例的示例性软件配置。
365.图37示出了根据至少一个实施例的编程平台的软件栈。在至少一个实施例中,编程平台是用于利用计算系统上的硬件来加速计算任务的平台。在至少一个实施例中,软件开发人员可以通过库、编译器指令和/或对编程语言的扩展来访问编程平台。在至少一个实施例中,编程平台可以是但不限于cuda,radeon开放计算平台(“rocm”),opencl(由khronos group开发的opencl
tm
),sycl或intel one api。
366.在至少一个实施例中,编程平台的软件栈3700为应用程序3701提供执行环境。在至少一个实施例中,应用程序3701可以包括能够在软件栈3700上启动的任何计算机软件。在至少一个实施例中,应用程序3701可以包括但不限于人工智能(“ai”)/机器学习(“ml”)应用程序,高性能计算(“hpc”)应用程序,虚拟桌面基础架构(“vdi”)或数据中心工作负载。
367.在至少一个实施例中,应用程序3701和软件栈3700在硬件3707上运行。在至少一个实施例中,硬件3707可以包括一个或更多个gpu,cpu,fpga,ai引擎和/或支持编程平台的其他类型的计算设备。在至少一个实施例中,例如采用cuda,软件栈3700可以是厂商专用的,并且仅与来自特定厂商的设备兼容。在至少一个实施例中,例如在采用opencl中,软件栈3700可以与来自不同供应商的设备一起使用。在至少一个实施例中,硬件3707包括连接到一个或更多个设备的主机,该设备可经由应用程序编程接口(api)调用被访问以执行计算任务。在至少一个实施例中,与硬件3707内的主机相比,其可以包括但不限于cpu(但还可以包括计算设备)及其存储器,硬件3707内的设备可以包括但不限于gpu,fpga,ai引擎或其他计算设备(但还可以包括cpu)及其存储器。
368.在至少一个实施例中,编程平台的软件栈3700包括但不限于多个库3703,运行时(runtime)3705和设备内核驱动器3706。在至少一个实施例中,库3703中的每个库可以包括可以由计算机程序使用并在软件开发期间利用的数据和编程代码。在至少一个实施例中,库3703可以包括但不限于预写的代码和子例程,类,值,类型规范,配置数据,文档,帮助数据和/或消息模板。在至少一个实施例中,库3703包括被优化用于在一种或更多种类型的设备上执行的函数。在至少一个实施例中,库3703可以包括但不限于用于在设备上执行数学、深度学习和/或其他类型的运算的函数。在至少一个实施例中,库3803与对应的api 3802相关联,api 3802可包括一个或更多个api,其暴露在库3803中实现的函数。
369.在至少一个实施例中,将应用程序3701编写为源代码,该源代码被编译成可执行代码,如下面结合图42更详细讨论的。在至少一个实施例中,应用程序3701的可执行代码可以至少部分地在由软件栈3700提供的执行环境上运行。在至少一个实施例中,在应用程序3701的执行期间,可以得到需要在设备(与主机相比)上运行的代码。在这种情况下,在至少
一个实施例中,可以调用运行时3705以在设备上加载和启动必需的代码。在至少一个实施例中,运行时3705可以包括能够支持应用程序3701的执行的任何技术上可行的运行时系统。
370.在至少一个实施例中,运行时3705被实现为与对应的api(其被示为api 3704)相关联的一个或更多个运行时库。在至少一个实施例中,一个或更多个这样的运行时库可以包括但不限于用于存储器管理,执行控制,设备管理,错误处理和/或同步等等的函数。在至少一个实施例中,存储器管理函数可以包括但不限于用于分配、解除分配和复制设备存储器以及在主机存储器和设备存储器之间传输数据的函数。在至少一个实施例中,执行控制函数可以包括但不限于在设备上启动函数(当函数是可从主机调用的全局函数时,有时称为“内核”)的函数,和用于在运行时库为要在设备上执行的给定函数维护的缓冲区中设置属性值的函数。
371.在至少一个实施例中,可以任何技术上可行的方式来实现运行时库和相应的api 3704。在至少一个实施例中,一个(或任意数量的)api可以公开用于设备的细粒度控制的低级函数集,而另一(或任意数量的)api可以公开这样的较高级的函数集。在至少一个实施例中,可以在低级api之上构建高级运行时api。在至少一个实施例中,一个或更多个运行时api可以是在与语言无关的运行时api之上分层的特定于语言的api。
372.在至少一个实施例中,设备内核驱动器3706被配置为促进与底层设备的通信。在至少一个实施例中,设备内核驱动器3706可以提供诸如api3704之类的api和/或其他软件所依赖的低级函数。在至少一个实施例中,设备内核驱动器3706可以被配置为在运行时将中间表示(“ir”)代码编译成二进制代码。在至少一个实施例中,对于cuda,设备内核驱动器3706可以在运行时将非硬件专用的并行线程执行(“ptx”)ir代码编译为用于特定目标设备的二进制代码(高速缓存已编译的二进制代码),其有时也称为“最终”代码。在至少一个实施例中,这样做可以允许最终代码在目标设备上运行,而当源代码最初被编译为ptx代码时,该目标设备可能不存在。备选地,在至少一个实施例中,设备源代码可以离线地编译成二进制代码,而不需要设备内核驱动器3706在运行时编译ir代码。
373.图38示出了根据至少一个实施例的图37的软件栈3700的cuda实现。在至少一个实施例中,可在其上启动应用程序3801的cuda软件栈3800包括cuda库3803,cuda运行时3805,cuda驱动器3807和设备内核驱动器3808。在至少一个实施例中,cuda软件栈3800在硬件3809上执行,该硬件3809可以包括支持cuda的gpu,其由加利福尼亚州圣克拉拉市的nvidia公司开发。
374.在至少一个实施例中,应用程序3801、cuda运行时3805和设备内核驱动器3808可以分别执行与应用程序3701、运行时3705和设备内核驱动器3706类似的功能,以上结合图37对其进行了描述。在至少一个实施例中,cuda驱动器3807包括实现cuda驱动器api 3806的库(libcuda.so)。在至少一个实施例中,类似于由cuda运行时库(cudart)实现的cuda运行时api 3804,cuda驱动器api 3806可以公开但不限于用于存储器管理、执行控制、设备管理、错误处理、同步和/或图形互操作性等的函数。在至少一个实施例中,cuda驱动器api 3806与cuda运行时api 3804的不同之处在于,cuda运行时api 3804通过提供隐式初始化、上下文(类似于进程)管理和模块(类似于动态加载的库)管理来简化设备代码管理。与高级cuda运行时api 3804相反,在至少一个实施例中,cuda驱动器api 3806是提供对设备的更
细粒度控制的低级api,特别是关于上下文和模块加载。在至少一个实施例中,cuda驱动器api 3806可以公开没有由cuda运行时api 3804公开的用于上下文管理的函数。在至少一个实施例中,cuda驱动器api 3806也与语言无关,并且除了支持cuda运行时api3804之外,还支持例如opencl。此外,在至少一个实施例中,包括cuda运行时3805在内的开发库可被视为与驱动器组件分离,包括用户模式的cuda驱动器3807和内核模式的设备驱动器3808(有时也称为“显示”驱动器)。
375.在至少一个实施例中,cuda库3803可以包括但不限于数学库,深度学习库,并行算法库和/或信号/图像/视频处理库,并行计算应用程序(例如应用程序3801)可以利用这些库。在至少一个实施例中,cuda库3803可包括数学库,例如cublas库,其是用于执行线性代数运算的基本线性代数子程序(“blas”)的实现;用于计算快速傅立叶变换(“fft”)的cufft库,以及用于生成随机数的curand库等。在至少一个实施例中,cuda库3803可以包括深度学习库,诸如用于深度神经网络的基元的cudnn库和用于高性能深度学习推理的tensorrt平台等等。
376.图39示出了根据至少一个实施例的图37的软件栈3700的rocm实现。在至少一个实施例中,可在其上启动应用程序3901的rocm软件栈3900包括语言运行时3903,系统运行时3905,thunk 3907,rocm内核驱动器3908和设备内核驱动器。在至少一个实施例中,rocm软件栈3900在硬件3909上执行,硬件3909可以包括支持rocm的gpu,其由加利福尼亚州圣克拉拉市的amd公司开发。
377.在至少一个实施例中,应用程序3901可以执行与以上结合图37讨论的应用程序3701类似的功能。另外,在至少一个实施例中,语言运行时3903和系统运行时3905可以执行与以上结合图37讨论的运行时3705类似的功能。在至少一个实施例中,语言运行时3903和系统运行时3905的不同之处在于,系统运行时3905是实现rocr系统运行时api 3904并利用异构系统架构(“has”)运行时api的语言无关运行时。在至少一个实施例中,has运行时api是一种瘦用户模式api,它公开接口以供访问和与amd gpu交互,包括用于存储器管理、通过架构分派内核的执行控制、错误处理、系统和代理信息以及运行时初始化和关闭等的函数。在至少一个实施例中,与系统运行时3905相比,语言运行时3903是rocr系统运行时api 3904之上分层的特定于语言的运行时api 3902的实现。在至少一个实施例中,语言运行时api可以包括但不限于可移植异构计算接口(“hip”)语言运行时api,异构计算编译器(“hcc”)语言运行时api或opencl api等等。特别是,hip语言是c 编程语言的扩展,具有cuda机制的功能相似版本,并且在至少一个实施例中,hip语言运行时api包括与以上结合图38讨论的cuda运行时api 3804相似的函数,例如用于存储器管理、执行控制、设备管理、错误处理和同步等的函数。
378.在至少一个实施例中,thunk(roct)3907是可用于与底层rocm驱动器3908交互的接口。在至少一个实施例中,rocm驱动器3908是rock驱动器,其是amdgpu驱动器和has内核驱动器(amdkfd)的组合。在至少一个实施例中,amdgpu驱动器是由amd开发的用于gpu的设备内核驱动器,其执行与以上结合图37讨论的设备内核驱动器3706类似的功能。在至少一个实施例中,has内核驱动器是允许不同类型的处理器经由硬件特征更有效地共享系统资源的驱动器。
379.在至少一个实施例中,各种库(未示出)可以被包括在语言运行时3903上方的rocm
软件栈3900中,并且提供与以上结合图38讨论的cuda库3803相似的功能。在至少一个实施例中,各种库可以包括但不限于数学、深度学习和/或其他库,例如实现与cuda cublas类似的函数的hipblas库,类似于cuda cufft用于计算fft的rocfft库等。
380.图40示出了根据至少一个实施例的图37的软件栈3700的opencl实现。在至少一个实施例中,可以在其上启动应用程序4001的opencl软件栈4000包括opencl框架4005,opencl运行时4006和驱动器4007。在至少一个实施例中,opencl软件栈4000在不是特定于供应商的硬件3809上执行。在至少一个实施例中,由于由不同厂商开发的设备支持opencl,因此可能需要特定的opencl驱动器才能与来自此类厂商的硬件进行互操作。
381.在至少一个实施例中,应用程序4001,opencl运行时4006,设备内核驱动器4007和硬件4008可以分别执行与上面结合图37讨论的应用程序3701、运行时3705、设备内核驱动器3706和硬件3707类似的功能。在至少一个实施例中,应用程序4001还包括具有将在设备上执行的代码的opencl内核4002。
382.在至少一个实施例中,opencl定义了一种“平台”,其允许主机控制连接到该主机的设备。在至少一个实施例中,opencl框架提供平台层api和运行时api,示出为平台api 4003和运行时api 4005。在至少一个实施例中,运行时api 4005使用上下文来管理设备上内核的执行。在至少一个实施例中,每个标识的设备可以与各自的上下文相关联,运行时api4005可以使用该上下文来管理该设备的命令队列、程序对象和内核对象、共享存储器对象等。在至少一个实施例中,平台api 4003公开了允许设备上下文用于选择和初始化设备,经由命令队列将工作提交给设备,以及使得能够进行来自和去往设备的数据传输等的函数。另外,在至少一个实施例中,opencl框架提供各种内置函数(未示出),包括数学函数、关系函数和图像处理函数等。
383.在至少一个实施例中,编译器4004也被包括在opencl框架4005中。在至少一个实施例中,源代码可以在执行应用程序之前被离线编译或者在执行应用程序期间被在线编译。与cuda和rocm相反,至少一个实施例中的opencl应用程序可以由编译器4004在线编译,编译器4004被包括以代表可以用于将源代码和/或ir代码(例如标准可移植中间表示(“spir-v”)代码)编译为二进制代码的任意数量的编译器。可替代地,在至少一个实施例中,可以在执行这样的应用程序之前离线编译opencl应用程序。
384.图41示出了根据至少一个实施例的由编程平台支持的软件。在至少一个实施例中,编程平台4104被配置为支持应用程序4100可以依赖的各种编程模型4103,中间件和/或库4102以及框架4101。在至少一个实施例中,应用程序4100可以是使用例如深度学习框架(在至少一个实施例中,mxnet,pytorch或tensorflow)实现的ai/ml应用,其可以依赖于诸如cudnn,nvidia collective communications library(“nccl”)”和/或nvidia开发人员数据加载库(“dali”)cuda库之类的库,以在底层硬件上提供加速的计算。
385.在至少一个实施例中,编程平台4104可以是以上分别结合图33、图34和图40描述的cuda、rocm或opencl平台之一。在至少一个实施例中,编程平台4104支持多个编程模型4103,其是底层计算系统的抽象,其允许算法和数据结构的表达。在至少一个实施例中,编程模型4103可以暴露底层硬件的特征以便改善性能。在至少一个实施例中,编程模型4103可以包括但不限于cuda,hip,opencl,c 加速大规模并行性(“c amp”),开放多处理(“openmp”),开放加速器(“openacc”)和/或vulcan计算(vulcan compute)。
386.在至少一个实施例中,库和/或中间件4102提供编程模型4104的抽象的实现。在至少一个实施例中,这样的库包括可由计算机程序使用并在软件开发期间利用的数据和编程代码。在至少一个实施例中,除了可以从编程平台4104获得的那些之外,这样的中间件还包括向应用程序提供服务的软件。在至少一个实施例中,库和/或中间件4102可以包括但不限于cublas、cufft、curand和其他cuda库,或rocblas、rocfft、rocrand和其他rocm库。另外,在至少一个实施例中,库和/或中间件4102可以包括nccl和rocm通信集合库(“rccl”)库,其提供用于gpu的通信例程,用于深度学习加速的miopen库和/或用于线性代数、矩阵和向量运算、几何变换、数值求解器以及相关算法的本征库。
387.在至少一个实施例中,应用程序框架4101依赖于库和/或中间件4102。在至少一个实施例中,每个应用程序框架4101是用于实现应用软件的标准结构的软件框架。在至少一个实施例中,可以使用框架(诸如caffe,caffe2,tensorflow,keras,pytorch或mxnet深度学习框架)来实现ai/ml应用。
388.图42示出了根据至少一个实施例的编译代码以在图37-40的编程平台之一上执行。在至少一个实施例中,编译器4201接收源代码4200,其包括主机代码以及设备代码两者。在至少一个实施例中,编译器4201被配置为将源代码4200转换为用于在主机上执行的主机可执行代码4202以及用于在设备上执行的设备可执行代码4203。在至少一个实施例中,源代码4200可以在执行应用程序之前离线编译,或者在执行应用程序期间在线编译。
389.在至少一个实施例中,源代码4200可以包括编译器4201支持的任何编程语言的代码,例如c 、c、fortran等。在至少一个实施例中,源代码4200可以包括在单源(single-source)文件中,其具有主机代码和设备代码的混合,并在其中指示了设备代码的位置。在至少一个实施例中,单源文件可以是包括cuda代码的.cu文件或包括hip代码的.hip.cpp文件。备选地,在至少一个实施例中,源代码4200可以包括多个源代码文件,而不是单源文件,在该单源文件中主机代码和设备代码是分开的。
390.在至少一个实施例中,编译器4201被配置为将源代码4200编译成用于在主机上执行的主机可执行代码4202和用于在设备上执行的设备可执行代码4203。在至少一个实施例中,编译器4201执行操作,包括将源代码4200解析为抽象系统树(ast),执行优化以及生成可执行代码。在源代码4200包括单源文件的至少一个实施例中,编译器4201可以将设备代码与主机代码在这种单源文件中分开,将设备代码和主机代码分别编译成设备可执行代码4203和主机可执行代码4202,以及将设备可执行代码4203和主机可执行代码4202在单个文件中链接到一起,如下面关于图26更详细讨论的。
391.在至少一个实施例中,主机可执行代码4202和设备可执行代码4203可以是任何合适的格式,例如二进制代码和/或ir代码。在cuda的情况下,在至少一个实施例中,主机可执行代码4202可以包括本地对象代码,而设备可执行代码4203可以包括ptx中间表示的代码。在至少一个实施例中,在rocm的情况下,主机可执行代码4202和设备可执行代码4203都可以包括目标二进制代码。
392.其他变型在本公开的精神内。因此,尽管公开的技术易于进行各种修改和替代配置,但是某些示出的其实施例在附图中示出并且已经在上面进行了详细描述。然而,应理解,无意将公开内容限制为所公开的一种或更多种特定形式,而是相反,其意图是涵盖落入如所附权利要求书所定义的本公开内容的精神和范围内的所有修改、替代配置和等同物。
393.除非另有说明或显然与上下文矛盾,否则在描述所公开的实施例的上下文中(特别是在所附权利要求的上下文中),术语“一”和“一个”和“该”以及类似指代的使用应被解释为涵盖单数和复数,而不是作为术语的定义。除非另有说明,否则术语“包括”、“具有”、“包含”和“含有”应被解释为开放式术语(意味着“包括但不限于”)。术语“连接”(在未经修改时指的是物理连接)应解释为部分或全部包含在内、附接到或连接在一起,即使有某些介入。除非本文另外指出,否则本文中对数值范围的引用仅旨在用作分别指代落入该范围内的每个单独值的简写方法,并且每个单独值都被并入说明书中,就如同其在本文中被单独叙述一样。在至少一个实施例中,除非另外指出或与上下文矛盾,否则术语“集”(例如“项目集”)或“子集”的使用应解释为包括一个或更多个成员的非空集合。此外,除非另外指出或与上下文矛盾,否则术语相应集的“子集”不一定表示对应集的适当子集,而是子集和对应集可以相等。
394.除非以其他方式明确指出或与上下文明显矛盾,否则诸如“a,b和c中的至少一个”或“a,b与c中的至少一个”形式的短语之类的连接语在上下文中理解为通常用来表示项目、条款等,其可以是a或b或c,也可以是a和b和c集的任何非空子集。在具有三个成员的集的至少一个实施例中,连接短语“a,b和c中的至少一个”和“a,b与c中的至少一个”是指以下任意集:{a},{b},{c},{a,b},{a,c},{b,c},{a,b,c}。因此,这种连接语言通常不旨在暗示某些实施例要求存在a中的至少一个,b中的至少一个和c中的至少一个。另外,除非另有说明或与上下文矛盾,否则术语“多个”表示复数的状态(例如,“多个项目”表示多个项目)。在至少一个实施例中,多个项目中项目的数量至少为两个,但如果明确指示或通过上下文指示,则可以更多。此外,除非另有说明或从上下文中可以清楚得知,否则短语“基于”是指“至少部分基于”而不是“仅基于”。
395.除非本文另外指出或与上下文明显矛盾,否则本文描述的过程的操作可以任何合适的顺序执行。在至少一个实施例中,诸如本文所述的那些过程(或其变形和/或其组合)之类的过程在配置有可执行指令的一个或更多个计算机系统的控制下执行,并且被实现为代码(例如,可执行指令,一个或更多个计算机程序或一个或更多个应用程序),该代码通过硬件或其组合在一个或更多个处理器上共同执行。在至少一个实施例中,代码以计算机程序的形式存储在计算机可读存储介质上,在至少一个实施例中,该计算机程序包括可由一个或更多个处理器执行的多个指令。在至少一个实施例中,计算机可读存储介质是非暂时性计算机可读存储介质,其排除了暂时性信号(例如,传播的瞬态电或电磁传输),但包括非暂时性数据存储电路(例如,缓冲区、高速缓存和队列)。在至少一个实施例中,代码(例如,可执行代码或源代码)被存储在其上存储有可执行指令的一组一个或更多个非暂时性计算机可读存储介质(或用于存储可执行指令的其他存储器)上,该可执行指令在由计算机系统的一个或更多个处理器执行时(即,作为被执行的结果),使得计算机系统执行本文所述的操作。在至少一个实施例中,一组非暂时性计算机可读存储介质包括多个非暂时性计算机可读存储介质,并且多个非暂时性计算机可读存储介质中的个体非暂时性存储介质中的一个或更多个缺少全部代码,而是多个非暂时性计算机可读存储介质共同存储全部代码。在至少一个实施例中,可执行指令被执行,以使得不同的指令由不同的处理器执行,在至少一个实施例中,非暂时性计算机可读存储介质存储指令,并且主中央处理单元(“cpu”)执行一些指令,而图形处理单元(“gpu”)执行其他指令。在至少一个实施例中,计算机系统的不同组
件具有单独的处理器,并且不同的处理器执行指令的不同子集。
396.因此,在至少一个实施例中,计算机系统被配置为实现单独地或共同地执行本文所述的过程的操作的一个或更多个服务,并且这样的计算机系统被配置有使能实施操作的适用的硬件和/或软件。此外,实现本公开的至少一个实施例的计算机系统是单个设备,并且在另一实施例中是分布式计算机系统,其包括以不同方式操作的多个设备,使得分布式计算机系统执行本文所述的操作,并且使得单个设备不执行所有操作。
397.本文提供的任何和所有至少一个实施例或示例性语言(例如,“诸如”)的使用仅旨在更好地阐明本公开的实施例,并且不对公开的范围构成限制,除非另有要求。说明书中的任何语言都不应被解释为表示任何未要求保护的要素对于实践公开内容是必不可少的。
398.本文引用的所有参考文献,包括出版物、专利申请和专利,均通过引用并入本文,其程度就如同每个参考文献被单独且具体地指示为以引用的方式并入本文并且其全部内容在本文中阐述一样。
399.在说明书和权利要求中,可以使用术语“耦合”和“连接”以及它们的派生词。应当理解,这些术语可能不旨在作为彼此的同义词。相反,在至少一个实施例中的一个,“连接”或“耦合”可用于指示两个或更多个元件彼此直接或间接物理或电接触。“耦合”也可能意味着两个或更多个元素彼此不直接接触,但仍彼此协作或交互。
400.除非另有明确说明,否则可以理解,在整个说明书中,诸如“处理”、“计算”、“计算”、“确定”等之类的术语,是指计算机或计算系统或类似的电子计算设备的动作和/或过程,其将计算系统的寄存器和/或存储器中表示为物理量(例如电子)的数据处理和/或转换为类似表示为计算系统的存储器、寄存器或其他此类信息存储、传输或显示设备中的物理量的其他数据。
401.以类似的方式,术语“处理器”可以指处理来自寄存器和/或存储器的电子数据并将该电子数据转换成可以存储在寄存器和/或存储器中的其他电子数据的任何设备或存储器的一部分。作为非限制性至少一个实施例中的一个,“处理器”可以是cpu或gpu。“计算平台”可以包括一个或更多个处理器。如本文所使用的,在至少一个实施例中,“软件”进程可以包括随时间执行工作的软件和/或硬件实体,诸如任务、线程和智能代理。同样,每个过程可以指代多个过程,以连续地或间歇地顺序地或并行地执行指令。术语“系统”和“方法”在本文中可以互换使用,只要系统可以体现一种或更多种方法,并且方法可以被认为是系统。
402.在本文件中,可以参考获得、获取、接收或将模拟或数字数据输入子系统、计算机系统或计算机实现的机器中。在至少一个实施例中,可以通过多种方式来完成获得、获取、接收或输入模拟和数字数据的过程,例如通过接收作为函数调用或对应用程序编程接口的调用的参数的数据。在一些实现方式中,可以通过经由串行或并行接口传输数据来完成获得、获取、接收或输入模拟或数字数据的过程。在另一实现方式中,可以通过经由计算机网络将数据从提供实体传输到获取实体来完成获得、获取、接收或输入模拟或数字数据的过程。也可以参考提供、输出、传送、发送或呈现模拟或数字数据。在各种示例中,提供、输出、传送、发送或呈现模拟或数字数据的过程可以通过将数据作为函数调用的输入或输出参数、应用程序编程接口或进程间通信机制的参数进行传输来实现。
403.尽管上面的讨论阐述了所描述的技术的至少一个实施例中的一个实现,但是其他架构可以用于实现所描述的功能,并且旨在落入本公开的范围内。此外,尽管出于讨论的目
的在上面定义了具体的职责分配,但是根据情况,可以以不同的方式分配和划分各种功能和职责。
404.此外,尽管已经用特定于结构特征和/或方法动作的语言描述了主题,但是应当理解,所附权利要求书所要求保护的主题不必限于所描述的特定特征或动作。而是,公开了特定的特征和动作作为实现权利要求的示例性形式。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献