一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

服务器的散热方法及装置、系统和计算机可读存储介质与流程

2023-01-14 12:34:57 来源:中国专利 TAG:


1.本技术实施例涉及计算设备技术领域,具体而言,涉及一种服务器的散热方法及装置、系统和计算机可读存储介质。


背景技术:

2.在云计算时代,海量数据传输、存储需要大量的存储设备,这些大量的存储设备在数据高速传输的过程中会产生大量的功耗,例如ssd装置在数据高速传输中瞬时电流能达到18a,芯片所产生的温度能够达到80℃。
3.固态硬盘现有传统的散热场景,主要依靠服务器内部涵道,在盘片温度过高时,启动或增大涵道的转速,通过加强风流动的速度,增加盘片散热,全局调控所有盘片温度。这种通过风冷进行被动式散热的方法,目前至少存在以下问题:由于结构设计,散热涵道距离ssd本体会有一段距离,降低了散热能效。
4.针对上述问题,目前尚无有效的解决方案。


技术实现要素:

5.本技术实施例提供了一种服务器的散热方法及装置、系统和计算机可读存储介质,以至少解决相关技术中散热能效较低的问题。
6.根据本技术的一个实施例,提供了一种服务器的散热方法,包括:获取服务器机箱内的环境状态,其中,环境状态至少包括:服务器机箱内的环境温度;在环境温度状态处于目标状态的情况下,获取服务器机箱内各个硬盘的温度,其中,目标状态用于指示服务器机箱内的环境温度大于第一温度阈值的持续时长大于第一时间阈值;依据各个硬盘的温度从各个硬盘中确定温度大于第二温度阈值的第一目标硬盘;向第一目标硬盘发送第一控制指令,其中,第一控制指令用于控制第一目标硬盘进行降温操作。
7.在一个示例性实施例中,各个硬盘通过机箱内部的转接板与第一目标硬盘连接,获取服务器机箱内各个硬盘的温度,包括以下之一:通过转接板上设置的串行总线通道向各个硬盘的主控模块发送第一查询指令;接收各个硬盘的主控模块依据第一查询指令发送的温度;通过转接板上设置的串行总线通道接收各个硬盘的主控模块定时发送的温度;在一个示例性实施例中,依据各个硬盘的温度从各个硬盘中确定温度大于第二温度阈值的第一目标硬盘,包括:从各个硬盘中确定温度大于第二温度阈值的候选硬盘集合;确定候选硬盘集合中上一次统计时刻的温度,其中,上一次统计时刻为主控模块上一个定时周期内发送硬盘的温度的发送时刻或者主控模块依据上一次接收到的第一查询指令发送硬盘的温度的发送时刻;从候选硬盘集合中确定上一次统计时刻的温度大于第二温度阈值的硬盘,并将上一次统计时刻的温度大于第二温度阈值的硬盘作为第一目标硬盘。
8.在一个示例性实施例中,向第一目标硬盘发送第一控制指令之后,方法还包括:从第一控制指令的发送时刻开始计时,并在计时时长到达预设时长后,向第一目标硬盘发送第二查询指令;接收第一目标硬盘发送的与第二查询指令对应的温度;在与第二查询指令
对应的温度仍然大于第二温度阈值的情况下,从第一目标硬盘的周边硬盘中确定第二目标硬盘;向第二目标硬盘发送第二控制指令,其中,第二控制指令用于控制第二目标硬盘执行降温操作。
9.在一个示例性实施例中,从第一目标硬盘的周边硬盘中确定第二目标硬盘之前,方法还包括:确定第一目标硬盘所对应的散热涵道;确定散热涵道的风冷覆盖范围内的多个硬盘,将风冷覆盖范围内的多个硬盘作为周边硬盘。
10.在一个示例性实施例中,从第一目标硬盘的周边硬盘中确定第二目标硬盘包括:从第一目标硬盘的周边硬盘中确定温度大于第三温度阈值的硬盘,其中,第三温度阈值大于第一温度阈值且小于第二温度阈值。
11.在一个示例性实施例中,获取服务器机箱内各个硬盘的温度之前,方法还包括:确定服务器机箱内的散热涵道是否全部开启,在服务器机箱内的散热涵道全部开启的情况下,触发获取服务器机箱内各个硬盘的温度。
12.在服务器机箱内的散热涵道仅有部分开启的情况下,控制服务器机箱内的散热涵道全部开启;在服务器机箱内的散热涵道全部开启且环境温度状态处于目标状态的情况下,触发获取服务器机箱内各个硬盘的温度。
13.根据本技术的另一个实施例,提供了一种服务器的散热方法,包括:获取服务器机箱内目标硬盘的温度;在目标硬盘的温度大于第四温度阈值的情况下,向服务器机箱内的控制模块发送第三控制指令,其中,第三控制指令用于控制服务器机箱内的散热涵道执行全局降温操作。
14.在一个示例性实施例中,向服务器机箱内的控制模块发送第三控制指令之前,方法还包括:确定目标硬盘的温度大于第四温度阈值的持续时长;在持续时长大于指定时长的情况下,触发向控制模块发送第三控制指令。
15.在一个示例性实施例中,向服务器机箱内的控制模块发送第三控制指令之后,方法还包括:持续检测目标硬盘的温度,并在目标硬盘的温度大于第四温度阈值的持续时长大于第二持续时长的情况下,向控制模块发送通知信息。
16.在一个示例性实施例中,方法还包括:控制模块在接收到通知信息后,确定目标硬盘的周边硬盘;控制模块向周边硬盘发送用于控制周边硬盘进行降温操作的第四控制指令。
17.在一个示例性实施例中,确定目标硬盘的周边硬盘,包括:确定目标硬盘所对应的散热涵道;确定散热涵道的风冷覆盖范围内的多个硬盘,将风冷覆盖范围内的多个硬盘作为周边硬盘。
18.在一个示例性实施例中,获取服务器机箱内目标硬盘的温度之前,方法还包括:确定目标硬盘的降温装置是否已经开启,并在目标硬盘的降温装置开启的情况下,确定降温装置的降温等级;在降温等级为最高等级的情况下,触发向服务器机箱内的控制模块发送第三控制指令。
19.在一个示例性实施例中,向服务器机箱内的控制模块发送第三控制指令之后,方法还包括:控制模块统计服务器机箱内硬盘的温度大于第二温度阈值的硬盘数量比例;在硬盘数量比例大于预设比例的情况下,控制模块控制服务器机箱内的全部涵道开启,以执行降温操作。
20.根据本技术的又一个实施例,提供了一种服务器的散热装置,包括:第一获取模块,用于获取服务器机箱内的环境状态,其中,环境状态至少包括:服务器机箱内的环境温度;第二获取模块,用于在环境温度状态处于目标状态的情况下,获取服务器机箱内各个硬盘的温度,其中,目标状态用于指示服务器机箱内的环境温度大于第一温度阈值的持续时长大于第一时间阈值;确定模块,用于依据各个硬盘的温度从各个硬盘中确定温度大于第二温度阈值的第一目标硬盘;发送模块,用于向第一目标硬盘发送第一控制指令,其中,第一控制指令用于控制第一目标硬盘进行降温操作。
21.根据本技术的再一个实施例,提供了一种服务器的散热系统,包括:目标硬盘的第一控制模块、用于控制服务器机箱内的散热涵道开闭的第二控制模块,转接板,其中,第一控制模块和第二控制模块通过转接板连接,第二控制模块,用于执行以上的服务器的散热方法;第一控制模块,用于执行以上的服务器的散热方法。
22.在一个示例性实施例中,第一控制模块和第二控制模块通过设置在转接板上的串行数据总线连接。
23.根据本技术的再一个实施例,提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,其中,计算机程序被处理器执行时实现以上的服务器的散热方法。
24.根据本技术的再一个实施例,提供了一种电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以上的服务器的散热方法。
25.通过本技术,由于在服务器内部的环境状态为目标状态的情况下,可以根据机箱内各个硬盘的温度确定第一目标硬盘,从而对目标硬盘进行精准降温。另外,服务器内的目标硬盘的温度大于第四温度阈值的情况下,向服务器内的控制模块发送用于控制散热涵道执行全局降温操作的控制指令。因此,可以实现服务器机箱内温度的全局动态调控与硬盘自调控相结合的散热方法,解决由于服务器内散热涵道距离ssd本体会有一段距离,降低了散热能效的问题,从而提高服务器的散热效率。
附图说明
26.图1是本技术实施例的一种计算机设备的硬件结构框图;图2是根据本技术实施例的一种服务器的散热方法的流程图;图3是根据本技术实施例的硬件架构示意图;图4是根据本技术实施例的不同固态硬盘的电气连接结构示意图;图5是根据本技术实施例的一种服务器cpu主导的散热方法的流程图;图6是根据本技术实施例的一种服务器的散热装置的结构框图;图7是根据本技术实施例的另一种服务器的散热方法的流程图;图8是根据本技术实施例的一种硬盘主导的散热方法的流程图。
具体实施方式
27.下文中将参考附图并结合实施例来详细说明本技术的实施例。
28.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第
二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
29.为了更好地理解本技术实施例,以下将本技术实施例中涉及的技术术语解释如下:固态硬盘(solid state drives),简称固盘,固态硬盘(solid state drive)用固态电子存储芯片阵列而制成的硬盘,由控制单元和存储单元(flash芯片、dram芯片)组成。固态硬盘在接口的规范和定义、功能及使用方法上与传统硬盘的完全相同,在产品外形和尺寸上也完全与传统硬盘一致,但i/o性能相对于传统硬盘大大提升。被广泛应用于军事、车载、工控、视频监控、网络监控、网络终端、电力、医疗、航空、导航设备等领域。
30.相关技术中,固态硬盘现有传统的散热场景,主要依靠服务器内部涵道,在盘片温度过高时,启动或增大涵道的转速,通过加强风流动的速度,增加盘片散热,全局调控所有盘片温度。这种通过风冷进行被动式散热的方法,目前至少存在以下问题:1)由于结构设计,散热涵道距离ssd本体会有一段距离,降低了散热能效;2)另外,由于服务器线缆走线设计,会阻挡涵道风冷路径,导致不同的槽位散热能力不同,在实际测试中,服务器背板两端的槽位温度较中间槽位高5度以上。3)由于服务器升级换代,存量服务器因设计时间较早,在散热技术上不够先进,无法适配现在高性能盘体(热量更大),并且无法通过调控风速解决问题。4)原有散热技术,通过服务器cpu去调控温度,高温盘片反馈温度后,cpu启动或调高涵道风速,但该涵道影响槽位通常是几个盘片,调整的是区域温度,调控精度不够准确,会浪费大量的功耗。
31.为解决上述问题,本技术实施例通过了相应的解决方案,本技术实施例中,启动风冷降温有两个路径,第一是由ssd主控控制,单盘能够实现精准温度调控;第二是由服务器cpu控制,进行全局或精准降温。
32.本技术实施例提供的方案,具有广泛的适用性,能够在新老服务器上适用,再不改变原有服务器散热结构的前提下,增强ssd固态硬盘的散热能力,优化补充了服务器原有的散热方法。使散热更灵活,更精准,散热能效更高。
33.本技术实施例的两种散热分配方法,全局温控精准辅助策略、精准温控全局辅助策略能够更好的提升服务器的散热能力,补充原有的散热算法。全局温控精准辅助策略具有更高的散热能力,在整体温度难以降低时,对异常高温的盘片进行精准温控,适用于局部盘片温度过高或全局温控难以降低温度场景;精准温控全局辅助策略具有更低的功耗,在满足散热的前提下,使用ssd自主控制自身的盘片温度,减少的涵道所需的功耗,只有在自调控难以满足要求时,再启动全局调控,能更好的控制功耗。以下详细说明。
34.本技术实施例中所提供的方法实施例可以在计算机设备、计算机终端或者类似的运算装置中执行。以运行在计算机设备上为例,图1是本技术实施例的一种gpu扩展箱的固件升级方法的计算机设备的硬件结构框图。如图1所示,计算机设备可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)和用于存储数据的存储器104,其中,上述计算机设备还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述计算机设备的结构造成限定。例如,计算机设备还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
35.存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本申
请实施例中的gpu扩展箱的固件升级方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
36.传输设备106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机设备的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(network interface controller,简称为nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(radio frequency,简称为rf)模块,其用于通过无线方式与互联网进行通讯。
37.在本实施例中提供了一种运行于上述计算机设备的服务器的散热方法,图2是根据本技术实施例的一种服务器的散热方法的流程图,如图2所示,该流程包括如下步骤:步骤s202,获取服务器机箱内的环境状态,其中,所述环境状态至少包括:所述服务器机箱内的环境温度;上述环境温度包括但不限于:服务器机箱内空间的环境温度,例如,其可以是机箱内各个区域的平均温度。
38.步骤s204,在所述环境温度状态处于目标状态的情况下,获取服务器机箱内各个硬盘的温度,其中,所述目标状态用于指示所述服务器机箱内的环境温度大于第一温度阈值的持续时长大于第一时间阈值;其中,各个硬盘的温度的采集可以通过硬盘上设置的温度传感器进行采集。
39.步骤s206,依据所述各个硬盘的温度从所述各个硬盘中确定温度大于第二温度阈值的第一目标硬盘;例如,统计各个硬盘的温度;然后从中选择温度大于第二温度阈值的硬盘作为第一目标硬盘。上述第二温度阈值可以依据经验确定。
40.步骤s208,向所述第一目标硬盘发送第一控制指令,其中,所述第一控制指令用于控制所述第一目标硬盘进行降温操作。
41.需要注意的是,向第一目标硬盘发送第一控制指令,可以理解为对第一目标硬盘中的主控模块发送第一控制指令,该主控模块至少用于控制第一目标硬盘内的降温装置(例如内部风扇)的运行状态,该运行状态包括但不限于:降温装置的开启或关闭、加速或减速等。
42.需要说明的是,上述各个步骤的执行主体可以为服务器内的cpu,即用于控制机箱内各个散热涵道的运行状态的控制模块。
43.所述降温装置包括但不限于风冷模块散热、液冷模块散热以及其他可控散热方法,本技术的实施例中的散热执行部件(降温装置)能够与ssd主控、服务器cpu同时通信,能够根据ssd主控的命令或服务器主控的命令启动或停止散热。
44.在一些实施例中,所述各个硬盘通过所述机箱内部的转接板与所述第一目标硬盘连接;此时,可以通过以下之一方式获取所述服务器机箱内各个硬盘的温度:1)通过所述转接板上设置的串行总线通道向所述各个硬盘的主控模块发送第一
查询指令;接收所述各个硬盘的主控模块依据所述第一查询指令发送的温度;上述串行总线通道包括但不限于i2c通道。
45.2)通过所述转接板上设置的串行总线通道接收所述各个硬盘的主控模块定时发送的温度;以硬盘为固态硬盘为例,本技术实施例硬件连接部分主要为硬盘支架、转接板(内含单片机最小系统)和风冷降温模块(例如风扇),固态硬盘安装于支架内部,接口连接至转接板u.2的母头,使用螺丝在背面固定支架与硬盘,最后将整个装置安装于服务器内部就可以,盘片及转接板自动上电,具体如图3所示。
46.如图3所示,所述硬盘支架如104所示,固定ssd固态硬盘102、转接板103和风冷模块101。
47.所述风冷模块如101,安装于ssd散热风道处,通过硬盘支架104固定。
48.所说转接板103的top面连接固态硬盘,bottom面用于连接至服务器背板,由硬盘支架104固定。本技术实施例的硬件电气连接及通信链路如图4所示。
49.从各个硬盘中选择第一目标硬盘的方式有多种,例如,可以根据硬盘的重要等级进行选择,也可以根据硬盘的温度信息选择。在本技术的一些实施例中,可以通过以下方式从各个硬盘中选择第一目标硬盘:从各个硬盘中确定温度大于第二温度阈值的候选硬盘集合;确定候选硬盘集合中上一次统计时刻的温度,其中,上一次统计时刻为主控模块上一个定时周期内发送硬盘的温度的发送时刻或者主控模块依据上一次接收到的第一查询指令发送硬盘的温度的发送时刻;从候选硬盘集合中确定上一次统计时刻的温度大于第二温度阈值的硬盘,并将上一次统计时刻的温度大于第二温度阈值的硬盘作为第一目标硬盘。
50.需要说明的是,上述第二温度阈值大于第一温度阈值。
51.可以理解地,在一些实施例中,可以将上述候选硬盘集合直接作为第一目标硬盘,但是,这样,会造成温控的乒乓效应,从而导致温控过程的不稳定,因此,本技术实施例还提供了另外一种方案,即在后续硬盘集合中选择具有一定持续时长或者前后连续两个统计时刻的温度均大于第二温度阈值的硬盘,可以避免乒乓效应的产生。
52.在向第一目标硬盘发送第一控制指令之后,存在仍然不能满足降温需求的情况,因此,可以对第一目标硬盘的其他硬盘进行控制,以进一步提高降温效率,例如:从第一控制指令的发送时刻开始计时,并在计时时长到达预设时长后,向第一目标硬盘发送第二查询指令;接收第一目标硬盘发送的与第二查询指令对应的温度;在与第二查询指令对应的温度仍然大于第二温度阈值的情况下,从第一目标硬盘的周边硬盘中确定第二目标硬盘;向第二目标硬盘发送第二控制指令,其中,第二控制指令用于控制第二目标硬盘执行降温操作。,其中,上述第二查询指令可以为专用于查询第一目标硬盘的温度的查询指令,即携带于专用消息中;也可以为第一目标硬盘和服务器中的控制模块(cpu)中的其他交互消息中携带的指令。
53.其中,可以通过以下方式从第一目标硬盘的周边硬盘中确定第二目标硬盘:确定第一目标硬盘所对应的散热涵道;从散热涵道的风冷覆盖范围内的多个硬盘,将风冷覆盖范围内的多个硬盘作为周边硬盘。
54.可以理解地,如果采取上述措施后,还是不能满足降温需求,还可以对上述散热涵道的邻近散热涵道的降温状态进行控制,例如,在邻近散热涵道的降温功能未开启的情况
下,开启散热涵道的降温功能;在邻近散热涵道的降温功能开启的情况下,提高散热涵道的降温等级(提高风扇转速等)。
55.可选地,还可以从第一目标硬盘的周边硬盘中确定温度大于第三温度阈值的硬盘,其中,第三温度阈值大于第一温度阈值且小于第二温度阈值。
56.需要注意的是,在对硬盘进行降温控制之前,需要确定服务器机箱内部的全部涵道已经开启,以避免运行资源的浪费,具体地,在获取服务器机箱内各个硬盘的温度之前,还可以执行以下步骤:确定服务器机箱内的散热涵道是否全部开启,在服务器机箱内的散热涵道全部开启的情况下,触发获取服务器机箱内各个硬盘的温度。
57.在所述服务器机箱内的散热涵道仅有部分开启的情况下,控制服务器机箱内的散热涵道全部开启;在服务器机箱内的散热涵道全部开启且环境温度状态处于目标状态的情况下,触发获取服务器机箱内各个硬盘的温度。
58.在一些实施例中,图2所示实施例的散热方法,由服务器中的cpu所主导的,具体如图5所示:在采集服务器内部温度高于阈值时,并且全局降温策略无法降低高温盘片时,服务器cpu会通知ssd主控进行精准降温,ssd内部主控会采集自身温度,在温度大于阈值时,会通过i2c网络通知转接板上的单片机最小系统,单片机通过io口控制风冷降温模块,风扇转速通过pwm控制。
59.图6是根据本技术实施例的一种服务器的散热装置的结构框图。如图6所示,该散热装置包括:第一获取模块60,用于获取服务器机箱内的环境状态,其中,所述环境状态至少包括:所述服务器机箱内的环境温度;第二获取模块62,用于在所述环境温度状态处于目标状态的情况下,获取所述服务器机箱内各个硬盘的温度,其中,所述目标状态用于指示所述服务器机箱内的环境温度大于第一温度阈值的持续时长大于第一时间阈值;确定模块64,用于依据所述各个硬盘的温度从所述各个硬盘中确定温度大于第二温度阈值的第一目标硬盘;发送模块66,用于向所述第一目标硬盘发送第一控制指令,其中,所述第一控制指令用于控制所述第一目标硬盘进行降温操作。
60.上述第一确定模块,还用于从各个硬盘中确定温度大于第二温度阈值的候选硬盘集合;确定候选硬盘集合中上一次统计时刻的温度,其中,上一次统计时刻为主控模块上一个定时周期内发送硬盘的温度的发送时刻或者主控模块依据上一次接收到的第一查询指令发送硬盘的温度的发送时刻;从候选硬盘集合中确定上一次统计时刻的温度大于第二温度阈值的硬盘,并将上一次统计时刻的温度大于第二温度阈值的硬盘作为第一目标硬盘。
61.需要说明的是,上述第二温度阈值大于第一温度阈值。
62.可以理解地,在一些实施例中,可以将上述候选硬盘集合直接作为第一目标硬盘,但是,这样,会造成温控的乒乓效应,从而导致温控过程的不稳定,因此,本技术实施例还提供了另外一种方案,即在后续硬盘集合中选择具有一定持续时长或者前后连续两个统计时刻的温度均大于第二温度阈值的硬盘,可以避免乒乓效应的产生。
63.在一些实施例中,上述散热装置还可以包括:计时模块,用于从第一控制指令的发送时刻开始计时;上述发送模块,还用于在计时时长到达预设时长后,向第一目标硬盘发送第二查询指令;接收模块,用于接收第一目标硬盘发送的与第二查询指令对应的温度;上述确定模块,还用于在与第二查询指令对应的温度仍然大于第二温度阈值的情况下,从第一
目标硬盘的周边硬盘中确定第二目标硬盘;上述发送模块,还用于向第二目标硬盘发送第二控制指令,其中,第二控制指令用于控制第二目标硬盘执行降温操作。
64.其中,上述确定模块,还用于确定第一目标硬盘所对应的散热涵道;从散热涵道的风冷覆盖范围内的多个硬盘,将风冷覆盖范围内的多个硬盘作为周边硬盘。
65.可选地,上述确定模块,还用于从第一目标硬盘的周边硬盘中确定温度大于第三温度阈值的硬盘,其中,第三温度阈值大于第一温度阈值且小于第二温度阈值。
66.在一些实施例中,在对硬盘进行降温控制之前,需要确定服务器机箱内部的全部涵道已经开启,以避免运行资源的浪费,上述确定模块,还用于确定服务器机箱内的散热涵道是否全部开启,在服务器机箱内的散热涵道全部开启的情况下,触发获取服务器机箱内各个硬盘的温度。
67.在一个应用场景示例中,在采集服务器内部温度高于阈值时,并且全局降温策略无法降低高温盘片时,服务器cpu会通知ssd主控进行精准降温,ssd内部主控会采集自身温度,高于阈值时,会通过i2c网络通知转接板上的单片机最小系统,单片机通过io口控制风冷降温模块,风扇转速通过pwm控制。
68.本技术实施例还提供了另一种服务器的散热方法,该方法可以由硬盘主导,即硬盘中的主控模块主导,具体地,如图7所示,该散热方法包括:步骤s702,获取服务器机箱内目标硬盘的温度;步骤s704,在目标硬盘的温度大于第四温度阈值的情况下,向服务器机箱内的控制模块发送第三控制指令,其中,第三控制指令用于控制服务器机箱内的散热涵道执行全局降温操作。其中,全局降温操作的含义包括但不限于:对服务器机箱内部的全部散热涵道的状态(风扇运行速度、开关状态)进行统一控制。
69.为避免乒乓相应,在向服务器机箱内的控制模块发送第三控制指令之前,确定目标硬盘的温度大于第四温度阈值的持续时长;在持续时长大于指定时长的情况下,触发向控制模块发送第三控制指令。
70.为进一步提升降温效率,控制模块在接收到所述通知信息后,还可以确定所述目标硬盘的周边硬盘;然后控制模块向周边硬盘发送用于控制所述周边硬盘进行降温操作的第四控制指令。此处的降温操作包括但不限于以下之一:开启硬盘自身的降温装置、提升硬盘自身的降温等级。其中,不同的降温等级可以用自身降温装置的功率衡量,例如,降温等级越高,其自身的风扇转速越大。
71.确定目标硬盘的周边硬盘的方式有多种,例如:确定所述目标硬盘所对应的散热涵道;确定散热涵道的风冷覆盖范围内的多个硬盘,将所述风冷覆盖范围内的多个硬盘作为所述周边硬盘。
72.可以理解地,如果采取上述措施后,还是不能满足降温需求,还可以对上述散热涵道的邻近散热涵道的降温状态进行控制,例如,开启散热涵道的降温功能、提高散热涵道的降温等级(提高风扇转速等)。
73.为进一步减少资源浪费,在获取服务器机箱内目标硬盘的温度之前,还确定目标硬盘的降温装置是否已经开启,并在目标硬盘的降温装置开启的情况下,确定降温装置的降温等级;在降温等级为最高等级的情况下,触发向服务器机箱内的控制模块发送第三控制指令。其中,不同的降温等级对应不同的降温强度,例如,不同的降温等级可以用自身降
温装置的功率衡量,例如,降温等级越高,其自身的风扇转速越大。在一些实施例中,可以在降温等级维持一定的时长后,再发送第三控制指令。
74.为避免资源浪费,向服务器机箱内的控制模块发送第三控制指令之后,控制模块统计服务器机箱内硬盘的温度大于第二温度阈值的硬盘数量比例;在硬盘数量比例大于预设比例的情况下,控制模块控制服务器机箱内的全部涵道开启,以执行降温操作。硬盘数量比例为温度大于第二温度阈值的硬盘数量与服务器机箱内硬盘总数的比值。
75.如图8所示为精准温控全局辅助降温的方法,由安装于服务器上的各个ssd主控主导,在盘片高温报警时,是由ssd主控自身发起风冷散热命令,并根据温度高低,通过pwm方式控制风扇转速的,这种方法只是高温盘片进行降温,作为低功耗模式使用,只有在服务器上大于70%的盘片无法通过自身降温控制时,说明服务器内部整体温度偏高,支架风冷装置降温效果无法达到要求,这个时候才会启动全局降温策略,服务器cpu下达命令,启动涵道进行pid的全局控制策略。在整体温度下降后,继续采用盘片自温控,降低散热所需功耗。
76.本技术实施例还提供了一种服务器的散热装置,用于执行图7所示的散热方法,包括:获取模块,用于获取服务器机箱内目标硬盘的温度;发送模块,用于在目标硬盘的温度大于第四温度阈值的情况下,向服务器机箱内的控制模块发送第三控制指令,其中,第三控制指令用于控制服务器机箱内的散热涵道执行全局降温操作。其中,全局降温操作的含义包括但不限于:对服务器机箱内部的全部散热涵道的状态(风扇运行速度、开关状态)进行统一控制。
77.在一个示例性实施例中,上述装置还可以包括:确定模块,用于确定所述目标硬盘的温度大于所述第四温度阈值的持续时长;触发模块,用于在所述持续时长大于指定时长的情况下,触发向所述控制模块发送所述第三控制指令。
78.在一个应用场景中,服务器中的控制模块统计所述服务器机箱内硬盘的温度大于所述第二温度阈值的硬盘数量比例;在所述硬盘数量比例大于预设比例的情况下,所述控制模块控制所述服务器机箱内的全部涵道开启,以执行降温操作。
79.需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
80.本技术的实施例还提供了一种服务器的散热系统,包括:目标硬盘的第一控制模块、用于控制服务器机箱内的散热涵道开闭的第二控制模块,转接板,其中,所述第一控制模块和第二控制模块通过所述转接板连接,所述第二控制模块,用于执行以上所述的服务器的散热方法;所述第一控制模块,用于执行以上所述的服务器的散热方法。
81.在一个示例性实施例中,所述第一控制模块和第二控制模块通过设置在所述转接板上的串行数据总线连接。
82.本技术的再一个实施例,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现以上所述的服务器的散热方法。例如,可以执行实现以下功能的程序指令:获取服务器机箱内的环境状态,其中,所述环境状态至少包括:所述服务器机箱内的环境温度;在所述环境温度状态处于目标状态的情况下,获取所述服务器机箱内各个硬盘的温度,其中,所述目标状态用于指示所述服务器机箱内的环境温度大于第一温度阈值的持续时长大于第一时间阈值;依据所述各个
硬盘的温度从所述各个硬盘中确定温度大于第二温度阈值的第一目标硬盘;向所述第一目标硬盘发送第一控制指令,其中,所述第一控制指令用于控制所述第一目标硬盘进行降温操作;或者,获取服务器机箱内目标硬盘的温度;在所述目标硬盘的温度大于第四温度阈值的情况下,向所述服务器机箱内的控制模块发送第三控制指令,其中,所述第三控制指令用于控制所述服务器机箱内的散热涵道执行全局降温操作。
83.在一个示例性实施例中,在本实施例中,上述计算机可读存储介质还用于存储执行以下功能的程序:通过所述转接板上设置的串行总线通道向所述各个硬盘的主控模块发送第一查询指令;接收所述各个硬盘的主控模块依据所述第一查询指令发送的温度;通过所述转接板上设置的串行总线通道接收所述各个硬盘的主控模块定时发送的温度。
84.在一个示例性实施例中,在本实施例中,上述计算机可读存储介质还用于存储执行以下功能的程序:从所述各个硬盘中确定温度大于第二温度阈值的候选硬盘集合;确定所述候选硬盘集合中上一次统计时刻的温度,其中,所述上一次统计时刻为所述主控模块上一个定时周期内发送所述硬盘的温度的发送时刻或者所述主控模块依据上一次接收到的第一查询指令发送所述硬盘的温度的发送时刻;从所述候选硬盘集合中确定所述上一次统计时刻的温度大于所述第二温度阈值的硬盘,并将所述上一次统计时刻的温度大于所述第二温度阈值的硬盘作为所述第一目标硬盘。
85.在一个示例性实施例中,上述计算机可读存储介质还用于存储执行以下功能的程序:从所述第一控制指令的发送时刻开始计时,并在计时时长到达预设时长后,向所述第一目标硬盘发送第二查询指令;接收所述第一目标硬盘发送的与所述第二查询指令对应的温度;在与所述第二查询指令对应的温度仍然大于所述第二温度阈值的情况下,从所述第一目标硬盘的周边硬盘中确定第二目标硬盘;向所述第二目标硬盘发送第二控制指令,其中,所述第二控制指令用于控制所述第二目标硬盘执行降温操作。
86.在本实施例中,上述计算机可读存储介质还用于存储执行以下功能的程序:确定所述第一目标硬盘所对应的散热涵道;确定所述散热涵道的风冷覆盖范围内的多个硬盘,将所述风冷覆盖范围内的多个硬盘作为所述周边硬盘在一个示例性实施例中,上述计算机可读存储介质可以包括但不限于:u盘、只读存储器(read-only memory,简称为rom)、随机存取存储器(random access memory,简称为ram)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
87.本技术的实施例还提供了一种电子设备,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
88.上述处理器用于运行执行以下功能的程序:获取服务器机箱内的环境状态,其中,所述环境状态至少包括:所述服务器机箱内的环境温度;在所述环境温度状态处于目标状态的情况下,获取所述服务器机箱内各个硬盘的温度,其中,所述目标状态用于指示所述服务器机箱内的环境温度大于第一温度阈值的持续时长大于第一时间阈值;依据所述各个硬盘的温度从所述各个硬盘中确定温度大于第二温度阈值的第一目标硬盘;向所述第一目标硬盘发送第一控制指令,其中,所述第一控制指令用于控制所述第一目标硬盘进行降温操作。
89.或者,获取服务器机箱内目标硬盘的温度;在所述目标硬盘的温度大于第四温度阈值的情况下,向所述服务器机箱内的控制模块发送第三控制指令,其中,所述第三控制指令用于控制所述服务器机箱内的散热涵道执行全局降温操作在一个示例性实施例中,上述电子设备还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
90.根据本技术的再一个实施例,提供了一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以上所述的服务器的散热方法。
91.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本技术各个实施例所述的方法。
92.从上述实施例可以看出,本技术实施例的温度控制方法有两种,一种是由服务器cpu主导的全局温控精准辅助方法,第二种是ssd主导的精准温控全局辅助的方法。两种方法控制对象不同,降温策略不同,各有利弊。第一种方法能够使服务器整体温度降低,降温效果较好,全局降温不能满足盘片时,盘片启动自降温,但是所需功耗大。第二种方法能够精准降低高温盘片的温度,在整体温度过高时再启用全局降温,在服务器低能效场景,此种降温方案功耗更低,降温效果满足要求,但不如第一种降温效果更好。
93.本技术实施例中的两种温控方法例如a(服务器主导)、b(硬盘主导),可以组合使用,例如本文中使用限定的方法为先a后b和先b后a,也可以a/b单独执行,或者a/b方法同时执行,再或者先ab,后a;先ab后b等等散热方法搭配使用。
94.本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例,本实施例在此不再赘述。
95.显然,本领域的技术人员应该明白,上述的本技术的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本技术不限制于任何特定的硬件和软件结合。
96.以上所述仅为本技术的优选实施例而已,并不用于限制本技术,对于本领域的技术人员来说,本技术可以有各种更改和变化。凡在本技术的原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献