一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

过热故障的识别设备、方法、装置、介质及服务器机柜与流程

2023-03-20 16:34:10 来源:中国专利 TAG:


1.本发明涉及服务器技术领域,特别是涉及一种过热故障的识别设备、方法、装置、介质及服务器机柜。


背景技术:

2.随着信息行业绿色发展要求的不断提高,对于数据中心消耗的所有能源与信息产业(information technology,it)负载使用的能源之比(power usage effectiveness,pue)要求也不断提高,现有的风冷散热技术的数据中心pue值一般大于2,已经无法满足未来高功率密度大型数据中心的运行要求。服务器板级供电电压和供电电流随着核心芯片功耗的增加,其各元件发热也不断增加,容易发生过热故障。
3.对于两相浸没式液冷服务器内个别芯片才具备内置温度传感器,具有单点测温功能,仅能识别安装位置处的过热故障,无法覆盖整个服务器区域和所有元件,甚至测量得到的温度信息无法准确反映邻近区域和真实的温度值。由于该服务器系统一直发生冷却液沸腾和冷凝两个相变过程,其内部压力一直处于波动状态,具备的压力传感器测得的压力信号无法确定是过热故障还是芯片功耗正常波动,容易发生误报情况,使之故障识别准确性降低。
4.因此,如何提高过热故障识别的准确性是本领域技术人员亟需要解决的。


技术实现要素:

5.本发明的目的是提供一种过热故障的识别设备、方法、装置、介质及服务器机柜,克服了温度传感器和压力传感器的局限性,通过声信号实现对服务器系统的温度测量,并且通过少量的声波传感器组成声信号测量阵列实现对整个服务器系统的全域温度监测。
6.为解决上述技术问题,本发明提供一种过热故障的识别设备,所述识别设备设置于服务器箱体内,所述服务器箱体放置有待散热服务器,且在所述服务器箱体内填充两相冷却液并完全浸没所述待散热服务器;所述识别设备包括声波传感器和信号处理装置;所述声波传感器放置于所述待散热服务器对面且位于所述服务器箱体内部的壁面,用于收集所述待散热服务器沸腾相变产生的声音信号;所述声波传感器与所述信号处理装置连接,所述信号处理装置用于将收集的所述声音信号进行特征提取得到特征声音信号;将所述特征声音信号进行分析处理得到声信号能量值;当所述声信号能量值处于过热故障的能量预设范围内,根据所述声信号能量值与所述声波传感器的位置信息的关系确定过热故障点的坐标信息和温度值以识别过热故障。
7.优选地,还包括冷却装置;所述冷却装置安装于所述服务器箱体上部空间以便于对所述两相冷却液吸热沸腾产生的蒸汽进行降温。
8.优选地,还包括吸声装置;
所述吸声装置位于所述服务器箱体内侧壁面,用于降低所述声音信号的反射特性。
9.为解决上述技术问题,本发明还提供一种过热故障的识别方法,应用于过热故障的识别设备,所述识别设备设置于服务器箱体内,所述服务器箱体放置有待散热服务器,且在所述服务器箱体内填充两相冷却液并完全浸没所述待散热服务器;所述识别设备包括声波传感器和信号处理装置;所述声波传感器放置于所述待散热服务器对面且位于所述服务器箱体内部的壁面;所述声波传感器与所述信号处理装置连接,包括:将所述声波传感器收集的声音信号进行特征提取得到特征声音信号;将所述特征声音信号进行分析处理得到声信号能量值;当所述声信号能量值处于过热故障的能量预设范围内,根据所述声信号能量值与所述声波传感器的位置信息的关系确定过热故障点的坐标信息和温度值以识别过热故障。
10.优选地,在所述将所述声波传感器收集的声音信号进行特征提取得到特征声音信号之前,还包括:获取所述声波传感器收集的原始声音信号;对所述原始声音信号进行预处理得到所述声音信号。
11.优选地,所述将所述声波传感器收集的所述声音信号进行特征提取得到特征声音信号,包括:预先存储所述待散热服务器的正常工作状态的第一声音信号;将所述声音信号与所述第一声音信号进行比较,并将所述声音信号内含有所述第一声音信号的信号进行去除以得到所述特征声音信号。
12.优选地,所述将所述声波传感器收集的所述声音信号进行特征提取得到特征声音信号,包括:预先存储所述待散热服务器的非正常工作状态的第二声音信号;根据所述第二声音信号对所述声音信号进行提取以得到所述特征声音信号。
13.优选地,所述将所述特征声音信号进行分析处理得到声信号能量值,包括:将所述特征声音信号进行时域分析得到时域信号;根据所述时域信号与能量谱的关系确定对应的所述声信号能量值。
14.优选地,所述将所述特征声音信号进行分析处理得到声信号能量值,包括:将所述特征声音信号进行频域分析得到频域信号;获取能量方程;将所述频域信号输入至所述能量方程中以得到对应的输出参数;将所述输出参数作为所述声信号能量值。
15.优选地所述根据所述声信号能量值与所述声波传感器的位置信息的关系确定过热故障点,包括:根据所述声信号能量值确定对应的目标方向和对应的目标声波传感器;获取所述目标声波传感器的位置信息;调用过热故障模型,并将所述目标方向和所述位置信息作为输入参数输入至所述过热故障模型,其中所述过热故障模型基于人工智能模型得到;获取所述故障模型的输出参数以确定发生过热故障的所述待散热服务器;
将发生过热故障的所述待散热服务器作为所述过热故障点。
16.优选地,获取所述过热故障点的温度值,包括:获取所述声音信号的传播速度值、所述目标声波传感器和所述过热故障点之间的距离值;根据所述传播速度值、声波传递方程和所述距离值的关系确定所述过热故障点的所述温度值。
17.优选地,还包括:当所述声信号能量值处于过热故障的所述能量预设范围内时,输出过热故障警报信息。
18.优选地,还包括:将所述过热故障点的所述坐标信号和所述温度值生成日志信息;将所述日志信息通过邮件形式发送至用户;或者将所述过热故障点的所述坐标信号和所述温度值通过显示装置进行显示。
19.为解决上述技术问题,本发明还提供一种过热故障的识别装置,应用于过热故障的识别设备,所述识别设备设置于服务器箱体内,所述服务器箱体放置有待散热服务器,且在所述服务器箱体内填充两相冷却液并完全浸没所述待散热服务器;所述识别设备包括声波传感器和信号处理装置;所述声波传感器放置于所述待散热服务器对面且位于所述服务器箱体内部的壁面;所述声波传感器与所述信号处理装置连接,包括:特征提取模块,用于将所述声波传感器收集的声音信号进行特征提取得到特征声音信号;分析处理模块,用于将所述特征声音信号进行分析处理得到声信号能量值;确定模块,用于当所述声信号能量值处于过热故障的能量预设范围内,根据所述声信号能量值与所述声波传感器的位置信息的关系确定过热故障点的坐标信息和温度值以识别过热故障。
20.为解决上述技术问题,本发明还提供一种过热故障的识别装置,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现如上述所述的过热故障的识别方法的步骤。
21.为解决上述技术问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述的过热故障的识别方法的步骤。
22.为解决上述技术问题,本发明还提供一种服务器机柜,所述服务器机柜包括服务器箱体、待散热服务器和上述所述的过热故障的识别设备,所述识别设备设置于所述服务器箱体内,所述服务器箱体放置有所述待散热服务器,且在所述服务器箱体内填充两相冷却液并完全浸没所述待散热服务器。
23.本发明提供的一种过热故障的识别设备,识别设备设置于服务器箱体内,服务器箱体放置有待散热服务器,且在服务器箱体内填充两相冷却液并完全浸没待散热服务器;识别设备包括声波传感器和信号处理装置;声波传感器放置于待散热服务器对面且位于服务器箱体内部的壁面,用于收集待散热服务器沸腾相变产生的声音信号;声波传感器与信
号处理装置连接,信号处理装置用于将收集的声音信号进行特征提取得到特征声音信号;将特征声音信号进行分析处理得到声信号能量值;当声信号能量值处于过热故障的能量预设范围内,根据声信号能量值与声波传感器的位置信息的关系确定过热故障点的坐标信息和温度值以识别过热故障。该设备采用声波传感器替代原有的温度传感器或者压力传感器,感知待散热服务器的冷却液沸腾相变所产生的气泡动力学信息(声音信号),将声音信号进行特征提取以得到特征声音信号,进而将声音特征信号分析处理得到声信号能量值,在声信号能量值处于过热故障的能量预设范围内,结合声波传感器的安装位置以及声信号能量值得到过热故障位置和温度值,有效识别两相浸没式液冷服务器过热故障,避免出现误报情况,仅对过热故障的故障识别进行定位,以提高故障识别的准确性。克服了温度传感器和压力传感器的局限性,通过声信号实现对服务器系统的温度测量,并且通过少量的声波传感器组成声信号测量阵列实现对整个服务器系统的全域温度监测。
24.另外,本发明还提供了一种过热故障的识别方法、装置、介质及服务器机柜,具有如上述过热故障的识别设备相同的有益效果。
附图说明
25.为了更清楚地说明本发明实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
26.图1为本发明实施例提供的一种过热故障的识别设备的剖面结构示意图;图2为本发明实施例提供的一种过热故障的识别方法的流程图;图3为本发明实施例提供的一种过热故障的识别装置的结构图;图4为本发明实施例提供的另一种过热故障的识别装置的结构图;图5为本发明实施例提供的另一种过热故障的识别方法的流程图;图6为本发明另一实施例提供的一种过热故障的识别装置的结构图。
具体实施方式
27.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本发明保护范围。
28.本发明的核心是提供一种过热故障的识别设备、方法、装置、介质及服务器机柜,克服了温度传感器和压力传感器的局限性,通过声信号实现对服务器系统的温度测量,并且通过少量的声波传感器组成声信号测量阵列实现对整个服务器系统的全域温度监测。
29.为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。
30.需要说明的是,液冷散热技术,特别是浸没式液冷散热技术会逐渐成为未来数据中心的主流散热技术。浸没式液冷散热技术采用将服务器直接浸泡在冷却液中的方式,通过服务器发热元件与冷却液之间发生热量交换以将元件表面的热量带走,降低发热元件的温度,保证服务器系统正常工作。浸没式液冷技术按照所用冷却液沸点和传热方式的差异
又分为单相浸没式液冷技术和两相浸没式液冷技术。其中两相浸没式液冷技术依靠沸腾传热,具备更高的热通量密度和散热极限,是未来浸没式液冷技术发展的重点。
31.服务器系统需要能实现长期高负荷运行,例如5-10年,服务器的元件随着运行时间的延长性能会不断老化,故障风险和故障概率不断提高,元器件过热故障不仅会影响服务器系统运行的稳定性,更有可能导致整个服务器系统硬件发生损坏,导致严重的宕机事故。
32.对于风冷散热和冷板式液冷散热服务器系统,仍然采用芯片内部的温度传感器和布置在主板上的温度传感器来监测服务器系统的温度。对于浸没式液冷服务器系统,除上述芯片内部和主板上布置的温度传感器监测服务器温度之外,一般在箱体表面还布置有温度传感器以测量冷却液温度。而单相浸没式液冷系统中还可采用在机箱上部安装压力传感器的方法,通过测量箱体内部压力波动以识别系统过热故障。
33.对于两相浸没式液冷服务器系统,一旦服务器发生过热故障,机箱内部冷却液会吸热相变进而产生大量气体,使服务器箱体压力升高。一旦机箱内部气体产生量长期超过气体冷凝量,将会导致服务器箱体压力不断升高,当箱体内部压力超过系统所用两相冷却液临界工作压力后,冷却液散热能力会迅速降低,使服务器主板和芯片等元件温度进一步升高,使冷却系统散热性能逐渐降低,最终导致服务器箱体损坏或者服务器过热关机等严重事故。因此需要采取有效手段识别两相浸没式液冷服务器系统的过热工况,及时发出故障预警。由于沸腾传热过程会使得机箱内部冷却液流动复杂,布置在机箱内部和主板表面的温度传感器测量得到的温度信号可能无法准确反映邻近区域和系统真实的温度。
34.另外,在机箱上部安装压力传感器的方式仅适用于单相浸没式液冷系统,因为单相浸没式液冷系统运行时内部发热元件温度不会超过冷却液沸点,系统内部压力较为稳定,正常工作时系统压力不会出现波动。当系统压力出现波动则代表冷却液发生了沸腾相变,也即是服务器出现了过热故障。
35.本发明提供的过热故障的识别设备,适用于两相浸没式液冷服务器,还可以适用于两相浸没式液冷电气设备,包含变压器、电池、半导体开关和高功耗芯片等。图1为本发明实施例提供的一种过热故障的识别设备的剖面结构示意图,如图1所示,识别设备设置于服务器箱体1内,服务器箱体1放置有待散热服务器2,且在服务器箱体1内填充两相冷却液并完全浸没待散热服务器2;识别设备包括声波传感器3和信号处理装置4;声波传感器3放置于待散热服务器2对面且位于服务器箱体1内部的壁面,用于收集待散热服务器2沸腾相变产生的声音信号;声波传感器3与信号处理装置4连接,信号处理装置4用于将收集的声音信号进行特征提取得到特征声音信号;将特征声音信号进行分析处理得到声信号能量值;当声信号能量值处于过热故障的能量预设范围内,根据声信号能量值与声波传感器3的位置信息的关系确定过热故障点的坐标信息和温度值以识别过热故障。
36.具体地,服务器箱体为具有一定体积的密闭容器,服务器箱体内放置待散热服务器,对于待散热服务器的数量不做限定,可以是一个或者多个。声波传感器可以有超声波传感器和次声波传感器,在本发明实施例中对于声波传感器的类型不做限定,可以根据实际情况设定即可。同理,对于声波传感器的数量不做限定,可以和待散热服务器的数量相同,也可以不同,还可以多个待散热服务器共用一个声波传感器等,可根据实际情况设定。图1
中的服务器高功耗元件5也可以进行过热故障的识别与定位。
37.在服务器箱体内填充两相冷却液,两相冷却液完全浸没待散热服务器,声波传感器放置于待散热服务器对面。需要说明的是,声波传感器的放置位置位于待散热服务器的对面仅是一种优选实施例,还可以位于待散热服务器同侧等。声波传感器位于服务器箱体内部的壁面处,也就是位于服务器箱体内。两相冷却液的沸腾过程伴随着发热元件(待散热服务器)表面气泡的生长、脱离和破裂的过程,气泡的动力学行为会产生一定频率和幅值的声信号,声信号的特征与沸腾过程密切相关。在确定冷却液和空间结构的条件下,沸腾过程可以通过气泡的声信号以检测热源温度值,即通过声波传感器采集不同沸腾状态下的声音信号。
38.两相冷却液在循环散热过程中发生了相变,冷却液带走电子元件的热量后发生相变气化,气态冷却液被其它设备冷凝重新变成液态。声波传感器与信号处理装置连接,信号处理装置用于收集声音信号,并对声音信号进行特征提取分析以得到特征声音信号。在本实施例中,特征声音信号为除待散热服务器正常工作时发出的声音对应的特征声音信号之外的其他信号,例如过热故障的特征声音信号等。将特征声音信号进行分析处理得到声信号能量值,判断声信号能量值是否处于过热故障的能量预设范围,若处于,则确定声信号能量值由于过热故障引起的能量值改变,进而根据声信号能量值与声波传感器的位置信息的关系确定出过热故障点的坐标信息和温度值。
39.本发明实施例提供的一种过热故障的识别设备,识别设备设置于服务器箱体内,服务器箱体放置有待散热服务器,且在服务器箱体内填充两相冷却液并完全浸没待散热服务器;识别设备包括声波传感器和信号处理装置;声波传感器放置于待散热服务器对面且位于服务器箱体内部的壁面,用于收集待散热服务器沸腾相变产生的声音信号;声波传感器与信号处理装置连接,信号处理装置用于将收集的声音信号进行特征提取得到特征声音信号;将特征声音信号进行分析处理得到声信号能量值;当声信号能量值处于过热故障的能量预设范围内,根据声信号能量值与声波传感器的位置信息的关系确定过热故障点的坐标信息和温度值以识别过热故障。该设备采用声波传感器替代原有的温度传感器或者压力传感器,感知待散热服务器的冷却液沸腾相变所产生的气泡动力学信息(声音信号),将声音信号进行特征提取以得到特征声音信号,进而将声音特征信号分析处理得到声信号能量值,在声信号能量值处于过热故障的能量预设范围内,结合声波传感器的安装位置以及声信号能量值得到过热故障位置和温度值,有效识别两相浸没式液冷服务器过热故障,避免出现误报情况,仅对过热故障的故障识别进行定位,以提高故障识别的准确性。克服了温度传感器和压力传感器的局限性,通过声信号实现对服务器系统的温度测量,并且通过少量的声波传感器组成声信号测量阵列实现对整个服务器系统的全域温度监测。
40.在上述实施例的基础上,如图1所示,声波传感器3与信号处理装置4连接,其具体地声波传感器3与信号处理装置4通过信号电缆9进行连接。
41.信号电缆是一种信号传输工具,一般信号电缆传输的信号很小,为了避免信号受到干扰,信号电缆外面有一层屏蔽层,包裹的导体的屏蔽层,一般为导电布,编织铜网或铜泊(铝),屏蔽层需要接地,外来的干扰信号可被该层导入大地,避免干扰信号进入内层导体干扰同时降低传输信号的损耗。信号电缆用于各种传感器、仪器仪表的信号传输。
42.本实施例提供的声波传感器与信号处理装置通过信号电缆进行连接,用于将声波
传感器采集的声音信号通过信号电缆传输至信号处理装置,以便于信号处理装置对采集的声音信号进行处理。
43.在上述实施例的基础上,作为一种实施例,两相冷却液为电子氟化液,电子氟化液的型号至少为fc-72、novec
tm
7100、novec
tm
649的任意一种。
44.具体地,两相浸没式液冷服务器系统使用的两相冷却液为低沸点的电子氟化液。电子氟化液是无色透明全氟具有良好的化学惰性、电气绝缘性能、热传导性和独特的低表面张力广泛应用于半导体制造厂作为热传导介质。有着良好的化学惰性,与电子类部件接触时,不会对其产生任何腐蚀,使用过后也不需特定的清洗步骤,因此广泛用作电子测试液体。
45.需要说明的是,电子氟化液的型号至少为fc-72、novec
tm
7100、novec
tm
649的任意一种,包括但不限于上述提到的液体型号,还可以为其他液体型号的电子氟化液。
46.本实施例提供的两相冷却液为电子氟化液,电子氟化液的型号至少为fc-72、novec
tm
7100、novec
tm
649的任意一种,电子氟化液本身的特性作为热传导介质,广泛适用于电子测试液体。
47.在上述实施例的基础上,两相冷却液的沸腾过程伴随着发热元件表面气泡的生长、脱离和破裂的过程,在服务器箱体内会一直进行沸腾产生气泡。在整个相变过程,冷却液蒸发为气态过程会发生逃逸,故需要采用服务器箱体为密封。但是随着一直产生气态的气泡,防止冷却系统中断出现事故,需要设置一定的冷却装置用于对蒸汽进行降温。作为一种实施例,如图1所示,还包括冷却装置6;冷却装置6安装于服务器箱体1上部空间以便于对两相冷却液吸热沸腾产生的蒸汽进行降温。
48.如图1所示,冷却装置6安装于服务器箱体1上部空间内,对两相冷却液吸热沸腾后产生的蒸汽进行降温,冷却装置1包括进液口7和出液口8。冷却装置6的作用是为两相冷却液进行降温冷凝。
49.作为一种实施例,冷却装置1为冷凝管,冷凝管内填充水或乙二醇介质。
50.冷凝管用作促成冷凝作用的装置,起冷凝或回流作用,利用热交换原理使冷凝性气体冷却凝结为液体的装置。在图1中的冷凝管的形状为蛇形冷凝管,适用于沸点较低的液体。对于冷凝管的形状本发明实施例不做限定,可以根据实际情况设定即可。另外,填充的冷却液为水或者乙二醇以获取且成本较低的介质,包括但不限于上述提到的冷却液介质。
51.本发明实施例提供的冷却装置安装于服务器箱体上部空间,其冷却装置为冷凝管,冷凝管内填充水或乙二醇介质,实现对两相冷却液吸热沸腾产生的蒸汽进行降温,防止冷却系统中断出现事故。
52.在上述实施例的基础上,还包括吸声装置;吸声装置位于服务器箱体内侧壁面,用于降低声音信号的反射特性。
53.具体地,可在服务器箱体内侧加装一定厚度的吸声材料,以降低声波的反射特性。在密闭服务器箱体内,声波信号会发生多次反射与直射,减弱因反射造成的声音信号的噪声,这样,会留下直射的声音信号从而规避因反射造成的声音信号的干扰。
54.对于吸声装置其采用的材料应选用与冷却系统所用的两相冷却液兼容性较好的材料,作为一种实施例,吸声装置采用的材料为三元乙丙橡胶材料或聚乙烯材料,包括但不
限于上述提到的材料名称。
55.本发明实施例提供的吸声装置位于服务器箱体内侧壁面以及采用的材料为三元乙丙橡胶材料或聚乙烯材料,实现减弱声波信号反射造成的声音信号的噪声信号,减少干扰性。
56.图2为本发明实施例提供的一种过热故障的识别方法的流程图,如图2所示,该方法应用于过热故障的识别设备,识别设备设置于服务器箱体内,服务器箱体放置有待散热服务器,且在服务器箱体内填充两相冷却液并完全浸没待散热服务器;识别设备包括声波传感器和信号处理装置;声波传感器放置于待散热服务器对面且位于服务器箱体内部的壁面;声波传感器与信号处理装置连接,包括:s11:将声波传感器收集的声音信号进行特征提取得到特征声音信号;s12:将特征声音信号进行分析处理得到声信号能量值;s13:当声信号能量值处于过热故障的能量预设范围内,根据声信号能量值与声波传感器的位置信息的关系确定过热故障点的坐标信息和温度值以识别过热故障。
57.具体地,在步骤s11之前,先进行预处理将采集的原始声音信号处理得到声音信号,对于预处理的过程可以是降噪、滤波等过程。作为一种实施例,在将声波传感器收集的声音信号进行特征提取得到特征声音信号之前,还包括:获取声波传感器收集的原始声音信号;对原始声音信号进行预处理得到声音信号。
58.对应地,采集的原始声音信号其可能会记录后续不需要用到的声音信号,则需要将该声音信号剔除掉,不纳入后续的分析过程。滤波方式是将指定的频率信号进行保留,对应的波滤方式可以是高通、低通或者凹陷滤波等,在此不做限定,可以理解的是,滤波并不是将指定频率之外的其他频率完全滤掉,而是以指定频率为截止频率。例如,30hz的低通滤波,以30hz为截止频率,高于该截止频率的信号会逐渐衰减。另外,接收的原始声音信号是从开始一直全程记录,可以对信号进行分段处理,只有在接近待散热服务器非正常工作时声音信号对于后续分析采用,故将声音信号分段处理。由于整个采集过程采样率较大,其对应的采集数据量较多,故在后续分析,可以减少数据量以提高计算速度,故需要降低采样率。在本实施例中进行的预处理过程对应的具体处理操作不做限定,可根据实际情况设定即可。
59.步骤s11中的将声波传感器收集的声音信号进行特征提取得到特征声音信号,可以是将声音信号中剔除待散热服务器的正常工作状态的声音信号,以留下其他声音作为特征声音信号;还可以是根据待散热服务器的非正常工作状态的声音信号作为特征,对预处理后的声音信息进行提取得到特征声音信号。两种方式均可以得到特征声音信号,由于特征声音信号中存在噪声信号,后者提取的特征声音信号相较于前者提取的特征声音信号较为准确。
60.将特征提取后的特征声音信号进行分析处理得到声信号能量值,分析处理过程可以是时频分析,还可以是频域分析,只要能得到对应的声信号能量值即可。对于时频分析和频域分析的具体分析方法本发明实施例不做限定,可根据实际情况设定即可。
61.判断声信号能量值是否处于过热故障的能量预设范围,若是,则进入步骤s13中,根据声信号能量值与声波传感器的位置信息的关系确定过热故障点的坐标信息和温度值。
对于过热故障点的确定方式可以基于过热故障模型进行确定。需要说明的是,过热故障模型基于人工智能模型建立,需要前期大量的学习训练得到的模型。根据过热故障点可以确定其坐标信号和温度值,结合声波传感器的布置结果和冷却液中声音信号的传播规律,实现对故障热源点的定位和识别。
62.若声音信号能量值未处于过热故障的能量预设范围,则继续监测获取声波传感器收集的声音信号,返回步骤s11中。
63.另外,本发明实施例提供的过热故障的识别方法,可以适用于单相浸没式液冷系统的过热故障的识别,其对于上述实施例中的设备不适用于单相浸没式液冷系统。
64.本发明实施例提供的一种过热故障的识别方法,将收集的声音信号进行特征提取得到特征声音信号;将特征声音信号进行分析处理得到声信号能量值;当声信号能量值处于过热故障的能量预设范围内,根据声信号能量值与声波传感器的位置信息的关系确定过热故障点的坐标信息和温度值以识别过热故障。该方法采用声波传感器替代原有的温度传感器或者压力传感器,感知待散热服务器的冷却液沸腾相变所产生的气泡动力学信息(声音信号),将声音信号进行特征提取以得到特征声音信号,进而将声音特征信号分析处理得到声信号能量值,在声信号能量值处于过热故障的能量预设范围内,结合声波传感器的安装位置以及声信号能量值得到过热故障位置和温度值,有效识别两相浸没式液冷服务器过热故障,避免出现误报情况,仅对过热故障的故障识别进行定位,以提高故障识别的准确性。克服了温度传感器和压力传感器的局限性,通过声信号实现对服务器系统的温度测量,并且通过少量的声波传感器组成声信号测量阵列实现对整个服务器系统的全域温度监测。
65.在上述实施例的基础上,作为一种实施例,步骤s11中的将声波传感器收集的声音信号进行特征提取得到特征声音信号,包括:预先存储待散热服务器的正常工作状态的第一声音信号;将声音信号与第一声音信号进行比较,并将声音信号内含有第一声音信号的信号进行去除以得到特征声音信号。
66.具体地,预先存储待散热服务器的正常工作状态的第一声音信号,通过预处理得到的声音信号与第一声音信号进行比较,将包含第一声音信号的信号部分去除以得到特征声音信号。需要说明的是,待散热服务器的正常工作状态的第一声音信号包括待散热服务器本身工作下的声音信号和在一定时间内由于功耗增加导致元器件的温度信号波动的声音信号等。在特征声音信号内留有非正常工作状态下的声音信号,其中包括过热故障引起的声音信号还有其他噪声信号等。
67.作为另一种实施例,将声波传感器收集的声音信号进行特征提取得到特征声音信号,包括:预先存储待散热服务器的非正常工作状态的第二声音信号;根据第二声音信号对声音信号进行提取以得到特征声音信号。
68.具体地,将非正常工作状态的第二声音信号作为特征信号,对该特征信号进行提取,即根据第二声音信号对预处理后的声音信号进行提取以得到特征声音信号。和上述实施例中的特征提取方式不同,本实施例中将非正常工作状态的第二声音信号作为特征信号,进行提取得到特征声音信号。在上述实施例中将第一声音信号与预处理后的声音信号进行对比以剔除第一声音信号对应的声音信息,留下的声音信号作为特征声音信号。
69.本发明实施例提供的将声波传感器收集的声音信号进行特征提取得到特征声音信号,两种实施例均可以得到特征声音信号,便于后续的声音信号能量值的计算,减少噪声干扰。
70.在上述实施例的基础上,步骤s12中的将特征声音信号进行分析处理得到声信号能量值,包括:将特征声音信号进行时域分析得到时域信号;根据时域信号与能量谱的关系确定对应的声信号能量值。
71.具体地,采用时频分析方式得到对应的声信号能量值。对于时频分析过程,可以先根据时频分析方法得到对应的时频信号,再根据时频信号与能量谱的关系确定对应的声信号能量值,其两者的关系通过帕塞瓦尔定理确定得到。
72.帕塞瓦尔定理具体公式如下:
73.其波形依据时间域累积的总能量与该波形的傅里叶变换在频域累积的总能量相等。
74.作为另一种实施例,步骤s12中的将特征声音信号进行分析处理得到声信号能量值,包括:将特征声音信号进行频域分析得到频域信号;获取能量方程;将频域信号输入至能量方程中以得到对应的输出参数;将输出参数作为声信号能量值。
75.具体地,采用频域分析方式得到对应的声信号能量值,将特征声音信号进行频域分析得到频域信号,同时获取能量方程,其能量方程可以为上述的帕塞瓦尔定理公式,也可以为其他的能量方程。将频域信号输入至能量方程,其输出参数作为声信号能量值。
76.本实施例提供的将特征声音信号进行分析处理得到声信号能量值,通过声信号能量值的确定过程,便于后续实现对服务器系统的温度测量。
77.在上述实施例的基础上,得到声信号能量值之后,根据声信号能量值与声波传感器的位置信息的关系确定过热故障点,包括:根据声信号能量值确定对应的目标方向和对应的目标声波传感器;获取目标声波传感器的位置信息;调用过热故障模型,并将目标方向和位置信息作为输入参数输入至过热故障模型,其中过热故障模型基于人工智能模型得到;获取故障模型的输出参数以确定发生过热故障的待散热服务器;将发生过热故障的待散热服务器作为过热故障点。
78.具体地,根据声信号能量值确定对应的目标方向和目标声波传感器,信号处理装置中存在的声信号能量值来自于多个声波传感器,多个声波传感器的安装位置不同,其需要根据多个声信号能量值确定最大的声信号能量值,根据最大声信号能量值确定对应的目标方向以及目标声波传感器。
79.获取目标声波传感器的位置信息,调用过热故障模型,将目标方向和位置信息输
入至调用的过热故障模型,其对应的输出参数作为目标待散热服务器。可以理解的是,目标待散热服务器为发生过热故障的待散热服务器,并将该服务器作为过热故障点。
80.关于过热故障模型,是预先建立的模型,通过大量参数进行训练学习得到,其具有人工智能模型确定。
81.作为一种实施例,步骤s13中的温度值的确定过程,具体包括:获取声音信号的传播速度值、目标声波传感器和过热故障点之间的距离值;根据传播速度值、声波传递方程和距离值的关系确定过热故障点的温度值。
82.具体地,声波传递方程是利用不同位置的多个声波传感器对应的声波信号传递实现声信号热源的温度值。
83.声波传递方程通过测量声波在介质中传播速度,可间接测得待散热服务器的温度值。由速度与传播时间的关系确定得到对应的温度值,例如:
84.其中,为气体常数,为定压比热容和定容比热容之比,为分子质量,为声波传播距离,为声波传播时间,为气体压强,为温度值。
85.在上述实施例中已确定过热故障点,即可确定过热故障点的位置信息。
86.本发明实施例提供的确定过热故障点的坐标信息和温度值过程,结合声波传感器阵列安装位置利用声波传递规律计算得到过热故障点位置和温度,实现对过热故障点的识别和定位。
87.在上述实施例的基础上,该方法还包括:当声信号能量值处于过热故障的能量预设范围内时,输出过热故障警报信息。
88.具体地,声信号能量值处于能量预设范围内时,则说明当前的待散热服务器发生过热故障,需要输出过热故障警报信息。对于输出的形式不做限定,可以通过蜂鸣器进行输出,还可以通过led灯进行警报,还可以通过语音输出等,在此不做限定,可根据实际情况设定即可。
89.在上述实施例的基础上,该方法还包括:将过热故障点的坐标信号和温度值生成日志信息;将日志信息通过邮件形式发送至用户;或者将过热故障点的坐标信号和温度值通过显示装置进行显示。
90.具体地,可以在输出告警的同时,将过热故障点的坐标信息和温度值生成日志信息,通过邮件形式或者其他形式发送至用户。还可以通过显示装置显示过热故障点的坐标信息和温度值,以便于用户查看。
91.本发明实施例提供的发出过热故障警报信息,并将故障点坐标和温度发至用户以便于查看检测。
92.上述详细描述了过热故障的识别方法对应的各个实施例,在此基础上,本发明还公开与上述方法对应的过热故障的识别装置,识别设备设置于服务器箱体内,服务器箱体放置有待散热服务器,且在服务器箱体内填充两相冷却液并完全浸没待散热服务器;识别设备包括声波传感器和信号处理装置;声波传感器放置于待散热服务器对面且位于服务器
箱体内部的壁面;声波传感器与信号处理装置连接。图3为本发明实施例提供的一种过热故障的识别装置的结构图。如图3所示,过热故障的识别装置包括:特征提取模块11,用于将声波传感器收集的声音信号进行特征提取得到特征声音信号;分析处理模块12,用于将特征声音信号进行分析处理得到声信号能量值;确定模块13,用于当声信号能量值处于过热故障的能量预设范围内,根据声信号能量值与声波传感器的位置信息的关系确定过热故障点的坐标信息和温度值以识别过热故障。
93.由于装置部分的实施例与上述的实施例相互对应,因此装置部分的实施例请参照上述方法部分的实施例描述,在此不再赘述。
94.对于本发明提供的一种过热故障的识别装置的介绍请参照上述方法实施例,本发明在此不再赘述,其具有上述过热故障的识别方法相同的有益效果。
95.图4为本发明实施例提供的另一种过热故障的识别装置的结构图,如图4所示,该装置包括:存储器21,用于存储计算机程序;处理器22,用于执行计算机程序时实现过热故障的识别方法的步骤。
96.其中,处理器22可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器22可以采用数字信号处理器(digital signal processor,dsp)、现场可编程门阵列(field-programmable gate array,fpga)、可编程逻辑阵列(programmable logic array,pla)中的至少一种硬件形式来实现。处理器22也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称中央处理器(central processing unit,cpu);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器22可以集成有图像处理器(graphics processing unit,gpu),gpu用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器22还可以包括人工智能(artificial intelligence,ai)处理器,该ai处理器用于处理有关机器学习的计算操作。
97.存储器21可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器21还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器21至少用于存储以下计算机程序211,其中,该计算机程序被处理器22加载并执行之后,能够实现前述任一实施例公开的过热故障的识别方法的相关步骤。另外,存储器21所存储的资源还可以包括操作系统212和数据213等,存储方式可以是短暂存储或者永久存储。其中,操作系统212可以包括windows、unix、linux等。数据213可以包括但不限于过热故障的识别方法所涉及到的数据等等。
98.在一些实施例中,过热故障的识别装置还可包括有显示屏23、输入输出接口24、通信接口25、电源26以及通信总线27。
99.领域技术人员可以理解,图4中示出的结构并不构成对过热故障的识别装置的限定,可以包括比图示更多或更少的组件。
100.处理器22通过调用存储于存储器21中的指令以实现上述任一实施例所提供的过热故障的识别方法。
101.对于本发明提供的一种过热故障的识别装置的介绍请参照上述方法实施例,本发明在此不再赘述,其具有上述过热故障的识别方法相同的有益效果。
102.进一步的,本发明还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器22执行时实现如上述过热故障的识别方法的步骤。
103.可以理解的是,如果上述实施例中的方法以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
104.对于本发明提供的一种计算机可读存储介质的介绍请参照上述方法实施例,本发明在此不再赘述,其具有上述过热故障的识别方法相同的有益效果。
105.最后,本发明还提供一种服务器机柜,服务器机柜包括服务器箱体、待散热服务器和上述的过热故障的识别设备,识别设备设置于服务器箱体内,服务器箱体放置有待散热服务器,且在服务器箱体内填充两相冷却液并完全浸没待散热服务器,由于上文对各部件进行了描述,故本实施例不再赘述。
106.本发明提供的一种服务器机柜,服务器机柜包括服务器箱体、待散热服务器和上述的过热故障的识别设备,识别设备设置于服务器箱体内,服务器箱体放置有待散热服务器,且在服务器箱体内填充两相冷却液并完全浸没待散热服务器。该识别设备包括声波传感器和信号处理装置;声波传感器放置于待散热服务器对面且位于服务器箱体内部的壁面,用于收集待散热服务器沸腾相变产生的声音信号;声波传感器与信号处理装置连接,信号处理装置用于将收集的声音信号进行特征提取得到特征声音信号;将特征声音信号进行分析处理得到声信号能量值;当声信号能量值处于过热故障的能量预设范围内,根据声信号能量值与声波传感器的位置信息的关系确定过热故障点的坐标信息和温度值以识别过热故障。该服务器机柜采用声波传感器替代原有的温度传感器或者压力传感器,感知待散热服务器的冷却液沸腾相变所产生的气泡动力学信息(声音信号),将声音信号进行特征提取以得到特征声音信号,进而将声音特征信号分析处理得到声信号能量值,在声信号能量值处于过热故障的能量预设范围内,结合声波传感器的安装位置以及声信号能量值得到过热故障位置和温度值,有效识别两相浸没式液冷服务器过热故障,避免出现误报情况,仅对过热故障的故障识别进行定位,以提高故障识别的准确性。克服了温度传感器和压力传感器的局限性,通过声信号实现对服务器系统的温度测量,并且通过少量的声波传感器组成声信号测量阵列实现对整个服务器系统的全域温度监测。
107.作为一种实施例,图5为本发明实施例提供的另一种过热故障的识别方法的流程图,如图5所示,该方法包括:s21:使用声波传感器测量两相浸没式液冷服务器系统工作时的瞬态声信号并传输到信号处理装置;s22:信号处理装置将接收到的声信号与预储存的正常工作状态声信号进行比较运算,去除服务器正常运行时两相冷却液沸腾产生的声信号;
s23:对运算后的声信号进行时频分析,计算声信号能量;s24:根据设定的声信号能量阈值判断是否发生过热故障,若是,则进入步骤s25;s25:根据声信号能量数据结合声波传感器位置计算发生过热故障点的坐标和温度;s26:发出过热故障警报信息,并将故障点坐标和温度传输到监视模块。
108.对应地,图6为本发明另一实施例提供的一种过热故障的识别装置的结构图,如图6所示,该装置包括:接收模块31,用于接收并传输声波传感器测量到的两相浸没式液冷服务器系统工作时产生的瞬态声信号数据;存储模块32,用于存储正常工作状态服务器产生的声信号,以及实时存储接收模块31输入的瞬态声信号;运算模块33,用于运算比较接收到的瞬态声信号与预储存的正常工作状态声信号,去除服务器正常运行时两相冷却液沸腾产生的声信号;并对运算后的声波信号进行时频分析,计算声信号能量;判断模块34,用于根据设定的声信号能量阈值判断是否发生过热故障,若是,则进入定位模块;定位模块35,用于根据声信号能量数据结合声波传感器位置计算过热故障点坐标和温度;报警模块36,用于发出过热故障警报信息,并将故障点坐标和温度传输到监视模块;监视模块37,用于监视两相浸没式液冷服务器系统工作状态。
109.对于本发明提供的一种过热故障的识别方法、过热故障的识别装置的介绍请参照上述方法实施例,本发明在此不再赘述,其具有上述过热故障的识别方法相同的有益效果。
110.以上对本发明所提供的一种过热故障的识别设备、方法、装置、介质及服务器机柜进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
111.还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献