一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种提高电源oring可靠性的方法及系统与流程

2022-11-09 21:34:15 来源:中国专利 TAG:


1.本技术涉及服务器电源可靠性技术领域,特别是涉及一种提高电源oring(多路冗余,并联隔离)可靠性的方法及系统。


背景技术:

2.随着云计算技术的发展,高功率密度服务器的应用越来越广泛,相应地,用户对整个系统可靠性的需求越来越高,为不断地提高系统的整机可靠性,多台电源并机使用的场景被系统应用端广泛采用。
3.多台电源之间主要通过mos(metal oxide semiconductor field effect transistor-金属氧化物半导体场效应晶体管)来实现并机隔离,简称oring-mos。这种方式应用简单,mos开通时大电流的损耗很小,当某台电源失效时,oring mos关断,实现隔离保护,不影响其它电源的输出。但是,大功率高电流输出电源中多个oring-mos并联使用,当oring-mos驱动异常mos无法完全导通的情况,会出现大电流过mos的体内二极管而产生大量损耗以及发热问题,长期工作甚至有可能出现烧pcb的风险,因此,如何提高电源oring的可靠性,是个重要的技术问题。
4.目前提高电源oring可靠性的方法,主要是从硬件的角度,具体地,修改电源的oring线路,增加对oring-mos温度和压差的检测线路来监控保护电源,从而提高电源oring的可靠性。
5.然而目前提高电源oring可靠性的方法中,由于从硬件角度提高电源oring可靠性,改动不够方便,而且对于已经现网运行的设备无法更新优化,因此,目前提高电源oring可靠性的方法不便于操作,执行效率不够高,从而影响对电源oring可靠性的提高效果。


技术实现要素:

6.本技术提供了一种提高电源oring可靠性的方法及系统,以解决现有技术中提高电源oring可靠性的方法执行效率不够高的问题。
7.为了解决上述技术问题,本技术实施例公开了如下技术方案:
8.一种提高电源oring可靠性的方法,所述服务器电源中包括有多个并联连接的oring-mos,且所述服务器电源中包括互为冗余的电源psu0(power supply unit,供电单元)和psu1,psu0为主电源,psu1为备用电源,所述方法包括:
9.服务器电源运行过程中,判断输出电源的电流是否大于等于设定的电流阈值;
10.如果是,启动psu0和psu1的oring-mos压差检测;
11.分别对电源的oring线路隔离前电压和oring线路隔离后总线电压进行读取pmbus值采样;
12.根据oring线路隔离前电压和oring线路隔离后总线电压的pmbus寄存器值,利用公式voring=12v_f-12vrs,计算得出任一电源的oring-mos压差voring,其中,12v_f为oring线路隔离前电压,12vrs为oring线路隔离后总线电压;
13.判断所述任一电源的oring-mos压差voring是否小于等于设定的第一电压阈值;
14.如果是,判定mos管完全导通,所述任一电源的oring-mos工作正常;
15.如果否,判定mos管未完全导通,所述任一电源的oring-mos工作异常;
16.当所述任一电源的oring-mos工作异常时,根据所述任一电源的oring-mos压差,将oring线路故障划分为低风险级故障和高风险级故障;
17.根据oring线路故障的风险等级,控制所述任一电源执行告警响应模式或故障保护响应模式。
18.可选地,所述设定的电流阈值为50a。
19.可选地,所述分别对电源的oring线路隔离前电压和oring线路隔离后总线电压进行读取pmbus值采样,包括:
20.bmc通过iic总线以及对应电源的地址,分别与服务器系统的每个电源通信,读取电源的oring线路隔离前电压12v_f和oring线路隔离后总线电压12vrs的pmbus值;
21.bmc对oring线路隔离前电压12v_f pmbus值进行采样,寄存器赋值为8bh;
22.bmc对所述任一电源的oring线路隔离后总线电压12vrs的pmbus值进行采样,寄存器赋值为b8h。
23.可选地,根据所述任一电源的oring-mos压差,将oring线路故障划分为低风险级故障和高风险级故障,包括:
24.当oring-mos压差voring满足:voring≤第一电压阈值时,判定oring线路无故障;
25.当oring-mos压差voring满足:第一电压阈值《voring《第二电压阈值时,判定oring线路故障等级为低风险级故障;
26.当oring-mos压差voring满足:voring≥第二电压阈值时,判定oring线路故障等级为高风险级故障。
27.可选地,所述第一电压阈值为0.1v,所述第二电压阈值为0.3v。
28.可选地,所述根据oring线路故障的风险等级,控制所述任一电源执行告警响应模式或故障保护响应模式,包括:
29.当oring线路故障的风险等级为低风险级故障时,bmc控制所述任一电源执行告警响应模式;
30.当oring线路故障的风险等级为高风险级故障时,bmc控制所述任一电源执行故障保护响应模式。
31.可选地,当oring线路故障的风险等级为低风险级故障时,bmc控制所述任一电源执行告警响应模式包括:
32.当oring线路故障的风险等级为低风险级故障时,bmc发送冷备份指令给所述任一电源;
33.根据所获取的冷备份指令,所述任一电源关闭均流使能,调低输出电压使得所述任一电源进入待机状态;
34.当冗余电源中所述任一电源以外的另一电源发生故障时,低风险级故障的所述任一电源由待机状态进入开启工作状态。
35.可选地,当oring线路故障的风险等级为高风险级故障时,bmc控制所述任一电源执行故障保护响应模式,包括:
36.当oring线路故障的风险等级为高风险级故障时,bmc发送关机指令给所述任一电源;
37.根据所获取的关机指令,所述任一电源进入关机状态;
38.bmc上报所述任一电源oring故障,并记录日志;
39.根据所获取的更新命令,为所述任一电源槽口更新电源。
40.一种提高电源oring可靠性的系统,所述服务器电源中包括有多个并联连接的oring-mos,且所述服务器电源中包括互为冗余的电源psu0和psu1,psu0为主电源,psu1为备用电源,所述系统包括:
41.第一判断模块,用于服务器电源运行过程中,判断输出电源的电流是否大于等于设定的电流阈值,如果是,启动psu0和psu1的oring-mos压差检测,否则,不启动oring-mos压差检测;
42.采样模块,用于分别对电源的oring线路隔离前电压和oring线路隔离后总线电压进行读取pmbus值采样;
43.oring-mos压差计算模块,用于根据oring线路隔离前电压和oring线路隔离后总线电压的pmbus寄存器值,利用公式voring=12v_f-12vrs,计算得出任一电源的oring-mos压差voring,其中,12v_f为oring线路隔离前电压,12vrs为oring线路隔离后总线电压;
44.第二判断模块,用于判断所述任一电源的oring-mos压差voring是否小于等于设定的第一电压阈值,如果是,判定mos管完全导通,所述任一电源的oring-mos工作正常,如果否,判定mos管未完全导通,所述任一电源的oring-mos工作异常;
45.oring线路故障划分模块,用于当所述任一电源的oring-mos工作异常时,根据所述任一电源的oring-mos压差,将oring线路故障划分为低风险级故障和高风险级故障;
46.响应控制模块,用于根据oring线路故障的风险等级,控制所述任一电源执行告警响应模式或故障保护响应模式。
47.可选地,所述采样模块包括:
48.电压读取单元,用于通过iic总线以及对应电源的地址,分别与服务器系统的每个电源通信,读取电源的oring线路隔离前电压12v_f和oring线路隔离后总线电压12vrs的pmbus值;
49.第一采样单元,用于对oring线路隔离前电压12v_f pmbus值进行采样,寄存器赋值为8bh;
50.第二采样单元,用于对所述任一电源的oring线路隔离后总线电压12vrs的pmbus值进行采样,寄存器赋值为b8h。
51.本技术的实施例提供的技术方案可以包括以下有益效果:
52.本技术提供一种提高电源oring可靠性的方法,该方法在判定oring-mos驱动异常后,首先系统bmc分别对oring线路隔离前电压和oring线路隔离后总线电压进行采样,并根据采样结果更新电源固件,然后利用公式voring=12v_f-12vrs,计算得出psu1的oring-mos压差voring,根据压差将oring线路故障划分为低风险级故障和高风险级故障,最后根据oring线路故障的风险等级,控制psu1执行告警响应模式或故障保护响应模式。本实施例采用优化电源固件的方法提高电源oring可靠性,相比于现有技术,本实施例在电源固件中增加对隔离后总线电压12vrs的上报,这种方式所确定的oring-mos压差更加准确,而且这
种方式并不改变原有oring线路,能够有效提高电源oring可靠性。本实施例利用系统bmc对oring-mos前后压差进行判断和检测,从而监控电源oring mos的工作状态,进而进行电源相应的响应动作,相比于现有技术中的硬件处理方法,无需修改pcb线路,从电源和系统bmc固件升级的角度覆盖现网运行电源,在确保提高电源oring可靠性的同时,能够有效提高工作效率。另外,本实施例利用bmc监控电源oring线路,相比于现有技术中的硬件处理方法,以及电源自身监控方法,从系统的角度监控电源oring线路,有利于提高监控结果的准确性。
53.本技术还提供一种提高电源oring可靠性的系统,该系统主要包括:第一判断模块、采样模块、oring-mos压差计算模块、第二判断模块、oring线路故障划分模块和响应控制模块。这6个模块设置于同一个系统bmc中。通过第一判断模块和第二判断模块的设置,能够确定启动oring-mos压差检测的时刻和oring-mos工作异常的时刻。通过采样模块和oring-mos压差计算模块的设置,计算得出任一电源的oring-mos压差voring,最后通过oring线路故障划分模块和响应控制模块,任一电源的oring-mos工作异常时,根据不同的风险级故障启动相应的保护模式。从系统bmc角度监控电源oring线路,并提高电源oring可靠性,这种提高电源oring可靠性的结构,不必修改电源pcb线路,采用电源固件和bmc固件升级的方法即可覆盖现网运行电源,在确保提高系统运行的可靠性的同时,有利于提高系统的运行效率。而且本实施例的结构只需要固件升级,改动影响较小,操作简单,也有利于提高系统执行效率。
54.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本技术。
附图说明
55.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。
56.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
57.图1为本技术实施例所提供的一种提高电源oring可靠性的方法的流程示意图;
58.图2为本实施例中oring-mos电路原理示意图;
59.图3为12v输出oring前后的电源dsp(digital signal processing,数字信号处理)采样电路原理示意图;
60.图4为本技术实施例所提供的一种提高电源oring可靠性的系统的结构示意图。
具体实施方式
61.为了使本技术领域的人员更好地理解本技术中的技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范围。
62.为了更好地理解本技术,下面结合附图来详细解释本技术的实施方式。
63.参见图1,图1为本技术实施例所提供的一种提高电源oring可靠性的方法的流程示意图。由图1可知,本实施例中提高电源oring可靠性的方法,主要包括如下过程:
64.s1:服务器电源运行过程中,判断输出电源的电流是否大于等于设定的电流阈值。
65.本实施例中的电源为服务器电源,服务器电源中包括有多个并联连接的oring-mos,且服务器电源中包括互为冗余的电源psu0和psu1,定义psu0为主电源,psu1为备用电源。本实施例中oring-mos的电路原理图可以参见图2所示。图2是通过两个分立三极管检测电源隔离前12vl电压和12vo总线电压前后压差,即oring-mos源极和漏级来自驱动oring-mos的开通和关断。本实施例中以对备用电源psu1为例,进行提高电源oring可靠性方法的陈述。
66.通过检测服务电源正常运行过程中输出电源的电流,当有大电流流经mos管时能够及时发现,从而避免电源电路产生大量损耗以及发热问题,有利于提高电源oring可靠性。本实施例中设定的电流阈值可以设定为50a。也就是,当输出电源的电流大于等于50a时,执行步骤s2,否则继续执行步骤s1。该设定的电流阈值根据服务器器电源的额定功率确定。
67.如果输出电源的电流大于等于设定的电流阈值,执行步骤s2:启动psu0和psu1的oring-mos压差检测。
68.否则,输出电源的电流小于设定的电流阈值,不启动电源的oring-mos压差检测,继续执行步骤s1。
69.s3:分别对电源的oring线路隔离前电压和oring线路隔离后总线电压进行读取pmbus值采样。
70.具体地,步骤s3包括如下过程:
71.s31:bmc通过iic总线以及对应电源的地址,分别与服务器系统的每个电源通信,读取电源的oring线路隔离前电压12v_f和oring线路隔离后总线电压12vrs的pmbus值。
72.s32:bmc对oring线路隔离前电压12v_f pmbus值进行采样,寄存器赋值为8bh。
73.本实施例可以利用dsp进行电压采样。本实施例中dsp采样电路的电路原理可以参见图3所示。图3为12v输出oring前后的电源dsp采样电路原理示意图。
74.s33:bmc对任一电源的oring线路隔离后总线电压12vrs的pmbus值进行采样,寄存器赋值为b8h。
75.根据以上步骤s31-s33,dsp会分别采样oring线路隔离前电压12v_f和总线电压12v_rs,本实施例中电源pmbus除了对隔离前电压12v_f进行了上报,寄存器为8bh(pmbus_cmd_read_vout)linear-16read word。电源pmbus还增加对隔离后总线电压12v_rs进行上报,赋值寄存器为b8h(pmbus_cmd_read_vout)linear-16read word,读法和格式与8bh一样。
76.继续参见图1可知,分别对电源的oring线路隔离前电压和oring线路隔离后总线电压进行读取pmbus值采样之后,执行步骤s4:根据oring线路隔离前电压和oring线路隔离后总线电压的pmbus寄存器值,利用公式voring=12v_f-12vrs,计算得出任一电源的oring-mos压差voring。其中,12v_f为oring线路隔离前电压,12vrs为oring线路隔离后总线电压。
77.s5:判断任一电源的oring-mos压差voring是否小于等于设定的第一电压阈值。
78.如果任一电源的oring-mos压差voring小于等于设定的第一电压阈值,执行步骤s6:判定mos管完全导通,任一电源的oring-mos工作正常。
79.如果任一电源的oring-mos压差voring大于设定的第一电压阈值,执行步骤s7:判定mos管未完全导通,任一电源的oring-mos工作异常。
80.s8:当任一电源的oring-mos工作异常时,根据任一电源的oring-mos压差,将oring线路故障划分为低风险级故障和高风险级故障。
81.具体地,步骤s8包括如下过程:
82.s81:当oring-mos压差voring满足:voring≤第一电压阈值时,判定oring线路无故障。
83.s82:当oring-mos压差voring满足:第一电压阈值《voring《第二电压阈值时,判定oring线路故障等级为低风险级故障。
84.本实施例以判断psu1的oring-mos压差为例。利用bmc对psu1持续检测3轮,每轮检测2次,每次间隔200ms,检测结果都符合第一电压阈值《voring《第二电压阈值时,判定oring线路故障等级为低风险级故障。
85.s83:当oring-mos压差voring满足:voring≥第二电压阈值时,判定oring线路故障等级为高风险级故障。
86.本实施例中第一电压阈值和第二电压阈值根据mos管的导通阻抗和输出电流确定,当mos管完全导通时,导通阻抗很小,通常voring不到0.1v。
87.第一电压阈值可以取值0.1v,第二电压阈值可以取值0.3v。该阈值的设置,能够相对准确地评估是否发生oring线路故障,以及oring线路故障的级别,有利于提高对电源oring可靠性评估的效率。
88.s9:根据oring线路故障的风险等级,控制任一电源执行告警响应模式或故障保护响应模式。
89.本实施例中根据oring线路故障的风险等级,设置有oring告警点和oring故障点。
90.具体地,步骤s9包括如下过程:
91.s91:当oring线路故障的风险等级为低风险级故障时,bmc控制该任一电源执行告警响应模式。
92.也就是触发oring告警点,执行步骤s91,触发oring故障点执行步骤s92。
93.进一步地,步骤s91包括如下过程:
94.s911:当oring线路故障的风险等级为低风险级故障时,bmc发送冷备份指令给该任一电源;
95.s912:根据所获取的冷备份指令,该任一电源关闭均流使能,调低输出电压使得psu1进入待机状态;
96.s913:当冗余电源中该任一电源以外的另一电源发生故障时,低风险级故障的该任一电源由待机状态进入开启工作状态。
97.由以上步骤s911-s913可知,当oring线路故障的风险等级为低风险级故障时,触发oring告警点,用于提醒系统psu1电源oring线路有低风险异常。此时bmc给psu1发送冷备份指令,使得psu1进入冷备份,psu1关闭均流使能,psu1调低输出电压为11.8v,使得psu1处
于待机不流经负载的情况。这种情况能够确保在psu0出现失效时,psu1实际voring压差在0.15v-0.3v之间,为oring故障的低风险级别,即使psu1工作也不会出现烧板或其他风险,psu1不是关闭状态,能够及时被唤醒,因此,这种方法当psu0出现失效时,使得psu1能够从冷备份转为运行状态,从而确保整个系统不宕机,提高电源oring可靠性,进而提高整个系统的可靠性和稳定性。而psu0没有故障时,psu0流经负载电流,负载电流不会流过oring处于低风险级故障的psu1。
98.s92:当ring线路故障的风险等级为高风险级故障时,bmc控制该任一电源执行故障保护响应模式。
99.进一步地,步骤s92包括如下过程:
100.s921:当oring线路故障的风险等级为高风险级故障时,bmc发送关机指令给该任一电源。
101.与低风险级故障判断原理相似,在判定oring线路故障位高风险级故障时,本实施例所采用的方法是:利用bmc对psu1持续检测3轮,每轮检测2次,每次间隔200ms,检测结果都符合voring》第二电压阈值时,判定oring线路故障等级为高风险级故障。
102.s922:根据所获取的关机指令,该任一电源进入关机状态。
103.s923:bmc上报该任一电源oring故障,并记录日志。
104.通过记录相关日志,便于后续进行故障处理。
105.s924:根据所获取的更新命令,为该任一电源槽口更新电源。
106.由步骤s921-s924可知,当oring线路故障的风险等级为高风险级故障时,触发oring故障点,用于提醒系统psu1电源oring线路有高风险异常。同时bmc给psu1发送关机指令,psu0此时正常运行,同时为psu1槽口更新性能良好的电源,从而避免psu1d的oring线路故障一直运行。
107.进一步地,本实施例中针对不同的故障级别,采用不同的指示灯进行显示,有利于用户直观确认oring线路故障,从而提高用户体验。例如:oring线路无故障时,绿灯亮起;oring线路低风险级故障时,故障橙色灯闪,表示告警;oring线路高风险级故障时,故障橙色灯常亮起,表示有故障。
108.实施例二
109.在图1-图3所示实施例的基础上参见图4,图4为本技术实施例所提供的一种提高电源oring可靠性的系统的结构示意图。由图4可知,本实施例中提高电源oring可靠性的系统,主要包括:第一判断模块、采样模块、oring-mos压差计算模块、第二判断模块、oring线路故障划分模块和响应控制模块。这6个模块设置于同一个系统bmc中。服务器电源中包括有多个并联连接的oring-mos,且所述服务器电源中包括互为冗余的电源psu0和psu1,psu0为主电源,psu1为备用电源。
110.其中,第一判断模块,用于服务器电源运行过程中,判断输出电源的电流是否大于等于设定的电流阈值,如果是,启动psu0和psu1的oring-mos压差检测,否则,不启动oring-mos压差检测;采样模块,用于分别对电源的oring线路隔离前电压和oring线路隔离后总线电压进行读取pmbus值采样;oring-mos压差计算模块,用于根据oring线路隔离前电压和oring线路隔离后总线电压的pmbus寄存器值,利用公式voring=12v_f-12vrs,计算得出任一电源的oring-mos压差voring,其中,12v_f为oring线路隔离前电压,12vrs为oring线路
隔离后总线电压;第二判断模块,用于判断任一电源的oring-mos压差voring是否小于等于设定的第一电压阈值,如果是,判定mos管完全导通,任一电源的oring-mos工作正常,如果否,判定mos管未完全导通,任一电源的oring-mos工作异常;oring线路故障划分模块,用于当任一电源的oring-mos工作异常时,根据任一电源的oring-mos压差,将oring线路故障划分为低风险级故障和高风险级故障;响应控制模块,用于根据oring线路故障的风险等级,控制任一电源执行告警响应模式或故障保护响应模式。
111.进一步地,采样模块包括:电压读取单元、第一采样单元和第二采样单元。其中,电压读取单元,用于通过iic总线以及对应电源的地址,分别与服务器系统的每个电源通信,读取电源的oring线路隔离前电压12v_f和oring线路隔离后总线电压12vrs的pmbus值;第一采样单元,用于对oring线路隔离前电压12v_f pmbus值进行采样,寄存器赋值为8bh;第二采样单元,用于对任一电源的oring线路隔离后总线电压12vrs的pmbus值进行采样,寄存器赋值为b8h。
112.该实施例中提高电源oring可靠性的系统的工作原理和工作方法,在图1-图3所示的实施例中已经详细阐述,两个实施例之间可以互相参照,在此不再赘述。
113.以上所述仅是本技术的具体实施方式,使本领域技术人员能够理解或实现本技术。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下,在其它实施例中实现。因此,本技术将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献