一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种故障定位方法、装置、设备及介质与流程

2023-07-23 06:08:29 来源:中国专利 TAG:


1.本技术涉及服务器技术领域,特别是涉及一种故障定位方法、装置、设备及介质。


背景技术:

2.基板管理控制器(baseboard management controller,bmc)是独立于服务器系统之外的小型操作系统,其形式可为集成在主板上的芯片,也可通过高速串行计算机扩展总线标准(peripheral component interconnect express,pcie)等形式插在主板上,对外表现形式只是一个标准的rj45网口,拥有独立网际互连协议(internet protocol,ip)的固件系统。服务器集群一般使用bmc指令进行大规模无人值守操作,包括服务器的远程管理、监控、安装、重启等。
3.bmc芯片形状较小,构成精细,内部运行着小型的操作系统,当bmc固件更新时可能会出现bmc芯片损坏或者是固件不完整等异常情况,造成bmc系统无法正常工作。而在bmc系统无法正常工作且服务器也无法开机的情况下,用户无法判断bmc芯片故障是什么原因所导致,对bmc芯片故障的排除更是无法实现,这极大地影响了故障定位效率。
4.鉴于上述问题,如何实现bmc芯片故障的快速定位,是本领域技术人员亟待解决的问题。


技术实现要素:

5.本技术的目的是提供一种故障定位方法、装置、设备及介质,以实现bmc芯片故障的快速定位。
6.为解决上述技术问题,本技术提供一种故障定位方法,包括:
7.当基板管理控制器芯片的固件更新出现故障时,建立与所述基板管理控制器芯片的通信连接;
8.判断更新的固件文件是否符合预设要求;
9.若是,则确认为所述基板管理控制器芯片故障;
10.若否,则确认为固件更新故障。
11.优选地,所述判断更新的固件文件是否符合预设要求包括:
12.获取所述基板管理控制器芯片中更新的所述固件文件,并获取本地存储的备份固件文件;
13.判断所述固件文件的文件大小与所述备份固件文件的文件大小是否相同;
14.若是,则确认为所述基板管理控制器芯片故障;
15.若否,则确认所述固件文件不完整,并确认为固件更新故障。
16.优选地,所述判断更新的固件文件是否符合预设要求包括:
17.获取所述基板管理控制器芯片中更新的所述固件文件的数字签名,并获取本地存储的备份固件文件的数字签名;
18.判断所述固件文件的数字签名与所述备份固件文件的数字签名是否相同;
19.若是,则确认为所述基板管理控制器芯片故障;
20.若否,则确认所述固件文件已被修改,并确认为固件更新故障。
21.优选地,在所述确认为固件更新故障之后,还包括:
22.根据所述备份固件文件对所述基板管理控制器芯片进行固件更新。
23.优选地,在所述根据所述备份固件文件对所述基板管理控制器芯片进行固件更新之后,还包括:
24.断开与所述基板管理控制器芯片的通信连接。
25.优选地,在所述确认为固件更新故障之后,还包括:
26.生成包含固件更新故障信息的日志。
27.优选地,在所述确认为所述基板管理控制器芯片故障之后,还包括:
28.输出所述基板管理控制器芯片故障的提示信息;
29.生成包含所述基板管理控制器芯片故障信息的日志。
30.为解决上述技术问题,本技术还提供一种故障定位装置,包括:
31.通信模块,用于当基板管理控制器芯片的固件更新出现故障时,建立与所述基板管理控制器芯片的通信连接;
32.判断模块,用于判断更新的固件文件是否符合预设要求;若是,则触发第一确认模块,若否,则触发第二确认模块;
33.所述第一确认模块,用于确认为所述基板管理控制器芯片故障;
34.所述第二确认模块,用于确认为固件更新故障。
35.优选地,所述判断模块包括:
36.文件获取模块,用于获取所述基板管理控制器芯片中更新的所述固件文件,并获取本地存储的备份固件文件;
37.文件大小判断模块,用于判断所述固件文件的文件大小与所述备份固件文件的文件大小是否相同;若是,则确认为所述基板管理控制器芯片故障;若否,则确认所述固件文件不完整,并确认为固件更新故障。
38.优选地,所述判断模块包括:
39.数字签名获取模块,用于获取所述基板管理控制器芯片中更新的所述固件文件的数字签名,并获取本地存储的备份固件文件的数字签名;
40.数字签名判断模块,用于判断所述固件文件的数字签名与所述备份固件文件的数字签名是否相同;若是,则确认为所述基板管理控制器芯片故障;若否,则确认所述固件文件已被修改,并确认为固件更新故障。
41.优选地,还包括:
42.固件更新模块,用于在所述确认为固件更新故障之后,根据所述备份固件文件对所述基板管理控制器芯片进行固件更新。
43.优选地,还包括:
44.通信连接断开模块,用于在所述根据所述备份固件文件对所述基板管理控制器芯片进行固件更新之后,断开与所述基板管理控制器芯片的通信连接。
45.优选地,还包括:
46.第一日志生成模块,用于在所述确认为固件更新故障之后,生成包含固件更新故
障信息的日志。
47.优选地,还包括:
48.提示信息输出模块,用于在所述确认为所述基板管理控制器芯片故障之后,输出所述基板管理控制器芯片故障的提示信息;
49.第二日志生成模块,用于生成包含所述基板管理控制器芯片故障信息的日志。
50.为解决上述技术问题,本技术还提供一种故障定位设备,包括:
51.存储器,用于存储计算机程序;
52.处理器,用于执行所述计算机程序时实现上述的故障定位方法的步骤。
53.为解决上述技术问题,本技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的故障定位方法的步骤。
54.本技术所提供的故障定位方法,当基板管理控制器芯片的固件更新出现故障时,建立与基板管理控制器芯片的通信连接;判断更新的固件文件是否符合预设要求;若是,则确认为基板管理控制器芯片故障;若否,则确认为固件更新故障。由此可知,上述方案在固件更新故障时,通过固件文件对预设要求的满足关系准确地判断出了固件更新故障的原因,解决了基板管理控制器服务无法启动时快速定位基板管理控制器芯片的问题,提高了故障定位的效率,节省了时间成本,有助于测试人员对故障的尽快修复。
55.此外,本技术实施例还提供了一种故障定位装置、设备及介质,效果同上。
附图说明
56.为了更清楚地说明本技术实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
57.图1为本技术实施例提供的一种故障定位方法的流程图;
58.图2为本技术实施例提供的一种故障定位装置的示意图;
59.图3为本技术实施例提供的一种故障定位设备的示意图;
60.图4为本技术实施例提供的故障定位方法在应用场景中的流程图。
具体实施方式
61.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本技术保护范围。
62.本技术的核心是提供一种故障定位方法、装置、设备及介质,以实现bmc芯片故障的快速定位。
63.为了使本技术领域的人员更好地理解本技术方案,下面结合附图和具体实施方式对本技术作进一步的详细说明。
64.固件(firmware)一般存储于设备中的电可擦除只读存储器(electrically erasable programmable rom,eeprom)或flash芯片中,一般可由用户通过特定的刷新程序
进行升级的程序。一般来说,担任着一个数码产品最基础、最底层工作的软件才可以称之为固件,比如计算机主板上的基本输入/输出系统bios(basic input/output system)。
65.通常,硬件内所保存的程序是无法被用户直接读出或修改的。在以前一般情况下是没有必要对固件进行升级操作的,即使在固件内发现了严重的漏洞也必须由专业人员带着写好程序的芯片把原来机器上芯片的更换下来。早期固件芯片一般采用了rom设计,它的固件代码是在生产过程中固化的,用任何手段都无法修改。随着技术的不断发展,修改固件以适应不断更新的硬件环境成了用户们的迫切要求,所以,可重复写入的可编程可擦除只读存储器eprom(erasable programmable rom)、eeprom和flash出现了。这些芯片是可以重复刷写的,让固件得以修改和升级。
66.同样的,作为独立于服务器系统之外的小型操作系统,基板管理控制器芯片同样也需要进行固件更新升级,从而满足其对服务器的远程管理、监控、安装、重启等操作。然而,当固件更新时,如果基板管理控制器损坏或者是固件不完整等异常情况发生,就会造成基板管理控制器无法正常工作;而在基板管理控制器无法工作,服务器也无法开机的情况下,用户无法判断是什么原因所导致固件更新的故障,无法排除是基板管理控制器芯片本身硬件的原因还是固件的原因。因此,本技术实施例提供了一种故障定位方法,以解决上述问题。可以理解的是,本技术实施例所提供的故障定位方法,其具体的应用场景可为计算机、服务器或带有处理功能的存储介质。本实施例中对于故障定位方法的应用场景不做限制,根据具体的实施情况而定。
67.图1为本技术实施例提供的一种故障定位方法的流程图。如图1所示,方法包括:
68.s10:当基板管理控制器芯片的固件更新出现故障时,建立与基板管理控制器芯片的通信连接。
69.具体地,在基板管理控制器芯片进行固件更新时,监测基板管理控制器芯片的固件更新过程。当基板管理控制器芯片的固件更新出现故障时,建立起与基板管理控制器芯片的通信连接。需要注意的是,本技术实施例中对于与基板管理控制器芯片的通信连接的具体方式不做限制,可通过串口进行通信连接,还可通过无线通信连接,根据具体的实施情况而定。
70.s11:判断更新的固件文件是否符合预设要求;若是,则进入步骤s12;若否,则进入步骤s13。
71.s12:确认为基板管理控制器芯片故障。
72.s13:确认为固件更新故障。
73.进一步地,判断基板管理控制器芯片在本次更新的固件文件是否符合预设要求。需要注意的是,本实施例中对于预设要求不做限制,可具体为固件文件的大小需满足一个预设条件,可具体为固件文件需要与基板管理控制器芯片相匹配,还可为固件文件在更新写入基板管理控制器芯片的过程中未被修改,根据具体的实施情况而定。
74.当确认更新的固件文件符合预设要求时,则认为基板管理控制器芯片本次的固件更新正常,判定为基板管理控制器芯片的硬件故障;而当确认更新的固件文件不符合预设要求时,则认为基板管理控制器芯片本次的固件更新异常,判定为基板管理控制器芯片固件更新故障。
75.本实施例中,当基板管理控制器芯片的固件更新出现故障时,建立与基板管理控
制器芯片的通信连接;判断更新的固件文件是否符合预设要求;若是,则确认为基板管理控制器芯片故障;若否,则确认为固件更新故障。由此可知,上述方案在固件更新故障时,通过固件文件对预设要求的满足关系准确地判断出了固件更新故障的原因,解决了基板管理控制器服务无法启动时快速定位基板管理控制器芯片的问题,提高了故障定位的效率,节省了时间成本,有助于测试人员对故障的尽快修复。
76.在上述实施例的基础上,作为一种优选的实施例,判断更新的固件文件是否符合预设要求包括:
77.获取基板管理控制器芯片中更新的固件文件,并获取本地存储的备份固件文件;
78.判断固件文件的文件大小与备份固件文件的文件大小是否相同;
79.若是,则确认为基板管理控制器芯片故障;
80.若否,则确认固件文件不完整,并确认为固件更新故障。
81.在上述实施例中对于预设条件不做限制,根据具体的实施情况而定。而作为一种优选的实施例,在本实施例中,为判断更新的固件文件是否符合预设要求,具体首先需要获取基板管理控制器芯片中更新的固件文件,并获取本地存储的备份固件文件。
82.可以理解的是,为了获取固件文件对预设要求的满足关系,首先要获取本次更新的固件文件。在具体实施中,由于在确认基板管理控制器芯片发生固件更新故障时,已经与基板管理控制器芯片建立起了通信连接,则可直接通过通信连接从基板管理控制器芯片中获取本次更新的固件文件。同时,获取存储于本地的备份固件文件。可以理解的是,理论上基板管理控制器芯片更新的固件文件应与备份固件文件相同。
83.进一步判断固件文件的文件大小与备份固件文件的文件大小是否相同,即对二者进行大小的比对。如果比对结果不一致,二者大小不同,则认为更新的固件文件不完整,可以确认为固件更新故障;如果比对结果一致,二者大小相同,则认为更新的固件文件完整,可以确认为基板管理控制器芯片故障。
84.本实施例中,通过获取基板管理控制器芯片中更新的固件文件,并获取本地存储的备份固件文件;判断固件文件的文件大小与备份固件文件的文件大小是否相同;若是,则确认为基板管理控制器芯片故障;若否,则确认固件文件不完整,并确认为固件更新故障。实现了对更新的固件文件是否符合预设要求的判断,准确地进行了故障定位。
85.在上述实施例的基础上,作为一种优选的实施例,判断更新的固件文件是否符合预设要求包括:
86.获取基板管理控制器芯片中更新的固件文件的数字签名,并获取本地存储的备份固件文件的数字签名;
87.判断固件文件的数字签名与备份固件文件的数字签名是否相同;
88.若是,则确认为基板管理控制器芯片故障;
89.若否,则确认固件文件已被修改,并确认为固件更新故障。
90.在上述实施例中给出了判断更新的固件文件是否符合预设要求的一种方式。作为一种优选的实施例,在具体实施中,判断更新的固件文件是否符合预设要求,还可通过比较固件文件与本地存储的备份固件文件的数字签名来实现。
91.具体地,首先获取基板管理控制器芯片中更新的固件文件的数字签名,并获取本地存储的备份固件文件的数字签名。数字签名(又称公钥数字签名)是只有信息的发送者才
能产生的别人无法伪造的一段数字串,这段数字串同时也是对信息的发送者发送信息真实性的一个有效证明。它是一种类似写在纸上的普通的物理签名,但是在使用了公钥加密领域的技术来实现的,用于鉴别数字信息的方法。一套数字签名通常定义两种互补的运算,一个用于签名,另一个用于验证。数字签名是非对称密钥加密技术与数字摘要技术的应用。
92.数字签名算法依靠公钥加密技术来实现的。在公钥加密技术里,每一个使用者有一对密钥:一把公钥和一把私钥。公钥可以自由发布,但私钥则秘密保存。普通的数字签名算法包括密码生成算法、标记算法和验证算法。其中还存在哈希算法的数字签名与验证,哈希函数是一种“压缩函数”,利用哈希函数可以把任意长度的输入经由散列函数算法变换成固定长度的输出,该输出的哈希值就是消息摘要,也称数字摘要。在正式的数字签名中,发送方首先对发送文件采用哈希算法,得到一个固定长度的消息摘要(message digest);再用自己的私钥(secret key,sk)对消息摘要进行签名,形成发送方的数字签名。数字签名将作为队件和原文一起发送给接收方;接收方首先用发送方的公钥对数字签名进行解密得到发送方的数字摘要,然后用相同的哈希函数对原文进行哈希计算,得到一个新的消息摘要,最后将消息摘要与收到的消息摘要做比较。而基于非对称密钥加密体制的数字签名与验证中,发送方首先将原文用自己的私钥加密得到数字签名,然后将原文和数字签名一起发送给接收方。接收方用发送方的公钥对数字签名进行解密,最后与原文进行比较。由此可知,数字签名是电子商务、电子政务中应用普遍、技术成熟、可操作性强的一种电子签名方法。它采用了规范化的程序和科学化的方法,用于鉴定签名人的身份以及对一项电子数据内容的认可。使用数字签名技术能够验证文件的原文在传输过程中有无变动,确保传输电子文件的完整性、真实性和不可抵赖性。
93.而在具体实施例中,如果固件文件未被修改,则理论上固件文件的数字签名应与备份固件文件的数字签名相同。因此通过将固件文件的数字签名与备份固件文件的数字签名进行比较,如果二者相同,则认为固件文件未被修改,可以确认为基板管理控制器芯片故障;如果二者不同,则认为固件文件已被修改,可以确认为固件更新故障。
94.需要注意的是,在具体实施中,通过比较固件文件与备份固件文件的数字签名来进行故障定位的方式,以及上述实施例中通过比较固件文件与备份固件文件的大小来进行故障定位的方式,这两种定位方式可以选择其中一种实施,也可以同时实施,从而达到更好的故障定位效果,在本实施例中不做限制,根据具体的实施情况而定。
95.本实施例中,通过获取基板管理控制器芯片中更新的固件文件的数字签名,并获取本地存储的备份固件文件的数字签名;判断固件文件的数字签名与备份固件文件的数字签名是否相同;若是,则确认为基板管理控制器芯片故障;若否,则确认固件文件已被修改,并确认为固件更新故障。实现了对更新的固件文件是否符合预设要求的判断,准确地进行了故障定位。
96.为了完成基板管理控制器芯片的固件更新,在上述实施例的基础上,作为一种优选的实施例,在确认为固件更新故障之后,还包括:
97.根据备份固件文件对基板管理控制器芯片进行固件更新。
98.在具体实施中,当确认基板管理控制器芯片固件更新发生了固件更新故障时,为了保证基板管理控制器芯片正常的固件更新,进一步保证基板管理控制器芯片及服务器的正常运行,作为一种优选的实施例,在本实施例中,在确认基板管理控制器芯片发生固件更
新故障之后,根据备份固件文件对基板管理控制器芯片进行固件更新,即利用本地存储的正确的备份固件文件对备份固件文件重新进行固件更新,从而保证基板管理控制器芯片的正常运行。
99.本实施例中,在确认为固件更新故障之后,根据备份固件文件对基板管理控制器芯片进行固件更新。保证了基板管理控制器芯片及服务器的正常运行。
100.在上述实施例的基础上,作为一种优选的实施例,在根据备份固件文件对基板管理控制器芯片进行固件更新之后,还包括:
101.断开与基板管理控制器芯片的通信连接。
102.具体地,在根据备份固件文件对基板管理控制器芯片进行固件更新之后,基板管理控制器芯片正常运行,则此时不再需要对基板管理控制器芯片进行监测。此时断开与基板管理控制器芯片的通信连接,进一步节省了系统功耗,并等待下一次固件更新时的通信连接。
103.在上述实施例的基础上,作为一种优选的实施例,在确认为固件更新故障之后,还包括:
104.生成包含固件更新故障信息的日志。
105.在具体实施中,为了更好地记录固件更新故障的相关信息,作为一种优选的实施例,在本实施例中在确认为固件更新故障之后,生成包含固件更新故障信息的日志。以上述实施例中记载的内容为例:当检查固件文件的完整性时,将固件文件与备份固件文件进行一个大小的比对,若比对结果不一致,则认为更新的固件文件不完整,对此结果记录在日志中。当检查固件文件是否被修改过时,将固件文件与备份固件文件的数字签名进行比对,若签名不一致,则确认固件文件已被修改,对此结果记录在日志中。
106.需要注意的是,生成包含固件更新故障信息的日志,一方面能够对固件更新故障进行记录,以便于后续工作人员对故障过程进行审计;另一方面由于日志的存在,使得工作人员能够直接通过日志的内容来确定固件更新故障的具体故障原因,从而大大减少排查故障的时间,提高排查效率。
107.在上述实施例的基础上,作为一种优选的实施例,在确认为基板管理控制器芯片故障之后,还包括:
108.输出基板管理控制器芯片故障的提示信息;
109.生成包含基板管理控制器芯片故障信息的日志。
110.在具体实施中,当确认基板管理控制器芯片发生故障时,为了提示工作人员对发生故障的基板管理控制器芯片进行更换,输出基板管理控制器芯片故障的提示信息。可以理解的是,在本实施例中提示信息的输出方式可为语音播报、指示灯告警或弹窗提示,在本实施例中对于提示信息的输出方式不做限制,根据具体的实施情况而定。
111.进一步地,生成包含基板管理控制器芯片故障信息的日志,从而可以使工作人员对基板管理控制器芯片的故障情况进行评估查看,同时也可通过日志内容直接确定发生了基板管理控制器芯片故障,从而对该基板管理控制器芯片进行更换,节省了时间成本,提高了故障排查的效率。
112.在上述实施例中,对于故障定位方法进行了详细描述,本技术还提供故障定位装置对应的实施例。
113.图2为本技术实施例提供的一种故障定位装置的示意图。如图2所示,故障定位装置包括:
114.通信模块10,用于当基板管理控制器芯片的固件更新出现故障时,建立与基板管理控制器芯片的通信连接。
115.判断模块11,用于判断更新的固件文件是否符合预设要求;若是,则触发第一确认模块12,若否,则触发第二确认模块13。
116.第一确认模块12,用于确认为基板管理控制器芯片故障。
117.第二确认模块13,用于确认为固件更新故障。
118.作为一种优选的实施例,判断模块包括:
119.文件获取模块,用于获取基板管理控制器芯片中更新的固件文件,并获取本地存储的备份固件文件;
120.文件大小判断模块,用于判断固件文件的文件大小与备份固件文件的文件大小是否相同;若是,则确认为基板管理控制器芯片故障;若否,则确认固件文件不完整,并确认为固件更新故障。
121.具体地,在本实施例中,为判断更新的固件文件是否符合预设要求,首先通过文件获取模块获取基板管理控制器芯片中更新的固件文件,并获取本地存储的备份固件文件。
122.可以理解的是,为了获取固件文件对预设要求的满足关系,首先要获取本次更新的固件文件。在具体实施中,由于在确认基板管理控制器芯片发生固件更新故障时,已经与基板管理控制器芯片建立起了通信连接,则可直接通过通信连接从基板管理控制器芯片中获取本次更新的固件文件。同时,获取存储于本地的备份固件文件。可以理解的是,理论上基板管理控制器芯片更新的固件文件应与备份固件文件相同。
123.进一步通过文件大小判断模块判断固件文件的文件大小与备份固件文件的文件大小是否相同,即对二者进行大小的比对。如果比对结果不一致,二者大小不同,则认为更新的固件文件不完整,可以确认为固件更新故障;如果比对结果一致,二者大小相同,则认为更新的固件文件完整,可以确认为基板管理控制器芯片故障。
124.作为一种优选的实施例,判断模块包括:
125.数字签名获取模块,用于获取基板管理控制器芯片中更新的固件文件的数字签名,并获取本地存储的备份固件文件的数字签名;
126.数字签名判断模块,用于判断固件文件的数字签名与备份固件文件的数字签名是否相同;若是,则确认为基板管理控制器芯片故障;若否,则确认固件文件已被修改,并确认为固件更新故障。
127.在上述实施例中可通过文件获取模块和文件大小判断模块来实现判断更新的固件文件是否符合预设要求。作为一种优选的实施例,在具体实施中,判断更新的固件文件是否符合预设要求,还可通过数字签名获取模块和数字签名判断模块来实现。
128.具体地,首先通过数字签名获取模块获取基板管理控制器芯片中更新的固件文件的数字签名,并获取本地存储的备份固件文件的数字签名。数字签名(又称公钥数字签名)是只有信息的发送者才能产生的别人无法伪造的一段数字串,这段数字串同时也是对信息的发送者发送信息真实性的一个有效证明。它是一种类似写在纸上的普通的物理签名,但是在使用了公钥加密领域的技术来实现的,用于鉴别数字信息的方法。一套数字签名通常
定义两种互补的运算,一个用于签名,另一个用于验证。数字签名是非对称密钥加密技术与数字摘要技术的应用。
129.而在具体实施例中,如果固件文件未被修改,则理论上固件文件的数字签名应与备份固件文件的数字签名相同。因此通过数字签名判断模块将固件文件的数字签名与备份固件文件的数字签名进行比较,如果二者相同,则认为固件文件未被修改,可以确认为基板管理控制器芯片故障;如果二者不同,则认为固件文件已被修改,可以确认为固件更新故障。
130.需要注意的是,本实施例中通过数字签名获取模块和数字签名判断模块来进行故障定位的方式,以及上述实施例中通过文件获取模块和文件大小判断模块来进行故障定位的方式,这两种定位方式可以选择其中一种实施,也可以同时实施,从而达到更好的故障定位效果,在本实施例中不做限制,根据具体的实施情况而定。
131.本实施例中,通过数字签名获取模块获取基板管理控制器芯片中更新的固件文件的数字签名,并获取本地存储的备份固件文件的数字签名;通过数字签名判断模块判断固件文件的数字签名与备份固件文件的数字签名是否相同;若是,则确认为基板管理控制器芯片故障;若否,则确认固件文件已被修改,并确认为固件更新故障。实现了对更新的固件文件是否符合预设要求的判断,准确地进行了故障定位。
132.作为一种优选的实施例,还包括:
133.固件更新模块,用于在确认为固件更新故障之后,根据备份固件文件对基板管理控制器芯片进行固件更新。
134.在具体实施中,当确认基板管理控制器芯片固件更新发生了固件更新故障时,为了保证基板管理控制器芯片正常的固件更新,进一步保证基板管理控制器芯片及服务器的正常运行,作为一种优选的实施例,在本实施例中,利用固件更新模块在确认基板管理控制器芯片发生固件更新故障之后,根据备份固件文件对基板管理控制器芯片进行固件更新,即利用本地存储的正确的备份固件文件对备份固件文件重新进行固件更新,从而保证基板管理控制器芯片的正常运行。
135.作为一种优选的实施例,还包括:
136.通信连接断开模块,用于在根据备份固件文件对基板管理控制器芯片进行固件更新之后,断开与基板管理控制器芯片的通信连接。
137.作为一种优选的实施例,还包括:
138.第一日志生成模块,用于在确认为固件更新故障之后,生成包含固件更新故障信息的日志。
139.在具体实施中,为了更好地记录固件更新故障的相关信息,作为一种优选的实施例,在本实施例中利用第一日志生成模块,能够在确认为固件更新故障之后,生成包含固件更新故障信息的日志。以上述实施例中记载的内容为例:当检查固件文件的完整性时,将固件文件与备份固件文件进行一个大小的比对,若比对结果不一致,则认为更新的固件文件不完整,利用第一日志生成模块对此结果记录在日志中。当检查固件文件是否被修改过时,将固件文件与备份固件文件的数字签名进行比对,若签名不一致,则确认固件文件已被修改,利用第一日志生成模块对此结果记录在日志中。
140.需要注意的是,利用第一日志生成模块生成包含固件更新故障信息的日志,一方
面能够对固件更新故障进行记录,以便于后续工作人员对故障过程进行审计;另一方面由于日志的存在,使得工作人员能够直接通过日志的内容来确定固件更新故障的具体故障原因,从而大大减少排查故障的时间,提高排查效率。
141.作为一种优选的实施例,还包括:
142.提示信息输出模块,用于在确认为基板管理控制器芯片故障之后,输出基板管理控制器芯片故障的提示信息;
143.第二日志生成模块,用于生成包含基板管理控制器芯片故障信息的日志。
144.本实施例中,故障定位装置包括通信模块、判断模块、第一确认模块和第二确认模块。故障定位装置在运行时能够实现上述实施例中故障定位方法的全部步骤。当基板管理控制器芯片的固件更新出现故障时,建立与基板管理控制器芯片的通信连接;判断更新的固件文件是否符合预设要求;若是,则确认为基板管理控制器芯片故障;若否,则确认为固件更新故障。由此可知,上述方案在固件更新故障时,通过固件文件对预设要求的满足关系准确地判断出了固件更新故障的原因,解决了基板管理控制器服务无法启动时快速定位基板管理控制器芯片的问题,提高了故障定位的效率,节省了时间成本,有助于测试人员对故障的尽快修复。
145.图3为本技术实施例提供的一种故障定位设备的示意图。如图3所示,故障定位设备包括:
146.存储器20,用于存储计算机程序。
147.处理器21,用于执行计算机程序时实现如上述实施例中所提到的故障定位的方法的步骤。
148.本实施例提供的故障定位设备可以包括但不限于智能手机、平板电脑、笔记本电脑或台式电脑等。
149.其中,处理器21可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器21可以采用数字信号处理器(digital signal processor,dsp)、现场可编程门阵列(field-programmable gate array,fpga)、可编程逻辑阵列(programmable logic array,pla)中的至少一种硬件形式来实现。处理器21也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称中央处理器(central processing unit,cpu);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器21可以在集成有图形处理器(graphics processing unit,gpu),gpu用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器21还可以包括人工智能(artificial intelligence,ai)处理器,该ai处理器用于处理有关机器学习的计算操作。
150.存储器20可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器20还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器20至少用于存储以下计算机程序201,其中,该计算机程序被处理器21加载并执行之后,能够实现前述任一实施例公开的故障定位方法的相关步骤。另外,存储器20所存储的资源还可以包括操作系统202和数据203等,存储方式可以是短暂存储或者永久存储。其中,操作系统202可以包括windows、unix、linux等。数据203可以包括但不限于故障定位方法涉及到的数据。
151.在一些实施例中,故障定位设备还可包括有显示屏22、输入输出接口23、通信接口24、电源25以及通信总线26。
152.本领域技术人员可以理解,图3中示出的结构并不构成对故障定位设备的限定,可以包括比图示更多或更少的组件。
153.本实施例中,故障定位设备包括存储器和处理器。存储器用于存储计算机程序。处理器用于执行计算机程序时实现如上述实施例中所提到的故障定位的方法的步骤。当基板管理控制器芯片的固件更新出现故障时,建立与基板管理控制器芯片的通信连接;判断更新的固件文件是否符合预设要求;若是,则确认为基板管理控制器芯片故障;若否,则确认为固件更新故障。由此可知,上述方案在固件更新故障时,通过固件文件对预设要求的满足关系准确地判断出了固件更新故障的原因,解决了基板管理控制器服务无法启动时快速定位基板管理控制器芯片的问题,提高了故障定位的效率,节省了时间成本,有助于测试人员对故障的尽快修复。
154.最后,本技术还提供一种计算机可读存储介质对应的实施例。计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述方法实施例中记载的步骤。
155.可以理解的是,如果上述实施例中的方法以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
156.本实施例中,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述方法实施例中记载的步骤。当基板管理控制器芯片的固件更新出现故障时,建立与基板管理控制器芯片的通信连接;判断更新的固件文件是否符合预设要求;若是,则确认为基板管理控制器芯片故障;若否,则确认为固件更新故障。由此可知,上述方案在固件更新故障时,通过固件文件对预设要求的满足关系准确地判断出了固件更新故障的原因,解决了基板管理控制器服务无法启动时快速定位基板管理控制器芯片的问题,提高了故障定位的效率,节省了时间成本,有助于测试人员对故障的尽快修复。
157.为了使本领域的技术人员更好的理解本技术的技术方案,下面结合附图4对上述本技术作进一步的详细说明。图4为本技术实施例提供的故障定位方法在应用场景中的流程图。如图4所示,该方法包括:
158.s20:监测基板管理控制器固件更新。
159.s21:当基板管理控制器固件更新出现故障时,建立起与基板管理控制器芯片的通信连接。
160.s22:检查固件文件的完整性,并生成日志。
161.s23:检查固件文件是否被修改过,并生成日志。
162.s24:当确认固件文件完整且未被修改,则判定为基板管理控制器芯片硬件故障,并生成日志。
163.具体地,本技术方法的应用场景可为一种计算机、存储设备或可移动计算机可读存储介质,可以直接插在服务器主板上,能够具有存储和数据处理的功能。其存储部分主要包含的基板管理控制器的备份固件和固件更新的故障信息记录日志,处理部分为计算机程序被处理器执行时实现基板管理控制器固件恢复功能。
164.在具体实施中,在基板管理控制器进行固件更新时监测基板管理控制器固件更新。当基板管理控制器固件更新出现故障时,建立起与基板管理控制器芯片的通信连接。可以理解的是,该通信连接可为有线通信连接或无线通信连接。在建立起通信连接后,进行以下几项的检查和处理:
165.首先,检查固件文件的完整性,具体获取基板管理控制器芯片本次更新的固件文件,与本地存储介质中的备份固件文件进行一个大小的比对;若比对结果不一致,则为更新的固件文件不完整,对此结果记录在本地的日志文件中。然后执行写入的基板管理控制器芯片更新指令,利用本地的备份固件文件进行基板管理控制器芯片更新启动。基板管理控制器芯片固件的故障恢复后,则断开与基板管理控制器芯片的通信连接。
166.进一步地,检查固件文件是否被修改过,具体获取基板管理控制器芯片本次更新的固件文件的数字签名,与本地存储的备份固件文件的数字签名进行比对;若签名不一致,则固件文件已被修改,对此结果记录在本地的日志文件中。然后执行写入的基板管理控制器芯片更新指令,利用本地的备份固件文件进行基板管理控制器芯片更新启动。基板管理控制器芯片固件的故障恢复后,则断开与基板管理控制器芯片的通信连接。
167.以上能够实现对固件更新故障的判断,而如果检查的固件文件完整且没有被修改过,则判定为基板管理控制器芯片的硬件故障,将该结果记录在本地的日志文件中。以此,用户可以直接通过检测结果,或通过查看记录的日志文件,从而确定基板管理控制器芯片更新故障的原因。这样可以大大减少排查故障的时间,提高效率。
168.以上对本技术所提供的一种故障定位方法、装置、设备及介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以对本技术进行若干改进和修饰,这些改进和修饰也落入本技术权利要求的保护范围内。
169.还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表