一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种服务器故障硬盘自动定位系统、方法及装置与流程

2022-05-27 01:58:04 来源:中国专利 TAG:

1.本发明涉及故障硬盘自动定位领域,具体涉及一种服务器故障硬盘自动定位系统、方法及装置。


背景技术:

2.随着数据的不断增长,服务器的存储容量越来越高,硬盘数量不断增加,硬盘的运维工作量及复杂度也不断增加,如何有效提升硬盘的运维效率,降低人为判定故障硬盘的复杂度并提升运维的自动化程度成为了越来越紧迫的需求。在现有服务器系统中,通常会有大量的带内管理软件对硬盘进行管理,但这些软件运行在带内业务系统下,消耗了cpu和内存等系统资源,也存在着一定的安全性问题。


技术实现要素:

3.为解决上述问题,本发明提供一种服务器故障硬盘自动定位系统、方法及装置,通过带外管理系统进行硬盘监控,并自动对故障硬盘进行定位,通过此方法可以完全使用带外管理的方法对硬盘进行监控与管理,降低对cpu和内存的压力,节省系统资源,并提高硬盘监控系统的安全性。
4.第一方面,本发明的技术方案提供一种服务器故障硬盘自动定位系统,包括多个硬盘,各个硬盘分别通过硬盘背板与硬盘控制器连接,该装置还包括bmc芯片和设置在各个硬盘处的指示灯;bmc芯片通过i2c总线与硬盘控制器通信,并分别与各个指示灯连接;bmc芯片从硬盘控制器获取各个硬盘的硬盘信息,并判断是否有硬盘故障,当有硬盘故障时,bmc芯片控制故障硬盘处的指示灯亮起。
5.进一步地,bmc芯片还与用户客户端连接,当bmc芯片判断有硬盘故障时,记录故障信息并发送至用户客户端。
6.第二方面,本发明的技术方案提供一种服务器故障硬盘自动定位方法,由bmc芯片执行,包括以下步骤:从硬盘控制器获取各个硬盘的硬盘信息;基于所获取的所有硬盘信息,判断是否有硬盘故障;若有硬盘故障,则控制故障硬盘处的指示灯亮起。
7.进一步地,基于所获取的所有硬盘信息,判断是否有硬盘故障,具体包括:将所有硬盘信息进行汇总,并筛选出错误信息;将筛选出的错误信息根据用户自定义的报错机制进行逻辑判断;当某个硬盘的错误信息出现用户自定义的错误时,判断为该硬盘故障。
8.进一步地,该方法还包括以下步骤:当某个硬盘的错误信息出现用户自定义的错误时,记录该硬盘的错误信息,并发送至用户客户端。
9.进一步地,该方法还包括以下步骤:将筛选出的错误信息根据用户自定义的报错机制进行逻辑判断的结果记录在运维日志。
10.进一步地,该方法还包括以下步骤:当出现硬盘故障后,定时监测故障硬盘是否已更换并消除错误信息;若是,则将故障硬盘处的指示灯熄灭,并记录运维日志。
11.第三方面,本发明的技术方案提供一种服务器故障硬盘自动定位装置,配置于bmc芯片,包括,硬盘信息获取模块:从硬盘控制器获取各个硬盘的硬盘信息;硬盘故障判断模块:基于所获取的所有硬盘信息,判断是否有硬盘故障;指示灯控制模块:若有硬盘故障,则控制故障硬盘处的指示灯亮起。
12.进一步地,硬盘故障判断模块基于所获取的所有硬盘信息,判断是否有硬盘故障,具体包括:将所有硬盘信息进行汇总,并筛选出错误信息;将筛选出的错误信息根据用户自定义的报错机制进行逻辑判断;当某个硬盘的错误信息出现用户自定义的错误时,判断为该硬盘故障。
13.进一步地,该装置还包括,硬盘故障发送模块:当某个硬盘的错误信息出现用户自定义的错误时,记录该硬盘的错误信息,并发送至用户客户端。
14.本发明提供的一种服务器故障硬盘自动定位系统、方法及装置,相对于现有技术,具有以下有益效果:由bmc芯片从硬盘控制器获取硬盘信息,根据硬盘信息判断硬盘故障,在硬盘故障时控制相应指示灯点亮以指示故障硬盘位置。本发明通过带外管理系统进行硬盘监控,并自动对故障硬盘进行定位,通过此方法可以完全使用带外管理的方法对硬盘进行监控与管理,降低对cpu和内存的压力,节省系统资源,并提高硬盘监控系统的安全性。
附图说明
15.为了更清楚的说明本技术实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
16.图1为当前服务器系统带内硬盘管理示意图。
17.图2为本发明实施例一提供的一种服务器故障硬盘自动定位系统结构示意图。
18.图3为本发明实施例二提供的一种服务器故障硬盘自动定位系统结构示意图。
19.图4为本发明实施例三提供的一种服务器故障硬盘自动定位方法流程示意图。
20.图5为本发明实施例三提供的一种服务器故障硬盘自动定位方法一具体实施例流程示意图。
21.图6为本发明实施例四提供一种服务器故障硬盘自动定位装置结构示意框图。
具体实施方式
22.以下对本发明涉及的部分术语进行解释。
23.bmc:baseboard management cotroller(基板管理控制器),是对服务器进行管理的模块,其主要对于服务器的功耗,温度,故障,散热等运行状态进行监控与管理的模块。
24.带内系统:通常是指cpu/ddr/网络等承载实际业务的系统模块。
25.带外系统:通常是指bmc等对整个服务器的业务系统提供监控管理等保障功能的系统,例如,bmc模块即是一种带外系统模块,bmc主要是为服务器提供散热,温度,功耗等监控及管理功能,只是为cpu/ddr/网卡等这些业务系统模块提供保证,并不承载实际的业务。
26.为了使本技术领域的人员更好地理解本技术方案,下面结合附图和具体实施方式对本技术作进一步的详细说明。显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
27.实施例一如图1所示为当前服务器系统带内硬盘管理示意图,cpu连接硬盘控制器,硬盘控制器连接硬盘背板,硬盘背板连接硬盘,通过在操作系统下安装对应的硬盘控制器驱动及硬盘管理系统,通过操作系统os》cpu》硬盘控制器》硬盘背板》硬盘这条路径对硬盘进行监控和管理。这种方法,需要在操作系统下安装硬盘管理系统,会占用cpu和ddr等系统资源,并且硬盘管理系统与客户的业务同时运行在带内的系统上,有着被外部客户控制并破坏硬盘数据的风险,随着网络破坏者的技术不断提升,为了保证安全性,会使得硬盘管理系统安全性要求越来越高,系统越来越繁重,给cpu等系统资源造成的压力越来越大。
28.因此,本实施例一提供一种服务器故障硬盘自动定位系统,通过bmc芯片对系统内硬盘进行监控,自动抓取硬盘故障信息,并控制硬盘的指示灯,便于用户故障定位。
29.如图2所示为本实施例一提供的一种服务器故障硬盘自动定位系统结构示意图,包括多个硬盘,各个硬盘分别通过硬盘背板与硬盘控制器连接,另外,硬盘控制器与cpu连接,cpu与操作系统通信。
30.为实现带外管理,本实施例的定位系统在各个硬盘处设置指示灯,用于在硬盘故障时指示硬盘位置。
31.bmc芯片通过i2c总线与硬盘控制器通信,并分别与各个指示灯连接。bmc芯片从硬盘控制器获取各个硬盘的硬盘信息,并判断是否有硬盘故障,当有硬盘故障时,bmc芯片控制故障硬盘处的指示灯亮起。
32.本实施例一提供的一种服务器故障硬盘自动定位系统,由bmc芯片从硬盘控制器获取硬盘信息,根据硬盘信息判断硬盘故障,在硬盘故障时控制相应指示灯点亮以指示故障硬盘位置。本发明通过带外管理系统进行硬盘监控,并自动对故障硬盘进行定位,通过此方法可以完全使用带外管理的方法对硬盘进行监控与管理,降低对cpu和内存的压力,节省系统资源,并提高硬盘监控系统的安全性。
33.实施例二在本实施例二提供一种服务器故障硬盘自动定位系统,在自动定位故障硬盘后,及时将故障信息发送给用户,以便及时检修。
34.如图3所示为本实施例二提供的一种服务器故障硬盘自动定位系统结构示意图,
包括多个硬盘,各个硬盘分别通过硬盘背板与硬盘控制器连接,另外,硬盘控制器与cpu连接,cpu与操作系统通信。
35.为实现带外管理,本实施例的定位系统在各个硬盘处设置指示灯,用于在硬盘故障时指示硬盘位置。
36.bmc芯片通过i2c总线与硬盘控制器通信,并分别与各个指示灯连接,同时与用户客户端。bmc芯片从硬盘控制器获取各个硬盘的硬盘信息,并判断是否有硬盘故障,当有硬盘故障时,bmc芯片控制故障硬盘处的指示灯亮起,同时记录故障信息并发送至用户客户端。需要说明的是,所记录并发送给用户客户端的故障信息包括故障硬盘的位置信息,可方便用户及时了解故障硬盘的位置,同时在现场结合指示灯的指示,快速找到故障硬盘进行检修,或者远程检修故障硬盘。
37.本实施例二提供的一种服务器故障硬盘自动定位系统,由bmc芯片从硬盘控制器获取硬盘信息,根据硬盘信息判断硬盘故障,在硬盘故障时控制相应指示灯点亮以指示故障硬盘位置。本发明通过带外管理系统进行硬盘监控,并自动对故障硬盘进行定位,通过此方法可以完全使用带外管理的方法对硬盘进行监控与管理,降低对cpu和内存的压力,节省系统资源,并提高硬盘监控系统的安全性。
38.实施例三在上述实施例一基础上,如图4所示,本实施例三提供一种服务器故障硬盘自动定位方法,由bmc芯片执行,实现硬盘故障的带外监控,定位故障硬盘,包括以下步骤。
39.s101,从硬盘控制器获取各个硬盘的硬盘信息。
40.s102,基于所获取的所有硬盘信息,判断是否有硬盘故障。
41.s103,若有硬盘故障,则控制故障硬盘处的指示灯亮起。
42.本实施例三提供的一种服务器故障硬盘自动定位方法,由bmc芯片从硬盘控制器获取硬盘信息,根据硬盘信息判断硬盘故障,在硬盘故障时控制相应指示灯点亮以指示故障硬盘位置。本发明通过带外管理系统进行硬盘监控,并自动对故障硬盘进行定位,通过此方法可以完全使用带外管理的方法对硬盘进行监控与管理,降低对cpu和内存的压力,节省系统资源,并提高硬盘监控系统的安全性。
43.考虑到不同用户所采用的报错机制不同,即用户自定义错误,当硬盘出现用户自定义的错误时才会判定为故障,当出现其他错误时,则不判定为故障。
44.基于此,上述步骤s102基于所获取的所有硬盘信息,判断是否有硬盘故障,具体包括以下步骤。
45.步骤一,将所有硬盘信息进行汇总,并筛选出错误信息。
46.步骤二,将筛选出的错误信息根据用户自定义的报错机制进行逻辑判断。
47.步骤三,当某个硬盘的错误信息出现用户自定义的错误时,判断为该硬盘故障。
48.本实施例中,为及时通知用户出现硬盘故障,在某个硬盘的错误信息出现用户自定义的错误时,除了点亮相应指示灯外,还记录该硬盘的错误信息,并发送至用户客户端。使用户可及时了解故障硬盘的位置,同时在现场结合指示灯的指示,快速找到故障硬盘进行检修,或者远程检修故障硬盘。
49.出现硬盘故障后,用户检修故障硬盘,此时bmc芯片也定时(例如每隔三分钟)监测故障硬盘是否已更换并消除错误信息,若是,则将故障硬盘处的指示灯熄灭,并记录运维日
志。
50.另外,本实施例将筛选出的错误信息根据用户自定义的报错机制进行逻辑判断的结果记录在运维日志。
51.为进一步理解本方法,以下提供一具体实施例对本方法进行解释,如图5所示,该具体实施例包括以下步骤。
52.步骤一,系统上电。
53.步骤二,bmc芯片通过i2c从硬盘控制器中获取硬盘信息。
54.步骤三,对所有硬盘信息进行汇总,筛选错误信息。
55.步骤四,判断错误信息是否为预知可忽略故障。
56.步骤五,若是,则记录运维日志后返回步骤二。
57.步骤六,若否,则记录错误信息,并自动点亮对应硬盘的指示灯并通过告警方式通知用户。
58.步骤七,定时判断用户是否更换硬盘并消除错误信息。
59.步骤八,若是,则熄灭指示灯,并记录运维日志后返回步骤二。
60.步骤九,若否,则直接返回步骤二。
61.实施例四本实施例四提供一种服务器故障硬盘自动定位装置,配置于bmc芯片,用于实现实施例三的方法。
62.如图6所示为本实施例四提供一种服务器故障硬盘自动定位装置结构示意框图,包括以下功能模块。
63.硬盘信息获取模块101:从硬盘控制器获取各个硬盘的硬盘信息。
64.硬盘故障判断模块102:基于所获取的所有硬盘信息,判断是否有硬盘故障。
65.指示灯控制模块103:若有硬盘故障,则控制故障硬盘处的指示灯亮起。
66.另外,为及时通知用户存在硬盘故障,本实施例的装置还包括硬盘故障发送模块104:当某个硬盘的错误信息出现用户自定义的错误时,记录该硬盘的错误信息,并发送至用户客户端。
67.考虑到不同用户所采用的报错机制不同,即用户自定义错误,当硬盘出现用户自定义的错误时才会判定为故障,当出现其他错误时,则不判定为故障。
68.相应的,硬盘故障判断模块基于所获取的所有硬盘信息,判断是否有硬盘故障,具体包括:将所有硬盘信息进行汇总,并筛选出错误信息;将筛选出的错误信息根据用户自定义的报错机制进行逻辑判断;当某个硬盘的错误信息出现用户自定义的错误时,判断为该硬盘故障。
69.本实施例的服务器故障硬盘自动定位装置用于实现前述的服务器故障硬盘自动定位方法,因此该装置中的具体实施方式可见前文中的服务器故障硬盘自动定位方法的实施例部分,所以,其具体实施方式可以参照相应的各个部分实施例的描述,在此不再展开介绍。
70.另外,由于本实施例的服务器故障硬盘自动定位装置用于实现前述的服务器故障硬盘自动定位方法,因此其作用与上述方法的作用相对应,这里不再赘述。
71.以上公开的仅为本发明的优选实施方式,但本发明并非局限于此,任何本领域的技术人员能思之的没有创造性的变化,以及在不脱离本发明原理前提下所作的若干改进和润饰,都应落在本发明的保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献