一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

硬盘的故障检测方法、装置、设备及可读存储介质与流程

2021-07-06 18:48:00 来源:中国专利 TAG:检测方法 装置 可读 故障 硬盘
硬盘的故障检测方法、装置、设备及可读存储介质与流程

本申请涉及计算机技术领域,尤其涉及一种硬盘的故障检测方法、装置、设备及可读存储介质。



背景技术:

随着计算机技术的飞速发展,为了满足不断提高的计算、存储海量数据的需求,现有技术一方面不断增大硬盘单盘容量,另一方面利用服务器集群技术,不断增加服务器集群挂载的硬盘数量,在服务器集群的实际运维工作中,通常抓取每一硬盘的s.m.a.r.t(self-monitoringanalysisandreportingtechnology”,硬盘的自我监测和分析及报告技术)日志(简称为smart日志)中的指标项进行故障判断和处理,但对于规模日益壮大的服务器集群来说,业务系统对硬盘的访问量呈现几何级的增长,且硬盘多数时间处于100%繁忙的工作状态,因此硬盘故障率大大增加,显然采集每一块故障硬盘的smart日志进行故障处理的方法,由于smart日志的获取过程耗时长,往往导致故障处理不及时,硬盘故障检测的效率有待提高。



技术实现要素:

本申请提供了一种硬盘的故障检测方法、装置、设备及可读存储介质,目的在于提高获取硬盘的故障信息的效率,如下:

一种硬盘的故障检测方法,包括:

获取服务器集群中各个服务器节点的运行日志;

依据每一所述服务器节点的运行日志,确定每一所述服务器节点的预设指标项的出现次数;

若所述服务器节点的至少一项所述预设指标项的出现次数不小于所述预设指标项对应的预设次数阈值,将所述服务器节点的硬盘作为目标硬盘;所述预设指标项对应的预设次数阈值依据所述服务器节点的硬盘出现故障的概率配置,在所述服务器节点的历史运行日志中,所述预设指标项的出现次数不小于所述预设指标项对应的预设次数阈值时,所述服务器节点的硬盘出现故障的概率大于第一预设概率阈值;

获取所述目标硬盘的smart日志;

依据所述目标硬盘的smart日志,检测所述目标硬盘是否出现故障。

可选地,预设指标项包括:强相关指标项和次相关指标项,所述强相关指标项对应的预设次数阈值等于1,所述次相关指标项对应的预设次数阈值大于1。

可选地,若服务器节点的至少一项所述预设指标项的出现次数大于所述预设指标项对应的预设次数阈值,将所述服务器节点的硬盘作为目标硬盘,包括:

若在所述运行日志中存在至少一项所述强相关指标项,将所述服务器节点的硬盘作为目标硬盘;

若在所述运行日志中不存在所述强相关指标项,判断各个所述次相关指标项的出现次数是否大于所述次相关指标项对应的预设次数阈值;

若至少一项所述次相关指标项的出现次数大于所述次相关指标项对应的预设次数阈值,确定所述服务器节点的硬盘为目标硬盘。

可选地,依据目标硬盘的smart日志,检测所述目标硬盘是否出现故障,包括:

依据所述目标硬盘的smart日志,确定预设硬盘指标项的数值;

若至少一项所述预设硬盘指标项的数值满足所述预设硬盘指标项对应的预设故障条件,确定所述目标硬盘出现故障,每一所述预设指标项的数值对应的预设故障条件依据所述目标硬盘出现故障的概率配置,在所述目标硬盘的历史smart日志中,所述预设硬盘指标项的数值满足所述预设硬盘指标项对应的预设故障条件时,所述目标硬盘出现故障的概率大于第二预设概率阈值。

可选地,预设硬盘指标项包括第一预设硬盘指标项、第二预设硬盘指标项、第三预设硬盘指标项和第四预设硬盘指标项;

所述第一预设硬盘指标项对应的预设故障条件为:所述第一预设硬盘指标项的数值非0;

所述第二预设硬盘指标项对应的预设故障条件为:所述第二预设硬盘指标项的数值等于预设故障值;

所述第三预设硬盘指标项对应的预设故障条件为:所述第三预设硬盘指标项的数值不等于预设正常值;

所述第四预设硬盘指标项对应的预设故障条件为:所述第四预设硬盘指标项的数值超过预设数值阈值。

可选地,若至少一项所述预设硬盘指标项的数值满足所述预设指标项对应的预设故障条件,确定所述目标硬盘出现故障,包括:

若满足:至少一项所述第一预设硬盘指标项的数值非0、至少一项所述第二预设硬盘指标项的数值等于第一预设数值、至少一项所述第三预设硬盘指标项的数值不等于第二预设数值、和至少一项所述第四预设硬盘指标项的数值超过预设数值阈值中至少一项,则确定所述目标硬盘出现故障。

一种硬盘的故障检测装置,包括:

第一日志获取单元,用于获取服务器集群中各个服务器节点的运行日志;

次数获取单元,用于依据每一所述服务器节点的运行日志,确定每一所述服务器节点的预设指标项的出现次数;

目标硬盘确定单元,用于若所述服务器节点的至少一项所述预设指标项的出现次数不小于所述预设指标项对应的预设次数阈值,将所述服务器节点的硬盘作为目标硬盘;所述预设指标项对应的预设次数阈值依据所述服务器节点的硬盘出现故障的概率配置,在所述服务器节点的历史运行日志中,所述预设指标项的出现次数不小于所述预设指标项对应的预设次数阈值时,所述服务器节点的硬盘出现故障的概率大于第一预设概率阈值;

第二日志获取单元,用于获取所述目标硬盘的smart日志;

故障确定单元,用于依据所述目标硬盘的smart日志,检测所述目标硬盘是否出现故障。

可选地,故障确定单元用于依据所述目标硬盘的smart日志,检测所述目标硬盘是否出现故障,包括:所述故障确定单元具体用于:

依据所述目标硬盘的smart日志,确定预设硬盘指标项的数值;

若至少一项所述预设硬盘指标项的数值满足所述预设硬盘指标项对应的预设故障条件,确定所述目标硬盘出现故障,每一所述预设指标项的数值对应的预设故障条件依据所述目标硬盘出现故障的概率配置,在所述目标硬盘的历史smart日志中,所述预设硬盘指标项的数值满足所述预设硬盘指标项对应的预设故障条件时,所述目标硬盘出现故障的概率大于第二预设概率阈值。

一种硬盘的故障检测设备,包括:存储器和处理器;

所述存储器,用于存储程序;

所述处理器,用于执行所述程序,实现硬盘的故障检测方法的各个步骤。

一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现硬盘的故障检测方法的各个步骤。

由上述技术方案可以看出,本申请实施例提供的硬盘的故障检测方法、装置、设备及可读存储介质,获取服务器集群中各个服务器节点的运行日志,依据运行日志,确定各个服务器节点的预设指标项的出现次数,若服务器节点的至少一项预设指标项的出现次数不小于预设指标项对应的预设次数阈值,将服务器节点的硬盘作为目标硬盘。由于,在服务器节点的历史运行日志中,预设指标项的出现次数不小于预设指标项对应的预设次数阈值时,服务器节点的硬盘出现故障的概率大于第一预设概率阈值,所以,目标硬盘为出现故障的概率大于第一预设概率阈值的硬盘。因此,本方法仅需获取目标硬盘进行smart日志,并依据目标硬盘的smart日志,检测目标硬盘是否出现故障。由于,获取服务器节点的运行日志的耗时短且效率高,因此,本方法无需获取每一服务器节点的硬盘的smart日志,避免由于获取smart日志的耗时较长,导致的故障处理不及时,也即,本方法通提高了硬盘故障检测的效率。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种硬盘的故障检测方法的具体实施方式的流程示意图;

图2为本申请实施例提供的一种硬盘的故障检测方法的流程示意图;

图3为本申请实施例提供的一种硬盘的故障检测装置的结构示意图;

图4为本申请实施例提供的一种硬盘的故障检测设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请实施例提供的一种硬盘的故障检测方法应用于但不限于获取服务器集群中部署的硬盘的故障信息,目的在于及时,其中,服务器集群中包括至少两个服务器节点,在实际应用中,服务器集群的节点数量庞大,本实施例中以n表示服务器集群中的服务器节点的数量,需要说明的是,每一服务器节点至少部署一个硬盘,硬盘的类型包括但不限于固态硬盘,且硬盘的工作模式包括但不限于直通模式和raid(redundantarraysofindependentdisks,磁盘列阵)模式。

图1为本申请实施例提供的一种硬盘的故障检测方法的具体实施方式的流程示意图,具体包括:

s101、获取每一服务器节点的运行日志。

本实施例中,任一服务器节点的运行日志包括但不限于服务器节点在预设时间段内的操作系统日志。

获取运行日志的方法可以参见现有技术。

依据每一服务器节点的运行日志,判断服务器节点的硬盘是否为目标硬盘,目标硬盘指的是出现故障的概率大于第一预设概率阈值的硬盘,需要说明的是,本实施例中,判断各个服务器节点的硬盘是否为目标硬盘的方法相同,下述s102~s104以第一服务器节点为例,对判断服务器节点的硬盘是否为目标硬盘的方法进行说明。

s102、在第一服务器节点的运行日志中,查找是否出现预设的强相关指标项。

本实施例中,强相关指标项依据历史运行日志预先配置,在历史运行日志中,若出现强相关指标项,硬盘出现故障的概率大于第一预设概率阈值。强相关指标项包括但不限于:unrecoveredreaderror、ncqfail、i/oerror、deviceofflined、scsierror、以及filesystemread-only。

需要说明的是,每一种强相关指标项指示服务器节点在运行过程中出现强相关指标项对应的运行错误,通常,强相关指标项为运行错误的预设脚本表达。强相关指标项与运行错误的对应关系可以参见现有技术,例如,强相关指标项“unrecoveredreaderro”对应的运行错误为“不可恢复的错误”。具体的每一强相关指标项对应的运行错误可以参见现有技术,本实施例在此不作赘述。

s103、若出现强相关指标项中的任一项,则确定第一服务器节点的硬盘是目标硬盘。

本实施例将存在至少一项强相关指标项,作为第一预设条件,当满足第一预设条件,确定第一服务器节点的硬盘是目标硬盘。

本实施例中,若第一服务器节点的运行日志满足(11)存在unrecoveredreaderro,(12)存在ncqfail,(13)存在i/oerror,(14)存在deviceofflined,(15)存在scsierror,(16)存在filesystemread-only,中的至少一项,则确定服务器节点的运行日志满足第二预设条件。

需要说明的是,强相关指标项的配置条件依据历史运行日志确定,强相关指标项还可以包括其他多个指标项,且,强相关指标项依据历史运行日志实时更新,本实施例对此不做赘述。

s104、依据第一服务器节点的运行日志,确定各个预设的次相关指标项的出现次数。

本实施例中,确定各个预设的次相关指标项的出现次数的方法可以参见现有技术,可选地,查找指示次相关指标项的存在的关键词的出现次数,作为存在次相关指标项的出现次数。

本实施例中,每一次相关指标项依据历史运行日志预先配置,在历史运行日志中,次相关指标项的出现次数越多,硬盘出现故障的概率越大,且次相关指标项的出现次数大于次相关指标项对应的预设次数阈值时,硬盘出现故障的概率大于第一预设概率阈值,其中,预设次数阈值大于1。

可选地,次相关指标项包括但不限于:lunreset、resetlogical、unrecoveredreaderror、以及unrecoveredwriteerror。需要说明的是,每一种次相关指标项指示服务器节点在运行过程中出现次相关指标项对应的运行错误,通常,次相关指标项为运行错误的预设脚本表达。例如,次相关指标项“resetlogical”对应的运行错误为逻辑卷重置。具体的每一次相关指标项对应的运行错误可以参见现有技术,本实施例在此不作赘述。

s105、若至少一项次相关指标项的出现次数大于次相关指标项对应的预设次数阈值,将第一服务器节点的硬盘为目标硬盘。

本实施例中,将至少一项次相关指标项的出现次数大于次相关指标项对应的预设次数阈值作为第二预设条件,当满足第二预设条件,确定第一服务器节点的硬盘是目标硬盘。具体的,若第一服务器节点的运行日志满足(11)lunreset的出现次数大于预设的第一数值,(12)resetlogical的出现次数大于预设的第二数值,(13)unrecoveredreaderror的出现次数大于预设的第三数值,(14)unrecoveredwriteerror的出现次数大于第四数值,中的至少一项时,确定服务器节点的运行日志满足第一预设条件。

需要说明的是,次相关指标项对应的预设次数阈值依据历史运行日志确定,第一数值~第四数值的值可能相同也可能不同。次相关指标项还可以包括其他多个指标项,且,次相关指标项依据历史运行日志实时更新,本实施例对此不做赘述。本申请不限定s102~s103和s104~s105的执行顺序,也即当第一服务器节点的运行日志满足第一预设条件和第二预设条件中至少一项,则,确定服务器节点的硬盘为目标硬盘。

由上可知,由于在历史运行日志中,若出现强相关指标项,硬盘出现故障的概率大于第一预设概率阈值,多以每当服务器的运行日志中存在至少一项强相关指标时,则,服务器的硬盘出现故障的概率大于第一预设概率阈值,并且,次相关指标项的出现次数大于次相关指标项对应的预设次数阈值时,硬盘出现故障的概率大于第一预设概率阈值,所以,当服务器的运行日志中,至少一项次相关指标项的出现次数大于次相关指标项对应的预设次数阈值时,则,服务器的硬盘出现故障的概率大于第一预设概率阈值,因此,当第一服务器节点的运行日志满足第一预设条件和第二预设条件中至少一项,确定服务器节点的硬盘为目标硬盘,可见,本方法确定的目标硬盘为依据运行日志确定的出现故障的概率大于第一预设概率阈值的硬盘。

本实施例中,通过上述s102~s105确定每一服务器节点的硬盘是否是目标硬盘,从而获取至少一个目标硬盘,s106~s109示例了一种确定目标硬盘是否出现故障的具体实现流程。

s106、获取目标硬盘的smart日志中第一预设硬盘指标项的数值,若第一预设硬盘指标项的数值非0,则确定目标硬盘出现故障。

本实施例中,第一预设硬盘指标项为依据历史运行日志预先配置的指标项,配置条件为:第一预设硬盘指标项的数值非0时,目标硬盘出现故障的概率大于第二预设概率阈值。

s107、获取目标硬盘的smart日志中第二预设硬盘指标项的数值,若第二预设硬盘指标项的数值等于第二预设硬盘指标项的预设故障值,则确定目标硬盘出现故障。

本实施例中,第二预设硬盘指标项为依据历史运行日志预先配置的指标项,配置条件为:第二预设硬盘指标项的数值等于第二预设硬盘指标项的预设故障值时,目标硬盘出现故障的概率大于第二预设概率阈值。

s108、获取目标硬盘的smart日志中第三预设硬盘指标项的数值,若第三预设硬盘指标项的数值不等于第三预设硬盘指标项的预设正常值,则确定目标硬盘出现故障。

本实施例中,第三预设硬盘指标项为依据历史运行日志预先配置的指标项,配置条件为:第三预设硬盘指标项的数值不等于第三预设硬盘指标项的预设正常值时,目标硬盘出现故障的概率大于第二预设概率阈值。

s109、获取目标硬盘的smart日志中第四预设硬盘指标项的数值,若第四预设硬盘指标项的数值超过第四预设硬盘指标项对应的预设数值阈值,则确定目标硬盘出现故障。

本实施例中,第四预设硬盘指标项为依据历史运行日志预先配置的指标项,配置条件为:第四预设硬盘指标项的数值超过第四预设硬盘指标项对应的预设数值阈值,目标硬盘出现故障的概率大于第二预设概率阈值。

需要说明的是,上述四类硬盘指标项均为通过历史运行日志预先配置的、与目标硬盘是否出现故障相关的指标项,表1示例了实际应用中的四类硬盘指标项的具体指标项内容和预设故障条件的对应关系。

表1、对应关系

本申请不限定s106~s109的执行顺序,当s106~s109中任一步骤确定目标硬盘是否出现故障,则结束流程。

由上述技术方案可以看出,第一预设硬盘指标项~第四预设硬盘指标项均为依据历史运行日志预先配置的预设硬盘指标项,配置条件为当预设硬盘指标项的数值满足预设硬盘指标项的数值对应的预设故障条件时,目标硬盘出现故障的概率大于第二预设概率阈值,所以,本方法依据目标硬盘的smart日志,确定至少一项预设硬盘指标项的数值满足预设硬盘指标项的数值对应的预设故障条件的情况下,确定目标硬盘出现故障的准确性高。

需要说明的是,每一预设硬盘指标项的具体配置条件参见上述实施例。

图1所示的流程仅为本申请提供的一种硬盘的故障检测方法的具体实现方式,本申请还包括其他的具体实现方式。

例如,强相关指标项和次相关指标项为依据历史运行日志确定的预设指标项,具体的预设指标项不限于上述实施例中表1和表2所示的指标项,还可以包括其他指标项。

再例如,s106~s109为依据目标硬盘的smart日志,确定目标硬盘是否出现故障的一种具体实现方法,本申请还包括其他的实现方法,具体可以参见现有技术。

综上,本实施例将本申请提供的一种硬盘的故障检测方法总结概率为图2所示的流程,具体可以包括:

s201、获取服务器集群中各个服务器节点的运行日志。

本实施例中,服务器集群包括多个服务器节点,每一服务器节点上运行至少一个硬盘,获取每一服务器节点的运行日志的方法通过从服务器的日志存储空间提取预设时间段内的运行日志即可完成,具体可以参见现有技术。

s202、依据运行日志,确定各个服务器节点的预设指标项的出现次数。

需要说明的是,确定预设指标项的出现次数的方法包括多种,具体可以参见上述实施例。

s203、若服务器节点的至少一项预设指标项的出现次数大于预设指标项对应的预设次数阈值,将服务器节点的硬盘作为目标硬盘。

本实施例中,每一预设指标项对应的预设次数阈值依据服务器节点的硬盘出现故障的概率确定。并且,在服务器节点的历史运行日志中,预设指标项的出现次数不小于预设指标项对应的预设次数阈值时,服务器节点的硬盘出现故障的概率大于第一预设概率阈值。

需要说明的是,预设指标项的配置方法以及预设指标项对应的预设次数阈值的确定具体方法可以参见现有技术。

s204、获取目标硬盘的smart日志。

s205、依据目标硬盘的smart日志,检测目标硬盘是否出现故障。

从上述技术方案可以看出,本方法获取服务器集群中各个服务器节点的运行日志,依据运行日志,确定各个服务器节点的预设指标项的出现次数,若服务器节点的至少一项预设指标项的出现次数不小于预设指标项对应的预设次数阈值,将服务器节点的硬盘作为目标硬盘。由于,在服务器节点的历史运行日志中,预设指标项的出现次数不小于预设指标项对应的预设次数阈值时,服务器节点的硬盘出现故障的概率大于第一预设概率阈值,所以,目标硬盘为出现故障的概率大于第一预设概率阈值的硬盘。因此,本方法仅需获取目标硬盘进行smart日志,并依据目标硬盘的smart日志,检测目标硬盘是否出现故障。由于,获取服务器节点的运行日志的耗时短且效率高,因此,本方法无需获取每一服务器节点的硬盘的smart日志,避免由于获取smart日志的耗时较长,导致的故障处理不及时,也即,本方法通提高了硬盘故障检测的效率。

图3示出了本申请实施例提供的一种硬盘的故障检测装置的结构示意图,如图3所示,该装置可以包括:

第一日志获取单元301,用于获取服务器集群中各个服务器节点的运行日志;

次数获取单元302,用于依据每一所述服务器节点的运行日志,确定每一所述服务器节点的预设指标项的出现次数;

目标硬盘确定单元303,用于若所述服务器节点的至少一项所述预设指标项的出现次数不小于所述预设指标项对应的预设次数阈值,将所述服务器节点的硬盘作为目标硬盘;所述预设指标项对应的预设次数阈值依据所述服务器节点的硬盘出现故障的概率配置,在所述服务器节点的历史运行日志中,所述预设指标项的出现次数不小于所述预设指标项对应的预设次数阈值时,所述服务器节点的硬盘出现故障的概率大于第一预设概率阈值;

第二日志获取单元304,用于获取所述目标硬盘的smart日志;

故障确定单元305,用于依据所述目标硬盘的smart日志,检测所述目标硬盘是否出现故障。

可选地,预设指标项包括:强相关指标项和次相关指标项,所述强相关指标项对应的预设次数阈值等于1,所述次相关指标项对应的预设次数阈值大于1。

可选地,目标硬盘确定单元,用于若所述服务器节点的至少一项所述预设指标项的出现次数不小于所述预设指标项对应的预设次数阈值,将所述服务器节点的硬盘作为目标硬盘,包括:目标硬盘确定单元具体用于:

若在所述运行日志中存在至少一项所述强相关指标项,将所述服务器节点的硬盘作为目标硬盘;

若在所述运行日志中不存在所述强相关指标项,判断各个所述次相关指标项的出现次数是否大于所述次相关指标项对应的预设次数阈值;

若至少一项所述次相关指标项的出现次数大于所述次相关指标项对应的预设次数阈值,确定所述服务器节点的硬盘为目标硬盘。

可选地,故障确定单元用于依据目标硬盘的smart日志,检测所述目标硬盘是否出现故障,包括:故障确定单元具体用于:

依据所述目标硬盘的smart日志,确定预设硬盘指标项的数值;

若至少一项所述预设硬盘指标项的数值满足所述预设硬盘指标项对应的预设故障条件,确定所述目标硬盘出现故障,每一所述预设指标项的数值对应的预设故障条件依据所述目标硬盘出现故障的概率配置,在所述目标硬盘的历史smart日志中,所述预设硬盘指标项的数值满足所述预设硬盘指标项对应的预设故障条件时,所述目标硬盘出现故障的概率大于第二预设概率阈值。

可选地,预设硬盘指标项包括第一预设硬盘指标项、第二预设硬盘指标项、第三预设硬盘指标项和第四预设硬盘指标项;

所述第一预设硬盘指标项对应的预设故障条件为:所述第一预设硬盘指标项的数值非0;

所述第二预设硬盘指标项对应的预设故障条件为:所述第二预设硬盘指标项的数值等于预设故障值;

所述第三预设硬盘指标项对应的预设故障条件为:所述第三预设硬盘指标项的数值不等于预设正常值;

所述第四预设硬盘指标项对应的预设故障条件为:所述第四预设硬盘指标项的数值超过预设数值阈值。

可选地,故障确定单元用于若至少一项所述预设硬盘指标项的数值满足所述预设指标项对应的预设故障条件,确定所述目标硬盘出现故障,包括:故障确定单元具体用于:

若满足:至少一项所述第一预设硬盘指标项的数值非0、至少一项所述第二预设硬盘指标项的数值等于第一预设数值、至少一项所述第三预设硬盘指标项的数值不等于第二预设数值、和至少一项所述第四预设硬盘指标项的数值超过预设数值阈值中至少一项,则确定所述目标硬盘出现故障。

图4示出了该硬盘的故障检测设备的结构示意图,该设备可以包括:至少一个处理器401,至少一个通信接口402,至少一个存储器403和至少一个通信总线404;

在本申请实施例中,处理器401、通信接口402、存储器403、通信总线404的数量为至少一个,且处理器401、通信接口402、存储器403通过通信总线404完成相互间的通信;

处理器401可能是一个中央处理器cpu,或者是特定集成电路asic(applicationspecificintegratedcircuit),或者是被配置成实施本发明实施例的一个或多个集成电路等;

存储器403可能包含高速ram存储器,也可能还包括非易失性存储器(non-volatilememory)等,例如至少一个磁盘存储器;

其中,存储器存储有程序,处理器可执行存储器存储的程序,实现本申请实施例提供的一种硬盘的故障检测方法的各个步骤,如下:

一种硬盘的故障检测方法,包括:

获取服务器集群中各个服务器节点的运行日志;

依据每一所述服务器节点的运行日志,确定每一所述服务器节点的预设指标项的出现次数;

若所述服务器节点的至少一项所述预设指标项的出现次数不小于所述预设指标项对应的预设次数阈值,将所述服务器节点的硬盘作为目标硬盘;所述预设指标项对应的预设次数阈值依据所述服务器节点的硬盘出现故障的概率配置,在所述服务器节点的历史运行日志中,所述预设指标项的出现次数不小于所述预设指标项对应的预设次数阈值时,所述服务器节点的硬盘出现故障的概率大于第一预设概率阈值;

获取所述目标硬盘的smart日志;

依据所述目标硬盘的smart日志,检测所述目标硬盘是否出现故障。

可选地,预设指标项包括:强相关指标项和次相关指标项,所述强相关指标项对应的预设次数阈值等于1,所述次相关指标项对应的预设次数阈值大于1。

可选地,若服务器节点的至少一项所述预设指标项的出现次数大于所述预设指标项对应的预设次数阈值,将所述服务器节点的硬盘作为目标硬盘,包括:

若在所述运行日志中存在至少一项所述强相关指标项,将所述服务器节点的硬盘作为目标硬盘;

若在所述运行日志中不存在所述强相关指标项,判断各个所述次相关指标项的出现次数是否大于所述次相关指标项对应的预设次数阈值;

若至少一项所述次相关指标项的出现次数大于所述次相关指标项对应的预设次数阈值,确定所述服务器节点的硬盘为目标硬盘。

可选地,依据目标硬盘的smart日志,检测所述目标硬盘是否出现故障,包括:

依据所述目标硬盘的smart日志,确定预设硬盘指标项的数值;

若至少一项所述预设硬盘指标项的数值满足所述预设硬盘指标项对应的预设故障条件,确定所述目标硬盘出现故障,每一所述预设指标项的数值对应的预设故障条件依据所述目标硬盘出现故障的概率配置,在所述目标硬盘的历史smart日志中,所述预设硬盘指标项的数值满足所述预设硬盘指标项对应的预设故障条件时,所述目标硬盘出现故障的概率大于第二预设概率阈值。

可选地,预设硬盘指标项包括第一预设硬盘指标项、第二预设硬盘指标项、第三预设硬盘指标项和第四预设硬盘指标项;

所述第一预设硬盘指标项对应的预设故障条件为:所述第一预设硬盘指标项的数值非0;

所述第二预设硬盘指标项对应的预设故障条件为:所述第二预设硬盘指标项的数值等于预设故障值;

所述第三预设硬盘指标项对应的预设故障条件为:所述第三预设硬盘指标项的数值不等于预设正常值;

所述第四预设硬盘指标项对应的预设故障条件为:所述第四预设硬盘指标项的数值超过预设数值阈值。

可选地,若至少一项所述预设硬盘指标项的数值满足所述预设指标项对应的预设故障条件,确定所述目标硬盘出现故障,包括:

若满足:至少一项所述第一预设硬盘指标项的数值非0、至少一项所述第二预设硬盘指标项的数值等于第一预设数值、至少一项所述第三预设硬盘指标项的数值不等于第二预设数值、和至少一项所述第四预设硬盘指标项的数值超过预设数值阈值中至少一项,则确定所述目标硬盘出现故障。

本申请实施例还提供一种可读存储介质,该可读存储介质可存储有适于处理器执行的计算机程序,计算机程序被处理器执行时,实现本申请实施例提供的一种硬盘的故障检测方法的各个步骤,如下:

一种硬盘的故障检测方法,包括:

获取服务器集群中各个服务器节点的运行日志;

依据每一所述服务器节点的运行日志,确定每一所述服务器节点的预设指标项的出现次数;

若所述服务器节点的至少一项所述预设指标项的出现次数不小于所述预设指标项对应的预设次数阈值,将所述服务器节点的硬盘作为目标硬盘;所述预设指标项对应的预设次数阈值依据所述服务器节点的硬盘出现故障的概率配置,在所述服务器节点的历史运行日志中,所述预设指标项的出现次数不小于所述预设指标项对应的预设次数阈值时,所述服务器节点的硬盘出现故障的概率大于第一预设概率阈值;

获取所述目标硬盘的smart日志;

依据所述目标硬盘的smart日志,检测所述目标硬盘是否出现故障。

可选地,预设指标项包括:强相关指标项和次相关指标项,所述强相关指标项对应的预设次数阈值等于1,所述次相关指标项对应的预设次数阈值大于1。

可选地,若服务器节点的至少一项所述预设指标项的出现次数大于所述预设指标项对应的预设次数阈值,将所述服务器节点的硬盘作为目标硬盘,包括:

若在所述运行日志中存在至少一项所述强相关指标项,将所述服务器节点的硬盘作为目标硬盘;

若在所述运行日志中不存在所述强相关指标项,判断各个所述次相关指标项的出现次数是否大于所述次相关指标项对应的预设次数阈值;

若至少一项所述次相关指标项的出现次数大于所述次相关指标项对应的预设次数阈值,确定所述服务器节点的硬盘为目标硬盘。

可选地,依据目标硬盘的smart日志,检测所述目标硬盘是否出现故障,包括:

依据所述目标硬盘的smart日志,确定预设硬盘指标项的数值;

若至少一项所述预设硬盘指标项的数值满足所述预设硬盘指标项对应的预设故障条件,确定所述目标硬盘出现故障,每一所述预设指标项的数值对应的预设故障条件依据所述目标硬盘出现故障的概率配置,在所述目标硬盘的历史smart日志中,所述预设硬盘指标项的数值满足所述预设硬盘指标项对应的预设故障条件时,所述目标硬盘出现故障的概率大于第二预设概率阈值。

可选地,预设硬盘指标项包括第一预设硬盘指标项、第二预设硬盘指标项、第三预设硬盘指标项和第四预设硬盘指标项;

所述第一预设硬盘指标项对应的预设故障条件为:所述第一预设硬盘指标项的数值非0;

所述第二预设硬盘指标项对应的预设故障条件为:所述第二预设硬盘指标项的数值等于预设故障值;

所述第三预设硬盘指标项对应的预设故障条件为:所述第三预设硬盘指标项的数值不等于预设正常值;

所述第四预设硬盘指标项对应的预设故障条件为:所述第四预设硬盘指标项的数值超过预设数值阈值。

可选地,若至少一项所述预设硬盘指标项的数值满足所述预设指标项对应的预设故障条件,确定所述目标硬盘出现故障,包括:

若满足:至少一项所述第一预设硬盘指标项的数值非0、至少一项所述第二预设硬盘指标项的数值等于第一预设数值、至少一项所述第三预设硬盘指标项的数值不等于第二预设数值、和至少一项所述第四预设硬盘指标项的数值超过预设数值阈值中至少一项,则确定所述目标硬盘出现故障。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜