一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种服务器报错评估及处理方法、系统及存储介质与流程

2022-02-21 04:25:36 来源:中国专利 TAG:


1.本技术涉及服务器运维领域,尤其涉及一种服务器报错评估及处理方法、系统及存储介质。


背景技术:

2.数据中心存在大量的不同时期上线运行的服务器,服务器的硬件、固件、软件、配置信息等各有差异。对服务器的维护管理造成不便。
3.在服务器厂商端,针对服务器产品固件版本比如bios、bmc、rmc等版本迭代较快,研发人员通常解决一部分bug后进行迭代升级到下一个版本。客户往往会购买3到5年的维保服务,服务器厂商会定期将这些新版本固件提供给客户,但这些已经上架的服务器因为业务的运行往往不能及时对固件升级,导致了一些故障在最新的固件版本中已修复,但在线上服务器中老版本固件中依旧存在。当数据中心的服务器出现报错时,需要花费较多时间对报错信息进行甄别处理,报错信息中部分问题需要升级固件解决的,部分问题则需要通过技术人员进行维护。现有甄别处理服务器报错信息的方式主要靠人工的方式,技术人员如果对后续固件更新作用不清楚,导致技术人员尝试各种方法来解决本来由固件升级可能解决的问题。这很可能造成人力物力的浪费,甚至可能存在“药不对症”无法解决问题的情况。


技术实现要素:

4.为了解决上述技术问题或者至少部分地解决上述技术问题,本技术提供一种服务器报错评估及处理方法、系统及存储介质。
5.第一方面,本技术提供一种服务器报错评估及处理方法,包括:
6.服务器在发生故障报错时,获取服务器的故障报错信息;
7.将服务器的故障报错信息与固件缺陷数据库中的固件缺陷案例进行匹配;
8.统计并判断服务器的故障报错信息与所匹配的固件缺陷案例之间的匹配度是否大于设定阈值;
9.否则,反馈第一人工处理信息;
10.是则,反馈升级决策信息;其中,所述升级决策信息内容中包括解决服务器故障的固件版本和故障风险;
11.在满足预设升级条件下,根据升级决策信息中的解决服务器故障的固件版本获取固件进行服务器升级。
12.更进一步地,所述故障报错信息包括服务器信息、故障部件、错误代码、故障日志内容。
13.更进一步地,所述固件缺陷数据库中存储固件缺陷案例,所述固件缺陷案例的内容包括固件版本、固件所存在的缺陷信息、缺陷风险等级和解决缺陷的对应版本固件;
14.其中,所述固件所存在的缺陷信息包括:缺陷部件、错误代码及缺陷描述。
15.更进一步地,所述将服务器的故障报错信息与固件缺陷数据库中的固件缺陷案例进行匹配包括:
16.按照故障报错信息中的故障部件和错误代码匹配固件缺陷数据库中与故障报错信息对应的固件缺陷案例。
17.更进一步地,统计服务器的故障报错信息与所匹配的固件缺陷案例之间的匹配度包括:
18.解析故障报错信息中的故障日志内容并从故障日志内容中收集描述故障的故障关键字;
19.从故障报错信息所匹配的固件缺陷案例的缺陷描述中收集描述缺陷的缺陷关键字;
20.所述故障关键字和所述缺陷关键字进行对比,获取所述故障关键字和所述缺陷关键字的匹配度作为服务器故障与固件缺陷案例匹配度。
21.更进一步地,利用与服务器故障报错信息相匹配的固件缺陷案例中的缺陷风险等级作为服务器故障的故障风险,缺陷风险等级包括高等级、中等级和低等级。
22.更进一步地,所述在满足预设升级条件下,根据升级决策信息中的解决服务器故障的固件版本获取固件进行服务器升级包括:
23.判断发出故障报错信息的目标服务器是否空闲且获得升级许可,是则,获取升级决策信息中解决目标服务器故障的固件版本作为目标固件;
24.查询云固件库中是否存在目标固件;
25.是则,下载目标固件到目标服务器中并升级;
26.否则,记录所缺失的目标固件并通过预设的联系方式发送给服务器管理员和云固件库管理员。
27.更进一步地,针对服务器故障报错信息而进行服务器固件升级后,验证服务器是否仍产生相同的服务器故障报错,是则,服务器反馈第二人工处理信息。
28.第二方面,本技术提供一种服务器固件风险评估及升级系统,包括:故障上传模块,所述故障上传模块在服务器发生故障报错时将故障报错信息上传故障匹配模块;
29.所述故障匹配模块根据服务器故障报错信息匹配固件缺陷数据库中的固件缺陷案例;
30.判断模块,所述判断模块统计并判断服务器的故障报错信息与所匹配的固件缺陷案例之间的匹配度是否大于设定阈值;
31.反馈模块,所述反馈模块在判断模块判断匹配度大于设定阈值时,生成升级决策信息,在判断模块判断匹配度小于设定阈值时反馈第一人工处理信息;
32.决策模块,所述决策模块用于管理员为服务器提供升级许可;
33.升级模块,所述升级模块在服务器获取升级许可且空闲时,根据升级决策信息从云固件库获取目标固件对目标服务器升级。
34.第三方面,本技术提供一种实现服务器服务器报错评估及处理方法的存储介质,实现服务器服务器报错评估及处理方法的存储介质存储至少一条指令,读取并执行所述指令实现所述的服务器报错评估及处理方法。
35.本技术实施例提供的上述技术方案与现有技术相比具有如下优点:
36.本技术通过将服务器故障报错与固件缺陷数据库中固件缺陷案例匹配的方式来确定能够通过固件升级而解决的故障报错,对于因服务器现有固件缺陷而导致的服务器故障报错,故障报错所匹配的固件缺陷案例会提供解决故障报错的目标固件,可通过云固件库获取目标固件来升级解决服务器因固件缺陷导致的故障报错。并对无法通过固件升级解决的故障报错提供第一人工处理信息,确保非固件升级所能解决的服务器故障报错能够及时被技术人员处理,实现对服务器故障报错的自动评估甄别处理。
37.本技术在针对服务器故障报错信息而进行服务器固件升级后,验证服务器是否仍产生相同的服务器故障报错,若出现则反馈第二人工处理信息,避免出现因对故障报错误判导致问题未被解决的情况。
附图说明
38.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
39.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
40.图1为本技术实施例提供的服务器报错评估及处理方法的流程图;
41.图2为本技术实施例提供的固件缺陷数据库中存储固件缺陷案例的内容示意图;
42.图3为本技术实施例提供的将服务器的故障报错信息与固件缺陷数据库中的固件缺陷案例进行匹配的流程图;
43.图4为本技术实施例提供的统计服务器的故障报错信息与所匹配的固件缺陷案例之间的匹配度的流程图;
44.图5为本技术实施例提供的在满足预设升级条件下,根据升级决策信息中的解决服务器故障的固件版本获取固件进行服务器升级的流程图;
45.图6为本技术实施例提供的服务器固件风险评估及升级系统的示意图。
具体实施方式
46.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术的一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本技术保护的范围。
47.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
48.实施例1
49.参阅图1所示,本技术实施例提供一种服务器报错评估及处理方法,包括:
50.s100,服务器在发生故障报错时,获取服务器的故障报错信息;具体的,所述故障
报错信息包括服务器信息、故障部件、错误代码、故障日志内容,其中,一种可行的所述服务器信息包括服务器产品编号,所述故障日志内容的来源包括但不限于黑盒日志和sel日志。具体实施过程中,配置与服务器连接的运维服务器,当服务器发生故障报错时,服务器将故障报错信息发送给运维服务器。
51.s200,将服务器的故障报错信息与固件缺陷数据库中的固件缺陷案例进行匹配。
52.具体实施过程中,在所述运维服务器中配置所述固件缺陷数据库,参阅图2所示,所述固件缺陷数据库中存储固件缺陷案例,所述固件缺陷案例的内容包括固件版本、固件所存在的缺陷信息、缺陷风险等级和解决缺陷的对应版本固件;其中,所述固件所存在的缺陷信息包括:缺陷部件、错误代码及缺陷描述。
53.具体实施过程中,按照故障报错信息中的故障部件和错误代码匹配固件缺陷数据库中与故障报错信息对应的固件缺陷案例,参阅图3所示,所述将服务器的故障报错信息与固件缺陷数据库中的固件缺陷案例进行匹配包括:
54.s201,获取故障报错信息中的故障部件和错误代码;
55.s202,通过所获取的故障部件来查询筛选固件缺陷数据库中与故障报错信息中缺陷部件相同的固件缺陷案例,找到与故障报错信息中故障部件匹配的固件缺陷案例;
56.s203,再进一步通过故障报错信息中的错误代码来查询筛选步骤s202所筛选出的固件缺陷案例,找到全部故障部件和错误代码均与故障报错信息中相同的固件缺陷案例。
57.s300,统计并判断服务器的故障报错信息与所匹配的固件缺陷案例之间的匹配度是否大于设定阈值;否则,跳转s400,是则跳转s500。
58.具体实施过程中,参阅图4所示,统计服务器的故障报错信息与所匹配的固件缺陷案例之间的匹配度包括:
59.s301,解析故障报错信息中的故障日志内容并从故障日志内容中收集描述故障的故障关键字;
60.s302,从故障报错信息所匹配的固件缺陷案例的缺陷描述中收集描述缺陷的缺陷关键字;
61.s303,所述故障关键字和所述缺陷关键字进行对比,获取所述故障关键字和所述缺陷关键字的匹配度作为服务器故障与固件缺陷案例匹配度。
62.s400,反馈第一人工处理信息;具体实施过程中,将管理员的联系方式和管理员所维护的服务器的服务器信息绑定,并存储于所述运维服务器。当判断服务器的故障报错信息与所匹配的固件缺陷案例之间的匹配度是否小于设定阈值时,认为更新固件无法解决服务器所发生的故障报错。根据对应服务器的管理员的联系方式来向管理员反馈第一人工处理信息,所述第一人工处理信息包含匹配度未达到设定阈值的故障报错信息,根据第一人工处理信息安排技术人员处理对应的故障报错。
63.s500,反馈升级决策信息;其中,所述升级决策信息内容中包括解决服务器故障的固件版本和故障风险;当判断服务器的故障报错信息与所匹配的固件缺陷案例之间的匹配度是否大于设定阈值时,认为更新固件能够解决服务器所发生的故障报错。获取与服务器故障报错匹配度固件缺陷案例中的解决缺陷的对应版本固件和缺陷风险等级,进而生成所述升级决策信息,根据对应服务器的管理员的联系方式来向管理员反馈升级决策信息。生成所述升级决策信息时,将固件缺陷案例中的缺陷风险等级作为服务器故障的故障风险,
缺陷风险等级包括高等级、中等级和低等级。一种可行的方式是:为不影响服务器功能的告警类缺陷的缺陷风险等级配置为低等级,使得不影响服务器功能的告警类故障报错的故障风险为低等级。
64.s600,在满足预设升级条件下,根据升级决策信息中的解决服务器故障的固件版本获取固件进行服务器升级。具体的,所述预设升级条件包括服务器获取管理员赋予的升级许可且服务器处于空闲状态。
65.具体实施过程中,参阅图5所示,所述在满足预设升级条件下,根据升级决策信息中的解决服务器故障的固件版本获取固件进行服务器升级包括:
66.s601,判断发出故障报错信息的目标服务器是否获得升级许可,是则,执行s602,否则,放弃服务器固件升级更新。具体实施过程中,管理员根据所述升级决策信息中的故障风险确定是否赋予目标服务器升级许可。一种可行的方式是:若故障报错的故障风险中存在非低等级的情况,则管理员赋予目标服务器升级许可。
67.s602,判断发出故障报错信息的目标服务器是否处于空闲状态,是则,执行s603,否则,周期性的获取目标服务器状态并循环执行s602。
68.s603,获取升级决策信息中解决目标服务器故障的固件版本作为目标固件。
69.s604,查询云固件库中是否存在目标固件;是则,执行s605;否则执行s606。
70.s605,下载目标固件到目标服务器中并升级。
71.s606,记录所缺失的目标固件并通过预设的联系方式发送给服务器管理员和云固件库管理员。
72.具体实施过程中,针对服务器故障报错信息而进行服务器固件升级后,验证服务器是否仍产生相同的服务器故障报错,是则,服务器向管理员反馈第二人工处理信息。
73.实施例2
74.参阅图6所示,本技术实施例提供一种服务器固件风险评估及升级系统,包括:故障上传模块,所述故障上传模块在服务器发生故障报错时将故障报错信息上传故障匹配模块。所述故障匹配模块根据服务器故障报错信息匹配固件缺陷数据库中的固件缺陷案例。判断模块,所述判断模块统计并判断服务器的故障报错信息与所匹配的固件缺陷案例之间的匹配度是否大于设定阈值,具体实施过程中,所述设定阈值由配置模块配置。
75.反馈模块,所述反馈模块在判断模块判断匹配度大于设定阈值时,生成并向管理员发送升级决策信息,在判断模块判断匹配度小于设定阈值时生成并向管理员发送第一人工处理信息;
76.决策模块,所述决策模块用于管理员为服务器提供升级许可;
77.升级模块,所述升级模块在服务器获取升级许可且空闲时,根据升级决策信息从云固件库获取目标固件对目标服务器升级;
78.验证模块,所述验证模块用于在针对服务器故障报错信息而进行服务器固件升级后,验证服务器是否仍产生相同的服务器故障报错,是则生成并反馈第二人工处理信息。
79.实施例3
80.本技术实施例提供一种实现服务器服务器报错评估及处理方法的存储介质,实现服务器服务器报错评估及处理方法的存储介质存储至少一条指令,读取并执行所述指令实现所述的服务器报错评估及处理方法。
81.在本发明所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
82.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
83.另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
84.以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献