一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

服务器整机诊断过程的监控方法、系统、终端及存储介质与流程

2022-05-18 07:27:59 来源:中国专利 TAG:


1.本发明涉及服务器测试技术领域,具体涉及一种服务器整机诊断过程的监控方法、系统、终端及存储介质。


背景技术:

2.在当前工厂生产服务器过程中,服务器从生产线组装完毕,到符合订单要求允许工厂出货,需要通过一系列的整机诊断测试。在传统的服务器生产工艺中,整机诊断测试流程多是以执行整机诊断脚本程序,然后查看检测结果日志是否符合检测要求的方式实现。但是整机诊断过程,尤其是老化流程中,针对服务器cpu、内存、硬盘等模块各项指标达不到实时监控的级别。但是当服务器需要进行问题溯源时,一般是以查看日志的形式进行,无法展现整机诊断过程的服务器状态数据。所以,在当前智能制造的背景下,有必要对服务器的各个模块诊断过程的数据进行实时存储、追踪和诊断分析。


技术实现要素:

3.针对现有技术的上述不足,本发明提供一种服务器整机诊断过程的监控方法、系统、终端及存储介质,以解决上述技术问题。
4.第一方面,本发明提供一种服务器整机诊断过程的监控方法,包括:
5.利用普罗米修斯监控程序获取服务器的实时运行数据;
6.将获取的运行数据与服务器名称绑定后保存至数据库;
7.对数据库中的所有服务器的运行数据进行阈值比对处理,并对超出阈值范围的异常运行数据生成告警提示;
8.根据用户查询请求从数据库调取目标服务器的运行数据,并根据设定的显示规则对目标服务器的运行数据进行分类显示。
9.进一步的,对数据库中的所有服务器的运行数据进行阈值比对处理,并对超出阈值范围的异常运行数据生成告警提示,包括:
10.根据运行数据的参数类型设定各参数类型阈值范围;
11.定期读取数据库中的更新数据,并将更新数据按参数类型与相应的阈值范围进行比对;
12.将超出相应阈值范围的数据写入告警提示输出,并将所述告警提示推送至监控终端。
13.进一步的,根据用户查询请求从数据库调取目标服务器的运行数据,并根据设定的显示规则对目标服务器的运行数据进行分类显示,包括:
14.根据运行数据包含的参数类型对运行数据进行分类;
15.预先设定各参数类型的统计规则对各参数类型的数据进行统计,并将统计结果分别显示输出。
16.第二方面,本发明提供一种服务器整机诊断过程的监控系统,包括:
17.运行监控单元,用于利用普罗米修斯监控程序获取服务器的实时运行数据;
18.数据存储单元,用于将获取的运行数据与服务器名称绑定后保存至数据库;
19.阈值比对单元,用于对数据库中的所有服务器的运行数据进行阈值比对处理,并对超出阈值范围的异常运行数据生成告警提示;
20.分类显示单元,用于根据用户查询请求从数据库调取目标服务器的运行数据,并根据设定的显示规则对目标服务器的运行数据进行分类显示。
21.进一步的,所述阈值比对单元包括:
22.阈值设定模块,用于根据运行数据的参数类型设定各参数类型阈值范围;
23.比对执行模块,用于定期读取数据库中的更新数据,并将更新数据按参数类型与相应的阈值范围进行比对;
24.告警生成模块,用于将超出相应阈值范围的数据写入告警提示输出,并将所述告警提示推送至监控终端。
25.进一步的,所述分类显示单元包括:
26.数据分类模块,用于根据运行数据包含的参数类型对运行数据进行分类;
27.显示输出模块,用于预先设定各参数类型的统计规则对各参数类型的数据进行统计,并将统计结果分别显示输出。
28.第三方面,提供一种终端,包括:
29.处理器、存储器,其中,
30.该存储器用于存储计算机程序,
31.该处理器用于从存储器中调用并运行该计算机程序,使得终端执行上述的终端的方法。
32.第四方面,提供了一种计算机存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
33.本发明的有益效果在于,本发明提供的服务器整机诊断过程的监控方法、系统、终端及存储介质,可以以图形化的形式展示服务器的实时数据,针对整机检测过程中的异常指标进行报警,有助于优化整机检测程序,从而提高了整机系统诊断质量;同时可以邮件告知相关负责人,提高了处理故障的及时性,从而节约了检测时间。服务器进行问题溯源时,本发明提高追踪问题的效率,节约了人力成本。本发明在保持传统的整机诊断流程基础上,增加服务器实时监控数据的诊断分析的流程,能进一步提升出厂服务器的稳定性和可靠性。
34.此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
附图说明
35.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
36.图1是本发明一个实施例的方法的示意性流程图。
37.图2是本发明一个实施例的系统的示意性框图。
38.图3为本发明实施例提供的一种终端的结构示意图。
具体实施方式
39.为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
40.下面对本发明中出现的关键术语进行解释。
41.prometheus:中文名普罗米修斯,是一个开源的监控程序,它将采集器收集到的所有信息都存储为时间序列数据,实时分析系统运行的状态、执行时间、调用次数等,以找到系统的热点,为性能优化提供依据。
42.grafana:用于可视化展现监控结果,他提供了强大和优雅的方式可视化展现方式,支持图标、列表、柱状图等多种展现方式。
43.node_exporter:用于监控linux系统的指标采集器,采集系统运行指标信息。
44.alertmanager:提供监控告警功能,支持短信、邮件等多种告警方式。
45.图1是本发明一个实施例的方法的示意性流程图。其中,图1执行主体可以为一种服务器整机诊断过程的监控系统。
46.如图1所示,该方法包括:
47.步骤110,利用普罗米修斯监控程序获取服务器的实时运行数据;
48.步骤120,将获取的运行数据与服务器名称绑定后保存至数据库;
49.步骤130,对数据库中的所有服务器的运行数据进行阈值比对处理,并对超出阈值范围的异常运行数据生成告警提示;
50.步骤140,根据用户查询请求从数据库调取目标服务器的运行数据,并根据设定的显示规则对目标服务器的运行数据进行分类显示。
51.为了便于对本发明的理解,下面以本发明服务器整机诊断过程的监控方法的原理,结合实施例中对服务器整机诊断过程进行监控的过程,对本发明提供的服务器整机诊断过程的监控方法做进一步的描述。
52.具体的,所述服务器整机诊断过程的监控方法包括:
53.s1、利用普罗米修斯监控程序获取服务器的实时运行数据。
54.在监控中心的服务器上,安装prometheus、grafana等服务。步骤如下:
55.a)使用root帐号登录,拷贝安装文件soft目录到服务器。
56.b)进入soft目录,执行安装命令./promethues.sh-i,根据提示完成安装选项。
57.c)安装完成后,启动prometheus。启动命令:./start.sh

start。
58.d)启动成功后,访问地址:http://服务器ip:9090/targets,就可以访问prometheus了。
59.e)在网页上配置被监控服务器的ip、用户名、密码等数据,以及需要监控的关键进程等。利用prometheus获取被监控服务器的实时运行数据。
60.f)导入grafana的可视化视图模板。
61.解压/soft/grafana_template.tar.gz,导入可视化模板,包括按照拓扑图展示服务器整体健康程度模板、服务器性能排行榜视图模板、单台主机明细视图模板等。
62.g)根据实际需求,配置告警规则。触发相应告警规则后,可以发送邮件等。
63.被监控服务器,需要安装node_exporter服务。步骤如下:a)导入安装文件。从/home/prometheus/exporter目录里拷贝node_exporter-0.18.1.linux-amd64.tar.gz、node_exporter.sh到相应目录。b)使用root权限帐号,安装node_exporter服务。安装命令:./node_exporter.sh

install。c)启动node_exporter服务。启动命令:./node_exporter.sh

start。
64.s2、将获取的运行数据与服务器名称绑定后保存至数据库。
65.将获取的实时运行数据与所属服务器名词绑定后保存至数据库。
66.s3、对数据库中的所有服务器的运行数据进行阈值比对处理,并对超出阈值范围的异常运行数据生成告警提示。
67.根据运行数据的参数类型设定各参数类型阈值范围;定期读取数据库中的更新数据,并将更新数据按参数类型与相应的阈值范围进行比对;将超出相应阈值范围的数据写入告警提示输出,并将所述告警提示推送至监控终端。
68.对数据进行存储转换,并按照可视化模板配置信息展示cpu信息、cpu使用率、内存使用率、磁盘信息、磁盘可用空间、磁盘使用率、磁盘io读写、tcp连接情况、以及其他关键进程等指标。告警中心按照配置的告警阈值对服务器的连接状态、健康度进行诊断评估,当各项指标出现异常时,可以给相应负责人发送邮件的方式进行告警。
69.s4、根据用户查询请求从数据库调取目标服务器的运行数据,并根据设定的显示规则对目标服务器的运行数据进行分类显示。
70.根据运行数据包含的参数类型对运行数据进行分类;预先设定各参数类型的统计规则对各参数类型的数据进行统计,并将统计结果分别显示输出。
71.统计规则例如计算平均值、最大值、最小值等。不同的参数类型对应匹配的统计规则。将统计结果显示输出。
72.如图2所示,该系统200包括:
73.运行监控单元210,用于利用普罗米修斯监控程序获取服务器的实时运行数据;
74.数据存储单元220,用于将获取的运行数据与服务器名称绑定后保存至数据库;
75.阈值比对单元230,用于对数据库中的所有服务器的运行数据进行阈值比对处理,并对超出阈值范围的异常运行数据生成告警提示;
76.分类显示单元240,用于根据用户查询请求从数据库调取目标服务器的运行数据,并根据设定的显示规则对目标服务器的运行数据进行分类显示。
77.可选地,作为本发明一个实施例,所述阈值比对单元包括:
78.阈值设定模块,用于根据运行数据的参数类型设定各参数类型阈值范围;
79.比对执行模块,用于定期读取数据库中的更新数据,并将更新数据按参数类型与相应的阈值范围进行比对;
80.告警生成模块,用于将超出相应阈值范围的数据写入告警提示输出,并将所述告警提示推送至监控终端。
81.可选地,作为本发明一个实施例,所述分类显示单元包括:
82.数据分类模块,用于根据运行数据包含的参数类型对运行数据进行分类;
83.显示输出模块,用于预先设定各参数类型的统计规则对各参数类型的数据进行统
计,并将统计结果分别显示输出。
84.图3为本发明实施例提供的一种终端300的结构示意图,该终端300可以用于执行本发明实施例提供的服务器整机诊断过程的监控方法。
85.其中,该终端300可以包括:处理器310、存储器320及通信单元330。这些组件通过一条或多条总线进行通信,本领域技术人员可以理解,图中示出的服务器的结构并不构成对本发明的限定,它既可以是总线形结构,也可以是星型结构,还可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
86.其中,该存储器320可以用于存储处理器310的执行指令,存储器320可以由任何类型的易失性或非易失性存储终端或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。当存储器320中的执行指令由处理器310执行时,使得终端300能够执行以下上述方法实施例中的部分或全部步骤。
87.处理器310为存储终端的控制中心,利用各种接口和线路连接整个电子终端的各个部分,通过运行或执行存储在存储器320内的软件程序和/或模块,以及调用存储在存储器内的数据,以执行电子终端的各种功能和/或处理数据。所述处理器可以由集成电路(integrated circuit,简称ic)组成,例如可以由单颗封装的ic所组成,也可以由连接多颗相同功能或不同功能的封装ic而组成。举例来说,处理器310可以仅包括中央处理器(central processing unit,简称cpu)。在本发明实施方式中,cpu可以是单运算核心,也可以包括多运算核心。
88.通信单元330,用于建立通信信道,从而使所述存储终端可以与其它终端进行通信。接收其他终端发送的用户数据或者向其他终端发送用户数据。
89.本发明还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可包括本发明提供的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:read-onlymemory,简称:rom)或随机存储记忆体(英文:random access memory,简称:ram)等。
90.因此,本发明可以以图形化的形式展示服务器的实时数据,针对整机检测过程中的异常指标进行报警,有助于优化整机检测程序,从而提高了整机系统诊断质量;同时可以邮件告知相关负责人,提高了处理故障的及时性,从而节约了检测时间。服务器进行问题溯源时,本发明提高追踪问题的效率,节约了人力成本。本发明在保持传统的整机诊断流程基础上,增加服务器实时监控数据的诊断分析的流程,能进一步提升出厂服务器的稳定性和可靠性,本实施例所能达到的技术效果可以参见上文中的描述,此处不再赘述。
91.本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中如u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质,包括若干指令用以使得一台计算机终端(可以是个人计算机,服务器,或者第二终端、网络终端等)执行本发明各个实施例所述方法的全部或部分步骤。
92.本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于终端实施
例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
93.在本发明所提供的几个实施例中,应该理解到,所揭露的系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,系统或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
94.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
95.另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
96.尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献