一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

服务系统的监控方法及装置、存储介质、计算机设备与流程

2021-10-23 01:30:00 来源:中国专利 TAG:监控 系统 装置 计算机 方法


1.本发明涉及系统监控领域,具体地涉及一种服务系统的监控方法及装置、存储介质、计算机设备。


背景技术:

2.在大量硬件设备部署后,在运营过程中,工作人员需要及时了解整个系统的软硬件状态,及时了解获取报警通知信息,并且需要根据报警通知信息快速排查问题,最终完成故障的排除,使设备重新恢复的正常状态。
3.现有技术中,服务系统中若发生故障,即产生报警通知信息,此报警是针对单个设备或当个错误现象产生的,无法全面监控服务系统,存在监控盲区且易发生故障的误报漏报。


技术实现要素:

4.本发明解决的技术问题是如何减少监控盲区和信息的误报漏报。
5.为解决上述技术问题,本发明实施例提供一种服务系统的监控方法,所述服务系统包括设备层、服务层和业务层,所述方法包括:获取设备层中各个设备的设备检测报告;获取服务层中各个服务接口的接口测试报告;获取业务层的业务交互数据;对所述设备检测报告、接口测试报告和所述业务日志进行分析,以发现所述服务系统中存在的故障问题;其中,所述设备层包括所述服务系统的各个设备,所述服务层包括所述服务系统提供的各个服务接口,所述业务层用于定义所述服务系统的业务流转规则。
6.可选的,各个设备的设备检测报告包括该设备的运行状态日志和网络状态日志,所述获取设备层中各个设备的设备检测报告,包括:设备层的设备部署在内网和/或外网中,通过内外网穿透使得内外网打通;监控设备层中各个设备的运行,以获得该设备的运行状态日志和网络状态日志。
7.可选的,所述接口测试报告由各个服务接口执行对应的测试指令后根据测试结果生成。
8.可选的,所述对所述设备检测报告、所述接口测试报告和所述业务日志进行分析,包括:通过全文搜索工具,对所述设备检测报告和/或所述接口测试报告和/或所述业务日志中的数据进行对比分析。
9.可选的,获取所述设备检测报告、所述接口测试报告和所述业务日志之后,还包括:将所述设备检测报告和/或所述接口测试报告和/或所述业务日志存储在数据收集服务器中。
10.可选的,所述设备检测报告、所述接口测试报告和所述业务日志是通过日志上传工具发送至所述数据收集服务器并进行存储的。
11.可选的,所述发现所述服务系统中存在的故障问题之后,还包括:获取锁定的故障问题的相关信息;将所述故障问题和所述相关信息发送至故障处理终端,以使得所述故障
终端处理所述故障问题。
12.本发明实施例还提供一种服务系统的监控装置,所述装置包括:设备层监控模块,用于获取设备层中各个设备的设备检测报告;服务层监控模块,用于获取服务层中各个服务接口的接口测试报告;业务层监控模块,用于获取业务层的业务交互数据;故障锁定模块,用于对所述设备检测报告、接口测试报告和所述业务日志进行分析,以发现所述服务系统中存在的故障问题;其中,所述设备层包括所述服务系统的各个设备,所述服务层包括所述服务系统提供的各个服务接口,所述业务层用于定义所述服务系统的业务流转规则。
13.本发明实施例还提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述数据传输方法的步骤。
14.本发明实施例还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述数据传输方法的步骤。
15.与现有技术相比,本发明实施例的技术方案具有以下有益效果:
16.本发明实施例提供一种服务系统的监控方法,所述服务系统包括设备层、服务层和业务层,所述方法包括:获取设备层中各个设备的设备检测报告;获取服务层中各个服务接口的接口测试报告;获取业务层的业务交互数据;对所述设备检测报告、接口测试报告和所述业务日志进行分析,以发现所述服务系统中存在的故障问题;其中,所述设备层包括所述服务系统的各个设备,所述服务层包括所述服务系统提供的各个服务接口,所述业务层用于定义所述服务系统的业务流转规则。较之现有技术,本发明方案中,根据服务系统的设备层、服务层和业务层进行多层监控设计,能够实现服务系统的软硬件相结合、有效监控服务系统内部的设备运行状态、内部与外部多系统之间的服务交互情况和业务流转情况,以实现多系统协同。通过多层监控,全面监控,而且实现数据的统一收集和相互验证,极大程度上减少监控盲区和信息的误报漏报。
17.进一步地,为实现对设备层的全网监控环境,可通过内外网穿透工具将内外网打通,全面收集设备的网络信息;另外,还可以配置接口监控平台管理所有的服务接口的监控流程。
18.进一步地,由于监控数据产生于服务系统的多个节点,产生量大,通过flume等高速数据采集工具,能够有效保护数据的完整性,且该工具支持断点续传,受链路影响较小。
19.进一步地,当根据各层的监控数据锁定故障问题后,可获取相关信息,将其发送至故障处理终端以通知对应的工作人员,工作人员可根据故障问题的相关信息进行故障排查与处理。其中,相关信息可以为故障设备的设备标识号、当前网络状态、故障编码和故障的优先级等信息。
附图说明
20.图1为本发明实施例的一种服务系统的监控方法的流程示意图;
21.图2为本发明实施例的一种服务系统的监控方法的应用示意图;
22.图3是本发明实施例的一种服务系统的监控装置的结构示意图。
具体实施方式
23.如背景技术所言,现有技术中在服务系统的自动化场景中,执行一个任务时,业务层和设备层的数据是交替产生的。当个别节点出现异常,经过重试机制可以让任务继续执行,不受影响。若如现有技术中单靠一个节点的故障报警就判定系统出现异常,则可能发生故障误报和漏报的情况。
24.为解决该问题,本发明实施例提供了一种服务系统的监控方法,所述服务系统包括设备层、服务层和业务层,所述方法包括:获取设备层中各个设备的设备检测报告;获取服务层中各个服务接口的接口测试报告;获取业务层的业务交互数据;对所述设备检测报告、接口测试报告和所述业务日志进行分析,以发现所述服务系统中存在的故障问题;其中,所述设备层包括所述服务系统的各个设备,所述服务层包括所述服务系统提供的各个服务接口,所述业务层用于定义所述服务系统的业务流转规则。
25.通过上述方案,能够有效减少监控盲区和信息的误报漏报。
26.为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
27.请参见图1,本发明实施例提供一种服务系统的监控方法,所述服务系统包括设备层、服务层和业务层,所述方法包括:
28.步骤s101,获取设备层中各个设备的设备检测报告;
29.步骤s102,获取服务层中各个服务接口的接口测试报告;
30.步骤s103,获取业务层的业务交互数据;
31.步骤s104,对所述设备检测报告、接口测试报告和所述业务日志进行分析,以发现所述服务系统中存在的故障问题;
32.其中,所述设备层包括所述服务系统的各个设备,所述服务层包括所述服务系统提供的各个服务接口,所述业务层用于定义所述服务系统的业务流转规则。
33.在一个对外提供服务的服务系统中至少包括三层:设备层,包括若干个支持服务系统运行的底层设备;服务层,包括多个向外部系统提供不同服务的服务接口;业务层,也称业务逻辑层(business logic layer),用于定义所述服务系统的业务流转规则,该层主要的关注端在业务规则的制定、业务流程的实现等与业务需求有关的系统设计等。
34.通过在服务系统的设备层、服务层和业务层分别部署监控机制,以收集各层的监控数据,各层的监控数据可以为各层根据各自设定好的故障上报规则,在发生故障问题时上报的故障通知消息。
35.可选的,各层上报的故障通知消息可具有异常级别,该异常级别用于表示故障的急迫程度。例如监控发现一台服务器离线,但是通过其他服务器相关日志发现,此台服务器离线没有产生错误数据。只需要恢复即可,异常级别就可以不用很高。
36.其中,对设备层进行监控得到的监控数据为设备检测报告,设备检测报告可以为对各个设备的运行状态进行检收集的检测日志,可包括各个设备的内存占用量、是否宕机以及各个设备的网络交互情况等信息。
37.对服务层进行监控得到的监控数据为接口测试报告,对该服务系统与外部的其他系统进行数据交互的各个接口处设置监控点,以获得接口测试报告;对业务层进行监控得到的监控数据为业务交互数据,即在业务层执行业务流转规则时,收集产生的业务数据或
检测日志等。
38.在获取设备层、服务层和业务层的监控数据后,可将这些数据结合起来进行故障对比分析,以发现服务系统中存在的故障问题。例如,业务层中上报的故障数据大多与特定的设备有关,可结合业务层的故障数据与设备层中设备的运行状态,快速定位到故障设备,以解决该设备的故障问题。
39.通过上述服务系统的监控方法,根据服务系统的设备层、服务层和业务层进行多层监控设计,能够实现服务系统的软硬件相结合、有效监控服务系统内部的设备运行状态、内部与外部多系统之间的服务交互情况和业务流转情况,以实现多系统协同。通过多层监控,全面监控,而且实现数据的统一收集和相互验证,极大程度上减少监控盲区和信息的误报漏报。
40.在一个实施例中,各个设备的设备检测报告包括该设备的运行状态日志和网络状态日志,图1中的步骤s101获取设备层中各个设备的设备检测报告,可包括:设备层的设备部署在内网和/或外网中,通过内外网穿透使得内外网打通;监控设备层中各个设备的运行,以获得该设备的运行状态日志和网络状态日志。
41.各个设备的设备检测报告除包括该设备运行情况的运行状态日志,还可以包括该设备在网络环境中进行数据交互时生成的网络状态日志。在服务系统中的设备可部署在当地现场的内网环境中,也有部分设备需与外网通讯。故需要对设备层中的各个设备实现全网监控环境需要实现内外网打通,可利用内外网穿透工具lanproxy等实现内外网打通。
42.可选的,在内外网打通之后,还可通过zabbix等监控类型的软件,监控每一台机器以收集设备的信息(如网络信息、硬盘信息等),并将收集到的信息发送至服务器。
43.可选的,所述接口测试报告由各个服务接口执行对应的测试指令后根据测试结果生成。
44.对服务层的各个服务接口监控时,可对各个服务接口设置对应的测试指令,各服务接口调用对应的测试指令以检测接口的运行情况,生成接口测试包括。
45.可选的,各个服务接口每隔一段时间调用对应的测试指令,进行一次接口测试,周期性对各个服务接口进行健康性检测。
46.可选的,可配置整个服务系统的接口监控平台,对各个服务接口根据接口标识或接口地址配置测试指令和测试周期,以管理所有的服务接口的监控流程。
47.本实施例中,为实现对设备层的全网监控环境,可通过内外网穿透工具将内外网打通,全面收集设备的网络信息;另外,还可以配置接口监控平台管理所有的服务接口的监控流程。
48.在一个实施例中,图1中步骤s104中对所述设备检测报告、所述接口测试报告和所述业务日志进行分析,可包括:通过全文搜索工具,对所述设备检测报告和/或所述接口测试报告和/或所述业务日志中的数据进行分析。
49.在获取设备检测报告、接口测试报告和业务日志之后,若需要对这些监控数据进行对比分析,可通过全文搜索工具,如filelocator、apache lucene等从监控数据中获取设备层、服务层和业务层中相关的监控数据,以快速发现故障问题、定位故障设备,以执行故障解决。
50.可结合故障分析的需求,从设备层、服务层和业务层中的一层或多层进行数据分
析。由于业务层的业务日志数据量较大,可先结合设备层和服务层定位到故障后,再根据定位的故障查询业务日志的对应内容。
51.可选的,请继续参见图1,通过图1中的步骤s101至s103获取所述设备检测报告、所述接口测试报告和所述业务日志之后,还可包括:将所述设备检测报告、所述接口测试报告和所述业务日志存储在数据收集服务器中。
52.可选的,在获取到设备检测报告、接口测试报告和业务日志,将这些监控数据收集到数据收集服务器中,在需要进行故障分析时,可从数据收集服务器获取需要的监控数据以进行数据分析。可选的,数据收集服务器为云端服务器,该服务器可使用搜索服务器(elasticsearch,简称es)存储,并且可利用es内部的全文检索工具包(apache lucene)实现数据的读写。
53.可选的,所述设备检测报告和/或所述接口测试报告和/或所述业务日志是通过日志上传工具发送至所述数据收集服务器并进行存储的。
54.其中,日志上传工具可以为日志管理工具flume等。
55.由于监控数据产生于服务系统的多个节点,产生量大,通过flume等高速数据采集工具,能够有效保护数据的完整性,且该工具支持断点续传,受链路影响较小。
56.在一个实施例中,请继续参见图1,步骤s104所述发现所述服务系统中存在的故障问题之后,还可包括:获取锁定的故障问题的相关信息;将所述故障问题和所述相关信息发送至故障处理终端,以使得所述故障终端处理所述故障问题。
57.当根据各层的监控数据锁定故障问题后,可获取相关信息,将其发送至故障处理终端以通知对应的工作人员,工作人员可根据故障问题的相关信息进行故障排查与处理。其中,相关信息可以为故障设备的设备标识号、当前网络状态、故障编码和故障的优先级等信息。
58.请参见图2,图2提供了一种服务系统的监控方法的应用示意图,该方法可应用于物流园区的服务监控,设备层中的设备包括多个道闸(图2中的道闸201和道闸202),每一道闸可包括闸门、本地的终端(如电脑等)、管理该道闸数据的道闸服务器等设备;各个道闸将产生的出入记录等信息传输到园区服务器203,园区服务器203可对其他系统提供服务,共同构成服务层,且园区服务器203还对该园区的多个道闸进行管理。各个园区服务器203还可与云端业务服务器204进行业务交互,构成业务层;园区服务器203可配置zabbix监控程序,以将设备层的监控数据发送至zabbix服务器205;另外,各个道闸(如道闸201和道闸202)中的各个设备若有需要也可配置zabbix监控程序,直接将监控信息传输至zabbix服务器205;其中,各个zabbix监控程序通过lanproxy打通内外网,以进行网络状态监控并将数据传输至zabbix服务器205。云端业务服务器204和zabbix服务器205得到的业务层的监控数据以及设备层和服务层的监控数据通过flume等工具传输至数据收集服务器206进行存储,数据收集服务器206可以为es服务器,由监控平台207对数据收集服务器206中存储的监控数据进行对比分析,以锁定故障问题,并获取相关信息,通知其他终端(如园区项目经理)。
59.请参见图3,本发明还提供一种服务系统的监控装置,所述装置可包括:
60.设备层监控模块301,用于获取设备层中各个设备的设备检测报告;
61.服务层监控模块302,用于获取服务层中各个服务接口的接口测试报告;
only memory,简称rom)、可编程只读存储器(programmable rom,简称prom)、可擦除可编程只读存储器(erasable prom,简称eprom)、电可擦除可编程只读存储器(electrically eprom,简称eeprom)或闪存。易失性存储器可以是随机存取存储器(random access memory,简称ram),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的随机存取存储器(random access memory,简称ram)可用,例如静态随机存取存储器(static ram,简称sram)、动态随机存取存储器(dram)、同步动态随机存取存储器(synchronous dram,简称sdram)、双倍数据速率同步动态随机存取存储器(double data rate sdram,简称ddr sdram)、增强型同步动态随机存取存储器(enhanced sdram,简称esdram)、同步连接动态随机存取存储器(synchlink dram,简称sldram)和直接内存总线随机存取存储器(direct rambus ram,简称dr ram)。
81.应理解,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,表示前后关联对象是一种“或”的关系。
82.本技术实施例中出现的“多个”是指两个或两个以上。
83.本技术实施例中出现的第一、第二等描述,仅作示意与区分描述对象之用,没有次序之分,也不表示本技术实施例中对设备个数的特别限定,不能构成对本技术实施例的任何限制。
84.本技术实施例中出现的“连接”是指直接连接或者间接连接等各种连接方式,以实现设备间的通信,本技术实施例对此不做任何限定。
85.虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜