一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于运维保障服务管理平台的监控管理系统的制作方法

2022-12-20 01:12:36 来源:中国专利 TAG:

1.本发明涉及运维保障服务管理技术领域,尤其涉及一种基于运维保障服务管理平台的监控管理系统。


背景技术:

2.运维保障服务管理平台的建设从设计的角度描述其结构模块流程设计和数据库系统功能的实现,明确运维保障服务管理平台的接口设计,使项目开发人员、实施人员明确系统的功能,可针对性的进行平台的开发、测试、验收等各方面的工作。
3.但传统的运维保障服务管理平台的监控管理系统,在其使用过程中仍存在不足,无法对其进行扩展,监控规模小,存取性能低,且无法对管理进行深入融合联动,因此,为了解决此类问题,我们提出了一种基于运维保障服务管理平台的监控管理系统。


技术实现要素:

4.本发明提出的一种基于运维保障服务管理平台的监控管理系统,解决了现有的运维保障服务管理平台的监控管理系统无法对其进行扩展,监控规模小,存取性能低,且无法对管理进行深入融合联动的问题。
5.为了实现上述目的,本发明采用了如下技术方案:
6.一种基于运维保障服务管理平台的监控管理系统,包括资源管理、关系管理、拓扑管理、业务管理、用户体验管理、性能分析管理、告警异常管理、策略管理和通知视图管理,所述监控管理系统基于资源管理、关系管理、拓扑管理、业务管理、用户体验管理、性能分析管理、告警异常管理、策略管理和通知视图管理,以全域视角监控机房网络、计算、存储、虚拟化、容器、云资源、操作系统、数据库、中间件等所有it基础架构,持续优化业务可用性,基于平台的微服务集群架构,提供ha能力以及可扩展,实现大规模监控,根据数据访问特性使用不同数据库,提高存取性能并为其它运维模块提供数据基础。
7.优选的,所述资源管理用于管理包括主机系统、数据库系统、应用系统、网络设备等it资源及其组成元素的模块,及他们的子资源,以及提供资源发现、资源维护、资源关系管理、资源查询、关系查询功能,通过资源管理模块提供的功能,监控系统将企业信息系统按照统一概念模型映射到数据库中,形成了一份关于信息系统组成结构的共享知识,同时也为资源的运行时监控提供基础。
8.优选的,所述关系管理是事件相关性分析的基础功能,主要分为关系类别维护、关系维护、关系发现功能,通过资源关系管理,用户可以在资源的子资源之间建立各种关联关系,从而细化一个资源的组成结构,为资源维护与管理提供共享知识,资源之间的关联关系包括横向和纵向。
9.优选的,所述拓扑管理的展现要求分层次地呈现it系统所涉及的所有被管理资源的拓扑结构,具有灵活的拖拽、缩放、动态刷新功能,同时在性能、告警、配置等方面动态反映资源环境的变化,能够根据现有的资源关系模型自动生成拓扑图,能够在线编辑拓扑图,
提供位置和大小拖拽、元素编辑、连线关系编辑功能,对已经保存的拓扑图进行再次显示。
10.优选的,所述业务管理实时展示各个业务系统当前的健康状态等状态数据,平台页面中显示端到端的拓扑展示图,通过手动拖拽的方式自由改变大小,通过数据模型查询业务组件之间、业务和平台之间以及平台资源之间的关系,并且以按照可用性、性能、容量等数据管理相应的监控指标,同时运维保障服务管理平台将通过服务模型实现业务全景监控,系统将根据业务情况来建立模型,并实时的展示各个服务之间的映射关系,在监控中可以看到不同服务的问题对业务造成的影响。
11.优选的,所述用户体验管理能够分析用户体验相关的响应时间、错误量、页面点击数量、用户来源、ajax错误关键指标,且数据将会被收集,并保存在数据库中,系统定期检查数据是否出现异常,并对系统做出改进,提高用户体验,对于特殊用户,运维保障服务管理平台还特别记录访问网站的详细情况,并对其数据进行分析,将分析结果保存到数据中。
12.优选的,所述性能分析管理包括性能分析和性能管理,所述性能分析通过健康报告统一个资源在一天、一周、一月的时间段内监控的健康度情况,包括健康度变化曲线、事件发生的统计、关键性能数据的变化趋势;
13.所述性能管理包括性能数据采集、接入、存储、汇聚以及对性能数据的实时展现和历史查询,性能管理将提供应用所有web事务列表并提供缓慢web事务的代码追踪trace,实现应用事务性能监控与分析,提供所有应用层列表,应用总览视图,应用过程总览,提供应用拓扑功能模块。
14.优选的,所述告警异常管理包括事件检测与标准化、事件压制与合并、事件关联、事件信息存储与展现查询功能,其主要目的是为了及时发现it系统存在的故障。
15.优选的,所述策略管理是系统提供一系列可配置的管理功能,为了保证其他功能模块的功能更全面和完整。
16.优选的,所述通知视图管理包括通知管理和视图管理,所述通知管理是按预先设置的事件通知策略,将事件消息通知给接收人,按其通知方式可分为短信通知、邮件通知,按通知类型分为及时通知、提升通知、恢复通知,通知发送成功后记录通知发送记录可供用户查询和导出,及时通知是指事件产生后立即发送通知,提升通知是指事件产生后指定时效内未被清除则发送通知,其设置的接收人与通知方式可与其及时通知策略不同,恢复通知是指事件恢复后发送事件恢复通知,同时取消该事件未发送的其它通知;
17.所述视图管理是操作用于为了适应自己的常用操作和显示形式,将系统的各个功能模块的展示界面集中定制显示。
18.本发明的有益效果为:以全域视角监控机房网络、计算、存储、虚拟化、容器、云资源、操作系统、数据库、中间件等所有it基础架构,持续优化业务可用性,以便满足企业全域资源的统一管理,基于平台的微服务集群架构,提供ha能力以及可扩展,实现大规模监控,根据数据访问特性使用不同数据库,提高存取性能并为其它运维模块提供数据基础,且提供网络管理、服务器管理、存储管理、数据库管理、中间件管理、网络流量管理、虚拟化资源管理、集中告警管理、融合拓扑管理、分级分权管理、统一报表管理等功能,实现了管理的深入融合联动。
19.综上所述,该运维保障服务管理平台的监控管理系统优化业务的可用性,满足企业全域资源的统一管理,实现大规模监控,存取性能高,实现管理的深入融合联动。
附图说明
20.图1为本发明所述的融合基础架构全域资源监控架构图。
21.图2为本发明所述资源管理中的资源发现过程的流程图。
22.图3为本发明所述的关系管理数据流图。
23.图4为本发明所述的性能分析管理中性能分析的处理流程图。
具体实施方式
24.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
25.参照图1-4所示,一种基于运维保障服务管理平台的监控管理系统,包括资源管理、关系管理、拓扑管理、业务管理、用户体验管理、性能分析管理、告警异常管理、策略管理和通知视图管理,所述监控管理系统基于资源管理、关系管理、拓扑管理、业务管理、用户体验管理、性能分析管理、告警异常管理、策略管理和通知视图管理,以全域视角监控机房网络、计算、存储、虚拟化、容器、云资源、操作系统、数据库、中间件等所有it基础架构,持续优化业务可用性,基于平台的微服务集群架构,提供ha能力以及可扩展,实现大规模监控,根据数据访问特性使用不同数据库,提高存取性能并为其它运维模块提供数据基础。
26.所述资源管理用于管理包括主机系统、数据库系统、应用系统、网路设备等it资源及其组成元素的模块,及他们的子资源,以及提供资源发现、资源维护、资源关系管理、资源查询、关系查询功能,通过资源管理模块提供的功能,监控系统将企业信息系统按照统一概念模型映射到数据库中,形成了一份关于信息系统组成结构的共享知识,同时也为资源的运行时监控提供基础;
27.资源模型维护:进行资源类别、指标、属性、事件以及相互约束关系的定义;
28.资源发现:通过资源发现功能可以发现指定资源的各级孩子资源及其属性值,并按组成关系形成父子关系存入数据库,其资源发现过程如图2所示;
29.资源维护管理:资源维护管理是指对资源的新增、删除、修改以及迁移管理等,资源维护管理还包括录入和修改资源的某些属性值。
30.所述关系管理是事件相关性分析的基础功能,主要分为关系类别维护、关系维护、关系发现功能,通过资源关系管理,用户可以在资源的子资源之间建立各种关联关系,从而细化一个资源的组成结构,为资源维护与管理提供共享知识,资源之间的关联关系包括横向和纵向,资源关系管理包括:
31.资源关系发现:能自动发现平台设备的依赖、组成、连接关系;
32.关系编辑,用户可以使用手工编辑人工整合子资源之间的关联关系,包括关系增、删、与修改等;
33.关系查询:提供按资源、类别不同维度的查询;
34.关系管理是事件相关性分析的基础功能,主要分为关系类别维护、关系维护、关系发现功能;
35.且其关系管理数据流图如图3所示。
36.所述拓扑管理的展现要求分层次地呈现it系统所涉及的所有被管理资源的拓扑结构,应具有灵活的拖拽、缩放、动态刷新等功能,同时在性能、告警、配置等方面动态反映
资源环境的变化;
37.自动拓扑:能够根据现有的资源关系模型自动生成拓扑图;
38.拓扑编辑:能够在线编辑拓扑图,提供位置和大小拖拽、元素编辑、连线关系编辑等功能;
39.拓扑展现:对已经保存的拓扑图进行再次显示。
40.所述业务管理实时展示各个业务系统当前的健康状态等状态数据,平台页面中显示端到端的拓扑展示图,通过手动拖拽的方式自由改变大小,通过数据模型查询业务组件之间、业务和平台之间以及平台资源之间的关系,并且以按照可用性、性能、容量等数据管理相应的监控指标,同时运维保障服务管理平台将通过服务模型实现业务全景监控,系统将根据业务情况来建立模型,并实时的展示各个服务之间的映射关系,在监控中可以看到不同服务的问题对业务造成的影响。
41.所述用户体验管理能够分析用户体验相关的响应时间、错误量、页面点击数量、用户来源、ajax错误关键指标,且数据将会被收集,并保存在数据库中,系统定期检查数据是否出现异常,并对系统做出改进,提高用户体验,对于特殊用户,运维保障服务管理平台还特别记录访问网站的详细情况,并对其数据进行分析,将分析结果保存到数据中。
42.所述性能分析管理包括性能分析和性能管理,所述性能分析通过健康报告统一个资源在一天、一周、一月的时间段内监控的健康度情况,包括健康度变化曲线、事件发生的统计、关键性能数据的变化趋势,其处理流程如图4所示;
43.所述性能管理包括性能数据采集、接入、存储、汇聚以及对性能数据的实时展现和历史查询,性能管理将提供应用所有web事务列表并提供缓慢web事务的代码追踪trace,实现应用事务性能监控与分析,提供所有应用层列表,应用总览视图,应用过程总览,提供应用拓扑功能模块;
44.性能采集:系统支持通过定义轮询采集调度、定时采集调度、实时出发采集调度的方式来采集各类性能、配置和故障数据,通过这集中采集方式的灵活配置,可以实现实时故障数据、性能数据、配置数据的采集,精确度可以达到秒级;
45.性能接入:能够集成第三方工具采集的实时性能数据和历史性能数据;
46.性能数据存储:对原始性能数据进行分区存储,历史数据永久保留;
47.性能数据汇聚:对性能数据进行小时汇聚、日汇聚;
48.实时展现:对实时性能提供dashboard和实时表格的展现方式,在实时查看时能够加快指标的采集速度,以提高及时性;
49.历史查询:提供按资源、指标、时间不同维度的查询。
50.所述告警异常管理包括事件检测与标准化、事件压制与合并、事件关联、事件信息存储与展现查询功能,其主要目的是为了及时发现it系统存在的故障;
51.事件检测与接入:事件数据来源包含监控平台通过主动状态轮询、被动接收snmp trap、syslog获得的信息,以及从已有的网管软件或信息安全管理软件中转发过来的事件信息,这些事件信息经过标准化处理,形成统一格式的标准化事件,同时,通过性能管理和资源管理模块,告警管理模块能够获得已经是标准事件的性能指标超门限和配置信息变更等事件信息;
52.事件压制与过滤:在事件生成以后,被处理完之前,有可能生成重复事件,例如当
某设备通过状态轮询发现其状态异常后,每次状态轮询将生成一个重复事件,另外同一事件可能由于事件来源不同而生成多个事件/告警,事件压制与合并就是对相同的事件或派生型事件进行压制和归并,在告警管理模块中保持告警信息的准确性和精确性;
53.事件关联:在实际环境中,很多事件之间存在关联关系,如因果关系、触发关系、影响关系等,同时由于很多被管对象之间存在父子关系,很多应用处理环节之间有先后次序,因此,可以通过建立合理的事件相关性模型和被管对象的父子关系,以及面向应用过程的分析流图,判断已发生事件间的相关性,实现故障源识别和准确的故障定位,事件关联分析,首先依据事件因果关系规则,查找当前事件缓冲区,发现事件的根源事件,其次需要依据事件源之间的父子关系、相关关系,设置事件之间的关联关系;
54.事件信息存储:进行事件信息的持久化存储,监控系统对历史事件进行永久保存,不清除历史事件;
55.事件展现与查询:提供事件滚动窗口、查询、过滤表格的展现形式;
56.事件处理:提供事件的认领、清除、自动发送工单、手动发送工单的功能。
57.所述策略管理是系统提供一系列可配置的管理功能,为了保证其他功能模块的功能更全面和完整;
58.监控状态策略:资源的监控状态分为暂停监控和正常监控两种状态,可以进行周期暂停/恢复、定时暂停/恢复、手工暂停/恢复;
59.性能采集策略:提供指标采集的配置和性能集成配置,指标采集方式分为周期采集、定时采集;
60.事件检测策略:提供事件阀值、防抖动的配置和事件的消息配置;
61.事件过滤策略:配置事件的压制合并策略;
62.资源发现策略:配置资源发现的范围、周期,资源发现后变更的处理策略;
63.事件相关性策略:配置事件相关性的影响规则;
64.事件通知策略:配置事件通知范围、通知接收人、接收方式以及通知过滤、通知暂停、通知提升等规则,过滤规则可以设定符合什么条件的需要通知,提升规则描述了在什么条件下,需要提升通知优先级,以及在什么条件下需要将通知到当前接受者的主管领导;
65.事件工单策略:配置发送工单的事件范围、数据格式化、工单发送方式;
66.健康度传递策略:配置资源健康度的传递规则、事件的影响程度以及健康度计算算法;
67.可用性传递策略:配置资源可用性的传递规则、影响程度以及可用性计算算法。
68.所述通知视图管理包括通知管理和视图管理,所述通知管理是按预先设置的事件通知策略,将事件消息通知给接收人,按其通知方式可分为短信通知、邮件通知,按通知类型分为及时通知、提升通知、恢复通知,通知发送成功后记录通知发送记录可供用户查询和导出,及时通知是指事件产生后立即发送通知,提升通知是指事件产生后指定时效内未被清除则发送通知,其设置的接收人与通知方式可与其及时通知策略不同,恢复通知是指事件恢复后发送事件恢复通知,同时取消该事件未发送的其它通知,通知管理模块功能包括:
69.消息发送:以邮件、短信等方式发送事件消息;
70.历史查询:查询已发送事件通知;
71.所述视图管理是操作用于为了适应自己的常用操作和显示形式,将系统的各个功
能模块的展示界面集中定制显示,模块功能包括:
72.视图定制:用户定制自己的常用界面和资源显示视图;
73.视图显示:系统在用户登录后显示用户已经定制的界面和资源视图。
74.以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献