一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

告警检测任务均衡调度的方法、装置、设备及可读介质与流程

2021-11-09 21:45:00 来源:中国专利 TAG:


1.本领域涉及计算机领域,并且更具体地涉及一种集群告警检测任务均衡调度的方法、装置、设备及可读介质。


背景技术:

2.本发明涉及到分布式存储集群相关的领域,分布式存储集群系统一般包含多台存储服务器(server),这些服务器组成一个集群统一对外提供服务,文中也将服务器用“节点”表示,分布式集群一般都有其告警管理系统,需要定时检测集群节点上软硬件异常并进行告警,软硬件检测指标项比较多(包括系统资源利用率、集群各项服务及硬盘、电源、风扇等硬件设备状态),需要针对各个告警指标项单独建立检测任务线程,进行周期性检测指标项的状态。由于软硬件指标检测耗时和资源消耗不同,会造成任务线程分配不均,并且会引起不必要的系统资源开销。


技术实现要素:

3.有鉴于此,本发明实施例的目的在于提出一种集群告警检测任务均衡调度的方法、装置、设备及可读介质,通过使用本发明的技术方案,能够有效增加告警线程的利用效率,能够自适应任务线程资源占用限制,避免资源占用过高对系统中其他服务造成影响,能够避免引起cpu资源峰值占用。
4.基于上述目的,本发明的实施例的一个方面提供了一种集群告警检测任务均衡调度的方法,包括以下步骤:
5.获取每个告警检测任务的耗时和资源消耗,并基于获取到的耗时和资源消耗将告警检测任务进行分类;
6.基于告警检测任务的分类为每个告警检测任务分配工作线程数,并实时检测每个告警检测任务的资源消耗;
7.响应于检测到有告警检测任务的资源消耗超过预设阈值,将该告警检测任务执行频率降低。
8.根据本发明的一个实施例,还包括:
9.获取每个告警检测任务的运行周期;
10.将具有相同运行周期的告警检测任务设置为在告警检测任务执行前在预设时间段内随机休眠后再进行执行。
11.根据本发明的一个实施例,预设时间段为1秒至30秒。
12.根据本发明的一个实施例,获取每个告警检测任务的耗时和资源消耗,并基于获取到的耗时和资源消耗将告警检测任务进行分类包括:
13.响应于告警检测任务的耗时超过1分钟和/或资源消耗大于30m物理内存,将告警检测任务分类为重量级检测任务;
14.响应于告警检测任务的耗时未超过1分钟且资源消耗不大于30m物理内存,将告警
检测任务分类为轻量级检测任务。
15.根据本发明的一个实施例,基于告警检测任务的分类为每个告警检测任务分配工作线程数,并实时检测每个告警检测任务的资源消耗包括:
16.将执行告警检测任务的总线程数中的三分之二分配给重量级检测任务;
17.将执行告警检测任务的总线程数中其余的三分之一分配给轻量级检测任务。
18.根据本发明的一个实施例,响应于检测到有告警检测任务的资源消耗超过预设阈值,将该告警检测任务执行频率降低包括:
19.响应于检测到有告警检测任务的资源消耗超过cpu单核的50%,将该告警检测任务执行频率降低50%。
20.根据本发明的一个实施例,获取每个告警检测任务的耗时和资源消耗包括:
21.在集群启动后,将所有告警检测任务执行预设次数并获取每个告警检测任务的总耗时时间和总资源消耗;
22.将总耗时时间和总资源消耗取平均值以得到每个告警检测任务的耗时和资源消耗。
23.本发明的实施例的另一个方面,还提供了一种集群告警检测任务均衡调度的装置,装置包括:
24.获取模块,获取模块配置为获取每个告警检测任务的耗时和资源消耗,并基于获取到的耗时和资源消耗将告警检测任务进行分类;
25.分配模块,分配模块配置为基于告警检测任务的分类为每个告警检测任务分配工作线程数,并实时检测每个告警检测任务的资源消耗;
26.调整模块,调整模块配置为响应于检测到有告警检测任务的资源消耗超过预设阈值,将该告警检测任务执行频率降低。
27.本发明的实施例的另一个方面,还提供了一种计算机设备,该计算机设备包括:
28.至少一个处理器;以及
29.存储器,存储器存储有可在处理器上运行的计算机指令,指令由处理器执行时实现上述任意一项方法的步骤。
30.本发明的实施例的另一个方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述任意一项方法的步骤。
31.本发明具有以下有益技术效果:本发明实施例提供的集群告警检测任务均衡调度的方法,通过获取每个告警检测任务的耗时和资源消耗,并基于获取到的耗时和资源消耗将告警检测任务进行分类;基于告警检测任务的分类为每个告警检测任务分配工作线程数,并实时检测每个告警检测任务的资源消耗;响应于检测到有告警检测任务的资源消耗超过预设阈值,将该告警检测任务执行频率降低的技术方案,能够有效增加告警线程的利用效率,能够自适应任务线程资源占用限制,避免资源占用过高对系统中其他服务造成影响,能够避免引起cpu资源峰值占用。
附图说明
32.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本
发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
33.图1为根据本发明一个实施例的集群告警检测任务均衡调度的方法的示意性流程图;
34.图2为根据本发明一个实施例的集群告警检测任务均衡调度的装置的示意图;
35.图3为根据本发明一个实施例的计算机设备的示意图;
36.图4为根据本发明一个实施例的计算机可读存储介质的示意图。
具体实施方式
37.为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
38.基于上述目的,本发明的实施例的第一个方面,提出了一种集群告警检测任务均衡调度的方法的一个实施例。图1示出的是该方法的示意性流程图。
39.如图1中所示,该方法可以包括以下步骤:
40.s1获取每个告警检测任务的耗时和资源消耗,并基于获取到的耗时和资源消耗将告警检测任务进行分类。
41.在集群启动后,将所有告警检测任务执行预设次数并获取每个告警检测任务的总耗时时间和总资源消耗,将总耗时时间和总资源消耗取平均值以得到每个告警检测任务的耗时和资源消耗,例如,集群启动后将所有的告警检测任务执行50次,监测每个告警检测任务在执行这50次的过程中的总耗时和总的资源消耗,然后取平均值就可以获得每个告警检测任务的平均耗时和资源消耗。还可以根据告警检测任务执行的历史记录获取平均的耗时和资源消耗。如果告警检测任务的耗时超过1分钟和/或资源消耗大于30m物理内存,则将告警检测任务分类为重量级检测任务,如果告警检测任务的耗时未超过1分钟且资源消耗不大于30m物理内存,则将告警检测任务分类为轻量级检测任务。
42.s2基于告警检测任务的分类为每个告警检测任务分配工作线程数,并实时检测每个告警检测任务的资源消耗。
43.将两种类型的告警检测任务划分到两个任务池中,将执行告警检测任务的总线程数中的三分之二分配给重量级检测任务,将执行告警检测任务的总线程数中其余的三分之一分配给轻量级检测任务。
44.s3响应于检测到有告警检测任务的资源消耗超过预设阈值,将该告警检测任务执行频率降低。
45.在告警服务进程启动后添加资源监控线程(resource_monitor),实时的检测每个任务cpu占用率,当发现任务执行过程中cpu占用率超过节点cpu单核的50%时,则自动降低任务的执行频率为原来的一半,以防止频率过高引起cpu长期占用,对集群其他服务造成影响。
46.通过本发明的技术方案,能够有效增加告警线程的利用效率,能够自适应任务线程资源占用限制,避免资源占用过高对系统中其他服务造成影响,能够避免引起cpu资源峰值占用。
47.在本发明的一个优选实施例中,还包括:
48.获取每个告警检测任务的运行周期;
49.将具有相同运行周期的告警检测任务设置为在告警检测任务执行前在预设时间段内随机休眠后再进行执行。告警检测任务是周期性运行,必然会出现某些任务周期相同,也就是任务每次都是相同时间开始执行检测,这样会造成如果相同周期的任务过多时,在检测开始时,会同时产生大量cpu开销,可能会引起cpu峰值,此时需要对这些相同周期的任务进行错峰执行。相同周期任务执行之前随机休眠t秒,t的范围为1

30秒,此时每个任务执行不会集中在同一时刻,不会造成cpu瞬间峰值情况,从而保障系统稳定运行。
50.在本发明的一个优选实施例中,预设时间段为1秒至30秒。
51.在本发明的一个优选实施例中,获取每个告警检测任务的耗时和资源消耗,并基于获取到的耗时和资源消耗将告警检测任务进行分类包括:
52.响应于告警检测任务的耗时超过1分钟和/或资源消耗大于30m物理内存,将告警检测任务分类为重量级检测任务;
53.响应于告警检测任务的耗时未超过1分钟且资源消耗不大于30m物理内存,将告警检测任务分类为轻量级检测任务。可以根据集群的实际情况和监测的实际需求设定其他的分类方式。
54.在本发明的一个优选实施例中,基于告警检测任务的分类为每个告警检测任务分配工作线程数,并实时检测每个告警检测任务的资源消耗包括:
55.将执行告警检测任务的总线程数中的三分之二分配给重量级检测任务;
56.将执行告警检测任务的总线程数中其余的三分之一分配给轻量级检测任务。
57.在本发明的一个优选实施例中,响应于检测到有告警检测任务的资源消耗超过预设阈值,将该告警检测任务执行频率降低包括:
58.响应于检测到有告警检测任务的资源消耗超过cpu单核的50%,将该告警检测任务执行频率降低50%。
59.在本发明的一个优选实施例中,获取每个告警检测任务的耗时和资源消耗包括:
60.在集群启动后,将所有告警检测任务执行预设次数并获取每个告警检测任务的总耗时时间和总资源消耗;
61.将总耗时时间和总资源消耗取平均值以得到每个告警检测任务的耗时和资源消耗。
62.通过本发明的技术方案,能够有效增加告警线程的利用效率,能够自适应任务线程资源占用限制,避免资源占用过高对系统中其他服务造成影响,能够避免引起cpu资源峰值占用。
63.需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,上述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中存储介质可为磁碟、光盘、只读存储器(read

only memory,rom)或随机存取存储器(random access memory,ram)等。上述计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
64.此外,根据本发明实施例公开的方法还可以被实现为由cpu执行的计算机程序,该计算机程序可以存储在计算机可读存储介质中。在该计算机程序被cpu执行时,执行本发明
实施例公开的方法中限定的上述功能。
65.基于上述目的,本发明的实施例的第二个方面,提出了一种集群告警检测任务均衡调度的装置,如图2所示,装置200包括:
66.获取模块201,获取模块201配置为获取每个告警检测任务的耗时和资源消耗,并基于获取到的耗时和资源消耗将告警检测任务进行分类;
67.分配模块202,分配模块202配置为基于告警检测任务的分类为每个告警检测任务分配工作线程数,并实时检测每个告警检测任务的资源消耗;
68.调整模块203,调整模块203配置为响应于检测到有告警检测任务的资源消耗超过预设阈值,将该告警检测任务执行频率降低。
69.在本发明的一个优选实施例中,还包括休眠模块,休眠模块配置为:
70.获取每个告警检测任务的运行周期;
71.将具有相同运行周期的告警检测任务设置为在告警检测任务执行前在预设时间段内随机休眠后再进行执行。
72.在本发明的一个优选实施例中,预设时间段为1秒至30秒。
73.在本发明的一个优选实施例中,获取模块还配置为:
74.响应于告警检测任务的耗时超过1分钟和/或资源消耗大于30m物理内存,将告警检测任务分类为重量级检测任务;
75.响应于告警检测任务的耗时未超过1分钟且资源消耗不大于30m物理内存,将告警检测任务分类为轻量级检测任务。
76.在本发明的一个优选实施例中,分配模块还配置为:
77.将执行告警检测任务的总线程数中的三分之二分配给重量级检测任务;
78.将执行告警检测任务的总线程数中其余的三分之一分配给轻量级检测任务。
79.在本发明的一个优选实施例中,调整模块还配置为:
80.响应于检测到有告警检测任务的资源消耗超过cpu单核的50%,将该告警检测任务执行频率降低50%。
81.在本发明的一个优选实施例中,获取模块还配置为:
82.在集群启动后,将所有告警检测任务执行预设次数并获取每个告警检测任务的总耗时时间和总资源消耗;
83.将总耗时时间和总资源消耗取平均值以得到每个告警检测任务的耗时和资源消耗。
84.基于上述目的,本发明实施例的第三个方面,提出了一种计算机设备。图3示出的是本发明提供的计算机设备的实施例的示意图。如图3所示,本发明实施例包括如下装置:至少一个处理器s21;以及存储器s22,存储器s22存储有可在处理器上运行的计算机指令s23,指令由处理器执行时实现以下方法:
85.获取每个告警检测任务的耗时和资源消耗,并基于获取到的耗时和资源消耗将告警检测任务进行分类。
86.在集群启动后,将所有告警检测任务执行预设次数并获取每个告警检测任务的总耗时时间和总资源消耗,将总耗时时间和总资源消耗取平均值以得到每个告警检测任务的耗时和资源消耗,例如,集群启动后将所有的告警检测任务执行50次,监测每个告警检测任
务在执行这50次的过程中的总耗时和总的资源消耗,然后取平均值就可以获得每个告警检测任务的平均耗时和资源消耗。还可以根据告警检测任务执行的历史记录获取平均的耗时和资源消耗。如果告警检测任务的耗时超过1分钟和/或资源消耗大于30m物理内存,则将告警检测任务分类为重量级检测任务,如果告警检测任务的耗时未超过1分钟且资源消耗不大于30m物理内存,则将告警检测任务分类为轻量级检测任务。
87.基于告警检测任务的分类为每个告警检测任务分配工作线程数,并实时检测每个告警检测任务的资源消耗。
88.将两种类型的告警检测任务划分到两个任务池中,将执行告警检测任务的总线程数中的三分之二分配给重量级检测任务,将执行告警检测任务的总线程数中其余的三分之一分配给轻量级检测任务。
89.响应于检测到有告警检测任务的资源消耗超过预设阈值,将该告警检测任务执行频率降低。
90.在告警服务进程启动后添加资源监控线程(resource_monitor),实时的检测每个任务cpu占用率,当发现任务执行过程中cpu占用率超过节点cpu单核的50%时,则自动降低任务的执行频率为原来的一半,以防止频率过高引起cpu长期占用,对集群其他服务造成影响。
91.在本发明的一个优选实施例中,还包括:
92.获取每个告警检测任务的运行周期;
93.将具有相同运行周期的告警检测任务设置为在告警检测任务执行前在预设时间段内随机休眠后再进行执行。
94.在本发明的一个优选实施例中,预设时间段为1秒至30秒。
95.在本发明的一个优选实施例中,获取每个告警检测任务的耗时和资源消耗,并基于获取到的耗时和资源消耗将告警检测任务进行分类包括:
96.响应于告警检测任务的耗时超过1分钟和/或资源消耗大于30m物理内存,将告警检测任务分类为重量级检测任务;
97.响应于告警检测任务的耗时未超过1分钟且资源消耗不大于30m物理内存,将告警检测任务分类为轻量级检测任务。
98.在本发明的一个优选实施例中,基于告警检测任务的分类为每个告警检测任务分配工作线程数,并实时检测每个告警检测任务的资源消耗包括:
99.将执行告警检测任务的总线程数中的三分之二分配给重量级检测任务;
100.将执行告警检测任务的总线程数中其余的三分之一分配给轻量级检测任务。
101.在本发明的一个优选实施例中,响应于检测到有告警检测任务的资源消耗超过预设阈值,将该告警检测任务执行频率降低包括:
102.响应于检测到有告警检测任务的资源消耗超过cpu单核的50%,将该告警检测任务执行频率降低50%。
103.在本发明的一个优选实施例中,获取每个告警检测任务的耗时和资源消耗包括:
104.在集群启动后,将所有告警检测任务执行预设次数并获取每个告警检测任务的总耗时时间和总资源消耗;
105.将总耗时时间和总资源消耗取平均值以得到每个告警检测任务的耗时和资源消
耗。
106.基于上述目的,本发明实施例的第四个方面,提出了一种计算机可读存储介质。图4示出的是本发明提供的计算机可读存储介质的实施例的示意图。如图4所示,计算机可读存储介质s31存储有被处理器执行时执行如下方法的计算机程序s32:
107.获取每个告警检测任务的耗时和资源消耗,并基于获取到的耗时和资源消耗将告警检测任务进行分类;
108.基于告警检测任务的分类为每个告警检测任务分配工作线程数,并实时检测每个告警检测任务的资源消耗;
109.响应于检测到有告警检测任务的资源消耗超过预设阈值,将该告警检测任务执行频率降低。
110.在本发明的一个优选实施例中,还包括:
111.获取每个告警检测任务的运行周期;
112.将具有相同运行周期的告警检测任务设置为在告警检测任务执行前在预设时间段内随机休眠后再进行执行。
113.在本发明的一个优选实施例中,预设时间段为1秒至30秒。
114.在本发明的一个优选实施例中,获取每个告警检测任务的耗时和资源消耗,并基于获取到的耗时和资源消耗将告警检测任务进行分类包括:
115.响应于告警检测任务的耗时超过1分钟和/或资源消耗大于30m物理内存,将告警检测任务分类为重量级检测任务;
116.响应于告警检测任务的耗时未超过1分钟且资源消耗不大于30m物理内存,将告警检测任务分类为轻量级检测任务。
117.在本发明的一个优选实施例中,基于告警检测任务的分类为每个告警检测任务分配工作线程数,并实时检测每个告警检测任务的资源消耗包括:
118.将执行告警检测任务的总线程数中的三分之二分配给重量级检测任务;
119.将执行告警检测任务的总线程数中其余的三分之一分配给轻量级检测任务。
120.在本发明的一个优选实施例中,响应于检测到有告警检测任务的资源消耗超过预设阈值,将该告警检测任务执行频率降低包括:
121.响应于检测到有告警检测任务的资源消耗超过cpu单核的50%,将该告警检测任务执行频率降低50%。
122.在本发明的一个优选实施例中,获取每个告警检测任务的耗时和资源消耗包括:
123.在集群启动后,将所有告警检测任务执行预设次数并获取每个告警检测任务的总耗时时间和总资源消耗;
124.将总耗时时间和总资源消耗取平均值以得到每个告警检测任务的耗时和资源消耗。
125.此外,根据本发明实施例公开的方法还可以被实现为由处理器执行的计算机程序,该计算机程序可以存储在计算机可读存储介质中。在该计算机程序被处理器执行时,执行本发明实施例公开的方法中限定的上述功能。
126.此外,上述方法步骤以及系统单元也可以利用控制器以及用于存储使得控制器实现上述步骤或单元功能的计算机程序的计算机可读存储介质实现。
127.本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现的功能,但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。
128.在一个或多个示例性设计中,功能可以在硬件、软件、固件或其任意组合中实现。如果在软件中实现,则可以将功能作为一个或多个指令或代码存储在计算机可读介质上或通过计算机可读介质来传送。计算机可读介质包括计算机存储介质和通信介质,该通信介质包括有助于将计算机程序从一个位置传送到另一个位置的任何介质。存储介质可以是能够被通用或专用计算机访问的任何可用介质。作为例子而非限制性的,该计算机可读介质可以包括ram、rom、eeprom、cd

rom或其它光盘存储设备、磁盘存储设备或其它磁性存储设备,或者是可以用于携带或存储形式为指令或数据结构的所需程序代码并且能够被通用或专用计算机或者通用或专用处理器访问的任何其它介质。此外,任何连接都可以适当地称为计算机可读介质。例如,如果使用同轴线缆、光纤线缆、双绞线、数字用户线路(dsl)或诸如红外线、无线电和微波的无线技术来从网站、服务器或其它远程源发送软件,则上述同轴线缆、光纤线缆、双绞线、dsl或诸如红外线、无线电和微波的无线技术均包括在介质的定义。如这里所使用的,磁盘和光盘包括压缩盘(cd)、激光盘、光盘、数字多功能盘(dvd)、软盘、蓝光盘,其中磁盘通常磁性地再现数据,而光盘利用激光光学地再现数据。上述内容的组合也应当包括在计算机可读介质的范围内。
129.以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
130.应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
131.上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。
132.本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
133.所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献