一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

资源容量系统及其控制方法和计算机可读存储介质与流程

2022-05-21 11:36:27 来源:中国专利 TAG:


1.本发明涉及计算机系统及其控制方法和介质,具体的说,是涉及一种资源容量系统及其控制方法以及相应的计算机可读存储介质。


背景技术:

2.参见图1,在互联网科技高速发展的当下,金融行业以其海量的业务与数据处理为特点,其在对计算机相关的资源需求十分巨大。普遍情况下一个金融集团会自有一个及一个以上的数据中心,并通过划分领域的方式对所有支撑数据及业务的物理设备资源进行分管。不同的领域主要体现在对指标的不同定义及指标的采集方式,资源领域主要表现为底层的物理计算资源的指标。其中具有代表性的指标有cpu使用率、io使用率、内存使用率。
3.对各个领域的管理也主要体现在对指标的监控和分析,监控涉及采集与统计,而分析涉及归纳与预测。在现阶段的管理方法中,较为普遍采用以监控为主的被动形式,即通过传感器不停地采集资源领域相关指标以监测是否存在异常。当异常产生时,绝大多数情况为资源容量告警问题,则管理系统基于统计基础得出当前存在相应问题的结论。接下来将统计后的数据特征交由人工分析,经理人基于自身经验对当前的指标异常情况给出分析结果并提出问题解决方案,再经由管理系统将问题上报并指示对应解决操作。
4.现有技术存在如下不足:
5.首先为被动地应对措施,在问题出现后才能够对问题进行应对,尤其是金融行业在处理海量业务数据时对计算资源的高度依赖,使得资源的容量相关问题变得十分棘手;
6.其次,整个应对流程中必不可缺地需要经理人的大量经验和成熟判断作为依据,使得资源领域的管理流程的不确定因素上升,系统流程的稳定性急剧下降;最后,由于资源领域涉及的主要方面为计算资源,而该类型资源的高昂价格使得其成为金融互联网内管理的重点,因而面对经常出现的容量告警问题不可能一味地增加容量,需要寻找合适的扩容范围,即精准地调整资源容量。


技术实现要素:

7.针对上述现有技术中的不足,本发明提供一种资源容量系统及其控制方法和计算机可读存储介质,用以解决上述至少一个技术问题。
8.本发明所采取的技术方案是:
9.一种资源容量控制方法,包括如下步骤:
10.步骤s101,开始;
11.步骤s102,资源领域管理系统从资源处抽取包括服务器编码、系统编码等容量信息和资源相关的指标信息,例如cpu使用率等;
12.步骤s103,资源领域管理系统整合所有数据成为以指标为单位的时序数据序列t=(t1,t2,

,tt),其中每个时点数据为整合后某系统下某服务器某指标的天维度统计值;
13.步骤s104,数据预处理装置接收指标为单位的时序数据及相关信息参数;
14.步骤s105,所有时序数据进行序列的异常值剔除和空值补足、计算时序数据的各项时间特征w’=(w1,w2,w3,w4),和历史特征log2tx(x=t,t-1,

,t-19);
15.步骤s106,从其他领域管理系统抽取与目标指标计算得到强相关的时序数据,以同时刻数值为特征序列组合(rt)n,构建出相关特征;
16.步骤s107,组成包括相关特征、时序特征、历史特征的结构化参数w,分割结构化数据为训练用数据集dt和预测用数据集df,比例为7:3;
17.步骤s108,训练集dt同建模请求发送至模型优化器,每个超参数的取值范围存在边界,即所有超参数可构成高次网格m,以网格中一点m(x0)初始化模型超参数;
18.步骤s109,建模装置接收超参数及数据集,构建随机森林模型并训练,训练结果由数据集中部分验证用数据得到模型训练效果,即将m(x0)作为已知带入模型f,计算使得模型最优时的参数w;
19.步骤s110,判断是否搜索完网格内所有超参数组合;是搜索完网格内所有超参数组合跳转步骤s112,否则,跳转步骤s111;
20.步骤s111,选取高次网格中下一个点位m(x1)组成的超参数;跳转步骤s109;
21.步骤s112,建模装置确定本次训练下该指标随机森林模型的超参数m(x)和模型参数w;
22.步骤s113,指标预测中心接收由建模装置筛选后的最优模型参数及预测用结构化数据集,对指定指标进行未来时间段内的值预测,得到预测序列f=(ft 1,

,ft k),预测长度按需确定;
23.步骤s114,以指标为单位,将每个特定指标的资源指标预测结果传递至指标风险检测器,同时从资源领域管理系统接收该指标的滞留系数r和阈值k,判断r系数下是否超阈值;
24.步骤s115,基于预测得到未来有超阈值风险的指标,连同其所有参数传入容量计算器,计算该风险指标对应的资源预警容量;
25.步骤s116,资源领域管理系统接收资源容量的预警状态及预警值评估,对管理下定位到的资源做权限申请;
26.步骤s117,资源领域管理系统得到授权后对指定资源做软件或硬件层面的资源容量预警式调整;
27.步骤s118,受到管控下资源继续以高效、节能方式为各个系统提供支持,所有相关指标受到采集,状态受到监控,跳转步骤s101。
28.优选的,其中步骤s109可以进一步包括:
29.步骤s201,训练开始;
30.步骤s202,输入训练集合x,y,构建决策树节点;
31.步骤s203,是否为叶子节点;是叶子节点跳转步骤s210,否则跳转步骤s204;
32.步骤s204,计算得到训练集合x的feature个数c和训练集合大小n;
33.步骤s205,判断c是否大于0,c》0跳转步骤s206,否则跳转步骤s209;
34.步骤s206,遍历第c个特征在训练集合中的所有取值,以每个值为切分点,计算切分后的不纯度;
35.步骤s207,每取一个切分点,把该切分的不纯度与当前节点最小的不纯度比较,如
果比后者小,则存储该切分点和切分特征;
36.步骤s208,c=c-1;
37.步骤s209,根据当前最优划分,将训练集合划分为两个集合,据此构造左右两个子节点,两个子节点的递归执行整个过程。直到到达叶子节点,并返回;
38.步骤s210,求当前节点所有y的平均值,并作为该叶子节点的预测值;
39.步骤s211,返回。
40.一种资源容量控制方法的系统,包括:资源容量,资源领域管理系统,容量计算器,指标风险检测器,其他领域管理系统,数据预处理装置,模型优化器,指标预测中心和建模装置,在其上使得下列步骤得以运行:
41.步骤s101,开始;
42.步骤s102,资源领域管理系统从资源处抽取包括服务器编码、系统编码等容量信息和资源相关的指标信息;
43.步骤s103,资源领域管理系统整合所有数据成为以指标为单位的时序数据序列t=(t1,t2,

,tt),其中每个时点数据为整合后某系统下某服务器某指标的天维度统计值;
44.步骤s104,数据预处理装置接收指标为单位的时序数据及相关信息参数;
45.步骤s105,所有时序数据进行序列的异常值剔除和空值补足、计算时序数据的各项时间特征w’=(w1,w2,w3,w4),和历史特征log2tx(x=t,t-1,

,t-19);
46.步骤s106,从其他领域管理系统抽取与目标指标计算得到强相关的时序数据,以同时刻数值为特征序列组合(rt)n,构建出相关特征;
47.步骤s107,组成包括相关特征、时序特征、历史特征的结构化参数w,分割结构化数据为训练用数据集dt和预测用数据集df,比例为7:3;
48.步骤s108,训练集dt同建模请求发送至模型优化器,每个超参数的取值范围存在边界,即所有超参数可构成高次网格m,以网格中一点m(x0)初始化模型超参数;
49.步骤s109,建模装置接收超参数及数据集,构建随机森林模型并训练,训练结果由数据集中部分验证用数据得到模型训练效果,即将m(x0)作为已知带入模型f,计算使得模型最优时的参数w;
50.步骤s110,判断是否搜索完网格内所有超参数组合;是搜索完网格内所有超参数组合跳转步骤s112,否则,跳转步骤s111;
51.步骤s111,选取高次网格中下一个点位m(x1)组成的超参数;跳转步骤s109;
52.步骤s112,建模装置确定本次训练下该指标随机森林模型的超参数m(x)和模型参数w;
53.步骤s113,指标预测中心接收由建模装置筛选后的最优模型参数及预测用结构化数据集,对指定指标进行未来时间段内的值预测,得到预测序列f=(ft 1,

,ft k),预测长度按需确定;
54.步骤s114,以指标为单位,将每个特定指标的资源指标预测结果传递至指标风险检测器,同时从资源领域管理系统接收该指标的滞留系数r和阈值k,判断r系数下是否超阈值;
55.步骤s115,基于预测得到未来有超阈值风险的指标,连同其所有参数传入容量计算器,计算该风险指标对应的资源预警容量;
56.步骤s116,资源领域管理系统接收资源容量的预警状态及预警值评估,对管理下定位到的资源做权限申请;
57.步骤s117,资源领域管理系统得到授权后对指定资源做软件或硬件层面的资源容量预警式调整;
58.步骤s118,受到管控下资源继续以高效、节能方式为各个系统提供支持,所有相关指标受到采集,状态受到监控,跳转步骤s101。
59.优选的,步骤s109可以进一步包括:
60.步骤s201,训练开始;
61.步骤s202,输入训练集合x,y,构建决策树节点;
62.步骤s203,是否为叶子节点;是叶子节点跳转步骤s210,否则跳转步骤s204;
63.步骤s204,计算得到训练集合x的feature个数c和训练集合大小n;
64.步骤s205,判断c是否大于0,c》0跳转步骤s206,否则跳转步骤s209;
65.步骤s206,遍历第c个特征在训练集合中的所有取值,以每个值为切分点,计算切分后的不纯度;
66.步骤s207,每取一个切分点,把该切分的不纯度与当前节点最小的不纯度比较,如果比后者小,则存储该切分点和切分特征;
67.步骤s208,c=c-1;
68.步骤s209,根据当前最优划分,将训练集合划分为两个集合,据此构造左右两个子节点,两个子节点的递归执行整个过程。直到到达叶子节点,并返回;
69.步骤s210,求当前节点所有y的平均值,并作为该叶子节点的预测值;
70.步骤s211,返回。
71.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述的资源容量控制方法。
72.本发明相对现有技术的有益效果:
73.本发明资源容量系统和控制方法以及计算机可读存储介质,依靠设备的自动运行,极大提高了流程的稳定性;采用更实用于大数据量多特征预测的随机森林模型,以保证指标预测结果的准确性与可用性;基于指标特性的不同风险检测方法使得系统对风险指标的处理方案更为全面有效。本发明提出了一套完整的系统和配套的流程以实现在有限的指标信息下,通过随机森林预测的方式,精准地找到未来时间段内该指标的变化特征,基于未来时间段内该指标的变化特征和预先设定的阈值,结合指标特有的评价标准,能在容量问题产生之前就预见性地检测出资源领域指标的风险情况并基于不同的指标特点对资源容量进行动态控制和调整。
附图说明
74.图1是现有人工控制容量的系统示意图;
75.图2是本发明资源容量控制方法的流程图;
76.图3是本发明资源容量控制系统的结构示意图;
77.图4是本发明图2所示方法流程图中步骤s109的模型原理图;
78.图5是本发明图2所示方法流程图中步骤s109的训练所包含的进一步方法步骤的
流程图。
具体实施方式
79.以下参照附图及实施例对本发明进行详细的说明:
80.参见图2和图3,本发明的技术术语和原理如下:
81.资源:即计算机资源,主要涉及计算资源与存储资源两个方面;资源领域即为金融网络整体部署下为实现所有业务正常进行所必须的计算资源与存储资源支撑;
82.资源领域指标:又称为资源指标,即描述计算机资源的指示标准。在本发明场景下简称为指标,通过特定的方法在每个瞬时均可得到的关于资源的状态指示;对于资源指标,较为常见的有cpu使用率、i/o使用率、内存使用率等,而这些瞬时采集的指标均为原始指标,无法在分析中直接利用,通过管理系统的管理,将原始指标进行了加工处理,得到加工后的指标时序数据。t=(t1,t2,

,tt);
83.时序数据:指时间序列数据,时间序列数据是同一指标按时间顺序记录的数据列。在同一数据列中的各个数据必须是同口径的,要求具有可比性;
84.时序数据可以是时期数,也可以是时点数。时间序列分析的目的是通过找出样本内时间序列的统计特性和发展规律性,构建时间序列模型,进行样本外预测;
85.通过对指标的加工即可得到每日维度下指标的时序数据,其以天作为时期数,代表指标名称有cpu每日使用率峰值、io每日使用率均值;
86.数据集设定:将要预测的目标指标的时序数据进行空缺值做好补足后,即通过三种方式进行组合构成完整的数据集。
87.方式一,以目标指标为一方,计算同一系统内应用领域指标之间的相关性,在得到相关程度高(相关系数大于0.4)的指标后,将所有高相关性的指标的同时间点时序数据值作为关联特征;
88.方式二,对目标指标的目标日期前20日的时序数据作为历史特征;
89.方式三,将目标指标的所有数据进行统计,得到周特征、月特征、年特征等时间相关的平均特征;
90.得到的特征进行组合即为输入特征,而输出特征为目标日期的指标数值,也即为预测特征。至此反复构造即可得到针对目标指标的完整数据集;
91.数据集设定完成后,基于模型训练和模型预测的需要,将数据集进行横向拆分,即拆分为拥有同样特性的训练用数据集和预测用数据集,预测用数据集又称为测试集;
92.训练用数据集在训练过程中,由于需要进行模型超参数的优化,所以将训练用测试集再次横向拆分为训练集和验证集,训练集负责与指定超参数进行模型训练,而验证集负责对训练得到的模型进行评价;
93.对于模型的验证采用五折交叉验证,即对于每组超参数,首先将训练用数据集横向五等分,然后依次将其中一份作为验证集,剩下四份作为训练集;
94.进行五次训练和评估后,得到的评估结果平均即为该超参数下模型的最终评估结果;
95.超参数:模型训练开始前设置的参数,而不是通过训练得到的参数数据;通常情况下,需要对超参数进行优化,给学习机选择一组最优超参数,以提高学习的性能和效果。
96.针对随机森林的超参数有决策树的个数、最佳分裂点特征使用最大个数、树的最大声读、叶子节点上应有的最少样例数;
97.预测结果:针对所有进行过训练和预测的指标所得到的预测数据;预测结果以某一系统下的一个指标为单位,预测了该指标在指定日期开始至之后的30日内其每日的时序数据值;
98.风险指标:在指标风险检测器中,对所有进行过预测的指标,协同其设定的阈值判断下筛选得到的指标;
99.风险指标表明了在当前随机森林算法下可预估的未来可能发生超越阈值这种风险的情况;
100.检测的方法基于直接判断,也可以根据资源容量稳定性设置为滞留积判断。滞留积顾名思义即通过预测值与阈值的差分和是否超越一定范围来判断是否为风险指标。
101.资源容量:对所有管控下的计算机资源的抽象表达,其中主要有cpu、i/o、内存、磁盘等存储和计算资源;本发明中主要针对前三者资源的监控、检测和调整;
102.资源领域管理系统:行业中对所有系统的资源容量进行管理的系统;负责全方位监控采集资源信息,管理加工各个系统的资源领域指标、分析预警资源容量问题、报告调控系统间资源;
103.数据预处理装置:数据预处理装置负责接收以指标为单位的时序数据,其内部以资源领域需构建模型的指标为基准,使用三种方式构造输入集的三部分特征,再并入该模型目标指标的时序数据作为输出集,实现一个目标指标一个模型数据集的形式;输出时基于建模请求将数据集进行拆分,完成数据的预处理过程;
104.目标指标为t,业务日期为t,则目标指标值为t
t
,t 1日开始为预测目标;通过前后均值的方式将目标指标的时序数据缺失部分补齐;
105.通过对其他领域的指标和资源领域的目标指标做相关性分析,分析结果为目标指标和其他指标之间的相关性为0至1的相关系数,当数值为1时代表完全相关,为0时代表完全不相关,则取所有相关系数超过0.4的其他指标在业务日期作为目标指标预测模型指标特征的一部分,即特征序列组合(r
t
)n,称为相关特征;
106.其次将目标指标的历史数据从t日开始往后倒推取20日的数据值做对数转换后得到指标特征序列组合log2t
x
(x=t,t-1,

,t-19),称为历史特征;
107.再次将业务日期所属周工作日休息日维度、所属周维度、所属月维度、所属年维度的所有参与训练的历史目标指标值平均作为特征w’=(w1,w2,w3,w4),称为平均特征;
108.最后将三个部分的特征组合成完整的模型训练指标输入特征,结合目标指标的时序数据作为输出特征;
109.完成特征组合后,开始对模型进行训练,即通过随机森林模型及相关辅助算法实现对公式的优化;
110.下面详细描述回归随机森林在所选输入特征和单一输出特征值下训练过程:
111.模型优化器:基于输入的训练用数据集,进行模型超参数的初始化、数据集的分割,传递参数至建模装置并接受模型训练结果;
112.循环操作至所有超参数取值组合得到训练,选取模型验证效果最佳的模型,将其输出至指标预测中心;
113.对于随机森林模型,通过对超参数的设定可以为随机森林的训练定下训练的框架,即为模型的参数确定训练方向;
114.超参数无法从训练中获得确定的值,于是在模型优化器中进行预设;预设的方式基于网格搜索,即构造超参数取值范围点形成的超网格,在每个超参数组合得到遍历后即可通过比较不同超参数组合下验证效果来选取最优模型。
115.建模装置:每次接收训练集、验证集、模型超参数,然后开始随机森林的训练,训练完成后将模型参数、验证结果传递至模型优化器;
116.参见图4,随机森林属于bagging类算法,而bagging又属于集成学习一种方法,集成学习的大致思路是训练多个弱模型打包起来组成强模型的过程。具体方式如图4,对于原有的训练集数据,首先进行划分,划分的方法在bagging类中属于bootstrap采样,即从输入训练数据集中通过有放回的方式重复随机抽取n组数据组成m个不同的子训练数据集;
117.对于一个样本在总量为k时,每次被采集到的概率为1/k,则n次采样中从未被采集到的概率为(1-1/m)m,n取极限时得到1/e的未被采样概率,这些未被采样数据可以作为测试集用于测试模型泛化能力;
118.对构成的m个子训练数据集分别做决策树的构建,从而形成随机森林;
119.在预测阶段,随机森林将通过每个决策树的预测结果取平均得到最终的预测结果;对于决策树来说,基于对树的划分原理存在几种不同算法原型;由于这里需要预测时序数据,即预测回归问题,则选用能够解决回归问题的回归决策树;
120.再次参见图2和图3,指标预测中心:基于输入的预测用数据集和模型参数进行预测;
121.尽可能多的预测得到资源领域中指标的未来数值并保存。在需要时将预测结果输出至指标风险检测器;
122.在对某一指标进行未来数值的预测时,需要准备目标指标为该指标的随机森林模型,其次对该指标的历史数据做前后平均的补足,最后基于本发明中同样的数据集构造方法,从业务日期t开始,对之后的未来日期数值做构造后进行预测;
123.由于预测目标存在两种不同的情况,即对于业务日期t时刻,需要预测t 1日的目标指标数据或需要预测t 1至t 30日的目标指标数据;
124.对于情况一,只需要在完成特征组合后以t 1日为目标进行预测;
125.对于情况二,需要实现以单日预测为基本的滚动预测方法,该方法即在情况一的前提下,将预测得到的t 1日目标指标值作为新的历史特征,构成新的历史特征序列组合log2tx(x=t 1,t,

,t-18),以真实值为优先、预测值为替代的相关特征序列组合(rt 1||g(rt 1))n,配合使用所属不同维度的平均特征w’组成新的预测公式由此继续预测,循环操作至目标预测日期。完成后将预测结果保存;
126.指标风险检测器:在产生需求时,指标预测中心将需求相关的资源指标预测结果传递至指标风险检测器,该装置将依据目标指标的阈值、预测结果、设定评价方法来检测目标指标是否在未来存在超阈值的风险,即目标指标所属系统资源是否存在容量问题;检测方法可通过直接测定,即当该指标预测结果序列(f)m=(f1,f2,

,fm)中存在至少一个值
大于阈值k时,就判断该指标为风险指标;同时检测方法也可以通过滞留积进行测定,即找到该指标预测结果序列(f)m中所有超过阈值k的数值点序列(l)j=(l1,l2,

,lj)(0《=j《=m),然后将超阈值点序列差阈值后求和∑((l)
j-k),判断是否超越预测数据总平均的系数r倍率超过时则判断为风险指标;系数r的确定取决于系统特点与资源特性,同阈值一样可调配且存储于管理系统中;
127.容量计算器:依据传递得到的风险指标及其相关参数,计算该指标在未来需要调整的幅度,将调整值传递给资源领域管理系统,再经由资源领域管理系统得到授权后由机械或软件方式对容量资源进行调控。
128.参见图2,一种本发明的概括性实施例的资源容量控制方法,包括如下步骤:
129.步骤s101,开始;
130.步骤s102,资源领域管理系统从资源处抽取包括服务器编码、系统编码等容量信息和资源相关的指标信息,例如cpu使用率等;
131.步骤s103,资源领域管理系统整合所有数据成为以指标为单位的时序数据序列t=(t1,t2,

,tt),其中每个时点数据为整合后某系统下某服务器某指标的天维度统计值;
132.步骤s104,数据预处理装置接收指标为单位的时序数据及相关信息参数;
133.步骤s105,所有时序数据进行序列的异常值剔除和空值补足、计算时序数据的各项时间特征w’=(w1,w2,w3,w4),和历史特征log2tx(x=t,t-1,

,t-19);
134.步骤s106,从其他领域管理系统抽取与目标指标计算得到强相关的时序数据,以同时刻数值为特征序列组合(rt)n,构建出相关特征;
135.步骤s107,组成包括相关特征、时序特征、历史特征的结构化参数w,分割结构化数据为训练用数据集dt和预测用数据集df,比例为7:3;
136.步骤s108,训练集dt同建模请求发送至模型优化器,每个超参数的取值范围存在边界,即所有超参数可构成高次网格m,以网格中一点m(x0)初始化模型超参数;
137.步骤s109,建模装置接收超参数及数据集,构建随机森林模型并训练,训练结果由数据集中部分验证用数据得到模型训练效果,即将m(x0)作为已知带入模型f,计算使得模型最优时的参数w;
138.步骤s110,判断是否搜索完网格内所有超参数组合;是搜索完网格内所有超参数组合跳转步骤s112,否则,跳转步骤s111;
139.步骤s111,选取高次网格中下一个点位m(x1)组成的超参数;跳转步骤s109;
140.步骤s112,建模装置确定本次训练下该指标随机森林模型的超参数m(x)和模型参数w;
141.步骤s113,指标预测中心接收由建模装置筛选后的最优模型参数及预测用结构化数据集,对指定指标进行未来时间段内的值预测,得到预测序列f=(ft 1,

,ft k),预测长度按需确定;
142.步骤s114,以指标为单位,将每个特定指标的资源指标预测结果传递至指标风险检测器,同时从资源领域管理系统接收该指标的滞留系数r和阈值k,判断r系数下是否超阈值;
143.步骤s115,基于预测得到未来有超阈值风险的指标,连同其所有参数传入容量计
算器,计算该风险指标对应的资源预警容量;
144.步骤s116,资源领域管理系统接收资源容量的预警状态及预警值评估,对管理下定位到的资源做权限申请;
145.步骤s117,资源领域管理系统得到授权后对指定资源做软件或硬件层面的资源容量预警式调整;
146.步骤s118,受到管控下资源继续以高效、节能方式为各个系统提供支持,所有相关指标受到采集,状态受到监控,跳转步骤s101。
147.参见图5,本发明前述方法步骤s109进一步可包括:
148.步骤s201,训练开始;
149.步骤s202,输入训练集合x,y,构建决策树节点;
150.步骤s203,是否为叶子节点;是叶子节点跳转步骤s210,否则跳转步骤s204;
151.步骤s204,计算得到训练集合x的feature个数c和训练集合大小n;
152.步骤s205,判断c是否大于0,c》0跳转步骤s206,否则跳转步骤s209;
153.步骤s206,遍历第c个特征在训练集合中的所有取值,以每个值为切分点,计算切分后的不纯度;
154.步骤s207,每取一个切分点,把该切分的不纯度与当前节点最小的不纯度比较,如果比后者小,则存储该切分点和切分特征;
155.步骤s208,c=c-1;
156.步骤s209,根据当前最优划分,将训练集合划分为两个集合,据此构造左右两个子节点,两个子节点的递归执行整个过程。直到到达叶子节点,并返回;
157.步骤s210,求当前节点所有y的平均值,并作为该叶子节点的预测值;
158.步骤s211,返回。
159.参见图3,本发明的一种资源容量控制系统,包括:资源容量,资源领域管理系统,容量计算器,指标风险检测器,其他领域管理系统,数据预处理装置,模型优化器,指标预测中心和建模装置,在其上使得下列步骤得以运行:
160.步骤s101,开始;
161.步骤s102,资源领域管理系统从资源处抽取包括服务器编码、系统编码等容量信息和资源相关的指标信息;
162.步骤s103,资源领域管理系统整合所有数据成为以指标为单位的时序数据序列t=(t1,t2,

,tt),其中每个时点数据为整合后某系统下某服务器某指标的天维度统计值;
163.步骤s104,数据预处理装置接收指标为单位的时序数据及相关信息参数;
164.步骤s105,所有时序数据进行序列的异常值剔除和空值补足、计算时序数据的各项时间特征w’=(w1,w2,w3,w4),和历史特征log2tx(x=t,t-1,

,t-19);
165.步骤s106,从其他领域管理系统抽取与目标指标计算得到强相关的时序数据,以同时刻数值为特征序列组合(rt)n,构建出相关特征;
166.步骤s107,组成包括相关特征、时序特征、历史特征的结构化参数w,分割结构化数据为训练用数据集dt和预测用数据集df,比例为7:3;
167.步骤s108,训练集dt同建模请求发送至模型优化器,每个超参数的取值范围存在边界,即所有超参数可构成高次网格m,以网格中一点m(x0)初始化模型超参数;
168.步骤s109,建模装置接收超参数及数据集,构建随机森林模型并训练,训练结果由数据集中部分验证用数据得到模型训练效果,即将m(x0)作为已知带入模型f,计算使得模型最优时的参数w;
169.步骤s110,判断是否搜索完网格内所有超参数组合;是搜索完网格内所有超参数组合跳转步骤s112,否则,跳转步骤s111;
170.步骤s111,选取高次网格中下一个点位m(x1)组成的超参数;跳转步骤s109;
171.步骤s112,建模装置确定本次训练下该指标随机森林模型的超参数m(x)和模型参数w;
172.步骤s113,指标预测中心接收由建模装置筛选后的最优模型参数及预测用结构化数据集,对指定指标进行未来时间段内的值预测,得到预测序列f=(ft 1,

,ft k),预测长度按需确定;
173.步骤s114,以指标为单位,将每个特定指标的资源指标预测结果传递至指标风险检测器,同时从资源领域管理系统接收该指标的滞留系数r和阈值k,判断r系数下是否超阈值;
174.步骤s115,基于预测得到未来有超阈值风险的指标,连同其所有参数传入容量计算器,计算该风险指标对应的资源预警容量;
175.步骤s116,资源领域管理系统接收资源容量的预警状态及预警值评估,对管理下定位到的资源做权限申请;
176.步骤s117,资源领域管理系统得到授权后对指定资源做软件或硬件层面的资源容量预警式调整;
177.步骤s118,受到管控下资源继续以高效、节能方式为各个系统提供支持,所有相关指标受到采集,状态受到监控,跳转步骤s101。
178.本发明的资源容量控制系统的另一个实施例,其中步骤s109可以进一步包括:
179.步骤s201,训练开始;
180.步骤s202,输入训练集合x,y,构建决策树节点;
181.步骤s203,是否为叶子节点;是叶子节点跳转步骤s210,否则跳转步骤s204;
182.步骤s204,计算得到训练集合x的feature个数c和训练集合大小n;
183.步骤s205,判断c是否大于0,c》0跳转步骤s206,否则跳转步骤s209;
184.步骤s206,遍历第c个特征在训练集合中的所有取值,以每个值为切分点,计算切分后的不纯度;
185.步骤s207,每取一个切分点,把该切分的不纯度与当前节点最小的不纯度比较,如果比后者小,则存储该切分点和切分特征;
186.步骤s208,c=c-1;
187.步骤s209,根据当前最优划分,将训练集合划分为两个集合,据此构造左右两个子节点,两个子节点的递归执行整个过程。直到到达叶子节点,并返回;
188.步骤s210,求当前节点所有y的平均值,并作为该叶子节点的预测值;
189.步骤s211,返回。
190.根据本发明资源容量控制方法的概括性实施例的一个具体实施方式。
191.首先由资源领域管理系统管理所有资源领域指标的时序数据,为所有指标设定阈
值及检测参数,没有设置检测参数的指标则使用直接检测。
192.现关注在手机银行系统中的某一服务器的cpu使用率日峰值,系统编码为cemb,服务器编码为bl02831,指标编码为cemb_day_cpu_fz,由此即可定位该指标,将该指标定为目标指标,资源领域管理系统通过采集和加工可以将目标指标的时序数据得到,为2020-01-01至2020-06-30的数据值,该时序数据可以写为序列(t1,t2,

,tm)=(50,39,

,28)。该时序数据传入数据预处理装置,首先进行关联指标的相关性计算,在该系统下有很多其他领域的指标,包括应用、网络、容器云等等,这些领域内的指标也有对应的时序数据,例如其中一个指标的时序数据序列为(r1,r2,

,rm)=(3920,24466,

,23218),则进行相关性计算可以得到相关系数。判断所有关联指标与目标指标之间的相关系数,取用所有系数大于0.4的指标。此实例中假设仅有一个关联指标符合要求,则为目标指标的时序数据增加一个关联特征,此时数据集为((r
t
),t
t
),1≤t≤m;第二部分历史特征则采用每个时刻目标指标的前20日的数据,即可得到数据集为((r
t
,t
t-1
,t
t-2
,...,t
t-20
),t
t
)1≤t≤m;第三部分的平均特征基于所有目标指标的时序数据,假设当前仅计算所属周工作日休息日维度、所属周维度,则可以得到两个特征,并合并至数据集得到((r
t
,t
t-1
t
t-2
...t
t-20
,w1,w2),t
t
),1≤t≤m。由此得到的数据集按照3∶7的比例分为预测用数据集和训练用数据集。
193.假设训练用数据集分到了2020-01-01至2020-06-01日期的目标指标时序数据组成的数据集。则在模型优化器中将数据集再次划分为五份,每份为一个月的数据集,开始通过网格方式选取模型超参数。本实例中假设超参数仅有最大树深度和树数量两项,且取值分别可选的有[10,20]和[50,100],则可以有四种组合,每种组合均会进入建模装置开始基于该超参数组合的模型训练。基于数据集的五等分,每次取其中的四份作为训练集训练,剩下的一份作为验证集验证本次模型的效果。则对于一个超参数组合可以训练出1个带有5次训练验证效果的随机森林模型,此处验证效果采用平均绝对百分比误差mape来评判,得到五个mape后进行平均后的mavg即为该模型的评估效果。遍历所有超参数组合后可以得到四个模型的评估效果,取mavg为最小的模型作为目标指标的最终模型,并将模型参数传递给指标预测中心。
[0194]
进入指标预测中心后,基于模型参数重建目标指标的模型。基于2020-06-02至2020-06-30日期的预测用数据集开始进行预测,本实例中进行预测2020-07-01至2020-07-10共10日的目标指标数据,则依次进行预测,首先预测2020-07-01日,通过构造当日t=2020-07-01的特征为(r
t
,t
t-1
,t
t-2
,...,t
t-20
,w1,w2=(24932,32,43,...,28,43,64),再配合模型f,即可进行运算得到目标日期t的数据预测值为f
t
=f(24932,32,43,...,28,43,64)=48。其后基于该日的预测数值,将特征内需要调整的数据进行替换为(r
t 1
,t
t
=f
t
t
t-1
,...,t
t-19
,w1′
,w2′
),同样适用模型f,即可得到下一日的预测值f
t 1
。循环至目标日期,即可获得最终的10日预测数值序列为(48,59,

,24)。
[0195]
完成指标预测后,在指标风险检测器中,由于目标指标为cemb系统下某一服务器的cpu日峰值使用率,考虑多方因素为其设定风险评估方式采用系数为r=0.3的滞留计算方法。基于预测的10日数据,配合目标指标所设定的阈值k=70,得到10日中有2日超过阈值70。于是计算总超阈值两位72-70 82-70=14,预测数据总平均的系数r倍率则为53*0.3=15.9,由此判断并未超过风险值,则不评判为风险指标。假设此处预测数据总平均为40时,
则最终超过风险值,于是评判为风险指标。风险指标需要进入容量计算器基于超越值做容量提升的计算,此处不再赘述。
[0196]
最终所有风险指标的状态和资源容量的调整方案将展示于资源领域管理系统,并在授权后由管理系统进行统一的资源容量调配。
[0197]
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明的的资源容量控制方法。
[0198]
以上所述,仅是本发明的较佳实施例而已,并非对本发明的结构作任何形式上的限制。凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均属于本发明的技术方案范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献