一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

数据中心资源分析系统及方法、存储介质及电子设备与流程

2022-04-09 08:57:04 来源:中国专利 TAG:


1.本发明涉及数据中心资源分析技术领域,特别是涉及一种数据中心资源分析系统及方法、存储介质及电子设备。


背景技术:

2.在信息科技日益发展的今天,业务规模逐渐扩大、软件功能不断增加、节假日的需求陡增,这些问题对数据中心的资源建设提出了更多更高的要求。数据中心的传统建设过程中,多是以人工经验的方式进行判断和规划,在实际运营过程中会出现大量的资源浪费情况,并且无法满足计划外的突增需求,因此对于底层资源的精细化管理应运而生,从数据驱动的角度为资源管理者提供更多的资料和视角。
3.在数据中心的运营过程中,为提升对于用户的服务等级,采集了服务器的各项运维分析指标数据。在运营过程中,大部分的工作是对性能指标进行告警监控,确保用户服务的高质量稳定运行,但对于资源使用情况的总体概览及用户的使用情况没有进行深入的挖掘及分析,总体资源管理缺乏精细化管理模式,对于下线软件的资源没有及时回收,对于软件的新增需求没有及时扩充资源,导致资源的不合理分配以及资源浪费等情况的发生。


技术实现要素:

4.有鉴于此,本发明提供一种数据中心资源分析系统及方法、存储介质及电子设备,通过该系统,可以对数据中心资源进行深入的分析,合理评估数据中心资源的建设方案、容量调整信息及预期设备需求。
5.一种数据中心资源分析系统,包括:
6.数据建设层、模式分析层以及综合评估层;
7.所述数据建设层,用于获取数据中心资源的离线数据和实时数据,并提取所述离线数据的配置数据,提取所述实时数据的性能数据;对所述配置数据及所述性能数据进行处理,构成分析指标数据,所述分析指标数据包括截面数据和时序数据;
8.所述模式分析层,用于获取预设的第一训练数据集和第二训练数据集,所述第一训练数据集包括多个第一训练数据,所述第二训练数据集包括多个第二训练数据,所述第一训练数据为用于生成模型的截面数据,所述第二训练数据为用于生成模型的时序数据;基于所述第一训练数据集和第二训练数据集,构建聚类模型、分类模型及预测模型;应用所述聚类模型、分类模型及预测模型对所述分析指标数据进行分析,获得聚类模型、分类模型及预测模型分别输出的所述分析指标数据对应的第一分析结果、第二分析结果和第三分析结果;
9.所述综合评估层,用于分别对所述第一分析结果、第二分析结果及第三分析结果进行评估,生成所述数据中心资源对应的资源分区建设方案、资源容量调整信息及资源设备需求信息。
10.上述的数据中心资源分析系统,可选的,所述数据建设层,包括:
11.数据解析模块和指标丰富模块;
12.所述数据解析模块,用于从预设的关系型数据库获取离线数据,并从所述离线数据中提取配置数据;从预设的队列中获取实时数据,并从所述实时数据中提取出性能数据;
13.所述指标丰富模块,用于获取预设的截面数据标签和时序数据标签,在所述配置数据加入所述截面数据标签,获得截面数据;在所述性能数据中加入所述时序数据标签,获得时序数据。
14.上述的数据中心资源分析系统,可选的,所述模式分析层,包括:
15.特征构建模块和算法分析模块;
16.所述特征构建模块,用于对所述截面数据和时序数据进行提炼和加工,获得所述截面数据对应的多个用户指标特征和多个数据指标特征,以及所述时序数据对应的多个用户指标特征和多个数据指标特征;将各个所述用户指标特征及各个所述数据指标特征存储至预设的数据特征池;
17.所述算法分析模块,用于获取每个所述第一训练数据对应的用户指标特征和数据指标特征,以及每个所述第二训练数据对应的用户指标特征和数据指标特征;应用每个所述第一训练数据对应的数据指标特征,构建聚类模型;应用每个所述第一训练数据对应的用户指标特征和数据指标特征,以及每个所述第二训练数据对应的用户指标特征和数据指标特征,构建分类模型;应用每个所述第二训练数据对应的数据指标特征,构建预测模型;提取所述数据特征池中所述截面数据对应的用户指标特征和数据指标特征,以及所述数据特征池中所述时序数据对应的用户指标特征和数据指标特征;将所述截面数据对应的数据指标特征输入所述聚类模型,获得所述聚类模型输出的第一分析结果;将所述截面数据对应的用户指标特征和数据指标特征,以及所述数据特征池中所述时序数据对应的用户指标特征和数据指标特征输入所述分类模型,获得所述分类模型输出的第二分析结果;将所述数据特征池中所述时序数据对应的数据指标特征输入所述预测模型,获得所述预测模型输出的第三分析结果。
18.上述的数据中心资源分析系统,可选的,所述算法分析模块,具体用于对各个所述第一训练数据对应的数据指标特征进行降维处理,获得聚类数据;迭代计算各个所述聚类数据之间的距离,并将距离小于预设距离的聚类数据合并至同一聚类簇中,直至任意的聚类簇间的各个聚类数据与其他聚类簇之间的各个聚类数据的距离不小于所述预设距离时,获得各个所述聚类数据对应的聚类结果;基于所述聚类结果构建聚类模型。
19.上述的数据中心资源分析系统,可选的,所述算法分析模块,具体用于基于所述第一训练数据集及第二训练数据集,构成第三训练数据集,所述第三训练数据集包含多个第三训练数据,每个所述第三训练数据由一个第一训练数据和一个第二训练数据构成;设置每个所述第三训练数据对应的数据标签;基于各个所述第三训练数据、每个所述第三训练数据对应的数据标签及预设的损失函数,构建分类模型。
20.上述的数据中心资源分析系统,可选的,所述算法分析模块,具体用于向预设的初始预测模型输入每个所述第二训练数据对应的数据指标特征,获得所述初始预测模型输出的训练结果;判断所述训练结果是否满足预设的训练条件,若不满足,则调整所述初始预测模型的模型参数,并继续向所述初始预测模型输入每个所述第二训练数据对应的数据指标特征,直至所述预测模型当前输出的训练结果满足训练条件,获得最终的预测模型。
21.上述的数据中心资源分析系统,可选的,所述综合评估层,包括:资源分区模块、用户画像模块和需求评估模块;
22.所述资源分区模块,用于对所述第一分析结果进行评估,生成所述数据中心资源对应的资源分区建设方案,并向预设的服务器输出所述资源分区建设方案;
23.所述用户画像模块,用于对所述第二分析结果进行评估,确定用户对所述数据中心资源的使用信息,生成所述数据中心资源对应的资源容量调整信息,并向所述服务器输出所述资源容量调整信息;
24.所述需求评估模块,用于对所述第三分析结果进行评估,生成所述数据中心资源对应的资源设备需求信息,并向所述服务器输出所述资源设备需求信息。
25.一种数据中心资源分析方法,所述方法应用于数据中心资源分析系统,所述方法包括:
26.获取数据中心资源的离线数据和实时数据,并提取所述离线数据的配置数据,提取所述实时数据的性能数据;
27.对所述配置数据及所述性能数据进行处理,构成分析指标数据,所述分析指标数据包括截面数据和时序数据;
28.获取预设的第一训练数据集和第二训练数据集,所述第一训练数据包括多个第一训练数据,所述第二训练数据集包括多个第二训练数据,所述第一训练数据为用于生成模型的截面数据,所述第二训练数据为用于生成模型的时序数据;
29.基于所述第一训练数据集和第二训练数据集,构建聚类模型、分类模型及预测模型;
30.应用所述聚类模型、分类模型及预测模型对所述分析指标数据进行分析,获得聚类模型、分类模型及预测模型分别输出的所述分析指标数据对应的第一分析结果、第二分析结果和第三分析结果;
31.分别对所述第一分析结果、第二分析结果及第三分析结果进行评估,生成所述数据中心资源对应的资源分区建设方案、资源容量调整信息及资源设备需求信息。
32.一种存储介质,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行上述的数据中心资源分析方法。
33.一种电子设备,包括存储器,以及一个或者一个以上的指令,其中一个或者一个以上指令存储于存储器中,且经配置以由一个或者一个以上处理器执行上述的数据中心资源分析方法。
34.与现有技术相比,本发明包括以下优点:
35.本发明提供了一种数据中心资源分析系统,包括:数据建设层用于获取数据中心资源的离线数据和实时数据,并提取所述离线数据的配置数据,提取所述实时数据的性能数据;对所述配置数据及所述性能数据进行处理,构成分析指标数据,所述分析指标数据包括截面数据和时序数据;模式分析层用于获取预设的第一训练数据集和第二训练数据集,所述第一训练数据包括多个第一训练数据,所述第二训练数据集包括多个第二训练数据,所述第一训练数据为用于生成模型的截面数据,所述第二训练数据为用于生成模型的时序数据;基于所述第一训练数据集和第二训练数据集,构建聚类模型、分类模型及预测模型;应用所述聚类模型、分类模型及预测模型对所述分析指标数据进行分析,获得聚类模型、分
类模型及预测模型分别输出的所述分析指标数据对应的第一分析结果、第二分析结果和第三分析结果;综合评估层用于分别对所述第一分析结果、第二分析结果及第三分析结果进行评估,生成所述数据中心资源对应的资源分区建设方案、资源容量调整信息及资源设备需求信息。本发明提供的系统,通过模式分析层构建模型并应用模型对数据中心资源进行深入的分析,再通过综合评估层对模型输出的分析结果合理评估数据中心资源的建设方案、容量调整信息及预期设备需求。应用本发明提供的方法,引入“ai ”方法对核心特征指标分析,结合层次聚类、判别分类、趋势预测算法,构建聚类、分类以及预测模型,将专家经验视角与数据驱动视角有机结合,了解资源用度情况,绘制软件用户资源用度画像,预测未来使用需求,为资源设备的生命周期管理、资源规划、软件部署提供重要参考依据,形成基于it运维资源数据的数据模型及评估方法。
附图说明
36.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
37.图1为本发明实施例提供的一种数据中心资源分析系统的系统结构图;
38.图2为本发明实施例提供的一种数据中心资源分析系统的又一系统结构图;
39.图3为本发明实施例提供的一种数据中心资源分析系统的再一系统结构图;
40.图4为本发明实施例提供的一种数据中心资源分析方法的方法流程图;
41.图5为本发明实施例提供的一种电子设备结构示意图。
具体实施方式
42.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
43.在本技术中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
44.本发明可用于众多通用或专用的计算装置环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器装置、包括以上任何装置或设备的分布式计算环境等等。
45.本发明实施例提供了一种数据中心资源分析系统,该系统的系统结构图如图1所示,具体包括:
46.数据建设层100、模式分析层200以及综合评估层300;
47.所述数据建设层100,用于获取数据中心资源的离线数据和实时数据,并提取所述离线数据的配置数据,提取所述实时数据的性能数据;对所述配置数据及所述性能数据进行处理,构成分析指标数据,所述分析指标数据包括截面数据和时序数据;
48.所述模式分析层200,用于获取预设的第一训练数据集和第二训练数据集,所述第一训练数据集包括多个第一训练数据,所述第二训练数据集包括多个第二训练数据,所述第一训练数据为用于生成模型的截面数据,所述第二训练数据为用于生成模型的时序数据;基于所述第一训练数据集和第二训练数据集,构建聚类模型、分类模型及预测模型;应用所述聚类模型、分类模型及预测模型对所述分析指标数据进行分析,获得聚类模型、分类模型及预测模型分别输出的所述分析指标数据对应的第一分析结果、第二分析结果和第三分析结果;
49.所述综合评估层300,用于分别对所述第一分析结果、第二分析结果及第三分析结果进行评估,生成所述数据中心资源对应的资源分区建设方案、资源容量调整信息及资源设备需求信息。
50.本发明实施例提供的数据中心资源分析系统中,数据建设层主要是从离线数据和实时数据中提取所需的配置数据和性能数据,该性能数据实际为指标性能数据,通过对配置数据和性能数据的分析获得截面数据和时序数据,具体参考图2所示的数据建设层中各个数据之间的关系。在数据规划过程中,离线数据主要用于提取配置信息,实时数据用于性能监控,因此,数据建设层需要整合配置及性能信息,丰富资源数据的多维度信息,形成标准的资源截面数据及资源时序数据,以此提供后续的数据挖掘算法分析。模式分析层主要是通过对截面数据和时序数据进行进一步的深度挖掘,构建聚类模型、分类模型和预测模型。其中,聚类模型从高维度视角对不同资源对象进行分类整理,明确资源对象的类别状态,为后续基础资源的建设和部署提供数字化的信息辅助;分类模型对用户的资源使用情况进行类别划分,从宏观视角了解资源整体使用情况,为后续进行资源回收、资源分配提供模型建设分析基础;预测模型则用于分析资源用户在未来的资源需求,为机房建设、资源规划、软件部署提供指导建议。因此,模式分析层的各个模型可以根据数据中心资源输出对应的类别、使用情况以及设备的需求等分析结果,最终由综合评估层根据第一分析结果、第二分析结果以及第三分析结果进行进一步的解释性分析,形成资源分区建设、用户资源使用情况分析及未来需求预测等场景的资源精细化运营评估模式,并输出对应的结果。
51.其中,截面数据信息主要包括用户软件信息及服务器相关配置信息,时序数据信息主要包括服务器性能监控数据。
52.应用本发明实施例提供的数据中心资源分析系统,可以对数据中心资源进行深入的分析,合理评估数据中心资源的建设方案、容量调整信息及预期设备需求。
53.参考图3,本发明实施例提供的数据中心资源分析系统中,数据建设层,包括:
54.数据解析模块101和指标丰富模块102;
55.所述数据解析模块101,用于从预设的关系型数据库获取离线数据,并从所述离线数据中提取配置数据;从预设的队列中获取实时数据,并从所述实时数据中提取出性能数据;
56.所述指标丰富模块101,用于获取预设的截面数据标签和时序数据标签,在所述配
置数据加入所述截面数据标签,获得截面数据;在所述性能数据中加入所述时序数据标签,获得时序数据。
57.本发明实施例中,数据解析模块主要功能是提取配置数据和性能数据。由于资源的配置数据变动周期较长,因此配置数据从关系型数据库中获取即可;对于性能数据而言,性能状态是实时波动的,因此数据的整合需要从队列kafka中获取流式数据,从大数据时序数据库中获取离线数据,共同组成性能数据。指标丰富模块将配置数据和性能数据加工整合,丰富指标信息,并将分析指标数据分类为多用户汇总的截面数据信息和单用户维度的性能指标时序变化信息,即,截面数据和时序数据,为后续的模型分析工作提供基础的数据指标。
58.具体的,指标丰富模块是对数据解析模块输出的多指标资源数据进行进一步加工及整理,形成后续算法分析过程中所需的数据特征信息,通过汇总数据的各个维度特征,整合资源数据多指标维度特征信息,最终形成丰富后的截面数据及时序数据,完成后续模块所需的数据建设工作。
59.参考图3,本发明实施例提供的数据中心资源分析系统中,模式分析层,包括:
60.特征构建模块201和算法分析模块202;
61.所述特征构建模块201,用于对所述截面数据和时序数据进行提炼和加工,获得所述截面数据对应的多个用户指标特征和多个数据指标特征,以及所述时序数据对应的多个用户指标特征和多个数据指标特征;将各个所述用户指标特征及各个所述数据指标特征存储至预设的数据特征池;
62.所述算法分析模块202,用于获取每个所述第一训练数据对应的用户指标特征和数据指标特征,以及每个所述第二训练数据对应的用户指标特征和数据指标特征;应用每个所述第一训练数据对应的数据指标特征,构建聚类模型;应用每个所述第一训练数据对应的用户指标特征和数据指标特征,以及每个所述第二训练数据对应的用户指标特征和数据指标特征,构建分类模型;应用每个所述第二训练数据对应的数据指标特征,构建预测模型;提取所述数据特征池中所述截面数据对应的用户指标特征和数据指标特征,以及所述数据特征池中所述时序数据对应的用户指标特征和数据指标特征;将所述截面数据对应的数据指标特征输入所述聚类模型,获得所述聚类模型输出的第一分析结果;将所述截面数据对应的用户指标特征和数据指标特征,以及所述数据特征池中所述时序数据对应的用户指标特征和数据指标特征输入所述分类模型,获得所述分类模型输出的第二分析结果;将所述数据特征池中所述时序数据对应的数据指标特征输入所述预测模型,获得所述预测模型输出的第三分析结果。
63.需要说明的是,特征构建模块基于数据建设层输出的截面数据和时序数据,将截面数据和时序数据分为两大方面:用户指标特征和数据指标特征。用户指标特征包括软件名称、软件类型、软件分区、软件功能、变更等级、服务器类别、服务器状态、服务器等级、网络分区等用户软件信息。数据指标特征包括原始特征和衍生特征,原始特征包括资源数量、cpu核数、cpu使用率、内存大小、内存使用率、磁盘容量、磁盘空间使用率等;衍生特征包括cpu使用率均值、cpu使用率方差、cpu使用率峰值、cpu使用率极值、cpu冗余比、cpu弹性率、内存使用率均值、内存使用率方差、内存使用率峰值、内存使用率极值、内存冗余比、内存弹性率、磁盘空间使用率均值、磁盘空间使用率方差、磁盘空间使用率峰值、磁盘空间使用率
极值、磁盘空间冗余比、磁盘空间弹性率、性能监控指标弹性率、性能监控指标冗余比以及性能监控指标使用率等。
64.其中,性能监控指标弹性率和性能监控指标冗余比通过性能监控指标使用率进行计算获得,性能监控指标弹性率的计算公式为:
[0065][0066]
性能监控指标冗余比的计算公式为:
[0067][0068]
r1表示性能监控指标弹性率,r2表示性能监控指标冗余比,x
t
表示在t时刻下性能监控指标使用率。
[0069]
具体的,对于聚类模型的构建过程,算法分析模块用于对各个所述第一训练数据对应的数据指标特征降维处理,获得聚类数据;迭代计算各个所述聚类数据之间的距离,并将距离小于预设距离的聚类数据合并至同一聚类簇中,直至任意的聚类簇间的各个聚类数据与其他聚类簇之间的各个聚类数据的距离不小于所述预设距离时,获得各个所述聚类数据对应的聚类结果;基于所述聚类结果构建聚类模型。
[0070]
进一步地,聚类过程中可以提取所有的第一训练数据对应的数据指标特征,也可以只提取第一训练数据对应的各个数据指标特征中的资源数量、cpu核数、内存大小、磁盘容量、cpu冗余比、内存冗余比、磁盘空间冗余比、cpu弹性率、内存弹性率、磁盘空间弹性率。
[0071]
聚类算法主要应用于资源分区建设这一场景目标,根据多维截面指标的聚类分析,将用户资源属性及用度信息的多维数据进行降维分析,根据截面数据提取的聚类特征,采用自底向上的聚合策略进行层次分析。算法在初始过程中每个聚类数据作为原始聚类簇,计算两个聚类数据之间的距离,将距离最近的两个簇进行合并,不断重复这一步骤,直到达到预期的聚类个数。通过选用最小距离、最大距离、平均距离、欧式距离等多种距离计算方法,对聚类结果进行加权汇总,最终根据权重最大的归类结果作为聚类的判断结果。具体的距离计算公式如下所示:
[0072]
最小距离:
[0073]
最大距离:
[0074][0075]
平均距离:
[0076][0077]
欧式距离:
[0078][0079]
其中,x,z表示两个实例对象的多维截面指标信息向量。
[0080]
在本发明实施例中,所述算法分析模块,具体用于基于所述第一训练数据集及第二训练数据集,构成第三训练数据集,所述第三训练数据集包含多个第三训练数据,每个所述第三训练数据由一个第一训练数据和一个第二训练数据构成;设置每个所述第三训练数据对应的数据标签;基于各个所述第三训练数据、每个所述第三训练数据对应的数据标签及预设的损失函数,构建分类模型。
[0081]
具体的,分类算法主要应用于用户画像场景目标,根据多维截面数据及时序数据信息,全面分析用户的资源使用情况,根据分类结果对用户提出合理的资源规划建议。通过对各个分类指标和分类标签信息,构建梯度提升树进行结点的属性划分,分类的过程采用梯度提升算法,具体的算法过程如下:
[0082]
首先定义训练数据集t={(x1,y1),(x2,y2),

,(xn,yn)},损失函数l=(y,f(x));
[0083]
初始化函数:
[0084][0085]
对m=1,2,

m,i=1,2,

n计算
[0086][0087]
对r
mi
拟合回归树,得到第m棵树的叶结点区域r
mj
,j=1,2,

,j
[0088]
对j=1,2,

,j,计算
[0089][0090]
更新
[0091]
最后得到回归树
[0092][0093]
其中,x1,x2,

xn为第三训练数据,第三训练数据由第一训练数据和第二训练数据构成,其中包含第一训练数据和第二训练数据对应的用户指标特征和数据指标特征;y1,y2,
…yn
分别为每个第三训练数据对应的标签;cmj是定义的参数,第m棵树的第j个指标(m和j的数量选择根据输入数据求解)cmj的求解过程根据真实值和估计值之间的残差,选取迭代过程中选取使得残差最小的参数作为求解结果。m和j是分类决策树求解过程的决策树数量和参与分类过程的具体数据指标。在应用过程中,模型的输入指标x可能有n个维度(n》m),根据y(标签)和指标的学习过程中,会构建m棵决策树,根据决策树模型对没有标签的数据得到分类结果(a/b/c...)。
[0094]
需要说明的是,可以通过选取软件类型、软件分区、软件功能、变更等级、服务器类别、服务器状态、服务器等级、网络分区等用户定性特征信息,cpu使用率均值、cpu使用率方差、cpu使用率峰值、cpu使用率极值、内存使用率均值、内存使用率方差、内存使用率峰值、内存使用率极值、磁盘空间使用率均值、磁盘空间使用率方差、磁盘空间使用率峰值、磁盘空间使用率极值等用户指标特征和数据指标特征构建分类模型。
[0095]
在本发明实施例中,所述算法分析模块,具体用于向预设的初始预测模型输入每
个所述第二训练数据对应的数据指标特征,获得所述初始预测模型输出的训练结果;判断所述训练结果是否满足预设的训练条件,若不满足,则调整所述初始预测模型的模型参数,并继续向所述初始预测模型输入每个所述第二训练数据对应的数据指标特征,直至所述预测模型当前输出的训练结果满足训练条件,获得最终的预测模型。
[0096]
具体的,预测算法主要应用于用户的未来需求预测场景目标,根据历史数据的分布特征,对时序数据信息构建自回归移动平均模型,预测每条时序数据的未来走势,为后续资源容量规划提供定量参考依据。自回归移动模型可以表示为:
[0097][0098]
其中,e(ε
t
)=0,
[0099]
模型的估计过程如下所示:
[0100]
首先求解模型的自相关系数:
[0101][0102]
下一步求解偏自相关系数:
[0103][0104]
其中,
[0105][0106]
估计模型中未知参数的值:
[0107][0108][0109]
其中,是自回归系数,θ是移动平均项系数,ε是拟合的残差项,μ是xi(1=1,2

n)的均值,ρ是自相关系数,自相关系数是根据序列x计算出来的,d是自相关系数组成的矩阵。
[0110]
需要说明的是,通过cpu使用率、cpu使用率、内存使用率、内存使用率、磁盘空间使用率、磁盘空间使用率等数据指标特征构建预测模型。
[0111]
参考图3,本发明实施例提供的数据中心资源分析系统中,所述综合评估层,包括:资源分区模块301、用户画像模块302和需求评估模块303;
[0112]
所述资源分区模块301,用于对所述第一分析结果进行评估,生成所述数据中心资源对应的资源分区建设方案,并向预设的服务器输出所述资源分区建设方案;
[0113]
所述用户画像模块302,用于对所述第二分析结果进行评估,确定用户对所述数据中心资源的使用信息,生成所述数据中心资源对应的资源容量调整信息,并向所述服务器
输出所述资源容量调整信息;
[0114]
所述需求评估模块303,用于对所述第三分析结果进行评估,生成所述数据中心资源对应的资源设备需求信息,并向所述服务器输出所述资源设备需求信息。
[0115]
需要说明的是,资源分区模块主要是对聚类模型输出的第一分析结果进行进一步的评估和分析,通过模型的分析结果,汇总出计算密集型、内存密集型、io密集型的用户规模,为后续进行资源精细化分区建设提供数据支撑。用户画像模块在分类模型的基础上,通过对用户使用情况的划分结果,对长期处于低使用率的用户给予资源回收操作;对资源用度稳定增长的用户合理分配使用资源;对资源使用情况急速增长或存在突增的用户给予扩容操作。通过对资源分析指标数据进一步分析,可以动态感知用户的使用行为,提升对用户的服务质量。评估模块的主要功能是应用于数据中心未来资源规划场景下,通过分析用户资源长期使用情况的时序数据,结合多维时序特征,构造算法分析层的预测模型,利用最终模型的预测结果规划未来底层基础设备的需求量,为数据中心后续的机房规划、资源平衡、软件系统合理部署提供数字化驱动的指导建议,将模型结果更好的应用于数据中心资源精细化运营中。
[0116]
本发明实施例提供的数据中心资源分析系统,可以应用于应用服务器、网络交换机、路由器、交换机、负载均衡等硬件设备,可以对数据库、中间件、大数据等软件资源进行信息汇总、智能分析、监控展示。传统的运营方法多依靠历史元数据信息,缺乏对于资源用度的动态分析及部署调整。通过元数据、主数据与监控数据的信息整合,将配置数据单一维度拓展至集成性能监控数据信息,汇聚截面数据与时序数据信息共同构造多维度指标特征。引入“ai ”方法对核心特征指标分析,结合层次聚类、判别分类、趋势预测算法,构建多指标数据评价模型,将专家经验视角与数据驱动视角有机结合,了解资源用度情况,绘制软件用户资源用度画像,预测未来使用需求,为资源设备的生命周期管理、资源规划、软件部署提供重要参考依据,形成基于it运维资源数据的数据模型及评估方法。
[0117]
本发明提供的数据中心资源分析系统结构明确,层级边界清晰,模式分析层具有较高的扩展性,在引入其他算法模型的情况下不影响总体装置的流程结构设计,数据模型的构建方法可快速应用部署至其他领域资源用度分析场景。
[0118]
上述各个实施例的具体实施过程及其衍生方式,均在本发明的保护范围之内。
[0119]
本发明实施例提供了一种数据中心资源分析方法,应用于数据中心资源分析系统,该方法的方法流程图如图4所示,具体包括:
[0120]
s401:获取数据中心资源的离线数据和实时数据,并提取所述离线数据的配置数据,提取所述实时数据的性能数据。
[0121]
在本发明实施例中,从预设的关系型数据库获取离线数据,并从所述离线数据中提取配置数据;从预设的队列中获取实时数据,并从所述实时数据中提取出性能数据。
[0122]
s402:对所述配置数据及所述性能数据进行处理,构成分析指标数据,所述分析指标数据包括截面数据和时序数据。
[0123]
在本发明实施例中,获取预设的截面数据标签和时序数据标签,在所述配置数据加入所述截面数据标签,获得截面数据;在所述性能数据中加入所述时序数据标签,获得时序数据。
[0124]
s403:获取预设的第一训练数据集和第二训练数据集,所述第一训练数据包括多
个第一训练数据,所述第二训练数据集包括多个第二训练数据,所述第一训练数据为用于生成模型的截面数据,所述第二训练数据为用于生成模型的时序数据。
[0125]
s404:基于所述第一训练数据集和第二训练数据集,构建聚类模型、分类模型及预测模型。
[0126]
在本发明实施例中,对所述截面数据和时序数据进行提炼和加工,获得所述截面数据对应的多个用户指标特征和多个数据指标特征,以及所述时序数据对应的多个用户指标特征和多个数据指标特征;将各个所述用户指标特征及各个所述数据指标特征存储至预设的数据特征池;获取每个所述第一训练数据对应的用户指标特征和数据指标特征,以及每个所述第二训练数据对应的用户指标特征和数据指标特征;应用每个所述第一训练数据对应的数据指标特征,构建聚类模型;应用每个所述第一训练数据对应的用户指标特征和数据指标特征,以及每个所述第二训练数据对应的用户指标特征和数据指标特征,构建分类模型;应用每个所述第二训练数据对应的数据指标特征,构建预测模型;提取所述数据特征池中所述截面数据对应的用户指标特征和数据指标特征,以及所述数据特征池中所述时序数据对应的用户指标特征和数据指标特征;将所述截面数据对应的数据指标特征输入所述聚类模型,获得所述聚类模型输出的第一分析结果;将所述截面数据对应的用户指标特征和数据指标特征,以及所述数据特征池中所述时序数据对应的用户指标特征和数据指标特征输入所述分类模型,获得所述分类模型输出的第二分析结果;将所述数据特征池中所述时序数据对应的数据指标特征输入所述预测模型,获得所述预测模型输出的第三分析结果。
[0127]
在本发明实施例中,对各个所述第一训练数据对应的数据指标特征进行降维处理,获得聚类数据;迭代计算各个所述聚类数据之间的距离,并将距离小于预设距离的聚类数据合并至同一聚类簇中,直至任意的聚类簇间的各个聚类数据与其他聚类簇之间的各个聚类数据的距离不小于所述预设距离时,获得各个所述聚类数据对应的聚类结果;基于所述聚类结果构建聚类模型。
[0128]
在本发明实施例中,基于所述第一训练数据集及第二训练数据集,构成第三训练数据集,所述第三训练数据集包含多个第三训练数据,每个所述第三训练数据由一个第一训练数据和一个第二训练数据构成;设置每个所述第三训练数据对应的数据标签;基于各个所述第三训练数据、每个所述第三训练数据对应的数据标签及预设的损失函数,构建分类模型。
[0129]
在本发明实施例中,向预设的初始预测模型输入每个所述第二训练数据对应的数据指标特征,获得所述初始预测模型输出的训练结果;判断所述训练结果是否满足预设的训练条件,若不满足,则调整所述初始预测模型的模型参数,并继续向所述初始预测模型输入每个所述第二训练数据对应的数据指标特征,直至所述预测模型当前输出的训练结果满足训练条件,获得最终的预测模型。
[0130]
s405:应用所述聚类模型、分类模型及预测模型对所述分析指标数据进行分析,获得聚类模型、分类模型及预测模型分别输出的所述分析指标数据对应的第一分析结果、第二分析结果和第三分析结果;
[0131]
s406:分别对所述第一分析结果、第二分析结果及第三分析结果进行评估,生成所述数据中心资源对应的资源分区建设方案、资源容量调整信息及资源设备需求信息。
[0132]
在本发明实施例中,对所述第一分析结果进行评估,生成所述数据中心资源对应的资源分区建设方案,并向预设的服务器输出所述资源分区建设方案;对所述第二分析结果进行评估,确定用户对所述数据中心资源的使用信息,生成所述数据中心资源对应的资源容量调整信息,并向所述服务器输出所述资源容量调整信息;对所述第三分析结果进行评估,生成所述数据中心资源对应的资源设备需求信息,并向所述服务器输出所述资源设备需求信息。
[0133]
本发明实施例还提供了一种存储介质,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行上述数据中心资源分析方法。
[0134]
本发明实施例还提供了一种电子设备,其结构示意图如图5所示,具体包括存储器501,以及一个或者一个以上的指令502,其中一个或者一个以上指令502存储于存储器501中,且经配置以由一个或者一个以上处理器503执行所述一个或者一个以上指令502进行以下操作:
[0135]
获取数据中心资源的离线数据和实时数据,并提取所述离线数据的配置数据,提取所述实时数据的性能数据;
[0136]
对所述配置数据及所述性能数据进行处理,构成分析指标数据,所述分析指标数据包括截面数据和时序数据;
[0137]
获取预设的第一训练数据集和第二训练数据集,所述第一训练数据包括多个第一训练数据,所述第二训练数据集包括多个第二训练数据,所述第一训练数据为用于生成模型的截面数据,所述第二训练数据为用于生成模型的时序数据;
[0138]
基于所述第一训练数据集和第二训练数据集,构建聚类模型、分类模型及预测模型;
[0139]
应用所述聚类模型、分类模型及预测模型对所述分析指标数据进行分析,获得聚类模型、分类模型及预测模型分别输出的所述分析指标数据对应的第一分析结果、第二分析结果和第三分析结果;
[0140]
分别对所述第一分析结果、第二分析结果及第三分析结果进行评估,生成所述数据中心资源对应的资源分区建设方案、资源容量调整信息及资源设备需求信息。
[0141]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
[0142]
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现。
[0143]
为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所
描述的功能,但是这种实现不应认为超出本发明的范围。
[0144]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献