一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种数据预测模型的输入数据归一化方法和装置及设备与流程

2022-12-23 21:19:05 来源:中国专利 TAG:


1.本发明涉及领域,尤其涉及一种数据预测模型的输入数据归一化方法和装置及设备。


背景技术:

2.随着大数据技术的迅猛发展,数据中心也迅速增多。数据中心通常由机柜、互联网技术(internet technology,it)服务器、不间断电源(uninterruptible power supply,ups)、空调、温湿度传感器等设备组成,上述设备在运行时会产生大量的热量,耗费大量电能。因此,通过人工智能的手段降低电源使用效率(power usage effectiveness,pue)成为了当前发展趋势。
3.可以使用人工智能等多种机器学习方法构建数据预测模型以降低pue,例如,将数据中心的设备运行数据和环境状态数据输入到pue预测模型,获得上述pue预测模型预测的pue数据,以确定使pue较低的设备运行方案;或,将数据中心的设备运行数据和环境状态数据输入到温度预测模型,获得上述温度预测模型预测的温度,以对数据中心内的设备进行调节。使用上述机器学习方法时,为了提高机器学习模型的准确性,首先会对机器学习模型输入的数据进行归一化处理。标准的0-1归一化方法为将待归一化数值和最小阈值的差值,与最大阈值和最小阈值的差值做比,计算归一化的数据,其中,要求待归一化数值在上述最大阈值和最小阈值之间。
4.上述数据预测模型的输入数据的变化范围常常较大,例如it功率,不同数据中心的it功率数值范围不同,且同一数据中心在不同时刻的it功率的数值范围也不同,所以在使用上述标准的0-1归一化方法时,会遇到两个问题:(1)如果设置的最大阈值和最小阈值之间的预设范围较大,对于待归一化的输入数据中存在的变化范围较小的数据,则归一化后的值会集中在某一值附近,效果不理想;(2)如果设置的最大阈值和最小阈值之间的预设范围较小,上述标准的0-1归一化方法无法处理在上述预设范围之外的输入数据。


技术实现要素:

5.本发明提供一种数据预测模型的输入数据归一化方法和装置及设备,解决现有的使用标准的0-1归一化方法处理数据预测模型的输入数据的方案,归一化结果集中在一个值附近,且无法处理预设范围之外的输入数据的问题。
6.第一方面,本发明提供一种数据预测模型的输入数据归一化方法,该方法包括:
7.获取待归一化的输入数据,并在确定所述输入数据超出预设范围时,限制所述输入数据的取值至预设范围内;
8.根据所述预设范围的数据长度及预设的维度n,确定每一维度向量对应的单位数据长度,所述n不小于2;
9.将所述输入数据和所述预设范围的最小阈值的差值β,映射为前n维采用绝对值不大于1的非零编码值、n-n维采用编码值0的n维向量,其中,所述n维向量中各维度编码值与
所述单位数据长度的乘积之和,为所述差值β。
10.可选地,将所述输入数据和所述预设范围的最小阈值的差值β,映射为前n维采用绝对值不大于1的非零编码值、n-n维采用编码值0的n维向量,包括:
11.将所述输入数据和所述预设范围的最小阈值的差值β,按照所述单位数据长度进行拆解,得到n-1个单位数据长度,及所述差值β和所述n-1个单位数据长度的差值m;
12.所述n维向量包括顺次排列的n-1个编码值为1的维度,和一个编码值为所述差值m和所述单位数据长度的比值的维度,以及n-n个编码值为0的维度。
13.可选地,将所述输入数据和所述预设范围的最小阈值的差值β,按照所述单位数据长度进行拆解,包括:
14.将所述输入数据和所述预设范围的最小阈值的差值β,按照非零编码值与单位数据长度的乘积迭代递减,迭代n次至递减结果小于所述单位数据长度时结束;或者
15.将所述输入数据和所述预设范围的最小阈值的差值β,对所述非零编码值与单位数据长度的乘积进行取模运算。
16.可选地,在确定所述输入数据超出预设范围时,限制所述输入数据的取值至预设范围内,包括:
17.确定所述输入数据大于所述预设范围的最大阈值,将所述输入数据更新为所述最大阈值;
18.确定所述输入数据小于所述预设范围的最小阈值,将所述输入数据更新为所述最小阈值;
19.确定所述输入数据不小于所述预设范围的最小阈值且不大于所述预设范围的最大阈值,保持所述输入数据不变。
20.可选地,根据所述预设范围的数据长度及预设的维度n,确定每一维度向量对应的单位数据长度,包括:
21.将所述预设范围的数据长度与预设的维度n做比,得到每一维度向量对应的单位数据长度。
22.可选地,所述方法还包括:
23.将所述n维向量作为数据预测模型的输入,以输出数据中心的与所述n维向量对应的实际数据为目标,调整所述数据预测模型的参数。
24.可选地,所述数据预测模型包括数据中心电源使用效率pue预测模型和/或数据中心温度预测模型。
25.第二方面,本发明提供一种数据预测模型的输入数据归一化设备,包括存储器和处理器,其中:
26.所述存储器用于存储计算机程序;
27.所述处理器用于读取所述存储器中的程序并执行如下步骤:
28.获取待归一化的输入数据,并在确定所述输入数据超出预设范围时,限制所述输入数据的取值至预设范围内;
29.根据所述预设范围的数据长度及预设的维度n,确定每一维度向量对应的单位数据长度,所述n不小于2;
30.将所述输入数据和所述预设范围的最小阈值的差值β,映射为前n维采用绝对值不
大于1的非零编码值、n-n维采用编码值0的n维向量,其中,所述n维向量中各维度编码值与所述单位数据长度的乘积之和,为所述差值β。
31.可选地,所述处理器将所述输入数据和所述预设范围的最小阈值的差值β,映射为前n维采用绝对值不大于1的非零编码值、n-n维采用编码值0的n维向量,包括:
32.将所述输入数据和所述预设范围的最小阈值的差值β,按照所述单位数据长度进行拆解,得到n-1个单位数据长度,及所述差值β和所述n-1个单位数据长度的差值m;
33.所述n维向量包括顺次排列的n-1个编码值为1的维度,和一个编码值为所述差值m和所述单位数据长度的比值的维度,以及n-n个编码值为0的维度。
34.可选地,所述处理器将所述输入数据和所述预设范围的最小阈值的差值β,按照所述单位数据长度进行拆解,包括:
35.将所述输入数据和所述预设范围的最小阈值的差值β,按照非零编码值与单位数据长度的乘积迭代递减,迭代n次至递减结果小于所述单位数据长度时结束;或者
36.将所述输入数据和所述预设范围的最小阈值的差值β,对所述非零编码值与单位数据长度的乘积进行取模运算。
37.可选地,所述处理器在确定所述输入数据超出预设范围时,限制所述输入数据的取值至预设范围内,包括:
38.确定所述输入数据大于所述预设范围的最大阈值,将所述输入数据更新为所述最大阈值;
39.确定所述输入数据小于所述预设范围的最小阈值,将所述输入数据更新为所述最小阈值;
40.确定所述输入数据不小于所述预设范围的最小阈值且不大于所述预设范围的最大阈值,保持所述输入数据不变。
41.可选地,所述处理器根据所述预设范围的数据长度及预设的维度n,确定每一维度向量对应的单位数据长度,包括:
42.将所述预设范围的数据长度与预设的维度n做比,得到每一维度向量对应的单位数据长度。
43.可选地,所述处理器还用于:
44.将所述n维向量作为数据预测模型的输入,以输出数据中心的与所述n维向量对应的实际数据目标,调整所述数据预测模型的参数。
45.可选地,所述数据预测模型包括数据中心电源使用效率pue预测模型和/或数据中心温度预测模型。
46.第三方面,本发明提供一种数据预测模型的输入数据归一化装置,包括:
47.数据调整单元,用于获取待归一化的输入数据,并在确定所述输入数据超出预设范围时,限制所述输入数据的取值至预设范围内;
48.长度计算单元,用于根据所述预设范围的数据长度及预设的维度n,确定每一维度向量对应的单位数据长度,所述n不小于2;
49.向量映射单元,用于将所述输入数据和所述预设范围的最小阈值的差值β,映射为前n维采用绝对值不大于1的非零编码值、n-n维采用编码值0的n维向量,其中,所述n维向量中各维度编码值与所述单位数据长度的乘积之和,为所述差值β。
50.可选地,所述向量映射单元将所述输入数据和所述预设范围的最小阈值的差值β,映射为前n维采用绝对值不大于1的非零编码值、n-n维采用编码值0的n维向量,包括:
51.将所述输入数据和所述预设范围的最小阈值的差值β,按照所述单位数据长度进行拆解,得到n-1个单位数据长度,及所述差值β和所述n-1个单位数据长度的差值m;
52.所述n维向量包括顺次排列的n-1个编码值为1的维度,和一个编码值为所述差值m和所述单位数据长度的比值的维度,以及n-n个编码值为0的维度。
53.可选地,所述向量映射单元将所述输入数据和所述预设范围的最小阈值的差值β,按照所述单位数据长度进行拆解,包括:
54.将所述输入数据和所述预设范围的最小阈值的差值β,按照非零编码值与单位数据长度的乘积迭代递减,迭代n次至递减结果小于所述单位数据长度时结束;或者
55.将所述输入数据和所述预设范围的最小阈值的差值β,对所述非零编码值与单位数据长度的乘积进行取模运算。
56.可选地,所述数据调整单元在确定所述输入数据超出预设范围时,限制所述输入数据的取值至预设范围内,包括:
57.确定所述输入数据大于所述预设范围的最大阈值,将所述输入数据更新为所述最大阈值;
58.确定所述输入数据小于所述预设范围的最小阈值,将所述输入数据更新为所述最小阈值;
59.确定所述输入数据不小于所述预设范围的最小阈值且不大于所述预设范围的最大阈值,保持所述输入数据不变。
60.可选地,所述长度计算单元根据所述预设范围的数据长度及预设的维度n,确定每一维度向量对应的单位数据长度,包括:
61.将所述预设范围的数据长度与预设的维度n做比,得到每一维度向量对应的单位数据长度。
62.可选地,所述向量映射单元还用于:
63.将所述n维向量作为数据预测模型的输入,以输出数据中心的与所述n维向量对应的实际数据为目标,调整所述数据预测模型的参数。
64.可选地,所述数据预测模型包括数据中心电源使用效率pue预测模型和/或数据中心温度预测模型。
65.第四方面,本发明提供一种计算机程序介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面提供的一种数据预测模型的输入数据归一化方法的步骤。
66.本发明提供的一种数据预测模型的输入数据归一化方法和装置及设备,具有以下有益效果:
67.通过将数据预测模型的输入数据转化为前n维采用绝对值不大于1的非零编码值、n-n维采用编码值0的n维向量,实现对上述输入数据的升维归一化,完成对上述输入数据合理的归一化;可以设置较大的预设范围,扩大可以处理的输入数据的数值范围,且减轻了变化范围较小的输入数据,归一化后在某一值附近集中的程度,使归一化后的编码值具有良好的精度;改善使用升维归一化的输入数据的数据预测模型的收敛速度和收敛效果。
附图说明
68.图1为本发明实施例提供的一种数据预测模型的输入数据归一化方法的流程图;
69.图2为本发明实施例提供的一种数据预测模型的输入数据归一化方法的效果示意图;
70.图3为本发明实施例提供的一种将输入数据映射为n维向量的流程图;
71.图4为本发明实施例提供的一种数据预测模型的输入数据归一化方法的具体实施方式的流程图;
72.图5为本发明实施例提供的一种数据预测模型的输入数据归一化设备的示意图;
73.图6为本发明实施例提供的一种数据预测模型的输入数据归一化装置的示意图。
具体实施方式
74.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,并不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
75.需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
76.以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的设备和方法的例子。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
77.在本技术实施例的描述中,除非另有说明,“/”表示或的意思,例如,a/b可以表示a或b;文本中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况,另外,在本技术实施例的描述中,“多个”是指两个或多于两个,其它量词与之类似应当理解,此处所描述的优选实施例仅用于说明和解释本技术,并不用于限定本技术,并且在不冲突的情况下,本技术的实施例及实施例中的特征可以相互组合。
78.以下,对本发明实施例中的部分用语进行解释说明,以便于本领域技术人员理解。
79.(1)本发明实施例中术语“电源使用效率(power usage effectiveness,pue)”,是评价数据中心能源效率的指标,pue=数据中心总能耗/it设备能耗,其中数据中心总能耗包括it设备能耗和制冷、配电等设备的能耗,其值大于1,pue越接近1表明非it设备耗能越少,即数据中心的能效水平越好。
80.(2)本发明实施例中术语“维数灾难”,是指在涉及到向量计算的问题中,随着向量维数的增加,计算量呈指数倍增长的一种现象。
81.鉴于现有的使用标准的0-1归一化方法处理数据预测模型的输入数据的方案,归一化结果集中在一个值附近,且无法处理上述预设范围之外的输入数据的问题,本发明提出一种数据预测模型的输入数据归一化方法和装置及设备。
82.下面结合附图对本发明实施例中的一种数据预测模型的输入数据归一化方法和装置及设备进行详细说明。
83.实施例1
84.本发明实施例提供一种数据预测模型的输入数据归一化方法的流程图,如图1所示,包括:
85.步骤s101,获取待归一化的输入数据,并在确定所述输入数据超出预设范围时,限制所述输入数据的取值至预设范围内;
86.上述输入数据可以是数据预测模型使用的任意数据类型的数据,包括但不限于设备运行数据,例如it功率、空调功率、配电设备功率,及环境状态数据,例如温度、湿度等。
87.作为一种可选的实施方式,上述输入数据为it功率。
88.上述预设范围可以通过设置最小阈值到最大阈值确定。
89.上述预设范围的具体大小可以根据具体的实施情况进行具体设置,例如,将数据中心正常运行时的数据范围乘以预设比例作为上述预设范围,或根据输入数据的期望大小确定上述预设范围,本发明实施例对此不作任何限定。
90.例如当上述输入数据为it功率时,设置上述预设范围的上限maxl=200(kw),设置上述预设范围的下限minl=10(kw)。
91.对于在上述预设范围之外的输入数据,即小于上述预设范围的最小阈值,或大于上述预设范围的最大阈值的输入数据,进行处理,将在上述预设范围之外的输入数据限制在上述预设范围内。
92.上述处理方法可以为能实现上述限制效果的任意方法,例如将大于上述预设范围的最大阈值的输入数据截断为上述最大阈值,将小于上述预设范围的最小阈值的输入数据截断为上述最小阈值;或者,按照预设比例将上述在上述预设范围之外的输入数据映射为在上述预设范围内的数据,本发明实施例对比不作任何限定。
93.步骤s102,根据所述预设范围的数据长度及预设的维度n,确定每一维度向量对应的单位数据长度,所述n不小于2;
94.需要说明的是,为了避免维数灾难,通常将上述预设的维度n设置在10以内。
95.上述预设的维度n可以为不小于2且不大于10的任意数值,上述预设的维度n的具体数值可以根据具体的实施情况进行设置,本发明实施例对此不作任何限定。
96.上述每一维度向量对应的单位数据长度interval可以理解为精度,可以通过上述预设范围的最大阈值maxl、上述预设范围的最小阈值minl、上述预设的维度n进行调整。
97.上述单位数据长度interval越小精度越高,但相应的维度n越大。
98.步骤s103,将所述输入数据和所述预设范围的最小阈值的差值β,映射为前n维采用绝对值不大于1的非零编码值、n-n维采用编码值0的n维向量,其中,所述n维向量中各维度编码值与所述单位数据长度的乘积之和,为所述差值β。
99.需要说明的是,预先设定上述绝对值不大于1的非零编码值可能的具体数值,上述具体数值可以根据具体的实施方式进行具体设置,本发明实施例对此不进行任何限定。
100.例如设置上述编码值为1,或-1,或绝对值不大于1的小数。
101.上述n维向量为[n1,n2,n3,n4],其中n=4,n1,n2,n3,n4为上述n维向量中各维度的编码值,则上述输入数据=单位数据长度interval*(n1 n2 n3 n4) 上述预设范围的最
小阈值minl。
[0102]
根据上述输入数据和上述预设范围的最小阈值的差值β,和上述单位数据长度,将上述差值β映射为前n维采用绝对值不大于1的非零编码值、n-n维采用编码值0的n维向量,确定每一维度的具体编码值,确保n维向量中各维度编码值与所述单位数据长度的乘积之和,为所述差值β。
[0103]
作为一种可选的实施方式,设置上述绝对值不大于1的非零编码值为1或在[0-1]之间的数值。
[0104]
如图2所示,本发明实施例提供一种数据预测模型的输入数据归一化方法的效果示意图。
[0105]
在图2的示例101中,输入数据为51,配置(0,60,5),指预设范围为0至60,预设的维度n为5,则将上述输入数据与0的差值映射为5维向量,并确定5维向量中各维度的编码值为[1,1,1,1,0.25],其中,51-0=(60-0)/5*(1 1 1 1 0.25)。
[0106]
在图2的示例102中,输入数据为51,配置(20,60,5),指预设范围为20至60,预设的维度n为5,则将上述输入数据与20的差值映射为5维向量,并确定5维向量中各维度的编码值为[1,1,1,0.875,0],其中,51-20=(60-20)/5*(1 1 1 0.875)。
[0107]
在图2的示例103中,输入数据为51,配置(30,60,3),指预设范围为30至60,预设的维度n为3,则将上述输入数据与30的差值映射为3维向量,并确定3维向量中各维度的编码值为[1,1,0.1],其中,51-30=(60-30)/3*(1 1 0.1)。
[0108]
作为一种可选的实施方式,在确定所述输入数据超出预设范围时,限制所述输入数据的取值至预设范围内,包括:
[0109]
确定所述输入数据大于所述预设范围的最大阈值,将所述输入数据更新为所述最大阈值;
[0110]
确定所述输入数据小于所述预设范围的最小阈值,将所述输入数据更新为所述最小阈值;
[0111]
确定所述输入数据不小于所述预设范围的最小阈值且不大于所述预设范围的最大阈值,保持所述输入数据不变。
[0112]
根据上述预设范围的最大阈值maxl和上述预设范围的最小阈值minl,对上述输入数据α进行截断处理:当α》maxl时,修正为α=maxl;当α《minl时,修正为α=minl;当minl《=α《=maxl时,不修改α。
[0113]
作为一种可选的实施方式,根据所述预设范围的数据长度及预设的维度n,确定每一维度向量对应的单位数据长度,包括:
[0114]
将所述预设范围的数据长度与预设的维度n做比,得到每一维度向量对应的单位数据长度。
[0115]
根据上述预设范围的最大阈值maxl和上述预设范围的最小阈值minl,及预设的维度n,计算每一维度向量对应的单位数据长度interval:interval=(maxl-minl)/n。
[0116]
如图3所示,本发明实施例提供一种将输入数据映射为n维向量的流程图,包括:
[0117]
步骤s301,将所述输入数据和所述预设范围的最小阈值的差值β,按照所述单位数据长度进行拆解,得到n-1个单位数据长度,及所述差值β和所述n-1个单位数据长度的差值m;
[0118]
计算上述输入数据α和上述预设范围的最小阈值minl的差值β,即β=α-minl。
[0119]
将上述差值β拆解为n-1个单位数据长度interval,及上述差值β和上述n-1个单位数据长度的差值m,即,β=(n-1)*interval m。
[0120]
作为一种可选的实施方式,将所述输入数据和所述预设范围的最小阈值的差值β,按照所述单位数据长度进行拆解,包括:
[0121]
将所述输入数据和所述预设范围的最小阈值的差值β,按照非零编码值与单位数据长度的乘积迭代递减,迭代n次至递减结果小于所述单位数据长度时结束;
[0122]
即,将上述差值β和上述单位数据长度interval进行迭代,迭代规则为:
[0123]
(1)若β》interval,将β更新为β=β-interval*1,然后再次比较更新后的β与interval进行下一轮迭代;
[0124]
其中,上述1为非零编码值。
[0125]
(2)若β《=interval,中止迭代。
[0126]
将迭代次数n减1作为上述单位数据长度的数量n-1,并将中止迭代后的差值β作为上述差值m。
[0127]
或者,将所述输入数据和所述预设范围的最小阈值的差值β,对所述非零编码值与单位数据长度的乘积进行取模运算。
[0128]
即,将上述差值β和上述单位数据长度interval*1进行取模运算,将计算得到的模作为上述单位数据长度的数量n-1,将计算得到的余数作为上述差值m:β=(n-1)*interval m。
[0129]
其中,上述1为非零编码值。
[0130]
步骤s302,所述n维向量包括顺次排列的n-1个编码值为1的维度,和一个编码值为所述差值m和所述单位数据长度的比值的维度,以及n-n个编码值为0的维度。
[0131]
即,上述n维向量[n1,n2,

,nk,nk 1,

]=[1,1,

,1,m/interval,

]。
[0132]
需要说明的是,当上述待归一化的输入数据等于上述预设范围的最大阈值时,上述n维向量由k 1个编码值为1的维度组成,即上述n维向量[n1,n2,

,nk 1]=[1,1,

,1]。
[0133]
将所述输入数据和所述预设范围的最小阈值的差值β,迭代多次减去所述非零编码值与单位数据长度的乘积,至迭代结果小于所述单位数据长度;所述n维向量包括顺次排列的n-1个编码值为1的维度,和一个编码值为所述差值m和所述单位数据长度的比值的维度,以及n-n个编码值为0的维度。
[0134]
即,将上述差值β和上述单位数据长度interval进行迭代,迭代规则为:
[0135]
(1)若β》interval,将β更新为β=β-interval*1,然后再次比较更新后的β与interval进行下一轮迭代;
[0136]
在进行上述迭代时,同时计算编码结果output:将output增加一个维度并且设置上述维度的编码值为1。
[0137]
(2)若β《=interval,中止迭代。
[0138]
在进行上述迭代时,同时计算编码结果output:将output增加一个维度并且设置上述维度的编码值为β/interval。
[0139]
需要说明的是,在迭代结束后,检查上述编码结果output的维度是否为预设的维度n,如果不是,增加维度至上述预设的维度n,并将上述新增加的维度的编码值设置为0。
[0140]
作为一种可选的实施方式,所述方法还包括:
[0141]
将所述n维向量作为数据预测模型的输入,以输出数据中心的与所述n维向量对应的实际数据为目标,调整所述数据预测模型的参数。
[0142]
作为一种可选的实施方式,所述数据预测模型包括数据中心电源使用效率pue预测模型和/或数据中心温度预测模型。
[0143]
需要说明的是,上述数据预测模型可以为任意的具有pue预测能力的机器学习模型,并不限于上述数据中心pue预测模型和数据中心温度预测模型,本发明实施例对此不进行任何限定。
[0144]
如图4所示,本发明实施例提供一种数据预测模型的输入数据归一化方法的具体实施方式的流程图,包括:
[0145]
例如,上述数据预测模型的输入数据为it功率α=45kw,上述预设范围的最大阈值maxl=160kw,上述预设范围的最小阈值minl=0kw,预设的维度n=8维。
[0146]
步骤s401,获取待归一化的输入数据;
[0147]
待归一化的输入数据为it功率α=45kw。
[0148]
步骤s402,判断上述输入数据是否超出预设范围,若是,执行步骤s403,否则,执行步骤s404;
[0149]
it功率α=45kw在上述预设范围[minl=0kw,maxl=160kw]内,因此上述输入数据未超出上述预设范围,执行步骤s404。
[0150]
若上述it功率α=170kw,大于上述maxl=160kw,执行步骤s403。
[0151]
步骤s403,限制上述输入数据的取值至预设范围内,执行步骤s404;
[0152]
若上述it功率α=170kw,则将上述it功率α修正为上述maxl=160kw。
[0153]
步骤s404,根据上述预设范围的数据长度及预设的维度n,确定每一维度向量对应的单位数据长度;
[0154]
计算每一维度向量对应的单位数据长度interval:interval=(160-0)/8=20。
[0155]
步骤s405,将上述输入数据和上述预设范围的最小阈值的差值β,减去非零编码值与上述单位数据长度的乘积;
[0156]
计算it功率α=45kw和上述预设范围的最小阈值minl=0kw的差值β:β=45-0=45。
[0157]
第一次:上述差值β减去非零编码值1与上述单位数据长度interval的乘积:β-1*interval=45-1*20=25;
[0158]
第二次:上述更新后的差值β减去非零编码值1与上述单位数据长度interval的乘积:β-1*interval=25-1*20=5。
[0159]
步骤s406,判断计算结果是否小于上述单位数据长度,若是,执行步骤s408,否则,执行步骤s407;
[0160]
第一次:计算结果为25,大于上述单位数据长度interval,执行步骤s407。
[0161]
第二次:计算结果为5,小于上述单位数据长度interval,执行步骤s408。
[0162]
步骤s407,将上述计算结果更新为上述差值β,并将output增加一个维度并且设置上述维度的编码值为1,执行步骤s405;
[0163]
第一次:上述差值β更新为β=25,output变为[1]。
[0164]
第二次:上述差值β更新为β=5,output变为[1,1]。
[0165]
步骤s408,将output增加一个维度并且设置上述维度的编码值为β/interval;
[0166]
output变为[1,1,5/20],即[1,1,0.25]。
[0167]
步骤s409,判断上述output的维度是否小于预设的维度n,若是,执行步骤s410,否则流程结束。
[0168]
上述output的维度=3小于预设的维度n=8。
[0169]
步骤s410,增加上述output的维度至上述预设的维度n,并将上述新增加的维度的编码值设置为0,流程结束。
[0170]
对增加上述output的维度至8维,并将上述新增加的维度的编码值设置为0,上述output变为[1,1,0.25,0,0,0,0,0]。
[0171]
流程结束,编码完成,it功率归一化编码前为45,编码后为[1,1,0.25,0,0,0,0,0]。
[0172]
本发明实施例通过将数据预测模型的输入数据转化为包括常数和小数编码值的n维向量,可以设置较大的预设范围,扩大可以处理的输入数据的数值范围,且减轻了变化范围较小的输入数据,归一化后在某一值附近集中的程度。
[0173]
即,本发明实施的数据预测模型的输入数据归一化方法可以使用较大的输入数据上下限,从而适用不同的输入数据,并且归一化后的输入数据的变化幅度更大。
[0174]
例如,设置预设范围为0到200,标准0-1归一化公式为(α-0)/(200-0),其中,α表示待归一化的输入数据。假设某一输入数据集合包括多个在40到60之间的输入数据,则使用上述标准0-1归一化公式对上述输入数据集合进行归一化的结果为在0.2到0.3之间的值;如果设置n=10,则使用本技术的数据预测模型的输入数据归一化方法对上述输入数据集合进行归一化,获得的n维向量,第1-2位始终为1,第4-10位始终为0,此时第3位为有效位,变化范围为[0.0,1.0],该有效位的变化范围幅度更宽,归一化效果比上述标准0-1归一化更好。
[0175]
本发明实施例归一后的输入数据可用于空调群控、温度控制等数据中心的ai算法中,可以改善ai算法的收敛速度及效果。
[0176]
本方法使用了升维的手段,使用后在其中一些维度实现比较优秀的归一,其它维度变为常数。it功率归一后的数值范围比较合理,与机器学习、神经网络等算法结合时能改善收敛速度及效果,特别地,与空调ai群控相结合可以改善算法的收敛效果。
[0177]
实施例2
[0178]
本发明实施例提供一种数据预测模型的输入数据归一化设备500的示意图,包括存储器501和处理器502,如图5所示,其中:
[0179]
所述存储器用于存储计算机程序;
[0180]
所述处理器用于读取所述存储器中的程序并执行如下步骤:
[0181]
获取待归一化的输入数据,并在确定所述输入数据超出预设范围时,限制所述输入数据的取值至预设范围内;
[0182]
根据所述预设范围的数据长度及预设的维度n,确定每一维度向量对应的单位数据长度,所述n不小于2;
[0183]
将所述输入数据和所述预设范围的最小阈值的差值β,映射为前n维采用绝对值不
大于1的非零编码值、n-n维采用编码值0的n维向量,其中,所述n维向量中各维度编码值与所述单位数据长度的乘积之和,为所述差值β。
[0184]
可选地,所述处理器将所述输入数据和所述预设范围的最小阈值的差值β,映射为前n维采用绝对值不大于1的非零编码值、n-n维采用编码值0的n维向量,包括:
[0185]
将所述输入数据和所述预设范围的最小阈值的差值β,按照所述单位数据长度进行拆解,得到n-1个单位数据长度,及所述差值β和所述n-1个单位数据长度的差值m;
[0186]
所述n维向量包括顺次排列的n-1个编码值为1的维度,和一个编码值为所述差值m和所述单位数据长度的比值的维度,以及n-n个编码值为0的维度。
[0187]
可选地,所述处理器将所述输入数据和所述预设范围的最小阈值的差值β,按照所述单位数据长度进行拆解,包括:
[0188]
将所述输入数据和所述预设范围的最小阈值的差值β,按照非零编码值与单位数据长度的乘积迭代递减,迭代n次至递减结果小于所述单位数据长度时结束;或者
[0189]
将所述输入数据和所述预设范围的最小阈值的差值β,对所述非零编码值与单位数据长度的乘积进行取模运算。
[0190]
可选地,所述处理器在确定所述输入数据超出预设范围时,限制所述输入数据的取值至预设范围内,包括:
[0191]
确定所述输入数据大于所述预设范围的最大阈值,将所述输入数据更新为所述最大阈值;
[0192]
确定所述输入数据小于所述预设范围的最小阈值,将所述输入数据更新为所述最小阈值;
[0193]
确定所述输入数据不小于所述预设范围的最小阈值且不大于所述预设范围的最大阈值,保持所述输入数据不变。
[0194]
可选地,所述处理器根据所述预设范围的数据长度及预设的维度n,确定每一维度向量对应的单位数据长度,包括:
[0195]
将所述预设范围的数据长度与预设的维度n做比,得到每一维度向量对应的单位数据长度。
[0196]
可选地,所述处理器还用于:
[0197]
将所述n维向量作为数据预测模型的输入,以输出数据中心的与所述n维向量对应的实际数据为目标,调整所述数据预测模型的参数。
[0198]
可选地,所述数据预测模型包括数据中心电源使用效率pue预测模型和/或数据中心温度预测模型。
[0199]
本发明实施例提供一种数据预测模型的输入数据归一化装置的示意图,如图6所示,包括:
[0200]
数据调整单元601,用于获取待归一化的输入数据,并在确定所述输入数据超出预设范围时,限制所述输入数据的取值至预设范围内;
[0201]
长度计算单元602,用于根据所述预设范围的数据长度及预设的维度n,确定每一维度向量对应的单位数据长度,所述n不小于2;
[0202]
向量映射单元603,用于将所述输入数据和所述预设范围的最小阈值的差值β,映射为前n维采用绝对值不大于1的非零编码值、n-n维采用编码值0的n维向量,其中,所述n维
向量中各维度编码值与所述单位数据长度的乘积之和,为所述差值β。
[0203]
可选地,所述向量映射单元将所述输入数据和所述预设范围的最小阈值的差值β,映射为前n维采用绝对值不大于1的非零编码值、n-n维采用编码值0的n维向量,包括:
[0204]
将所述输入数据和所述预设范围的最小阈值的差值β,按照所述单位数据长度进行拆解,得到n-1个单位数据长度,及所述差值β和所述n-1个单位数据长度的差值m;
[0205]
所述n维向量包括顺次排列的n-1个编码值为1的维度,和一个编码值为所述差值m和所述单位数据长度的比值的维度,以及n-n个编码值为0的维度。
[0206]
可选地,所述向量映射单元将所述输入数据和所述预设范围的最小阈值的差值β,按照所述单位数据长度进行拆解,包括:
[0207]
将所述输入数据和所述预设范围的最小阈值的差值β,按照非零编码值与单位数据长度的乘积迭代递减,迭代n次至递减结果小于所述单位数据长度时结束;或者
[0208]
将所述输入数据和所述预设范围的最小阈值的差值β,对所述非零编码值与单位数据长度的乘积进行取模运算。
[0209]
可选地,所述数据调整单元在确定所述输入数据超出预设范围时,限制所述输入数据的取值至预设范围内,包括:
[0210]
确定所述输入数据大于所述预设范围的最大阈值,将所述输入数据更新为所述最大阈值;
[0211]
确定所述输入数据小于所述预设范围的最小阈值,将所述输入数据更新为所述最小阈值;
[0212]
确定所述输入数据不小于所述预设范围的最小阈值且不大于所述预设范围的最大阈值,保持所述输入数据不变。
[0213]
可选地,所述长度计算单元根据所述预设范围的数据长度及预设的维度n,确定每一维度向量对应的单位数据长度,包括:
[0214]
将所述预设范围的数据长度与预设的维度n做比,得到每一维度向量对应的单位数据长度。
[0215]
可选地,所述向量映射单元还用于:
[0216]
将所述n维向量作为数据预测模型的输入,以输出数据中心的与所述n维向量对应的实际数据为目标,调整所述数据预测模型的参数。
[0217]
可选地,所述数据预测模型包括数据中心电源使用效率pue预测模型和/或数据中心温度预测模型。
[0218]
本发明还提供一种计算机程序介质,其上存储有计算机程序,该程序被处理器执行时实现上述实施例1中提供的一种数据预测模型的输入数据归一化方法的步骤。
[0219]
在本技术所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0220]
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显
示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
[0221]
另外,在本技术各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
[0222]
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。
[0223]
所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本技术实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘(solid state disk,ssd))等。
[0224]
以上对本技术所提供的技术方案进行了详细介绍,本技术中应用了具体个例对本技术的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本技术的方法及其核心思想;同时,对于本领域的一般技术人员,依据本技术的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本技术的限制。
[0225]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0226]
本技术是参照根据本技术的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0227]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0228]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0229]
显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精神和范围。这样,倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内,则本技术也意图包含这些改动和变型在内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献