一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种电力业扩项目时长的预测方法和装置与流程

2022-07-16 12:22:12 来源:中国专利 TAG:


1.本发明涉及电力技术领域,尤其涉及一种基于信息熵的电力业扩项目时长的预测方法和装置。


背景技术:

2.业扩报装是供电企业营销和配网管理的一项重要工作,随着经济的高速增长,业扩报装业务也越来越多。
3.目前的业扩报装流程相对单一,模式相对固定,牵连环节广泛,流程相对机械化,操作比较单一化,导致工作流程运转效率低下,增值活动时间偏长。在电力业扩项目时长的预测,涉及的数据具有规模巨大、不确定性复杂的特点,同时由于人为或者监测水平的限制必然让数据的存在一定的误差。


技术实现要素:

4.基于此,本发明提供了一种基于信息熵的电力业扩项目时长的预测方法和装置,本技术利用信息熵和平均互信息确定混合预测模型的权重,利用权重和训练好的预测子模型组成基于信息熵的混合预测模型。信息熵由于其可以对整个数据进行处理,其在系统性、整体性和客观性上存在优点,因此可用于处理电力业扩项目时长预测的这类数据。可以提高预测时长的精度。
5.根据本技术的一些实施例的第一方面,提供了一种电力业扩项目时长的预测方法,该方法包括以下步骤:
6.获取待预测的电力业扩项目时长的初始数据,所述初始数据包括电力业扩项目节点和电力业扩项目费用;
7.将所述初始数据输入至训练好的混合预测模型,得到所述混合预测模型输出的时长预测值,其中,所述混合预测模型包括bp预测子模型、dbn预测子模型和elm预测子模型;所述时长预测值包括所述bp预测子模型输出的第一时长预测值、所述dbn预测子模型输出的第二时长预测值和所述elm预测子模型输出的第三时长预测值;
8.根据所述第一时长预测值、第二时长预测值和第三时长预测值和预设的权重值,得到所述待预测的电力业扩项目时长。
9.进一步地,所述根据所述时长预测值和所述权重,确定所述待预测的电力业扩项目时长,包括如下计算:
[0010]vmpb
=w
1va
w
2vb
w
3vc
[0011]
其中,vmpb表示待预测的电力业扩项目时长,va,vb,vc分别为获得的所述第一时长预测值、第二时长预测值和第三时长预测值,a表示所述bp预测子模型,b表示所述dbn预测子模型,c表示所述elm预测子模型;w1表示第一权重、w2表示第二权重、w3表示第三权重。
[0012]
进一步地,训练所述混合预测模型的步骤包括:
[0013]
获取历史数据,所述历史数据包括原始节点、原始费用和原始时长,将所述历史数
据按照比例随机划分为训练集和验证集;
[0014]
将所述训练集中的原始节点和原始费用作为目标输入,所述训练集的原始时长作为目标输出,训练每个预测子模型,得到每个训练好的预测子模型;
[0015]
将所述验证集分别输入至每个训练好的预测子模型中,得到每个训练好的预测子模型的信息熵和平均互信息,所述信息熵包括所述bp预测子模型的第一信息熵、所述dbn预测子模型的第二信息熵和所述elm预测子模型的第三信息熵,所述平均互信息包括所述bp预测子模型的第一平均互信息、所述dbn预测子模型的第二平均互信息和所述elm预测子模型的第三平均互信息;
[0016]
根据所述信息熵和所述平均互信息的比值,得到所述预设的权重值,所述预设的权重值包括bp预测子模型的第一权重值、所述dbn预测子模型的第二权重值和所述elm预测子模型的第三权重值;
[0017]
得到所述第一权重值、第二权重值和第三权重值对应的混合预测模型,即为训练好的混合预测模型。
[0018]
进一步地,所述将所述验证集输入每个训练好的预测子模型中,得到每个预测子模型的信息熵,包括:
[0019]
将所述验证集分别输入至每个训练好的预测子模型进行预测,得到每个训练好的预测子模型的预测准确性,所述准确性的计算公式如下:
[0020][0021]
其中,a
ij
是使用任意一个预测子模型j,预测验证集第i个验证数据的准确性;ri代表第i个验证数据的原始时长;f
ij
表示j预测子模型对第i个验证数据的时长预测值;
[0022]
对于m项验证数据,j预测子模型将产生m个相应的所述精度值,筛选整数部分,得到矩阵r
mn

[0023]
其中,r
ij
代表第j列中a
ij
的出现次数;
[0024]
根据矩阵r
mn
,计算得到j预测子模型的信息熵,计算公式如下:
[0025][0026]
其中,
[0027]ej
是j预测子模型的信息熵,wi′j与p
ij
logp
ij
对应,nj表示在矩阵中的第j列中a
ij
大于准确率x%的数量。
[0028]
进一步地,所述将所述验证集输入每个训练好的预测子模型中,得到预测子模型的平均互信息,包括:
[0029]
预设rk=r1,则定义阶跃函数un(rk,r1)=1,否则,un(rk,r1)=0,
[0030]
其中,rk,r1(k=1)是矩阵r
mn
中的两行;
[0031]
定义得到向量c
mt
=(c1,c2,

,cm)
t

[0032]
获得预测子模型的平均互信息,计算公式如下:
[0033][0034]
其中,为预测子模型中的任意两个。
[0035]
进一步地,根据所述信息熵和所述平均互信息的比值,得到所述预设的权重,包括如下步骤:
[0036]
根据每个预测子模型的所述信息熵和所述平均互信息,得到预测子模型的权重,计算公式如下:
[0037][0038]
其中,z是用于归一化所有基本算法的权重以确保所有权重之和为1的参数,ej为预测子模型的信息熵,i为预测子模型的平均互信息。
[0039]
进一步地,所述bp预测子模型包括由n个神经元组成的输入层、由q个神经元组成隐含层和由m个神经元组成的输出层;
[0040]
将所述训练集中的原始节点和原始费用作为目标输入,所述训练集的原始时长作为目标输出,训练每个预测子模型,得到每个训练好的预测子模型,包括:
[0041]
将所述原始节点和所述原始费用输入至所述输入层,得到sk,
[0042]
其中,xi(i=1,2,

,n)表示输入数据,v
ki
(i=1,2,

,n;k=1,2,

,q)表示所述输入层到所述隐层的连接权值;
[0043]
将所述sk输入至所述隐含层,得到zk=f(sk);
[0044]
将所述sj输入至所述输出层,得到yj,所述
[0045]
其中,w
jk
(k=1,2,

,q;j=1,2,

,m)表示隐层到输出层的连接权值,yj表示原始时长;
[0046]
得到训练好的bp预测模型。
[0047]
进一步地,所述dbn预测模型包括n层rbm和一层bp神经网络,其中,rbm包括相互依次连接的一层输入层和2n-1层隐含层;
[0048]
将所述训练集中的原始节点和原始费用作为目标输入,所述训练集的原始时长作为目标输出,训练每个预测子模型,得到每个训练好的预测子模型,包括:
[0049]
将所述原始节点和所述原始费用输入至所述输入层,与所述输入层连接的隐含层对所述输入层的输入数据进行抽象和提取;
[0050]
按照连接顺序依次对上一层隐含层的输入数据进行抽象和提取,直至第2n隐含层对第2n-1隐含层的输入数据进行抽象和提取,得到抽象和提取完的所述输入数据;
[0051]
将抽象和提取完的所述输入数据输入至bp网络,bp网络输出所述原始时长,得到训练好的dbn模型。
[0052]
进一步地,所述elm预测模型包括m个隐含层、输入层和输出层;
[0053]
将所述训练集中的原始节点和原始费用作为目标输入,所述训练集的原始时长作为目标输出,训练每个预测子模型,得到每个训练好的预测子模型,包括:
[0054]
将所述原始节点和所述原始费用输入至所述隐含层,计算出所述隐含层中原始节点的输出矩阵h:
[0055]
其中,激活函数g(aj,bj,x)为sigmoid函数,aj,bj分别为输入层和隐含层之间的连接权重和偏置值,n为采样样本数,xn为采样数据,tj为分类标签号,相互之间的关系满足:
[0056]
其中,rn×rm
代表是全体实数;
[0057]
通过最小二乘法,计算出所述隐含层的所述原始节点的最优输出权重矩阵:
[0058]
其中,β
l
×m为隐含层与输出层之间的权重矩阵;
[0059]
当样本数n大于或等于隐含层的原始节点数l,计算最优输出权重矩阵:
[0060]
否则,计算最优输出权重矩阵:其中,
[0061]
所述最优权重矩阵对应的elm预测模型即为训练好的elm预测模型。
[0062]
据本技术的一些实施例的第二方面,提供了一种电力业扩项目时长的预测装置,包括:
[0063]
初始数据获取模块,用于获取待预测的电力业扩项目时长的初始数据,所述初始数据包括电力业扩项目节点和电力业扩项目费用;
[0064]
时长预测值获取模块,用于将所述初始数据输入至训练好的混合预测模型,得到所述混合预测模型输出的时长预测值,其中,所述混合预测模型包括bp预测子模型、dbn预测子模型和elm预测子模型;所述时长预测值包括所述bp预测子模型输出的第一时长预测值、所述dbn预测子模型输出的第二时长预测值和所述elm预测子模型输出的第三时长预测值;
[0065]
电力业扩项目时长获取模块,用于根据所述第一时长预测值、第二时长预测值和第三时长预测值和预设的权重值,得到所述待预测的电力业扩项目时长。
[0066]
本技术提供的一种电力业扩项目时长的预测方法和装置,通过将电力业扩项目的节点和对应的费用输入到训练好的混合预测模型中,并根据预设的权重值,即可得到待预测的电力业扩项目时长。而混合预测模型的训练是通过采集原始电力业扩项目节点和费用
作为输入,利用原始电力业扩项目节点、费用和时长分别对bp预测子模型,dbn预测子模型,elm预测子模型进行训练,确定bp预测模型,dbn预测模型,elm预测模型的信息熵和平均互信息,利用信息熵和平均互信息确定预设的权重值,利用得到的权重值和训练好的预测子模型组成混合预测模型。信息熵最简洁的表述就是对不确定性的度量,其主要思想是借助概率分布来对信息量进行描述。在电力业扩项目时长预测的研究之中,涉及的数据具有规模巨大、不确定性复杂的特点,同时由于人为或者监测水平的限制必然让数据的存在一定的误差。而信息熵由于其可以对整个数据进行处理,其在系统性、整体性和客观性上存在优点,采用基于互信息和信息熵的比值确定混合预测模型中每个预测子模型的权重值,从而根据不同项目节点和费用来预测其对应的时长。不仅避免了混合预测模型中权重出现局部最优的问题,还具有更好的可解释性并使得精度更高、稳定性更好的模型更加重要,能够准确的预测时长,从而有效地提高业务流程效率,提升电力企业核心竞争力。
[0067]
为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
附图说明
[0068]
图1为本技术实施例中的一种电力业扩项目时长的预测方法的步骤流程图;
[0069]
图2为本技术实施例中的一种电力业扩项目时长的预测装置的结构示意图。
具体实施方式
[0070]
为使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术实施例方式作进一步地详细描述。
[0071]
应当明确,所描述的实施例仅仅是本技术实施例一部分实施例,而不是全部的实施例。基于本技术实施例中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本技术实施例保护的范围。
[0072]
在本技术实施例使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本技术实施例。在本技术实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0073]
下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本技术相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本技术的一些方面相一致的装置和方法的例子。在本技术的描述中,需要理解的是,术语“第一”、“第二”、“第三”等仅用于区别类似的人体,而不必用于描述特定的顺序或先后次序,也不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本技术中的具体含义。
[0074]
此外,在本技术的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联人体的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联人体是一种“或”的关系。
[0075]
电力业扩项目时长用于指示电力业扩项目的耗费时长。电力业扩项目主要包括电力工程的所有环节,如:设计、审核、施工、检查和竣工验收等。为了保证电力业扩项目的合理规划,通常需要有电力业扩的计划时长,为了确保计划时长的准确性,需要对电力业扩的时长进行预测。在电力业扩项目时长的预测中,涉及的数据具有规模巨大、不确定性复杂的特点,同时由于人为或者监测水平的限制必然让数据的存在一定的误差。
[0076]
为了解决上述问题,请参阅图1,图1为本技术提供一种电力业扩项目时长的预测方法,该方法包括以下步骤:
[0077]
在步骤s101中,获取待预测的电力业扩项目时长的初始数据,所述初始数据包括电力业扩项目节点和电力业扩项目费用。
[0078]
电力业扩项目时长的影响因素有很多,对时长具有较大影响的主要是电力业扩项目的节点数量和电力业扩项目的费用。数量越大,费用越多,对应的电力业扩项目的时长也可能越大。因此,可以根据项目节点和项目费用来对时长进行预测。
[0079]
在步骤s102中,将所述初始数据输入至训练好的混合预测模型,得到所述混合预测模型输出的时长预测值,其中,所述混合预测模型包括bp预测子模型、dbn预测子模型和elm预测子模型;所述时长预测值包括所述bp预测子模型输出的第一时长预测值、所述dbn预测子模型输出的第二时长预测值和所述elm预测子模型输出的第三时长预测值。
[0080]
训练好的混合预测模型可以根据初始数据,预测得到电力业扩项目时长的时长预测值。由于混合模型包括上述的三个预测子模型,那么对应的会得到三个时长预测值。三个预测子模型的特点各不相同,因此,得到的三个时长预测值的偏重也会各不相同,此时测得的不是最准确的时长预测值。
[0081]
在步骤s103中,根据所述第一时长预测值、第二时长预测值和第三时长预测值和预设的权重值,得到所述待预测的电力业扩项目时长。
[0082]
预设的权重值用于指示该混合预测模型中的每个训练好的预测子模型的权重值,该权重值表示了每个预测子模型在该混合预测模型中的比重,确定了每个预测子模型的重要程度和准确程度。从而,将每个预测子模型的权重值和对应的时长预测值结合,可以得到更为合理和准确的时长预测值。
[0083]
本技术通过预设的权重值和训练好的混合预测模型来预测不同项目节点和费用对应的时长。不仅避免了混合预测模型中子预测模型的权重值出现局部最优的问题,还具有更好的可解释性并使得精度更高、稳定性更好的模型更加重要,能够准确的预测电力业扩项目时长,从而有效的提高业务流程效率。
[0084]
在一个具体的实施例中,步骤s103中,根据所述时长预测值和所述权重,确定所述待预测的电力业扩项目时长,包括如下计算:
[0085]vmpb
=w
1va
w
2vb
w
3vc
[0086]
其中,v
mpb
表示待预测的电力业扩项目时长,va,vb,vc分别为获得的所述第一时长预测值、第二时长预测值和第三时长预测值,a表示所述bp预测子模型,b表示所述dbn预测子模型,c表示所述elm预测子模型;w1表示第一权重、w2表示第二权重、w3表示第三权重。
[0087]
第一权重用于指示bp预测子模型在混合预测模型中的重要程度,以及第一时长预测值的比重;第二权重用于指示dbn预测子模型在混合预测模型中的重要程度,以及第二时长预测值的比重;第三权重用于指示elm预测子模型在混合预测模型中的重要程度,以及第
三时长预测值的比重。
[0088]
由于上述混合预测模型中,每个预测子模型在混合预测模型中的比例和权重没有确定,为了保证混合预测模型的预测结果的准确性,避免出现某个预测子模型局部最优的情况,需要得到每个预测子模型在混合预测模型中的重要程度,即需要得到训练好的混合预测模型,在一个具体的实施例中,训练所述混合预测模型的步骤包括:
[0089]
在步骤s201中,获取历史数据,所述历史数据包括原始节点、原始费用和原始时长,将所述历史数据按照比例随机划分为训练集和验证集。
[0090]
具体的,可以按照8:2的比例将历史数据随机划分为训练集和验证集。
[0091]
在步骤s202中,将所述训练集中的原始节点和原始费用作为目标输入,所述训练集的原始时长作为目标输出,训练每个预测子模型,得到每个训练好的预测子模型。
[0092]
通过已知的训练集训练该混合预测模型,即将训练集分别输入至混合预测模型中的bp预测子模型、dbn预测子模型和elm预测子模型。分别得到训练好的bp预测子模型、dbn预测子模型和elm预测子模型,上述三个预测子模型的组合即为训练好的混合预测模型。
[0093]
在步骤s203中,将所述验证集分别输入至每个训练好的预测子模型中,得到每个训练好的预测子模型的信息熵和平均互信息,所述信息熵包括所述bp预测子模型的第一信息熵、所述dbn预测子模型的第二信息熵和所述elm预测子模型的第三信息熵,所述平均互信息包括所述bp预测子模型的第一平均互信息、所述dbn预测子模型的第二平均互信息和所述elm预测子模型的第三平均互信息。
[0094]
信息熵用于描述信源的不确定度,是一个数学上的抽象概念,可以表征某种特定信息的出现概率。信息熵最简洁的表述就是对不确定性的度量,其主要思想是借助概率分布来对信息量进行描述。
[0095]
平均互信息是信息论里一种有用的信息度量,它可以看成是一个随机变量中包含的关于另一个随机变量的信息量,或者说是一个随机变量由于已知另一个随机变量而减少的不肯定性。
[0096]
通过验证集,获取每个预测子模型的信息熵和平均互信息,获取的目的在于通过信息熵和平均互信息,得到每个预测子模型对应的权重值。
[0097]
在一个具体的例子中,得到每个预测子模型的信息熵,包括以下步骤:
[0098]
将所述验证集分别输入至每个训练好的预测子模型进行预测,得到每个训练好的预测子模型的预测准确性,所述准确性的计算公式如下:
[0099][0100]
其中,a
ij
是使用任意一个预测子模型j,预测验证集第i个验证数据的准确性;ri代表第i个验证数据的原始时长;f
ij
表示j预测子模型对第i个验证数据的时长预测值。预测子模型j表示混合预测模型中的任意一个预测子模型。
[0101]
对于m项验证数据,j预测子模型将产生m个相应的所述精度值,筛选整数部分,得到矩阵r
mn

[0102]
其中,r
ij
代表第j列中a
ij
的出现次数。
[0103]
根据矩阵r
mn
,计算得到j预测子模型的信息熵,计算公式如下:
[0104][0105]
其中,
[0106]ej
是j预测子模型的信息熵,wi′j与p
ij
logp
ij
对应,nj表示在矩阵中的第j列中a
ij
大于准确率x%的数量,x依据实际需要取适当值。
[0107]
在一个具体的例子中,得到预测子模型的平均互信息,包括以下步骤:
[0108]
预设rk=r1,则定义阶跃函数un(rk,r1)=1,否则,un(rk,r1)=0,
[0109]
其中,rk,r1(k=1)是矩阵r
mn
中的两行。
[0110]
定义得到向量c
mt
=(c1,c2,

,cm)
t
,获得预测子模型的平均互信息,计算公式如下:
[0111][0112]
其中,为预测子模型中的任意两个。具体的,j,j

选取为任意两个预测子模型组合中效果最好的一组。
[0113]
在步骤s204中,根据所述信息熵和所述平均互信息的比值,得到所述预设的权重,所述预设的权重包括bp预测子模型的第一权重、所述dbn预测子模型的第二权重和所述elm预测子模型的第三权重。
[0114]
在一个具体的例子中,得到所述预设的权重,包括如下步骤:
[0115]
根据每个预测子模型的所述信息熵和所述平均互信息,得到预测子模型的权重,计算公式如下:
[0116]
其中,z是用于归一化所有基本算法的权重以确保所有权重之和为1的参数,ej为预测子模型的信息熵,i为预测子模型的平均互信息。
[0117]
在步骤s205中,得到所述第一权重、第二权重和第三权重对应的混合预测模型,即为训练好的混合预测模型。
[0118]
在一个具体的实施例中,bp预测子模型包括由n个神经元组成的输入层、由q个神经元组成隐含层和由m个神经元组成的输出层;
[0119]
在步骤s202中,将所述训练集中的原始节点和原始费用作为目标输入,所述训练集的原始时长作为目标输出,训练每个预测子模型,得到每个训练好的预测子模型,包括:
[0120]
将所述原始节点和所述原始费用输入至所述输入层,得到sk,其中,xi(i=1,2,

,n)表示输入数据,v
ki
(i=1,2,

,n;k=1,2,

,q)表示所述输入层到所述隐层的连接权值。
[0121]
将所述sk输入至所述隐含层,得到zk=f(sk)。
[0122]
将所述sj输入至所述输出层,得到yj,所述其中,w
jk
(k=1,2,

,q;j=1,2,

,m)表示隐层到输出层的连接权值,yj表示原始时长,得到训练好的bp预测模型。
[0123]
在一个具体的实施例中,dbn预测模型包括n层rbm和一层bp神经网络,其中,rbm包括相互依次连接的一层输入层和2n-1层隐含层;
[0124]
在步骤s202中,将所述训练集中的原始节点和原始费用作为目标输入,所述训练集的原始时长作为目标输出,训练每个预测子模型,得到每个训练好的预测子模型,包括:
[0125]
将所述原始节点和所述原始费用输入至所述输入层,与所述输入层连接的隐含层对所述输入层的输入数据进行抽象和提取。
[0126]
按照连接顺序依次对上一层隐含层的输入数据进行抽象和提取,直至第2n隐含层对第2n-1隐含层的输入数据进行抽象和提取,得到抽象和提取完的所述输入数据。
[0127]
将抽象和提取完的所述输入数据输入至bp网络,bp网络输出所述原始时长,得到训练好的dbn模型。
[0128]
在一个具体的实施例中,elm预测模型包括m个隐含层、输入层和输出层;
[0129]
在步骤s202中,将所述训练集中的原始节点和原始费用作为目标输入,所述训练集的原始时长作为目标输出,训练每个预测子模型,得到每个训练好的预测子模型,包括:
[0130]
将所述原始节点和所述原始费用输入至所述隐含层,计算出所述隐含层中原始节点的输出矩阵h:
[0131]
其中,激活函数g(aj,bj,x)为sigmoid函数,aj,bj分别为输入层和隐含层之间的连接权重和偏置值;
[0132]
n为采样样本数,xn为采样数据,tj为分类标签号,相互之间的关系满足:
[0133]
其中,rn×rm
代表是全体实数。
[0134]
通过最小二乘法,计算出所述隐含层的所述原始节点的最优输出权重矩阵:
[0135]
其中,β
l
×m为隐含层与输出层之间的权重矩阵;
[0136]
当样本数n大于或等于隐含层的原始节点数l,计算最优输出权重矩阵:
[0137]
否则,计算最优输出权重矩阵:其中,
[0138]
所述最优权重矩阵对应的elm预测模型即为训练好的elm预测模型。
[0139]
与上述的一种电力业扩项目时长的预测方法相对应,请参阅图2,本技术还提供一种电力业扩项目时长的预测的装置200,包括:
[0140]
初始数据获取模块210,用于获取待预测的电力业扩项目时长的初始数据,所述初始数据包括电力业扩项目节点和电力业扩项目费用;
[0141]
时长预测值获取模块220,用于将所述初始数据输入至训练好的混合预测模型,得到所述混合预测模型输出的时长预测值,其中,所述混合预测模型包括bp预测子模型、dbn预测子模型和elm预测子模型;所述时长预测值包括所述bp预测子模型输出的第一时长预测值、所述dbn预测子模型输出的第二时长预测值和所述elm预测子模型输出的第三时长预测值;
[0142]
电力业扩项目时长获取模块230,用于根据所述第一时长预测值、第二时长预测值和第三时长预测值和预设的权重值,得到所述待预测的电力业扩项目时长。
[0143]
在一个可选的实施例中,电力业扩项目时长预测模块230还包括:
[0144]
电力业扩项目时长预测单元,用于根据计算公式得到待预测的电力业扩项目时长,计算公式如下:
[0145]vmpb
=w
1va
w
2vb
w
3vc
[0146]
其中,vmpb表示待预测的电力业扩项目时长,va,vb,vc分别为获得的所述第一时长预测值、第二时长预测值和第三时长预测值,a表示所述bp预测子模型,b表示所述dbn预测子模型,c表示所述elm预测子模型;w1表示第一权重、w2表示第二权重、w3表示第三权重。
[0147]
在一个可选的实施例中,该装置200还包括用于训练混合预测模型的训练模块,该训练模块包括:
[0148]
历史数据获取单元,用于获取历史数据,所述历史数据包括原始节点、原始费用和原始时长,将所述历史数据按照比例随机划分为训练集和验证集。
[0149]
预测子模型训练单元,用于将所述训练集中的原始节点和原始费用作为目标输入,所述训练集的原始时长作为目标输出,训练每个预测子模型,得到每个训练好的预测子模型。
[0150]
信息熵和平均互信息获取单元,用于将所述验证集分别输入至每个训练好的预测子模型中,得到每个训练好的预测子模型的信息熵和平均互信息,所述信息熵包括所述bp预测子模型的第一信息熵、所述dbn预测子模型的第二信息熵和所述elm预测子模型的第三信息熵,所述平均互信息包括所述bp预测子模型的第一平均互信息、所述dbn预测子模型的第二平均互信息和所述elm预测子模型的第三平均互信息。
[0151]
预设权重值获取单元,用于根据所述信息熵和所述平均互信息的比值,得到所述预设的权重值,所述预设的权重值包括bp预测子模型的第一权重值、所述dbn预测子模型的第二权重值和所述elm预测子模型的第三权重值。
[0152]
混合预测模型获取单元,用于得到所述第一权重值、第二权重值和第三权重值对
应的混合预测模型,即为训练好的混合预测模型。
[0153]
本技术提供的一种电力业扩项目时长的预测方法和装置,通过将电力业扩项目的节点和对应的费用输入到训练好的混合预测模型中,并根据预设的权重值,即可得到待预测的电力业扩项目时长。而混合预测模型的训练是通过采集原始电力业扩项目节点和费用作为输入,利用原始电力业扩项目节点、费用和时长分别对bp预测子模型,dbn预测子模型,elm预测子模型进行训练,确定bp预测模型,dbn预测模型,elm预测模型的信息熵和平均互信息,利用信息熵和平均互信息确定预设的权重值,利用得到的权重值和训练好的预测子模型组成混合预测模型。信息熵最简洁的表述就是对不确定性的度量,其主要思想是借助概率分布来对信息量进行描述。在电力业扩项目时长预测的研究之中,涉及的数据具有规模巨大、不确定性复杂的特点,同时由于人为或者监测水平的限制必然让数据的存在一定的误差。而信息熵由于其可以对整个数据进行处理,其在系统性、整体性和客观性上存在优点,采用基于互信息和信息熵的比值确定混合预测模型中每个预测子模型的权重值,从而根据不同项目节点和费用来预测其对应的时长。不仅避免了混合预测模型中权重出现局部最优的问题,还具有更好的可解释性并使得精度更高、稳定性更好的模型更加重要,能够准确的预测时长,从而有效地提高业务流程效率,提升电力企业核心竞争力。
[0154]
应当理解的是,本技术实施例并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本技术实施例的范围仅由所附的权利要求来限制。以上所述实施例仅表达了本技术实施例的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术实施例构思的前提下,还可以做出若干变形和改进,这些都属于本技术实施例的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献