一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

分位点回归森林和可变带宽评估的风电功率概率预测方法

2022-07-30 14:51:36 来源:中国专利 TAG:


1.本发明属于新能源发电技术领域,特别是涉及一种分位点回归森林和可变带宽评估的风电功率概率预测方法。


背景技术:

2.对于风电这类随机性电源,预测误差大,给发电计划安排和电力电量平衡带来困难。为量化评估风电预测带来的不确定风险,开展日前风电功率概率预测非常重要,预测区间带(prediction intervals,pis)有助于电网调度人员提前预知电力平衡风险,及时采取预防措施。
3.根据概率预测方法是否利用点预测结果,将其划分为直接法和间接法。1)间接法最为常见,根据点预测曲线求取误差波动范围,再将不同置信水平下的误差区间带镶嵌到点预测结果上。间接法是基于对点预测误差的统计学分析,理论研究较为成熟,工程应用较广,但其区间预测效果严重依赖于点预测的误差。2)直接法,即在无法判断点预测结果的情况下,通过求取预测对象的最大、最小期望值,来获得预测结果的不确定范围。直接法主要依赖人工智能算法,求取双目标函数最优化结果,其物理意义不够明确。
4.随机森林是集成学习方法的一种,决策树训练过程引入了bagging方法(bootstrap aggregating的缩写,又称自助聚集),使得随机森林具有较强的泛化能力,但bagging方法存在伪抽样情况,预测结果可能偏离真实值,需要对预测区间进行偏差修正。本发明提出一种分位点回归森林和可变带宽评估的风电功率概率预测方法,能够通过分位点回归得到随机森林模型的双目标输出,利用可变带宽评估进行置信区间的动态压缩,得到不同置信水平下的概率预测区间。迄今尚未见与本发明相关的文献报道和实际应用。


技术实现要素:

5.本发明所要解决的技术问题是:克服现有技术的不足,提供一种科学合理,适用性强,效果佳的分位点回归森林和可变带宽评估的风电功率概率预测方法。
6.解决其技术问题采用的方案是,一种分位点回归森林和可变带宽评估的风电功率概率预测方法,其特征是,它包括的内容有:
7.1)建立分位点回归森林的风电功率预测模型
8.作为随机森林的衍生模型,分位点回归森林(quantile regression forests,qrf)采用分位点回归函数进行每棵决策树预测结果的组合,计算过程为:
9.f
α
(x)=q
α
({w
ifi
(x)})
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
10.其中,f
α
(x)为分位点回归森林模型;fi(x)为单棵决策树模型;q
α
(.)为分位点α的回归函数,x为输入变量,wi为每棵决策树对应的权值,i=1,2,...,m,m为决策树的个数;
11.分位点回归森林模型为一种多输入、双输出的预测模型,该模型能够直接输出与α分位点相匹配的预测区间带;训练目标变量由点预测形式对应的一条曲线,改成区间预测形式对应的一束曲线区间带,对于区间带的构造方法是以某条曲线为中心线,对其进行上、
下浮动,从而得到区间带的上、下边界线;
12.2)基于可变带宽的训练区间构造方法
13.根据数理统计学中的区间估计理论,用点预测曲线的均值标准差σ来反映风电功率预测结果的不确定性,现设某预测曲线满足t分布函数,近似得到置信水平为1-α的预测区间带pis为:
[0014][0015]
其中,ui,li分别表示预测曲线的上、下限;yi为预测曲线;δy={δyi|δyi=y
0i-yi}为预测误差曲线;t
α/2
表示t分布的双侧α分位点;
[0016]
均值标准差σ是基于整个预测时段l的全局统计指标,在置信水平1-α保持不变,即:在带宽固定为2σt
α/2
的情况下,能够得到预测误差区间;
[0017]
由于日前风电功率隶属于非平稳随机信号,其均值、标准差统计指标具有时变特征,依据滑动加窗提出一种基于瞬时均值、瞬时标准差指标的动态区间构造方法,旨在动态跟踪误差曲线的局部波动特性,具体定义为:
[0018]
选择一个固定长度为d的数据窗,通过平移该数据窗,对整个预测时段进行局部化处理,得到不同时刻t所对应的均值、标准差的瞬时值,即:
[0019][0020][0021]
其中,δyi为误差曲线的瞬时值;σ
t
分别表示t时刻所对应的瞬时均值、瞬时标准差;
[0022]
将式(3)、式(4)代入式(2),得到预测区间带宽pis的瞬时值表达式,即:
[0023][0024]
基于瞬时均值、瞬时标准差的误差区间带宽明显变窄,且在不同时刻下,误差带宽是动态可变的,即可变带宽,根据误差曲线的动态特性,实现误差带宽的自动伸缩;
[0025]
3)分位点回归森林模型的求解
[0026]
分位点回归森林通过分位点回归函数得到多棵决策树的组合结果,作为最小二乘法的扩展,分位数回归的应用条件能够刻画回归变量在分布上的特征,使异常点回归效果更佳,
[0027]
设y为一元随机变量,其分布函数是:
[0028]
f(y)=p(y≤y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
[0029]
y的第α分位数的定义为:
[0030]qα
=f-1
(α)=inf{y:f(y)≥α}(0<α<1)
ꢀꢀꢀꢀꢀꢀꢀ
(7)
[0031]
定义损失函数为:
[0032]
l
α
(u)=u(α-i(u))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
[0033]
其中,i(.)为指示函数,当u≥0时,i(u)=0;当u<0时,i(u)=1,
[0034]
分位点回归分析就是使期望损失最小,拟合精度最高,定y是因变量,y被n个自变量组成的矩阵x线性表征,对于函数e(y/x=x)=xiβ,求解:
[0035][0036]
得到参数的估计值;
[0037]
4)预测区间评估指标的改进
[0038]
将预测区间覆盖率(picp)和预测区间平均带宽(pinaw)两个评价指标进行有机融合,提出一种基于同一覆盖率水平下的预测区间相对带宽(prediction interval relative width,pirw)指标,使其与pinaw指标成正比、与picp指标成反比的特征,具体定义为:
[0039][0040]
其中,n为预测日样本的数据点数,i=1,2,3,...,n;ui和li分别表示预测值yi的上、下界;当真实值y
0i
包含于预测区间[ui和li]内时,ki=1,否则ki=0;r表示预测值的变化范围,用于对预测区间带宽做归一化处理。
[0041]
本发明的一种分位点回归森林和可变带宽评估的风电功率概率预测方法的有益效果是:
[0042]
1.基于瞬时均值、瞬时标准差的风电功率概率预测,其预测区间带宽更窄,且具有时变特性,预测区间越窄,预测不确定度越小,电网调峰成本越低。
[0043]
2.提出的预测区间相对带宽指标,能够在同一覆盖率水平下的预测区间平均带宽情况,有助于解决多目标优化难题。
[0044]
3.其科学合理,适用性强,效果佳。
附图说明
[0045]
以下结合附图和具体实施方式对本发明作进一步的说明:
[0046]
图1为本发明的流程结构示意图;
[0047]
图2(a)为固定比例法应用验证示意图;
[0048]
图2(b)固定带宽法应用验证示意图;
[0049]
图2(c)可变带宽法应用验证示意图;
[0050]
图3(a)为区间平均带宽(pinaw)在30天的概率预测评估指标示意图;
[0051]
图3(b)为区间覆盖率(picp)在30天的概率预测评估指标示意图;
[0052]
图3(c)为区间覆盖率(picp)在30天的概率预测评估指标示意图。
具体实施方式
[0053]
下面利用附图和具体实施方式对本发明作进一步说明。
[0054]
参照图1,本发明的一种分位点回归森林和可变带宽评估的风电功率概率预测方法,包括的内容有:
[0055]
1)建立分位点回归森林的风电功率预测模型
[0056]
作为随机森林的衍生模型,分位点回归森林(quantile regression forests,qrf)采用分位点回归函数进行每棵决策树预测结果的组合,计算过程为:
[0057]fα
(x)=q
α
({w
ifi
(x)})
ꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0058]
其中,f
α
(x)为分位点回归森林模型;fi(x)为单棵决策树模型;q
α
(.)为分位点α的回归函数,x为输入变量,wi为每棵决策树对应的权值,i=1,2,...,m,m为决策树的个数;
[0059]
分位点回归森林模型为一种多输入、双输出的预测模型,该模型能够直接输出与α分位点相匹配的预测区间带;训练目标变量由点预测形式对应的一条曲线,改成区间预测形式对应的一束曲线区间带,对于区间带的构造方法是以某条曲线为中心线对其进行上、下浮动,从而得到区间带的上、下边界线。浮动的规则可以是固定比例法yi(1 α%)、固定带宽法(yi±
σ),其中,α为分位点,σ为标准差。不过,以该方法构造出的区间带,受该曲线预测误差的影响大。考虑到日前风电功率具有动态不确定性,提出一种基于瞬时均值、瞬时标准差的动态区间构造方法,简称可变带宽法,以使得训练目标的构造更加合理。
[0060]
2)基于可变带宽的训练区间构造方法
[0061]
设某预测曲线满足t分布函数,可以近似得到置信水平为1-α的预测区间带pis为:
[0062][0063]
其中,ui,li分别表示预测曲线的上、下限;yi为预测曲线;δy={δyi|δyi=y
0i-yi}为预测误差曲线;σ分别为预测误差曲线的均值、标准差;t
α/2
表示t分布的双侧α分位点。
[0064]
在上述评估方法中,均值标准差σ是基于整个预测时段l的全局统计指标。由于日前风电功率隶属于非平稳随机信号,其均值、标准差等统计指标具有时变特征。依据滑动加窗的思想,提出一种基于瞬时均值、瞬时标准差指标的动态区间构造方法,旨在动态跟踪误差曲线的局部波动特性。具体定义如下:
[0065]
选择一个长度为d的数据窗,通过平移该数据窗,对整个预测时段进行局部化处理,得到不同时刻t所对应的均值、标准差的瞬时值,即:
[0066][0067][0068]
其中,δyi为误差曲线的瞬时值;σ
t
分别表示t时刻所对应的瞬时均值、瞬时
标准差。
[0069]
将式(3)、式(4)代入式(2),可得到预测区间带宽pis的瞬时值表达式,即:
[0070][0071]
现将固定比例法、固定带宽法和可变带宽法分别用于区间带宽的构造,如图2(a)、2(b)和图2(c)可知,可变带宽法可对预测曲线的误差区间动态压缩,误差带宽明显变窄,且在不同时刻下,误差带宽是动态可变的,即能够根据误差曲线的动态特性,实现误差带宽的自动伸缩。
[0072]
3)分位点回归森林模型的求解
[0073]
随机森林是集成学习方法中的一种,是由多个决策树子模型构成的组合模型。通过bagging抽样方法构造出近似独立同分布的多个训练集,并行训练出多个决策树模型后,再通过不同的组合策略构成随机森林。与传统的随机森林不同,分位点回归森林是通过分位点回归函数得到多棵决策树的组合结果。
[0074]
作为最小二乘法的扩展,分位数回归的应用条件更加宽松,能够更加全面地刻画回归变量在分布上的特征,且对异常点具有更稳健的回归效果。
[0075]
设y为一元随机变量,其分布函数是:
[0076]
f(y)=p(y≤y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
[0077]
y的第α分位数的定义为:
[0078]qα
=f-1
(α)=inf{y:f(y)≥α}(0<α<1)
ꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
[0079]
定义损失函数为:
[0080]
l
α
(u)=u(α-i(u))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
[0081]
其中,i(.)为指示函数,当u≥0时,i(u)=0;当u<0时,i(u)=1。
[0082]
分位点回归分析的基本思想,就是使期望损失最小,拟合精度最高。这里,假定y是因变量,它被n个自变量组成的矩阵x线性表征,对于函数e(y/x=x)=xiβ,求解:
[0083][0084]
得到参数的估计值。
[0085]
目前常用的分位点回归模型的求解算法,主要包括内点法、单纯形法、椭圆算法和平滑算法,等等。其中,内点法(interior point method,ipm)是一种求解线性规划的优化算法,在处理大数据方面运算效率高、数值稳定性好,在实际应用中受到了广泛重视。
[0086]
4)预测区间评估指标的改进
[0087]
判断风电功率区间预测结果与实际情况是否符合,对开展区间预测准确度的评价指标研究非常重要。目前,最常见的区间预测评价指标主要有两个:一是预测区间覆盖率(picp),又称落点概率;另一个是预测区间平均带宽(pinaw)。优化这两个指标的目的,在于减少电力系统运行的额外旋转备用容量。日前风电功率预区间预测的目的,就是希望在预测区间带宽较窄的同时,使风电功率真实值尽可能多地包含在预测区间带内,旨在量化评估对风电功率预测误差给电网运行造成的不确定性风险。
[0088]
在实际应用中,上述两个评价指标往往是相互矛盾的,例如:若提高预测区间覆盖率到100%,预测区间的平均带宽将增大,预测结果将过于保守;或者较窄的预测带宽,预测区间与真实值相差太远,区间预测结果的准确度降低,对电网调度将失去指导意义。因此,提出了一种基于同一覆盖率水平下的预测区间相对带宽(prediction interval relative width,pirw)指标,将上述两个评价指标进行有机融合,使其与pinaw指标成正比、与picp指标成反比的特征,具体定义如下:
[0089][0090]
其中,n为预测日样本的数据点数,i=1,2,3,...,n;ui和li分别表示预测值yi的上、下界;当真实值y
0i
包含于预测区间[ui和li]内时,ki=1,否则ki=0;r表示预测值的变化范围,用于对预测区间带宽做归一化处理。
[0091]
预测区间相对带宽pirw是一种相对指标,可以用来评估不同的区间预测方法在同一覆盖率水平下的预测区间平均带宽情况,即在满足预测可信度均为100%的前提下,看以哪种评估方法得到的预测区间最窄。
[0092]
由图3(a)可知,受不同日期的风电功率波动影响,对应的概率预测区间平均带宽(pinaw)指标参差不齐,无法判断哪种预测方法更优;从图3(b)可知,分位点回归森林的区间覆盖率(picp)指标整体较大,且指标稳定性最好;从图3(c)可知,分位点回归森林的相对带宽(pirw)指标整体上最小、预测带宽最窄。对比发现,相对带宽(pirw)指标的评估效果更为科学合理,能够解决picp、pinaw两个指标在实际应用中的协调性问题。
[0093]
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献