一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种分布式光伏电站出力预测方法、装置及存储介质与流程

2021-11-09 22:48:00 来源:中国专利 TAG:


1.本发明属于光伏电站出力预测技术领域,具体涉及一种分布式光伏电站出力预测方法、装置及存储介质。


背景技术:

2.近年来,伴随着可再生能源发电技术的迅速发展,在大量新能源并网发电的背景下,合理改善能源配置结构,保证电力网络安全可靠运行,成为电力系统发展的重要研究方向。其中,由于光伏出力的高随机性和波动性会对电网的安全运行和调峰调度带来挑战,也会较大程度的限制可再生能源的消纳。因此,合理准确预测光伏发电功率的变化有助于维护电网安全稳定运行。
3.传统的光伏出力预测方法主要有以下几类:
4.(1)按时间尺度分:超短期预测(<4h)主要采用统计、物理混合方法,主要原则是根据地球同步卫星拍摄的卫星云图推测云层运动情况,预测到达地面的辐照强度,通过太阳辐照强度与功率转换效率模型,从而对功率进行预测。一般用于光伏发电控制、电能质量评估及光伏电站组件部分的研发设计等。短期预测(<48h)主要以nwp(天气预报信息)数据为主,通过建立历史输入数据与历史输出功率的映射关系,进而获得光伏电站输出功率的预测值。一般用于电力系统的功率平衡和经济调度、日前发电计划制定、电力市场交易、暂态稳定评估等。中长期预测(>1周)主要用于系统的检修安排、发电量的预测等。
5.(2)按预测方式分:直接预测:通过早8点~晚5点的输出功率曲线规律,直接对光伏电站的出力进行功率预测。间接预测:先对太阳辐照量的预测,然后根据预测的太阳辐照量折算出光伏发电的出力。
6.(3)按预测原理分:物理方法:将nwp数据作为输入,研究光伏发电设备特性,建立光伏发电功率与nwp数据的对应数学模型,进一步对光伏发电功率进行预测的一种方法。物理方法的预测精度比统计方法略差,但优点在于该方法不需要大量历史数据的支持,适用于新建的光伏电站。统计方法:通过找出其历史数据内在规律,排除病态数据点,建立历史数据与输出功率的函数映射关系,进一步对光伏发电功率预测的一种方法。统计方法需要大量历史的光伏电站出力数据作为建模基础,只适用投运时间大于等于一年的光伏电站,不适用新建的光伏电站。学习方法:采用人工智能的方式去建立一种输入与输出的映射关系,主要应用于非线性映射模型。
7.(4)按数学模型分:数学模型包括:时间序列预测法、自回归滑动平均模型法、神经网络法、支持向量机法、小波分析方法、灰色预测法、递推最小二乘法、相似日选取算法和智能方法等。
8.另外,为使得预测精度更高,现在更多的是将多种方法组合应用。光伏发电功率组合预测法大致包括两类:第一种是综合比较几种光伏发电功率预测的结果,经过对比分析,提取一种误差较小且操作简单的方法应用于功率预测;第二种是按权重加权几种预测方法的结果,然后平均,既实现了预测信息的最大化利用,又优化了所有预测模型的弊端,消除
了传统单一模型的误差,大大提高了光伏发电功率预测的精度。
9.但是,由于光伏发电时常伴随着随机性和不确定性,导致使用上述传统方法对光伏发电出力进行预测时,都存在很大的缺陷和约束,例如预测精度不够、步骤繁琐、计算速度慢、预测效果欠佳等。


技术实现要素:

10.为了解决上述问题,本发明的目的在于提供一种分布式光伏电站出力预测方法、装置及存储介质,能够优化预测结果的稳定性准确性,缩短计算时间。
11.本发明是通过以下技术方案来实现:
12.一种分布式光伏电站出力预测方法,包括以下步骤:
13.s1:采用系统聚类方法对光伏电站的历史气象数据进行分类,并按照历史气象数据与历史发电功率数据的映射关系对历史发电功率进行分类;
14.s2:根据不同分类下的历史气象数据和历史发电功率数据建立相应的光伏电站发电功率预测模型;
15.s3:对预测样本数据进行主成分分析,根据光伏电站发电功率预测模型进行分布式光伏电站的超短期出力预测。
16.优选地,s1前,还包括数据清洗步骤。
17.优选地,s1中,历史气象数据包括太阳辐照度、气压、温度、湿度、天气、风向和风速。
18.优选地,s1中,系统聚类分段方式为根据聚类结果对结果树状图纵轴进行距离尺度分段。
19.优选地,s1中,系统聚类分段方式为对聚类结果的样本间横向相似尺度进行分段。
20.优选地,s2中,光伏电站发电功率预测模型通过径向基核函数神经网络建立。
21.优选地,s3具体为,对预测样本数据进行主成分分析,提取主成分作为输入,根据光伏电站发电功率预测模型得到与输入预测样本数据相对应的预测结果,即功率预测值。
22.本发明公开了一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述的分布式光伏电站出力预测方法的步骤。
23.本发明公开了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述的分布式光伏电站出力预测方法的步骤。
24.与现有技术相比,本发明具有以下有益的技术效果:
25.本发明公开的分布式光伏电站出力预测方法,考虑更全面的天气信息对光伏发电预测精度的影响,加入特征提取的方法,寻找光伏发电在天气数据中影响因素的主要组成成分。本发明在分析了聚类分析和主成分分析两种数据分析理论的基础上提出了一种径向基核函数(rbf)神经网络的光伏电站输出功率预测模型精度提升方法,对建模数据进行分段聚类。首先将数据清洗后的历史运行数据进行聚类,通过聚类分段方式划分目标相似样本集,并利用神经网络算法对光伏电站输出功率的预测进行验证,能给有效提高预测结果的稳定性和准确性,并且精简了输入量的样本数量;在此基础上为了进一步提高预测精度,将数据样本进行主成分分析,能给有效提高预测结果准确度并减低输入样本维数,起到了
简化网络结构、缩短神经网络学习时间的效果。
附图说明
26.图1为本发明的分布式光伏电站出力预测方法的流程图;
27.图2为实施例中聚类方案a的结果树状图的局部放大图;
28.图3为实施例中聚类方案a的样本分布图;
29.图4为实施例中聚类方案a的a组数据预测运行结果图;
30.图5为实施例中聚类方案a的b组数据预测运行结果图;
31.图6为实施例中聚类方案a的c组数据预测运行结果图;
32.图7为实施例中聚类方案b的样本分布图;
33.图8为实施例中聚类方案b的a组数据预测运行结果图;
34.图9为实施例中聚类方案b的b组数据预测运行结果图;
35.图10为实施例中聚类方案b的c组数据预测运行结果图;
36.图11为实施例中主成分组成分析图;
37.图12为实施例中光伏电站发电功率预测模型运行结果图。
具体实施方式
38.下面以附图和具体实施例对本发明做进一步的详细说明,所述是对本发明的解释而不是限定。
39.聚类分析
40.原理介绍
41.系统聚类分析是目前各研究领域中使用最多的一种聚类方法,其基本思想为:距离近的样本先聚成类,距离远的样本后聚成类,该过程一直进行下去,直到每个样本能聚到适当的类中。样本距离计算方法较多,本发明采用通过样本间距来度量其相似程度的欧氏距离计算方法。二值欧氏距离计算方法如下:
[0042][0043]
令d
ij
=d(x
i
,x
j
),d=(d
ij
)p
×
p,形成一个距离矩阵:
[0044][0045]
式中:d
ij
=d
ji
,表示i和j之间的相应距离。可以将两个最近的样本聚类为一类,并可以根据离差平方和法(ward’s method)来开发聚类算法。根据距离矩阵的大小将两个最近的样本聚类为一类,并根据离差平方和法(ward’s method)来后续聚类,当g
p
和g
q
聚类为g
r
后,这一类与其他类g
k
的距离递推公式为:
[0046]
[0047]
式中:n
p
、n
k
、n
r
、n
q
分别为g
p
、g
k
、g
r
、g
q
的样本数量。
[0048]
基于聚类分析的功率预测分段建模方法
[0049]
(1)功率预测模型
[0050]
本发明基于影响光伏电站出力值的太阳辐照度、气压、温度等历史环境监测数据以及历史发电功率数据,构建了聚类分析与rbf神经网络相结合的分布式光伏电站短期功率预测模型。首先通过对已知的光伏电站历史数据进行系统聚类(分段聚类),分析筛选出与目标时刻的环境数据相对应的相似样本,并将相似样本集输入至rbf神经网络作为训练集。然后通过rbf神经网络算法建立功率预测模型,实现分布式光伏电站的短期出力预测。
[0051]
(2)分段聚类建模
[0052]
为了选取合适的数据处理方式,达到理想分析与预测结果,本发明基于所选的系统聚类分析算法的聚类结果,提出了两种对历史环境数据样本的分析筛选方案。第一种分段方案为根据聚类结果对结果树状图纵轴进行距离尺度分段,即对输入系统聚类结果树状图中纵坐标欧氏距离值进行划分;第二种分段方案为对聚类结果的样本间相似尺度进行分段,即基于结果树状图横轴的节点聚拢过程中的亲疏程度进行划分。此处是本发明的创新点之一。
[0053]
(3)rbf神经网络算法
[0054]
为了实现光伏电站功率的预测及其优化,本发明选取rbf神经网络算法对神经网络的输入与输出间的隐性规律特性进行分析,在能够较好地逼近目标值的同时,rbf网络还有着拟合速度较快,权值变化较少,能够拟合输入与输出数据间非线性关系的优点。基于这项优势,本发明选用rbf神经网络来分析处理光伏发电内在规律以实现光伏功率的短期预测。
[0055]
rbf神经网络由3层结构组成,分别为信号输入层,进行非线性计算的隐含层和用于线性变换的输出层。本发明选取进行了相应分析处理后的数据作为输入层,不仅达到了系统的输入要求,还包含着系统数据的变化规律信息。选取预测功率值为输出层。
[0056]
对于隐含层,选取高斯函数为相对激活函数,并使用径向基函数net=newrb(p,t,s,m,d)来进行实现。其中:p为神经网络的输入,t为输出,s为径向基扩展速度,m为神经元数量的峰值,d为网络参数。该函数在创建rbf神经网络的过程中会持续增加隐含层的数值,直到输出的误差满足要求为止。
[0057]
第i个隐含层的输出通过以下公式计算:
[0058][0059]
其中r
i
为欧式范数;p为输入;c
i
为第i个基函数的中心向量;b
i
为基准宽度;d为隐含层的节点数量。
[0060]
如图1,本发明的分布式光伏电站出力预测方法,包括以下步骤:
[0061]
对采集的数据进行清洗;
[0062]
s1:采用系统聚类方法对光伏电站的历史气象数据进行分类,并按照历史气象数据与历史发电功率数据的映射关系对历史发电功率进行分类;历史气象数据包括太阳辐照度、气压、温度、湿度、天气、风向和风速;系统聚类分段方式有两种方案,一种是根据聚类结果对结果树状图纵轴进行距离尺度分段;另一种是对聚类结果的样本间横向相似尺度进行分段。
[0063]
s2:根据不同分类下的历史气象数据和历史发电功率数据建立相应的光伏电站发电功率预测模型;光伏电站发电功率预测模型通过径向基核函数(rbf)神经网络建立。
[0064]
s3:对预测样本数据进行主成分分析,根据光伏电站发电功率预测模型进行分布式光伏电站的超短期出力预测。具体为:对预测样本数据进行主成分分析,提取主成分作为输入,根据光伏电站发电功率预测模型得到与输入预测样本数据相对应的预测结果,即功率预测值。
[0065]
实施例分析
[0066]
本发明选取某分布式光伏电站10天内每天7:00

18:00的历史环境监测数据,包括该光伏电站的湿度、环境温度、气压、风向等气象因素和其对应功率。每隔15mins为一个时间节点样本,共450个样本,作为聚类分析的输入量,为进行系统聚类等后续步骤作准备。
[0067]
聚类方案a
[0068]
对历史数据进行系统聚类(分层聚类),在输出结果中显示,横轴表示各时间节点样本的分布,纵轴表示距离值。由于样本数量过多,结果树状图横轴节点过于密集,为集中探寻聚类规律,本方案根据纵向距离尺度进行分段,即对树状图纵坐标选取合适数值(13、22.5)为界线,进行样本划分,如图2。
[0069]
分别选取纵坐标距离值(13、22.5)为界线对节点进行划分,分为a、b、c三组,并选取各组中相同数量样本进行输入,其中
·
型为a组,*型为b组,x型为c组。样本分布图如图3所示。
[0070]
将a、b、c三组数据对照相应时刻的历史数据,分别输入到rbf神经网络预测程序中,对两小时时间段(即8个时间节点)进行功率预测,预测结果如图4、图5和图6所示。
[0071]
通过观察各组数据和预测程序的运行结果后,初步可知:通过rbf神经网络预测的a、b组数据集的曲线拟合程度较高,预测结果较好,其中a组较b组稍好,而c组拟合程度较差,预测结果也较差。根据纵轴欧氏距离数值进行分组时,欧式距离较小的分组输入至预测模型并运行后所得预测结果较好,欧氏距离较大的分组输入至预测模型后所得预测结果较差。
[0072]
聚类方案b
[0073]
本方案根据横向相似尺度进行分段,即根据树状图横轴中的样本节点亲疏程度进行分段,与方案a相同,对结果树状图局部放大后进行分析处理并选取相同数量输入样本,a、b、c组内平均样本间欧氏距离依次增大。样本分布图如图7所示。
[0074]
将a、b、c三组数据对照相应时刻的历史数据,分别输入到rbf神经网络预测程序中,对时间范围为两小时(即8个时间节点)进行功率预测。预测结果如图8、图9和图10所示。
[0075]
观察运行结果初步可知:输入rbf神经网络后的a、b、c组样本预测曲线拟合程度逐渐减小,其中a组拟合结果最好,而c组拟合程度最差,预测结果较差。当根据横轴时间节点样本相似程度分组时,组内样本间相似程度越高,预测模型所得预测结果越好。
[0076]
预测结果分析
[0077]
rmse:均方根误差(root mean squared error),为误差平方平均值的方根:
[0078][0079]
mre:平均相对误差(meanrelativeerror),为相对误差的均值:
[0080][0081]
d
t
:实际值;n:数据样本个数;f
t
:预测值;e
t
:误差。
[0082]
因此根据相关公式,对不同方案的各组情况分别进行相关计算,结果如下表所示:
[0083][0084]
由上述定义可知:r2(决定系数)的数值体现了经过神经网络训练后可解释的变异占变量出现的总变异的比重,以及预测结果中预测曲线的拟合度;rmse(均方根误差)体现了预测结果数值的稳定程度;而mre(均相对误差)则体现了预测结果数值的准确性。根据上图,可以得知b方案预测结果总体优于a方案预测结果,并且b方案中的a组预测结果最优,a方案中的a组相比同组最优。a方案分段依据为系统聚类结果树状图中纵轴距离,结合a方案与b方案结果可知,a方案中分段依据纵轴距离数值大小,并未考虑欧氏距离的相对性,而a方案中预测效果最好的a组特性为欧氏距离最小,可视为包含了若干个组内样本间相似程度高的分组集合,故而a组预测效果相比其他两组为最好,而b、c两组未能体现纵轴代表数值欧氏距离的相对性,故b、c组不具备足够参考分析价值;b方案分段依据为样本间相似度(即欧氏距离),a、b、c三组的样本间相似程度逐渐减小(即平均样本间欧氏距离逐渐增大),而三组的预测效果也依次降低,因此可知在输入rbf神经网络功率预测模型的等量历史数据样本集中,样本间相似度越高,则预测效果越好。
[0085]
基于主成分分析的功率预测模型输入数据结构研究
[0086]
主成分分析
[0087]
主成分分析法是一种多元统计分析方法,能够将多项变量变为若干相互关联性较小的综合变量(即初始变量的线性组合),降低数据维度。其具体步骤如下:
[0088]
首先设分析研究的样本数据中包含p个变量和n个样本,避免不同项变量间由于数量级相差过大而可能产生的不利影响。
[0089]
(1)通过标准化矩阵x1,x2,x
p
计算样本的相关系数矩阵r,计算相关系数的公式为:
[0090][0091]
(2)根据相关系数矩阵来求取相应的特征值λ1,λ2,


p
和特征向量e1,e2,

,e
p

[0092]
(3)求取各主成分的方差贡献率,计算累计方差贡献率,公式为:
[0093][0094]
甄别主成分,当有m个主成分的累计方差贡献率达到能够反映原始信息的精度指标85%时,可得出m个主成分y1,y2,

,y
m
来替换原先变量,将这m个主成分作为rbf神经网络模型的输入。
[0095]
主成分相关表达式如下:
[0096][0097]
其中:e
i
=[e
i1
,e
i2
,

,e
ip
],e
ip
为初始变量相关矩阵的第i个特征值对应的p维特征向量;x为p维的初始输入变量,x=[x1,x2,...,x
p
]
t

[0098]
算例分析
[0099]
选取某分布式光伏电站的十天内每天7:00

18:00时间内的历史环境监测数据,包括该光伏电站的湿度、辐射值、温度、气压等因素和对应功率数据,每相隔十五分钟为一个时间节点样本。如图11,在进行系统聚类后,选取相应的相似样本集作为主成分分析的输入量,进行提取主成分等后续步骤。将整理后的历史数据输入主成分分析模型,进行主成分分析,得到的协方差矩阵特征值、方差贡献率和累计贡献率如下表所示:
[0100][0101]
由上表可知,前四个特征值的累计贡献率已经到达了89.56%(大于85%),所以选择这4个主成分作为rbf神经网络功率预测的输入量,由表可求得四个主成分所对应的特征向量。
[0102]
预测结果分析
[0103]
根据四个主成分的特征向量可求解出相应的表达式,并将表达式代入历史数据进行计算,得到四个主成分,将主成分输入至rbf神经网络预测模型中,进行功率预测。为达到对照效果,将未进行主成分分析的原数据作为输入量输入至rbf神经网络预测模型中运行。预测结果如图12所示。
[0104]
对预测结果进行相关指数计算,计算结果如下表所示:
[0105][0106]
由上表可知,对历史数据进行主成分分析,提取主成分并输入至rbf神经网络预测模型后,预测曲线的拟合优度、预测结果数值的稳定程度、预测结果数值的准确性方面均优于直接输入原始数据进行预测的结果,并且采用主成分分析后,本次算例分析的输入量由8个环境因素减少为4个主成分,显著降低了输入数据的维度,成功减小了数据的冗余度,提高了运行速度。
[0107]
综合分析
[0108]
基于对系统聚类的相关研究分析结果,本章选取依据样本距离划分时样本距离最小的分组a组作为相似样本集。将各个时间节点样本的多项环境因素变量代入主成分表达式中,可求得相应的主成分,将所得主成分作为rbf神经网络功率预测模型的输入量。
[0109]
对预测结果进行相关指数计算,并与未处理数据时的预测结果进行对比,结果如下表所示:
[0110][0111]
综上所述,可以得出:系统聚类与主成分分析综合影响下的功率预测结果相比分析处理前的初始状态有着更好的预测效果。
[0112]
本发明还提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本发明所述分布式光伏电站出力预测方法的步骤。
[0113]
本发明分布式光伏电站出力预测方法可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd

rom、光学存储器等)上实施的计算机程序产品的形式。本发明分布式光伏电站出力预测方法如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
[0114]
基于这样的理解,在示例性实施例中,还提供了一种计算机可读存储介质,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于该计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读存储介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实
现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。其中,所述计算机存储介质可以是计算机能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器(例如软盘、硬盘、磁带、磁光盘(mo)等)、光学存储器(例如cd、dvd、bd、hvd等)、以及半导体存储器(例如rom、eprom、eeprom、非易失性存储器(nandflash)、固态硬盘(ssd))等。
[0115]
在示例性实施例中,还提供计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述分布式光伏电站出力预测方法的步骤。处理器可能是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor、dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field

programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
[0116]
需要说明的是,以上所述仅为本发明实施方式的一部分,根据本发明所描述的系统所做的等效变化,均包括在本发明的保护范围内。本发明所属技术领域的技术人员可以对所描述的具体实例做类似的方式替代,只要不偏离本发明的结构或者超越本权利要求书所定义的范围,均属于本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献