一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于光伏功率超短期预测的短临气象预报数据处理方法与流程

2022-05-18 15:45:39 来源:中国专利 TAG:


1.本发明涉及电力工程技术,具体涉及光伏功率预测技术。


背景技术:

2.开发实用的光伏功率超短期预测模型,可以有效减少旋转备用容量、提高电网安全经济运行水平。为了应对大规模光伏发电接入对电网稳定性的影响,国内外各高校及电力企业相继开展了对光伏发电功率超短期预测的研究工作。
3.现有研究者,在研究光伏功率超短期预测技术时可以归纳为以下方法:
4.(1)物理方法:将数值天气预报(numerical weather prediction,nwp)数据(主要包含的数据为:太阳辐射、温度、云量、雨量和风速等)作为输入,研究光伏发电设备特性(包括光伏组件、逆变器等),建立光伏发电功率与nwp数据的对应数学模型,进一步对光伏发电功率进行预测的一种方法。物理模型的输入信息包括以下两部分:

动态信息,由气象部门提供的nwp数据和用于模型输出统计(model output statistics,mos)来减小残差的在线实测数据组成。

静态信息,光伏电站的系统数据,如光伏组件安装的地理位置、光电转换效率等。关于物理模型,目前比较完善的有晴天ashrae模型、hottel模型、rest模型、有云天气nielsen模型及云遮系数模型等。
5.物理方法依赖详细的电站地理信息和准确的气象数据,并且物理公式本身存在一定的误差,模型抗干扰能力差,鲁棒性不强,准确性低、参数选取复杂等缺点。
6.(2)统计方法:不考虑太阳辐射变化的物理过程,通过输入太阳辐射、光伏发电出力等历史数据找出内在规律,排除病态数据点,建立历史数据与输出功率的函数映射关系,进一步对光伏发电功率预测的一种方法。常见的统计学方法有时间序列法、回归分析法、灰色理论、模糊理论和时空关联法等。国内外具体的研究案例为:意大利的mellit等人,提出的自适应小波网络方法对里雅斯特市一座20kw并网光伏电站逐小时光伏发电量进行预测。
7.统计学方法在预测时往往需要收集和处理大量的历史数据,所以增加了数据获取和处理的难度,而且在参数估计部分需要人工进行设置调试,十分耗时;
8.(3)人工智能方法:需要大量的历史观测数据建立一种输入与输出的映射关系,主要应用于非线性映射模型,常见的方法有神经网络、支持向量机、卡尔曼滤波算法、马尔科夫链、粒子群算法和遗传算法等。国内外具体的研究案例为:日本ruckus大学atsushi yona等人将预测前18小时的气压、温度、相对湿度、风速等作为神经网络输入,分别利用前馈神经网络、径向基神经和递归神经网络对太阳辐照量进行预测,得出太阳能发电系统的输出功率;我国合肥工业大学丁明等人提出了一种基于马尔可夫链的直接预测光伏电站功率的方法。
9.人工智能方法与统计类方法相同,往往需要收集和处理大量的历史数据,而且模型学习过程中容易出现过学习和易陷入局部最优解的缺陷。
10.光伏功率超短期预测是逐15分钟对未来15分钟到4小时的功率进行预测。光伏功率超短期预测的重要作用在于提高光伏电站的出力可预测性,为光伏电站制定合适的发电
计划并且为电网优化调度提供有力的技术支持,缓解电力系统高峰、调频压力,使电网在安全、高效运行的同时,从光伏电站尽可能多的接受电能。同时,光伏功率超短期预测在电站发电量预估、检修计划制订以及智能运维等方面都发挥着重要的作用。因此,高效准确地实现光伏功率超短期预测十分必要。
11.对于现有的光伏功率超短期预测技术,具有以下缺点:
12.(1)使用统计方法和人工智能方法构建光伏功率超短期预测模型时,都需要将大量历史的光伏功率、辐射数据作为建模基础,历史实况数据严重不足,会导致光伏功率超短期预测准确率不高。
13.(2)采用物理方法构建的光伏功率超短期预测模型中使用数值天气预报nwp数据,其时间和空间尺度都相对较低(如欧洲气象中心模式数据),这种数据无法有效的体现分钟级或小时级气象要素对光伏站出功功率的影响,这就造成由于获取的光伏站气象预报数据在时空方面的不精确从而影响光伏功率的预测准确度。


技术实现要素:

14.针对现有技术存在的历史光伏功率、辐射数据不足以及天气预报不精确导致的光伏功率的预测准确度较低的缺陷,本发明所要解决的技术问题就是提供一种用于光伏功率超短期预测的短临气象预报数据处理方法,为实现高效准确的光伏发电功率超短期预测提供数据支撑。
15.为解决上述技术问题,本发明采用如下技术方案:用于光伏功率超短期预测的短临气象预报数据处理方法,包括如下步骤:首先,通过卫星反演辐射模型,补充光伏电站历史辐射数据的不足情况;然后,利用卫星外推技术获得分钟级卫星外推云图,为光伏功率超短期预测提供高精度的短临气象预报数据。
16.优选的,卫星反演太阳辐射的过程包括以下步骤:
17.首先,通过晴空模型计算晴空辐照度;
18.然后,用卫星数据通过heliosat模型计算云指数进而计算晴空指数,来量化云层的削弱效应;
19.最后,通过heliosat模型结合晴空辐照度和晴空指数得出太阳辐射数据。
20.优选的,以0.7μm为界限划分波段带,波段1覆盖紫外和可见光,从0.29μm到0.70μm,波段2覆盖0.7μm至4μm的近红外波段,利用最新的地外光谱能量分布和最新的太阳常数1366.w/m2,两个波段平均日地距离的大气外辐照度分别为e
0n1
=635.4w/m2和e
0n2
=709.7w/m2,
21.对于每一个波段i,波段直射辐照度e
bni
由单个透射率的乘积得到的:
22.e
bni
=t
ri
t
gi
t
oi
t
ni
t
wi
t
aie0ni
23.式中,t
ri
、t
gi
、t
oi
、t
ni
、t
wi
、t
ai
分别为瑞利散射、均匀混合气体吸收、臭氧吸收、二氧化氮吸收、水蒸气吸收和气溶胶消光的透射率;
24.之后将两个波段的成分相加,得到直射辐照度:
25.e
bn
=e
bn1
e
bn2
26.对于每个波段,考虑地面和大气之间的多次反射得到后向散射分量eddi为:
27.e
ddi
=ρ
gi
ρ
si
(e
bi
e
dpi
)/(1-ρ
gi
ρ
si
)
28.ρ
s1
=[0.13363 0.00077358α1 β1(0.37567 0.22946α1)/(1-0.10832α1)]
[0029]
/[1 β1(0.84057 0.68683α1)/(1-0.08158α1)]
[0030]
ρ
s2
=[0.010191 0.00085547α2 β2(0.14618 0.062758α2)/(1-0.19402α2)]
[0031]
/[1 β2(0.58101 0.17426α2)/(1-0.17568α2)]
[0032]
其中ebi=ebni
×
cosz,各波段的总漫射辐照度为edi=edpi eddi,得到漫射辐照度为ed=ed1 ed2,全局辐照度为eg=eb ed。
[0033]
优选的,heliosat模型将晴空模型与云指数相结合,云指数定义如下:
[0034][0035]
晴空指数定义为实际水平辐照度与晴空水平辐照度的比值,即:
[0036][0037]
其中,ρ
t
是卫星观测到的表观反射率,最明亮云层的表观反射率,为地表反射率,g和gc分别为实际地表辐照度和晴空辐照度;
[0038]
最后,建立晴空指数与云反照率之间的经验关系,具体的数值关系为:
[0039][0040]
优选的,卫星外推技术利用历史一段时间内地球同步卫星拍摄的卫星云图,采用卫星外推算法对卫星云图进行外推,最终得到未来几小时逐分钟内云层运动情况,其中,历史卫星云图利用傅里叶变换进行滤波处理。
[0041]
优选的,卫星外推技术采用的外推模型为multi-level correlation lstm,利用历史时序的卫星云图采用编码和解码的方式实现卫星的外推,在前m-1步,模型每一步输入为上一时刻真实的卫星图片,后续模型输入为上一时刻模型预测结果,最后将[m-1,t]步的预测结果作为输出,然后选择损失函数,优化模型。
[0042]
本发明采用上述技术方案,具有如下有益效果:
[0043]
1.实现了卫星反演辐射技术,弥补因辐射监测站少导致的历史实况数据不足情况,为实现高效准确的光伏发电功率预测提供数据支撑。
[0044]
2.通过卫星外推模型得到卫星云图预报数据,即获取分钟级云图信息,为光伏功率超短期预测提供了高精度的短临气象预报数据,为光伏功率超短期预测准确率提供了数据基础。
[0045]
本发明采用的具体技术方案及其带来的有益效果将会在下面的具体实施方式中结合附图中予以详细的揭露。
附图说明
[0046]
下面结合附图和具体实施方式对本发明作进一步描述:
[0047]
图1为本发明的光伏功率超短期预测方法流程图;
[0048]
图2为卫星反演太阳辐射流程图;
[0049]
图3为晴空指数-云指数关系图;
[0050]
图4为卫星外推流程图;
[0051]
图5为光伏功率超短期预测流程图;
[0052]
图6为气象数据质量控制流程图;
[0053]
图7为超短期预测结构图。
具体实施方式
[0054]
下面结合本发明实施例的附图对本发明实施例的技术方案进行解释和说明,但下述实施例仅为本发明的优选实施例,并非全部。基于实施方式中的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得其他实施例,都属于本发明的保护范围。
[0055]
本发明提供了一种基于卫星云图和时空神经网络的光伏功率超短期预测方法,以光伏发电站微气象站采集的辐射和功率数据、快速更新同化数据、卫星数据、时间、地形地貌以及太阳方位角等理论信息为基础,通过数据预处理方法,采用人工智能算法建立超短期预测模型。
[0056]
如图1所示,其主要流程如下:
[0057]
(1)通过卫星反演辐射模型,补充光伏电站历史辐射数据的不足情况,为后续建模提供数据支撑。
[0058]
(2)利用卫星外推技术获得分钟级卫星外推云图,为光伏功率超短期预测提供高精度的短临气象预报数据。
[0059]
(3)基于外推云图、快速更新同化数据、历史电站辐射、功率监测数据、地理信息数据、太阳位置、时间等数据采用时空神经网络算法实现光伏功率超短期预测。
[0060]
1.卫星反演辐射模型
[0061]
光伏发电依赖于光电转换元件,将太阳辐射能转变为电能,因此光伏功率超短期预测依赖于大量的历史太阳辐射监测数据。
[0062]
获取地表太阳辐射的途径主要有三种:地面观测、数值模拟和卫星遥感。每一种都有其优点和不足。地面观测是获得地表太阳辐射最直接、最可靠的方法,对于需要严格数据质量的研究和应用不可或缺。但是,特定点的地面测量不足以描述地表太阳辐射空间分布的模式,特别是在观测地点稀少的偏远地区(例如海面)。以我国为例,全国气象温度监测站分布近万个,而气象辐射监测站分布仅191个,太阳辐射数据的空间分布无法满足建模所需。
[0063]
与地面观测相反,数值模式(如大气环流模式,gcm)可以在区域和全球尺度上生成时空连续的地表太阳辐射地图。它最大的优点是完整性和一致性,这对于长期气候监测和分析尤其重要。在基于数值模型的各种地表太阳辐射产品中,再分析产品是最常见的。典型的再分析产品,如欧洲中期天气预报中心的era-interim再分析产品等,其主要不足在于模型在模拟或预测云量时误差较大。因此,地表太阳辐射产品的质量,特别是高时间分辨率产品,其准确度值得怀疑。
[0064]
卫星遥感具有捕捉云层空间分布和动态演变的能力,为监测和估算地表太阳辐射提供了独特的手段。与数值模拟相比,卫星遥感是获得区域甚至全球地表太阳辐射的更好方法。一方面,卫星反演可以为光伏厂提供大量的历史太阳辐射数据为构建预测模型提供数据支撑,另一方面,可以基于卫星外推得到的数据实现太阳辐射的预测,以及得到短临的
云等要素的预报数据,从而为光功率的预测奠定基础。
[0065]
本实施方式在卫星反演辐射模型中主要用到风云卫星和葵花8卫星数据。
[0066]
收集到卫星反演太阳辐射模型中所需要的卫星数据后,进行模型的构建。
[0067]
本发明的卫星反演太阳辐射模型主要通过模拟太阳辐射从大气外到地表的过程而实现的。太阳辐射量到达地表需要经过很长的一段旅程,所以,在卫星反演辐射模型构建的时候需要将地球外层太阳辐射与地球大气、表面和物体之间的相互作用考虑进去。同时云作为强度最大的地表太阳辐射调节器(远强于其他大气成分),在地表太阳辐射估算中起着关键作用。鉴于云对地表太阳辐射的决定性影响,地表太阳辐射的估算在一定程度上是围绕着如何准确地考虑云在大气中的辐射衰减(云散射和云吸收)进行的。
[0068]
卫星反演太阳辐射的过程如图2所示,主要分为以下步骤:
[0069]
首先,通过晴空模型计算晴空辐照度。然后,用卫星数据通过heliosat模型计算云指数进而计算晴空指数,来量化云层的削弱效应。最后,通过heliosat模型结合晴空辐照度和晴空指数得出太阳辐射数据。
[0070]
(1)晴空辐射
[0071]
在晴空条件下的各种大气成分中,臭氧、水蒸气和气溶胶是对地表太阳辐射的影响较大的三个关键成分。大气气溶胶是指大气分子及悬浮在大气中的固体和液体微粒组成的多相体系,其粒径的尺度大小分布于0.001~100μm。其中,用于描述气溶胶对光的衰减作用的大气气溶胶光学厚度(aod)数据对模型的精度影响极大。aod的定义为大气介质的消光系数在垂直方向上从地表到大气层顶的积分,其值越高表示气溶胶对光的衰减作用越强,大气能见度越低。
[0072]
给出了波长λ对应的aod的计算方式为:
[0073]
τ
λ
=βλ-α
[0074]
式中,β代表浊度系数,与大气气溶胶的浓度有关,α代表波长指数,与大气气溶胶中的粒径分布有关。
[0075]
rest2是一种利用大气数据估计无云天空辐照度和光合有效辐射(par)的高性能模型。其推导过程使用了双波段带方案,模型特别注意准确地解释气溶胶对晴空辐射的影响。
[0076]
rest2以0.7μm为界限划分波段带。波段1覆盖紫外和可见光,从0.29μm到0.70μm,其特征是在紫外波段范围内被臭氧强烈吸收,在整个波段上被分子和气溶胶强烈散射。波段2覆盖0.7μm至4μm的近红外波段,其特征是对水蒸气、二氧化碳等气体的强吸收,散射有限。这种建模方法提高了估计晴空辐射的精度。
[0077]
利用最新的地外光谱能量分布和最新的太阳常数1366.w/m2,两个波段平均日地距离的大气外辐照度分别为e
0n1
=635.4w/m2和e
0n2
=709.7w/m2。
[0078]
对于每一个波段i,波段直射辐照度e
bni
可以由单个透射率的乘积得到的:
[0079]ebni
=t
ri
t
gi
t
oi
t
ni
t
wi
t
aie0ni
[0080]
式中,t
ri
、t
gi
、t
oi
、t
ni
、t
wi
、t
ai
分别为瑞利散射、均匀混合气体吸收、臭氧吸收、二氧化氮吸收、水蒸气吸收和气溶胶消光的透射率。每一种成分的透射率通过比较准确的参数化方案模拟,只引入了很小的误差。
[0081]
之后将两个波段的成分相加,得到直射辐照度:
[0082]ebn
=e
bn1
e
bn2
[0083]
散射辐照度的计算基于双层散射方案。顶层假定为所有瑞利散射,以及所有臭氧和混合气体吸收的来源。同样地,假定底层是所有气溶胶散射,以及气溶胶、水蒸气和二氧化氮吸收的来源。
[0084]
在正常情况下,由于反射的地球表面和大气散射层之间的相互作用,必须增加后向散射贡献。这一贡献通常很小,但在积雪地区可能会变得特别重要。对于每个波段,考虑地面和大气之间的多次反射得到后向散射分量eddi为:
[0085]eddi
=ρ
gi
ρ
si
(e
bi
e
dpi
)/(1-ρ
gi
ρ
si
)
[0086]
ρ
s1
=[0.13363 0.00077358α1 β1(0.37567 0.22946α1)/(1-0.10832α1)]
[0087]
/[1 β1(0.84057 0.68683α1)/(1-0.08158α1)]
[0088]
ρ
s2
=[0.010191 0.00085547α2 β2(0.14618 0.062758α2)/(1-0.19402α2)]
[0089]
/[1 β2(0.58101 0.17426α2)/(1-0.17568α2)]
[0090]
其中ebi=ebni
×
cosz,各波段的总漫射辐照度为edi=edpi eddi,得到漫射辐照度为ed=ed1 ed2,全局辐照度为eg=eb ed。
[0091]
(2)heliosat模型
[0092]
为解决各种天气条件下高效、准确地估算太阳辐射这一问题,以往许多研究将大量的大气和地表参数作为辐射传输模型的输入以考虑云对辐射的影响。虽然这些模型具有明确的物理过程,但由于涉及的变量多,计算量大,使得最终结果的空间分辨率受到了限制。与此不同的是,heliosat方法选择云反照率作为云衰减效应综合指标,尝试利用整个大气层的综合特性来确定云的影响,不需要大气层垂直结构假设,计算效率更高,因而得到了广泛的应用。
[0093]
heliosat采用了一个半参数化的太阳辐射模型,且采用了卫星数据来识别云特性,计算方案中还考虑了多数太阳辐射的大气衰减过程,也采用了一些输入的物理参数。因此,此计算方案可充分模拟实际状况。其估算效果普遍优于全球能量和水循环实验、era再分析数据等辐射产品。
[0094]
heliosat模型将晴空模型与“云指数”相结合。云指数方法基于以下假设:在像素上出现云会导致可见图像的反射率增加;大气对一个像素的下行短波辐照度的衰减,与在无云天空下应观测到的反射率与当前观测到的反射率之间的变化幅度有关。这种变化的幅度可以通过引入云指数和晴空指数来进行表征。
[0095]
云指数定义如下:
[0096][0097]
晴空指数定义为实际水平辐照度与晴空水平辐照度的比值,即:
[0098][0099]
其中ρ
t
是卫星观测到的表观反射率。最明亮云层的表观反射率,为地表反射率,g和gc分别为实际地表辐照度和晴空辐照度。最后,建立晴空指数与云反照率之间的经验关系,如图3所示。
[0100]
具体的数值关系为:
[0101][0102]
整个计算过程需要用到的数据如表1:
[0103]
表1反演模型数据表
[0104][0105]
采用本发明卫星反演辐射技术得到的晴天、多云、阴天条件下的地表太阳辐射的实际案例,并采用日均方根误差计算公式对反演效果进行评估。
[0106][0107]
其中,p
mi
为i时刻的实际功率,p
pi,t
为i时刻超短期预测值,n=144为样本个数(卫星逐10分钟数据)。
[0108]
通过检验效果分析,对于分钟级气象变化导致的太阳辐射变化也可以通过卫星反演技术呈现出来,这样可以很好的弥补电站辐射数据的不足,并利于有效提高光伏功率超短期预测准确率。
[0109]
2.卫星外推模型
[0110]
云是影响太阳辐射和光功率的主要气象要素之一,而且光伏功率超短期预测的难度主要表现在:(1)太阳运动规律与大气状态波动共同作用导致辐照度波动特性复杂,日内小时级变换难以把握;(2)云团生消运动造成地表辐照度快速剧烈变化,多云天气下光伏出力呈现分钟级无关心突变。因此,在光伏功率超短期预测模型中采用卫星外推技术实现分钟级云图预测,可以有效获取精准的短临气象预报数据,从而提高超短期预测准确率。
[0111]
卫星外推过程为利用历史一段时间内地球同步卫星拍摄的卫星云图(葵花8、风云4)采用卫星外推算法对卫星云图进行外推,最终得到未来几小时逐分钟内云层运动情况。
[0112]
如图4所示,卫星外推步骤主要为:数据质量控制和外推模型的构建。
[0113]
2.1数据质量控制
[0114]
数据质量控制,是指对收集到的卫星云图存在的噪声以及除坏线和条带等问题进行预处理。若将存在噪声的卫星云图输入到外推模型中,不仅不会提升外推的准确率反而会降低其外推效果。因此,对收集到卫星云图进行数据质量控制十分重要,一般利用傅里叶变换进行滤波处理,以减少卫星云图中周期性噪声、尖锐性噪声、除坏线和条带情况。
[0115]
2.2卫星云图外推模型
[0116]
目前最常用的外推模型以光流法为主,但光流法的3个约束条件(亮度一定、小运动、空间一致)导致光流法的外推可以预测卫星云图的运动轨迹,但无法预测云层厚度大小变化。根据人工智能在气象行业的最新研究,发现基于深度学习算法的外推模型既可以实现轨迹的预测又能有效实现云层大小厚度的预测。
[0117]
本发明中外推模型主要采用multi-level correlation lstm(mlc-lstm),其核心为convlstm,mlc-lstm是利用历史时序的卫星云图采用编码和解码的方式实现卫星的外推。在前m-1步,模型每一步输入为上一时刻真实的卫星图片,后续模型输入为上一时刻模型预测结果。最后将[m-1,t]步的预测结果作为输出,然后选择损失函数,优化模型。
[0118]
mlc-lstm模型核心是convlstm,convlstm主要是将lstm内部的乘积操作换成了卷积操作,即使其在输入到状态和状态到状态转换中都具有卷积结构,这样就更加适用于时空数据的处理。经过研究发现,convlstm网络能够更好地捕捉时空相关性,并始终优于fc-lstm。
[0119]
3.光伏功率超短期预测模型
[0120]
光伏功率超短期预测模型的构建是基于卫星外推云图、快速更新同化数据、dem高程数据、时间、理论太阳位置等数据融合,输入到时空神经网络算法模型中进行预测,最终得出未来4小时逐15分钟超短期功率预测结果。
[0121]
如图5所示,光伏功率超短期预测主要步骤为:
[0122]
(1)收集预测模型所需数据,并进行数据质量控制,以保证建模时使用的数据为干净,可靠数据,保证模型预测的准确性;
[0123]
(2)对数据质量控制后的数据,采用pearson相关系数分析和主成分分析pca相结合的方式,实现特征工程和特征选择,以提取有用特征,减少特征冗余,降低模型预测模型结构和时间复杂度,保证高效的进行模型预测;
[0124]
(3)采用3dconv_lstm网络结构从时空角度实现功率预测,进一步保证超短期功率预测的准确率。
[0125]
3.1数据质量控制
[0126]
在收集到的数据集中包含了自动站观测数据以及快速更新同化更新数据,在自动站观测数据和模式数据中会存在多种异常值、缺失值。因此需要对数据集中所有数据进行相应的预处理,以保证建模时使用的数据为干净,可靠数据,保证模型预测的准确性,数据的质量控制。
[0127]
气象数据的质量控制,其总流程如图6所示:
[0128]
(1)界限值检查:关于界限值的检查,按其特性分为气候学界限值检查和区域界限值检查。对于不属于界限值范围内的数据,将其当作异常数据对其做不录入数据库处理。界限值范围的上限值设定得是否合理决定了界限值检查的效果。如果上限值设定的太高,则错误的数据有可能被当作正确数据处理,从而导致了错误数据在应用中的使用;上限值设定的太低,则个别偏大值的正确数据又可能会被作为错误数据处理,恰恰这个数据正是对于研究极端天气和气象预警非常有帮助。
[0129]
(2)时间一致性检查:时间一致性检查是利用气象要素随时间的变化而具有一定的规律,在相对较短的时间内不会出现大幅跳变的特性,对气象自动站相应要素值变化是
否符合这种规律的一种检验方法。各气象要素采样值不能超出一定时间内的变化范围,超出的数据为可疑资料。
[0130]
(3)内部一致性检查:根据气象学原理,内部一致性检查是利用气象要素不同值的物理特性联系,判断其是否符合一定的规律,通过一个变量的观测值来判定另一个变量同时刻的观测值是否可信。不仅能够检测出错误,还能检测出可能出现的错误。
[0131]
(4)空间一致性检查:空间一致性检查是根据气象参数具有一定的空间分布特点,利用单站和其他相邻台站地理环境等因素的相似性造成气象要素存在相似性的特性,对本站气象要素进行正确与否检验的一种方法。根据气象要素的空间分布规律,将某个站的数据与相邻近的站点同时观测的气象要素数据值进行比较或利用邻近测站观测值通过一定的插值方法计算出被检查站点的估计值,然后对观测值与估计值进行比较,如果均为正偏差或均为负偏差,并且偏差幅度超过历史上限,则将该记录标记为可疑,报警提示人工确定,若偏差幅度超过历史上限两倍,则按缺测处理。
[0132]
采用上述流程对气象数据进行检验,不符合标准的记为异常值。对待异常值,如果异常值较多,可以直接删除,如果异常值不多,可以当作缺失值处理,需进一步处理。
[0133]
本发明中采取k近邻法来处理缺失值,确保数据的高质量,以便后期的使用。k近邻法即为通过距其最近的k个邻居来估计缺失值,各个邻居对应的权重基于该邻居到具有缺失值样本的距离加权得到,这里的距离一般选取欧几里得距离。来处理缺失值有两种情况:如果缺失值是离散的,使用k近邻分类器,投票选出k个邻居中最多的类别进行填补;如果为连续变量,则用k近邻回归器,拿k个邻居中该变量的平均值填补。
[0134]
3.2特征工程和特征选择
[0135]
在现有的数据集中已有的特征变量不够多,或者已有的特征变量不足以充分表征数据的特点,若根据少部分的特征进行建模并不能预测出好的效果,此时就需要进行特征工程来产生能够表征数据特点的新特征变量或者对已有的特征变量进行一种变换。
[0136]
采用pearson相关系数分析和主成分分析pca相结合的方式,通过线性投影,将高维的数据映射到低维的空间中表示,并期望在所投影的维度上数据的方差最大,以此使用较少的数据维度,同时保留住较多的原数据点的特性。
[0137]
pca算法流程:对原始d维数据集做标准化;构造样本的协方差矩阵;计算协方差矩阵的特征值和相应的特征向量;选择与前k个最大特征值对应的特征向量,其中k为新特征空间维度(k《=d);通过前k个特征向量构建映射矩阵w;通过映射矩阵w将d维的输入数据集x转换到新的k维特征子空间。当各气象特征经过pca变换后其物理意义并不存在,仅表示一个数值。
[0138]
表2为原始数据特征经过pearson相关系数和pca算法后得到的最终特征。由于经过pca变换之后的特征因为没有物理意义,所以不做详细列表说明。
[0139]
表2超短期功率预测模型数据表
[0140][0141]
3.3超短期时空预测模型
[0142]
如图7所示,超短期预测模型以光伏电站实时运行数据和自动气象站监测数据、卫星云图外推数据以及快速更新同化模式数据、时间等数据为输入,采用3dconv_lstm网络结构进行预测,输出未来4小时逐15分钟的光伏功率预测值。3dconv_lstm网络结构分为两部分:
[0143]
(1)采用3dconv网络结构进一步提取光伏预测时所需要的时空特征;
[0144]
(2)将提取的时空特征向量,输入到lstm单元中,构造时空特征与光伏功率的非线性映射关系,并基于该非线性映射关系实现未来4小时逐15分钟的功率预测。
[0145]
(1)3dconv网络
[0146]
3dconv网络非常适合于时空特征学习。与2dconv网络相比,3dconv网络能够通过3d卷积和3d池化操作更好地建模时间信息。在3dconv网络中,卷积和池化操作在时空上执行,而在2dconv中,它们仅在空间上完成。
[0147]
2)lstm网络
[0148]
长短期记忆网络(lstm)是循环神经网络的一个变体,通过引入线性连接和门控机制,可以有效地解决简单循环神经网络的梯度爆炸或消失问题,整个网络可以建立较长距离的时序依赖关系。
[0149]
lstm网络引入一个新的内部状态c_t专门进行线性的循环信息传递,同时非线性地输出信息给隐藏层的外部状态h_t。
[0150][0151][0152]ht
=o
t

tanh(c
t
)
[0153]
其中f
t
,i
t
,o
t
分别为遗忘门、输入门和输出门,用来控制信息传递的路径,

为向量元素乘积,c
t-1
是上一时刻的记忆单元,是通过非线性函数得到的候选状态。三个门的作用分别是:遗忘门f
t
控制上一个时刻的内部状态c
t-1
需要遗忘多少信息;输入门i
t
控制当前时刻的候选状态有多少信息需要保存;输出门o
t
控制当前时刻的内部状态c
t
有多少信息需要输出给外部状态h
t
。当f
t
=0,i
t
=1时,记忆单元将历史信息清空,并将候选状态向量写入。但此时记忆单元c
t
依然和上一时刻的历史信息相关。当f
t
=1,i
t
=0时,记忆单元将复制上一时刻的内容,不写入新的信息。
[0154]
三个门的计算方式为:
[0155]it
=σ(wix
t
u
iht-1
bi)
[0156]ft
=σ(wfx
t
ufh
t-1
bf)
[0157]ot
=σ(wox
t
u
oht-1
bo)
[0158]
循环神经网络中的隐状态h存储了历史信息,可以看作是一种记忆(memory)。在简单循环网络中,隐状态每个时刻都会被重写,因此可以看作是一种短期记忆(short-term memory)。在神经网络中,长期记忆(long-term memory)可以看作是网络参数,隐含了从训练数据中学到的经验,并更新周期要远远慢于短期记忆。而在lstm网络中,记忆单元c可以在某个时刻捕捉到某个关键信息,并有能力将此关键信息保存一定的时间间隔。记忆单元c中保存信息的生命周期要长于短期记忆h,但又远远短于长期记忆,因此称为长的短期记忆(long short-term memory)。
[0159]
lstm优点:
[0160]
在一块内存块中lstm能够做到常量误差传递,以及在不同时序阶段中通过输入门和遗忘门的控制能够使得误差极大化向后传递,最终使得lstm能够解决较长的依赖问题。
[0161]
lstm能够处理噪声、连续型输入以及分布式表示等问题。
[0162]
lstm泛化能力较其他模型强。
[0163]
不需要细粒度参数调优,而且计算复杂度和rnn一致。
[0164]
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,熟悉该本领域的技术人员应该明白本发明包括但不限于附图和上面具体实施方式中描述的内容。任何不偏离本发明的功能和结构原理的修改都将包括在权利要求书的范围中。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献