一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于机器学习的光伏功率短期预测方法、装置及存储介质与流程

2022-02-22 03:21:00 来源:中国专利 TAG:


1.本发明属于电网光伏发电预测技术领域,更具体地,涉及一种基于机器学习的光伏功率短期预测方法、装置及存储介质。


背景技术:

2.在新能源补贴退坡、平价时代即将到来之际,新能源场站业主面临的挑战更加严峻,一面是补贴减少带来的直观经济收益差异,一面是严格的考核给场站带来的经济负担。只有持续不断地优化预测技术和服务水平,提升预测精度,才能真正减少考核,为场站带来更大的收益空间。
3.目前我国关于功率预测与控制技术的标准相对陈旧,多采用传统的物理和统计方法,物理方法基于太阳辐照传递方程、光伏组件运行方程等物理方程进行预测,需要光伏电站详细的地理信息以及气象和太阳辐照数据,不需要大量的历史数据,建模过程复杂,且难以模拟一些极端异常天气情况和光伏组件参数随时间发生的缓慢变化的情况,模型抗干扰能力较差,鲁棒性不强。对采集数据和预测数据多项指标的要求规范还不够细致和具体,在应对新能源快速规模化并网,解决新能源消纳,平衡新能源波动等问题,亟待需要进行标准更新,以适应新能源的快速发展。
4.综上,亟待开发一种精准的光伏功率预测技术,用以直接助力新能源的科学规划与合理应用。


技术实现要素:

5.本技术提供一种基于机器学习的光伏功率短期预测方法、装置及存储介质,解决现有技术在短期条件下,光伏功率预测准确度不够的技术问题。
6.为了达到上述目的,本发明的技术方案如下:
7.第一个方面,本发明实施例提供一种基于机器学习的光伏功率短期预测方法,包括:
8.历史数据整合:从光伏电站一定时空尺度下收集数据,并以时间作为索引将它们整合为时间序列数据;
9.数据集预处理:将数据中连续取值的特征进行分箱处理,并进行缺失值和异常值的数据清洗;
10.时序趋势分解:利用趋势分解法将光伏历史功率的时序数据进行趋势分解,将其分解为长期趋势项、季节变动项、循环变动项和随机波动项;
11.最优特征筛选:使用基于岭回归的递归特征消除方法进行最优特征筛选;
12.机器学习建模:分别对长期趋势项、季节变动项、循环变动项建立机器学习回归预测模型,使用均方误差指标进行模型效果的评估;对随机波动项使用自回归模型拟合并进行白噪声检验;
13.预测趋势融合:对模型预测结果进行趋势融合,完成光伏功率的短期预测。
14.第二个方面,本发明实施例提供一种基于机器学习的光伏功率短期预测装置,包括:
15.历史数据整合模块,用于从光伏电站一定时空尺度下收集数据,并以时间作为索引将它们整合为时间序列数据;
16.数据集预处理模块,用于将数据中连续取值的特征进行分箱处理,并进行缺失值和异常值的数据清洗;
17.时序趋势分解模块,用于利用趋势分解法将光伏历史功率的时序数据进行趋势分解,将其分解为长期趋势项、季节变动项、循环变动项和随机波动项;
18.最优特征筛选模块,用于使用基于岭回归的递归特征消除方法进行最优特征筛选;
19.机器学习建模模块,用于分别对长期趋势项、季节变动项、循环变动项建立机器学习回归预测模型,使用均方误差指标进行模型效果的评估;对随机波动项使用自回归模型拟合并进行白噪声检验;
20.预测趋势融合模块,用于对模型预测结果进行趋势融合,完成光伏功率的短期预测。
21.第三个方面,本发明实施例提供一种基于机器学习的光伏功率短期预测的电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所提供的方法的步骤。
22.第四个方面,本发明实施例提供一种基于机器学习的光伏功率短期预测的存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。
23.本发明的有益效果如下:
24.1.本发明采用趋势分解与机器学习算法实现对光伏电站一定时空尺度下的多维度数据进行整合清洗,然后使用时序数据趋势分解法进行功率数据的趋势分解,并对比使用多种机器学习回归算法和自回归模型进行各趋势项的建模预测,最后结合分解模型对预测结果进行趋势预测融合,完成光伏功率的短期预测。
25.2.与传统的物理和统计方法相比,本发明:1)对功率数据分解后的各趋势项分别建模,有效提高预测精度;2)为新能源场站业主带来更精准的功率预测和更大的收益空间;3)更好的适应新能源快速发展,直接助力新能源的科学规划与合理应用。
附图说明
26.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
27.图1是本发明一种实施例的整体流程示意图;
28.图2是本发明一种实施例的趋势分解与机器学习建模的流程示意图;
29.图3是本发明一种实施例的装置示意图;
30.图4是本发明一种实施例的电子设备的实体结构示意图。
具体实施方式
31.下面通过具体实施方式结合附图对本发明作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中,很多细节描述是为了使得本技术能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本技术相关的一些操作并没有在说明书中显示或者描述,这是为了避免本技术的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
32.另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
33.本文中为部件所编序号本身,例如“第一”、“第二”等,仅用于区分所描述的对象,不具有任何顺序或技术含义。而本技术所说“连接”、“联接”,如无特别说明,均包括直接和间接连接(联接)。
34.本发明的目的是提供基于趋势分解与机器学习的光伏功率短期(6小时-1天)预测方法,基于光伏电站一定时空尺度下的历史功率、气候、气象、地理位置、电站设计、电气效率、管理运营等数据,首先进行数据整合与清洗,然后通过时序分析算法对光伏电站历史功率数据进行趋势分解,并对分解后的各趋势项训练机器学习预测模型,最后将各趋势项的预测结果依据分解模型进行趋势融合,完成对光伏功率的短期预测。
35.趋势分解是一种有效的处理时间序列数据的方式,时间序列数据通常有很多种潜在模式,趋势分解是将时间序列数据分解为四种基础模式:长期趋势项、季节变动项、循环变动项和随机波动项(随机波动项包含时间序列中其它所有信息)。
36.机器学习方法是指从给定的、有限的、用于学习的训练数据集合出发,假设数据是独立同分布产生的;并且假设要学习的模型属于某个函数集合,称为假设空间;应用某个评价准则,从假设空间中选取一个最优模型,使它对已知的训练数据及未知的测试数据在给定的评价准则下有最优的预测;最优模型的选取由算法实现。
37.本发明方法不仅可以为光伏电站控制和保障高比率光伏发电接入电网安全稳定运行提供基础性关键技术,而且通过精准的预测数据可以指导新能源电站合理发电,帮助电网调度优化新能源发电规划等。
38.实施例1:
39.本实施例涉及一种基于机器学习的光伏功率短期预测方法,步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行。如图1,包括以下步骤:
40.步骤s101、历史数据整合:从光伏电站一定时空尺度下的历史功率、气候气象、地理位置、电站设计、电气效率、管理运营等六个方面收集数据,并以时间作为索引将其整合为时间序列数据。
41.光资源和光伏功率影响因素多且影响机理复杂,不同因素在不同环境下对其影响程度不同,因此从多维度收集整合数据。具体的,气候气象数据主要包括大气层外辐照度、
气溶胶光学厚度、太阳天顶角、时空尺度、空气质量指数、空气温度、降水量、湿度等;地理位置数据主要包括场地条件、周边环境、经纬度、地形等;电站设计数据主要包括光伏电池板倾角、自清洁能力、容量设计、放置设计、设备选型、阵列选型等;电气效率数据主要包括逆变器的最大功率点跟踪速度和精度、逆变器启动时间、逆变器温度、组件阵列的转化效率、灰尘的清洁频率、汇流箱的接触电阻和质量、电缆的电阻和温度等;管理运营数据主要包括弃光、清洁方式、清洁频率、调度约束、运营维护等。
42.步骤s102、数据集预处理:对步骤s101处理后的数据,将数据中连续取值的特征进行分箱处理,连续数据的分箱处理是指把一段连续的值按照数据内在统计特征切分成若干段,每一段的值作为一个分类取值,把连续值转换成离散值的过程。
43.对处理后的数据中存在的缺失值,根据数据缺失的原因和类型,使用不同的处理方法,诸如直接删除、替代填充(前值/后值/均值/众数/中位数/插值法等)、拟合填充(回归算法/极大似然估计算法/随机森林算法等)、衍生变量等。
44.对处理后的数据使用统计分析判别数据中是否存在不合理的异常值,对确认存在异常值的情况,可以将其视为数据的内在变现不予处理,也可以根据异常的原因和类型通过直接删除、用均值修正、以处理缺失值的方法进行处理。
45.步骤s103、时序趋势分解:光资源和光伏功率具有较强的昼夜周期性和季节周期性,同时其可在数分钟内实现从满功率到零功率的变化,具有较强的波动性、变化频率快、随机性强,而且影响光资源和光伏功率的各影响因素之间存在一定程度的相互作用,因此采用x-11分解法的乘法模型,将光伏功率的时序数据(y
t
)进行趋势分解,将其分解为长期趋势项(t
t
)、季节变动项(s
t
)、循环变动项(c
t
)和随机波动项(i
t
),具体的模型为:y
t
=t
t
×st
×ct
×it

46.步骤s104、最优特征筛选:对步骤s103处理后的数据设为因变量,以步骤s102处理后的数据作为自变量,通过反复构建ridge(岭回归)模型,选出最好的的特征,把选出来的特征作为候选特征集,然后在剩余的特征上重复这个过程,直到遍历所有特征,过程中特征被消除的次序就是特征的排序,依据排序进行最优特征的筛选。其中,ridge(岭回归)模型能够通过回归系数反映出参数的重要程度,模型倾向于保留更少的特征以减少模型的复杂程度。
47.步骤s105、机器学习建模:对步骤s104处理后的数据,以步骤s103趋势分解后的长期趋势项、季节变动项、循环变动项分别作为因变量,以步骤s104筛选后的特征数据作为自变量,基于自变量和因变量构成的样本数据,按照4:3:3的比例将样本数据划分为训练集、验证集和测试集,在训练集和验证集上分别训练长期趋势项、季节变动项、循环变动项的机器学习回归预测模型,在测试集上使用均方误差(mse,mean squared error)指标进行各模型效果的评估,在确保均方误差达到一定的精度阈值时,完成机器学习的建模。
48.其中,对于按照步骤s103分解出来的随机波动项首先进行自相关检验,根据检验结果对随机波动项进行自回归模型拟合并对模型进行白噪声检验,通过检验后的自回归模型即为随机波动项预测模型。
49.步骤s106、预测趋势融合:对步骤s105处理后的数据,对长期趋势项的预测结果季节变动项的预测结果循环变动项的预测结果和随机波动项的预测
结果按照步骤s103的趋势分解乘法模型进行趋势融合,光伏功率的短期预测结果为:
50.其中趋势分解与机器学习建模部分的流程图如图2所示,具体包括:
51.步骤s201、进行光伏功率数据的时序整合;
52.步骤s202、使用x-11分解方法的乘法模型将功率数据分解为长期趋势项、季节变动项、循环变动项、随机波动项四部分;
53.步骤s203、将气候气象数据、地理位置数据、电站设计数据、电气效率数据、运营管理数据与长期趋势项、季节变动项、循环变动项进行数据匹配并分别建立回归预测模型进行训练与评估,对随机波动项使用自回归建模并进行白噪声检验;
54.步骤s204、最后将长期趋势项预测值、季节变动项预测值、循环变动项预测值、随机波动项预测值依据乘法模型进行趋势融合,完成光伏功率的短期预测。
55.实施例2:
56.本实施例涉及一种光伏功率短期预测的装置,该装置能以硬件或软件方式实现,用于完成光伏功率短期预测方法。如图3所示,所述预测装置100包括历史数据整合模块101,数据集预处理模块102,时序趋势分解模块103,最优特征筛选模块104,机器学习建模模块105、预测趋势融合模块106。
57.历史数据整合模块101,用于从光伏电站一定时空尺度下收集数据,并以时间作为索引将它们整合为时间序列数据;对应实施例1中步骤s101的内容;
58.数据集预处理模块102,用于将数据中连续取值的特征进行分箱处理,并进行缺失值和异常值的数据清洗;对应实施例1中步骤s102的内容;
59.时序趋势分解模块103,用于利用趋势分解法将光伏历史功率的时序数据进行趋势分解,将其分解为长期趋势项、季节变动项、循环变动项和随机波动项;对应实施例1中步骤s103的内容;
60.最优特征筛选模块104,用于使用基于岭回归的递归特征消除方法进行最优特征筛选;对应实施例1中步骤s104的内容;
61.机器学习建模模块105,用于分别对长期趋势项、季节变动项、循环变动项建立机器学习回归预测模型,使用均方误差指标进行模型效果的评估;对随机波动项使用自回归模型拟合并进行白噪声检验;对应实施例1中步骤s105的内容;
62.预测趋势融合模块106,用于对模型预测结果进行趋势融合,完成光伏功率的短期预测;对应实施例1中步骤s106的内容。
63.实施例3:
64.本实施例涉及一种光伏功率短期预测的电子设备,图4为本发明实施例提供的电子设备的实体结构示意图,该电子设备可以包括:处理器(processor)301、通信接口(communications interface)302、存储器(memory)303和总线304,其中,处理器301,通信接口302,存储器303通过总线304完成相互间的通信。处理器301可以调用存储在存储器303上并可在处理器301上运行的计算机程序,以执行上述实施例1提供的光伏功率短期预测方法。例如包括:历史数据整合:从光伏电站一定时空尺度下收集数据,并以时间作为索引将它们整合为时间序列数据;数据集预处理:将数据中连续取值的特征进行分箱处理,并进行
缺失值和异常值的数据清洗;时序趋势分解:利用趋势分解法将光伏历史功率的时序数据进行趋势分解,将其分解为长期趋势项、季节变动项、循环变动项和随机波动项;最优特征筛选:使用基于岭回归的递归特征消除方法进行最优特征筛选;机器学习建模:分别对长期趋势项、季节变动项、循环变动项建立机器学习回归预测模型,使用均方误差指标进行模型效果的评估;对随机波动项使用自回归模型拟合并进行白噪声检验;预测趋势融合:对模型预测结果进行趋势融合,完成光伏功率的短期预测。
65.此外,上述的存储器303中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
66.实施例4:
67.本实施例涉及一种光伏功率短期预测的存储介质,存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
68.可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:历史数据整合:从光伏电站一定时空尺度下收集数据,并以时间作为索引将它们整合为时间序列数据;数据集预处理:将数据中连续取值的特征进行分箱处理,并进行缺失值和异常值的数据清洗;时序趋势分解:利用趋势分解法将光伏历史功率的时序数据进行趋势分解,将其分解为长期趋势项、季节变动项、循环变动项和随机波动项;最优特征筛选:使用基于岭回归的递归特征消除方法进行最优特征筛选;机器学习建模:分别对长期趋势项、季节变动项、循环变动项建立机器学习回归预测模型,使用均方误差指标进行模型效果的评估;对随机波动项使用自回归模型拟合并进行白噪声检验;预测趋势融合:对模型预测结果进行趋势融合,完成光伏功率的短期预测。
69.本领域技术人员可以理解,上述实施方式中各种方法的全部或部分功能可以通过硬件的方式实现,也可以通过计算机程序的方式实现。当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器、随机存储器、磁盘、光盘、硬盘等,通过计算机执行该程序以实现上述功能。例如,将程序存储在设备的存储器中,当通过处理器执行存储器中程序,即可实现上述全部或部分功能。另外,当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序也可以存储在服务器、另一计算机、磁盘、光盘、闪存盘或移动硬盘等存储介质中,通过下载或复制保存到本地设备的存储器中,或对本地设备的系统进行版本更新,当通过处理器执行存储器中的程序时,即可实现上述实施方式中全部或部分功能。
70.以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献