一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于特征工程的光伏发电短期预测方法与流程

2022-10-26 05:05:09 来源:中国专利 TAG:

技术特征:
1.一种基于特征工程的光伏发电短期预测方法,其特征在于:它包括:步骤1、采集历史发电数据和气象数据,并进行数据噪声、数据异常、数据不一致问题的识别及处理;步骤2、利用多项式和数值分析的方法对历史数据进行新特征的构建,通过包裹式和过滤式的方法进行特征提取;步骤3、对所有数据进行z-score标准化和规范化;对历史光伏功率数据进行聚类划分;步骤4、将聚类划分后的二类光伏功率数据及特征组合划分为训练集、验证集和测试集,分别构建lighgbm模型并得到预测结果。2.根据权利要求1所述的一种基于特征工程的光伏发电短期预测方法,其特征在于:步骤1所述数据噪声的处理方法为:将相关特征负值数据进行修正,将辐照度为负值的数据删除,功率为负值的数据修正为0;异常数据的处理,将离群的少量数据设定为异常数据,利用正态分布的95%分位点对辐照度和功率数据的异常值进行剔除,如下公式所示:式中,σ代表数据的标准差,n为样本数量,x
i
表示第i个数据,表示该数据特征下的平均值,根据单侧检验显著性水平0.05对应的标准正态分布的分位数为1.645,式中b代表95%分位点的下界,为数据期望值,即平均值;数据不一致问题的处理方法为:考虑辐照度与功率正相关的关系,设置6.5个单位的辐照度为辐照度阈值,将辐照度达到1.5倍阈值而功率小于功率均值0.5%的数据进行删除;将数据的辐照度划分成若干个足够小的区间,对每个区间内的功率与辐照度比值进行正态分布95%分位点筛选。3.根据权利要求1所述的一种基于特征工程的光伏发电短期预测方法,其特征在于:步骤2所述利用多项式和数值分析的方法对历史数据进行新特征的构建的方法包括:步骤2.1、数据集中包含的基本特征集合有:温度、湿度、压强、风速、风向和辐照度特征,为增加特征间的线形关系,将特征进行二次和三次多项式特征处理,将已有特征的自乘二次和三次以及特征间的互乘二次和三次结果加入到特征集合中;步骤2.2、通过数值分析考虑时间特征和气象数据,将已有特征的日均值、最大值、最小值和极差加入到特征集合,将每条数据所处的月份、该月所处天数、当日日出时长作为新的特征,将日最大辐照度的时间与当日日出时间的差值加入到特征集合中。4.根据权利要求3所述的一种基于特征工程的光伏发电短期预测方法,其特征在于:所述通过包裹式和过滤式的方法进行特征提取的方法为:步骤2.3、通过过滤式方法进行初步筛选,根据下式计算各个特征的皮尔逊相关系数,并设置筛选阈值为0.2;
式中,n为样本数量,x
i
,y
i
为变量x,y对应的i点观测值,分别为x,y样本的平均数,r即皮尔逊相关系数,其取值情况可以反映x,y两个样本之间的关系;步骤2.4、将数据等距离离散化,对于每一个特征和标签的数据,将连续数值分为10个相等的区间,根据下式计算各个区间中特征的信息增益,提取信息增益前50的特征;相等的区间,根据下式计算各个区间中特征的信息增益,提取信息增益前50的特征;其中gain(a)为信息增益,a代表属性,d代表原有数据集,d
v
代表新增某一条件时,自变量取某一值时对应的样本数目,v即表示新增的某一特征数据;ent(d)为数据的信息熵,m为特征数目,p
i
是标签在某一取值时的频率;步骤2.4、将筛选得到的两个特征集合取并集进行下一步的筛选;步骤2.5、通过前向选择的包裹式方法,筛选出新增某一特征后新的特征子集的信息熵低于之前信息熵3%的特征作为最优新增特征,将最优新增特征增值添加到特征集合中,直至遍历所有的特征集合且特征子集不再变化。5.根据权利要求1所述的一种基于特征工程的光伏发电短期预测方法,其特征在于:对所有数据进行z-score标准化的公式为:其中x
*
为标准化后得到的数据,μ为对应某一特征的平均值,σ为对应某一特征的标准差,标准化得到的数据值落于-1.5到1.5之间,标准化后数据的均值和标准差均为1。6.根据权利要求1所述的一种基于特征工程的光伏发电短期预测方法,其特征在于:规范化的方法为:将数据的时间范围设定为每天的08:00-19:00,时间间隔为15min,对于原始功率数据中在此区间之外的删除,在此区间内开始或最后缺失的设为0,区间内缺失的利用线形插值进行补充。7.根据权利要求1所述的一种基于特征工程的光伏发电短期预测方法,其特征在于:对历史光伏功率数据进行聚类划分的方法为:将一天的功率数据序列作为一个样本数据,根据欧氏距离进行迭代计算;最后将数据集划分为两类,一类的总体功率数值高且日功率数据偏向于正态分布,偏向于各季节晴天天气特征;另一类的总体数据功率数值低且有数值突变,偏向于阴雨天等极端的天气特征。8.根据权利要求1所述的一种基于特征工程的光伏发电短期预测方法,其特征在于:选取均方根误差mse与平均绝对百分比误差mape进行预测结果进行评估,
式中,n表示预测的数据数目,w
i
分别代表第i个预测数据和实际的发电数据;在计算mape时设置选取阈值为3%的日最大功率值;上式中,n为样本数量,与w
i
分别是第i个样本的预测值与真实值。

技术总结
本发明公开了一种基于特征工程的光伏发电短期预测方法,它包括:步骤1、历史发电数据和气象数据,并进行数据噪声、数据异常、数据不一致问题的识别及处理;步骤2、利用多项式和数值分析的方法对历史数据进行新特征的构建,通过包裹式和过滤式的方法进行特征提取;步骤3、对所有数据进行Z-score标准化和规范化;对历史光伏功率数据进行聚类划分;步骤4、将聚类划分后的二类光伏功率数据及特征组合划分为训练集、验证集和测试集,分别构建LighGBM模型并得到预测结果;本发明通过特征工程充分挖掘数据信息,结合基于集成思想的LightGBM模型,较传统方法在不同的气候条件下提高了预测精度和有效性。和有效性。和有效性。


技术研发人员:苏华英 王融融 张俨 王宁 汪明清 王国松 陈锐 陶用伟
受保护的技术使用者:贵州电网有限责任公司
技术研发日:2022.06.16
技术公布日:2022/10/25
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献