一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于高维网格化和LightGBM的风电预测方法及装置与流程

2021-10-27 14:11:00 来源:中国专利 TAG:风电 网格 装置 预测 方法

基于高维网格化和lightgbm的风电预测方法及装置
技术领域
1.本发明属于风电领域,特别是涉及到一种基于高维网格化和lightgbm的风电预测方法及装置。


背景技术:

2.风力发电是一种具有很大发展潜力的新能源发电方式,清洁无污染,极具商业化发展前景,但是,由于风力发电具有明显的间歇性和波动性,并网后严重影响电网电能质量,同时,随着风电并网容量的逐年攀升,风力发电对电网的影响日益严重,为减少风电对电网的冲击,保护电网稳定运行,调度机构不得不在必要时对风电场采取限制并网的措施,造成风能消纳问题。提前对风电功率进行准确预测,可以缓解电力系统调峰压力,有效提高风电并网的能力。因此,风电功率预测对风风力发电的可持续发展起着重要的作用。
3.国内外对风电功率预测方法进行了大量研究,主流方法分为三类统计模型方法、物理模型方法、以及发展迅速的机器学习方法。传统上的统计模型方法旨在利用统计学的方法,通过获取历史风功率数据中与时间和空间相关的关联信息,建立映射关系,进行预测;常用到的统计学方法有时间序列法、回归拟合法、灰色预测法和卡尔曼滤波等。然而统计学模型在平稳时间序列的预测精度较高,对阵风突变情况的预测精度较低,且长期预测的准确性较低。物理模型方法的实质是必须依靠数值天气预报模式的准确率,根据nwp中的风速、风向、气温等气象变量作为输入,修正预报风电场风速,然后根据风电场的功率曲线来推算出风功率的预测值。机器学习方法的核心思想是通过计算机人工智能算法,对大量历史实际数据的训练与学习,捕捉输入的特征向量与输出数据中隐含的规律与逻辑关系,使得模型能做出准确的预测,如人工神经网络(artificial neural network,ann)、支持向量机(support vector machine,svm)等。但是,传统神经网络对长时间序列处理能力较弱,难以有较高的准确度。而支持向量回归算法虽然能够避免陷入局部最优解,但当处理大规模训练样本时会出现收敛速度慢、难以实施的问题。


技术实现要素:

4.本发明提出一种基于高维网格化和lightgbm的风电预测方法及装置,针对风力发电波动性和随机性较强的特点,提供更准确的风功率预测。
5.为达到上述目的,本发明的技术方案是这样实现的:
6.一种基于高维网格化和lightgbm的风电预测方法,包括:
7.s1、将风电机组或风电场中心坐标位置周围的w个网格点的气象要素数据提取出来,以每个气象要素的每个网格点作为一个特征量,所述气象要素包括风速、风向、温度、湿度和压强;
8.s2、将各类气象要素线性插值处理成与功率数据相同时间分辨率的时间序列气象数据,形成多维气象预报数据;其中,风向由x方向风速和y方向风速分别线性插值后计算得到;
9.s3、对风电机组或风电场的实际功率数据进行基于密度分布的功率曲线的预处理,获得有效的实际功率数据;将有效的实际功率数据以及与其对应时间段的多维气象预报数据作为训练数据,调用lightgbm算法,建立预测模型,得到功率预测结果。
10.进一步的,步骤s3中所述得到功率预测结果的具体步骤包括:
11.将获得的有效实际功率数据和对应时间段的多维气象预报数据作为训练数据,调用python库lightgbm算法,网格搜索自动进行参数寻优,建立功率预测模型,得到功率预测结果。
12.进一步的,步骤s3中所述得到功率预测结果的具体步骤包括:
13.将获得的有效实际功率数据所对应的实际风速数据和其对应时间段的多维气象预报数据作为训练数据,调用python库lightgbm算法,网格搜索自动进行参数寻优,建立风速预测模型;将风速预测模型的风速预测结果通过所述基于密度分布的功率曲线转换成功率值,得到功率预测结果。
14.优选的,步骤s3中所述基于密度分布的功率曲线的获取方法包括:
15.(1)采集风电机组或风电场实际历史运行风速、功率,进行初筛处理,去除恒定值和异常值;
16.(2)以风速为横坐标,功率为纵坐标,对风速进行等间隔划分,得到n个风速段,将功率进行等间隔划分,得到m个功率段,最终得到n*m个网格,以网格中心点坐标点代表该网格,即(v
i
,p
j
),其中,i=1,2,...,n;j=1,2,3,...,m;
17.(3)统计实际历史功率落在每个网格点的个数num(i,j),得到二维的功率密度数空间分布情况,取所有网格的非零功率密度数的中位数记为m
edian

18.(4)当风速小于阈值时,对于该区域内的每个风速段内的最大功率空间密度数所对应的网格,如果该网格对应的功率密度数在其纵向或者横向均为最大值,则记录下该网格的中心坐标;
19.(5)当风速大于阈值时,对于该区域内的每个风速段v
i
所对应的各功率段p
i
,从高风功率段开始,即j=m,m-1,...,1,寻找符合以下条件的网格点并记录下该网格点的中心坐标,并进入下一个风速段的寻找;1)num(i,j)等于该功率段下的最大密度数坐标,并进入下一个风速段的寻找;1)num(i,j)等于该功率段下的最大密度数为num(i,j)在i=1,2,...,n时的最大值;2)num(i,j)大于密度数的中位数m
edian

20.(6)根据步骤(4)和(5)获取到的坐标点,得到该风电机组的功率曲线。
21.更进一步的,步骤(6)中根据坐标点得到功率曲线的生成步骤还包括:
22.(601)获取到的一组坐标点(v
k
,p
k
),其中k=1,2,

,q;以风速v
k
从小到大进行排序,将功率递减的坐标点去除,得到一组新的坐标(v
k
,p
k
),其中k=1,2,

,p;
23.(602)从0到30m/s,以0.1m/s为间隔构建风速序列,将(v
k
,p
k
)线性插值到新的风速序列上,得到功率曲线b;
24.(603)将功率曲线b中风速小于k米/秒的功率置为零,k为风机切入风速;
25.(604)将该组数据中的最大功率值和最大风速值作为额定输出功率和额定风速,大于额定风速的风速对应功率值等于额定输出功率,最终得到该风电机组的功率曲线。
26.本发明的另一方面,还提供了一种基于高维网格化和lightgbm的风电预测装置,包括:
27.提取单元,用于将风电机组或风电场中心坐标位置周围的w个网格点的气象要素
数据提取出来,以每个气象要素的每个网格点作为一个特征量,所述气象要素包括风速、风向、温度、湿度和压强;
28.插值单元,用于将各类气象要素线性插值处理成与功率数据相同时间分辨率的时间序列气象数据,形成多维气象预报数据;其中,风向由x方向风速和y方向风速分别线性插值后计算得到;
29.预测单元,用于对风电机组或风电场的实际功率数据进行基于密度分布的功率曲线的预处理,获得有效的实际功率数据;将有效的实际功率数据以及与其对应时间段的多维气象预报数据作为训练数据,调用lightgbm算法,建立预测模型,得到功率预测结果。
30.进一步的,所述预测单元设有功率预测模型模块,用于将获得的有效实际功率数据和对应时间段的多维气象预报数据作为训练数据,调用python库lightgbm算法,网格搜索自动进行参数寻优,建立功率预测模型,得到功率预测结果。
31.进一步的,所述预测单元设有风速预测模型模块,用于将获得的有效实际功率数据所对应的实际风速数据和其对应时间段的多维气象预报数据作为训练数据,调用python库lightgbm算法,网格搜索自动进行参数寻优,建立风速预测模型;将风速预测模型的风速预测结果通过所述基于密度分布的功率曲线转换成功率值,得到功率预测结果。
32.优选的,所述预测单元设有功率曲线获取子单元,所述功率曲线获取子单元包括:
33.初筛模块,用于采集风电机组或风电场实际历史运行风速、功率后,进行初筛处理,去除恒定值和异常值;
34.网格划分模块,用于以风速为横坐标,功率为纵坐标,对风速进行等间隔划分,得到n个风速段,将功率进行等间隔划分,得到m个功率段,最终得到n*m个网格,以网格中心点坐标点代表该网格,即(v
i
,p
j
),其中,i=1,2,...,n;j=1,2,3,...,m;
35.密度统计模块,用于统计实际历史功率落在每个网格点的个数num(i,j),得到二维的功率密度数空间分布情况,取所有网格的非零功率密度数的中位数记为m
edian

36.坐标获取模块,用于:当风速小于阈值时,对于该区域内的每个风速段内的最大功率空间密度数所对应的网格,如果该网格对应的功率密度数在其纵向或者横向均为最大值,则记录下该网格的中心坐标;当风速大于阈值时,对于该区域内的每个风速段v
i
所对应的各功率段p
j
,从高风功率段开始,即j=m,m-1,...,1,寻找符合以下条件的网格点并记录下该网格点的中心坐标,并进入下一个风速段的寻找;1)num(i,j)等于该功率段下的最大密度数为num(i,j)在i=1,2,...,n时的最大值;2)num(i,j)大于密度数的中位数m
edian

37.功率曲线模块,用于根据坐标获取模块获取到的坐标点,得到该风电机组的功率曲线。
38.更进一步的,所述功率曲线模块还包括:
39.排序子模块,用于将坐标获取模块获取到的一组坐标点(v
k
,p
k
),其中k=1,2,

,q;以风速v
k
从小到大进行排序,将功率递减的坐标点去除,得到一组新的坐标(v
k
,p
k
),其中k=1,2,

,p;
40.插值子模块,用于从0到30m/s,以0.1m/s为间隔构建风速序列,将(v
k
,p
k
)线性插值到新的风速序列上,得到功率曲线b;
41.置零子模块,用于将功率曲线b中风速小于k米/秒的功率置为零,k为风机切入风
速;
42.曲线生成子模块,用于将该组数据中的最大功率值和最大风速值作为额定输出功率和额定风速,大于额定风速的风速对应功率值等于额定输出功率,最终得到功率曲线。
43.与现有技术相比,本发明具有如下的有益效果:
44.(1)本发明通过风电机组或风电场周围的气象信息,构建高维输入特征,利用lightgbm的强大学习能力,挖掘气象信息与风功率的关联信息,能更加准确地进行风功率预测。实践表明,单个lightgbm模型就已经可以取得比一般算法更好的结果;
45.(2)本发明在构建预测模型时使用了基于密度分布的功率曲线对实际功率数据进行预处理,受异常数据的影响非常小,准确度极高,保证功率模型训练输入的样本集中均为风电场有效数据;
46.(3)本发明所述方法也可以进行风速预测,由于用到高维气象信息,同样可以得到优越的效果,同时风速预测结果还可以应用到基于密度分布的功率曲线,得到功率预测结果;
47.(4)本发明中的lightgbm算法可更换成catboost或xgboost算法,参数调优后基本可达到同样效果。
附图说明
48.图1为本发明实施例中功率曲线的采集实际数据的散点图;
49.图2为本发明实施例中功率曲线的基于密度分布选取的一组坐标点的示意图;
50.图3为本发明实施例的功率曲线示意图;
51.图4为本发明实施例的功率曲线偏差范围示意图;
52.图5为本发明实施例的实际功率数据预处理后的示意图;
53.图6为本发明实施例的功率预测对比图。
具体实施方式
54.需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
55.为使本发明专利的目的、特征更明显易懂,下面结合附图对本发明专利的具体实施方式作进一步的说明。需说明的是,附图均采用非常简化的形式且均使用非精准的比率,仅用以方便、明晰地辅助说明本发明专利实施例的目的。
56.本发明的设计思想在于数据基于密度分布的功率曲线的预处理以及使用lightgbm进行功率预测。
57.由于电场运行数据是从scada系统中采集,在产生和采集的过程中均会受到各种因素的影响,由此带来误差,如果这部分数据较多被引进功率模型中,会明显降低风电功率的预测精度。因此,在使用历史数据训练模型前,需要考虑一定误差范围的情况下,剔除限电、故障等明显的功率异常点。将风电场的实测风速和实测功率二维空间进行网格离散化,统计功率值落在各个网格内的个数,获得功率空间密度数分布,通过统计处理,得到风电场实测风速和实测功率的拟合曲线,根据风电场实测功率与拟合曲线转换的理论功率的比较,剔除异常、扩建和限电数据,保证功率模型训练输入的样本集中均为风电场有效数据。
58.本发明中的lightgbm模型,根据决策树原理,特征中具体数据的量纲不同不会影响模型效果,因此不需要进行特征的标准化处理,可以自动剪枝选择特征,与其他单一模型对比,具有强大的泛化能力和鲁棒性,非常适用于短期风电功率预测。
59.lightgbm是个快速的,分布式的,高性能的基于决策树算法的梯度提升框架,对于这类基于树的模型,最耗时的部分就是在进行特征选择结点分裂时,需要遍历所有可能的划分点,计算信息增益,从而找到最优的划分点。面对海量数据和特征维度很高的数据集时,lightgbm算法正是通过对模型训练时样本点的采样优化和选择分裂点时的特征维度的优化,在不牺牲精度的条件下,提高了训练速度。
60.本发明的具体步骤包括:
61.1、将获取到的实际历史运行数据进行初筛处理,去除恒定值和异常值;如果数据采集频率为15分钟,风电机组或风电场并网发电容量为c,则恒定值的判断阈值为24(该阈值根据经验得来,可以设定为大于3的整数,但也不宜过大,以免无法起到异常数据过滤作用);风速正常值的范围为[0,30],功率正常值的范围为[0,c];
[0062]
2、以风速为横坐标,功率为纵坐标,从0到30米/秒对风速进行等间隔划分,得到n个风速段,从低风速段到高风速段进行编号1,2,...,n;将功率从0到c进行等间隔划分,得到m个功率段,从低功率段到高功率段进行编号1,2,3,...,m,最终得到n*m个网格,以网格中心点坐标点代表该网格,即(v
i
,p
j
),其中,i=1,2,...,n;j=1,2,3,...,m。通常,风速间隔为0.02米/秒,功率间隔为c/1500,上述的间隔是通过全国一百多个风电场实际数据测试经验得出的相对比较稳定的值;
[0063]
3、统计实际历史功率落在每个网格点的个数num(i,j),即可得到二维的功率密度数空间分布情况,取所有网格的非零功率密度数的中位数记为m
edian

[0064]
4、当风速小于v
o
时,一般v
o
取值为9~11米/秒(风速v
o
的取值一般接近风机额定输出功率,风电场限电基本发生在高风速段,风速超过v
o
时,该时段的数据会受限电影响,所以处理方法不一样),对于该区域内的每个风速段内的最大功率空间密度数所对应的网格,如果该网格对应的功率密度数在其纵向或者横向均为最大值,则记录下该网格的中心坐标;
[0065]
5、当风速大于v
o
时,对于该区域内的每个风速段v
i
所对应的各功率段p
j
,从高风功率段开始,即j=m,m-1,...,1,直到寻找符合以下条件的网格点,一旦找到符合的网格点,立即停止当前的寻找,记录下该网格点的中心坐标,并进入下一个风速段的寻找;
[0066]
所述条件为:1)num(i,j)等于该功率段下的最大密度数为num(i,j)在i=1,2,...,n时的最大值;2)num(i,j)大于密度数的中位数m
edian
;m
edian
为步骤3中求得的值,是所有网格点的非零功率密度数的中位数;
[0067]
上述条件1)起决定性作用;条件2)是针对特别情况做的限定,可以看成特殊处理,可以说绝大部分电场的情况都能够满足条件2);
[0068]
6、通过4、5两个步骤,可以获取一组坐标点(v
k
,p
k
),其中k=1,2,

,q,对该组坐标点进行以下处理:1)以风速v
k
从小到大进行排序,将功率递减的坐标点去除后,得到一组新的坐标(v
k
,p
k
),其中k=1,2,

,p,;2)从0到30m/s,以0.1m/s为间隔构建风速序列,将(v
k
,p
k
)线性插值到新的风速序列上,得到功率曲线b;3)将功率曲线b风速小于k米/秒的功率值为零(k为风机切入风速,一般取值范围为2~3.5m/s,该值跟风机机型有关);4)将该组数据
中的最大功率值和最大风速值作为额定输出功率和额定风速,大于额定风速的风速对应功率值等于额定输出功率,最终得到该风电机组以实际运行数据为基础的功率曲线;
[0069]
7、根据实际风速通过上述功率曲线可以插值得到一组理论发电功率p
theroy
,当实际功率与理论发电功率的偏差在一定范围内,则认为该实际功率值有效,可以作为模型输入值,如果超出该范围,则认为该实际功率值为异常。一般情况该偏差范围为[-k1*c,k2*c],其中,k1,k2的范围为(0,0.3];
[0070]
8、获取网格化气象预报数据,该数据可以是全球气象模式预报数据,也可以是中尺度气象预报模型数据,根据风电机组或风电场中心坐标位置周围约50km范围内的w个网格点的气象数据提取出来,以每个气象要素的每个网格点作为一个特征量,一般气象要素为风速、风向、温度、湿度和压强,则气象源的特征量均为5*w个。
[0071]
9、将各类气象要素线性插值处理成与功率数据相同时间分辨率的时间序列多维气象预报数据,其中,风向由x方向风速和y方向风速分别线性插值后计算得到;
[0072]
10、通过第7步,将剔除异常数据后的实际功率和对应时间段的多维气象预报数据作为训练数据,调用python库lightgbm算法,网格搜索自动进行参数寻优,建立功率预测模型,得到功率预测结果;
[0073]
11、或者通过第7步,将剔除异常数据后的实际功率所对应的实际风速数据和其对应时间段的多维气象预报数据作为训练数据,调用python库lightgbm算法,网格搜索自动进行参数寻优,建立风速预测模型,将风速预测模型的风速预测结果通过第6步中得到的功率曲线转换成功率值,即可得到功率预测结果。
[0074]
上述步骤10和11中,lightgbm算法可更换成catboost或xgboost算法。
[0075]
依据上述步骤,以某风电场为例,该风电场装机容量为49.5mw,采用气象数据的空间分辨率为10km*10km,则该风电场周围50km范围内的气象格点数为10*10个,选取风速、风向、温度、湿度和压强五个气象要素,获取气象预报数据得到的特征量维度为500,设该组为b组,再获取该风电场的单站的5个气象要素作为测试对照组a组,分别将单站气象预报数据和高维气象预报数据输入lightgbm模型,建立功率预测模型,对2019年5月11日到2019年5月17日该风电场的出力进行预测,结果如下表以及图6所示,采用本专利提供的高维气象数据和lightgbm方法,平均精度可提高1.4%。
[0076]
日期精度-预测功率a精度-预测功率b2019-05-1186.23%85.82%2019-05-1278.11%81.49%2019-05-1368.51%74.84%2019-05-1489.61%88.82%2019-05-1582.35%83.40%2019-05-1681.06%82.89%2019-05-1786.12%84.49%平均值81.71%83.11%
[0077]
上述表格中风功率预测精度计算方法:
[0078][0079]
其中,acc为每日的精度,n为当天测量样本的数量;p
ri
为实际功率;p
pi
为预测功率;c
p
为装机容量。
[0080]
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜