一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于卫星云图和随机森林模型的太阳总辐照度反演方法

2022-08-13 21:00:45 来源:中国专利 TAG:


1.本发明涉及地表太阳辐照度反演技术领域,尤其涉及基于卫星云图和随机森林模型的太阳总辐照度反演方法。


背景技术:

2.截至2021年10月,我国光伏发电累计装机容量已达 2.78 亿千瓦。随着太阳能光伏发电技术的进步和成本的降低,预计未来几十年光伏装机将实现大规模应用。但由于光伏发电的间歇性和不确定性,将大量光伏发电并入电力系统是一个挑战。
3.准确计算地表接收到的太阳辐照度是光伏发电预报的第一步,也是光伏发电预报中很重要的环节。由于云的瞬息万变,导致地表太阳辐照度的计算具有较大的不确定性。风云四号卫星(fy-4a)是我国静止轨道气象卫星从第一代(风云二号)向第二代跨越的首发星,整体性能达到国际先进水平。从风云
‑ꢀ
2g卫星的5个辐射成像通道增加到14个,覆盖可见光、短波、中波、长波红外波段。风云卫星已经证明了其在中国地区进行辐射研究的可行性。
4.机器学习是计算机科学的一个分支领域,是一种人工智能方法。这种方法的优点是一个模型可以解决不可能用显式算法表示的问题。机器学习模型可以找到输入和输出之间的关系,即使无法表示。随机森林(random forests)比较简单,易于实现,计算成本低,但它在分类和回归上表现出惊人的准确性。因此,随机森林算法与传统统计方法相比,准确率明显提高,在海量的卫星资料中有着很大的应用潜力。
5.利用我国的风云4号卫星,可拓展风云4号卫星的应用方法,改善对国外卫星信息的依赖,提升太阳辐射反演的自主能力。因此,如何利用高分卫星云图结合随机森林算法来建立地表太阳辐照度反演方法,以提高地表太阳辐照度的计算准确度,为太阳能资源的评估、光伏电站的合理布局以及光伏功率预报提供科学支撑就显得尤为重要。


技术实现要素:

6.本发明所要解决的技术问题是提供一种提高计算结果准确度的基于卫星云图和随机森林模型的太阳总辐照度反演方法。
7.为解决上述问题,本发明所述的基于卫星云图和随机森林模型的太阳总辐照度反演方法,包括以下步骤:

确定地表太阳辐照度反演地区的海拔高度及经纬度信息,并获得该地区的太阳辐照度观测资料ghi
ob
及常规气象变量的观测资料;

确定选择的晴空模型,在晴空模型下输入所述海拔高度及经纬度信息即可得到该地区晴天地表太阳辐照度数值,结合地表太阳辐照度观测数据ghi
ob
对晴空模型进行订正,得到修订后的晴天太阳辐照度数值ghi
clear-sky


下载风云4号卫星云图数据,并对卫星云图进行预处理,读取7个通道的各个像素点云图反照率区域平均值,经过线性插值,得到10min时间分辨率的反照率区域平均值


下载随机森林模型python程序包,利用ghi
ob
、ghi
clear-sky
和的历史数据对随机森林模型进行训练和超参数调优;

根据超参数调优和训练好的随机森林模型,输入变量ghi
clear-sky
和,即可获得该时刻地表太阳总辐照度的反演数值ghi
all-sky

8.所述步骤

中风云4号卫星云图数据来自国家气象科学数据中心,所使用的卫星图像的空间分辨率为2 km
×
2 km,选择光谱带宽为0.45 ~ 4.00μm的7个通道;同时删除太阳高度角小于10
°
的卫星图像。
9.所述步骤

中卫星云图按下述方法进行预处理:先对卫星云图进行几何定标和辐射定标,卫星云图裁剪的面积是32km
×
32km,反演地区像素点居中;然后对于缺失的卫星云图采用线性插值方法进行插补,最后分别得到10min时间分辨率的7个通道反照率区域平均值、、、、、和。
10.所述步骤

中随机森林模型的训练和超参数调优按下述方法进行:

下载随机森林模型python程序包;

在修订后的晴天太阳辐照度数值ghi
clear-sky
以及7个通道的卫星云图反照率区域平均值、、、、、和中随机选取70%的数据作为输入的训练数据;地表太阳辐照度观测数据ghi
ob
作为输出参量;

选择python中的sklearn模块中的网格搜索和随机搜索方法分别对下述六种超参数进行调优:决策树个数n_estimators,决策树最大深度max_depth,最小分离样本数min_samples_split,最小叶子节点样本数min_samples_leaf,最大分离特征数max_features以及是否进行随机抽样bootstrap。
11.本发明与现有技术相比具有以下优点:1、本发明利用我国的风云4号卫星高时空分辨率的观测数据以及地面气象观测资料结合随机森林算法,建立高精度的地表太阳辐照度反演方法,使得时间分辨率可达10min,空间分辨率为2km。
12.2、本发明所需要的参数较少,占用的计算资源较少,成本低,但预报结果的准确度较高,对电网保供电、保消纳、保安全的支撑作用具有重要的意义。
附图说明
13.下面结合附图对本发明的具体实施方式作进一步详细的说明。
14.图1为本发明的流程图。
15.图2为本发明实施例提供的风云4号卫星云图示意图。
16.图3为本发明实施例提供的随机森林模型参数寻优python程序示意图。
17.图4为本发明实施例提供的地表太阳辐照度反演结果示意图。
具体实施方式
18.如图1所示,基于卫星云图和随机森林模型的太阳总辐照度反演方法,包括以下步
骤:

确定地表太阳辐照度反演地区的海拔高度及经纬度信息,并获得该地区的太阳辐照度观测资料ghi
ob
及常规气象变量的观测资料。
19.⑵
确定选择的晴空模型(mcclear晴空模型),在晴空模型下输入海拔高度及经纬度信息即可得到该地区晴天地表太阳辐照度数值,结合地表太阳辐照度观测数据ghi
ob
(单位:w/m2)对晴空模型进行订正,得到修订后的晴天太阳辐照度数值ghi
clear-sky
(单位:w/m2)。
20.在我国地区晴空模型适用性较好的有mac2、rest2v5、bird、mcclear、ineichen、iqbal-c、ssolis、esra,mac2和rest2v5模型。综合考虑模型的计算准确度以及成本,mcclear晴空模型是最好的选择。
21.⑶
下载风云4号卫星云图数据,并对卫星云图进行预处理,读取7个通道的各个像素点云图反照率区域平均值,经过线性插值,得到10min时间分辨率的反照率区域平均值(无量纲)。
22.其中:风云4号卫星云图数据来自国家气象科学数据中心(http://satellite.nsmc.org.cn/),所使用的卫星图像的空间分辨率为2 km
×
2 km,选择光谱带宽为0.45 ~ 4.00μm的7个通道如表1所示。同时删除太阳高度角小于10
°
的卫星图像(由于光线太弱导致的观测误差较大)。
23.表1 计算ghi
all-sky
所用到的fy-4卫星的波段信息卫星云图按下述方法进行预处理:先对卫星云图进行几何定标和辐射定标,卫星云图裁剪的面积是32km
×
32km,反演地区像素点居中;然后对于缺失的卫星云图采用线性插值方法进行插补,最后分别得到10min时间分辨率的7个通道反照率区域平均值、、、、、和。
24.⑷
下载随机森林模型python程序包,利用ghi
ob
、ghi
clear-sky
和的历史数据对随机森林模型进行训练和超参数调优。具体过程如下:

下载随机森林模型python程序包。
25.②
在修订后的晴天太阳辐照度数值ghi
clear-sky
以及7个通道的卫星云图反照率区
域平均值、、、、、和中随机选取70%的数据作为输入的训练数据;地表太阳辐照度观测数据ghi
ob
作为输出参量。
26.③
选择python中的sklearn模块中的网格搜索(gridsearchcv)和随机搜索方法(randomizedsearchcv)分别对下述六种超参数进行调优:决策树个数n_estimators,决策树最大深度max_depth,最小分离样本数(即拆分决策树节点所需的最小样本数)min_samples_split,最小叶子节点样本数(即一个叶节点所需包含的最小样本数)min_samples_leaf,最大分离特征数(即寻找最佳节点分割时要考虑的特征变量数量)max_features以及是否进行随机抽样bootstrap。
27.⑸
根据超参数调优和训练好的随机森林模型,输入变量ghi
clear-sky
和,即可获得该时刻的地表太阳总辐照度的反演数值ghi
all-sky
(单位:w/m2)。
28.利用训练好的随机森林模型,在修订后的晴天太阳辐照度数值ghi
clear-sky
以及7个通道的卫星云图反照率区域平均值、、、、、和中随机选取30%的输入数据,输出地表太阳总辐照度的反演数值ghi
all-sky
,将对应时间的30%的观测数据ghi
ob
作为验证数据,来评估模型的准确度。
29.实施例 选取位于甘肃省兰州市榆中区国家基本气象观测站为地表太阳辐照度反演地区。估算点经纬度信息:104.15
°
e, 35.87
°
n。该观测点架设了地表太阳总辐射观测仪器及其他常规气象要素观测仪器。
30.在我国地区晴空模型适用性较好的有mac2、rest2v5、bird、mcclear、ineichen、iqbal-c、ssolis、esra,mac2和rest2v5模型。综合考虑模型的计算准确度以及成本,mcclear晴空模型是最好的选择。输入经纬度及海拔高度信息,即可得到预报地区晴天条件下的地表太阳辐照度数值。mcclear模型的结果可从cams服务网站(cams,http://www.soda-pro.com/web-services/radiation/cams-mcclear)免费获得。
31.在特殊天气类型下(例如沙尘、大雾或污染天气),需要对mcclear晴空模型进行修订,利用相同天气类型下晴天历史资料(过去7天的)mcclear模型计算值和观测值做线性拟合即可。
32.风云4号卫星云图数据来自国家气象科学数据中心(http://satellite.nsmc.org.cn/),所使用的卫星图像的空间分辨率为2 km
×
2 km,选择光谱带宽为0.45 ~ 4.00μm的7个通道如表1所示。同时删除太阳高度角小于10
°
的卫星图像(由于光线太弱导致的观测误差较大)。
33.卫星云图按下述方法进行预处理:先对卫星云图进行几何定标和辐射定标,卫星云图裁剪的面积是32km
×
32km,反演地区像素点居中;然后对于缺失的卫星云图采用线性插值方法进行插补,最后分别得到10min时间分辨率的7个通道反照率区域平均值、、、、、和。下载的风云4号卫星观测资料的时间段为2019年7月至2020年6月。风云4号卫星云图如图2所示。
34.在修订后的晴天太阳辐照度数值ghi
clear-sky
以及7个通道的卫星云图反照率区域平均值、、、、、和中随机选取70%的数据作为输入的训练数据;地表太阳辐照度观测数据ghi
ob
作为输出参量。
35.选择python中的sklearn模块中的网格搜索(gridsearchcv)和随机搜索方法(randomizedsearchcv)分别对下述六种超参数进行调优:决策树个数n_estimators,决策树最大深度max_depth,最小分离样本数(即拆分决策树节点所需的最小样本数)min_samples_split,最小叶子节点样本数(即一个叶节点所需包含的最小样本数)min_samples_leaf,最大分离特征数(即寻找最佳节点分割时要考虑的特征变量数量)max_features以及是否进行随机抽样bootstrap。
36.其中:n_estimators的参数寻优选取范围为50~3000的数据,以60为间隔分别进行寻优。max_features的寻优主要分别考虑'auto'和'sqrt'中方法的最优解。max_depth的寻优参考数值范围为10到500以50为间隔的数值。min_samples_split在2,5,10三个数值中进行选择。 min_samples_leaf在1,2,4,8四个数值中选择。bootstrap_range选择ture或者false,如图3所示。
37.利用训练好的随机森林模型,在修订后的晴天太阳辐照度数值ghi
clear-sky
以及7个通道的卫星云图反照率区域平均值、、、、、和中随机选取30%的输入数据,输出地表太阳总辐照度的反演数值ghi
all-sky
,将对应时间的30%的观测数据ghi
ob
作为验证数据,来评估模型的准确度。
38.如图4所示,得到该地区地表太阳总辐照度(时间分辨率10min)的反演结果示意图。横坐标是实际的观测数值,纵坐标是本发明模型的估算数值,样本个数是5494个。从统计参量可以看出,rmse为91.7w/m2,nrmse为19.7%, 相关系数r达到0.95。因此,在考虑所有的天气类型下,该模型能够很好地估算太阳总辐射的数值。
39.以上对本发明所提供的技术方案进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献