一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种集中式光伏电站运维方法及装置与流程

2022-12-19 23:55:25 来源:中国专利 TAG:


1.本技术涉及光伏发电技术领域,尤其是涉及一种集中式光伏电站运维方法及装置。


背景技术:

2.利用可再生能源能够减少化石燃料的使用,有利于实现碳中和的目标。
3.随着国家陆上、海上新能源发电补贴的逐步取消,原有的新能源场站的运行维护策略已不适应现有的运维管理要求,大量新建或扩建的新能源发电项目也亟需可靠的运维策略,以提升新能源场站的运维水平。特别地,集中式光伏电站的运行和维护成本较高,亟需提升其新能源场站的运维水平。
4.针对上述中的相关技术,发明人发现现有的集中式光伏电站存在有运行和维护成本较高的问题。


技术实现要素:

5.为了降低集中式光伏电站的运行和维护成本,本技术提供了一种集中式光伏电站运维方法及装置。
6.第一方面,本技术提供一种集中式光伏电站运维方法。
7.本技术是通过以下技术方案得以实现的:
8.一种集中式光伏电站运维方法,包括以下步骤,
9.获取集中式光伏电站的历史数据;
10.基于所述历史数据,结合集中式光伏电站的内部设施的物理特性进行数学建模,得到环境模型;
11.预设集中式光伏电站的不确定性因素,基于所述历史数据,对所述不确定性因素进行分析建模,得到分析结果;
12.根据集中式光伏电站的状态空间、操作空间及奖励函数,基于深度强化学习算法对集中式光伏电站的控制决策进行建模,得到运维模型;
13.采用gurobi规划优化运算器,结合所述环境模型,对所述运维模型进行全局寻优,并通过所述分析结果训练所述运维模型;
14.将训练好的运维模型安装于集中式光伏电站中,习得最优实时控制策略。
15.本技术在一较佳示例中可以进一步配置为:所述基于所述历史数据,结合集中式光伏电站的内部设施的物理特性进行数学建模,得到环境模型时,包括以下步骤,
16.按照集中式光伏电站的内部设施的物理特性建立约束条件,明确电力潮流及电力平衡的约束条件;
17.以混合整数线性规划模型为最终形式对所述环境模型进行线性化。
18.本技术在一较佳示例中可以进一步配置为:所述预设集中式光伏电站的不确定性因素,基于所述历史数据,对所述不确定性因素进行分析建模的步骤包括,
19.不确定性因素包括发电量、站用电量、电力市场实时电价、检修人员所在位置、部件故障位置和时间;
20.基于所述历史数据,建立所述不确定性因素之间的相关性分布曲线。
21.本技术在一较佳示例中可以进一步配置为:所述根据集中式光伏电站的状态空间、操作空间及奖励函数,基于深度强化学习算法对集中式光伏电站的控制决策进行建模的步骤包括,
22.将集中式光伏电站的控制决策的建模表征为马尔可夫决策过程;
23.所述马尔可夫决策过程的建立基于四个向量元组{s,a,r,s’},其中,s表示原始的状态空间,a表示操作空间,r表示奖励函数,s’表示原始的状态空间s从时间t到时间t 1的环境转换后的状态空间。
24.本技术在一较佳示例中可以进一步配置为:所述状态空间表征集中式光伏电站的控制决策的状态,所述状态空间包括[soc
k,t
,t
tin
,t
tiw
,t
tow
,t
tewh
,soc
v,t
,p
b,t
,p
s,t
],其中,soc
k,t
表示储能系统的电量水平,t
tin
表示升压站室温,t
tiw
表示内层温度,t
tow
表示外层温度,t
tewh
表示站内热水温度,soc
v,t
表示电站用电动车电量,p
b,t
表示实时通过电力市场的买电量,p
s,t
表示实时通过电力市场的卖电量。
[0025]
本技术在一较佳示例中可以进一步配置为:所述操作空间表征集中式光伏电站的控制决策在每个时间段采取的操作,所述操作空间包括[σ
t
,(u
b,t
,u
s,t
)],其中,表示储能系统的充电/放电指令,表示电站电动车充电指令,σ
t
表示空调控制指令,表示热水器控制指令,(u
b,t
,u
s,t
)表示选择实时从电力市场买电/向电力市场卖电。
[0026]
本技术在一较佳示例中可以进一步配置为:所述奖励函数以购电成本、储能系统老化成本以及无法平衡的实时电力差值的考核作为惩罚条件,以售电收益、光伏电站人员设备安全水平作为奖励条件。
[0027]
第二方面,本技术提供一种集中式光伏电站运维装置。
[0028]
本技术是通过以下技术方案得以实现的:
[0029]
一种集中式光伏电站运维装置,包括,
[0030]
数据模块,用于获取集中式光伏电站的历史数据;
[0031]
内部设施建模模块,用于基于所述历史数据,结合集中式光伏电站的内部设施的物理特性进行数学建模,得到环境模型;
[0032]
不确定性分析模块,用于预设集中式光伏电站的不确定性因素,基于所述历史数据,对所述不确定性因素进行分析建模,得到分析结果;
[0033]
控制决策建模模块,用于根据集中式光伏电站的状态空间、操作空间及奖励函数,基于深度强化学习算法对集中式光伏电站的控制决策进行建模,得到运维模型;
[0034]
优化模块,用于采用gurobi规划优化运算器,结合所述环境模型,对所述运维模型进行全局寻优,并通过所述分析结果训练所述运维模型;
[0035]
决策模块,用于将训练好的运维模型安装于集中式光伏电站中,习得最优实时控制策略。
[0036]
第三方面,本技术提供一种计算机设备。
[0037]
本技术是通过以下技术方案得以实现的:
[0038]
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意一种集中式光伏电站运维方法的步骤。
[0039]
第四方面,本技术提供一种计算机可读存储介质。
[0040]
本技术是通过以下技术方案得以实现的:
[0041]
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一种集中式光伏电站运维方法的步骤。
[0042]
综上所述,与现有技术相比,本技术提供的技术方案带来的有益效果至少包括:
[0043]
获取集中式光伏电站的历史数据;基于所述历史数据,结合集中式光伏电站的内部设施的物理特性进行数学建模,得到环境模型;预设集中式光伏电站的不确定性因素,基于所述历史数据,对所述不确定性因素进行分析建模,得到分析结果;根据集中式光伏电站的状态空间、操作空间及奖励函数,基于深度强化学习算法对集中式光伏电站的控制决策进行建模,得到运维模型;采用gurobi规划优化运算器,结合所述环境模型,对所述运维模型进行全局寻优,并通过所述分析结果训练所述运维模型;将训练好的运维模型安装于集中式光伏电站中,习得最优实时控制策略;能够根据光伏电站的实际运行情况习得光伏电站的最优实时控制策略,以使电力市场中的集中式光伏电站的运行和维护成本最小化,降低集中式光伏电站的运行和维护成本,并使光伏电站的综合运行维护满意度水平达到最大化,为集中式光伏电站运维人员提供最优的运行和维护策略,提升了集中式光伏电站的可靠性和稳定性,可以通过向电力市场售电实现收益最大化,实现了最优运维满意度。
附图说明
[0044]
图1为本技术一个示例性实施例提供的一种集中式光伏电站运维方法的流程示意图。
[0045]
图2为本技术一个示例性实施例提供的一种集中式光伏电站运维方法的dqn在1000个训练集训练后奖励明显提高的示意图。
[0046]
图3为本技术一个示例性实施例提供的一种集中式光伏电站运维方法的dqn在1000个训练集训练后损失明显降低的示意图。
[0047]
图4为本技术一个示例性实施例提供的一种集中式光伏电站运维方法的dqn在不同环境下进行测试100集时的表现示意图。
[0048]
图5为本技术一个示例性实施例提供的一种集中式光伏电站运维方法的dqn在不同不确定性因素影响下进行测试100集时的表现示意图。
[0049]
图6为本技术一个示例性实施例提供的一种集中式光伏电站运维装置的结构框图。
具体实施方式
[0050]
本具体实施例仅仅是对本技术的解释,其并不是对本技术的限制,本领域技术人员在阅读完本说明书后可以根据需要对本实施例做出没有创造性贡献的修改,但只要在本
申请的权利要求范围内都受到专利法的保护。
[0051]
为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
[0052]
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,如无特殊说明,一般表示前后关联对象是一种“或”的关系。
[0053]
集中式光伏电站要参与电力市场,就必须转变现有的运行维护方式,探寻一个最优的运行维护策略。为此,本技术提出了一种基于深度强化学习算法的集中式光伏电站运维方法,能够根据光伏发电的实际运行情况习得光伏电站的最优实时控制策略,以使电力市场中的集中式光伏电站的运行和维护成本最小化,并使光伏电站的综合运行维护满意度水平达到最大化,为集中式光伏电站运维人员提供最优的运行和维护策略,提升了集中式光伏电站的可靠性和稳定性,可以通过向电力市场售电实现收益最大化,实现了最优运维满意度。
[0054]
下面结合说明书附图对本技术实施例作进一步详细描述。
[0055]
参照图1,本技术实施例提供一种集中式光伏电站运维方法,所述方法的主要步骤描述如下。
[0056]
s1:获取集中式光伏电站的历史数据;
[0057]
s2:基于所述历史数据,结合集中式光伏电站的内部设施的物理特性进行数学建模,得到环境模型;
[0058]
s3:预设集中式光伏电站的不确定性因素,基于所述历史数据,对所述不确定性因素进行分析建模,得到分析结果;
[0059]
s4:根据集中式光伏电站的状态空间、操作空间及奖励函数,基于深度强化学习算法对集中式光伏电站的控制决策进行建模,得到运维模型;
[0060]
s5:采用gurobi规划优化运算器,结合所述环境模型,对所述运维模型进行全局寻优,并通过所述分析结果训练所述运维模型;
[0061]
s6:将训练好的运维模型安装于集中式光伏电站中,习得最优实时控制策略。
[0062]
进一步地,s2:所述基于所述历史数据,结合集中式光伏电站的内部设施的物理特性进行数学建模,得到环境模型时,包括以下步骤,
[0063]
按照集中式光伏电站的内部设施的物理特性建立约束条件,明确电力潮流及电力平衡的约束条件;
[0064]
以混合整数线性规划模型为最终形式对所述环境模型进行线性化。
[0065]
进一步地,s3:所述预设集中式光伏电站的不确定性因素,基于所述历史数据,对所述不确定性因素进行分析建模的步骤包括,
[0066]
不确定性因素包括发电量、站用电量、电力市场实时电价、检修人员所在位置、部件故障位置和时间;
[0067]
基于所述历史数据,建立所述不确定性因素之间的相关性分布曲线。
[0068]
进一步地,s4:所述根据集中式光伏电站的状态空间、操作空间及奖励函数,基于
深度强化学习算法对集中式光伏电站的控制决策进行建模的步骤包括,
[0069]
将集中式光伏电站的控制决策的建模表征为马尔可夫决策过程;
[0070]
所述马尔可夫决策过程的建立基于四个向量元组{s,a,r,s’},其中,s表示原始的状态空间,a表示操作空间,r表示奖励函数,s’表示原始的状态空间s从时间t到时间t 1的环境转换后的状态空间。
[0071]
进一步地,所述状态空间表征集中式光伏电站的控制决策的状态,所述状态空间包括[soc
k,t
,t
tin
,t
tiw
,t
tow
,t
tewh
,soc
v,t
,p
b,t
,p
s,t
],其中,soc
k,t
表示储能系统的电量水平,t
tin
表示升压站室温,t
tiw
表示内层温度,t
tow
表示外层温度,t
tewh
表示站内热水温度,soc
v,t
表示电站用电动车电量,p
b,t
表示实时通过电力市场的买电量,p
s,t
表示实时通过电力市场的卖电量。
[0072]
进一步地,所述操作空间表征集中式光伏电站的控制决策在每个时间段采取的操作,所述操作空间包括[σ
t
,(u
b,t
,u
s,t
)],其中,表示储能系统的充电/放电指令,表示电站电动车充电指令,σ
t
表示空调控制指令,表示热水器控制指令,(u
b,t
,u
s,t
)表示选择实时从电力市场买电/向电力市场卖电。
[0073]
进一步地,所述奖励函数以购电成本、储能系统老化成本以及无法平衡的实时电力差值的考核作为惩罚条件,以售电收益、光伏电站人员设备安全水平作为奖励条件。
[0074]
上述各个实施例的具体介绍如下。
[0075]
首先,获取集中式光伏电站的历史数据。
[0076]
光伏电站在实际运行的历史数据中涵盖了22个性能指标:(1)每台汇流箱、逆变器、箱变在一次定期检修后运行的总时间;(2)每台汇流箱、逆变器、箱变的实际输出功率;(3)每台汇流箱、逆变器、箱变的预测输出功率;(4)汇流箱、逆变器、箱变的计划检修率;(5)汇流箱、逆变器、箱变因各种故障停机率;(6)每台汇流箱、逆变器、箱变因同一故障停运次数;(7)每台汇流箱、逆变器、箱变无故障的预期运行时间间隔;(8)每台汇流箱、逆变器、箱变最小停机时间间隔;(9)每台汇流箱、逆变器、箱变排除故障的时间;(10)每台汇流箱、逆变器、箱变的损失电量;(11)一个运行日内预期的汇流箱、逆变器、箱变维护次数;(12)预期的太阳能转化率;(13)集中式光伏电站总功率因数;(14)升压站场用电率;(15)升压站和线路的电能损耗;(16)废弃的太阳能发电量;(17)因限电造成的电能损耗;(18)从主电网购电量;(19)因极端天气造成的电能损耗;(20)数据通信可靠率;(21)光伏板及组串的综合能源使用;以及(22)出于环保和安全考虑,移除的树木和草等。
[0077]
基于集中式光伏电站的上述性能指标,建立一个运维综合满意度水平指标集来评价光伏电站的运行维护策略,以根据光伏发电的实际运行情况实时衡量光伏电站的运行维护策略,使得电力市场中的集中式光伏电站的运行和维护成本最小化,集中式光伏电站的综合运行维护满意度水平达到最大化。
[0078]
本实施例中,运行维护策略的内容包括(1)光伏场区设备日常巡视频次及每次巡视时间、设备消缺维护频次及每次检修时间;(2)开展光伏板调整的频次;(3)开展光伏板清扫的频次、路线和方式;(4)开展光伏场区除草的频次和路线;(5)开展光伏逆变器、线路、箱变的年度定检工作的时间段及人员安排。
[0079]
接着,基于历史数据,对集中式光伏电站的内部设施进行数学建模,得到环境模
型。
[0080]
其中,集中式光伏电站的内部设施包括主变线路、集电线路、升压站内部用电设备(具体为空调、储能、服务器、电脑、照明、电热水器、电动车及其他基础用电设备等)、光伏组件、汇流箱、逆变器及箱变等。
[0081]
对集中式光伏电站的内部设施进行数学建模的具体步骤为:
[0082]
按照集中式光伏电站的内部设施的物理特性建立约束条件,明确电力潮流及电力平衡的约束条件;
[0083]
以混合整数线性规划模型为最终形式对所述环境模型进行线性化。
[0084]
按照内部设施的物理特性建立约束条件能够表征集中式光伏电站的内部设施的特性,有利于更精准地衡量光伏电站的运行维护策略。
[0085]
采用混合整数线性规划模型(milp,mixed-integer linear programming)作为最终形式对环境模型进行线性化,以便于使用现有的商业运算器对运维问题进行求解,获得数值解,以指导光伏电站的运维工作。
[0086]
其次,预设集中式光伏电站的不确定性因素,基于历史数据,对不确定性因素进行分析建模,得到分析结果。
[0087]
具体地,不确定性因素具体包括集中式光伏电站的发电量、站用电量、电力市场实时电价、检修人员所在位置、部件故障位置和时间。
[0088]
基于历史数据,对集中式光伏电站相关的不确定性因素进行分析建模,以集中式光伏电站的历史数据为依据,建立不确定性因素之间的相关性分布曲线,以明确各不确定性因素之间的相关性,为光伏电站的最优运维提供指导依据。
[0089]
以站用电量与电力市场实时电价为例,为满足运维人员夏天室内舒适度,空调将被设置为22摄氏度至26摄氏度之间运行,而电力市场实时电价将直接影响空调温度的设置,故在电力市场实时电价为低点时,空调温度设置为22摄氏度;在电力市场实时电价为高点时,空调温度设置为26摄氏度,具体的实时电价区间可根据各省电力市场电价而定。
[0090]
其次,根据集中式光伏电站的状态空间、操作空间及奖励函数,基于深度强化学习算法对集中式光伏电站的控制决策进行建模,得到运维模型;再采用gurobi规划优化运算器,结合环境模型,对得到的运维模型进行全局寻优,并通过不确定性因素的分析结果训练运维模型。
[0091]
状态空间表征集中式光伏电站的控制决策的状态,即状态变量,由一个向量来表示,状态空间包括[soc
k,t
,t
tin
,t
tiw
,t
tow
,t
tewh
,soc
v,t
,p
b,t
,p
s,t
],其中,soc
k,t
表示储能系统的电量水平,t
tin
表示升压站室温,t
tiw
表示内层温度,t
tow
表示外层温度,t
tewh
表示站内热水温度,soc
v,t
表示电站用电动车电量,p
b,t
表示实时通过电力市场的买电量,p
s,t
表示实时通过电力市场的卖电量。
[0092]
操作空间表征集中式光伏电站的控制决策在每个时间段采取的操作,即控制变量,由一个向量表示,基于累积q值的最大化目的,操作空间包括[σ
t
,(u
b,t
,u
s,t
)],其中,表示储能系统的充电/放电指令,表示电站电动车充电指令,σ
t
表示空调控制指令,表示热水器控制指令,(u
b,t
,u
s,t
)表示选择实时从电力
市场买电/向电力市场卖电。
[0093]
所有集中式光伏电站的操作都是二进制变量,例如,空调控制指令为-1表征制冷,0表征闲置,1表征制热。
[0094]
奖励函数以购电成本、储能系统老化成本以及无法平衡的实时电力差值的考核作为惩罚条件,以售电收益、光伏电站人员设备安全水平作为奖励条件,以最大限度地保证向电力市场卖电所获得的收益,同时保证光伏电站的可靠性,故将该目标转化为一个奖励函数。具体的奖励函数表达式如下:
[0095][0096]
其中,r
t
表示奖励函数,cb和cs表示实时从电力市场买电和向电力市场卖电的价格,ck和cv表示储能系统及电动车的老化系数,表示内部设施的运维满意度,j
v,t
表示运维人员的到位程度,表示运维车辆的满意程度,cm指电力不平衡的罚款单价,p
m,t
指电力不平衡差值,p
s,t
表示卖电量,u
s,t
表示实时向电力市场卖电,表示储能系统的充电功率,表示储能系统的放电功率,表示新能源汽车的充电功率,表示储能放电指令,表示储能充电指令,u
b,t
表示从电力市场买电,p
b,t
表示买电量,表示储能充电功率。
[0097]
进一步地,为了减小缺乏综合信息对不确定性因素相关性分布的影响,将集中式光伏电站的控制决策的建模表征为马尔可夫决策过程(mdp),并将集中式光伏电站的内部设施的数学建模模型作为集中式光伏电站的环境模型。其中,马尔可夫决策过程的建立基于四个向量元组{s,a,r,s’},其中,s表示原始的状态空间,a表示操作空间,s’表示原始的状态空间s从时间t到时间t 1的环境转换后的状态空间,表示奖励函数,即集中式光伏电站业主在执行从状态s变为状态s’的操作a后获得的即时奖励。
[0098]
在mdp模型中,状态被认为在整个时间间隔内是连续的,而操作动作被设置为离散的,这符合集中式光伏电站中主要部件的性质。
[0099]
采用python语言,以深度强化学习算法(drl)为基础,建立智慧大脑,以基于深度强化学习算法对集中式光伏电站的控制决策进行建模,得到运维模型。本实施例中,深度强化学习算法选用深度q网络(dqn,deep q-network),学习速率快且收敛效果好,提高了学习的稳定性和精度。
[0100]
采用gurobi规划优化运算器,结合环境模型,对运维模型进行全局寻优,并通过分析结果训练运维模型。
[0101]
通过上述不确定性因素的历史数据训练智慧大脑中的深度q神经网络。在训练过程中每个工作日包含96个工作时间段,即每个时间段15分钟。训练内容基于上述不确定因
素产生训练场景。数据采集30个工作日上述不确定因素的实际数据形成的10000个训练集。每次训练结束后,通过调整智慧大脑中的训练参数达到对dqn的最优训练效果。
[0102]
最后在集中式光伏电站中实装训练好的运维模型。运维模型通过学习运行和维护成本对每个时间段售电情况的影响,习得最优实时控制策略,即在同时考虑勘探和开发的情况下,可以得出一个以近期和长期收益为目标的最优控制决策。根据最优实时控制策略,控制集中式光伏电站的运行和维护,实现运行和维护成本最小化。
[0103]
进一步地,利用不同分布的不确定性因素的实时数据对训练后的dqn进行测试。具体地,采用两组基于不同分布的不确定性因素的1000个新测试集对训练好的dqn进行测试。第一套1000个新测试集采用与训练集相同的买卖电价、用电需求和发电量,其余不确定性因素的分布曲线不同。第二套1000个新测试集采用与训练集相同的故障发生时间、发生次数及检修人员所在位置,其余不确定性因素基于不同的分布且不同于第一组,以检验本技术所基于drl方法处理光伏电站未知状态的能力。
[0104]
参照图2为dqn在1000个训练集训练后奖励明显提高的示意图,体现了深度学习算法的训练次数和奖励之间的关系。
[0105]
参照图3为dqn在1000个训练集训练后损失明显降低的示意图,体现了深度学习算法的训练次数与对照组之间损失的关系。
[0106]
参照图4为dqn在不同环境下进行测试100集时的表现示意图,体现了深度学习算法的训练次数与对照组之间损失的关系。
[0107]
参照图5为dqn在不同不确定性因素影响下进行测试100集时的表现示意图,体现了深度学习算法的训练次数与奖励、平均奖励的关系,其中,虚线为平均奖励。
[0108]
大量基于实际数据的仿真结果验证了本技术基于深度强化学习算法的集中式光伏电站的运维方法的有效性。
[0109]
综上所述,一种集中式光伏电站运维方法通过获取集中式光伏电站的历史数据;基于所述历史数据,结合集中式光伏电站的内部设施的物理特性进行数学建模,得到环境模型;预设集中式光伏电站的不确定性因素,基于所述历史数据,对所述不确定性因素进行分析建模,得到分析结果;根据集中式光伏电站的状态空间、操作空间及奖励函数,基于深度强化学习算法对集中式光伏电站的控制决策进行建模,得到运维模型;采用gurobi规划优化运算器,结合所述环境模型,对所述运维模型进行全局寻优,并通过所述分析结果训练所述运维模型;将训练好的运维模型安装于集中式光伏电站中,习得最优实时控制策略;能够根据光伏电站的实际运行情况习得光伏电站的最优实时控制策略,以使电力市场中的集中式光伏电站的运行和维护成本最小化,降低集中式光伏电站的运行和维护成本,并使光伏电站的综合运行维护满意度水平达到最大化,为集中式光伏电站运维人员提供最优的运行和维护策略,提升了集中式光伏电站的可靠性和稳定性,可以通过向电力市场售电实现收益最大化,实现了最优运维满意度。
[0110]
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本技术实施例的实施过程构成任何限定。
[0111]
参照图6,本技术实施例还提供一种集中式光伏电站运维装置,该一种集中式光伏电站运维装置与上述实施例中一种集中式光伏电站运维方法一一对应。该一种集中式光伏
电站运维装置包括,
[0112]
数据模块,用于获取集中式光伏电站的历史数据;
[0113]
内部设施建模模块,用于基于所述历史数据,结合集中式光伏电站的内部设施的物理特性进行数学建模,得到环境模型;
[0114]
不确定性分析模块,用于预设集中式光伏电站的不确定性因素,基于所述历史数据,对所述不确定性因素进行分析建模,得到分析结果;
[0115]
控制决策建模模块,用于根据集中式光伏电站的状态空间、操作空间及奖励函数,基于深度强化学习算法对集中式光伏电站的控制决策进行建模,得到运维模型;
[0116]
优化模块,用于采用gurobi规划优化运算器,结合所述环境模型,对所述运维模型进行全局寻优,并通过所述分析结果训练所述运维模型;
[0117]
决策模块,用于将训练好的运维模型安装于集中式光伏电站中,习得最优实时控制策略。
[0118]
关于一种集中式光伏电站运维装置的具体限定可以参见上文中对于一种集中式光伏电站运维方法的限定,在此不再赘述。上述一种集中式光伏电站运维装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0119]
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现上述任意一种集中式光伏电站运维方法。
[0120]
在一个实施例中,提供了一种计算机可读存储介质,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
[0121]
s1:获取集中式光伏电站的历史数据;
[0122]
s2:基于所述历史数据,结合集中式光伏电站的内部设施的物理特性进行数学建模,得到环境模型;
[0123]
s3:预设集中式光伏电站的不确定性因素,基于所述历史数据,对所述不确定性因素进行分析建模,得到分析结果;
[0124]
s4:根据集中式光伏电站的状态空间、操作空间及奖励函数,基于深度强化学习算法对集中式光伏电站的控制决策进行建模,得到运维模型;
[0125]
s5:采用gurobi规划优化运算器,结合所述环境模型,对所述运维模型进行全局寻优,并通过所述分析结果训练所述运维模型;
[0126]
s6:将训练好的运维模型安装于集中式光伏电站中,习得最优实时控制策略。
[0127]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,
本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
[0128]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述系统的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献