一种基于联邦学习的可再生能源日前场景生成方法与流程

2021-10-19 23:20:00 来源：中国专利 TAG： 可再生能源生成联邦对抗场景

1.本发明涉及可再生能源数据整合技术领域，特别涉及一种基于联邦学习和条件wasserstein生成对抗网络的可再生能源日前场景生成方法。

背景技术：

2.近年来，在大数据背景下，人工智能飞速发展，但仍面临着很多挑战。能源互联网内不同系统不同环节会产生海量数据，且具有一定关联性，但都以独立的孤岛形式存在，而传统的分布式计算模型会增加计算和通信成本。为了有效描述可再生能源出力的不确定性并得到更精准的模型，需要将不同信息拥有者之间的数据进行整合，这便会带来数据隐私与安全性问题。另外，当某客户端数据出现严重缺失情况时，由于隐私问题又无法与其它客户端进行联合建模，此时将难以对该可再生能源个体进行有效建模。
3.现有技术一
4.针对数据孤岛问题，主要依靠传统的分布式计算实现。具体形式如下：
5.传统的分布式计算通过整合不同来源的数据进行分布式建模，需要多台机器处理巨大计算量的任务，提升计算效率，但重量级的系统架构会产生高昂的计算和通信成本，影响数据传输和处理效率。各个客户端还会暴露本地数据，即需要上传本地数据，隐私安全无法得到有利保障。
6.现有技术一的缺点
7.通信效率低，数据隐私无法得到保护
8.现有技术二
9.针对可再生能源场景生成方法，主要依靠传统统计学建模方法实现。具体形式如下：
10.马尔科夫链法
1.：是指t 1时刻系统状态的概率分布只与t时刻的状态有关，与t时刻以前的状态无关且从t时刻到t 1时刻的状态转移与t的值无关。这种方法只能针对出力的某一特征进行设计，模型不精准，计算复杂度高。
11.场景树生成法
2.：是描述不确定性决策问题中随机参数的一种有效方式，通过一棵简单的树来实现：一个节点有一个父亲和任意数量的孩子。这个数据结构用来管理层次结构的变换。这种方法无法对可再生能源出力不确定性进行全面建模，适用性不广泛。
12.现有技术二的缺点
13.仅能对可再生能源出力的某一特征将进行设计，而可再生能源出力不确定性包含复杂的气象相关性及时空特征，无法进行全面建模。
14.缩略语和关键术语定义：
15.条件生成对抗网络(cgan)：gan的判别器只能判断真假而无法按照要求控制生成多类数据，为解决此问题，cgan的生成器和判别器均需输入条件值，即生成器输入条件值和噪声，判别器输入生成样本、条件值和噪声，这样可达到输入自定义条件后输出指定数据样本的目的；
16.wasserstein生成对抗网络(wgan)：由于gan与cgan的判别器损失函数是基于js/kl散度的，训练过程不稳定、难度大，甚至容易出现模式崩溃的问题。wgan的提出有效解决了判别器使用js/kl散度作为损失函数会在反向传递中有梯度消失的问题，其主要思想是将wasserstein距离代替js/kl散度。它可以衡量两个概率分布间的距离，即使是没有重叠的两概率分布仍可有效描述其间距离。wgan通过拉近生成数据和真实数据之间的分布，彻底解决了传统gan存在的模式崩溃和多样性不足的问题；
17.cwgan：条件wasserstein生成对抗网络；
18.epoch：指训练集的全部数据对模型进行一次完整训练。
19.参考文献
20.[1]董雷,孟天骄,陈乃仕,李烨,蒲天骄.采用马尔可夫链—多场景技术的交直流主动配电网优化调度[j].电力系统自动化,2018,42(05):147
‑
153；
[0021]
[2]王群,董文略,杨莉.基于wasserstein距离和改进k
‑
medoids聚类的风电/光伏经典场景集生成算法[j].中国电机工程学报,2015,35(11):2654
‑
2661。

技术实现要素：

[0022]
本发明针对现有技术的缺陷，提供了一种基于联邦学习的可再生能源日前场景生成方法，解决了现有技术中存在的缺陷。
[0023]
为了实现以上发明目的，本发明采取的技术方案如下：
[0024]
一种基于联邦学习的可再生能源日前场景生成方法，包括以下步骤：
[0025]
1)定义并设置训练参数：
①
m为客户端，即可再生能源场站，
②
t为每次梯度上传至中心服务器前cwgan训练次数；
③
n为梯度上传至服务器次数，
④
r
m
为各场站可再生能源出力功率实测值的集合，为第m个场站数据占所有场站总数据的比例；
[0026]
2)数据预处理：进行数据清洗，舍弃偏差过大的数据，随后将可再生能源日前预测值与实测值进行归一化处理。
[0027]
3)本地计算：各可再生能源场站m分别将预测值与符合标准正态分布的噪声纵向拼接后输入生成器并输出生成样本，将预测值与实测值纵向拼接、预测值与生成样本纵向拼接后输入判别器并输出判别值；使用wgan
‑
gp方法，选取梯度惩罚采样点，计算生成器和判别器的损失，采用rmsprop优化算法更新t次生成器和判别器权重参数，分别得到
[0028]
4)模型扰动：每个场站m产生一个符合高斯分布的noise，即noise＝n(μ,σ2)，使用扰动本地模型；
[0029]
5)模型聚合：中心服务器获取各场站m上传的生成器权重参数判别器权重参数计算本轮生成器更新的权重和判别器更新的权重
[0030]
6)模型广播：中心服务器将新的模型等参数广播给各场站；
[0031]
7)本地模型更新并上传：各场站利用新的梯度进行本地计算，训练过程与3)相同，得到生成器权重判别器权重上传至中心服务器；
[0032]
8)重复步骤5)
‑
7)至epoch＝n，训练结束。
[0033]
9)保存训练的cwgan生成器模型参数，输入可再生能源出力功率日前预测值与n个符合标准正态分布的噪声，由此生成器可以输出得到由n个日前场景所构成的日前场景集。
[0034]
进一步地，所述生成器结构与参数如下表所示：
[0035][0036]
进一步地，所述判别器结构与参数如下表所示：
[0037][0038]
与现有技术相比，本发明的优点在于：
[0039]
1、较好地构建可再生能源日前场景生成的模型，cwgan可以有效学习到出力特征和日前出力不确定性。
[0040]
2、利用黑盒模型具有广泛适用性。
[0041]
3、保护各客户端数据隐私安全。
[0042]
4、当某客户端数据出现严重缺失情况时，可以对该可再生能源端进行有效建模。
附图说明
[0043]
图1为本发明实施例风电日前场景集图；图1(a)为布鲁塞尔首都区；图1(b)为弗拉芒区；图1(c)瓦隆区；
[0044]
图2为本发明实施例自相关系数示意图；图2(a)为布鲁塞尔首都区；图2(b)为弗拉芒区；图2(c)瓦隆区；
[0045]
图3为本发明实施例偏自相关系数示意图；图3(a)为布鲁塞尔首都区；图3(b)为弗拉芒区；图3(c)瓦隆区；
[0046]
图4为本发明实施例基于cwgan与基于联邦学习和cwgan方法生成的风电日前场景集示意图；图4(a)为仅使用cwgan训练生成的风电日前场景集；图4(b)为基于联邦学习的cwgan方法生成的风电日前场景集。
具体实施方式
[0047]
为使本发明的目的、技术方案及优点更加清楚明白，以下结合附图并列举实施例，对本发明做进一步详细说明；
[0048]
本发明使用的cwgan模型结合cgan和wgan优点，可以输出指定类别样本且更易训练；卷积网络在分析采样点与局部输入信息关联性方面优于全连接网络，因此选用卷积神经网络设计cwgan模型；模型的输入为指定维数噪声z与条件c纵向拼接而成的一个矩阵，这样可以使噪声和预测值时刻产生上下映射的关系，利于卷积核进行相关性分析。
[0049]
网络层数的增多会导致训练时参数进入激活函数的饱和区或死区，使网络训练困难；因此本发明设计的生成器共进行3次2d反卷积操作，每个2d反卷积层后都接有leakyrelu激活函数；激活函数选择使用leakyrelu，是因为相比relu函数而言，小于零的梯度也具有训练能力，且leakyrelu激活函数降低神经网络权重的稀疏性，有利于梯度值从判别器反向传播到生成器中；生成器参数如表1所示。
[0050]
表1生成器结构与参数
[0051][0052][0053]
判别器由预测条件与生成样本或真实样本纵向拼接后的矩阵作为输入，进行3次2d反卷积和一次全连接操作；每个2d反卷积后都接有正则化层，可以有效避免其进入激活函数死区或饱和区间，使数据正态分布，增强训练能力；每个正则化层后所接的激活函数选择leakyrelu；在全连接层前加入dropout层，可以使模型在训练过程中可以降低节点间依
赖性，将部分隐含层权重或输出置为0，降低过拟合概率；最后通过全连接层展平高维数据，输出判别值。
[0054]
表2判别器结构与参数
[0055][0056]
联邦学习系统主要由各客户端和中心服务器组成，中心服务器主要负责收集各客户端上传的梯度，随后进行梯度平均并将新的梯度下发给各客户端。
[0057]
具体步骤如下所示：
[0058]
1)定义并设置训练参数：
①
m为客户端，即可再生能源场站，
②
t为每次梯度上传至中心服务器前cwgan训练次数；
③
n为梯度上传至服务器次数，
④
r
m
为各场站可再生能源出力功率实测值的集合，为第m个场站数据占所有场站总数据的比例；
[0059]
2)数据预处理：进行数据清洗，舍弃偏差过大的数据，随后将可再生能源日前预测值与实测值进行归一化处理。
[0060]
3)本地计算：各可再生能源场站m分别将预测值与符合标准正态分布的噪声纵向拼接后输入生成器并输出生成样本，将预测值与实测值纵向拼接、预测值与生成样本纵向拼接后输入判别器并输出判别值；使用wgan
‑
gp方法，选取梯度惩罚采样点，计算生成器和判别器的损失，采用rmsprop优化算法更新t次生成器和判别器权重参数，分别得到
[0061]
4)模型扰动：每个场站m产生一个符合高斯分布的noise，即noise＝n(μ,σ2)，使用扰动本地模型；
[0062]
5)模型聚合：中心服务器获取各场站m上传的生成器权重参数判别器权重参数计算本轮生成器更新的权重和判别器更新的权重
[0063]
6)模型广播：中心服务器将新的模型等参数广播给各场站；
[0064]
7)本地模型更新并上传：各场站利用新的梯度进行本地计算，训练过程与3)相同，得到生成器权重判别器权重上传至中心服务器；
[0065]
8)重复步骤5)
‑
7)至epoch＝n，训练结束。
[0066]
9)保存训练的cwgan生成器模型参数，输入可再生能源出力功率日前预测值与n个符合标准正态分布的噪声，由此生成器可以输出得到由n个日前场景所构成的日前场景集。
[0067]
为验证本发明所提日前场景生成方法的准确性，进行以下试验：
[0068]
三个风电场的生成器分别输入日前预测值与800组噪声进行拼接后的矩阵，客户端每训练10个epoch上传梯度参数，中心服务器做梯度聚合、广播15000次，三个大区生成的风电出力功率日前场景集分别如图1所示。
[0069]
从图1可以看出基于本发明所提方法生成的风电日前场景集出力趋势与预测值基本相同，无明显异常波动，实测值可以较好地包络于场景集内。计算出生成场景集和实测数据的自相关系数与偏自相关系数分别如图2和图3所示。
[0070]
从图2和图3中可以看出比利时三个大区风电场生成场景集的相关系数波动趋势近似，这与其地区相近有关。图2可以清楚看出比利时三个大区风电场生成场景在滞后时刻为0小时时，自相关系数为1；滞后时刻为1
‑
6小时时，自相关系数随时间间隔增大而减小，且都具有一定的相关性。图3显示出三个大区生成场景在滞后时刻为0小时时，偏自相关系数为1；滞后时刻为1小时时，具有强偏自相关性；当时间间隔大于1小时时，出力点间偏自相关系数减小，偏自相关性减弱。从上述分析可以得出，相关系数变化特征符合可再生能源出力特点。
[0071]
由于数据在采集、传输、录入过程中，可能由于工作失职、录入数据失误等主观因素或设备故障、线路中断等客观因素，导致数据缺失。为了模拟在某风电场数据大量缺失情况下，使用本发明提出的方法与单纯使用cwgan训练生成日前场景集的效果，假设比利时三个大区中布鲁塞尔首都区的2019年全年风电出力日前预测值和实际值仅有80天数据，即1920组数据，弗拉芒区和瓦隆区样本量不变，依然为8760组数据。
[0072]
算例在其它实验条件都相同的情况下进行仿真，图4(a)为布鲁塞尔首都区风电场仅使用cwgan训练出的生成日前场景集，图4(b)为基于联邦学习和cwg an方法下布鲁塞尔首都区风电场生成的日前场景集。
[0073]
从图4(b)中可以看出生成曲线出力趋势与日前预测值大致相同，相较于图4(a)来说实测值被更好的包络于生成场景区间内，计算出的评价指标如表3所示。
[0074]
表3基于cwgan与基于联邦学习和cwgan方法场景生成指标计算结果
[0075][0076]
由表3可知，本发明提出的方法在100％置信区间内可以完整地包含风电实测值，而cwgan训练的结果覆盖率仅为一半左右。在其它相同置信度区间内，基于联邦学习的cwgan方法生成场景的覆盖率都大幅高于仅使用cwgan的方法；在功率区间相近时，覆盖率也高于cwgan的方法。因此本发明提出的基于联邦学习和cwgan的可再生能源日前场景生成方法相较于单纯的cwga n方法来说，可以在某风电场数据缺失的情况下提高该风电场日前场景生成的效果，有效地对缺失数据的客户端进行建模。
[0077]
本领域的普通技术人员将会意识到，这里所述的实施例是为了帮助读者理解本发明的实施方法，应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例；本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合，这些变形和组合仍然在本发明的保护范围内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

一种基于联邦学习的可再生能源日前场景生成方法与流程

相关文献

最热文献