基于联合学习的电力负荷预测模型建立方法和装置与流程

2022-02-22 08:48:27 来源：中国专利 TAG：

1.本公开涉及能源技术领域，尤其涉及一种基于联合学习的电力负荷预测模型建立方法、装置、电子设备及计算机可读存储介质。

背景技术：

2.电力负荷预测是电力系统规划的重要组成部分，准确的电力负荷预测是电力系统高效运行的基础。
3.现有技术中，通常基于训练模型进行电力负荷预测。在训练模型时，可能会因为冷启动或其它原因，导致发起方的训练样本数据量不够，并进一步导致发起方建立的电力负荷预测模型的准确性较差。

技术实现要素：

4.有鉴于此，本公开实施例提供了一种基于联合学习的电力负荷预测模型建立方法、装置、电子设备及计算机可读存储介质，以解决现有技术中因发起方的训练样本数据量不够，导致发起方建立的电力负荷预测模型的准确性较差的问题。
5.本公开实施例的第一方面，提供了一种基于联合学习的电力负荷预测模型建立方法，包括：获取发起方的用电负荷数据的数据集和至少一个参与方的用电负荷数据的数据集；确定发起方的用电负荷数据的数据集与至少一个参与方的用电负荷数据的数据集的相似度；基于相似度，在至少一个参与方的用电负荷数据的数据集中确定至少一个目标方的目标用电负荷数据的数据集，并基于发起方的用电负荷数据的数据集和至少一个目标方的目标用电负荷数据的数据集，采用横向联合学习算法进行模型训练；根据模型训练的结果，建立电力负荷预测模型。
6.本公开实施例的第二方面，提供了一种基于联合学习的电力负荷预测模型建立装置，包括：获取模块，被配置为获取发起方的用电负荷数据的数据集和至少一个参与方的用电负荷数据的数据集；确定模块，被配置为确定发起方的用电负荷数据的数据集与至少一个参与方的用电负荷数据的数据集的相似度；训练模块，被配置为基于相似度，在至少一个参与方的用电负荷数据的数据集中确定至少一个目标方的目标用电负荷数据的数据集，并基于发起方的用电负荷数据的数据集和至少一个目标方的目标用电负荷数据的数据集，采用横向联合学习算法进行模型训练；建立模块，被配置为根据模型训练的结果，建立电力负荷预测模型。
7.本公开实施例的第三方面，提供了一种电子设备，包括存储器、处理器以及存储在存储器中并且可以在处理器上运行的计算机程序，该处理器执行计算机程序时实现上述方法的步骤。
8.本公开实施例的第四方面，提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序，该计算机程序被处理器执行时实现上述方法的步骤。
9.本公开实施例与现有技术相比存在的有益效果是：通过获取发起方的用电负荷数
据的数据集和至少一个参与方的用电负荷数据的数据集；确定发起方的用电负荷数据的数据集与至少一个参与方的用电负荷数据的数据集的相似度；基于相似度，在至少一个参与方的用电负荷数据的数据集中确定至少一个目标方的目标用电负荷数据的数据集，并基于发起方的用电负荷数据的数据集和至少一个目标方的目标用电负荷数据的数据集，采用横向联合学习算法进行模型训练；根据模型训练的结果，建立电力负荷预测模型，能够联合与发起方的用电负荷数据的数据集相似的用电负荷数据的数据集，增加发起方训练样本数据量，因此，在发起方训练样本数据量不够的情况下，提高了建立的电力负荷预测模型的准确性，从而使得利用该电力负荷预测模型预测出的电力负荷预测结果的准确性较高，保证了电力系统的高效运行。
附图说明
10.为了更清楚地说明本公开实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。
11.图1是本公开实施例的一种联合学习的架构示意图；
12.图2是本公开实施例提供的一种基于联合学习的电力负荷预测模型建立方法的流程图；
13.图3是本公开实施例提供的另一种基于联合学习的电力负荷预测模型建立方法的流程图；
14.图4是本公开实施例提供的一种基于联合学习的电力负荷预测模型建立装置的示意图；
15.图5是本公开实施例提供的电子设备的示意图。
具体实施方式
16.以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本公开实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本公开。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本公开的描述。
17.联合学习是指在确保数据安全及用户隐私的前提下，综合利用多种ai(artificial intelligence，人工智能)技术，联合多方合作共同挖掘数据价值，催生基于联合建模的新的智能业态和模式。联合学习至少具有以下特点：
18.(1)参与节点控制自有数据的弱中心化联合训练模式，确保共创智能过程中的数据隐私安全。
19.(2)在不同应用场景下，利用筛选和/或组合ai算法、隐私保护计算，建立多种模型聚合优化策略，以获取高层次、高质量的模型。
20.(3)在确保数据安全及用户隐私的前提下，基于多种模型聚合优化策略，获取提升联合学习引擎的效能方法，其中效能方法可以是通过解决包括计算架构并行、大规模跨域网络下的信息交互、智能感知、异常处理机制等，提升联合学习引擎的整体效能。
21.(4)获取各场景下多方用户的需求，通过互信机制，确定合理评估各联合参与方的真实贡献度，进行分配激励。
22.基于上述方式，可以建立基于联合学习的ai技术生态，充分发挥行业数据价值，推动垂直领域的场景落地。
23.下面将结合附图详细说明根据本公开实施例的一种基于联合学习的电力负荷预测模型建立方法、装置、电子设备及计算机可读存储介质。
24.图1是本公开实施例的一种联合学习的架构示意图。如图1所示，联合学习的架构可以包括服务器(中心节点)101以及发起方102、参与方103和参与方104，其中，参与方103和参与方104是基于发起方102与所有参与方中每个参与方的相似度，从所有参与方中挑选出来的目标方。
25.在联合学习过程中，基本模型可以通过服务器101建立，服务器101将该模型发送至与其建立通信连接的发起方102、参与方103和参与方104。基本模型还可以是发起方或任一参与方建立后上传至服务器101，服务器101将该模型发送至与其建立通信连接的发起方和其他参与方。发起方102、参与方103和参与方104根据下载的基本结构和模型参数构建模型，利用本地数据进行模型训练，获得更新的模型参数，并将更新的模型参数加密上传至服务器101。服务器101对发起方102、参与方103和参与方104发送的模型参数进行聚合，获得全局模型参数，并将全局模型参数传回至发起方102、参与方103和参与方104。发起方102、参与方103和参与方104根据接收的全局模型参数对各自的模型进行迭代，直到模型最终收敛，从而实现对模型的训练。在联合学习过程中，发起方102、参与方103和参与方104上传的数据为模型参数，本地数据并不会上传至服务器101，且所有参与方可以共享最终的模型参数，因此可以在保证数据隐私的基础上实现共同建模。需要说明的是，参与方的数量不限于如上所述的两个，而是可以根据需要进行设置，本公开实施例对此不作限制。
26.这里，服务器101可以是提供各种服务的服务器，例如，对与其建立通信连接的发起方或参与方发送的请求进行接收的后台服务器，该后台服务器可以对发起方或参与方发送的请求进行接收和分析等处理，并生成处理结果。服务器101可以是一台服务器，也可以是由若干台服务器组成的服务器集群，或者还可以是一个云计算服务中心，本公开实施例对此不作限制。
27.需要说明的是，服务器101可以是硬件，也可以是软件。当服务器101为硬件时，其可以是为发起方102、参与方103和参与方104提供各种服务的各种电子设备。当服务器101为软件时，其可以是为发起方102、参与方103和参与方104提供各种服务的多个软件或软件模块，也可以是为发起方102、参与方103和参与方104提供各种服务的单个软件或软件模块，本公开实施例对此不作限制。
28.图2是本公开实施例提供的一种基于联合学习的电力负荷预测模型建立方法的流程图。图2的基于联合学习的电力负荷预测模型建立方法可以由服务器或任一参与方执行。如图2所示，该基于联合学习的电力负荷预测模型建立方法包括：
29.s201，获取发起方的用电负荷数据的数据集和至少一个参与方的用电负荷数据的数据集；其中，发起方可以是多个参与方之一。
30.s202，确定发起方的用电负荷数据的数据集与至少一个参与方的用电负荷数据的数据集的相似度；
31.s203，基于相似度，在至少一个参与方的用电负荷数据的数据集中确定至少一个目标方的目标用电负荷数据的数据集，并基于发起方的用电负荷数据的数据集和至少一个目标方的目标用电负荷数据的数据集，采用横向联合学习算法进行模型训练；
32.s204，根据模型训练的结果，建立电力负荷预测模型。
33.具体地，以服务器为例，服务器获取电力负荷预测发起方的用电负荷数据的数据集和至少一个电力负荷预测参与方的用电负荷数据的数据集，并确定发起方的用电负荷数据的数据集中的数据与至少一个参与方中的每个参与方的用电负荷数据的数据集中的数据之间的相似度；基于相似度，服务器在至少一个参与方中确定至少一个电力负荷预测目标方，并将该至少一个电力负荷预测目标方的用电负荷数据的数据集确定为至少一个目标用电负荷数据的数据集，进一步地，服务器基于发起方的用电负荷数据的数据集和至少一个目标用电负荷数据的数据集，执行横向联合学习算法以对基本模型进行训练；服务器根据对基本模型进行训练的结果，最终建立电力负荷预测模型。
34.电力负荷预测发起方为电力负荷预测的发起方，即根据不同应用场景和/或不同预测周期的用电特点，发起电力负荷预测请求的一方；电力负荷预测参与方为电力负荷预测的参与方，即响应于发起方的电力负荷预测请求，提供相应的用电负荷数据的数据集的一方；电力负荷预测目标方为响应于发起方的电力负荷预测请求，参与共同建模并提供相应的用电负荷数据的数据集的一方，是基于相似度，在至少一个参与方中被选中的参与方。需要说明的是，电力负荷预测发起方和电力负荷预测参与方可以位于同一区域，也可以位于不同区域，本公开实施例对此不作限制。例如，电力负荷预测发起方可以为陕西地方电力公司、内蒙古电力集团有限责任公司、湖北丹江电力股份有限公司等，电力负荷预测参与方可以为四川水电投资经营集团公司、广西桂东电力股份有限公司、广西壮族自治区百色电力有限责任公司等。此外，还需要说明的是，本公开实施例对电力负荷预测参与方的数量不作限制，例如，电力负荷预测参与方的数量可以是一个、两个、三个或更多个。
35.发起方的用电负荷数据的数据集和至少一个参与方的数据集包括历史电力负荷数据和对应的外部相关性数据，其中，历史电力负荷数据可以是过去几年、季度或一个月的电力负荷数据，还可以是出现电力负荷突变高点或突变低点时期前后的电力负荷数据，本公开实施例不作限制。外部相关性数据决定电力系统的电力负荷，是影响电力负荷的因子，可以包括：环境类数据；工厂生产相关数据；经济类数据。环境类数据可以包括：用电地域类型(如城区、郊区、居民区、厂区)；时间；天气情况(如日最高气温、日最低气温、湿度、降雨量、气压、风速)；季节性因素；节假日、工作日等，在此不作具体限定。举例来说，在夏季高温经常出现用电高峰期等电力负荷突变高点，而在某些传统重型工业聚焦区域，由于企业搬迁、产能更替等原因，局部地区也可能出现“负荷新低”等电力负荷突变低点，在此不再一一列举。工厂生产相关数据可以进一步包括：生产计划；检修计划；原材料库存；销售情况(如价格)。例如，在生产计划激增时，工厂用电量也会增加。在本说明书实施例中，外部相关性数据还可以包括其他种类，在此不作具体限定，可以根据具体应用场景进行选择。
36.相似度(向量相似度)是指不同样本之间的相似性度量(similarity measurement)，通常采用的方法是计算样本数据间的“距离(distance)”。应理解的是，两个向量的距离越近，则相似度越大。在本公开实施例中，样本数据间的“距离”是指发起方的用电负荷数据的数据集的特征向量与至少一个参与方的用电负荷数据的数据集的特征向量
之间的距离。
37.联合学习可以根据参与各方数据源分布的情况不同分为三类：横向联合学习、纵向联合学习和联合迁移学习。这里，横向联合学习是在两个数据集的用户特征重叠较多而用户重叠较少的情况下，将数据集按照横向(即，用户维度)切分，并取出双方用户特征相同而用户不完全相同的那部分数据进行训练。
38.模型是指对于某个实际问题或客观事物、规律进行抽象后的一种形式化表达方式，通常由目标、变量和关系三部分组成。模型可以包括但不限于数学模型、程序模型、逻辑模型、结构模型、方法模型、分析模型、预测模型、管理模型、数据模型、系统模型等。在本公开实施例中，模型可以是电力负荷预测模型，该电力负荷预测模型可以包括线性回归模型(linear regression model)、支持向量回归模型(support vector regression model)和xgboost模型中的任一种。
39.需要说明的是，本公开实施例的电力负荷预测模型不限于如上所述的线性回归模型、支持向量回归模型和xgboost模型，例如，还可以为逻辑回归模型(logistic regression model)、多项式回归模型(polynomial regression model)、逐步回归模型(stepwise regression model)、岭回归模型(ridge regression model)、套索回归模型(lasso regression model)和elasticnet回归模型等。
40.根据本公开实施例提供的技术方案，通过获取发起方的用电负荷数据的数据集和至少一个参与方的用电负荷数据的数据集；确定发起方的用电负荷数据的数据集与至少一个参与方的用电负荷数据的数据集的相似度；基于相似度，在至少一个参与方的用电负荷数据的数据集中确定至少一个目标方的目标用电负荷数据的数据集，并基于发起方的用电负荷数据的数据集和至少一个目标方的目标用电负荷数据的数据集，采用横向联合学习算法进行模型训练；根据模型训练的结果，建立电力负荷预测模型，能够联合与发起方的用电负荷数据的数据集相似的用电负荷数据的数据集，增加发起方训练样本数据量，因此，在发起方训练样本数据量不够的情况下，提高了建立的电力负荷预测模型的准确性，从而使得利用该电力负荷预测模型预测出的电力负荷预测结果的准确性较高，保证了电力系统的高效运行。
41.在一些实施例中，确定发起方的用电负荷数据的数据集与至少一个参与方的用电负荷数据的数据集的相似度，包括：分别计算发起方的用电负荷数据的数据集与至少一个参与方中的每个参与方的用电负荷数据的数据集的欧式距离，其中，欧式距离用于衡量发起方的用电负荷数据的数据集与参与方的用电负荷数据的数据集的相似度。
42.具体地，服务器分别计算发起方的用电负荷数据的数据集中的数据与至少一个参与方中的每个参与方的用电负荷数据的数据集中的数据之间的欧式距离，其中，欧式距离用于衡量发起方的用电负荷数据的数据集与参与方的用电负荷数据的数据集的相似度，欧式距离越大，相似度越小。
43.欧氏距离也称欧几里得度量(euclidean metric)或欧几里得距离，是指在m维空间中两个点之间的真实距离，或者向量的自然长度(即，该点到原点的距离)。欧氏距离是最常见的距离度量，衡量的是多维空间中两个点之间的绝对距离。欧式距离能够体现个体数值的绝对差异，更多用于需要从维度的数值大小中体现差异的分析，如利用用户行为指标评价用户相似度和差异度。
44.在二维和三维空间中的欧氏距离就是两点之间的实际距离。n维空间的欧氏距离公式如下：
[0045][0046]
其中，x＝(x1,...,xn)，y＝(y1,...,yn)，n为正整数且大于或等于1。
[0047]
在本实施例中，χi表示n维的发起方的用电负荷数据的数据集中的数据对应的特征值，yi表示n维的参与方的用电负荷数据的数据集中的数据对应的特征值。
[0048]
在一些实施例中，分别计算发起方的用电负荷数据的数据集与至少一个参与方中的每个参与方的用电负荷数据的数据集的欧式距离，包括：分别对发起方的用电负荷数据的数据集和至少一个参与方中的每个参与方的用电负荷数据的数据集进行特征提取，其中，特征用向量表示；分别计算发起方的用电负荷数据的数据集的特征向量与至少一个参与方中的每个参与方的用电负荷数据的数据集的特征向量之间的欧式距离。
[0049]
这里，特征提取(feature extraction)是将原始特征转换为一组具有明显物理意义或者统计意义或核的特征。在机器学习、模式识别和图像处理中，特征提取从初始的一组测量数据开始，并建立旨在提供信息和非冗余的派生值(特征)，从而促进后续的学习和泛化步骤，并且在某些情况下带来更好的可解释性。特征提取与降维有关，特征的好坏对泛化能力有至关重要的影响。特征提取的方法可以包括但不限于主成分分析(principal component analysis，pca)、线性判别分析(linear discriminant analysis，lda)、独立成分分析(independent component analysis，ica)、潜在语义索引(latent semantic indexing，lsi)等。进一步地，特征提取会通过数据转换或数据映射得到一个新的特征空间。
[0050]
在一些实施例中，基于相似度，在至少一个参与方的用电负荷数据的数据集中确定至少一个目标方的目标用电负荷数据的数据集，包括：基于欧式距离，确定欧式距离是否小于或等于预设距离阈值；在欧式距离小于或等于预设距离阈值的情况下，确定相似度大于或等于预设相似度阈值；将参与方的用电负荷数据的数据集中相似度大于或等于预设相似度阈值对应的用电负荷数据的数据集确定为目标方的目标用电负荷数据的数据集。
[0051]
具体地，服务器基于发起方的用电负荷数据的数据集中的数据与至少一个参与方中的每个参与方的用电负荷数据的数据集中的数据之间的欧式距离，判断欧式距离是否小于或等于预设距离阈值；进一步地，如果欧式距离小于或等于预设距离阈值，那么相似度就大于或等于预设相似度阈值，服务器将参与方的用电负荷数据的数据集中相似度大于或等于预设相似度阈值对应的用电负荷数据的数据集确定为目标方的目标用电负荷数据的数据集。
[0052]
这里，预设距离阈值可以根据用户需求进行设置，也可以根据默认模式设置，本发明实施例对此不作限定，预设距离阈值可以为3、5、7或9等。可以根据预设的计算公式计算相似度，其中，预设的计算公式为：相似度＝1.0/(1.0 欧式距离)，例如，相似度其中χi表示n维的发起方的用电负荷数据的数据集中的数据对应的特征值，yi表示n维的参与方的用电负荷数据的数据集中的数据对应的特征值。根据预设的计算公式可知，预设相似度阈值＝1.0/(1.0 预设距离阈值)，例如，如果预设距离
阈值为6，那么预设相似度阈值为1.0/(1.0 6)即1/7。
[0053]
示例性的，用电负荷数据的数据集包括发起方的用电负荷数据的数据集、第一参与方的用电负荷数据的数据集、第二参与方的用电负荷数据的数据集、第三参与方的用电负荷数据的数据集和第四参与方的用电负荷数据的数据集，预设距离阈值为5，预设相似度阈值为1/6，发起方的用电负荷数据的数据集与第一参与方的用电负荷数据的数据集的欧式距离为3，相似度为1/4，发起方的用电负荷数据的数据集与第二参与方的用电负荷数据的数据集的欧式距离为4，相似度为1/5，发起方的用电负荷数据的数据集与第三参与方的用电负荷数据的数据集的欧式距离为7，相似度为1/8，发起方的用电负荷数据的数据集与第四参与方的用电负荷数据的数据集的欧式距离为8，相似度为1/9；基于欧式距离，发起方的用电负荷数据的数据集与第一参与方的用电负荷数据的数据集的欧式距离和发起方的用电负荷数据的数据集与第二参与方的用电负荷数据的数据集的欧式距离小于预设距离阈值，因此，发起方的用电负荷数据的数据集与第一参与方的用电负荷数据的数据集的相似度和发起方的用电负荷数据的数据集与第二参与方的用电负荷数据的数据集的相似度均大于预设相似度阈值；第一参与方的用电负荷数据的数据集和第二参与方的用电负荷数据的数据集为目标方的目标用电负荷数据的数据集。
[0054]
可选地，也可以利用其他的方法由欧式距离计算相似度。
[0055]
在一些实施例中，基于相似度，在至少一个参与方的用电负荷数据的数据集中确定至少一个目标方的目标用电负荷数据的数据集，包括：基于欧式距离的大小，确定相似度的大小；根据相似度从大到小的顺序对全部参与方的用电负荷数据的数据集进行排序；选取排序在前的预设个数的参与方的用电负荷数据的数据集作为目标方的目标用电负荷数据的数据集。
[0056]
具体地，欧式距离越小，相似度越大，个体数值的绝对差异越小，基于欧式距离的大小，服务器确定相似度的大小；进一步地，服务器根据相似度的大小，按照相似度从大到小的顺序对全部参与方的用电负荷数据的数据集进行排序；服务器选取排序在前的相似度较大的预设个数的参与方的用电负荷数据的数据集作为目标方的目标用电负荷数据的数据集。
[0057]
这里，预设个数可以根据用户需求进行设置，也可以根据默认模式设置，本发明实施例对此不作限定，预设个数可以为3、5、7或9等。例如，如果发起方的训练样本数据量较少，可以增加预设个数，如果发起方的训练样本数据量较多，可以降低预设个数。
[0058]
在一些实施例中，基于发起方的用电负荷数据的数据集和至少一个目标方的目标用电负荷数据的数据集，采用横向联合学习算法进行模型训练，包括：获取发起方的第一本地模型的模型参数和目标方的第二本地模型的模型参数进行横向联合学习，以得到学习参数，其中，第一本地模型是由发起方采用机器学习算法对发起方的用电负荷数据的数据集在本地进行训练得到的，第二本地模型是由目标方采用机器学习算法对目标方的目标用电负荷数据的数据集在本地进行训练得到的；向发起方和目标方发送学习参数，以使发起方基于学习参数更新第一本地模型和目标方基于学习参数更新第二本地模型。
[0059]
这里，第一本地模型的数量为一个。
[0060]
第二本地模型的数量为至少一个，与目标方的数量一致，每个目标方对其对应的目标用电负荷数据的数据集在本地进行训练得到一个第二本地模型。
[0061]
在一些实施例中，基于发起方的用电负荷数据的数据集和至少一个目标方的目标用电负荷数据的数据集，采用横向联合学习算法进行模型训练，还包括：获取第一本地模型对应的模型权重值和第二本地模型对应的模型权重值，其中，模型权重值是基于用电负荷数据的数据集的样本数量和/或相似度预先设定的；基于第一本地模型的模型参数、第一本地模型对应的模型权重值、第二本地模型的模型参数和第二本地模型对应的模型权重值，进行横向联合学习，以得到学习参数。
[0062]
具体地，当服务器接收到第一本地模型的模型参数和第二本地模型的模型参数后，服务器获取第一本地模型对应的模型权重值和第二本地模型对应的模型权重值，其中，模型权重值是基于用电负荷数据的数据集的样本数量和/或相似度预先设定的，模型权重值是预先存储在服务器中的；当服务器得到第一本地模型对应的模型权重值和第二本地模型对应的模型权重值后，服务器根据第一本地模型对应的模型权重值和第二本地模型对应的模型权重值对第一本地模型和第二本地模型进行横向联合学习，以得到学习参数。例如在横向联合学习过程中，将第一本地模型对应的模型权重值乘以第一本地模型的模型参数，得到第一训练参数，以及将第二本地模型对应的模型权重值乘以第二本地模型的模型参数，得到第二训练参数，然后对一训练参数和第二训练参数进行横向联合学习，以得到学习参数。
[0063]
这里，样本数量可以是100、1000或10000等，例如，发起方的用电负荷数据的数据集包括1000组历史电力负荷数据和和对应的外部相关性数据，那么发起方的用电负荷数据的数据集的样本数量为1000。
[0064]
模型权重值是基于用电负荷数据的数据集的样本数量和/或相似度预先设定的，包括：获取发起方的用电负荷数据的数据集的样本数量和全部目标方中的每个目标方的目标用电负荷数据的数据集的样本数量，以及发起方的用电负荷数据的数据集与全部目标方中的每个目标方的目标用电负荷数据的数据集的相似度；基于用电负荷数据的数据集的样本数量和/或相似度预先设定模型权重值，用电负荷数据的数据集的样本数量越大，该用电负荷数据的数据集对应的发起方或目标方训练的本地模型对应的模型权重值就越高，相似度越大，该相似度对应的目标方训练的第二本地模型对应的的模型权重值就越高。例如，第一本地模型对应的模型权重值可以是发起方的用电负荷数据的数据集的样本数量与发起方的用电负荷数据的数据集的样本数量和目标方的目标用电负荷数据的数据集的样本数量之和的比值，第二本地模型对应的模型权重值的计算公式可以是：
[0065][0066]
其中，n表示目标方的个数，pm表示第m个目标方训练的第二本地模型对应的模型权重值，am表示第m个目标方的目标用电负荷数据的数据集的样本数量，bm表示第m个目标方的目标用电负荷数据的数据集的相似度，相似度可以是1.0/(1.0 欧式距离)，ai表示第i个目标方的目标用电负荷数据的数据集的样本数量，bi表示第i个目标方的目标用电负荷数据的数据集的相似度，az表示第z个目标方的目标用电负荷数据的数据集的样本数量，bz表示第z个目标方的目标用电负荷数据的数据集的相似度。
[0067]
下面，通过具体示例对本公开实施例的第一本地模型对应的模型权重值和第二本地模型对应的模型权重值的计算过程进行详细描述。
[0068]
假设，发起方的用电负荷数据的数据集的样本数量为300，目标方的数量为4个，分别为第一个目标方、第二个目标方、第三个目标方和第四个目标方，第一个目标方的目标用电负荷数据的数据集的样本数量为600，第一个目标方的目标用电负荷数据的数据集与发起方的用电负荷数据的数据集的相似度为0.60，第二个目标方的目标用电负荷数据的数据集的样本数量为500，第二个目标方的目标用电负荷数据的数据集与发起方的用电负荷数据的数据集的相似度为0.85，第三个目标方的目标用电负荷数据的数据集的样本数量为800，第三个目标方的目标用电负荷数据的数据集与发起方的用电负荷数据的数据集的相似度为0.72，第四个目标方的目标用电负荷数据的数据集的样本数量为1000，第四个目标方的目标用电负荷数据的数据集与发起方的用电负荷数据的数据集的相似度为0.64。
[0069]
第一本地模型对应的模型权重值的计算公式为：
[0070][0071]
计算得到的第一本地模型对应的模型权重值为
[0072]
4个目标方分别对其用电负荷数据的数据集在本地进行训练得到第二本地模型，第二本地模型的数量为4个，分别为第一个目标方的第二本地模型、第二个目标方的第二本地模型、第三个目标方的第二本地模型和第四个目标方的第二本地模型。
[0073]
第一个目标方的第二本地模型对应的模型权重值的计算公式为：
[0074][0075]
计算得到的第一个目标方的第二本地模型对应的模型权重值为
[0076]
第二个目标方的第二本地模型对应的模型权重值的计算公式为：
[0077][0078]
计算得到的第二个目标方的第二本地模型对应的模型权重值为
[0079]
第三个目标方的第二本地模型对应的模型权重值的计算公式为：
[0080][0081]
计算得到的第三个目标方的第二本地模型对应的模型权重值为
[0082]
第四个目标方的第二本地模型对应的模型权重值的计算公式为：
[0083][0084]
计算得到的第四个目标方的第二本地模型对应的模型权重值为
[0085]
根据本公开实施例提供的技术方案，通过获取第一本地模型对应的模型权重值和第二本地模型对应的模型权重值，其中，模型权重值是基于用电负荷数据的数据集的样本数量和/或相似度预先设定的；基于第一本地模型的模型参数、第一本地模型对应的模型权重值、第二本地模型的模型参数和第二本地模型对应的模型权重值，进行横向联合学习，以得到学习参数，可以使根据模型训练的结果，建立的电力负荷预测模型更加准确。
[0086]
在一些实施例中，根据模型训练的结果，建立电力负荷预测模型，包括：根据模型训练的结果，将迭代至满足收敛条件的第一本地模型确定为电力负荷预测模型。
[0087]
上述所有可选技术方案，可以采用任意结合形成本技术的可选实施例，在此不再一一赘述。
[0088]
图3是本公开实施例提供的另一种基于联合学习的电力负荷预测模型建立方法的流程图。图3的基于联合学习的电力负荷预测模型建立方法可以由服务器或任一参与方执行。如图3所示，该基于联合学习的电力负荷预测模型建立方法包括：
[0089]
s301，获取发起方的用电负荷数据的数据集和至少一个参与方的用电负荷数据的数据集；其中，发起方可以是多个参与方之一。
[0090]
s302，分别计算发起方的用电负荷数据的数据集与至少一个参与方中的每个参与方的用电负荷数据的数据集的欧式距离，其中，欧式距离用于衡量发起方的用电负荷数据的数据集与参与方的用电负荷数据的数据集的相似度；
[0091]
s303，基于欧式距离的大小，确定相似度的大小；
[0092]
s304，根据相似度从大到小的顺序对全部参与方的用电负荷数据的数据集进行排序，选取排序在前的预设个数的参与方的用电负荷数据的数据集作为目标方的目标用电负荷数据的数据集；
[0093]
s305，基于发起方的用电负荷数据的数据集和至少一个目标方的目标用电负荷数据的数据集，采用横向联合学习算法进行模型训练；
[0094]
s306，根据模型训练的结果，建立电力负荷预测模型。
[0095]
根据本公开实施例提供的技术方案，通过将电力负荷预测发起方的用电负荷数据的数据集和至少一个电力负荷预测参与方的用电负荷数据的数据集进行欧式距离计算，并将欧式距离较小即相似度高的参与方的用电负荷数据的数据集作为目标用电负荷数据的数据集；基于发起方的用电负荷数据的数据集和目标用电负荷数据的数据集，采用横向联合学习算法进行模型训练，能够提高训练电力负荷预测模型所需的样本数据的质量，进而提高了电力负荷预测模型的预测结果的准确性，因此，提高了利用该电力负荷预测模型预测出的电力负荷预测结果的准确性，保证了电力系统的高效运行。
[0096]
下述为本公开装置实施例，可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节，请参照本公开方法实施例。
[0097]
图4是本公开实施例提供的一种基于联合学习的电力负荷预测模型建立装置的示
意图。如图4所示，该基于联合学习的电力负荷预测模型建立装置包括：
[0098]
获取模块401，被配置为获取发起方的用电负荷数据的数据集和至少一个参与方的用电负荷数据的数据集；其中，发起方也可以是多个参与方之一。
[0099]
确定模块402，被配置为确定发起方的用电负荷数据的数据集与至少一个参与方的用电负荷数据的数据集的相似度；
[0100]
训练模块403，被配置为基于相似度，在至少一个参与方的用电负荷数据的数据集中确定至少一个目标方的目标用电负荷数据的数据集，并基于发起方的用电负荷数据的数据集和至少一个目标方的目标用电负荷数据的数据集，采用横向联合学习算法进行模型训练；
[0101]
建立模块404，被配置为根据模型训练的结果，建立电力负荷预测模型。
[0102]
根据本公开实施例提供的技术方案，通过获取发起方的用电负荷数据的数据集和至少一个参与方的用电负荷数据的数据集；确定发起方的用电负荷数据的数据集与至少一个参与方的用电负荷数据的数据集的相似度；基于相似度，在至少一个参与方的用电负荷数据的数据集中确定至少一个目标方的目标用电负荷数据的数据集，并基于发起方的用电负荷数据的数据集和至少一个目标方的目标用电负荷数据的数据集，采用横向联合学习算法进行模型训练；根据模型训练的结果，建立电力负荷预测模型，能够联合与发起方的用电负荷数据的数据集相似的用电负荷数据的数据集，增加发起方训练样本数据量，因此，在发起方训练样本数据量不够的情况下，提高了建立的电力负荷预测模型的准确性，从而使得利用该电力负荷预测模型预测出的电力负荷预测结果的准确性较高，保证了电力系统的高效运行。
[0103]
在一些实施例中，图4的确定模块402分别计算发起方的用电负荷数据的数据集与至少一个参与方中的每个参与方的用电负荷数据的数据集的欧式距离，其中，欧式距离用于衡量发起方的用电负荷数据的数据集与参与方的用电负荷数据的数据集的相似度。
[0104]
在一些实施例中，图4的训练模块403基于欧式距离，确定欧式距离是否小于预设距离阈值；在欧式距离小于预设距离阈值的情况下，确定相似度大于预设相似度阈值；将参与方的用电负荷数据的数据集中相似度大于预设相似度阈值对应的用电负荷数据的数据集确定为目标方的目标用电负荷数据的数据集。
[0105]
在一些实施例中，图4的训练模块403基于欧式距离的大小，确定相似度的大小；根据相似度从大到小的顺序对全部参与方的用电负荷数据的数据集进行排序；选取排序在前的预设个数的参与方的用电负荷数据的数据集作为目标方的目标用电负荷数据的数据集。
[0106]
在一些实施例中，图4的训练模块403获取发起方的第一本地模型的模型参数和目标方的第二本地模型的模型参数进行横向联合学习，以得到学习参数，其中，第一本地模型是由发起方采用机器学习算法对发起方的用电负荷数据的数据集在本地进行训练得到的，第二本地模型是由目标方采用机器学习算法对目标方的目标用电负荷数据的数据集在本地进行训练得到的；向发起方和目标方发送学习参数，以使发起方基于学习参数更新第一本地模型和目标方基于学习参数更新第二本地模型。
[0107]
在一些实施例中，图4的训练模块403获取第一本地模型对应的模型权重值和第二本地模型对应的模型权重值，其中，模型权重值是基于用电负荷数据的数据集的样本数量和/或相似度预先设定的；基于第一本地模型的模型参数、第一本地模型对应的模型权重
值、第二本地模型的模型参数和第二本地模型对应的模型权重值，进行横向联合学习，以得到学习参数。
[0108]
在一些实施例中，图4的建立模块404根据模型训练的结果，将迭代至满足收敛条件的第一本地模型确定为电力负荷预测模型。
[0109]
应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本公开实施例的实施过程构成任何限定。
[0110]
图5是本公开实施例提供的电子设备5的示意图。如图5所示，该实施例的电子设备5包括：处理器501、存储器502以及存储在该存储器502中并且可以在处理器501上运行的计算机程序503。处理器501执行计算机程序503时实现上述各个方法实施例中的步骤。或者，处理器501执行计算机程序503时实现上述各装置实施例中各模块/单元的功能。
[0111]
示例性地，计算机程序503可以被分割成一个或多个模块/单元，一个或多个模块/单元被存储在存储器502中，并由处理器501执行，以完成本公开。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述计算机程序503在电子设备5中的执行过程。
[0112]
电子设备5可以是桌上型计算机、笔记本、掌上电脑及云端服务器等电子设备。电子设备5可以包括但不仅限于处理器501和存储器502。本领域技术人员可以理解，图5仅仅是电子设备5的示例，并不构成对电子设备5的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如，电子设备还可以包括输入输出设备、网络接入设备、总线等。
[0113]
处理器501可以是中央处理单元(central processing unit，cpu)，也可以是其它通用处理器、数字信号处理器(digital signal processor，dsp)、专用集成电路(application specific integrated circuit，asic)、现场可编程门阵列(field-programmable gate array，fpga)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0114]
存储器502可以是电子设备5的内部存储单元，例如，电子设备5的硬盘或内存。存储器502也可以是电子设备5的外部存储设备，例如，电子设备5上配备的插接式硬盘，智能存储卡(smart media card，smc)，安全数字(secure digital，sd)卡，闪存卡(flash card)等。进一步地，存储器502还可以既包括电子设备5的内部存储单元也包括外部存储设备。存储器502用于存储计算机程序以及电子设备所需的其它程序和数据。存储器502还可以用于暂时地存储已经输出或者将要输出的数据。
[0115]
所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本技术的保护范围。上述系统中单
元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。
[0116]
在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。
[0117]
本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本公开的范围。
[0118]
在本公开所提供的实施例中，应该理解到，所揭露的装置/电子设备和方法，可以通过其它的方式实现。例如，以上所描述的装置/电子设备实施例仅仅是示意性的，例如，模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性，机械或其它的形式。
[0119]
作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0120]
另外，在本公开各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。
[0121]
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读存储介质中。基于这样的理解，本公开实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，计算机程序可以存储在计算机可读存储介质中，该计算机程序在被处理器执行时，可以实现上述各个方法实施例的步骤。计算机程序可以包括计算机程序代码，计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括：能够携带计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(read-only memory，rom)、随机存取存储器(random access memory，ram)、电载波信号、电信信号以及软件分发介质等。需要说明的是，计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如，在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。
[0122]
以上实施例仅用以说明本公开的技术方案，而非对其限制；尽管参照前述实施例对本公开进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本公开各实施例技术方案的精神和范围，均应包含在本公开的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种基于时空大数据的目标匹配方法及系统与流程

基于联合学习的电力负荷预测模型建立方法和装置与流程

相关文献

最热文献