一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于LOF离群因子检测算法的光伏发电上网数据校核方法与流程

2022-04-30 12:04:07 来源:中国专利 TAG:

基于lof离群因子检测算法的光伏发电上网数据校核方法
技术领域
1.本发明涉及电力大数据分析领域,尤其涉及一种基于lof离群因子检测算法的光伏发电上网数据校核方法。


背景技术:

2.随着国民经济的飞速发展,各行各业对电力的需求量迅速增长。面对化石能源的紧缺以及环境污染等严峻问题,发展可再生能源成为重中之重。分布式发电由于其安装地点灵活、环保、能带来收益等特点,吸引了越来越多的用户开始安装分布式光伏发电系统。
3.准确的光伏容量信息对于负荷预测、用户需求侧响应容量估计以及发放光伏补贴等至关重要。虽然在安装分布式光伏发电系统时会报备光伏容量,但由于故障导致光伏系统停运以及用户私自扩容等现象,系统记录的安装容量与实际容量不符,增加了电力系统运行的不稳定性,给电网造成不利影响。


技术实现要素:

4.本发明针对以上问题,提供了一种基于lof离群因子检测算法的光伏发电上网数据校核方法。
5.本发明的技术方案为:包括以下步骤:
6.(1)对全体用户的日发电量数据进行平滑处理;
7.(2)建立基于bp神经网络的光伏日发电量预测模型,对发电量进行预测;
8.(3)对比用户的实际发电量和预测发电量建立偏差模型;
9.(4)基于lof离群因子检测算法对偏差模型进行离群计算;
10.(5)依据离群计算的结果进行校核,并优化各影响因子比重重复计算,最终结果作为光伏发电上网数据校核的结果。
11.步骤(1)中,对全体用户的日发电量数据进行如下处理:
12.(1.1)对单个用户的日发电量数据进行去噪;
13.(1.2)利用滑动平均法补全用户的日发电数据;
14.步骤(2)中,对建立基于bp神经网络的光伏日发电量预测模型,对发电量进行预测:
15.(2.1)确定隐含层的个数公式:
[0016][0017]
其中,m是输入神经元个数,n是输出神经元个数,a是介于1~10之间的常数;
[0018]
(2.2)将所有用户的发电量按照以下公式计算决定系数:
[0019]
[0020]
其中,n为样品数目,是预测值,yi是实际值;
[0021]
(2.3)按照计算出的决定系数r2计算各用户的预计发电量。
[0022]
步骤(3)中,对比用户的实际发电量和预测发电量建立偏差模型:
[0023]
计算的预测发电量与实际发电量的绝对差值,百分数差值。
[0024]
步骤(4)中,基于lof离群因子检测算法对偏差模型进行离群计算:
[0025]
(4.1)采用欧几里得距离反映各数据点之间的距离,离群因子lof的阈值采用统计的方法获得,利用箱型图进行界定,确定最终阈值;
[0026]
(4.2)计算各个用户的lof值,lof值越大,该数据的离群度越高。
[0027]
步骤(5)中,依据离群计算的结果进行校核,并优化各影响因子比重重复计算:
[0028]
对离群度高的用户进行核查,并追踪实际情况,反馈给系统调整影响因子重新计算。
[0029]
步骤(3)中,实际发电量的影响因子包括:日最高气温、日最低气温、日平均气温、风力、空气质量和辐射量。
[0030]
本发明采用了lof离群因子检测算法对用户的单位容量日发电量数据进行检测,找出其中的问题用户以供排查,其结果具有较高的准确性和直观性,无论是私自扩容导致的光伏发电量上升还是利用储能冒充光伏发电,均能可靠地识别出异常,提高可靠性。
附图说明
[0031]
图1是本发明的流程图,
[0032]
图2是bp神经网络计算权值修正算法流程模型图,
[0033]
图3是离群因子分布图,
[0034]
图4是实际发电量的影响因子示意图。
具体实施方式
[0035]
下面结合附图对本发明的技术方案作进一步说明。应当了解,以下提供的实施例仅是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的技术构思,本发明还可以用许多不同的形式来实施,并且不局限于此处描述的实施例。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。
[0036]
本发明如图1所示,包括以下步骤:
[0037]
(1)对全体用户的日发电量数据进行平滑处理;具体而言,利用滑动平均法(moving average)将缺失点将附近的采样点做算数平均,作为这个点光滑后的值,这样,用来补全数据。
[0038]
(2)建立基于bp神经网络的光伏日发电量预测模型,对发电量进行预测;
[0039]
(3)对比用户的实际发电量和预测发电量建立偏差模型;
[0040]
(4)基于lof离群因子检测算法对偏差模型进行离群计算;
[0041]
(5)依据离群计算的结果进行校核,并优化各影响因子比重重复计算,最终结果作为光伏发电上网数据校核的结果。优化时,对高离群用户进行核查,结合实际情况调整影响因子和lof离群阈值,降低高离群用户数量。
[0042]
本发明采用了lof离群因子检测算法对用户的单位容量日发电量数据进行检测,
找出其中的问题用户以供排查。本发明采用了1000户用户信息对所提方法进行仿真测验,其结果具有较高的准确性和直观性,无论是私自扩容导致的光伏发电量上升还是利用储能冒充光伏发电,均能可靠地识别出异常。
[0043]
如图4所示,步骤(3)中,实际发电量的影响因子包括:日最高气温、日最低气温、日平均气温、风力、空气质量和辐射量。通过影响因子之间的比重关系,进而获取实际发电量。
[0044]
如图2所示,基于bp神经网络的光伏日发电量预测模型,对发电量进行预测:
[0045]
首先:建立一个四层的bp神经网络。其包含一个输入层,两个隐藏层以及一个输出层,两个输入分别为x1和x2,其分别通过两条连接线与隐含层最上方的神经元相连,每条线上都有对应的权重w,为了提高神经网络的非线性能力,每个神经元都有一个激活函数f,神经元的输出为y=f(w1·
x1 w2·
x2),前向传播计算出最后结果后,将计算结果与期望值相减得到误差,并将此误差反向传播。根据梯度下降法的原理,对每条连接线上的权值进行修正,权值修正公式为多次迭代直至误差在允许范围内,此时神经网络的权值训练完毕。
[0046]
其次:根据相似日理论,即天气特征相近时,光伏电源的输出功率曲线高度相似的特点,计算时输入为一段时间内某用户所在区域的天气特征量,包括日最高气温、日最低气温、日平均气温、风力、空气质量和太阳辐射量,输出为该用户日发电量。隐含层的个数可通过以下经验公式获得:
[0047][0048]
其中,m是输入神经元个数,n是输出神经元个数,a是介于1~10之间的常数。
[0049]
以2018年1月起至2020年10月,共1035天的数据作为样本,其中1000天为训练集,35天为测试集,epoch设置为1000,学习率设为0.01。选用了决定系数r2来反映一个随机变量与多个随机变量关系的数字特征以及因变量变化的可靠程度,r2越接近1,则预测效果越好。其计算公式如下:
[0050][0051]
其中,n为样品数目,是预测值,yi是实际值。
[0052]
最终,根据bp神经网络的输出值和实际发电量对比,其决定系数r2可达0.99242。
[0053]
如图3所示,基于lof离群因子检测算法对偏差模型进行离群计算:
[0054]
步骤一:根据各个用户的实际值与预测值计算绝对差值和百分数差值。
[0055]
步骤二:同样采用上述1000户用户2018年1月至2020年10月的日发电量数据为样本进行检验分析,采用欧几里得距离反映各数据点之间的距离,离群因子lof的阈值采用统计的方法获得,利用箱型图进行界定,最终阈值选取为27。依据以下步骤进行离群度计算:
[0056]
(1)第k距离:dk(o)为点o的第k距离,dk(o)=d(o,p),当满足如下两个条件时,点p是距离o点最近的第k个点。
[0057]
a)在集合中至少存在除o以外的k个点p

,使得d(o,p

)≤d(o,p);
[0058]
b)在集合中至多存在k-1个点p

,使得d(o,p

)≤d(o,p);
[0059]
(2)点o的k距离领域(k-distance neighborhood of an object o,nk(o)):与点o之间的距离小于第k距离的所有对象的集合,即以o为中心,dk(o)为半径的区域内对象的集合;
[0060]
(3)点p到点o的第k可达距离:dk(o,p)=max{dk(o),d(o,p)}。点p到点o的第k可达距离至少是dk(o);距离点o最近的k个点到点o的可达距离被认为是相当的,均等于dk(o);
[0061]
(4)局部可达密度可表示为k距离领域内所有点到点o的平均可达距离取倒数,其表达式如下:
[0062][0063]
(5)离群子lofk(o):点o的领域内其他点的局部可达密度与点o的局部可达密度之比的平均数;其表达式如下:
[0064][0065]
若lofk(o)接近1,说明o点的领域点密度差不多,可能来自于同一类簇,若小于1,说明o为密集点,若大于1,说明o的密度小于其领域点密度,可能为异常点。
[0066]
如图3反映了计算的最终结果,横纵坐标标明位置,黑点代表每位用户的数据点,圆圈反映了离群因子的大小,圆圈越大,lof值越大,该数据点离群度越高,采用lof离群因子检测算法具有较强的直观性。
[0067]
步骤三:将步骤二中的离群度高的点筛选出,结合线下检核的方式,对结果进行检验。并反馈匹配度,调整影响因子和lof离群阈值,最终将匹配度达到90%以上。
[0068]
离群点检测是数据挖掘的重要部分,其目的是发现与其他对象一般行为或特征显著不同的对象。大部分的数据挖掘方法会把这种差异信息视为噪声丢弃,然而在本发明中,这些异常数据背后往往是用户的私自行为。本发明采用离群点检测的方法对全部用户的单位容量日发电量进行检测,找出其中的疑似用户供排查。
[0069]
对电力系统而言,准确的安装容量信息,可以提高电力系统运行的稳定性和可靠性,降低分布式光伏对电网带来的不利影响;对国家而言,准确的安装容量信息是精准补贴光伏用户的必要条件;对用户本身而言,提高光伏容量的准确性可以降低分布式光伏带来的一些潜在风险。
[0070]
因此,及时发现光伏容量异常的用户具有重要的实际意义。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献