一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于多分类TrAdaBoost的目标域负荷识别方法与流程

2022-06-15 20:54:40 来源:中国专利 TAG:

基于多分类tradaboost的目标域负荷识别方法
技术领域
1.本发明属于负荷识别技术领域,尤其涉及一种基于多分类tradaboost的目标域负荷识别方法。


背景技术:

2.随着数字电网的发展,用户级负荷数据的利用价值日益凸显,用于挖掘其信息的负荷识别技术是实现需求响应、用户能源管理、细粒度负荷预测的基础。但目前绝大多数负荷识别研究仅针对单一的源域数据集,即讨论在一个包含较多预先收集的用电负荷样本的数据集上的识别效果。但实际家庭用电负荷种类、品牌众多,源域数据集所包含的样本只占一小部分。将负荷识别模型投入实际应用时,由于不同地区的负荷电器品牌、生产标准、测量手段等的差异,导致实际应用的目标域数据分布与源域数据集上的分布不同,致使训练好的模型性能可能出现大幅下降。现有少量研究使用深度学习模型在样本量较大的源域数据集中进行预训练,在样本量较小的目标域数据集中进行微调来应对这一问题,但难以收集到样本量足够的源域数据集,且目标域数据集样本量较小,微调容易导致过拟合,未能针对负荷识别领域的特点。文献(陈红,余志斌.基于深度迁移学习的家用电器识别研究[j].传感器与微系统,2020,039(006):48-50,54.)采用alexnet进行预训练与微调对v-i图进行负荷识别,虽使用大型图像数据集进行预训练减少了源域样本量较少的影响,但其目标域样本量较少且丰富度较低,容易导致过拟合。文献(梁家阁.基于可变输入lstm和迁移学习的非侵入式电力负荷分解[d].湖南科技大学.)采用lstm进行预训练与微调实现负荷分解,但受限于目标域样本量较少,微调后的泛化性能较低。基于此,如何在有效利用源域数据集与少量有标注的目标域数据集,是提升负荷识别模型在目标域应用效果的关键。


技术实现要素:

[0003]
本发明要解决的技术问题:提供一种基于多分类tradaboost的目标域负荷识别方法,以解决对源域、目标域样本量较少的场景下负荷准确识别。
[0004]
本发明技术方案:
[0005]
一种基于多分类tradaboost的目标域负荷识别方法,所述方法为通过预先采集单体负荷波形数据构建电气特征,建立源域数据集,再针对实际应用环境采集并标注数据建立目标域数据集,使用多分类tradaboost算法进行训练,利用源域中域间差异小的样本,实现目标域负荷识别。
[0006]
所述方法具体包括:
[0007]
步骤s1、预先通过智能插座采集电器负荷波形数据;
[0008]
步骤s2、对步骤s1中获得的负荷波形数据进行滑窗式事件检测,得到单体负荷波形数据;
[0009]
步骤s3、对步骤s2中获得的单体负荷波形数据构造电气特征,建立源域数据集;
[0010]
步骤s4、对目标应用场景按步骤s1~s3构建目标域数据集;
[0011]
步骤s5、对步骤s3、s4获得的源域、目标域数据集,使用多分类tradaboost算法进行训练与参数调优;
[0012]
步骤s6、将步骤s5训练得到的目标域负荷识别模型进行目标域负荷识别。
[0013]
智能插座采集电器负荷波形数据采样频率大于1000hz。
[0014]
对步骤s1中获得的负荷波形数据进行滑窗式事件检测是通过负荷电流序列在负荷事件发生前后的统计学差异进行检测。
[0015]
滑窗式事件检测采用cusum算法,通过负荷事件发生前后,在首末端窗口中的统计学差异进行检测,决策判据如下式所示:
[0016][0017]
其中,d为决策的阈值,对应滑动时间窗前后端两个电流序列的计算均值,的计算方法如下式所示:
[0018][0019]
其中,n1为滑动窗前端对应的采样点个数,ii为对应滑动时间窗内第i个采样点的电流值。
[0020]
构造电气特征包括:电流平均值、电流峰峰值、电流有效值、电流波形系数、电流峰均比、有功功率、无功功率、视在功率、功率因数、阻抗值和电流3、5、7次谐波值;电流3、5、7次谐波值由傅里叶分解计算得到;电流峰峰值为电流序列最大值与最小值之差,电流有效值i
rms
、电流波形因数i
rms-abmean
、电流峰均比i
p-rms
的计算公式如下所示:
[0021][0022][0023][0024]
其中,n为单体负荷波形序列的采样点总数,ii为第i个采样点的电流值;
[0025]
视在功率s为电流、电压有效值的乘积,有功功率p、无功功率q、功率因数的计算公式如下所示:
[0026][0027][0028]
[0029]
其中,n为单体负荷波形序列的采样点总数,ui、ii为第i个采样点的电压、电流值;
[0030]
阻抗值为电压、电流有效值之比。
[0031]
目标域数据集样本量少于源域数据集,随机抽取5~10户目标用户家庭,对电器构建目标域数据集。
[0032]
步骤s5所述的多分类tradaboost算法的基学习器为决策树,所述的参数调优通过在目标域数据集上进行五折交叉验证实现。
[0033]
步骤s5所述对步骤s3、s4获得的源域、目标域数据集,使用多分类tradaboost算法进行训练的方法包括:
[0034]
首先、使用源域、目标域样本量的倒数为源域、目标域样本分别赋予初始权重;
[0035]
采用决策树算法对源域、目标域训练集的并集进行训练,计算目标域训练集上的错误率ε
t
,计算公式如下所示:
[0036][0037]
其中,n为目标域样本数,为第i个目标域训练样本的权重,h
t
(xi)、y(xi)分别为第t次迭代中决策树模型对第i个目标域训练样本的预测输出与对应真实标签;
[0038]
参数α
t
、α的计算公式如下所示:
[0039][0040][0041]
其中,k为负荷类别数,m为源域样本数,n为tradaboost算法的迭代次数;
[0042]
按以下公式分别对源域、目标域的样本更新权重:
[0043][0044][0045]
将除权重初始化外的其它步骤循环n次,最终经过多分类tradaboost算法训练的决策树集成模型如下式所示:
[0046][0047]
其中,h
t
(x)对应第t次迭代中训练的决策树模型。
[0048]
参数调优以五折交叉验证的准确率作为指标,对tradaboost迭代次数、决策树最大深度和决策树叶子节点上最小样本数超参数进行寻优;五折交叉验证为将目标域数据集随机划分成互不相交的5等份,依次取其中一份作为验证集,另外四份作为训练集,取模型在验证集上准确率的平均值作为最终的交叉验证准确率。
[0049]
本发明的有益效果:
[0050]
本发明通过预先采集单体负荷波形数据构建电气特征,建立源域数据集,再针对实际应用环境采集并标注少量数据建立目标域数据集,使用多分类tradaboost算法进行训练,利用源域中域间差异较小的样本,提高目标域识别性能。本发明的负荷识别方法,对源域、目标域样本量较少的场景适应性强,是提升负荷识别模型在目标域上应用效果的关键技术。
[0051]
本发明设计了一种基于多分类tradaboost的目标域负荷识别方法,可有效利用源域数据集与目标域数据集,减少因电器品牌、生产标准、测量手段等不同造成的分布差异对实际应用的影响,提高数据量较少的目标域负荷识别效果。
[0052]
本发明设计了一种基于多分类tradaboost的目标域负荷识别方法,针对负荷识别领域中源域、目标域样本较少的问题,提出了一种适用于负荷识别领域的迁移学习方法,对样本量的依赖较小。
[0053]
解决了对源域、目标域样本量较少的场景下负荷准确识别。
附图说明:
[0054]
图1为本发明流程示意图。
具体实施方式
[0055]
请参考图1,本发明基于多分类tradaboost的目标域负荷识别方法包括以下步骤:
[0056]
步骤s1,预先通过智能插座采集电器负荷数据。步骤s1所述智能插座的采样频率需大于1000hz,满足事件检测以及频域电气特征计算精度的要求;本例的智能插座的采样频率为6.4khz,采集开始两秒后负荷投入,共采集10s的负荷波形数据。
[0057]
步骤s2,对步骤s1中获得的负荷波形数据进行滑窗式事件检测。滑窗式事件检测采用cusum算法,通过负荷事件发生前后,在首末端窗口中的统计学差异进行检测,决策判据如下式所示:
[0058][0059]
其中,d为决策的阈值,对应滑动时间窗前后端两个电流序列的计算均值,的计算方法如下式所示:
[0060][0061]
其中,n1为滑动窗前端对应的采样点个数,ii为对应滑动时间窗内第i个采样点的电流值。
[0062]
步骤s3,对步骤s2中获得的单体负荷波形数据构造电气特征,建立源域数据集。构造的电气特征为电流平均值、电流峰峰值、电流有效值、电流波形系数、电流峰均比、有功功率、无功功率、视在功率、功率因数、阻抗值、电流3、5、7次谐波值。其中,电流3、5、7次谐波值由傅里叶分解计算得到。电流峰峰值为电流序列最大值与最小值之差,电流有效值i
rm

、电流波形因数i
rms-abmean
、电流峰均比i
p-rms
的计算公式如下所示:
[0063][0064][0065][0066]
其中,n为单体负荷波形序列的采样点总数,ii为第i个采样点的电流值。
[0067]
视在功率s为电流、电压有效值的乘积,有功功率p、无功功率q、功率因数的计算公式如下所示:
[0068][0069][0070][0071]
其中,n为单体负荷波形序列的采样点总数,ui、ii为第i个采样点的电压、电流值。
[0072]
阻抗值为电压、电流有效值之比。
[0073]
步骤s4,在目标应用场景按步骤s1~s3构建目标域数据集。步骤s4所述的目标域数据集样本量应少于源域数据集,提高实际应用的效率。
[0074]
随机抽取5~10户目标用户家庭,对常用电器构建目标域数据集。
[0075]
步骤s5,对步骤s3、s4获得的源域、目标域数据集,使用多分类tradaboost算法进行训练与参数调优。多分类tradaboost算法的主要步骤分为样本权重更新与目标域训练集错误率及相关参数计算。
[0076]
首先,使用源域、目标域样本量的倒数为源域、目标域样本分别赋予初始权重。
[0077]
采用决策树算法对源域、目标域训练集的并集进行训练,计算目标域训练集上的错误率ε
t
,计算公式如下所示:
[0078][0079]
其中,n为目标域样本数,为第i个目标域训练样本的权重,h
t
(xi)、y(xi)分别为第t次迭代中决策树模型对第i个目标域训练样本的预测输出与对应真实标签。
[0080]
参数α
t
、α的计算公式如下所示:
[0081]
[0082][0083]
其中,k为负荷类别数,m为源域样本数,n为tradaboost算法的迭代次数。
[0084]
按以下公式分别对源域、目标域的样本更新权重:
[0085][0086][0087]
将除权重初始化外的其它步骤循环n次,最终经过多分类tradaboost算法训练的决策树集成模型如下式所示:
[0088][0089]
其中,h
t
(x)对应第t次迭代中训练的决策树模型。
[0090]
参数调优以五折交叉验证的准确率作为指标,对tradaboost迭代次数、决策树最大深度、决策树叶子节点上最小样本数等超参数进行寻优。五折交叉验证为将目标域数据集随机划分成互不相交的5等份,依次取其中一份作为验证集,另外四份作为训练集,取模型在验证集上准确率的平均值作为最终的交叉验证准确率。
[0091]
步骤s6,将步骤s5训练得到的目标域负荷识别模型投入实际应用。对采集的电气数据进行实时的事件检测,对提取的单体负荷电压、电流波形构造电气特征量,将特征向量输入利用多分类tradaboost算法训练得到的决策树集成模型,输出负荷识别结果。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献