一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种输变电设备状态监测数据的预处理方法及系统与流程

2021-10-24 11:08:00 来源:中国专利 TAG:预处理 数据处理 监测 输变电 状态


1.本发明涉及电力数据处理技术领域,具体涉及一种输变电设备状态监测数据的预处理方法及系统。


背景技术:

2.输电线路设备状态监测系统是实现输变电设备状态运行检修管理、提升输变电专业生产运行管理精益化水平的重要技术手段。系统通过各种传感器技术、广域通信技术和信息处理技术实现各类输变电设备运行状态的实时感知、监视预警、分析诊断和评估预测。随着国家电网公司建设“一强三优”现代公司及坚强智能电网战略的快速推进,采用科技手段提高电网安全运行水平成为现代化电网发展的必然趋势。输电线路在线监测作为国家智能电网工程中极其重要的组成部分,是实现国家电网的可靠、安全、经济、高效、环境友好目标的主要手段,对进一步提高电力安全运行水平具有十分积极的意义。
3.现有技术cn201610061402.1公开了一种输电线路在线监测数据的通信方法及系统,通过在输电线路上布置终端监测节点及汇聚节点;采集输电线路当前的监测数据;将监控数据汇聚为汇聚节点数据,并将汇聚节点数据传送至监测主站;监控主站接收汇聚节点数据并进行实时监控。系统包括在5.8g无线专网中相互通信的终端监控节点、汇聚节点、远程变电站节点、远程变电站节点及监控主站,有效防止非网内节点的非法接入;满足图像视频监控高带宽需求的同时也解决了网络传输可靠性差的问题。
4.虽然上述现有技术能够在一定程度上提高输电线路监测过程中网络传输可靠性差的问题,但是仍然存在一定的缺陷性,比如,监测数据采用所有层级间进行全传输,如此整个处理系统需要承受大量视频数据传输的运行压力,并对传输带宽具有较高的要求,而且后续在如此巨大的视频数据中标定出异常设备的异常运行时刻点,需要承受大量的数据处理压力,因此整体上效率低,数据冗余度大,时效性差。


技术实现要素:

5.本发明的目的在于提供一种输变电设备状态监测数据的预处理方法及系统,以解决现有技术中数据预处理效率低,数据冗余度大,传输时效性差的技术问题。
6.为解决上述技术问题,本发明具体提供下述技术方案:
7.一种输变电设备状态监测数据的预处理方法,包括以下步骤:
8.步骤s1、将输变电设备的状态监测数据进行规格化处理,转换为统一且呈规整形态的第一预处理状态监测数据;
9.步骤s2、将所述第一预处理状态监测数据进行特征筛选,转换为第二预处理状态监测数据,实现数据量的第一降维,获得仅包含重要特征的监测数据,所述重要特征用于表征输变电设备的状态;
10.步骤s3、将所述第二预处理状态监测数据进行异常筛选,转换为第三预处理状态监测数据,实现数据量的第二降维,获得仅包含表征输变电设备异常状态的监测数据。
11.可选地,所述步骤s1中,将输变电设备的状态监测数据进行规格化处理,包括:
12.步骤s101、对所述状态监测数据的缺失项进行删除,实现对缺失项的数据清洗;
13.步骤s102、对所述状态监测数据进行归一化处理,消除不同指标量纲带来的差异,所述归一化公式为:
[0014][0015]
其中,b
yt
={b
yt1
,b
yt2
,

,b
ytp
},表示第y个输变电设备t时刻下的状态监测数据的特征向量,b
ytz
表示第y个输变电设备t时刻下的状态监测数据的第z类特征量,n表示输变电设备的数目,b
ytz

表示归一化处理后第y个输变电设备t时刻下的状态监测数据的第z类特征量,p为t时刻下状态监测数据的特征类目,z∈[1,p]。
[0016]
可选地,所述步骤s2中,将所述第一预处理状态监测数据进行特征筛选,包括:
[0017]
步骤s201、随机在第y个输变电设备各个时刻下的状态监测数据中,抽取相同数量的正样本和负样本,均匀混合构成特征筛选样本正样本为第y个输变电设备在选取时刻下为异常状态的状态监测数据的特征向量负样本为第y个输变电设备在选取时刻下为正常状态的状态监测数据的特征向量其中,i,j∈[1,n2],n2为正样本或负样本的数目,表征为第y个输变电设备在选取时刻t
j
下的状态监测数据的特征向量及运行状态为正常normal,表征为第y个输变电设备在选取时刻t
i
下的状态监测数据的特征向量及运行状态为异常error;
[0018]
步骤s202、基于均衡第y个输变电设备在选取时刻下运行状态的判别精度和判别效率,构建用于特征筛选的多目标函数;
[0019]
步骤s203、利用智能搜索算法求解所述多目标函数,获得多个特征量组合的pareto解集,多个特征量组合的pareto解集包含均衡判别出第y个输变电设备在选取时刻下的运行状态;构建均衡度函数,利用均衡度函数在pareto解集中选取出对判别精度和判别效率实现最佳均衡的特征量,作为所述重要特征。
[0020]
可选地,所述步骤s202中,构建用于特征筛选的多目标函数,包括:
[0021]
数学量化所述第y个输变电设备在选取时刻下运行状态的判别精度,获得精度目标函数,所述精度目标函数的公式为:
[0022][0023]
数学量化所述第y个输变电设备在选取时刻下运行状态的判别效率,获得效率目标函数,所述效率目标函数的公式为:
[0024]
f
obj_2
=m*t;
[0025]
利用最小化求解原则结合所述精度目标函数和效率目标函数,构建所述多目标函
数,所述多目标函数为:
[0026][0027]
其中,
[0028][0029]
f
obj_1
、f
obj_2
和f
obj
分别为精度目标函数值、效率目标函数值和多目标函数值,m表示为参与所述第y个输变电设备在选取时刻下运行状态的判别的特征量数目,t表示为每个特征量消耗的判别时长。
[0030]
可选地,步骤s203中,均衡度函数构建包括:
[0031]
线性标定多目标函数,构建均衡度函数,所述均衡度函数为:
[0032][0033]
其中,a b=1,a、b为预设权重参数,γ∈(0,0.1),g为适应度值,f
obj
为目标函数,γ为扰动常数。
[0034]
可选地,所述步骤s203中,利用均衡度函数在pareto解集中选取出对判别精度和判别效率实现最佳均衡的特征量,作为所述重要特征,包括:
[0035]
利用所述均衡度依次计算pareto解集中所有特征量组合的均衡度,选取出均衡度最高对应的特征量组合中包含的所有单个特征量,作为所述重要特征以实现所述状态监测数据的数据量在特征上的第一降维。
[0036]
可选地,所述步骤s3中,将所述第二预处理状态监测数据进行异常筛选包括:
[0037]
步骤s301、将所述输变电设备y的状态监测数据由连续线性数据切割为依时序分布的全时刻连续点性数据其中,其中,表示第y个输变电设备t
k
时刻下的状态监测数据的重要特征向量,b2
ytq
表示第y个输变电设备t
k
时刻下的状态监测数据的第q类重要特征量,q为t
k
时刻下状态监测数据的重要特征类目,k为输变电设备y的状态监测数据包含的时刻数目;
[0038]
步骤s302、依次对所述全时刻连续点性数据进行异常波动分析,获得仅包含表征输变电设备处于异常状态时刻的异常时刻连续点性数据,实现所述状态监测数据的数据量在时序上的第二降维。
[0039]
可选地,所述步骤s302中,依次对所述全时刻连续点性数据进行异常波动分析包括:
[0040]
依次计算所述全时刻连续点性数据中相邻数据的相似度,构成波动数据链,所述相似度的计算公式为:
[0041][0042]
其中,x
k
,x
k 1
为是x
k
,x
k 1
的联合概率分布函数,而p(x
k
)和p(x
k 1
)分别是x
k
,x
k 1
的边缘概率分布函数;
[0043]
在波动数据链上标定所有波动节点,并选取位于所有波动节点两侧的连续点性数据予以保留构成异常时刻连续点性数据;
[0044]
其中,波动节点是指波动数据链上相邻节点数值相差超过相似度阈值的数据节点。
[0045]
本发明还提供了一种输变电设备状态监测数据的预处理系统,用于实现如上任一项所述的输变电设备状态监测数据的预处理方法,包括:
[0046]
第一预处理单元,用于将输变电设备的状态监测数据进行规格化处理,转换为统一且呈规整形态的第一预处理状态监测数据;
[0047]
第二预处理单元,用于将所述第一预处理状态监测数据进行特征筛选,转换为第二预处理状态监测数据,实现数据量的第一降维,获得仅包含重要特征的监测数据,所述重要特征用于表征输变电设备的状态;
[0048]
第三预处理单元,用于将所述第二预处理状态监测数据进行异常筛选,转换为第三预处理状态监测数据,实现数据量的第二降维,获得仅包含表征输变电设备异常状态的监测数据。
[0049]
可选地,所述第一预处理单元、第二预处理单元和第三预处理单元依次通讯连接。
[0050]
本发明与现有技术相比较具有如下有益效果:
[0051]
本发明利用特征筛选处理和异常筛选处理分别将输变电设备的状态监测数据进行特征级别的数据量降维和时序级别的数据量降维,最终仅保留能够准确快速判别出输变电设备的运行状态的重要特征以及仅表征输变电设备的异常状况时刻下的状态监测数据,去除冗余特征和冗余时序,实现保留输变电设备的重要信息的最小数据量,有效减轻后续数据传输的压力,而且降维后的数据已经完成异常状态的状态监测数据的提取,可直接用于分析输变电设备的异常原因并制定处理方案,有效地提高后续的应用效率。
附图说明
[0052]
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
[0053]
图1为本发明实施例提供的预处理方法流程图;
[0054]
图2为本发明实施例提供的异常时刻连续点性数据的结构示意图;
[0055]
图3为本发明实施例提供的预处理系统结构框图。
[0056]
图中的标号分别表示如下:
[0057]1‑
第一预处理单元;2

第二预处理单元;3

第三预处理单元。
具体实施方式
[0058]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0059]
如图1

2所示,本发明提供了一种输变电设备状态监测数据的预处理方法,包括以下步骤:
[0060]
步骤s1、将输变电设备的状态监测数据进行规格化处理,转换为统一且呈规整形态的第一预处理状态监测数据;
[0061]
步骤s1中,规格化处理的具体方法包括:
[0062]
步骤s101、对状态监测数据的缺失项进行删除以实现对缺失项的数据清洗;
[0063]
步骤s102、对状态监测数据进行归一化处理为消除不同指标量纲带来的差异为后续数据降维提供基准辅助,归一化公式为:
[0064][0065]
其中,b
yt
={b
yt1
,b
yt2
,

,b
ytp
}表示第y个输变电设备t时刻下的状态监测数据的特征向量,b
ytz
表示第y个输变电设备t时刻下的状态监测数据的第z类特征量,n表示输变电设备的数目,b
ytz

表示归一化处理后第y个输变电设备t时刻下的状态监测数据的第z类特征量,p为t时刻下状态监测数据的特征类目,z∈[1,p]。
[0066]
步骤s2、将所述第一预处理状态监测数据进行特征筛选,转换为第二预处理状态监测数据,实现数据量的第一降维,获得仅包含重要特征的监测数据,所述重要特征用于表征输变电设备的状态;
[0067]
输变电设备的状态监测数据中包含有多个表征输变电设备状态特征的数据,其中存在有可准确用于判断输变电设备状态的特征量,同样也包含有一些无用的特征量,因此将此类无用的特征量进行剔除,不会减少状态监测数据中的有效数据,还能实现数据量的精简达到数据降维的作用,释放硬件存储空间和传输通道的空间。
[0068]
步骤s2中,特征筛选的具体方法包括:
[0069]
步骤s201、随机在第y个输变电设备各个时刻下的状态监测数据中抽取相同数量的正样本和负样本均匀混合构成特征筛选样本其中,正样本为第y个输变电设备在选取时刻下为异常状态的状态监测数据的特征向量负样本为第y个输变电设备在选取时刻下为正常状态的状态监测数据的特征向量其中,i,j∈[1,n2],n2为正样本或负样本的数目,表征为第y个输变电设备在选取时刻t
j
下的状态监测数据的特征向量及运行状态为正常normal,表征为第y个输变电设备在选取时刻t
i
下的状态监测数据的特征向量及运行状态为异常error;
[0070]
状态监测数据包括但不仅限于变压器生产厂家、额定功率、额定电压、服役地点平均温度和湿度、服役时长、油中溶解气体h2、ch4、c2h2、c2h4、c2h6、co、co2、油温、局部放电,特征筛选样本中包括50%的处于异常运行状态的时刻点的监测数据和50%的处于正常运行状态的时刻点的监测数据以保证样本的均衡性,在实际使用中也可根据实景进行调整。
[0071]
步骤s202、基于均衡第y个输变电设备在选取时刻下运行状态的判别精度和判别效率构建用于特征筛选的多目标函数;
[0072]
步骤s202中,多目标函数构建的具体方法包括:
[0073]
数学量化第y个输变电设备在选取时刻下运行状态的判别精度获得精度目标函数,精度目标函数的公式为:
[0074][0075]
具体的,精度目标函数值越高则判别第y个输变电设备在选取时刻下运行状态的准确度越高。
[0076]
数学量化第y个输变电设备在选取时刻下运行状态的判别效率获得效率目标函数,效率目标函数的公式为:
[0077]
f
obj_2
=m*t;
[0078]
具体的,效率目标函数越高则判别第y个输变电设备在选取时刻下运行状态的时间越长。
[0079]
利用精度目标函数和效率目标函数构建的多目标函数,其中,特征数目越多效率目标函数值越大消耗运算的时间越长,但在智能分类算法(贝叶斯分类算法)中特征数量越多判别结果的精度越高,因此精度目标函数与效率目标函数存在互斥的竞争关系,同时精度目标函数和效率目标函数又分别体现了智能分类算法的两种优化目标即分类精度高和分类用时短,因此将存在竞争的精度目标函数和效率目标函数进行权衡,将单个目标的优化转变为多个目标的优化,实现对精度目标函数和效率目标函数的折衷优化以获得快速精确判别输变电设备的状态,并且将多目标优化问题转变为目标函数的最小值求解问题,简化计算过程,提高效率。
[0080]
利用最小化求解原则结合精度目标函数和效率目标函数构建多目标函数,多目标函数为:
[0081][0082]
其中,
[0083][0084]
f
obj_1
、f
obj_2
和f
obj
分别为精度目标函数值、效率目标函数值和多目标函数值,m表示为参与第y个输变电设备在选取时刻下运行状态的判别的特征量数目,t表示为每个特征量消耗的判别时长。
[0085]
步骤s203、利用智能搜索算法求解多目标函数获得包含均衡判别出第y个输变电设备在选取时刻下运行状态的多个特征量组合的pareto解集,并利用均衡度函数在pareto解集中选取出对判别精度和判别效率实现最佳均衡的特征量作为重要特征。
[0086]
步骤s203中,均衡度函数构建的具体方法包括:
[0087]
线性标定多目标函数构建均衡度函数,均衡度函数为:
[0088][0089]
其中,a b=1,a、b为预设权重参数,γ∈(0,0.1),g为适应度值,f
obj
为目标函数,γ为扰动常数扰动常数的设定可以增加多目标智能搜索算法的求解的多样性,最终保证了pareto解集中解的多样性,避免早熟收敛。
[0090]
均衡度反应了智能搜索算法中个体对环境的适应能力强弱,因此可以构建均衡度函数来衡量个体的优劣,而且均衡度函数可以在不利用外部信息的情况下,作为是多目标搜索算法挑选优秀个体的唯一依据,它由优化问题中目标函数映射而来,在本实施例的多目标优化问题中反映了pareto解集中解的优劣,均衡度值越高,则解越优。在多目标智能搜索算法的智能搜索过程中,通过均衡度的比较排序操作可以实现最优解的寻优功能,在设定时为方便规定均衡度总是非负的,如此在选择中可以直观的选取解个体均衡度在数值上更大的解个体,所以再均衡度函数是需要遵循最大值形式且函数值非负的规则,并保持低复杂度。
[0091]
步骤s203中,重要特征获取的具体方法为:
[0092]
利用均衡度依次计算pareto解集中所有特征量组合的均衡度,并选取出均衡度最高对应的特征量组合中包含的所有单个特征量作为重要特征以实现状态监测数据的数据量在特征上的第一降维。
[0093]
利用均衡度在pareto解集选择出重要特征,然后在原始的状态监测数据中仅保留重要特征量的监测数据,实现了从全特征量数据降维值重要特征量数据。
[0094]
对于输变电设备的状态监测主要是期望获取输变电设备的异常数据,进而分析出异常出现的原因以及制定异常应急方案,因此处于正常运行状态的监测数据显得可有可无,因此可作为冗余数据进行剔除,进一步释放存储空间和传输通道空间,具体如下:
[0095]
步骤s3、将所述第二预处理状态监测数据进行异常筛选,转换为第三预处理状态监测数据,实现数据量的第二降维,获得仅包含表征输变电设备异常状态的监测数据。
[0096]
步骤s3中,异常筛选的具体方法包括:
[0097]
步骤s301、将输变电设备y的状态监测数据由连续线性数据切割为依时序分布的全时刻连续点性数据其中,其中,表示第y个输变电设备t
k
时刻下的状态监测数据的重要特征向量,b2
ytq
表示第y个输变电设备t
k
时刻下的状态监测数据的第q类重要特征量,q为t
k
时刻下状态监测数据的重要特征类目,k为输变电设备y的状态监测数据包含的时刻数目;
[0098]
步骤s302、依次对全时刻连续点性数据进行异常波动分析获得仅包含表征输变电设备处于异常状态时刻的异常时刻连续点性数据以实现状态监测数据的数据量在时序上的第二降维。
[0099]
步骤s302中,异常波动分析的具体方法包括:
[0100]
依次计算全时刻连续点性数据中相邻数据的相似度构成波动数据链,相似度的计算公式为:
[0101][0102]
其中,x
k
,x
k 1
为是x
k
,x
k 1
的联合概率分布函数,而p(x
k
)和p(x
k 1
)分别是x
k
,x
k 1
的边缘概率分布函数;
[0103]
其中,波动节点是指波动数据链上相邻节点数值相差超过相似度阈值的数据节点。
[0104]
在波动数据链上标定所有波动节点,并选取位于所有波动节点两侧的连续点性数据予以保留构成异常时刻连续点性数据;
[0105]
相似度表征相邻全时刻连续点性数据中相邻数据之间的相似程度,数值越高则相似程度越高,即可用相邻全时刻连续点性数据中相邻数据两者降维为任一全时刻连续点性数据中相邻数据表示,因此将相邻全时刻连续点性数据中相邻数据之间的相似度构成波动数据链,波动数据链中平缓曲线上的所有数据节点对应的相邻全时刻连续点性数据中相邻数据均具有一致的相似度,可随机选取平缓曲线上的所有数据节点对应的某一全时刻连续点性数据中相邻数据进行表征完成多变一的全时刻连续点性数据中相邻数据降维,波动数据链上跳跃节点对应的相邻全时刻连续点性数据中相邻数据均具有不一致的相似度,即相邻全时刻连续点性数据中相邻数据中运行数据变化剧烈,包含了输变电设备的异常运行的监测数据,因此相邻全时刻连续点性数据中相邻数据作为异常时刻连续点性数据进行保留,仅体现了输变电设备的异常运行的监测数据,可作为后续分析输变电设备的异常运行原因的基础辅助。
[0106]
以上步骤建立在仅包含重要特征的状态监测数据的基础上实现了输变电设备由全时刻的数据量降维值异常时刻的数据量,在特征级降维的基础上叠加时序级降维,降维效果更好。
[0107]
如图3所示,基于上述预处理方法,本发明提供了一种预处理系统,包括:
[0108]
第一预处理单元1,用于将输变电设备的状态监测数据进行规格化处理以使得转换为统一且规整形态的第一预处理状态监测数据;
[0109]
第二预处理单元2,用于将第一预处理状态监测数据进行特征筛选以转换为第二预处理状态监测数据实现数据量的第一降维获得仅包含表征判断输变电设备状态的重要特征的监测数据;
[0110]
第三预处理单元3,用于将第二预处理状态监测数据进行异常筛选转换为第三预处理状态监测数据实现数据量的第二降维获得仅包含表征输变电设备异常状态的监测数据。
[0111]
作为本发明的一种优选方案,第一预处理单元、第二预处理单元和第三预处理单元依次通讯连接。
[0112]
本发明利用特征筛选处理和异常筛选处理分别将输变电设备的状态监测数据进
行特征级别的数据量降维和时序级别的数据量降维,最终仅保留能够准确快速判别出输变电设备的运行状态的重要特征以及仅表征输变电设备的异常状况时刻下的状态监测数据,去除冗余特征和冗余时序,实现保留输变电设备的重要信息的最小数据量,有效减轻后续数据传输的压力,而且降维后的数据已经完成异常状态的状态监测数据的提取,可直接用于分析输变电设备的异常原因并制定处理方案,有效地提高后续的应用效率。
[0113]
以上实施例仅为本技术的示例性实施例,不用于限制本技术,本技术的保护范围由权利要求书限定。本领域技术人员可以在本技术的实质和保护范围内,对本技术做出各种修改或等同替换,这种修改或等同替换也应视为落在本技术的保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜