一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于边缘实时射频脉冲分类的局放连续监测方法及装置与流程

2022-10-13 05:57:50 来源:中国专利 TAG:


1.本发明实施例涉及电力领域,尤其涉及一种基于边缘实时射频脉冲分类的局放连续监测方法及装置。


背景技术:

2.对电网设备的健康状况和运行状态进行在线监测是保证电网安全运行、降低人工维护成本、提高资产管理水平和延长设备工作寿命的重要保证。电网设备中存在多种绝缘保护,在长期的机械、电、热、化学作用下这些绝缘逐渐老化,在电场强度较高的区域,电荷在绝缘较弱的部位定向移动,形成局部放电但不击穿绝缘。因此,局部放电(局放)是电网设备可能出现故障的早期征兆。对局放信号进行检测和定位是一种重要但同时也充满挑战的电网设备状态监测和预测性维护方法。
3.在甚高频(vhf: 30mhz~300mhz)和特高频(uhf:300mhz~ 3ghz)频段进行空间耦合接收的局放宽带射频脉冲检测方法具有非接触性信号获取(非侵入式)、现场部署灵活、灵敏度高和覆盖范围广等优点,特别适合用于对变电设备进行非侵入式的连续在线监测。但对局放宽带射频脉冲信号在开放空间进行高灵敏的耦合接收需要配置宽带或超宽带的射频传感天线,很容易引入各类电磁干扰信号,尤其是与局放信号特征相似的宽频射频脉冲信号。进一步地,为了保证在后台能对所有检测到的宽带射频脉冲信号进行准确分类和辨识,需要对宽带射频脉冲信号进行高精度的采样以保留信号的所有特征,这就导致采样数据量增大。
4.在空间耦合式局放检测中,经常会遇到周边电子设备产生的高重复率的宽带射频脉冲干扰信号,由于处理它们会占用大量的数据传输带宽和计算资源,常常会导致系统卡顿甚至崩溃,从而影响对局放信号的正常检测。特别地,不同于纯交流场下产生的局放信号,在高压直流或者交直流复合电场下(如换流变)产生的局放信号具有随机突发、发生间隙长、无明显周期性规律等特点。如果局放检测系统无法连续、不间断地对电网设备进行长时间监测,很容易导致对局放的漏检、漏报。目前已有的空间耦合式局放检测系统,尚不具备在高重复率宽带射频脉冲干扰带来的高速数据流下进行连续、不间断、长时间监测的能力。


技术实现要素:

5.为实现在高重复率宽带射频脉冲干扰所带来的高速数据流下进行连续、不间断、长时间的空间耦合式局放监测,本发明提出了一种基于边缘实时射频脉冲分类的局放连续监测方法及装置。
6.第一方面,本发明提供了一种基于边缘实时射频脉冲分类的局放连续监测方法,方法包括:获取宽带射频脉冲信号;根据预先训练的分类模型对宽带射频脉冲信号进行分类,得到宽带射频脉冲信号
中的干扰信号;去除宽带射频脉冲信号中的干扰信号,得到疑似局放信号;对疑似局放信号进行分析判断,得到疑似局放信号的判定结果。
7.通过上述方法,在局放信号检测前,去除高重复率的宽带射频脉冲干扰信号的相关数据,节省大量的数据传输带宽、数据存储空间及计算资源,使得局放检测系统可以长时间连续工作。
8.结合第一方面,在第一方面的第一实施例中,方法还包括:当分类模型的监测数值不满足预设条件时,对分类模型进行性能维护。
9.结合第一方面的第一实施例,在第一方面的第二实施例中,监测数值包括干扰信号与疑似局放信号在特征空间上的距离,当干扰信号与疑似局放信号在特征空间上的距离小于第一预定阈值时,判定分类模型的监测数值不满足预设条件。
10.结合第一方面的第一实施例,在第一方面的第三实施例中,监测数值包括干扰信号中出现新类型干扰信号的频次,当干扰信号中出现新类型干扰信号的频次大于第二预定阈值时,判定分类模型的监测数值不满足预设条件。
11.结合第一方面的第一实施例至第一方面的第三实施例中的任一实施例,在第一方面的第四实施例中,对分类模型进行性能维护,包括:当分类模型的性能指标小于第三预定阈值时,将已去除干扰信号的疑似局放信号加入到用于训练分类模型的宽带射频脉冲信号样本数据中,对分类模型进行更新。
12.结合第一方面,在第一方面的第五实施例中,对疑似局放信号进行分析判断,得到疑似局放信号的判定结果,包括:对疑似局放信号进行聚类分组,得到多组疑似局放信号集合;根据各疑似局放信号集合的属性特征对各组疑似局放信号集合分别进行分析判断,得到各组疑似局放信号集合中疑似局放信号的判定结果。
13.第二方面,本发明还提供了一种基于边缘实时射频脉冲分类的局放连续监测装置,该装置包括:脉冲信号采集设备,用于获取宽带射频脉冲信号;边缘计算设备,与脉冲信号采集设备相连接,用于接收宽带射频脉冲信号,根据预先训练的分类模型对宽带射频脉冲信号进行分类,得到宽带射频脉冲信号中的干扰信号;去除宽带射频脉冲信号中的干扰信号,得到疑似局放信号;服务器,与脉冲信号采集设备、边缘计算设备分别相连接,用于对疑似局放信号进行分析判断,得到疑似局放信号的判定结果。
14.通过上述装置,在局放信号检测前,去除高重复率的宽带射频脉冲干扰信号的相关数据,节省大量的数据传输带宽、数据存储空间及计算资源,使得局放检测系统可以长时间连续工作。
15.结合第二方面,在第二方面的第一实施例中,服务器还用于对边缘计算设备进行性能维护。
16.第三方面,本发明还提供了一种计算机设备,包括存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行第一方面或第一方面的任一实施例的基于边缘实时射频脉冲分类的局放连续监测方法的
步骤。
17.第四方面,本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现第一方面或第一方面的任一实施例的基于边缘实时射频脉冲分类的局放连续监测方法的步骤。
附图说明
18.为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
19.图1为根据一示例性实施例提出的一种基于边缘实时射频脉冲分类的局放连续监测方法的流程图;图2 为根据一示例性实施例提出的数据准备阶段流程图;图3为根据一示例性实施例提出的模型训练阶段流程图;图4为根据一示例性实施例提出的基于边缘实时射频脉冲分类的局放连续监测装置的结构示意图;图5为根据一示例性实施例提出的基于边缘实时射频脉冲分类的局放连续监测装置的具体结构示意图;图6为根据一示例性实施例提出的一种计算机设备的硬件结构示意图。
具体实施方式
20.下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
21.此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
22.为实现在高重复率宽带射频脉冲干扰所带来的高速数据流下进行连续、不间断、长时间的空间耦合式局放监测,本发明提出了一种基于边缘实时射频脉冲分类的局放连续监测方法及装置。
23.图1为根据一示例性实施例提出的一种基于边缘实时射频脉冲分类的局放连续监测方法的流程图。如图1所示,基于边缘实时射频脉冲分类的局放连续监测方法包括如下步骤s101至s104。
24.在步骤s101中,获取宽带射频脉冲信号。
25.具体地,宽带射频脉冲信号可以通过部署在局放监测现场的宽带射频脉冲信号传感器实时获取。其中,宽带射频脉冲信号传感器的数量可以是一个或者多个。
26.在步骤s102中,根据预先训练的分类模型对宽带射频脉冲信号进行分类,得到宽带射频脉冲信号中的干扰信号。
27.具体地,分类模型可以选择非线性分类器,如决策树、随机森林、非线性核支持向量机、神经网络等。
28.在步骤s103中,去除宽带射频脉冲信号中的干扰信号,得到疑似局放信号。
29.在步骤s104中,对疑似局放信号进行分析判断,得到疑似局放信号的判定结果。
30.具体地,可以对疑似局放信号进行聚类分组,对不同分组信号属性特征进行描述,呈现给领域专家进行进一步局放诊断。领域专家可以是通过机器自动实现,也可以是人工专家,或者是两者的结合,在此不做限制。
31.通过本发明实施例,在局放信号检测前,去除高重复率的宽带射频脉冲干扰信号的相关数据,节省大量的数据传输带宽、数据存储空间及计算资源,使得执行本发明实施例提供的基于边缘实时射频脉冲分类的局放连续监测方法的局放检测系统有足够数据传输和读写带宽来连续、不间断地保存数据,进而可以长时间连续工作。
32.在一示例中,该方法还包括当分类模型的监测数值不满足预设条件时,对分类模型进行性能维护。当然也可以根据需要周期性地进行性能维护(例如以周、月为周期)。
33.在一可选实施例中,分类模型的监测数值包括干扰信号与疑似局放信号在特征空间上的距离,当干扰信号与疑似局放信号在特征空间上的距离小于第一预定阈值时,判定分类模型的监测数值不满足预设条件。
34.局放监测环境及宽带射频脉冲传感器的变化都会导致脉冲信号的特征漂移,例如幅值增益、空间噪声、传播路径等变化都会导致脉冲波形变化,在局放信号判定过程中获得的不同类型宽带射频脉冲信号的在特征空间上的距离(或者特征区分度)可能变小,基于旧数据训练的分类模型在面对特征区分度更小的新数据时性能可能退化,无法准确识别出带宽脉冲信号中的干扰信号。因此,当干扰信号与疑似局放信号在特征空间上的距离小于第一预定阈值时,需要对分类模型进行性能维护。
35.在又一可选实施例中,分类模型的监测数值包括干扰信号中出现新类型干扰信号的频次,当干扰信号中出现新类型干扰信号的频次大于第二预定阈值时,判定分类模型的监测数值不满足预设条件。
36.局放监测环境中可能出现新类型的干扰信号。其中,新类型干扰信号指的是该分类模型没有检测过的干扰信号。如果其出现频次不多,对局放监测性能影响不大;如果出现频次过高,则代表分类模型的干扰脉冲预测召回率过低,会带来很高的数据传输带宽开销,影响局放监测连续工作的性能。
37.当然,当局放监测对象的设备发生了改装变化、监测环境加装了会产生脉冲干扰的电子设备、宽带射频脉冲传感器的部署位置发生了变化等事件也需要对分类模型进行性能维护。
38.在本发明实施例中,可根据上述不同事件的组合来综合判定是否进行分类模型的性能维护。
39.在一可选实施例中,当分类模型的监测数值不满足预设条件时,根据分类模型的性能指标对分类模型进行性能维护。其中,性能指标包括但不限于干扰脉冲信号预测的精确率(precison, p)、召回率(recall, r)。当分类模型的性能指标小于第三预定阈值时,将已去除干扰信号的疑似局放信号中的部分数据或者全部数据加入到用于训练分类模型的宽带射频脉冲信号样本数据中,对分类模型进行更新。当然,如果某类之前参与分类模型训练的脉冲干扰信号在预设时间内从未再次出现,也可将该类脉冲干扰对应的数据标签及数据从总数据中剔除。在另一示例中,对疑似局放信号进行分析判断,得到疑似局放信号的判
定结果,包括如下步骤:首先,对疑似局放信号进行聚类分组,得到多组疑似局放信号集合。
40.在一可选实施例中,为了从聚类分组后的脉冲信号样本数据中获得更高质量的属性特征,可对疑似局放信号数据进行聚类分组前进行不同程度的数字信号处理:比如采用匹配滤波、主成分分析、小波等手段,进行进一步的降噪处理。其中,属性特征可以为相位、频率、幅值等等,在此不做限制。
41.然后,根据各疑似局放信号集合的属性特征对各组疑似局放信号集合分别进行分析判断,得到各组疑似局放信号集合中疑似局放信号的判定结果。
42.在本发明实施例中,一方面,将最终的局放分析和判断结果呈现给现场运维人员,以辅助其决定如何采取下一步措施;另一方面,对包含疑似局放信号和脉冲干扰信号的不同分组脉冲信号进行数据标记和统计,用来作为上述步骤中进行分类模型性能维护的依据之一。
43.在一示例中,在局放信号判定前需要进行分类模型的训练,具体包括如下步骤:首先,在数据准备阶段,通过宽带射频脉冲信号传感器在目标局放监测环境和局放拟真环境中获取样本数据,并对样本数据进行降噪处理、特征提取和数据标注,得到用于训练机器学习模型的样本数据。
44.然后,在模型训练阶段,对比和优选不同的机器学习分类算法,基于数据准备阶段获得的样本数据对适用于宽带射频脉冲信号分类的模型进行训练、验证、测试和交互式迭代改进,直至获得满足目标性能和应用需求的分类模型。
45.图2 为根据一示例性实施例提出的数据准备阶段流程图。如图2所示,数据准备阶段包括如下步骤s201至s204。
46.在步骤s201中,采集样本数据。
47.在一可选实施例中,至少使用一个宽带射频脉冲信号传感器,来采集目标局放监测环境和局放拟真环境中的宽带射频脉冲信号原始波形的样本数据。为了保证数据质量,采集的样本数据至少应满足奈奎斯特最小采样率要求,即采样率至少应是传感器耦合接收的宽带射频脉冲信号最高频率的2倍;优选地,采样率应是接收宽带射频脉冲信号最高频率的3倍或以上,以保留脉冲信号足够的特征信息。
48.在一可选实施例中,在目标局放监测环境和局放拟真环境通过四通道宽带射频脉冲信号传感器获取样本数据。在目标局放监测环境中几乎不可能在短期内采集到局放信号,因此主要是获取其中的典型脉冲干扰信号样本数据。在局放拟真环境中,则可以混合拟真出不同类型的局放信号和典型脉冲干扰信号,获得各自的样本数据。在本发明实施中,在数据准备阶段从目标局放监测环境和局放拟真环境同时获取不同类型的局放信号和典型脉冲干扰信号,形成更全面的分类模型训练数据库。
49.在步骤s202中,对样本数据进行降噪处理。
50.具体地,在采集宽带射频脉冲信号的样本数据后,首先对所有信号样本数据进行降噪处理。目的是去除不包含脉冲信号能量或仅包含微弱脉冲信号能量的频带范围内的白噪声和/或其他窄带干扰信号,提高信噪比,从而提高对不同信号源脉冲波形的可辨识度。
51.在一可选实施例中,为了统一去除宽带射频脉冲信号频带范围外的噪声和干扰,可通过频谱分析来确定所获脉冲信号的主要频带范围,然后应用数字滤波去除脉冲信号带
外的噪声和干扰。降噪处理时中,也可以使用其他降噪方法,例如小波变换,对所有脉冲采用统一标尺进行降噪处理。
52.其中,脉冲信号的主要频带范围可根据其能量分布来确定。一般情况下,使用滤波去除带外噪声和干扰时建议尽量不对脉冲信号的能量造成较大衰减。不失一般性的,可使用95百分位数,即在所确定频带范围内至少包含95%的脉冲信号能量;也可以在一定脉冲能量百分位数范围内使用局部信噪比最大化逼近准则,例如在90%~100%脉冲能量范围内,选取某个目标频带范围以实现信噪比最大化。在实际应用中,应根据具体情况来选择脉冲信号能量范围和最佳滤波频带,在此不做专门限制。在本发明实施例中,如果在某个或某几个包含较高脉冲能量密度的频带附近同时存在较强能量的窄带干扰信号,则应视具体情况而定:若对步骤s203和步骤s204的结果影响有限,在该步骤可先不予滤波去除,待数据标注中的聚类分组后再予以去除;反之,若这些窄带干扰叠加在脉冲信号上严重影响了步骤s203和步骤s204的效果,则可在该步骤部分或全部去除,此时可对滤波前的宽带射频脉冲信号原始样本数据做一份拷贝以备后需检验。
53.在步骤s203中,提取样本数据的特征,为宽带射频脉冲分类模型训练提供输入。
54.具体地,宽带射频脉冲信号的特征主要分为以下两种形式:宽带射频脉冲信号原始波形的所有采样样本,即其特征维度/数目等于采样样本数目,或宽带射频脉冲信号部分原始波形的采样样本,即其原始波形全部采样样本的一个子集;通过对宽带射频脉冲信号原始波形样本数据进行一定形式的数字信号处理,如傅里叶变换、小波变换分解、自相关、包络提取等,获得新的有助于区分脉冲的不同维度特征集。
55.特征提取和选择的一个标准是,可以作为宽带射频脉冲分类模型的输入,帮助更准确和鲁棒地辨识来自不同信号源的脉冲,尤其是辨识局放监测环境中的典型高频次干扰脉冲信号。特征提取和选择的另一个标准是,在宽带射频脉冲分类模型性能满足应用要求的前提下,特征应尽量简单、容易快速提取和占用较小内存,以支持在局放信号判定时可以实时或低时延地进行脉冲分类辨识和干扰去除。实际应用中可能很难针对所有场景和数据,确定一个通用的可以确保最佳性能的特征集,这时需要针对局放监测场景,通过数据获取和对比训练测试,结合领域专家知识,确定最合适的特征集。这里指的领域专家知识是指对不同类型局放信号和干扰信号的属性和特征的知识库,可以是机器自动化实现的专家知识推理库,也可以是由人工专家参与的知识反馈,或者是两者的结合。
56.在一可选实施例中,选择宽带射频脉冲信号原始波形中从起振点开始预设长度的波形的采样样本作为特征集或特征集来源。从起振点开始预设长度的波形最能反映信号源原始波形的特征,不受射频信号传播过程中的多径反射叠加效应影响,使用该特征集对不同信号源脉冲波形更具辨识度,即更容易在特征空间获得更大距离,从而进行区分。同时,选择从起振点开始的预设长度波形会减少特征维度,进而降低计算资源要求,缩短计算时间。例如,使用从宽带射频脉冲信号原始波形起振点开始的0.1us长度对应的数据样本作为后续分类模型训练的特征集,考虑传感器采样间隔为0.4ns(对应2.5gsps采样率),每个宽带射频脉冲信号的特征维度为250。这是考虑宽带射频脉冲信号由于传播过程中的多径反射叠加效应,会造成信号后面部分的波形畸变,增加对不同信号源脉冲波形进行辨识区分的难度。步骤s203对计算操作的实时性没有特别要求,但对脉冲起振点及特征提取的准确性有很高要求。
57.在步骤s204中,对采集的样本数据对应的脉冲信号是属于疑似局放信号还是干扰信号进行数据标注,为分类模型的训练和评估提供标准参考。
58.在一可选实施例中,数据标注具体步骤如下:首先,基于非监督式机器学习聚类算法对样本数据进行脉冲聚类分组。在本发明实施例中,基于宽带射频脉冲信号原始波形的全部或部分样本数据,进行互相关分析来衡量不同信号源脉冲之间的相似度距离,再采用聚类算法进行脉冲分组。例如,使用上述从起振点开始的0.1us长度的样本数据作为特征,对所有宽带射频脉冲信号进行互相关分析来衡量不同脉冲之间的相似度距离,在此基础上采用凝聚式层次聚类(hierarchical agglomerative clustering,hac)算法进行宽带射频脉冲信号的聚类分组。当采用了多通道同步采样获取样本数据时,还可进行多通道融合的聚类分组,以及基于多通道检测到同一脉冲信号的时间差而估算出的该脉冲源的位置信息进行聚类分组优化,具体实现方法在此不做展开,本发明实施例也不做限制。
59.为了从聚类分组后的脉冲信号样本数据中获得更高质量的属性/特征,可对聚类分组后的数据样本进行不同程度的数字信号处理:比如采用匹配滤波、主成分分析、小波等手段,进行进一步的降噪处理;再比如基于多传感器同步获取的分组脉冲的抵达时间差或信号强度,进行信号源定位,以对脉冲聚类分组进行优化和校验。本发明实施例对上述数字信号处理的具体方法不做专门限制。
60.然后,对每个脉冲聚类分组进行属性特征描述。
61.例如,针对每个脉冲聚类分组采用以下属性进行描述:局放相位分布谱图(phase-resolved partial discharge pattern ,prpd)、局放时间分布谱图(time resolved partial discharge pattern,trpd)、分组内脉冲相隔时间分布、分组间脉冲相隔时间分布、脉冲信号强度分布、脉冲频谱、脉冲波形、脉冲源定位位置。其中,prpd主要用于纯交流场强下的局放属性描述,也可用于工频信号相关联的脉冲干扰信号属性描述,trpd主要用于纯直流场强下的局放属性描述,prpd和trpd可一起结合用于交直流混合场强下的局放及脉冲干扰属性描述。
62.最后,基于领域专家知识对脉冲聚类分组进行标注。
63.其中,数据标注的重点是典型脉冲干扰信号。典型脉冲干扰信号可能由雷电波、电网中的开关、换流阀换相、继电器的开合、旋转电机的电刷、浮动电位物体放电等产生。只出现一次或者少数几次的脉冲干扰信号只要连续跟踪观察一段时间即可辨识;而持续出现的脉冲干扰则一般具有较强的规律性,往往具备以下一种或多种属性:信号强度分布相对集中,频谱相对局放信号更窄,分组内脉冲相隔时间和分组间脉冲相隔时间(如果有)可能与工频周期强相关(与工频信号相关联的脉冲干扰)或无明显关联(部分周期性干扰,如开关电源)、在prpd谱图中往往以很小的偏差集中分布在某个相位点附近,定位位置一般不会指向重点局放监测对象。另一种情况下,宽带射频脉冲信号传感器检测微弱局放信号时,可能会把一些引起射频信号波动的噪声信号误检为脉冲信号,出现频次还可能非常高,这类信号一般具备如下属性:强度较弱,频谱和分组内脉冲相隔时间的分布比较平坦,在prpd谱图中的分布没有明显规律(与工频周期不相关),同一脉冲分组所含信号的定位结果呈无规律分布。利用上述属性综合判断可较为容易地辨识出该类信号。上述只是部分典型脉冲干扰信号的属性举例,在本发明实施例中,根据现场情况可能总结和应用具备不同属性特征的
干扰脉冲的专家知识,本发明实施例对具体应用的专家知识不做专门限制。
64.另一方面,疑似局放信号一般具备以下一种或多种属性特征:信号强度分布相对分散,频谱较宽,分组内脉冲相隔时间很短(一般几百个微秒到几个毫秒不等),交流场强下分组间脉冲相隔时间(如果有)与工频周期强相关,在prpd谱图中往往相对分散地分布在某个特定相位区间或者某两个对称的相位区间,定位位置则指向变电设备主体或连接套管等重点局放监测对象。需要说明的是,上述属性不一定在任何情况下都全部具备,部分属性也可能随现场条件的改变而变化,本发明实施例对标注疑似局放信号所应具备的专家知识不做专门限制。
65.本发明实施例的应用现场可能电磁环境复杂(如变电站),并非所有脉冲信号都具备明显属性而能被确定标注为干扰脉冲或疑似局放。为了避免对潜在局放信号的漏检,不失一般性的,在数据标注后可将该类未知信号标注成疑似局放信号加入到训练数据中。
66.在上述数据标注过程中,根据领域专家知识可以对获得的脉冲聚类分组进行分组合并或分组拆分(进一步分成子分组),也可以将任一分组中某个或某部分脉冲信号对应的样本数据剔除,以提高用于宽带射频脉冲分类模型训练的样本数据的质量。例如,当局放监测环境中存在来自多个信号源的脉冲干扰,且这些干扰信号之间的特征差异不大时(与疑似局放脉冲相比),领域专家可将这些来自多个信号源的脉冲干扰统一标注为一个大类的干扰信号,而不具体区分具体是来自哪一个信号源的信号,这样获得的数据标签将只有两种情况:疑似局放信号和干扰信号;反之,如果来自不同信号源的脉冲干扰之间的特征差异较大,则数据标签可以有多种情况:疑似局放信号、典型干扰信号1、典型干扰信号2等等。领域专家可以是机器自动化实现的专家知识推理库,也可以是人工专家,或者是两者的结合,在本发明实施例中不做具体限制。
67.上述数据标注中的不同步骤可进行多轮迭代,直至获得针对具体局放测试场景优化的高准确度的数据标签。
68.在步骤s204中聚类分组的属性,是指某一组相似的宽带射频脉冲信号作为一个整体所表现出的属性和特征,包括一些时间维度上的统计量(如脉冲抵达时间间隔分布),或空间维度上的统计量(如基于多个传感器同步获得脉冲信号计算出的信号源位置分布);而步骤s203中的确定的特征,从实现和应用角度,则一般是单个传感器上获得的单个脉冲信号具备的特征,不失一般性的,会选择非统计量特征。
69.数据准备阶段最终确定的数据集由两部分组成:一部分是s203步骤提取的所有宽带射频脉冲信号的特征集,假设脉冲数目为m,脉冲信号特征维度为n, 则可用m
ꢀ×ꢀ
n阶矩阵表示,代表m个n维特征行向量;另一部分是s204步骤获得的所有宽带射频脉冲信号的数据标签,不失一般性的,数据标签可用1个m维列向量表示;据此,由所有宽带射频脉冲信号的特征集和数据标签组成的数据集可用m
ꢀ×ꢀ
n 1 阶矩阵表示。
70.图3为根据一示例性实施例提出的模型训练阶段流程图。如图3所示,模型训练阶段包括如下步骤s301至s304。
71.在步骤301中,将样本数据划分为训练数据和测试数据。
72.具体地,用于机器学习分类模型训练和评估的样本数据,至少会被划分为训练数据和测试数据两部分。训练数据用于训练机器学习分类模型,测试数据用于评估和验证模型的性能。
73.为了在模型的构建过程中尽早对模型进行检验和迭代改进,训练数据中还经常会被划分出一部分可以重复使用的数据用作验证数据,而测试数据完全不参与训练,被保留至最后阶段用作对模型性能的再次检查和确认。只有模型通过验证数据性能检测后,才动用测试数据进行最后评估,这样可以避免模型训练的过拟合问题。训练数据和测试数据可采用8-2、7-3、6-4等比例划分,训练数据和验证数据则可选择采用留出法、交叉验证法、自助法划分。例如,将样本数据按8-2比例划分为训练数据和测试数据。再将训练数据按k折交叉验证法分割成k份数据,一份被保留作为验证分类模型的数据,其他k-1份用来分类模型训练,交叉验证重复k次,每份数据验证一次,再综合k次验证结果得到一个单一性能估测值。综合k次验证结果可采用平均、加权或使用其他结合方式,具体结合方式本发明不做专门限制。
74.在步骤302中,基于训练数据和机器学习分类算法进行分类模型的训练。
75.例如,分类算法优先选择非线性分类器,如决策树、随机森林、非线性核支持向量机,神经网络等;在宽带射频脉冲线性可分的部分特殊情况下,不排除使用线性分类模型,如单层感知机、贝叶斯分类、逻辑回归、线性核支持向量机等。实际模型训练中,根据情况可能需要选择多种分类算法进行性能评估和对比。
76.在一可选实施例中,通过神经网络来训练分类模型。神经网络分类模型具有四层结构:第零层(输入层)的神经元/节点个数取决于训练数据的特征维度,第一层50个神经元,第二层50个神经元,第三层(输出层)的神经元个数取决于训练数据中被数据标注的脉冲类数。本发明实施例中训练数据的特征维度是250,因此神经网络输入层神经元个数为251,其中多出来的一个神经元是偏置单元,通常设置为1。如果实施例中的训练数据只将宽带射频脉冲信号标注为两类:疑似局放信号和干扰信号,则神经网络输出层的神经元个数为2。
77.在步骤303中,对训练好的分类模型进行性能评估。
78.鉴于本发明实施例中宽带射频脉冲分类模型的首要目标是尽可能去除典型干扰脉冲信号和保留疑似局放信号,分类模型性能指标重点关注对干扰脉冲信号预测的精确率(precison, p)和召回率(recall, r),当然也可以使用其他性能指标,如准确率,作为补充评估性能的指标。
79.干扰脉冲信号预测精确率p,用以衡量在所有预测结果为干扰脉冲的样本中,被正确预测的样本(即实际上确实是干扰脉冲)所占比例;优化干扰脉冲信号精确率可以降低疑似局放信号被错误地预测为脉冲干扰信号而被边缘去除的概率,有助于降低局放被漏检的概率。干扰脉冲信号预测召回率r,用以衡量在所有实际为干扰脉冲信号的样本中,被分类器模型预测为干扰脉冲的样本所占比例;优化干扰脉冲信号预测召回率可以降低干扰脉冲被错误地预测为疑似局放信号的概率,有助于提高边缘去除脉冲干扰信号相关无效数据的比例。理想情况下,干扰脉冲信号预测精确率和召回率都应尽可能大,以实现分类模型的性能优化。
80.在一可选实施例中,在分类模型性能评估指标选择方面,应根据具体应用场景选择。在交流局放测试中,鉴于局放信号一般会随工频周期反复成批量出现,对干扰信号预测的精确率要求可适当降低,即允许次优精确率,以优化召回率;在直流或交直流混合局放测试中,鉴于直流激励下可能产生的局放信号呈稀疏、随机特征,对干扰信号预测的召回率可
适当降低,即允许次优召回率,以优化精确率。
81.在一可选实施例中,当从多个宽带射频脉冲信号传感器获取样本数据时,针对宽带射频脉冲信号传感器的四通道分别创建四个分类模型,并对每个分类模型分别进行独立的性能评估。在此基础上,再对四个分类模型的聚合预测结果进行性能评估。取决于具体实施例的应用场景,在选择分类模型或对分类模型在局放信号判定过程中的性能维护时,可以只关注四个通道各自对应分类模型单独预测的性能,也可以关注四个分类聚合预测的性能,或者综合考虑四个分类单独预测和聚合预测的性能,在此不做专门限制。
82.在本发明实施例中,在步骤s204中将具有不同特征的干扰脉冲信号标注为不同标签时,需要将所有干扰脉冲信号数据样本作为一个整体来计算预测精确率和召回率。如果精确率和召回率无法同时优化(此消彼长),则应根据具体应用要求和情况,选择其中一个指标进行性能优化目标,或者选择一个兼顾精确率和召回率的调和均值指标,例如f1值,作为综合性能评估指标。对模型评估性能指标的最终选择和设定,取决于局放监测应用现场中具体传感器检测到的局放信号和干扰信号的特征,如频次、信号强弱等。
83.如果性能无法满足分类要求,则需要对模型进行调整和迭代训练优化。模型调整可以只对同模型的参数和结构进行调优,也可以换一个全新的分类算法重新进行模型训练,必要的时候,还可对样本数据进行重新划分,或者返回到数据准备阶段进行样本数据的更新。本发明对模型调整的具体方法不做专门限制。
84.在步骤304中,基于具体应用需求选择性能评估后的分类模型。
85.例如,可以选择某个在各种情况下性能都最优的分类模型(如果有),也可以选择将多个分类器模型组合以获得最优或最鲁棒的性能,还可以兼顾模型性能和其实现的复杂度及对硬件的要求。
86.图4为根据一示例性实施例提出的基于边缘实时射频脉冲分类的局放连续监测装置的结构示意图。如图4所示,该装置包括:脉冲信号采集设备401,用于获取宽带射频脉冲信号。
87.边缘计算设备402,与脉冲信号采集设备401相连接,用于接收宽带射频脉冲信号,根据预先训练的分类模型对宽带射频脉冲信号进行分类,得到宽带射频脉冲信号中的干扰信号;去除宽带射频脉冲信号中的干扰信号,得到疑似局放信号。
88.服务器403,与脉冲信号采集设备401、边缘计算设备402分别相连接,用于对疑似局放信号进行分析判断,得到疑似局放信号的判定结果。
89.在一示例中,服务器403还用于对分类模型进行性能维护。当分类模型的监测数值不满足预设条件时,对分类模型进行性能评估。此时,需要将边缘计算设备402的功能暂时旁路掉,将脉冲信号采集设备401采集到的所有宽带射频脉冲信号数据样本传输至服务器403。基于采集到的数据样本,在服务器403上,首先采用数据准备阶段中的数据标注步骤形成可用于分类器性能评估的测试数据集;再采用模型训练阶段中的性能评估步骤对分类模型进行评估,例如干扰脉冲信号预测精确率p、召回率r等;最后根据性能评估结果决定是维持现有分类器模型不变并恢复其功能,还是回到数据准备阶段和模型准备阶段进行重新训练以维护其性能。
90.通过上述装置,在局放信号检测前,去除高重复率的宽带射频脉冲干扰信号的相关数据,节省大量的数据传输带宽、数据存储空间及计算资源,使得局放检测系统可以长时
间连续工作,同时能大大缩短数据处理和分析结果反馈至用户的时延,提高空间耦合式局放检测系统在现场应用的可靠性和实用性。
91.在一示例中,脉冲信号采集设备401可以是宽带射频脉冲信号传感器。宽带射频脉冲信号传感器可以在甚高频(vhf: 30mhz~300mhz)和特高频(uhf:300mhz~ 3ghz)的可选频带范围内对辐射到空间的无线射频电磁波模拟信号进行耦合接收,再通过模拟调理、数模转换以及实时脉冲检测获得宽带射频脉冲信号样本数据。相应的,宽带射频脉冲传感器一般包含宽带天线、模拟调理单元、数模转换单元、基于专用集成电路(application specific integrated circuit ,asic)或现场可编程门阵列(field programmable gate array ,fpga)实现的脉冲检测单元、数据通信模块等部件。其中,宽带射频脉冲信号传感器至少包含一路通道。
92.图5为根据一示例性实施例提出的基于边缘实时射频脉冲分类的局放连续监测装置的具体结构示意图。如图5所示,宽带射频脉冲信号传感器包括宽带天线、模拟调理单元、四通道模数转换单元、脉冲检测单元。宽带射频脉冲信号传感器由四路通道组成,每路通道包含一个独立的宽带天线和模拟调理单元。四路通道的模拟调理单元输出的射频模拟信号全部接入一个共同的四通道模数转换单元进行同步采样,采样频率可以为2.5gsps采样率,获得的宽带射频信号的连续采样样本数据再输入至基于fpga的脉冲检测单元,通过定制算法检测和截取出连续采样数据中对应宽带射频脉冲信号的部分样本数据。
93.宽带射频脉冲信号传感器的四通道可进行相互独立触发的脉冲信号检测和样本数据提取,也可以互相关联实现同步触发的脉冲信号检测和提取。后者可以更好地保证在同一时间戳上同时获得来自四个通道的宽带射频脉冲信号,给后续的宽带射频脉冲信号分类模型训练提供更高维度的数据库,但同步触发脉冲检测也可能提取出与脉冲信号不相关的数据,增加不必要的数据量和通信带宽。具体实施中需根据现场情况和装置模式做选择配置,在此不做专门限制。
94.在一可选实施例中,宽带射频脉冲信号传感器的频带范围设置为50mhz~800mhz, 这主要是考虑800mhz~3ghz频段的射频信号分量在辐射到空间并传播一段距离之后衰减较大、包含能量较小;数模转换单元垂直分辨率设置为12比特或以上、采样率设置为2.5gsps(两个采样样本间隔0.4ns),即传感器可耦合接收的最高频率分量的3倍以上,可实现对宽带射频信号的高精度采样;每个宽带射频脉冲信号的样本数据截取长度设置为2us, 即5000个采样样本。
95.如图5所示,宽带射频脉冲信号传感器通过服务器403母板上的pcie交换机及总线分别与服务器403和边缘计算设备402实现互联和高速数据传输。
96.在又一示例中,边缘计算设备402对接收到的宽带射频脉冲信号样本数据进行实时的特征提取和脉冲分类,一方面将被分类为脉冲干扰的样本数据去除,另一方面将被分类为疑似局放信号的样本数据传输至服务器403。如图5所示,边缘计算设备402可以基于图形处理器(graphics processing unit ,gpu)实现,或者是基于现场可编程门阵列 (fpga)、神经网络处理器(neural-network processing unit ,npu)等针对机器学习分类模型进行优化的硬件模块实现,还应包含一定大小的随机存取存储器(ram)来缓存宽带射频脉冲信号样本数据和分类模型的参数及中间结果。
97.在一示例中,服务器403负责分类模型的训练(包括数据准备阶段和模型训练阶
段)的所有工作以及局放信号判定中的局放判定、分类模型性能维护工作。服务器403一般包含中央处理器(central processing unit, cpu)、随机存取存储器(random access memory ,ram)、硬盘、机器学习训练和推理加速硬件(如图形处理器gpu)、数据通信网卡等模块。
98.其中,在数据准备阶段,宽带射频脉冲信号传感器获得的宽带射频脉冲信号样本数据被直接传输至服务器403,边缘计算设备402被旁路。在模型训练阶段,服务器403基于准备好的样本数据来训练和验证分类模型,并将最终确定的分类模型进行本地备份,以备局放信号判定时的局放分析和判断使用。当基于现有数据可以训练出一个达到目标性能的分类模型时,模型训练阶段不需要宽带射频脉冲信号传感器和边缘计算设备402的参与;但是,如果现有数据不足以训练出一个满足目标性能的分类模型,则需要回到数据准备阶段,使用宽带射频脉冲信号传感器来准备新的样本数据,此时边缘计算设备402同样被旁路。在局放信号判定时,当分类模型的监测数值满足预设条件时,边缘计算设备402正常运行(步骤s102和s103),被分类为疑似局放信号的样本数据被传输至服务器403,进一步执行局放信号判定(步骤s104);反之,当分类模型的监测数值不满足预设条件时,边缘计算设备402被旁路,通过宽带射频脉冲信号传感器获得的现场数据被直接传输至服务器403进行分类性能维护。
99.如图5所示,该装置的数据流模式有以下两种:第一种数据流模式,来自宽带射频脉冲信号传感器的样本数据可以通过pcie交换机以点对点数据流的形式传输至位于边缘计算设备402上的随机存取存储器ram和图形处理器gpu以实现对宽带射频脉冲信号样本数据的实时分类处理;分类处理后的样本数据再通过pcie交换机传输至位于服务器403上的随机存取存储器ram和中央处理器cpu进行下一步数据分析。该数据流模式主要用于边缘计算设备402执行干扰信号辨识和去除的情况。第二种数据流模式,来自宽带射频脉冲信号传感器的样本数据通过pcie交换机直接传输至位于服务器403上的随机存取存储器ram和中央处理器cpu进行数据处理和分析,服务器403可进一步将需要专门并行加速处理的数据和任务通过pcie交换机和总线分配到互联的图形处理器gpu中进行。在本发明实施例中,上述负责并行加速处理的pcie总线互联的图形处理器gpu可以是位于边缘计算设备402上的图形处理器gpu,也可以是服务器403中的通过pcie交换机和总线互联的其他图形处理器gpu。
100.如图5所示,模型训练阶段确定的分类模型被部署在边缘计算设备402的图形处理器gpu上,针对宽带射频脉冲信号传感器中四路通道的不同数据流,相应地同时运行四个分类模型进行信号分类和干扰信号去除。在具体应用实施例中,根据实际应用需求,可以四个分类模型独立运行进行信号分类和干扰信号去除,也可以基于每个分类模型的输出进行聚合预测,再根据聚合预测结果来去除四个通道对应数据流中的干扰信号样本数据。
101.根据上述宽带射频脉冲信号传感器中四通道数据流对应的四个分类模型各自的性能指标以及聚合性能指标,执行以下操作:如果检测到某个或部分通道对应分类模型的性能指标低于阈值,但四个分类模型聚合性能指标仍高于阈值,则维持现有的分类模型不变,在边缘计算设备402中使用四个分类模型聚合判定的结果来去除四个通道数据流中对应干扰信号的样本数据。该情况一般对应某个或部分通道上的宽带射频脉冲发生较大特征漂移。
102.如果检测到某个或部分通道对应分类模型的性能指标低于阈值,四个分类模型聚
合性能指标也低于阈值,则只对低于性能阈值的分类模型进行重新训练和维护。该情况一般对应某个或部分通道上突然出现之前从未检测到过的高频次脉冲干扰信号。
103.如果检测到大部分或所有通道对应分类模型的性能指标都低于阈值,则对所有通道对应的分类模型进行重新训练和维护。该情况一般对应大部分或所有通道上宽带射频脉冲发生了较大特征漂移或突然出现之前从未检测到过的高频次脉冲干扰信号。
104.图6是根据一示例性实施例提出的一种计算机设备的硬件结构示意图。如图6所示,该设备包括一个或多个处理器610以及存储器620,存储器620包括持久内存、易失内存和硬盘,图6中以一个处理器610为例。该设备还可以包括:输入装置630和输出装置640。
105.处理器610、存储器620、输入装置630和输出装置640可以通过总线或者其他方式连接,图6中以通过总线连接为例。
106.处理器610可以为中央处理器cpu。处理器610还可以为其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路asic、现场可编程门阵列fpga或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
107.存储器620作为一种非暂态计算机可读存储介质,包括持久内存、易失内存和硬盘,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本技术实施例中基于边缘实时射频脉冲分类的局放连续监测方法对应的程序指令/模块。处理器610通过运行存储在存储器620中的非暂态软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述任意一种基于边缘实时射频脉冲分类的局放连续监测方法。
108.存储器620可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据、需要使用的数据等。此外,存储器620可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件或其他非暂态固态存储器件。在一些实施例中,存储器620可选包括相对于处理器610远程设置的存储器,这些远程存储器可以通过网络连接至数据处理装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
109.输入装置630可接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的信号输入。输出装置640可包括显示屏等显示设备。
110.一个或者多个模块存储在存储器620中,当被一个或者多个处理器610执行时,执行如图1所示的方法。
111.上述产品可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,具体可参见如图1所示的实施例中的相关描述。
112.本发明实施例还提供了一种非暂态计算机存储介质,计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的监测方法。其中,存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)、随机存储记忆体ram、快闪存储器(flash memory)、硬盘(hard disk drive,缩写:hdd)或固态硬盘(solid-state drive,ssd)等;存储介质还可以包括上述种类的存储器的组合。
113.需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之
间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
114.以上仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献