一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种光纤预警系统事件分类机器学习算法的制作方法

2022-02-22 04:12:53 来源:中国专利 TAG:


1.本发明涉及油气管道输送安全监测技术领域,尤其是涉及一种光纤预警系统事件分类机器学习算法。


背景技术:

2.随着我国能源需求的增加和能源结构的变革,石油、天然气在我国能源需求中比例逐年增加,以便捷和经济为特点的石油、天然气的管道运输得到了迅猛发展,在管道输送过程中,管道安全问题至关重要,近十年来,分布式光纤传感的到了应用,基于光纤的传感器以管道伴行光缆作为传感器,能够连续的监测光纤参数,在光缆附近可以进行分布式全面检测,起到对管道的保护作用,其中一种技术为基于瑞利相干的分布式振动传感技术,该技术可以将光缆分数数个独立的传感单元,互不干扰,并采集振动信号。
3.如图一所示,所述典型的基于瑞利相干干涉的单波长系统内部包括有负责发出单波长的高相干激光光源101,所述高相干激光光源101一端光路连接有用于转换连续激光为脉冲激光的脉冲发生模块102,所述脉冲发生模块102远离高相干激光光源101的一端光路连接有环形器103,所述环形器103一端固定连接有传感光缆104,所述环形器103另一端电性连接有光电探测器105,所述光电探测器105远离环形器103的一端电性连接有数字转换模块106,所述数字转换模块106远离光电探测器105的一端电性连接有用于将传感光缆104线路上振动信号定位的数据处理模块107,该技术能够对土壤振动进行监测,灵敏度较高,在实际应用中,管道不可避免的穿越公路,铁路,河流以及人为活动较多的区域,这些区域的日常活动信号也会产生振动,这导致系统误报率较高,如何区分安全的日常活动信号和对管道、光缆具有危害性的事件信号是该系统的关键技术。
4.上述中的现有技术方案存在以下缺陷:信号数据量大,信号处理要求实时性,由于管道、光缆安全事件后果较为严重,需要系统进行实时处理,信号样本分布不均衡,发生在管道、光缆上方的振动事件,巨大部分是安全事件,据统计危害事件占比极少,且样本标注困难,由于管道点多线长面广的特点,不可能发生危害事件立刻能到达现场进行跟踪,导致对信号标注不准确。


技术实现要素:

5.本发明的目的是提供一种降增加信号标注精准度的光纤预警系统事件分类机器学习算法。
6.为实现上述目的,本发明提供了如下技术方案:一种光纤预警系统事件分类机器学习算法,包括特征提取模块,分类器结构模块和训练数据库模块,所述特征提取模块内部包括有分段能量占比单元、能量单元、信号连续性单元、时间标记单元、传感器序号单元和光缆埋深单元,所述分类器结构模块内部包括有预处理分类器、主分类器、防误报分类器和防漏报分类器,所述训练数据库模块内部包括有信号定义数据库、日常事件数据库、纠偏数据库一和纠偏数据库二,其算法如下:
s1:信号收集及预处理分类,光纤预警系统全量数据进入预处理分类器内部进行分类处理,将全量数据分为有待继续分类的振动信号和绝地安全的无振动事件,预处理分类器模型训练库为所有采集到的信号组成的集合进行提取,具有振动特征的标记为正样本,纯噪声信号标记为负样本;s2:危险信号的分类:振动信号进入主分类器内部进行分离,主分类器模型训练数据库为日常事件数据库,日常事件数据库是信号定义数据库中的正样本,经过核实为安全事件信号的标记为正样本,经过核实为危险事件信号的标记为负样本,数据经过主分类器后分为中间安全信号和中间危险信号;s3:危险信号防误报分类:中间危险信号进入防误报分类器,防误报分类器模型训练数据库是经过现场核实的误报事件、经过现场核实的危害事件组成,其中经过现场核实的误报事件信号标记为正样本,经过现场核实的危害事件信号标记为负样本,中间危险信号通过防误报分类器后得到最终安全信号一和最终危险信号一;s4:安全信号防漏报分类:中间安全信号进入防漏报分类器进行分类,防漏报分类器模型训练数据库是由现场核实的危害事件信号,相同数据条目的经过核实的安全事件信号组成,其中经过现场核实的漏事件信号标记为负样本,经过现场核实的危害事件信号标记为负样本,经过核实的安全事件信号为正样本,中间安全信号通过防漏报分类器后得到最终安全信号二和最终危险信号二。
7.通过采用上述技术方案,通过对日常产生的错误情况进行分类,并通过数据库对错误报告进行核对,从而使整体产生的错误报告为正常的错误报告,方便使用者可以快速且正确的找到需要修理的地方,保证整体良好的使用效果。
8.进一步的,所述分段能量占比单元用于将信号频谱等分成十等段,所述能量单元用于反映信号的幅值,即振动信号的幅度,所述信号连续性单元用于把信号等分为十段,并记录信号连续特征。
9.通过采用上述技术方案,对将信号频谱进行分段,反映信号在频域的分布情况,并通过能量单元反映信号的幅值,接着通过信号连续性单元对信号连续性特征进行记录,方便整体对信号进行分析处理。
10.进一步地,所述时间标记单元用于采集信号时间,并反应现场活动时间特性,所述传感器序号单元用于收集传感器位置信息,并对每个独立传感单元进行顺序标号,所述光缆埋深单元用于对应传感器序号所在实际位置进行光缆埋深。
11.通过采用上述技术方案,时间标记单元可以反应时间标记特征,且传感器序号单元将光缆分数数个独立的传感单元,互不干扰,同时光缆埋深单元即对应传感器序号所在实际位置光缆的埋深,方便整体进行布置,方便整体后期获得信号。
12.进一步地,所述预处理分类器用于区分有振动信号和无振动事件,所述预处理分类器数据库为信号定义数据库。
13.通过采用上述技术方案,预处理分类器主要作用首先区分有振动信号和无振动事件,是利用信号定义数据库中的数据进行训练得到的分类器模型,信号定义数据库是指所有采集到的所有信号组成的集合提取,具有振动特征的标记为正样本,纯噪声信号标记为负样本。
14.进一步地,所述主分类器用于区分振动信号是否有危害性,所述主分类器的数据
库为日常事件数据库。
15.通过采用上述技术方案,主分类器要作用是区分振动信号是否有危害性,是利用日常事件数据库的数据进行训练得到的模型,日常事件数据库是信号定义数据库中的正样本,经过核实为安全事件信号的标记为正样本,经过核实为危险事件信号的标记为负样本。
16.进一步地,所述防误报分类器用于判断在信号推理过程中主分类器中判断为危害事件的信号属实情况,所述防误报分类器的数据库为纠偏数据库一。
17.通过采用上述技术方案,由于埋地管道振动数据的特殊性,危害事件和安全事件数量严重失衡,会导致主分类器产生误报,由于防误报分类器针对的训练数据不同,可以起到一定程度上消除误报的作用。
18.进一步地,所述防漏报分类器用于判断在信号推理过程中主分类器中判断为安全事件的信号属实情况,所述防漏报分类器数据库为纠偏数据库二。
19.通过采用上述技术方案,防止整体内部存在没有发现的错误,对正确的信号进行检索,并将经过现场核实的危害事件信号标记为负样本,经过核实的安全事件信号为正样本,保证整体的检测效果。
20.综上所述,本发明的有益技术效果为:1、采用了提取模块、分类器结构模块和训练数据库模块组成,使用特定的特征组合,特定的分类器结构以及与分类器相匹配的典型数据数据库组成,主要作用是从分布式埋地传感器采集的振动信号中分辨安全事件和危险事件,产生分辨故障事件的效果;2、采用了分类器结构模块和训练数据库模块,方便整体对危险信息进行对比适配,从而快速的知道危险信息,并降低不良和错误信息对整体的影响,产生信息快速准确筛选的效果。
附图说明
21.图1为典型的基于瑞利相干干涉的单波长系统示意图;图2为本发明工作流程示意图;图3为本发明特征提取模块结构示意图;图4为本发明分类器结构模块结构示意图;图5为本发明训练数据库模块结构示意图。
22.图中:1、特征提取模块;2、分类器结构模块;3、训练数据库模块;11、分段能量占比单元;12、能量单元;13、信号连续性单元;14、时间标记单元;15、传感器序号单元;16、光缆埋深单元;21、预处理分类器;22、主分类器;23、防误报分类器;24、防漏报分类器;31、信号定义数据库;32、日常事件数据库;33、纠偏数据库一;34、纠偏数据库二;101、高相干激光光源;102、脉冲发生模块;103、环形器;104、传感光缆;105、光电探测器;106、数字转换模块;107、数据处理模块;201、光纤预警系统全量数据;202、振动信号;203、无振动事件;204、中间安全信号;205、中间危险信号;206、最终安全信号一;207、最终危险信号一;208、最终安全信号二;209、最终危险信号二。
具体实施方式
23.以下结合附图对本发明方法作进一步详细说明。
24.参照图3、图4和图5,一种光纤预警系统事件分类机器学习算法,包括特征提取模块1,分类器结构模块2和训练数据库模块3,特征提取模块1内部包括有分段能量占比单元11、能量单元12、信号连续性单元13、时间标记单元14、传感器序号单元15和光缆埋深单元16,分类器结构模块2内部包括有预处理分类器21、主分类器22、防误报分类器23和防漏报分类器24,预处理分类器21、主分类器22、防误报分类器23和防漏报分类器24均为独立的svm二分类分类器,训练数据库模块3内部包括有信号定义数据库31、日常事件数据库32、纠偏数据库一33和纠偏数据库二34,特定的分类器结构以及与分类器相匹配的典型数据数据库组成,主要作用是从分布式埋地传感器采集的振动信号202中分辨安全事件和危险事件;分段能量占比单元11用于将信号频谱等分成十等段,每一段的能量占总体能量的百分比,共有十个特征,该特征组能够反映信号在频域的分布情况,能量单元12用于反映信号的幅值,该特征能够反映信号的幅值,即振动信号202的幅度,同等条件下,振动幅度越大,信号能量越大,信号连续性单元13用于把信号等分为十段,以整体信号峰值的1/2为阈值。每小段内如果信号峰值超过阈值记为1,峰值未超过阈值记为0,记为1的总段数作为信号连续性特征;时间标记单元14用于采集信号时间,即信号采集的时间,按小时算,比如20:14分的信号记为20,作为时间标记特征,该特征可以反应现场活动的时间特性,传感器序号单元15用于收集传感器位置信息,即传感器位置信息,由于基于瑞利相干的分布式振动传感技术将光缆分数数个独立的传感单元,互不干扰,对每个独立传感单元进行顺序标号,光缆埋深单元16用于对应传感器序号所在实际位置进行光缆埋深;预处理分类器21用于区分有振动信号202和无振动事件203,预处理分类器21数据库为信号定义数据库31,预处理分类器21,主要作用首先区分有振动信号202和无振动事件203,是利用信号定义数据库31中的数据进行训练得到的分类器模型,信号定义数据库31是指所有采集到的所有信号组成的集合提取,具有振动特征的标记为正样本,纯噪声信号标记为负样本;主分类器22用于区分振动信号202是否有危害性,主分类器22的数据库为日常事件数据库32,主分类器22主要作用是区分振动信号202是否有危害性,是利用日常事件数据库32的数据进行训练得到的模型,日常事件数据库32是信号定义数据库31中的正样本,经过核实为安全事件信号的标记为正样本,经过核实为危险事件信号的标记为负样本,在实际应用中,得到的危险事件是由时间段,位置信息组成,由于石油天然气管道线路长,通常是由巡线员汇报现场危害事件信息时,事件已经发生,同时危害事件也会伴随安全类事件的信号特征,比如挖掘机挖掘施工时,破土挖掘属于危害事件,应该标记为负样本,挖掘机行进时则属于安全事件,应该标记为正样本,在实际作业时,通常这两种信号重叠在一起,给信号的标注带来了困难,训练数据库模块3信号打标,采用弱打标的方式,在巡线员汇报的时间、地点段内,需要对采集到的信号进行特定处理,对于危害事件信号打标需要经过聚类算法,距离中心样本最近的80%记为负样本,剩余20%抛弃不打标,样本之间距离计算采用欧氏距离,类中心样本定义为所有样本的平均值;防误报分类器23用于判断在信号推理过程中主分类器22中判断为危害事件的信号属实情况,防误报分类器23的数据库为纠偏数据库一33,主要针对在信号推理过程中主分类器22中判断为危害事件的信号,由于埋地管道振动数据的特殊性,危害事件和安全事
件数量严重失衡,会导致主分类器22产生误报,由于防误报分类,针对的训练数据不同,可以起到一定程度上消除误报的作用,防误报分类器23模型是由纠偏数据库一33数据训练而成,纠偏数据库一33由经过现场核实的误报事件、经过现场核实的危害事件组成,其中经过现场核实的误报事件信号标记为正样本,经过现场核实的危害事件信号标记为负样本,对于危害事件,同样采取弱打标的方式进行打标;防漏报分类器24用于判断在信号推理过程中主分类器22中判断为安全事件的信号属实情况,防漏报分类器24数据库为纠偏数据库二34,主要针对在信号推理过程中主分类器22中判断为安全事件的信号,防漏报分类器24模型是由纠偏数据库二34数据训练而成,纠偏数据库二34由经过现场核实的漏报事件信号,经过现场核实的危害事件信号,相同数据条目的经过核实的安全事件信号组成,其中经过现场核实的漏事件信号标记为负样本,经过现场核实的危害事件信号标记为负样本,经过核实的安全事件信号为正样本;参照图2,其算法如下:s1:信号收集及预处理分类,光纤预警系统全量数据201进入预处理分类器21内部进行分类处理,将全量数据分为有待继续分类的振动信号202和绝地安全的无振动事件203,预处理分类器21模型训练库为所有采集到的信号组成的集合进行提取,具有振动特征的标记为正样本,纯噪声信号标记为负样本;s2:危险信号的分类:振动信号202进入主分类器22内部进行分离,主分类器22模型训练数据库为日常事件数据库32,日常事件数据库32是信号定义数据库31中的正样本,经过核实为安全事件信号的标记为正样本,经过核实为危险事件信号的标记为负样本,数据经过主分类器22后分为中间安全信号204和中间危险信号205;s3:危险信号防误报分类:中间危险信号205进入防误报分类器23,防误报分类器23模型训练数据库是经过现场核实的误报事件、经过现场核实的危害事件组成,其中经过现场核实的误报事件信号标记为正样本,经过现场核实的危害事件信号标记为负样本,中间危险信号205通过防误报分类器23后得到最终安全信号一206和最终危险信号一207;s4:安全信号防漏报分类:中间安全信号204进入防漏报分类器24进行分类,防漏报分类器24模型训练数据库是由现场核实的危害事件信号,相同数据条目的经过核实的安全事件信号组成,其中经过现场核实的漏事件信号标记为负样本,经过现场核实的危害事件信号标记为负样本,经过核实的安全事件信号为正样本,中间安全信号204通过防漏报分类器24后得到最终安全信号二208和最终危险信号二209。
25.本具体实施方式的实施例均为本发明的较佳实施例,并非依此限制本发明的保护范围,故:凡依本发明的结构、形状、原理所做的等效变化,均应涵盖于本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献