基于机器学习的矿井传感器报警原因分类方法及装置与流程

2021-11-24 21:57:00 来源：中国专利 TAG：

1.本发明涉及煤矿安全生产数据特征识别技术领域，具体而言，涉及一种基于机器学习的矿井传感器报警原因分类方法及装置。

背景技术：

2.为实时监测煤矿井下环境、保障煤矿安全生产，有关规定要求矿井必须装备安全监控系统。该系统用以监测甲烷浓度、一氧化碳浓度、风速、风压、温度、烟雾、馈电状态、风门状态、风筒状态、局部通风机开停、主要通风机开停等，并实现甲烷超限声光报警、断电和甲烷风电闭锁控制等。其中，甲烷传感器的报警浓度一般在0.5％ch4～1.0％ch4范围内，具体报警浓度可根据其安装位置确定，一氧化碳传感器的报警浓度为0.0024％co。
3.然而，在井下实际开采过程中，导致甲烷传感器、一氧化碳传感器报警的原因是多种多样的。例如，对甲烷传感器、一氧化碳传感器进行调校，导致传感器监测值超过报警浓度；在井下放炮、汽车尾气排放会导致一氧化碳浓度升高，甚至超过报警浓度等。在这些情况下传感器报警而实际并未出现生产危险状况，使安全监控系统难以正确判断井下危险状态，导致矿井安全管理和决策出现错误。

技术实现要素：

4.本发明解决的是现有矿井安全监控系统难以正确判断井下危险状态，导致矿井安全管理和决策出现错误的问题。
5.为解决上述问题，本发明提供一种基于机器学习的矿井传感器报警原因分类方法，所述方法包括：获取矿井传感器在报警前后预设时间段内的监测数据；将所述监测数据输入预先训练的机器学习模型，确定所述监测数据对应的报警原因类型；所述机器学习模型由历史报警数据的数据特征训练得到。
6.可选地，所述数据特征包括以下至少一项：报警期间内最高值、报警期间内最低值、报警期间的时长、报警当日均值、当日数据波动次数、当日数据在基准值以上的波动次数、当日数据在第一阈值以上的波动次数、当日数据在第二阈值以上的波动次数、报警期间内最高值的时间点和报警结束后第一个记录点的时间间隔、报警期间内最高值的时间点和报警开始前最后一个记录点的时间间隔、报警期间内最高值和报警结束后第一记录点的差值、报警期间内最高值和报警开始前最后一个记录点的差值、报警期间内最低值的时间点和报警结束后第一个记录点的时间间隔、报警期间内最低值的时间点和报警开始前最后一个记录点的时间间隔、报警期间内最低值和报警结束后第一个记录点的差值、报警期间内最低值和报警开始前最后一个记录点的差值、报警期间内第一个记录点和报警开始前最后一个记录点的差值、报警期间内第一个记录点和报警开始前最后一个记录点的时间间隔、报警期间内最后一个记录点和报警结束后第一个记录点的时间间隔、报警期间内最后一个记录点和报警结束后第一个记录点的差值。
7.可选地，所述报警原因类型包括：传感器调校、车辆尾气排放、爆破、真实报警及其
他。
8.可选地，所述机器学习模型的训练过程如下：获取历史报警数据，及对所述历史报警数据进行预处理；所述预处理包括异常值剔除、报警原因标签添加；根据所述预处理后的历史报警数据构建多个子特征，以及对所述多个子特征进行模型精确度影响筛选，得到对模型精确度影响高的多个目标特征；将预处理后的历史报警数据及所述训练集对应的报警原因标签、目标特征分为训练集和测试集；根据所述训练集训练机器学习模型，以及根据所述测试集测试所述机器学习模型，直至所述机器学习模型的分类效果满足预设评价指标。
9.可选地，所述报警原因标签添加包括：获取所述历史报警数据中第一报警记录的处置结果，以及将所述处置结果对应的报警原因标签添加至所述第一报警记录；若所述历史报警数据中第二报警记录不存在处置结果，则将与所述第二报警记录的间隔时长小于预设时长的前一条报警记录对应的报警原因标签添加至所述第二报警记录。
10.可选地，所述模型精确度影响的算法为以下至少一种：互信息算法、f
‑
分数算法、最大相关性与最小冗余度算法、前后向选择算法、随机森林算法。
11.可选地，所述机器学习模型为以下至少一种：逻辑回归模型、支持向量机、xgboost、神经网络模型。
12.本发明提供一种基于机器学习的矿井传感器报警原因分类装置，所述装置包括：数据获取模块，用于获取矿井传感器在报警前后预设时间段内的监测数据；报警原因分类模块，用于将所述监测数据输入预先训练的机器学习模型，确定所述矿监测数据对应的报警原因类型；所述机器学习模型由所述矿井传感器的历史报警数据的数据特征训练得到。
13.可选地，还包括机器学习模型的训练模块，用于：获取历史报警数据，及对所述历史报警数据进行预处理；所述预处理包括异常值剔除、报警原因标签添加；根据所述预处理后的历史报警数据构建多个子特征，以及对所述多个子特征进行模型精确度影响筛选，得到对模型精确度影响高的多个目标特征；将预处理后的历史报警数据及所述训练集对应的报警原因标签、目标特征分为训练集和测试集；根据所述训练集训练机器学习模型，以及根据所述测试集测试所述机器学习模型，直至所述机器学习模型的分类效果满足预设评价指标。
14.可选地，所述机器学习模型的训练模块，具体用于：获取所述历史报警数据中第一报警记录的处置结果，以及将所述处置结果对应的报警原因标签添加至所述第一报警记录；若所述历史报警数据中第二报警记录不存在处置结果，则将与所述第二报警记录的间隔时长小于预设时长的前一条报警记录对应的报警原因标签添加至所述第二报警记录。
15.本发明提供的基于机器学习的矿井传感器报警原因分类方法及装置，机器学习模型的训练时基于矿井传感器的历史报警数据的数据特征进行，以及以矿井传感器的报警前后预设时间段内的监测数据输入模型进行分类，扩大了数据基础，充分挖掘了报警相关数据的特征，提炼得到更多、更明显的数据特点，有利于模型精确度及分类效果的提高，提高了报警原因分类的准确度，精准识别传感器真实报警，正确判断井下危险状态，对指导矿井安全开采，协助监控部门提高管理决策水平具有重要意义。
附图说明
16.为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现
有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。
17.图1为本发明的一个实施例中一种基于机器学习的矿井传感器报警原因分类方法的示意性流程图；
18.图2为本发明的一个实施例中报警数据对应特征的重要程度示意图；
19.图3为本发明的一个实施例中一种基于机器学习的矿井传感器报警原因分类装置的结构示意图。
具体实施方式
20.为使本发明的上述目的、特征和优点能够更为明显易懂，下面结合附图对本发明的具体实施例做详细的说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。
21.本发明实施例利用机器学习算法实现传感器报警原因的分类，能够精准识别传感器真实报警，对指导矿井安全开采，协助监控部门提高管理决策水平具有重要意义。
22.图1是本发明的一个实施例中一种基于机器学习的矿井传感器报警原因分类方法的示意性流程图，该方法包括以下步骤：
23.s102，获取矿井传感器在报警前后预设时间段内的监测数据。
24.在监控系统获取到矿井传感器报警后，获取该传感器在报警前后预设时间段内的监测数据。该前后预设时间段可以是报警当日，示例性地，当日的监测数据包括报警前的监测数据(例如自当日0时开始、至报警开始时刻结束)、报警期间内的监测数据(自报警开始时刻开始、至报警结束时刻结束)以及报警结束后的监测数据(例如自报警结束时刻开始、至结束时刻后经过1分钟、10分钟、1小时结束)。
25.在本实施例中，针对传感器报警原因进行分类时，不仅仅依赖于报警期间内的监测数据进行，而是将报警前后预设时间段内的报警开始前、报警结束后的监测数据一并作为分类的数据基础，通过报警期间数据的特征、报警与非报警期间数据之间的关系特征以及当日数据的整体特征，扩大了数据基础，从而提炼得到更多、更明显的数据特点，结合确定报警原因的类别，从而提高报警原因分类的精确度。
26.s104，将监测数据输入预先训练的机器学习模型，确定矿井传感器的报警原因类型。
27.其中，该机器学习模型由矿井传感器的历史报警数据对应的数据特征训练得到。该数据特征可以分为以下三类：报警期间数据的特征、报警当日数据的特征、报警期间数据与报警当日非报警数据的关系特征。该报警期间数据的特征，例如可以是最高值max、最低值min、报警持续时间等，表达的是报警数据自身的特点；该报警当日数据的特征，例如可以是全天波动次数、均值等，表达的是报警当日更长时段内数据的整体特点；该报警期间数据与报警当日非报警数据的关系特征，例如可以是max与报警前最后一个点的差值、min与报警后第一个点的时间间隔等，表达的是报警数据与非报警数据之间的关系特点。
28.基于上述数据对机器学习模型进行训练，该机器学习模型为以下至少一种：逻辑回归模型、支持向量机(support vector machines，svm)、xgboost、神经网络模型，至机器
学习模型的分类效果满足预设的评价指标结束训练。
29.可选地，本实施例还对上述历史报警数据对应的报警原因进行了精细分类，上述报警原因类型可以包括以下四类：传感器调校、车辆尾气排放、爆破、真实报警及其他。
30.以一氧化碳传感器为例，其报警的真实原因通常包括以下情况：
31.(1)调校，指采用空气样和标准气样按产品说明书对一氧化碳传感器进行调校，保证一氧化碳传感器可以准确检测井下环境实际浓度。对传感器进行调校操作时，充入的气体浓度超过一氧化碳传感器报警浓度阈值，导致传感器误报警；
32.(2)尾气排放，指胶轮车、单轨吊车、铲车等车辆在井下工作时排放尾气，导致一氧化碳浓度升高，导致传感器误报警；
33.(3)爆破，指井下的炮采工作面和炮掘巷道内进行爆破作业时产生大量一氧化碳，导致传感器误报警；
34.(4)真实报警及其他，其包含因开采作业导致的真实报警或不属于上述三类情况的误报警，但该类误报警与真实报警的数据特征相似，无法区分。
35.结合上述三类特征类型对上述报警原因类型的特点进行示例性介绍。以调校为例，其在传感器处注入标准气样呈现突然性，即不存在一氧化碳浓度缓慢上升的过程，而是突变超过报警阈值且最大值达到一个较高浓度水平，持续时间短，可以理解的是井下一氧化碳的增加通常是一个缓慢的过程。以尾气排放为例，车辆排放一氧化碳通常为规律性的，即各时刻一氧化碳的增加量保持在固定的水平，持续时间更长，而井下一氧化碳的增加通常不具有该规律性。
36.可选地，本实施例提供了各类特征的具体选择参数，如下：
37.(1)报警期间数据的特征
38.报警期间内最高值、报警期间内最低值、报警期间的时长。
39.(2)报警当日数据的特征
40.报警当日均值、当日数据波动次数、当日数据在基准值以上的波动次数、当日数据在第一阈值以上的波动次数、当日数据在第二阈值以上的波动次数；
41.(3)报警期间数据与报警当日非报警数据的关系特征
42.报警期间内最高值的时间点和报警结束后第一个记录点的时间间隔、报警期间内最高值的时间点和报警开始前最后一个记录点的时间间隔、报警期间内最高值和报警结束后第一记录点的差值、报警期间内最高值和报警开始前最后一个记录点的差值、报警期间内最低值的时间点和报警结束后第一个记录点的时间间隔、报警期间内最低值的时间点和报警开始前最后一个记录点的时间间隔、报警期间内最低值和报警结束后第一个记录点的差值、报警期间内最低值和报警开始前最后一个记录点的差值、报警期间内第一个记录点和报警开始前最后一个记录点的差值、报警期间内第一个记录点和报警开始前最后一个记录点的时间间隔、报警期间内最后一个记录点和报警结束后第一个记录点的时间间隔、报警期间内最后一个记录点和报警结束后第一个记录点的差值。
43.本实施例提供的基于机器学习的矿井传感器报警原因分类方法，机器学习模型的训练时基于矿井传感器的历史报警数据的数据特征进行，以及以矿井传感器的报警前后预设时间段内的监测数据输入模型进行分类，扩大了数据基础，充分挖掘了报警相关数据的特征，提炼得到更多、更明显的数据特点，有利于模型精确度及分类效果的提高，提高了报
警原因分类的准确度，精准识别传感器真实报警，正确判断井下危险状态，对指导矿井安全开采，协助监控部门提高管理决策水平具有重要意义。
44.可选地，上述机器学习模型的训练过程如下：
45.首先，获取历史报警数据，及对历史报警数据进行预处理。
46.预处理可以包括异常值剔除、报警原因标签添加。具体地，针对相隔时长较短的多次报警，且其中一条处置而后续其他报警未处理的情况，可以按照以下方式添加标签：获取历史报警数据中第一报警记录的处置结果，以及将处置结果对应的报警原因标签添加至第一报警记录；若历史报警数据中第二报警记录不存在处置结果，则将与第二报警记录的间隔时长小于预设时长的前一条报警记录对应的报警原因标签添加至第二报警记录。即，以该前一条报警记录的处置结果(例如为尾气排放)，作为第二报警记录的报警原因标签(尾气排放)。
47.其次，根据预处理后的历史报警数据构建多个子特征，以及对多个子特征进行模型精确度影响筛选，得到对模型精确度影响高的多个目标特征。
48.模型精确度影响的算法可以是以下一种或多种：互信息算法、f
‑
分数算法(f
‑
score)、最大相关性与最小冗余度算法(max
‑
relevance and min
‑
redundancy，mrmr)、前后向选择算法、随机森林算法。
49.然后，将预处理后的历史报警数据及训练集对应的报警原因标签、目标特征分为训练集和测试集。
50.最后，根据训练集训练机器学习模型，以及根据测试集测试机器学习模型，直至机器学习模型的分类效果满足预设评价指标。
51.以下实施例以一氧化碳co传感器报警数据为例，详细介绍上述方法。
52.根据实际情况将co传感器报警原因分为：调校、尾气排放、爆破、其他四类。调校是指采用空气样和标准气样按产品说明书对co传感器进行调校，保证co传感器可以准确检测井下环境实际浓度。对传感器进行调校操作时，充入的气体浓度超过co传感器报警浓度值，导致传感器误报警；尾气排放是指胶轮车、单轨吊车、铲车等车辆在井下工作时排放尾气，导致co浓度升高，传感器误报警；爆破是指井下在炮采工作面和炮掘巷道内进行爆破作业时产生大量co，导致传感器误报警；其他包含因开采作业导致的真实报警或不属于上述三类情况的误报警，但与真实报警的数据特征相似，无法区分。
53.(1)数据预处理
54.获取近一年内co传感器所有报警的当日一整天监测数据，剔除数据中的异常值，比如
‑
9999，
‑
9998等超量程值。然后，根据其报警处置结果，进行标记。四类报警原因分别标记为：调校1、尾气排放2、爆破3、其他4，数据集示例如下：
55.[0056][0057]
在实际数据中，会出现同一个传感器一天内多次报警，且其中一条报警处置结果为尾气排放，其余未处理。因井下车辆不太可能在报警后马上离开，那么每次发动车辆时，都会使co浓度过高导致报警。在对类似数据进行打标时可以将当日的多条报警均标记为尾气排放。
[0058]
(2)特征选择
[0059]
结合不同报警类型的实际情况与数据特征，按下列三个方面区分不同报警类型：
[0060]
1.报警时数据特征：最高值max，最低值min，报警持续时间等；
[0061]
2.全天数据特征：全天波动次数，均值等；
[0062]
3.报警数据与非报警数据之间的关系：max与报警前最后一个点前的差值，min与报警后第一个点的持续时间等。
[0063]
基于以上3大类特征构造了共60余个子特征，采用互信息、f
‑
score、mrmr、前后向选择、随机森林特征重要程度等方法筛选出了20个对模型精确度有重大影响的特征，如下：
[0064]
1.当日co报警均值(svg_all_day)
[0065]
2.当日co数据波动次数(fluctuationcount)
[0066]
3.当日co数据在1以上的波动次数(onecount)
[0067]
4.当日co数据在5以上的波动次数(fivecount)
[0068]
5.当日co数据在基准值以上的波动次数(eightcount)
[0069]
6.报警内最高值(max_value)
[0070]
7.报警内最低值(min_value)
[0071]
8.报警时长(alarm_duration)
[0072]
9.报警内最高值的时间点和报警后第一个记录点的时间间隔(max_after_first_duration)
[0073]
10.报警内最高值的时间点和报警前最后一个记录点的时间间隔(max_pre_last_duration)
[0074]
11.报警内最高值和报警后第一记录点的差值(max_after_first)
[0075]
12.报警内最高值和报警前最后一个记录点的差值(max_pre_last)
[0076]
13.报警内最低值的时间点和报警后第一个记录点的时间间隔(min_after_first_duration)
[0077]
14.报警内最低值的时间点和报警前最后一个记录点的时间间隔(min_pre_last_duration)
[0078]
15.报警内最低值和报警后第一个记录点的差值(min_after_first)
[0079]
16.报警内最低值和报警前最后一个记录点的差值(min_pre_last)
[0080]
17.报警内第一个记录点和报警前最后一个记录点的差值(start_pre_last)
[0081]
18.报警内第一个记录点和报警前最后一个记录点的时间间隔(start_pre_last_duration)
[0082]
19.报警内最后一个记录点和报警后第一个记录点的时间间隔(end_after_first_duration)
[0083]
20.报警内最后一个记录点和报警后第一个记录点的差值(end_after_first)
[0084]
参见图2所示的报警数据对应特征的重要程度示意图，示出了上述20个特征的重要程度得分。
[0085]
(3)构建分类模型
[0086]
基于上述20个特征，可以采用逻辑回归、svm、xgboost、神经网络等多种分类算法，本实施例以采用xgboost模型为例。
[0087]
(4)模型训练
[0088]
将数据集中67％的数据划分为训练集，剩余为测试集。在训练集上通过十折交叉验证方法，训练多种参数组合的模型效果，最终确定参数为：树的深度为10，学习速率为0.8，损失函数为multi:softprob(与softmax原理类似)，其余参数为默认值，此时模型分类效果最好。
[0089]
在2513条测试集上验证模型分类效果，各类评价指标为：准确度：84％，精确度：83％，召回率：86％。混淆矩阵如下表所示：
[0090][0091]
图3是本发明的一个实施例中一种基于机器学习的矿井传感器报警原因分类装置的结构示意图，该装置包括：
[0092]
数据获取模块301，用于获取矿井传感器在报警前后预设时间段内的监测数据；
[0093]
报警原因分类模块302，用于将所述监测数据输入预先训练的机器学习模型，确定所述监测数据对应的报警原因类型；所述机器学习模型由所述矿井传感器的历史报警数据的数据特征训练得到。
[0094]
本实施例提供的基于机器学习的矿井传感器报警原因分类装置，机器学习模型的训练时基于矿井传感器的历史报警数据的数据特征进行，以及以矿井传感器的报警前后预设时间段内的监测数据输入模型进行分类，扩大了数据基础，充分挖掘了报警相关数据的特征，提炼得到更多、更明显的数据特点，有利于模型精确度及分类效果的提高，提高了报警原因分类的准确度，精准识别传感器真实报警，正确判断井下危险状态，对指导矿井安全开采，协助监控部门提高管理决策水平具有重要意义。
[0095]
可选地，作为一个实施例，所述数据特征包括以下至少一项：报警期间内最高值、报警期间内最低值、报警期间的时长、报警当日均值、当日数据波动次数、当日数据在基准
值以上的波动次数、当日数据在第一阈值以上的波动次数、当日数据在第二阈值以上的波动次数、报警期间内最高值的时间点和报警结束后第一个记录点的时间间隔、报警期间内最高值的时间点和报警开始前最后一个记录点的时间间隔、报警期间内最高值和报警结束后第一记录点的差值、报警期间内最高值和报警开始前最后一个记录点的差值、报警期间内最低值的时间点和报警结束后第一个记录点的时间间隔、报警期间内最低值的时间点和报警开始前最后一个记录点的时间间隔、报警期间内最低值和报警结束后第一个记录点的差值、报警期间内最低值和报警开始前最后一个记录点的差值、报警期间内第一个记录点和报警开始前最后一个记录点的差值、报警期间内第一个记录点和报警开始前最后一个记录点的时间间隔、报警期间内最后一个记录点和报警结束后第一个记录点的时间间隔、报警期间内最后一个记录点和报警结束后第一个记录点的差值。
[0096]
可选地，作为一个实施例，所述报警原因类型包括：传感器调校、车辆尾气排放、爆破、真实报警及其他。
[0097]
可选地，作为一个实施例，还包括机器学习模型的训练模块，用于：获取历史报警数据，及对所述历史报警数据进行预处理；所述预处理包括异常值剔除、报警原因标签添加；根据所述预处理后的历史报警数据构建多个子特征，以及对所述多个子特征进行模型精确度影响筛选，得到对模型精确度影响高的多个目标特征；将预处理后的历史报警数据及所述训练集对应的报警原因标签、目标特征分为训练集和测试集；根据所述训练集训练机器学习模型，以及根据所述测试集测试所述机器学习模型，直至所述机器学习模型的分类效果满足预设评价指标。
[0098]
可选地，作为一个实施例，所述机器学习模型的训练模块，具体用于：获取所述历史报警数据中第一报警记录的处置结果，以及将所述处置结果对应的报警原因标签添加至所述第一报警记录；若所述历史报警数据中第二报警记录不存在处置结果，则将与所述第二报警记录的间隔时长小于预设时长的前一条报警记录对应的报警原因标签添加至所述第二报警记录。
[0099]
可选地，作为一个实施例，所述模型精确度影响的算法为以下至少一种：互信息算法、f
‑
分数算法、最大相关性与最小冗余度算法、前后向选择算法、随机森林算法。
[0100]
可选地，作为一个实施例，所述机器学习模型为以下至少一种：逻辑回归模型、支持向量机、xgboost、神经网络模型。
[0101]
上述实施例提供的基于机器学习的矿井传感器报警原因分类装置能够实现上述基于机器学习的矿井传感器报警原因分类方法的实施例中的各个过程，为避免重复，这里不再赘述。
[0102]
本发明实施例还提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述基于机器学习的矿井传感器报警原因分类方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。其中，所述的计算机可读存储介质，如只读存储器(read
‑
only memory，简称rom)、随机存取存储器(random access memory，简称ram)、磁碟或者光盘等。
[0103]
当然，本领域技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令控制装置来完成，所述的程序可存储于一计算机可读取的存储介质中，所述程序在执行时可包括如上述各方法实施例的流程，其中所述的存储介质可为存
储器、磁盘、光盘等。
[0104]
在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0105]
本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。
[0106]
对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种公共信息安全监测装置的制作方法

基于机器学习的矿井传感器报警原因分类方法及装置与流程

相关文献

最热文献