一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于语音识别技术的煤矿井下音视频监控方法与流程

2022-06-05 02:08:19 来源:中国专利 TAG:


1.本发明涉及矿井监控技术领域,尤其涉及一种基于语音识别技术的煤矿井 下音视频监控方法。


背景技术:

2.目前,大多数煤矿井下建设了语音通话及调度广播系统,监控摄像机也具 有了语音对讲功能,语音通话多采用有线电话实现矿井上下的通信,但语音通 信系统往往独立于摄像仪存在,在通话线路建立后,调度人员不能实时观测到 工人所在的区域,不便于了解井下实时场景;并且,当前音视频监控系统中语 音通道需要人工近距离操作控制,由此带来通话的不及时,一旦井下发生危急 情况,矿井上下通信不及时、不通畅,将严重影响后续应急救援工作开展,危 及井下矿工的人身与财产安全。


技术实现要素:

3.本发明要解决的技术问题是:为了解决现有技术中的语音通话和视频监控 是独立的,在语音通话时,调度员不能在通话的同时监控到矿井下通话人员周 边的实际情况,现有技术中语音通话的建立需要手动近距离操作,智能化水平 低的技术问题。本发明提供一种基于语音识别技术的煤矿井下音视频监控方法, 可以有效解决当前音视频监控系统中语音通道不及时、不灵活等问题;通话过 程中调度人员可以实时观测工人所在区域,便于做下一步的操作,有效提升煤 矿井下音视频监控系统的智能化水平。
4.本发明解决其技术问题所采用的技术方案是:一种基于语音识别技术的煤 矿井下音视频监控方法,包括以下步骤:
5.步骤s1、获取矿井下监控画面的实时音视频数据;
6.步骤s2、将获取到的音视频数据传输至地面服务器;
7.步骤s3、所述地面服务器对音视频数据进行分析处理,根据分析结果判定 是否建立通话;
8.所述步骤s3包括:
9.步骤s31、检测音视频中的语音内容;
10.步骤s32、分析语音内容中的词汇;
11.步骤s33、判断语音内容中的词汇是否符合预设词汇,若为是,则建立语音 通道,若为否,则继续进行音视频监控。
12.进一步地,通过语音检测模型判断语音内容中的词汇是否符合预设词汇。
13.进一步地,为了提高判断识别的精度,获取语音检测模型的步骤包括:
14.步骤s331、采集矿井下的实时音视频数据;
15.步骤s332、对获取到的音视频数据分切处理为若干词汇;
16.步骤s333、通过标签制作工具对所采集到的若干词汇打标签,每一类相同 的语音数据打上对应类别的标签;
17.步骤s334、将多类标签输入到网络模型中,经过多轮迭代训练后得到语音 检测模型。
18.优选地,标签制作工具采用transcriber。
19.进一步地,为了便于操作,通过摄像头获取监控画面实时音视频数据。
20.进一步地,所述音视频数据通过井下工业环网传输到地面服务器。
21.本发明的有益效果是,本发明的基于语音识别技术的煤矿井下音视频监控 方法,具有以下优点:
22.1、本发明提供的一种基于语音识别技术的煤矿井下音视频监控方法,通过 后端服务器实时分析井下语音内容,实现对工人特定语音的检测并触发语音通 道建立,提醒调度人员通话。该发明解决了当前井下语音通道需要人工近距离 手动建立的问题,在发生危急情况下,矿井下的工人不便移动时,能够通过头 灯触发语音通道,及时和调度人员建立联系,提高了矿用摄像仪的智能化水平, 符合智能化矿山建设政策导向。
23.2、本发明提供的一种基于语音识别技术的煤矿井下音视频监控方法,通过 实时检测井下工人的语音内容,根据设定的逻辑规则判断是否建立语音通道, 实时检测准确率可以稳定在90%以上,准确率较高并且能实时响应,具有极高的 可靠性;
24.3、本发明提供的一种基于语音识别技术的煤矿井下音视频监控方法,通过 整合音视频监控系统,使得调度人员在通话过程中可以实时观测工人所在区域, 调度指挥操作更为便捷、高效。
25.4、本发明提供的一种基于语音识别技术的煤矿井下音视频监控方法,适用 于对煤矿井下已有摄像仪改造,只需在后端服务器上分析井下监控画面音视频 数据即可,部署周期短、改造成本低。
26.5、本发明提供的一种基于语音识别技术的煤矿井下音视频监控方法,功耗 较低,满足绿色环保要求。
附图说明
27.下面结合附图和实施例对本发明进一步说明。
28.图1是本发明的基于语音识别技术的煤矿井下音视频监控方法的流程图;
29.图2是本发明的语音检测模型构建方法的流程图。
具体实施方式
30.现在结合附图对本发明作进一步详细的说明。这些附图均为简化的示意图, 仅以示意方式说明本发明的基本结构,因此其仅显示与本发明有关的构成。
31.在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、
ꢀ“
长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、
ꢀ“
右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、
ꢀ“
逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于 附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指 示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作, 因此不能理解为对本发明的限制。此外,限定有“第一”、“第二”的特征可 以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,除非另有 说明,“多个”的含义是两个或两个以上。
32.在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安 装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是 可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接 相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领 域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
33.如图1所示,是本发明最优实施例,一种基于语音识别技术的煤矿井下音 视频监控方法,包括以下步骤:
34.步骤s1、获取矿井下监控画面的实时音视频数据;步骤s2、将获取到的音 视频数据传输至地面服务器;步骤s3、地面服务器对音视频数据进行分析处理, 根据分析结果判定是否建立通话;
35.步骤s3包括:步骤s31、检测音视频中的语音内容;步骤s32、分析语音 内容中的词汇;步骤s33、判断语音内容中的词汇是否符合预设词汇,若为是, 则建立语音通道,若为否,则继续进行音视频监控。
36.通过语音检测模型判断语音内容中的词汇是否符合预设词汇,获取语音检 测模型的步骤包括:
37.步骤s331、采集矿井下的实时音视频数据;步骤s332、对获取到的音视频 数据分切处理为若干词汇;步骤s333、通过标签制作工具对所采集到的若干词 汇打标签,每一类相同的语音数据打上对应类别的标签;步骤s334、将多类标 签输入到网络模型中,经过多轮迭代训练后得到语音检测模型,标签制作工具 采用transcriber。
38.通过摄像头获取监控画面实时音视频数据,音视频数据通过井下工业环网 传输到地面服务器。
39.上述数据处理及标签制作步骤中,对获取到的语音信息进行处理,得到特 定词汇,如“打开”、“通话”等,采用标签制作工具将每一类相同的语音数据打上 对应类别的标签。
40.预设词汇为“通话”,当检测到音视频数据中含有“通话”时,建立语音 通话。
41.上述后端服务器算法采用深度学习方法训练语音数据,网络训练过程中经 过反复迭代优化得到较为稳定的语音识别模型,基于该语音识别模型实时分析 音视频中的语音内容判断是否具有特定词汇,若检测到特定词汇即触发摄像仪 语音通道建立,进而自动提醒调度人员语音通信,以达到语音通话的实时性、 可靠性。
42.本发明的基于语音识别技术的煤矿井下音视频监控方法,具有以下优点:
43.1、本发明提供的一种基于语音识别技术的煤矿井下音视频监控方法,通过 后端服务器实时分析井下语音内容,实现对工人特定语音的检测并触发语音通 道建立,提醒调度人员通话。该发明解决了当前井下语音通道需要人工近距离 手动建立的问题,在发生危急情况下,矿井下的工人不便移动时,能够通过头 灯触发语音通道,及时和调度人员建立联系,提高了矿用摄像仪的智能化水平, 符合智能化矿山建设政策导向。
44.2、本发明提供的一种基于语音识别技术的煤矿井下音视频监控方法,通过 实时检测井下工人的语音内容,根据设定的逻辑规则判断是否建立语音通道, 实时检测准确率可以稳定在90%以上,准确率较高并且能实时响应,具有极高的 可靠性;
45.3、本发明提供的一种基于语音识别技术的煤矿井下音视频监控方法,通过 整合
音视频监控系统,使得调度人员在通话过程中可以实时观测工人所在区域, 调度指挥操作更为便捷、高效。
46.4、本发明提供的一种基于语音识别技术的煤矿井下音视频监控方法,适用 于对煤矿井下已有摄像仪改造,只需在后端服务器上分析井下监控画面音视频 数据即可,部署周期短、改造成本低。
47.5、本发明提供的一种基于语音识别技术的煤矿井下音视频监控方法,功耗 较低,满足绿色环保要求。
48.以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作 人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。 本项发明的技术性范围并不局限于说明书上的内容,必须要如权利要求范围来 确定其技术性范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献