基于语音识别技术的煤矿井下音视频监控方法与流程

2022-06-05 02:08:19 来源：中国专利 TAG：

1.本发明涉及矿井监控技术领域，尤其涉及一种基于语音识别技术的煤矿井下音视频监控方法。

背景技术：

2.目前，大多数煤矿井下建设了语音通话及调度广播系统，监控摄像机也具有了语音对讲功能，语音通话多采用有线电话实现矿井上下的通信，但语音通信系统往往独立于摄像仪存在，在通话线路建立后，调度人员不能实时观测到工人所在的区域，不便于了解井下实时场景；并且，当前音视频监控系统中语音通道需要人工近距离操作控制，由此带来通话的不及时，一旦井下发生危急情况，矿井上下通信不及时、不通畅，将严重影响后续应急救援工作开展，危及井下矿工的人身与财产安全。

技术实现要素：

3.本发明要解决的技术问题是：为了解决现有技术中的语音通话和视频监控是独立的，在语音通话时，调度员不能在通话的同时监控到矿井下通话人员周边的实际情况，现有技术中语音通话的建立需要手动近距离操作，智能化水平低的技术问题。本发明提供一种基于语音识别技术的煤矿井下音视频监控方法，可以有效解决当前音视频监控系统中语音通道不及时、不灵活等问题；通话过程中调度人员可以实时观测工人所在区域，便于做下一步的操作，有效提升煤矿井下音视频监控系统的智能化水平。
4.本发明解决其技术问题所采用的技术方案是：一种基于语音识别技术的煤矿井下音视频监控方法，包括以下步骤：
5.步骤s1、获取矿井下监控画面的实时音视频数据；
6.步骤s2、将获取到的音视频数据传输至地面服务器；
7.步骤s3、所述地面服务器对音视频数据进行分析处理，根据分析结果判定是否建立通话；
8.所述步骤s3包括：
9.步骤s31、检测音视频中的语音内容；
10.步骤s32、分析语音内容中的词汇；
11.步骤s33、判断语音内容中的词汇是否符合预设词汇，若为是，则建立语音通道，若为否，则继续进行音视频监控。
12.进一步地，通过语音检测模型判断语音内容中的词汇是否符合预设词汇。
13.进一步地，为了提高判断识别的精度，获取语音检测模型的步骤包括：
14.步骤s331、采集矿井下的实时音视频数据；
15.步骤s332、对获取到的音视频数据分切处理为若干词汇；
16.步骤s333、通过标签制作工具对所采集到的若干词汇打标签，每一类相同的语音数据打上对应类别的标签；
17.步骤s334、将多类标签输入到网络模型中，经过多轮迭代训练后得到语音检测模型。
18.优选地，标签制作工具采用transcriber。
19.进一步地，为了便于操作，通过摄像头获取监控画面实时音视频数据。
20.进一步地，所述音视频数据通过井下工业环网传输到地面服务器。
21.本发明的有益效果是，本发明的基于语音识别技术的煤矿井下音视频监控方法，具有以下优点：
22.1、本发明提供的一种基于语音识别技术的煤矿井下音视频监控方法，通过后端服务器实时分析井下语音内容，实现对工人特定语音的检测并触发语音通道建立，提醒调度人员通话。该发明解决了当前井下语音通道需要人工近距离手动建立的问题，在发生危急情况下，矿井下的工人不便移动时，能够通过头灯触发语音通道，及时和调度人员建立联系，提高了矿用摄像仪的智能化水平，符合智能化矿山建设政策导向。
23.2、本发明提供的一种基于语音识别技术的煤矿井下音视频监控方法，通过实时检测井下工人的语音内容，根据设定的逻辑规则判断是否建立语音通道，实时检测准确率可以稳定在90％以上，准确率较高并且能实时响应，具有极高的可靠性；
24.3、本发明提供的一种基于语音识别技术的煤矿井下音视频监控方法，通过整合音视频监控系统，使得调度人员在通话过程中可以实时观测工人所在区域，调度指挥操作更为便捷、高效。
25.4、本发明提供的一种基于语音识别技术的煤矿井下音视频监控方法，适用于对煤矿井下已有摄像仪改造，只需在后端服务器上分析井下监控画面音视频数据即可，部署周期短、改造成本低。
26.5、本发明提供的一种基于语音识别技术的煤矿井下音视频监控方法，功耗较低，满足绿色环保要求。
附图说明
27.下面结合附图和实施例对本发明进一步说明。
28.图1是本发明的基于语音识别技术的煤矿井下音视频监控方法的流程图；
29.图2是本发明的语音检测模型构建方法的流程图。
具体实施方式
30.现在结合附图对本发明作进一步详细的说明。这些附图均为简化的示意图，仅以示意方式说明本发明的基本结构，因此其仅显示与本发明有关的构成。
31.在本发明的描述中，需要理解的是，术语“中心”、“纵向”、“横向”、
ꢀ“
长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、
ꢀ“
右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、
ꢀ“
逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上。
32.在本发明的描述中，需要说明的是，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。
33.如图1所示，是本发明最优实施例，一种基于语音识别技术的煤矿井下音视频监控方法，包括以下步骤：
34.步骤s1、获取矿井下监控画面的实时音视频数据；步骤s2、将获取到的音视频数据传输至地面服务器；步骤s3、地面服务器对音视频数据进行分析处理，根据分析结果判定是否建立通话；
35.步骤s3包括：步骤s31、检测音视频中的语音内容；步骤s32、分析语音内容中的词汇；步骤s33、判断语音内容中的词汇是否符合预设词汇，若为是，则建立语音通道，若为否，则继续进行音视频监控。
36.通过语音检测模型判断语音内容中的词汇是否符合预设词汇，获取语音检测模型的步骤包括：
37.步骤s331、采集矿井下的实时音视频数据；步骤s332、对获取到的音视频数据分切处理为若干词汇；步骤s333、通过标签制作工具对所采集到的若干词汇打标签，每一类相同的语音数据打上对应类别的标签；步骤s334、将多类标签输入到网络模型中，经过多轮迭代训练后得到语音检测模型，标签制作工具采用transcriber。
38.通过摄像头获取监控画面实时音视频数据，音视频数据通过井下工业环网传输到地面服务器。
39.上述数据处理及标签制作步骤中，对获取到的语音信息进行处理，得到特定词汇，如“打开”、“通话”等，采用标签制作工具将每一类相同的语音数据打上对应类别的标签。
40.预设词汇为“通话”，当检测到音视频数据中含有“通话”时，建立语音通话。
41.上述后端服务器算法采用深度学习方法训练语音数据，网络训练过程中经过反复迭代优化得到较为稳定的语音识别模型，基于该语音识别模型实时分析音视频中的语音内容判断是否具有特定词汇，若检测到特定词汇即触发摄像仪语音通道建立，进而自动提醒调度人员语音通信，以达到语音通话的实时性、可靠性。
42.本发明的基于语音识别技术的煤矿井下音视频监控方法，具有以下优点：
43.1、本发明提供的一种基于语音识别技术的煤矿井下音视频监控方法，通过后端服务器实时分析井下语音内容，实现对工人特定语音的检测并触发语音通道建立，提醒调度人员通话。该发明解决了当前井下语音通道需要人工近距离手动建立的问题，在发生危急情况下，矿井下的工人不便移动时，能够通过头灯触发语音通道，及时和调度人员建立联系，提高了矿用摄像仪的智能化水平，符合智能化矿山建设政策导向。
44.2、本发明提供的一种基于语音识别技术的煤矿井下音视频监控方法，通过实时检测井下工人的语音内容，根据设定的逻辑规则判断是否建立语音通道，实时检测准确率可以稳定在90％以上，准确率较高并且能实时响应，具有极高的可靠性；
45.3、本发明提供的一种基于语音识别技术的煤矿井下音视频监控方法，通过整合
音视频监控系统，使得调度人员在通话过程中可以实时观测工人所在区域，调度指挥操作更为便捷、高效。
46.4、本发明提供的一种基于语音识别技术的煤矿井下音视频监控方法，适用于对煤矿井下已有摄像仪改造，只需在后端服务器上分析井下监控画面音视频数据即可，部署周期短、改造成本低。
47.5、本发明提供的一种基于语音识别技术的煤矿井下音视频监控方法，功耗较低，满足绿色环保要求。
48.以上述依据本发明的理想实施例为启示，通过上述的说明内容，相关工作人员完全可以在不偏离本项发明技术思想的范围内，进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容，必须要如权利要求范围来确定其技术性范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：语音合成方法、声学模型的训练方法及装置与流程

基于语音识别技术的煤矿井下音视频监控方法与流程

相关文献

最热文献