一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于声学的呼救检测方法、装置、设备及存储介质与流程

2021-11-20 01:49:00 来源:中国专利 TAG:

技术特征:
1.一种基于声学的呼救检测方法,其特征在于,包括:通过麦克风阵列采集音频数据;采用预设的呼救检测模型对所述音频数据进行声学判断,确定所述音频数据中是否包含有呼救声音事件并输出检测结果;若检测结果为所述音频数据中包含有呼救声音事件,则触发声源定位,根据定位信息生成报警数据并实时上报至相关系统。2.根据权利要求1所述的基于声学的呼救检测方法,其特征在于,所述通过麦克风阵列采集音频数据的步骤,包括:将所述麦克风阵列配置为立体排列阵型,通过立体排列阵型的麦克风阵列同步采集多通道的音频数据。3.根据权利要求1所述的基于声学的呼救检测方法,其特征在于,所述采用预设的呼救检测模型对所述音频数据进行声学判断,确定所述音频数据中是否包含有呼救声音事件并输出检测结果的步骤之前,还包括:采用尖叫声检测样本数据对所述预设的呼救检测模型进行预训练生成一尖叫声检测子模型,以使所述预设的呼救检测模型具备尖叫声判断功能;采用喊叫声检测样本数据对所述预设的呼救检测模型进行预训练生成一喊叫声检测子模型,以使所述预设的呼救检测模型具备喊叫声判断功能;采用命令词识别样本数据对所述预设的呼救检测模型进行预训练生成一命令词检测子模型,以使所述预设的呼救检测模型具备命令词识别功能。4.根据权利要求3所述的基于声学的呼救检测方法,其特征在于,所述采用预设的呼救检测模型对所述音频数据进行声学判断的步骤,包括:采用预设的呼救检测模型对所述音频数据进行尖叫声检测,获取所述音频数据中的尖叫声特征分值;将所述尖叫声特征分值与预设的尖叫声特征阈值进行比对,若所述音频数据中的尖叫声特征分值大于预设的尖叫声特征阈值,则获取所述尖叫声特征分值。5.根据权利要求4所述的基于声学的呼救检测方法,其特征在于,所述采用预设的呼救检测模型对所述音频数据进行声学判断的步骤,包括:采用预设的呼救检测模型对所述音频数据进行喊叫声检测,获取所述音频数据中的喊叫声特征分值;将所述喊叫声特征分值与预设的喊叫声特征阈值进行比对,若所述音频数据中的喊叫声特征分值大于预设的喊叫声特征阈值,则获取所述喊叫声特征分值。6.根据权利要求5所述的基于声学的呼救检测方法,其特征在于,所述采用预设的呼救检测模型对所述音频数据进行声学判断的步骤,包括:采用预设的呼救检测模型对所述音频数据进行命令词识别处理,获取所述音频数据中的关键语音特征;计算所述关键语音特征与预设的表征呼救的命令词语音特征之间的词语关联度分值;若所述词语关联度分值满足预设的关联度阈值要求,则获取所述词语关联度分值。7.根据权利要求6所述的基于声学的呼救检测方法,其特征在于,所述采用预设的呼救检测模型对所述音频数据进行声学判断,确定所述音频数据中是否包含有呼救声音事件并
输出判断结果的步骤,包括:对所述预设的呼救检测模型获得的喊叫声特征分值和词语关联度分值按照预设的权重进行加权求和获得综合分值,将所述综合分值与用于触发报警的第一预设分值进行比对,以及将所述预设的呼救检测模型获得的尖叫声特征分值和词语关联度分值分别与预设的用于触发报警的第二预设分值和第三预设分值进行比对;若所述综合分值大于所述第一预设分值、所述尖叫声特征分值大于所述第二预设分值且所述词语关联度分值大于所述第三预设分值,则判断所述音频数据中包含有呼救声音事件并输出判断结果。8.根据权利要求1

7任意一项所述的基于声学的呼救检测方法,其特征在于,所述若检测结果为所述音频数据中包含有呼救声音事件,则触发声源定位,根据定位信息生成报警数据并实时上报至相关系统的步骤,还包括:根据所述定位信息调用与所述定位信息相匹配的摄像设备拍摄声源位置的图像,并将拍摄获得的图像上报至相关系统。9.一种基于声学的呼救检测装置,其特征在于,包括:采集模块,用于通过麦克风阵列采集音频数据;检测模块,用于采用预设的呼救检测模型对所述音频数据进行声学判断,确定所述音频数据中是否包含有呼救声音事件并输出检测结果;报警模块,用于若检测结果为所述音频数据中包含有呼救声音事件,则触发声源定位,根据定位信息生成报警数据并实时上报至相关系统。10.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8任一项所述基于声学的呼救检测方法的步骤。11.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8任一项所述基于声学的呼救检测方法的步骤。

技术总结
本申请提供了一种基于声学的呼救检测方法、装置、设备及存储介质,其方法包括:通过麦克风阵列采集音频数据;采用预设的呼救检测模型对所述音频数据进行声学判断,确定所述音频数据中是否包含有呼救声音事件并输出检测结果;若检测结果为所述音频数据中包含有呼救声音事件,则触发声源定位,根据定位信息生成报警数据并实时上报至相关系统。该方法可以实现实现及时、迅捷地触发报警且报警操作不容易受现场情况限制。现场情况限制。现场情况限制。


技术研发人员:王丹 高治良
受保护的技术使用者:海宁市微纳感知计算技术有限公司
技术研发日:2021.04.02
技术公布日:2021/11/19
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献