技术特征:
1.一种地铁站紧急状态下声音识别方法,其特征在于,包括:
获取地铁站内的声音信号;
对所述声音信号进行声学特征提取,获得声学特征数据;
对所述声学特征数据进行滤波处理,获得声学特征向量;
将所述声学特征向量输入预设声学模型中,识别所述声音信号,并输出声音识别结果。
2.根据权利要求1所述的地铁站紧急状态下声音识别方法,其特征在于,所述声学特征数据包括:声学前端特征、滤波器组特征和梅尔倒谱系数特征中的任意一种或者多种。
3.根据权利要求1所述的地铁站紧急状态下声音识别方法,其特征在于,所述对所述声音信号进行声学特征提取,获得声学特征数据包括:
对所述声音信号进行分帧处理;
对分帧处理后的声音信号提取声学特征。
4.根据权利要求1所述的地铁站紧急状态下声音识别方法,其特征在于,所述声学特征数据为定点数特征向量。
5.根据权利要求4所述的地铁站紧急状态下声音识别方法,其特征在于,所述对所述声学特征数据进行滤波处理,获得声学特征向量包括:
对所述定点数特征向量中的每个定点数的声学特征分别进行滤波运算,获得多个滤波后的浮点数声学特征;
所述多个滤波后的浮点数声学特征为所述声学特征向量;所述声学特征向量为浮点数特征向量。
6.根据权利要求1所述的地铁站紧急状态下声音识别方法,其特征在于,所述方法还包括:
收集正常声音数据,获得正常声音数据集;
收集异常声音数据,获得异常声音数据集;
对所述正常声音数据集和所述异常声音数据集作为训练样本进行处理,获得所述预设声学模型。
7.根据权利要求6所述的地铁站紧急状态下声音识别方法,其特征在于,所述对所述正常声音数据集和所述异常声音数据集作为训练样本进行处理,获得所述预设声学模型包括:
对所述正常声音数据集和所述异常声音数据集进行划分,得到训练数据和验证数据;
提取所述训练数据的声学特征;
将所述声学特征中的每一帧波形转换为包含声音信息的多维特征向量,获得初始模型;
基于所述验证数据对所述初始模型进行验证,获得经过验证后的声学模型;
所述经过验证后的声学醋为所述预设声学模型。
8.根据权利要求1-7任一项所述的地铁站紧急状态下声音识别方法,其特征在于,所述预设声学模型包括:时延神经网络模型、卷积神经网络模型、深度神经网络模型、长短期记忆模型、循环神经网络模型中的任意一种。
9.根据权利要求1所述的地铁站紧急状态下声音识别方法,其特征在于,所述方法还包括:
若所述声音识别结果为异常声音,则根据所述异常声音输出报警信号。
10.根据权利要求9所述的地铁站紧急状态下声音识别方法,其特征在于,所述方法还包括:
若所述声音识别结果为异常声音,则输出声音识别装置的位置信息。
11.一种地铁站紧急状态下声音识别装置,其特征在于,包括:
获取模块,用于获取地铁站内的声音信号;
特征提取模块,用于对所述声音信号进行声学特征提取,获得声学特征数据;
滤波模块,用于对所述声学特征数据进行滤波处理,获得声学特征向量;
识别模块,用于将所述声学特征向量输入预设声学模型中,识别所述声音信号,并输出声音识别结果。
12.一种电子设备,其特征在于,包括:
存储器,用于存储程序;
处理器,用于加载所述程序,执行如权利要求1-10任一项所述的地铁站紧急状态下声音识别方法。
13.一种存储介质,其存储有程序,其特征在于,所述程序被处理器执行时实现如权利要求1-10任一项所述的地铁站紧急状态下声音识别方法。
技术总结
本发明涉及地铁站紧急状态下声音识别方法、装置和电子设备,包括:获取地铁站内的声音信号;对声音信号进行声学特征提取,获得声学特征数据;对声学特征数据进行滤波处理,获得声学特征向量;将声学特征向量输入预设声学模型中,识别声音信号,并输出声音识别结果。本发明可以快速识别地铁站紧急状态下的声音信号,可以准确地识别出异常危险信号,为地铁站预警和监控提供了更为精确的参考信息,且在提高识别准确率的同时,还降低了运算量,提升识别效率。
技术研发人员:朱永寅;谢辉优;蒋辉华;潘超;许宗金;杨雪斌
受保护的技术使用者:深圳达实智能股份有限公司
技术研发日:2021.04.02
技术公布日:2021.08.10
本文用于企业家、创业者技术爱好者查询,结果仅供参考。