一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种音频特征提取方法、装置及系统与流程

2021-11-05 23:00:00 来源:中国专利 TAG:

技术特征:
1.一种音频特征提取方法,其特征在于,包括:获取音频信息;对所述音频信息执行加强语音信号性能的预处理,得到经过所述预处理后的音频信息;通过快速傅里叶变换将经过所述预处理后的音频信息由时间域转换为频率域;将频率域的所述音频信息经过基于所述音频信息的语种信息设置频率的梅尔滤波器组的滤波处理,确定所述音频信息的音频特征向量。2.根据权利要求1所述的方法,其特征在于,所述将频率域的所述音频信息经过基于所述音频信息的语种信息设置频率的梅尔滤波器组的滤波处理,包括:基于所述音频信息确定所述音频信息对应的语种信息;确定与所述语种信息匹配的预设数量个梅尔滤波器中每个梅尔滤波器所对应的特定起始梅尔频率及特定终止梅尔频率;将频率域的所述音频信息经过所述基于特定梅尔频率设置的每个梅尔滤波器的滤波处理。3.根据权利要求2所述的方法,其特征在于,确定每个梅尔滤波器所对应的特定起始梅尔频率及特定终止梅尔频率,包括:基于所述音频信息对应的语种信息确定第一方式及第二方式;梅尔滤波器组中按顺序排列的预设数量个梅尔滤波器,第k个梅尔滤波器及其之前的梅尔滤波器的特定起始梅尔频率采用第一方式确定;第k 1个梅尔滤波器及其之后的梅尔滤波器的特定起始梅尔频率采用第二方式确定;第k

1个梅尔滤波器及其之前的梅尔滤波器的特定终止梅尔频率采用第一方式确定;第k个梅尔滤波器及其之后的梅尔滤波器的特定终止梅尔频率采用第二方式确定;其中,k为小于预设数量与1的和的一半的正整数,且k 1为大于或等于预设数量与1的和的一半的正整数;每个梅尔滤波器的特定终止梅尔频率为所述梅尔滤波器的下一个梅尔滤波器的特定起始梅尔频率。4.根据权利要求2所述的方法,其特征在于,确定每个梅尔滤波器所对应的特定起始梅尔频率及特定终止梅尔频率,包括:基于所述音频信息对应的语种信息确定第一方式及第二方式;若预设数量为m,待确定的频率点的数量为m 1个;当i小于m与1的和的一半时,第i个频率点及其之前的频率点采用第一方式确定;当i大于等于m与1的和的一半时,第i个频率点及其之后的频率点采用第二方式确定;将m 1个所述频率点按照顺序确定为预设数量的梅尔滤波器的特定起始梅尔频率或特定终止梅尔频率。5.根据权利要求1所述的方法,其特征在于,所述将频率域的所述音频信息经过基于所述音频信息的语种信息设置频率的梅尔滤波器组的滤波处理,确定所述音频信息的音频特征向量,包括:将频率域的所述音频信息经过基于所述音频信息的语种信息设置频率的梅尔滤波器组的滤波处理,得到与所述梅尔滤波器组中梅尔滤波器数量匹配的特征向量;将所述与梅尔滤波器数量匹配的特征向量进行反余弦变换,生成所述音频信息的音频
特征向量。6.根据权利要求1所述的方法,其特征在于,所述将频率域的所述音频信息经过基于所述音频信息的语种信息设置频率的梅尔滤波器组的滤波处理,包括:基于预设关系将所述音频信息由频率域的频率标度转换为梅尔频谱标度,并将转换为所述梅尔频谱标度的音频信息经过基于所述音频信息的语种信息设置频率的梅尔滤波器组的滤波处理。7.根据权利要求1所述的方法,其特征在于,所述对所述音频信息执行加强语音信号性能的预处理,得到经过所述预处理后的音频信息,包括:对所述音频信息进行分帧处理,得到每一帧音频数据;对所述每一帧音频数据进行预加重处理后,将每一帧进行预加重处理后的音频数据经过窗函数处理,得到预处理后的音频信息。8.一种音频特征提取系统,其特征在于,包括:获取单元,用于获取音频信息;预处理单元,用于对所述音频信息执行加强语音信息性能的预处理,得到经过所述预处理后的音频信息;转换单元,用于通过快速傅里叶变换将经过所述预处理后的音频信息由时间域转换为频率域;滤波单元,用于将频率域的所述音频信息经过基于所述音频信息的语种信息设置频率的梅尔滤波器组的滤波处理,确定所述音频信息的音频特征向量。9.一种音频特征提取装置,其特征在于,包括:处理器,用于获取音频信息;对所述音频信息执行加强语音信号性能的预处理,得到经过所述预处理后的音频信息;通过快速傅里叶变换将经过所述预处理后的音频信息由时间域转换为频率域;将频率域的所述音频信息经过基于所述音频信息的语种信息设置频率的梅尔滤波器组的滤波处理,确定所述音频信息的音频特征向量;存储器,用于存储所述处理器执行上述处理过程的程序。10.一种可读存储介质,其特征在于,其上存储有计算机程序,该计算机程序被处理器执行,实现如上述的音频特征提取方法的各步骤。

技术总结
本申请公开了一种音频特征提取方法、装置及系统,获取音频信息,对音频信息执行加强语音信号性能的预处理,得到经过预处理后的音频信息,通过快速傅里叶变换将经过预处理后的音频信息由时间域转换为频率域,将频率域的音频信息经过基于音频信息的语种信息设置频率的梅尔滤波器组的滤波处理,确定音频信息的音频特征向量。本方案通过在对音频信息经过预处理、快速傅里叶变换后,通过梅尔滤波器组进行滤波处理,梅尔滤波器组是基于音频信息的语种信息设置的频率,从而使得音频信息经过的滤波处理是基于音频信息性本身的语种信息实现的,与其语种特征相关联,从而确定的音频特征向量更符合该音频信息对应的语种信息的特征,提高了音频识别的精度。了音频识别的精度。了音频识别的精度。


技术研发人员:岑吴镕 李骊
受保护的技术使用者:北京华捷艾米科技有限公司
技术研发日:2021.08.06
技术公布日:2021/11/4
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献