技术特征:
1.一种音频处理方法,其特征在于,包括:
提取音频信号中的扩展巴克刻度倒谱系数和谐波相关性系数;
将所述扩展巴克刻度倒谱系数和所述谐波相关性系数输入预设音频处理模型中,得到扩展巴克刻度频带增益值;
根据所述扩展巴克刻度频带增益值,获取处理后频带增益值;
根据所述处理后频带增益值与所述音频信号的频谱幅值,获得所述音频信号对应的处理后信号。
2.根据权利要求1所述的音频处理方法,其特征在于,提取音频信号中的扩展巴克刻度倒谱系数包括:
获取所述音频信号的音频频谱,将所述音频频谱划分为多个频段;
将每个所述频段划分为多个扩展巴克刻度频带值;
对多个所述扩展巴克刻度频带值取对数,并进行离散余弦变换,得到多维所述扩展巴克刻度倒谱系数。
3.根据权利要求1或2所述的音频处理方法,其特征在于,提取音频信号中的谐波相关性系数包括:
获取所述音频信号的音频频谱,对当前帧所述音频频谱进行帧移,得到多帧子音频频谱;
将多帧所述子音频频谱与前预设帧所述子音频频谱分别进行幅值相乘,获得多个所述谐波相关性系数。
4.一种音频处理装置,其特征在于,包括:
特征提取模块,用于提取音频信号中的扩展巴克刻度倒谱系数和谐波相关性系数;
增益获取模块,用于将所述扩展巴克刻度倒谱系数和所述谐波相关性系数输入预设音频处理模型中,得到扩展巴克刻度频带增益值;
增益处理模块,用于根据所述扩展巴克刻度频带增益值,获取处理后频带增益值;
音频获取模块,用于根据所述处理后频带增益值与所述音频信号的频谱幅值,获得所述音频信号对应的处理后信号。
5.一种音频处理模型训练方法,其特征在于,包括:
确定预设循环神经网络;
分别提取带噪音频数据的音频特征和纯净音频数据的音频特征;
根据所述带噪音频数据的音频特征和所述纯净音频数据的音频特征,计算实际频带增益值;
将所述带噪音频数据的音频特征和所述纯净音频数据的音频特征输入所述预设循环神经网络中,获取预测频带增益值;
根据损失函数计算所述实际频带增益值和所述预测频带增益值的误差值,根据所述误差值优化所述预设循环神经网络,得到预设音频处理模型;
其中,所述音频特征包括扩展巴克刻度倒谱系数和谐波相关性系数。
6.根据权利要求5所述的音频处理模型训练方法,其特征在于,所述损失函数的计算公式为:
其中,ρ为权重;α代表求均方次数,α0=2;gk为实际频带增益值,
7.根据权利要求5或6所述的音频处理模型训练方法,其特征在于,确定预设循环神经网络包括:
确定所述预设循环神经网络包括:多层全连接层、多层卷积层和多层gru层。
8.一种音频处理模型训练装置,其特征在于,包括:
模型确定模块,用于确定预设循环神经网络;
特征提取模块,用于分别提取带噪音频数据的音频特征和纯净音频数据的音频特征;
实际增益确定模块,用于根据所述带噪音频数据的音频特征和所述纯净音频数据的音频特征,计算实际频带增益值;
预测增益确定模块,用于将所述带噪音频数据的音频特征和所述纯净音频数据的音频特征输入所述预设循环神经网络中,获取预测频带增益值;
模型优化模块,用于根据损失函数计算所述实际频带增益值和所述预测频带增益值的误差值,根据所述误差值优化所述预设循环神经网络,得到预设音频处理模型;
其中,所述音频特征包括扩展巴克刻度倒谱系数和谐波相关性系数。
9.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至3中任一项所述的音频处理方法,或实现权利要求5至7中任一项所述的音频处理模型训练方法。
10.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至3中任一项所述的音频处理方法,或实现权利要求5至7中任一项所述的音频处理模型训练方法。
技术总结
本发明的实施方式提供了一种音频处理方法及装置、音频处理模型训练方法及装置、存储介质和电子设备。该音频处理方法包括:提取音频信号中的扩展巴克刻度倒谱系数和谐波相关性系数;将所述扩展巴克刻度倒谱系数和所述谐波相关性系数输入预设音频处理模型中,得到扩展巴克刻度频带增益值;根据所述扩展巴克刻度频带增益值,获取处理后频带增益值;根据所述处理后频带增益值与所述音频信号的频谱幅值,获得所述音频信号对应的处理后信号。本发明实施例的技术方案可以实现实时音频降噪。
技术研发人员:成帅;陈功;陈丽;郝一亚
受保护的技术使用者:杭州朗和科技有限公司
技术研发日:2021.03.23
技术公布日:2021.07.06
本文用于企业家、创业者技术爱好者查询,结果仅供参考。