一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种音频处理方法、装置、介质和电子设备与流程

2021-12-01 01:16:00 来源:中国专利 TAG:

技术特征:
1.一种音频处理方法,包括:获取待处理音频包括的多个音频帧中至少部分音频帧分别对应的频域信息,以及所述至少部分音频帧中相邻两个音频帧之间的频谱变化信息;基于所述频域信息与所述频谱变化信息,生成与所述待处理音频对应的输入特征;将所述输入特征输入音频类型识别模型,得到所述待处理音频对应的音频类型识别结果;其中,所述音频类型识别模型包括基于多个标注了音频类型信息的音频样本训练得到的神经网络模型。2.根据权利要求1所述的方法,所述频域信息包括由第一预设数量的梅尔带分别对应的幅度所组成的梅尔频谱;所述频谱变化信息包括由所述相邻两个音频帧分别在各所述梅尔带下的幅度变化值。3.根据权利要求1所述的方法,所述音频类型识别模型包括卷积神经网络;所述卷积神经网络包括第二预设数量的卷积层与池化层。4.根据权利要求3所述的方法,所述第二预设数量不大于5。5.根据权利要求1所述的方法,所述音频样本包括多种音乐类型的音乐样本。6.根据权利要求1所述的方法,所述待处理音频包括通过音频数据采样得到的音频片段;其中,通过采样得到的相邻的两个音频片段至少包括部分相同的音频帧。7.根据权利要求1所述的方法,还包括:响应于所述音频类型识别结果指示所述待处理音频的类型为预设类型,对所述待处理音频数据进行动态范围压缩处理,并输出处理后的音频;响应于所述音频类型识别结果指示所述待处理音频的类型不是所述预设类型,对所述待处理音频数据进噪音抑制和/或自动增益控制处理,并输出处理后的音频。8.一种音频处理装置,包括:获取模块,用于获取待处理音频包括的多个音频帧中至少部分音频帧分别对应的频域信息,以及所述至少部分音频帧中相邻两个音频帧之间的频谱变化信息;生成模块,用于基于所述频域信息与所述频谱变化信息,生成与所述待处理音频对应的输入特征;识别模块,用于将所述输入特征输入音频类型识别模型,得到所述待处理音频对应的音频类型识别结果;其中,所述音频类型识别模型包括基于多个标注了音频类型信息的音频样本训练得到的神经网络模型。9.一种电子设备,所述设备包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器通过运行所述可执行指令以实现如权利要求1

7任一所述的音频处理方法。10.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于使处理器执行如权利要求1

7任一所述的音频处理方法。

技术总结
本公开的实施方式提供了一种音频处理方法。该方法可以包括:获取待处理音频包括的多个音频帧中至少部分音频帧分别对应的频域信息,以及所述至少部分音频帧中相邻两个音频帧之间的频谱变化信息;基于所述频域信息与所述频谱变化信息,生成与所述待处理音频对应的输入特征;将所述输入特征输入音频类型识别模型,得到所述待处理音频对应的音频类型识别结果。从而可以使音频类型识别模型结合对识别音频类型有益的频率特征与能量变化特征进行音频类型识别,提升音频类型识别准确性,为用户带来了更好的体验。此外,本公开的实施方式提供了一种音频处理装置,介质与电子设备。介质与电子设备。介质与电子设备。


技术研发人员:郝一亚 阮良 陈功 张伟伟 陈丽
受保护的技术使用者:杭州网易智企科技有限公司
技术研发日:2021.08.06
技术公布日:2021/11/30
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献