一种音乐混响强度估计方法、装置及电子设备与流程

2022-06-05 02:14:50 来源：中国专利 TAG：

技术特征：
1.一种音乐混响强度估计方法，其特征在于，包括：获取原始音乐中带有混响的原始人声信号；对所述原始人声信号分别进行编码和声纹处理，得到编码向量和声纹向量；将所述编码向量和所述声纹向量进行拼接，并将拼接后的向量输入分离网络得到掩码向量；将所述掩码向量和所述编码向量叠加后进行解码得到去除混响后的人声信号；基于所述去除混响后的人声信号和带有混响的原始人声信号估计所述原始音乐的混响强度。2.根据权利要求1所述的音乐混响强度估计方法，其特征在于，所述对所述原始人声信号分别进行编码和声纹处理，得到编码向量和声纹向量，包括：将所述原始人声信号按照预设的步长进行划分；将划分后的原始人声信号进行编码得到编码向量；通过预设算法从所述原始人声信号中提取频谱特征向量；将所述频谱特征向量进行声纹处理得到声纹向量。3.根据权利要求2所述的音乐混响强度估计方法，其特征在于，所述通过预设算法从所述原始人声信号中提取频谱特征向量，包括：将所述原始人声信号进行傅里叶分析，得到第一频谱；对所述第一频谱进行滤波得到第二频谱；基于所述第一频谱和所述第二频谱计算得到所述频谱特征向量。4.根据权利要求2所述的音乐混响强度估计方法，其特征在于，所述将所述频谱特征向量进行声纹处理得到声纹向量，包括：将所述频谱特征向量通过帧表示层得到隐层向量；将所述隐层向量输入统计池化层提取特征表达向量；将所述特征表达向量输入全连接层进行降维得到声纹向量。5.根据权利要求1所述的音乐混响强度估计方法，其特征在于，所述将拼接后的向量输入分离网络得到掩码向量，包括：通过多头注意力机制对所述拼接后的向量进行识别得到多个局部特征向量；通过多头注意力机制对所述局部特征向量进行识别得到掩码向量。6.根据权利要求1所述的音乐混响强度估计方法，其特征在于，所述基于所述去除混响后的人声信号和带有混响的原始人声信号估计所述原始音乐的混响强度，包括：从所述原始人声信号中提取第一强度和信号频率分布；从所述去除混响后的人声信号提取第二强度；计算所述第一强度和第二强度的比值；基于所述第一强度、第二强度、信号频率分布和比值计算所述原始音乐的混响强度。7.根据权利要求1所述的音乐混响强度估计方法，其特征在于，所述获取原始音乐中带有混响的原始人声信号，包括：对所述原始音乐进行音轨分离；从音轨分离后的原始音乐中提取带有混响的原始人声信号。8.一种音乐混响强度估计装置，其特征在于，包括：
获取模块，用于获取原始音乐中带有混响的原始人声信号；处理模块，用于对所述原始人声信号分别进行编码和声纹处理，得到编码向量和声纹向量；分离模块，用于将所述编码向量和所述声纹向量进行拼接，并将拼接后的向量输入分离网络得到掩码向量；解码模块，用于将所述掩码向量和所述编码向量叠加后进行解码得到去除混响后的人声信号；估计模块，用于基于所述去除混响后的人声信号和带有混响的原始人声信号估计所述原始音乐的混响强度。9.一种电子设备，其特征在于，包括：存储器和处理器，所述存储器和所述处理器之间互相通信连接，所述存储器中存储有计算机指令，所述处理器通过执行所述计算机指令，从而执行权利要求1-7中任一项所述的音乐混响强度估计方法。10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的音乐混响强度估计方法。

技术总结
本发明公开了一种音乐混响强度估计方法，该方法包括：通过获取原始音乐中带有混响的原始人声信号；对原始人声信号分别进行编码和声纹处理，得到编码向量和声纹向量；将编码向量和声纹向量进行拼接，并将拼接后的向量输入分离网络得到掩码向量；将掩码向量和编码向量叠加后进行解码得到去除混响后的人声信号；基于去除混响后的人声信号和带有混响的原始人声信号估计原始音乐的混响强度。本发明通过对原始人声信号进行处理，然后根据处理结果进行预测，不会存在相位缺失的情况，有效提高了预测结果的准确度；同时加入了声纹处理，利用了不同人嗓音不同的特点，使音乐混响强度的估计更加准确。加准确。加准确。

技术研发人员：于洋
受保护的技术使用者：镁佳(北京)科技有限公司
技术研发日：2022.02.28
技术公布日：2022/6/3

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：音频处理方法和装置、存储介质和电子设备与流程

一种音乐混响强度估计方法、装置及电子设备与流程

相关文献

最热文献