音频信号处理方法、音频信号处理装置及存储介质与流程

2021-10-09 02:16:00 来源：中国专利 TAG：信号处理音频装置公开方法

技术特征：
1.一种音频信号处理方法，其特征在于，所述音频信号处理方法包括：获取麦克风所采集的观测数据，其中，所述观测数据为多声源音频信号，所述多声源音频信号为至少两个声源发声而被所述麦克风所采集的音频信号；响应于存在直达声和早期反射声的协方差矩阵估计更新值，基于所述直达声和早期反射声的协方差矩阵估计更新值，对所述观测数据进行去混响处理，得到直达声和早期反射声的估计值；基于所述直达声和早期反射声的估计值，对所述多声源音频信号进行盲源分离处理，得到各声源的时域声源信号。2.根据权利要求1所述的音频信号处理方法，其特征在于，基于所述直达声和早期反射声的估计值，对所述多声源音频信号进行盲源分离处理，包括：根据第一分离矩阵，对所述直达声和早期反射声的估计值进行盲源分离，得到所述至少两个声源中每个声源对应声源信号的先验频域估计；根据所述先验频域估计，得到加权系数以及对比函数，并基于所述加权系数和所述对比函数，对第一加权协方差矩阵进行更新，得到第二加权协方差矩阵；基于所述第二加权协方差矩阵，对所述第一分离矩阵进行更新，得到第二分离矩阵；基于所述第二分离矩阵，对所述直达声和早期反射声的估计值进行盲源分离，得到所述至少两个声源中每个声源对应声源信号的后验频域估计；根据所述后验频域估计，得到直达声和早期反射声的协方差矩阵估计更新值，更新直达声和早期声的协方差矩阵估计，并根据所述后验频域估计，得到各声源的时域声源信号。3.根据权利要求2所述的音频信号处理方法，其特征在于，所述根据所述后验频域估计，得到直达声和早期反射声的协方差矩阵估计更新值，包括：根据所述后验频域估计和马尔可夫决策mdp算法，得到所述至少两个声源中每个声源在每个麦克风的观测信号中的直达声和早期反射声的估计值；根据每个声源在每个麦克风的观测信号中的直达声和早期反射声的估计值，得到直达声和早期反射声的协方差矩阵估计更新值。4.根据权利要求3所述的音频信号处理方法，其特征在于，所述根据所述后验频域估计和mdp算法，得到所述至少两个声源中每个声源在每个麦克风的观测信号中的直达声和早期反射声的估计值，包括：基于mdp算法，通过所述后验频域估计的对角矩阵以及所述第二分离矩阵的逆矩阵，得到所述至少两个声源中每个声源在每个麦克风处的观测信号中的直达声和早期反射声的估计值。5.根据权利要求3或4所述的音频信号处理方法，其特征在于，根据每个声源在每个麦克风的观测信号中的直达声和早期反射声的估计值，得到直达声和早期反射声的协方差矩阵估计更新值，包括：根据每个声源在每个麦克风的观测信号中的直达声和早期反射声的估计值，得到所述至少两个声源中每个声源在每个麦克风处的观测信号中的直达声和早期反射声的增广矩阵；基于所述增广矩阵，确定直达声和早期反射声的协方差矩阵估计更新值。6.根据权利要求5所述的音频信号处理方法，其特征在于，所述基于所述增广矩阵，确
定直达声和早期反射声的协方差矩阵估计更新值，包括：确定直达声和早期反射声的协方差矩阵在τ
‑
1帧直达声和早期反射声的协方差矩阵估计值，其中，τ为自然数，τ且大于1；以预设的平滑系数，对所述τ
‑
1帧直达声和早期反射声的协方差矩阵估计值进行平滑处理，得到第τ帧对应的直达声和早期反射声的协方差矩阵估计值。7.一种音频信号处理装置，其特征在于，所述音频信号处理装置包括：获取单元，用于获取麦克风所采集的观测数据，其中，所述观测数据为多声源音频信号，所述多声源音频信号为至少两个声源发声而被所述麦克风所采集的音频信号；去混响单元，用于响应于存在直达声和早期反射声的协方差矩阵估计更新值，基于所述直达声和早期反射声的协方差矩阵估计更新值，对所述观测数据进行去混响处理，得到直达声和早期反射声的估计值；分离单元，用于基于所述直达声和早期反射声的估计值，对所述多声源音频信号进行盲源分离处理，得到各声源的时域声源信号。8.根据权利要求7所述的音频信号处理装置，其特征在于，所述分离单元采用下述方式基于所述直达声和早期反射声的估计值，对所述多声源音频信号进行盲源分离处理：根据第一分离矩阵，对所述直达声和早期反射声的估计值进行盲源分离，得到所述至少两个声源中每个声源对应声源信号的先验频域估计；根据所述先验频域估计，得到加权系数以及对比函数，并基于所述加权系数和所述对比函数，对第一加权协方差矩阵进行更新，得到第二加权协方差矩阵；基于所述第二加权协方差矩阵，对所述第一分离矩阵进行更新，得到第二分离矩阵；基于所述第二分离矩阵，对所述直达声和早期反射声的估计值进行盲源分离，得到所述至少两个声源中每个声源对应声源信号的后验频域估计；根据所述后验频域估计，得到直达声和早期反射声的协方差矩阵估计更新值，更新直达声和早期声的协方差矩阵估计，并根据所述后验频域估计，得到各声源的时域声源信号。9.根据权利要求8所述的音频信号处理装置，其特征在于，所述分离单元采用下述方式根据所述后验频域估计，得到直达声和早期反射声的协方差矩阵估计更新值：根据所述后验频域估计和马尔可夫决策mdp算法，得到所述至少两个声源中每个声源在每个麦克风的观测信号中的直达声和早期反射声的估计值；根据每个声源在每个麦克风的观测信号中的直达声和早期反射声的估计值，得到直达声和早期反射声的协方差矩阵估计更新值。10.根据权利要求9所述的音频信号处理装置，其特征在于，所述分离单元采用下述方式根据所述后验频域估计和mdp算法，得到所述至少两个声源中每个声源在每个麦克风的观测信号中的直达声和早期反射声的估计值：基于mdp算法，通过所述后验频域估计的对角矩阵以及所述第二分离矩阵的逆矩阵，得到所述至少两个声源中每个声源在每个麦克风处的观测信号中的直达声和早期反射声的估计值。11.根据权利要求8或9所述的音频信号处理装置，其特征在于，所述分离单元采用下述方式根据每个声源在每个麦克风的观测信号中的直达声和早期反射声的估计值，得到直达声和早期反射声的协方差矩阵估计更新值：
根据每个声源在每个麦克风的观测信号中的直达声和早期反射声的估计值，得到所述至少两个声源中每个声源在每个麦克风处的观测信号中的直达声和早期反射声的增广矩阵；基于所述增广矩阵，确定直达声和早期反射声的协方差矩阵估计更新值。12.根据权利要求11所述的音频信号处理装置，其特征在于，所述分离单元采用下述方式基于所述增广矩阵，确定直达声和早期反射声的协方差矩阵估计更新值：确定直达声和早期反射声的协方差矩阵在τ
‑
1帧直达声和早期反射声的协方差矩阵估计值，其中，τ为自然数，且τ大于1；以预设的平滑系数，对所述τ
‑
1帧直达声和早期反射声的协方差矩阵估计值进行平滑处理，得到第τ帧对应的直达声和早期反射声的协方差矩阵估计值。13.一种音频信号处理装置，其特征在于，所述电子设备包括：存储器，用于存储指令；以及处理器，用于调用所述存储器存储的指令执行如权利要求1
‑
6中任意一项所述的音频信号处理方法。14.一种计算机可读存储介质，其中存储有指令，所述指令被处理器执行时，执行如权利要求1
‑
6中任意一项所述的音频信号处理方法。

技术总结
本公开关于一种音频信号处理方法、音频信号处理装置及存储介质。音频信号处理方法包括：获取麦克风所采集的观测数据。响应于存在直达声和早期反射的协方差矩阵估计更新值，基于直达声和早期反射声的协方差矩阵估计更新值，对观测数据进行去混响处理，得到直达声和早期反射声的估计值。基于直达声和早期反射声的估计值，对多声源音频信号进行盲源分离处理，得到各声源的时域声源信号。通过本公开提供的音频信号处理方法，能够基于盲源分离算法，获取用于确定直达声和早期反射声的估计值的直达声和早期反射声的协方差矩阵，进而进行盲源分离得到各音频信号时，可以削弱混响声的干扰，从而提升信号分离的性能，提高音频信号的处理质量。的处理质量。的处理质量。

技术研发人员：侯海宁
受保护的技术使用者：北京小米松果电子有限公司
技术研发日：2021.06.18
技术公布日：2021/10/8

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种基于声波探测的车轴异常AI识别系统的制作方法

音频信号处理方法、音频信号处理装置及存储介质与流程

相关文章

最热文献