技术特征:
1.一种语音活动检测方法,其特征在于,所述方法包括
确定第t帧音频信号的第一空间谱,所述第t帧音频信号包括m个麦克风采集的m个第一音频信号,且所述m个第一音频信号与所述m个麦克风一一对应,m为大于1的整数,t为正整数;
确定所述第t帧音频信号中的背景干扰信号的第二空间谱;
根据所述第一空间谱和所述第二空间谱,确定所述第t帧音频信号中的期望语音信号的第三空间谱;
基于所述第三空间谱,检测所述第t帧音频信号中的语音活动。
2.根据权利要求1所述的方法,其特征在于,所述确定所述第t帧音频信号中的背景干扰信号的第二空间谱,包括:
根据所述第一空间谱和第四空间谱,确定所述第二空间谱,所述第四空间谱为第t-1帧音频信号中的背景干扰信号的空间谱,所述第t-1帧音频信号包括所述m个麦克风采集的m个第二音频信号,且所述m个第二音频信号与所述m个麦克风一一对应。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一空间谱和第四空间谱,确定所述第二空间谱之前,所述方法还包括:
采用单通道语音检测方法,对所述第t-1帧音频信号中的参考音频信号进行语音活动检测;
所述根据所述第一空间谱和第四空间谱,确定所述第二空间谱,包括:
在检测到所述参考音频信号中存在语音活动的情况下,根据所述第一空间谱和所述第四空间谱,确定所述第二空间谱。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述m个第一音频信号包括1个参考音频信号和m-1个音频信号;
所述确定第t帧音频信号的第一空间谱,包括:
对于所述m-1个音频信号中的第g个音频信号,基于所述第g个音频信号和所述参考音频信号,确定第g个互功率谱,g为小于或等于m-1的正整数;
根据m-1个互功率谱、目标转换矩阵和频域加权系数,确定所述第一空间谱;
其中,所述目标转换矩阵为预设的频域-空间转换矩阵,所述频域加权系数是根据期望语音信号在每个频点上存在的估计概率确定的。
5.根据权利要求1至3中任一项所述的方法,其特征在于,所述根据所述第一空间谱和所述第二空间谱,确定所述第t帧音频信号中的期望语音信号的第三空间谱,包括:
根据所述第一空间谱和所述第二空间谱,确定所述第t帧音频信号中的背景干扰信号的过滤增益;
根据所述第一空间谱和所述过滤增益,确定所述第三空间谱。
6.一种语音活动检测装置,其特征在于,所述装置包括确定模块和检测模块;
所述确定模块,用于确定第t帧音频信号的第一空间谱,且确定所述第t帧音频信号中的背景干扰信号的第二空间谱,并根据所述第一空间谱和所述第二空间谱,确定所述第t帧音频信号中的期望语音信号的第三空间谱;所述第t帧音频信号包括m个麦克风采集的m个第一音频信号,且所述m个第一音频信号与所述m个麦克风一一对应,m为大于1的整数,t为正整数;
所述检测模块,用于基于所述确定模块确定的所述第三空间谱检测所述第t帧音频信号中的语音活动。
7.根据权利要求6所述的装置,其特征在于,
所述确定模块,具体用于根据所述第一空间谱和第四空间谱,确定所述第二空间谱,所述第四空间谱为第t-1帧音频信号中的背景干扰信号的空间谱,所述第t-1帧音频信号为所述m个麦克风采集的m个第二音频信号,且所述m个第二音频信号与所述m个麦克风一一对应。
8.根据权利要求7所述的装置,其特征在于,
所述检测模块,还用于在所述确定模块根据所述第一空间谱和所述第四空间谱,确定所述第二空间谱之前,采用单通道语音检测方法,对所述第t-1帧音频信号中的参考音频信号进行语音活动检测;
所述确定模块,具体用于在所述检测模块检测到所述参考音频信号中存在语音活动的情况下,根据所述第一空间谱和所述第四空间谱,确定所述第二空间谱。
9.根据权利要求6至8中任一项所述的装置,其特征在于,所述m个第一音频信号包括1个参考音频信号和m-1个音频信号;
所述确定模块,具体用于对于所述m-1个音频信号中的第g个音频信号,基于所述第g个音频信号和所述参考音频信号,确定第g个互功率谱;且根据m-1个互功率谱、目标转换矩阵和频域加权系数,确定所述第一空间谱;
其中,所述目标转换矩阵为预设的频域-空间转换矩阵,所述频域加权系数是根据所述第t帧音频信号中的期望语音信号在每个频点存在的估计概率确定的,g小于或等于m-1的正整数。
10.根据权利要求6至8中任一项所述的装置,其特征在于,所述确定模块,具体用于根据所述第一空间谱和所述第二空间谱,确定所述第t帧音频信号中的背景干扰信号的过滤增益;且根据所述第一空间谱和所述过滤增益,确定所述第三空间谱。
11.一种电子设备,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1至6中任一项所述的语音活动检测方法的步骤。
12.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1至6中任一项所述的语音活动检测方法的步骤。
技术总结
本申请公开了一种语音活动检测方法、装置、电子设备及介质,属于通信技术领域。该方法包括:确定第t帧音频信号的第一空间谱,第t帧音频信号包括M个麦克风采集的M个第一音频信号,且M个第一音频信号与M个麦克风一一对应,M为大于1的整数,t为正整数;确定第t帧音频信号中的背景干扰信号的第二空间谱;根据第一空间谱和第二空间谱,确定第t帧音频信号中的期望语音信号的第三空间谱;基于第三空间谱检测第t帧音频信号中的语音活动。
技术研发人员:杨闳博
受保护的技术使用者:维沃移动通信有限公司
技术研发日:2021.04.27
技术公布日:2021.08.17
本文用于企业家、创业者技术爱好者查询,结果仅供参考。