技术特征:
1.一种语音处理方法,其特征在于,所述方法包括:
对采集到的唤醒音频的声源进行音区定位,确定目标音区;
基于所述目标音区确定用于波束成形的目标参数值组,其中,用于波束成形的参数值组与所述音区一一对应;
获取待处理音频;
基于所述目标参数值组对所述待处理音频进行波束成形处理,得到目标音频。
2.根据权利要求1所述的方法,其特征在于,所述基于所述目标音区确定用于波束成形的目标参数值组,包括:
获取参数值存储表,所述参数值存储表用于存储与各个音区对应的参数值组;
利用所述目标音区查询参数值存储表,确定所述目标参数值组。
3.根据权利要求2所述的方法,其特征在于,所述获取参数值存储表,包括:
在任一音区作为所述目标音区时,获取测试音频;
利用至少一个预设步长在每种参数的数值范围内进行遍历,得到候选参数值组;
利用所述候选参数值组对所述测试音频进行波束成形处理,得到候选音频;
对所述候选音频进行语音识别测试,得到测试结果;
基于对应于各个候选参数值组的测试结果,确定所述目标音区的目标参数值组,以得到所述参数值存储表。
4.根据权利要3所述的方法,其特征在于,所述在任一音区作为所述目标音区时,获取测试音频,包括:
在任一音区作为所述目标音区时,确定所述目标音区对应的目标语音接收装置;
获取所述目标语音接收装置采集到的音频,得到所述测试音频。
5.根据权利要求1所述的方法,其特征在于,所述获取待处理音频,包括:
利用所述目标音区,确定与所述目标音区对应的目标语音接收装置;
获取所述目标语音接收装置采集到的音频,得到所述待处理音频。
6.根据权利要求1所述的方法,其特征在于,所述基于所述目标参数值组对所述待处理音频进行波束成形处理,得到目标音频,包括:
对所述待处理音频进行回声消除;
对回声消除后的待处理音频进行语音活动检测,得到用户音频;
对所述用户音频进行降噪处理,并利用所述目标参数值组对降噪处理后的待处理音频进行webrtc波束成形处理,得到所述目标音频。
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述基于所述目标参数值组对所述待处理音频进行波束成形处理,得到目标音频的步骤之后,包括:
对所述目标音频进行语音识别,得到语音控制指令;
基于所述语音控制指令,控制相应的执行机构执行对应的动作。
8.一种语音处理装置,其特征在于,所述装置包括:
定位模块,用于对采集到的唤醒音频的声源进行音区定位,确定目标音区;
确定模块,用于基于所述目标音区确定用于波束成形的目标参数值组,其中,用于波束成形的参数值组与所述音区一一对应;
获取模块,用于获取待处理音频;
处理模块,用于基于所述目标参数值组对所述待处理音频进行波束成形处理,得到目标音频。
9.一种电子设备,其特征在于,包括:
存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求1-7中任一项所述的语音处理方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使计算机执行权利要求1-7中任一项所述的语音处理方法。
技术总结
本公开涉及一种语音处理方法、装置、存储介质及电子设备,包括:对采集到的唤醒音频的声源进行音区定位,确定目标音区;基于所述目标音区确定用于波束成形的目标参数值组,其中,用于波束成形的参数值组与所述音区一一对应;获取待处理音频;基于所述目标参数值组对所述待处理音频进行波束成形处理,得到目标音频。通过在确定出与唤醒音频对应的目标音区之后,利用与目标音区对应的目标参数值组对采集到的待处理音频进行波束成形处理,即,在波束成形处理时是利用与目标音区对应的目标参数值进行的,使得波束成形处理能够增强发出唤醒音频的用户的音频而削弱其他声音。
技术研发人员:葛斯函;马天泽;尹路通
受保护的技术使用者:镁佳(北京)科技有限公司
技术研发日:2021.04.26
技术公布日:2021.08.17
本文用于企业家、创业者技术爱好者查询,结果仅供参考。