技术特征:
1.一种语音处理方法,其特征在于,包括:
针对语音集中的任一第一语音文件,通过语音分析确定所述第一语音文件的第一有效语音;
对各第一有效语音在各第一语音文件中的位置进行聚类,得到有效语音在语音文件中的k个预测位置;
针对所述语音集中的任一第二语音文件,从所述第二语音文件在所述k个预测位置处的语音序列中,确定所述第二语音文件的第二有效语音。
2.如权利要求1所述的方法,其特征在于,还包括:
针对所述语音集中的任一语音文件,根据所述语音文件的起始语音序列或结尾语音序列确定所述语音文件的噪声语音;根据所述语音文件的有效语音和所述语音文件的噪声语音,确定所述语音文件的信噪比。
3.如权利要求1所述的方法,其特征在于,
通过语音分析确定所述第一语音文件的第一有效语音,包括:
通过对所述第一语音文件进行滑窗操作,得到每个滑窗的语音序列;
将能量最高的语音序列确定为所述第一语音文件的第一有效语音;所述能量最高的语音序列对应的滑窗为所述第一有效语音在所述第一语音文件中的位置。
4.如权利要求3所述的方法,其特征在于,
通过对所述第一语音文件进行滑窗操作,得到每个滑窗的语音序列,包括:
采用n种不同尺寸的滑窗对所述第一语音文件进行滑窗操作,得到每个滑窗的语音序列;
将能量最高的语音序列确定为所述第一语音文件的第一有效语音,包括:
针对任一种尺寸的滑窗,将能量最高的语音序列确定为所述第一语音文件的第一有效语音。
5.如权利要求3所述的方法,其特征在于,
通过如下方式确定每个滑窗的语音序列的能量:
根据第一滑窗的语音序列与第二滑窗的语音序列,通过差分方式确定所述第二滑窗的语音序列的能量;所述第二滑窗为位于所述第一滑窗之后的第一个滑窗。
6.如权利要求1-5中任一项所述的方法,其特征在于,
从所述第二语音文件在所述k个预测位置处的语音序列中,确定所述第二语音文件的第二有效语音,包括:
从所述第二语音文件在所述k个预测位置处的语音序列中,确定过零率大于预设阈值的语音序列;
从过零率大于预设阈值的语音序列中确定能量最高的语音序列为所述第二语音文件的第二有效语音。
7.如权利要求6所述的方法,其特征在于,
根据所述语音文件的起始语音序列或结尾语音序列确定所述语音文件的噪声语音,包括:
将所述语音文件的起始语音序列或结尾语音序列中能量最低的语音序列,确定为所述语音文件的噪声语音。
8.一种语音处理装置,其特征在于,包括:
确定单元,用于针对语音集中的任一第一语音文件,通过语音分析确定所述第一语音文件的第一有效语音;
处理单元,用于:
对各第一有效语音在各第一语音文件中的位置进行聚类,得到有效语音在语音文件中的k个预测位置;
针对所述语音集中的任一第二语音文件,从所述第二语音文件在所述k个预测位置处的语音序列中,确定所述第二语音文件的第二有效语音。
9.一种计算设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于调用所述存储器中存储的计算机程序,按照获得的程序执行权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行程序,所述计算机可执行程序用于使计算机执行权利要求1至7任一项所述的方法。
技术总结
本发明实施例涉及语音处理技术领域,尤其涉及一种语音处理方法、装置、计算设备及计算机可读存储介质。包括:针对语音集中的任一第一语音文件,通过语音分析确定第一语音文件的第一有效语音;对各第一有效语音在各第一语音文件中的位置进行聚类,得到有效语音在语音文件中的k个预测位置;针对语音集中的任一第二语音文件,从第二语音文件在k个预测位置处的语音序列中,确定第二语音文件的第二有效语音。通过先对语音集中的一部分语音文件的有效语音所在的位置进行聚类,得到k个可能的预测位置,如此,针对剩下的语音文件,只需在这k个预测位置处进行判断即可,无需对再进行逐帧的语音分析,从而提高了提取有效语音的效率。
技术研发人员:李程帅;孙进伟;徐涛
受保护的技术使用者:青岛信芯微电子科技股份有限公司
技术研发日:2021.04.06
技术公布日:2021.07.30
本文用于企业家、创业者技术爱好者查询,结果仅供参考。