基于人工智能的音频编解码的制作方法

2022-04-14 01:14:09 来源：中国专利 TAG：

技术特征：
1.一种用于重构一个或多个音频信号的装置，包括：存储器，被配置为存储音频数据；以及一个或多个处理器，在电路中实施并耦合到所述存储器，所述一个或多个处理器被配置为：使用神经网络，基于所述神经网络的一个或多个输入，生成音频信号的至少一个样本的残差信号，所述残差信号被配置为激励长期预测滤波器和短期预测滤波器中的至少一个；以及使用所述长期预测滤波器和所述短期预测滤波器中的至少一个来确定重构音频信号的至少一个样本，所述重构音频信号的所述至少一个样本是基于使用所述神经网络为所述音频信号的所述至少一个样本生成的所述残差信号来确定的。2.根据权利要求1所述的装置，其中所述长期预测滤波器是长期线性预测(ltp)滤波器。3.根据权利要求2所述的装置，其中所述残差信号包括被配置为激励所述ltp滤波器的长期线性预测(ltp)残差。4.根据权利要求3所述的装置，其中所述一个或多个处理器被配置为：使用所述ltp滤波器确定所述音频信号的所述至少一个样本的线性预测(lp)残差，所述音频信号的所述至少一个样本的所述lp残差是基于使用所述神经网络为所述音频信号的所述至少一个样本生成的所述ltp残差和使用增益和所述音频信号的至少一个先前样本的lp残差确定的所述音频信号的所述至少一个样本的ltp预测来确定的。5.根据权利要求4所述的装置，其中所述增益被应用于所述音频信号的所述至少一个先前样本的所述lp残差。6.根据权利要求4所述的装置，其中所述短期预测滤波器是短期线性预测(lp)滤波器。7.根据权利要求6所述的装置，其中所述一个或多个处理器被配置为：使用所述短期lp滤波器确定所述重构音频信号的所述至少一个样本，所述重构音频信号的所述至少一个样本是基于为所述音频信号的所述至少一个样本确定的lp预测和所述lp残差来确定的。8.根据权利要求7所述的装置，其中所述神经网络的一个或多个输入包括针对所述音频信号的所述至少一个样本的所述ltp预测、针对所述音频信号的所述至少一个样本的所述lp预测、由所述神经网络为所述音频信号的所述至少一个先前样本确定的先前ltp残差和所述重构音频信号的至少一个先前样本中的至少一个。9.根据权利要求7所述的装置，其中将使用所述神经网络为所述音频信号的所述至少一个样本生成的所述ltp残差与所述音频信号的所述至少一个样本的所述ltp预测组合以生成所述音频信号的所述至少一个样本的所述lp残差。10.根据权利要求7所述的装置，其中为所述音频信号的所述至少一个样本确定的所述lp残差与所述音频信号的所述至少一个样本的所述lp预测组合以确定所述重构音频信号的所述至少一个样本。11.根据权利要求1所述的装置，其中所述短期预测滤波器是短期线性预测(lp)滤波器。12.根据权利要求11所述的装置，其中所述残差信号包括被配置为激励所述短期lp滤
波器的线性预测(lp)残差。13.根据权利要求12所述的装置，其中所述一个或多个处理器被配置为：使用所述短期lp滤波器确定所述音频信号的所述至少一个样本的长期线性预测(ltp)残差，所述至少一个样本的所述ltp残差是基于所述音频信号的所述至少一个样本的lp预测和使用所述神经网络生成的所述lp残差来确定的。14.根据权利要求13所述的装置，其中所述长期预测滤波器是长期线性预测(ltp)滤波器。15.根据权利要求14所述的装置，其中所述一个或多个处理器被配置为：使用所述ltp滤波器确定所述重构音频信号的所述至少一个样本，所述重构音频信号的所述至少一个样本是基于所述音频信号的所述至少一个样本的所述ltp残差和使用增益和所述重构音频信号的至少一个先前样本确定的所述音频信号的所述至少一个样本的ltp预测来确定的。16.根据权利要求1所述的装置，其中所述音频信号的所述至少一个样本包括单个样本。17.根据权利要求1所述的装置，其中所述音频信号的所述至少一个样本包括多个样本。18.根据权利要求17所述的装置，其中所述多个样本被包括在所述音频信号的帧中。19.根据权利要求1所述的装置，其中所述音频信号包括话音信号，并且其中所述重构音频信号包括重构话音信号。20.一种重构一个或多个音频信号的方法，所述方法包括：使用神经网络，基于所述神经网络的一个或多个输入，生成音频信号的至少一个样本的残差信号，所述残差信号被配置为激励长期预测滤波器和短期预测滤波器中的至少一个；以及使用所述长期预测滤波器和所述短期预测滤波器中的至少一个来确定重构音频信号的至少一个样本，所述重构音频信号的所述至少一个样本是基于使用所述神经网络为所述音频信号的所述至少一个样本生成的所述残差信号来确定的。21.根据权利要求20所述的方法，其中所述长期预测滤波器是长期线性预测(ltp)滤波器。22.根据权利要求21所述的方法，其中所述残差信号包括被配置为激励所述ltp滤波器的长期线性预测(ltp)残差。23.根据权利要求22所述的方法，进一步包括：使用所述ltp滤波器确定所述音频信号的所述至少一个样本的线性预测(lp)残差，所述音频信号的所述至少一个样本的所述lp残差是基于使用所述神经网络为所述音频信号的所述至少一个样本生成的所述ltp残差和使用增益和所述音频信号的至少一个先前样本的lp残差确定的所述音频信号的所述至少一个样本的ltp预测来确定的。24.根据权利要求23所述的方法，其中所述增益被应用于所述音频信号的所述至少一个先前样本的所述lp残差。25.根据权利要求23所述的方法，其中所述短期预测滤波器是短期线性预测(lp)滤波器。
26.根据权利要求25所述的方法，还包括：使用所述短期lp滤波器确定所述重构音频信号的所述至少一个样本，所述重构音频信号的所述至少一个样本是基于为所述音频信号的所述至少一个样本确定的lp预测和所述lp残差来确定的。27.根据权利要求26所述的方法，其中所述神经网络的一个或多个输入包括针对所述音频信号的所述至少一个样本的所述ltp预测、针对所述音频信号的所述至少一个样本的所述lp预测、由所述神经网络为所述音频信号的所述至少一个先前样本确定的先前ltp残差和所述重构音频信号的至少一个先前样本中的至少一个。28.根据权利要求26所述的方法，其中将使用所述神经网络为所述音频信号的所述至少一个样本生成的所述ltp残差与所述音频信号的所述至少一个样本的所述ltp预测组合以生成所述音频信号的所述至少一个样本的所述lp残差。29.根据权利要求26所述的方法，其中为所述音频信号的所述至少一个样本确定的所述lp残差与所述音频信号的所述至少一个样本的所述lp预测组合以确定所述重构音频信号的所述至少一个样本。30.根据权利要求20所述的方法，其中所述短期预测滤波器是短期线性预测(lp)滤波器。31.根据权利要求30所述的方法，其中所述残差信号包括被配置为激励所述短期lp滤波器的线性预测(lp)残差。32.根据权利要求31所述的方法，还包括：使用所述短期lp滤波器确定所述音频信号的所述至少一个样本的长期线性预测(ltp)残差，所述至少一个样本的所述ltp残差是基于所述音频信号的所述至少一个样本的lp预测和使用所述神经网络生成的所述lp残差来确定的。33.根据权利要求32所述的方法，其中所述长期预测滤波器是长期线性预测(ltp)滤波器。34.根据权利要求33所述的方法，还包括：使用所述ltp滤波器确定所述重构音频信号的所述至少一个样本，所述重构音频信号的所述至少一个样本是基于所述音频信号的所述至少一个样本的所述ltp残差和使用增益和所述重构音频信号的至少一个先前样本确定的所述音频信号的所述至少一个样本的ltp预测来确定的。35.根据权利要求20所述的方法，其中所述音频信号的所述至少一个样本包括单个样本。36.根据权利要求20所述的方法，其中所述音频信号的所述至少一个样本包括多个样本。37.根据权利要求36所述的方法，其中所述多个样本被包括在所述音频信号的帧中。38.根据权利要求20所述的方法，其中所述音频信号包括话音信号，并且其中所述重构音频信号包括重构话音信号。39.一种存储指令的计算机可读存储介质，所述指令在执行时使设备的一个或多个处理器：使用神经网络，基于所述神经网络的一个或多个输入，生成音频信号的至少一个样本
的残差信号，所述残差信号被配置为激励长期预测滤波器和短期预测滤波器中的至少一个；以及使用所述长期预测滤波器和所述短期预测滤波器中的至少一个来确定重构音频信号的至少一个样本，所述重构音频信号的所述至少一个样本是基于使用所述神经网络为所述音频信号的所述至少一个样本生成的所述残差信号来确定的。

技术总结
描述了用于编解码音频信号的技术。例如，使用神经网络，基于神经网络的输入生成音频信号的样本的残差信号。残差信号被配置为激励长期预测滤波器和/或短期预测滤波器。使用长期预测滤波器和/或短期预测滤波器，确定重构音频信号的样本。基于使用神经网络为音频信号的样本生成的残差信号来确定重构音频信号的样本。本。本。

技术研发人员：Z.I.斯科迪利斯 V.拉詹德兰 G.K.索蒂尔 D.J.辛德
受保护的技术使用者：高通股份有限公司
技术研发日：2020.06.29
技术公布日：2022/4/12

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种头戴式智能语音识别装置的制作方法

基于人工智能的音频编解码的制作方法

相关文献

最热文献