音频处理方法及装置与流程

2021-07-09 11:55:00 来源：中国专利 TAG：说明书音频处理计算机装置可读

技术特征：
1.一种音频处理方法，其特征在于，包括：获取包含丢失音频片段的待处理音频；在所述待处理音频中确定与所述丢失音频片段相邻的前音频片段和后音频片段，并构建所述前音频片段的前音频频域特征集合和所述后音频片段的后音频频域特征集合；将所述前音频频域特征集合和所述后音频频域特征集合进行拼接，并将拼接后的音频频域特征集合输入至音频处理模型进行处理获得局部频域帧序列；基于所述前音频片段对应的前频域帧序列、所述局部频域帧序列以及所述后音频片段对应的后频域帧序列生成用于替换所述待处理音频的目标音频。2.根据权利要求1所述的音频处理方法，其特征在于，所述在所述待处理音频中确定与所述丢失音频片段相邻的前音频片段和后音频片段，包括：在所述待处理音频定位所述丢失音频片段；选择所述丢失音频片段之前设定时长的音频片段确定为所述前音频片段，以及所述丢失音频片段之后设定时长的音频片段确定为所述后音频片段。3.根据权利要求1所述的音频处理方法，其特征在于，所述构建所述前音频片段的前音频频域特征集合和所述后音频片段的后音频频域特征集合，包括：对所述前音频片段和所述后音频片段进行预处理，获得所述前音频片段对应的所述前频域帧序列以及所述后音频片段对应的所述后频域帧序列；基于所述前频域帧序列构建所述前音频频域特征集合，以及基于所述后频域帧序列构建所述后音频频域特征集合。4.根据权利要求3所述的音频处理方法，其特征在于，所述对所述前音频片段和所述后音频片段进行预处理，获得所述前音频片段对应的所述前频域帧序列以及所述后音频片段对应的所述后频域帧序列，包括：对所述前音频片段和所述后音频片段进行分帧处理，获得所述前音频片段对应的前音频时域帧序列以及所述后音频片段对应的后音频时域帧序列；基于预设的补充信息和变换参数对所述前音频时域帧序列和所述后音频时域帧序列进行变换处理，获得所述前音频片段对应的所述前频域帧序列以及所述后音频片段对应的所述后频域帧序列。5.根据权利要求3所述的音频处理方法，其特征在于，所述基于所述前频域帧序列构建所述前音频频域特征集合，以及基于所述后频域帧序列构建所述后音频频域特征集合，包括：确定所述前频域帧序列对应的前频域信息，以及所述后频域帧序列对应的后频域信息；基于所述前频域信息确定所述前频域帧序列的前频域帧、前分量和前复数，以及所述后频域信息确定所述后频域帧序列的后频域帧、后分量和后复数；基于所述前频域帧、所述前分量和所述前复数构建所述前音频频域特征集合，以及所述后频域帧、所述后分量和所述后复数构建所述后音频频域特征集合。6.根据权利要求1所述的音频处理方法，其特征在于，所述将拼接后的音频频域特征集合输入至音频处理模型进行处理获得局部频域帧序列，包括：将拼接后的音频频域特征集合输入至所述音频处理模型，通过所述音频处理模型中的
编码模块进行编码处理，获得编码特征集合；通过所述音频处理模型中的解码模块对所述编码特征集合进行处理，获得解码特征集合；基于所述解码特征集合生成目标音频频域特征集合；通过所述音频处理模块中的输出模块对所述目标音频频域特征集合进行处理，获得所述音频处理模型输出的所述局部频域帧序列。7.根据权利要求6所述的音频处理方法，其特征在于，所述基于所述解码特征集合生成目标音频频域特征集合，包括：通过所述音频处理模型中的卷积模块对所述解码特征集合进行处理，获得初始音频频域特征集合；通过所述音频处理模型中的掩码模块对所述初始音频频域特征集合进行处理，获得中间音频频域特征集合；基于所述音频处理模型中的参考幅值对所述中间音频频域特征集合进行调整，获得所述目标音频频域特征集合。8.根据权利要求7所述的音频处理方法，其特征在于，所述参考幅值通过如下方式确定：确定所述丢失音频片段对应的丢失音频频域信息，并基于所述丢失频域信息在所述音频频域特征集合中确定第一频域帧和第二频域帧；选择所述第一频域帧对应的幅值确定为第一幅值，以及所述第二频域帧对应的幅值确定为第二幅值；根据线性插值算法计算第三幅值，并基于所述第一幅值、所述第二幅值和所述第三幅值创建所述参考幅值。9.根据权利要求4所述的音频处理方法，其特征在于，所述基于所述前音频片段对应的前频域帧序列、所述局部频域帧序列以及所述后音频片段对应的后频域帧序列生成用于替换所述待处理音频的目标音频，包括：基于所述前频域帧序列、所述局部频域帧序列和所述后频域帧生成目标全局频域帧序列；对所述目标全局频域帧序列进行逆处理获得目标全局时域帧序列，并基于所述目标全局时域帧序列生成用于替换所述待处理音频的所述目标音频。10.根据权利要求9所述的音频处理方法，其特征在于，所述基于所述前频域帧序列、所述局部频域帧序列和所述后频域帧生成目标全局频域帧序列，包括：基于所述补充信息在所述前频域帧序列中确定目标前频域帧序列，以及在所述后频域帧序列中确定目标后频域帧序列；将所述目标前频域帧序列、所述局部频域帧序列和所述目标后频域帧序列进行拼接，获得所述目标全局频域帧序列。11.根据权利要求1所述的音频处理方法，其特征在于，所述音频处理模型通过如下方式训练：获取样本音频以及所述样本音频对应的样本局部频域帧序列；基于所述样本音频构建样本音频特征集合，并基于所述样本音频特征集合和所述样本
局部频域帧序列对初始音频处理模型进行训练，直至所述初始音频处理模型满足训练停止条件，根据训练结果获得所述音频处理模型。12.根据权利要求11所述的音频处理方法，其特征在于，所述训练停止条件由所述初始音频处理模型的损失值确定；相应的，所述损失值由幅值损失和相位损失确定，用于确定训练过程中的初始音频处理模型的预测精准度。13.一种音频处理装置，其特征在于，包括：获取模块，被配置为获取包含丢失音频片段的待处理音频；构建模块，被配置为在所述待处理音频中确定与所述丢失音频片段相邻的前音频片段和后音频片段，并构建所述前音频片段的前音频频域特征集合和所述后音频片段的后音频频域特征集合；处理模块，被配置为将所述前音频频域特征集合和所述后音频频域特征集合进行拼接，并将拼接后的音频频域特征集合输入至音频处理模型进行处理获得局部频域帧序列；生成模块，被配置为基于所述前音频片段对应的前频域帧序列、所述局部频域帧序列以及所述后音频片段对应的后频域帧序列生成用于替换所述待处理音频的目标音频。14.一种计算设备，其特征在于，包括：存储器和处理器；所述存储器用于存储计算机可执行指令，所述处理器用于执行所述计算机可执行指令，以实现权利要求1至12任意一项所述方法的步骤。15.一种计算机可读存储介质，其特征在于，其存储有计算机指令，该指令被处理器执行时实现权利要求1至12任意一项所述方法的步骤。

再多了解一些

2/3 首页上一页 1 2 3 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

音频处理方法及装置与流程

相关文章

最热文献