一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

音频压缩方法、音频解压缩方法及装置与流程

2021-06-25 15:18:00 来源:中国专利 TAG:音频 方法 解压缩 音频处理 装置

技术特征:
1.一种音频压缩方法,其特征在于,包括:将预设编码格式的音频数据进行分片,得到n个音频片段,n为大于1的整数;分别将每个所述音频片段输入预先训练的音频压缩网络,得到每个所述音频片段对应的音频压缩特征矩阵和音频时序特征向量,其中,所述音频压缩网络包括带残差的卷积神经网络和深层循环神经网络,所述带残差的卷积神经网络对输入的所述音频片段压缩处理后输出所述音频压缩特征矩阵,所述深层循环神经网络对输入的所述音频片段处理后得到所述音频时序特征向量;按序将每个所述音频片段对应的所述音频压缩特征矩阵和所述音频时序特征向量拼接,得到音频压缩数据。2.根据权利要求1所述的方法,其特征在于,所述带残差的卷积神经网络包括依次连接的嵌入网络层、m个压缩残差网络层和k个卷积网络层,其中,所述嵌入网络层用于对输入的音频片段进行嵌入处理并输出第一特征矩阵,所述m个压缩残差网络层用于对所述第一特征矩阵进行卷积压缩并输出第二特征矩阵,所述k个卷积网络层用于对所述第二特征矩阵进行卷积压缩并输出所述音频压缩特征矩阵,m和k均为正整数。3.根据权利要求2所述的方法,其特征在于,在m为1的情况下,所述压缩残差网络层包括子卷积网络、降采样网络层和求和归一化层,所述子卷积网络的输入为所述第一特征矩阵,所述降采样网络层的输入为所述第一特征矩阵,所述子卷积网络的输出和所述降采样网络层的输出均输入至所述求和归一化层;在m大于1的情况下,所述m个压缩残差网络层之间串联,每个所述压缩残差网络层均包括子卷积网络、降采样网络层和求和归一化层,每个所述降采样网络层的输入均为所述第一特征矩阵,每个所述子卷积网络的输出和每个所述降采样网络层的输出均输入至对应的所述求和归一化层,第一压缩残差网络层的子卷积网络的输入为所述第一特征矩阵,第二压缩残差网络层的子卷积网络的输入为其前一个压缩残差网络层的求和归一化层的输出,所述第一压缩残差网络层为所述m个压缩残差网络层中的第一个压缩残差网络,所述第二压缩残差网络层为所述m个压缩残差网络层中除所述第一压缩残差网络层之外的压缩残差网络层。4.根据权利要求2所述的方法,其特征在于,所述深层循环神经网络包括第一求均值层、目标lstm层和串联的l个lstm层,所述第一求均值层的输入为所述音频压缩特征矩阵,所述第一求均值层的输出为第一特征向量,所述第一特征向量为所述音频压缩特征矩阵的各个通道向量的平均值组成的特征向量,所述目标lstm层的输入为所述第一特征向量,所述目标lstm层的输出为第一隐态向量,所述l个lstm层的输入为音频片段,所述l个lstm层的输出为第二隐态向量,其中,所述第一隐态向量和第二隐态向量之和为所述音频时序特征向量,l为m和k之和。5.根据权利要求2所述的方法,其特征在于,所述深层循环神经网络包括与所述m个压缩残差网络层对应的m个子循环神经网络和与所述k个卷积网络层对应的k个子循环网络;其中,所述m个子循环神经网络的输入为音频片段和所述m个压缩残差网络层输出的特征矩阵,所述k个子循环网络的输入为所述m个子循环神经网络输出的隐态向量和所述k个卷积网络层输出的特征矩阵,所述k个子循环网络的输出为所述音频时序特征向量。6.根据权利要求5所述的方法,其特征在于,在m为1的情况下,所述m个子循环神经网络
中的子循环神经网络的输入为音频片段和对应的压缩残差网络层输出的特征矩阵;在m为大于1的整数的情况下,所述m个子循环神经网络之间串联,所述m个子循环神经网络中的第一个子循环神经网络的输入为音频片段和对应的压缩残差网络层输出的特征矩阵,所述m个子循环神经网络中的除第一个子循环神经网络之外的子循环神经网络的输入为其前一个子循环神经网络输出的特征矩阵和对应的压缩残差网络层输出的特征矩阵;在k为1的情况下,所述k个子循环神经网络中的子循环神经网络的输入为所述m个子循环神经网络中的最后一个子循环神经网络输出的隐态向量和对应的卷积网络层输出的特征矩阵;在k为大于1的整数的情况下,所述k个子循环神经网络之间串联,所述k个子循环神经网络中的第一个子循环神经网络的输入为所述m个子循环神经网络中的最后一个子循环神经网络输出的隐态向量和对应的卷积网络层输出的特征矩阵,所述k个子循环神经网络中除第一个子循环神经网络之外的子循环神经网络的输入为其前一个子循环神经网络输出的隐态向量和对应的卷积网络层输出的特征矩阵。7.根据权利要求5所述的方法,其特征在于,所述m个子循环神经网络和所述k个子循环神经网络中的每个子循环神经网络均包括求均值层、两个lstm层和求和归一化层,所述求均值层用于求输入所述求均值层的特征矩阵的各个通道向量的平均值并输出第二特征向量,所述求和归一化层用于对所述两个lstm层输出的隐态向量进行求和以及归一化处理并输出隐态向量;其中,所述m个子循环神经网络中的第一个子循环神经网络的两个lstm层中的一个lstm层用于提取所述第二特征向量的时序特征并输出隐态向量,另一个lstm层用于提取音频片段的时序特征并输出隐态向量;目标子循环神经网络的两个lstm层中的一个lstm层用于提取所述第二特征向量的时序特征并输出隐态向量,另一个lstm层用于提取所述第二子循环神经网络的前一个子循环神经网络输出的隐态向量的时序特征并输出隐态向量,所述目标子循环神经网络为所述m个子循环神经网络和所述k个子循环神经网络中除所述第一个子循环神经网络之外的子循环神经网络。8.一种音频解压缩方法,其特征在于,包括:获取目标音频压缩数据,其中,所述音频压缩数据为根据权利要求1至7中任一项所述的音频压缩方法压缩得到的音频压缩数据;按照第一预设长度将所述目标音频压缩数据进行分片,得到s个音频压缩片段,其中,s为大于1的整数;分别获取所述s个音频压缩片段中每个音频压缩片段的音频压缩特征矩阵和音频时序特征向量;分别将所述s个音频压缩片段中每个音频压缩片段的音频压缩特征矩阵和音频时序特征向量输入预先训练的音频解压缩网络,得到预测的s个音频片段,其中,所述音频解压缩网络包括带残差的膨胀卷积网络、转置层、concat网络层和全连接网络层,所述带残差的膨胀卷积网络用于对输入的音频压缩特征矩阵进行膨胀卷积,所述转置层用于对所述带残差的膨胀卷积网络输出的特征矩阵进行转置并输出转置矩阵,所述concat网络层用于将输入的音频时序特征向量和所述转置层输出的转置矩阵进行拼接,所述全连接网络层用于基于所述concat网络层输出的特征矩阵输出预测的音频片段;
将所述s个音频片段按序拼接,得到解压后的音频数据。9.根据权利要求8所述的方法,其特征在于,所述带残差的膨胀卷积网络包括串联的q个带反卷积残差的膨胀卷积网络层,每个所述带反卷积残差的膨胀卷积网络层均包括膨胀卷积网络层、反卷积网络层和求和归一化层,其中,所述膨胀卷积网络层的输入和所述反卷积网络层的输入相同,所述膨胀卷积网络层的输出和所述反卷积网络层的输出均输入至所述求和归一化层,q为正整数。10.一种模型训练方法,其特征在于,包括:获取p个音频样本,其中,p为大于1的整数,所述p个音频样本中的每个音频样本均为预设编码格式的音频数据;基于所述p个音频样本对音频压缩网络和音频解压缩网络进行迭代训练,直至所述音频压缩网络输入的音频样本和所述音频解压缩网络输出的预测音频之间的均方差损失最小化;其中,所述音频压缩网络包括带残差的卷积神经网络和深层循环神经网络,所述带残差的卷积神经网络用于对输入的音频样本进行压缩并输出音频压缩特征矩阵,所述深层循环神经网络用于提取输入的音频样本的音频时序特征向量;所述音频解压缩网络包括带残差的膨胀卷积网络、转置层、concat网络层和全连接网络层,所述带残差的膨胀卷积网络用于对所述带残差的卷积神经网络输出的音频压缩特征矩阵进行膨胀卷积,所述转置层用于对所述带残差的膨胀卷积网络输出的特征矩阵进行转置并输出转置矩阵,所述concat网络层用于将所述深层循环神经网络输出的音频时序特征向量和所述转置层输出的转置矩阵进行拼接,所述全连接网络层用于基于所述concat网络层输出的特征矩阵输出预测音频。11.一种音频压缩装置,其特征在于,包括:第一分片模块,用于将预设编码格式的音频数据进行分片,得到n个音频片段,n为大于1的整数;第一输入模块,用于分别将每个所述音频片段输入预先训练的音频压缩网络,得到每个所述音频片段对应的音频压缩特征矩阵和音频时序特征向量,其中,所述音频压缩网络包括带残差的卷积神经网络和深层循环神经网络,所述带残差的卷积神经网络对输入的所述音频片段压缩处理后输出所述音频压缩特征矩阵,所述深层循环神经网络对输入的所述音频片段处理后得到所述音频时序特征向量;第一拼接模块,用于按序将每个所述音频片段对应的所述音频压缩特征矩阵和所述音频时序特征向量拼接,得到音频压缩数据。12.一种电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的音频压缩方法的步骤,或者实现如权利要求8至9中任一项所述的音频解压缩方法的步骤,或者实现如权利要求10所述的模型训练方法的步骤。13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的音频压缩方法的步骤,或者实现如权利要求8至9中任一项所述的音频解压缩方法的步骤,或者实现如权利要求10所述的模型训练方法的步骤。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜