一种基于深度学习的音频码流压缩方法和装置与流程

2022-04-27 02:35:18 来源：中国专利 TAG：

技术特征：
1.一种基于深度学习的音频码流压缩方法，其特征在于，包括以下步骤：对利用深度学习算法压缩后的码流进行反向还原，比对所述深度学习算法压缩还原前后码流的还原度；根据所述还原度来对所述深度学习算法压缩还原进行优化迭代，直至优化迭代到所有音频码流经过所述深度学习算法压缩还原后还原度达到预设阈值，并在优化迭代的过程中记录其优化迭代次数；根据所述优化迭代次数判断所述深度学习算法是否需要进行更换，进而利用判断得到的深度学习算法对音频码流进行压缩处理。2.根据权利要求1所述的基于深度学习的音频码流压缩方法，其特征在于，所述利用判断得到的深度学习算法对音频码流进行压缩处理，包括：若判断所述深度学习算法需要进行更换，则利用更换后的算法对音频码流进行压缩处理；若判断所述深度学习算法不需要进行更换，则利用所述深度学习算法对音频码流进行压缩处理。3.根据权利要求1所述的基于深度学习的音频码流压缩方法，其特征在于，利用如下公式对利用深度学习算法压缩后的码流进行反向还原，比对所述深度学习算法压缩还原前后码流的还原度：其中h表示未进行优化迭代前所述深度学习算法压缩还原前后码流的还原度；d
a
表示原始第a个未压缩的二进制形式的音频码流数据；d
a
(i)表示原始第a个未压缩的音频码流数据中第i位的二进制数；p(d
a
)表示利用深度学习算法对原始第a个未压缩的音频码流数据进行压缩后的二进制形式的数据；p-1
[p(d
a
)]表示利用深度学习算法对p(d
a
)进行反向解压缩后的二进制形式的数据；p-1
[p(d
a
)](i)表示利用深度学习算法对p(d
a
)进行反向解压缩后的数据中第i位的二进制数；n表示原始第a个未压缩的音频码流数据中二进制数的位数；m表示原始未压缩的音频码流数据个数；| |表示求取绝对值；若h＝1，表示当前深度学习算法的还原度最高，则不需要对所述深度学习算法进行优化迭代；若h＜1，表示当前深度学习算法的还原度未达到要求，则需要对所述深度学习算法进行优化迭代。4.根据权利要求3所述的基于深度学习的音频码流压缩方法，其特征在于，利用如下公式判断所述深度学习算法是否完成优化迭代：其中g(k 1)表示对所述深度学习算法进行第k 1次优化迭代的控制值；k表示所述深度学习算法当前已经完成优化迭代的次数；δ
k
(h)表示完成第k次优化迭代后所述深度学习算法压缩还原前后码流的还原度；若g(k 1)＝0，表示所述优化迭代并未完成，即所述深度学习算法需要继续控制进行第
k 1次优化迭代；若g(k 1)＝1，表示所述优化迭代已经完成，则所述深度学习算法不需要继续控制进行第k 1次优化迭代。5.根据权利要求4所述的基于深度学习的音频码流压缩方法，其特征在于，利用如下公式根据所述优化迭代次数判断所述深度学习算法是否需要进行更换：其中f表示所述深度学习算法的控制更换值；t表示设定的允许优化迭代的最长时间；t0表示所述深度学习算法进行第一次优化迭代的初始时刻；t0表示所述深度学习算法进行一次优化迭代所需要的时间；∩表示取交集；u表示取并集；表示向下取整；若f＝1，表示当前所述深度学习算法不符合对所述音频码流数据进行压缩以及反向还原的要求则需要进行更换新的算法重新进行上述步骤；若f＝0，表示当前所述深度学习算法符合对所述音频码流数据进行压缩以及反向还原的要求则不需要进行更换新的算法。6.一种基于深度学习的音频码流压缩装置，其特征在于，包括：比对模块，用于对利用深度学习算法压缩后的码流进行反向还原，比对所述深度学习算法压缩还原前后码流的还原度；优化迭代模块，用于根据所述还原度来对所述深度学习算法压缩还原进行优化迭代，直至优化迭代到所有音频码流经过所述深度学习算法压缩还原后还原度达到预设阈值，并在优化迭代的过程中记录其优化迭代次数；压缩模块，用于根据所述优化迭代次数判断所述深度学习算法是否需要进行更换，进而利用判断得到的深度学习算法对音频码流进行压缩处理。7.根据权利要求6所述的基于深度学习的音频码流压缩装置，其特征在于，所述压缩模块还用于：若判断所述深度学习算法需要进行更换，则利用更换后的算法对音频码流进行压缩处理；若判断所述深度学习算法不需要进行更换，则利用所述深度学习算法对音频码流进行压缩处理。8.根据权利要求6所述的基于深度学习的音频码流压缩装置，其特征在于，所述比对模块还用于：利用如下公式对利用深度学习算法压缩后的码流进行反向还原，比对所述深度学习算法压缩还原前后码流的还原度：其中h表示未进行优化迭代前所述深度学习算法压缩还原前后码流的还原度；d
a
表示原始第a个未压缩的二进制形式的音频码流数据；d
a
(i)表示原始第a个未压缩的音频码流数据中第i位的二进制数；p(d
a
)表示利用深度学习算法对原始第a个未压缩的音频码流数据
进行压缩后的二进制形式的数据；p-1
[p(d
a
)]表示利用深度学习算法对p(d
a
)进行反向解压缩后的二进制形式的数据；p-1
[p(d
a
)](i)表示利用深度学习算法对p(d
a
)进行反向解压缩后的数据中第i位的二进制数；n表示原始第a个未压缩的音频码流数据中二进制数的位数；m表示原始未压缩的音频码流数据个数；| |表示求取绝对值；若h＝1，表示当前深度学习算法的还原度最高，则不需要对所述深度学习算法进行优化迭代；若h＜1，表示当前深度学习算法的还原度未达到要求，则需要对所述深度学习算法进行优化迭代。9.根据权利要求8所述的基于深度学习的音频码流压缩装置，其特征在于，所述优化迭代模块还用于：利用如下公式判断所述深度学习算法是否完成优化迭代：其中g(k 1)表示对所述深度学习算法进行第k 1次优化迭代的控制值；k表示所述深度学习算法当前已经完成优化迭代的次数；δ
k
(h)表示完成第k次优化迭代后所述深度学习算法压缩还原前后码流的还原度；若g(k 1)＝0，表示所述优化迭代并未完成，即所述深度学习算法需要继续控制进行第k 1次优化迭代；若g(k 1)＝1，表示所述优化迭代已经完成，则所述深度学习算法不需要继续控制进行第k 1次优化迭代。10.根据权利要求9所述的基于深度学习的音频码流压缩装置，其特征在于，所述压缩模块还用于：利用如下公式根据所述优化迭代次数判断所述深度学习算法是否需要进行更换：其中f表示所述深度学习算法的控制更换值；t表示设定的允许优化迭代的最长时间；t0表示所述深度学习算法进行第一次优化迭代的初始时刻；t0表示所述深度学习算法进行一次优化迭代所需要的时间；∩表示取交集；∪表示取并集；表示向下取整；若f＝1，表示当前所述深度学习算法不符合对所述音频码流数据进行压缩以及反向还原的要求则需要进行更换新的算法重新进行上述步骤；若f＝0，表示当前所述深度学习算法符合对所述音频码流数据进行压缩以及反向还原的要求则不需要进行更换新的算法。

技术总结
本申请提供了一种基于深度学习的音频码流压缩方法和装置，涉及音频数据处理技术领域。该方法对利用深度学习算法压缩后的码流进行反向还原，比对深度学习算法压缩还原前后码流的还原度；根据还原度来对深度学习算法压缩还原进行优化迭代，直至优化迭代到所有音频码流经过深度学习算法压缩还原后还原度达到预设阈值，并在优化迭代的过程中记录其优化迭代次数；根据优化迭代次数判断深度学习算法是否需要进行更换，进而利用判断得到的深度学习算法对音频码流进行压缩处理。可以看到，本申请实施例可以通过训练好的深度学习算法的框架还原出未压缩的码流，这样就省去了当需要完整品质的码流时重新传输的情况，节约了资源。节约了资源。节约了资源。

技术研发人员：兰雨晴黄永琢余丹王丹星唐霆岳
受保护的技术使用者：慧之安信息技术股份有限公司
技术研发日：2021.12.09
技术公布日：2022/4/26

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

一种基于深度学习的音频码流压缩方法和装置与流程

相关文献

最热文献