基于为心理声学音频编解码确定的比特分配对空间分量进行量化的制作方法

2022-02-22 03:24:07 来源：中国专利 TAG：

技术特征：
1.一种被配置为对基于场景的音频数据进行编码的设备，所述设备包括：存储器，其被配置为存储基于场景的音频数据；以及一个或多个处理器，其被配置为:针对所述基于场景的音频数据执行空间音频编码，以获得前景音频信号和对应的空间分量，所述空间分量定义所述前景音频信号的空间特征；针对所述前景音频信号执行心理声学音频编码，以获得经编码的前景音频信号；当针对所述前景音频信号执行心理声学音频编码时，确定所述前景音频信号的第一比特分配；基于所述前景音频信号的所述第一比特分配，确定所述空间分量的第二比特分配；基于所述空间分量的所述第二比特分配，对所述空间分量进行量化，以获得经量化的空间分量；以及在比特流中指定所述经编码的前景音频信号和所述经量化的空间分量。2.根据权利要求1所述的设备，其中，所述一个或多个处理器被配置为：针对所述前景音频信号，根据压缩算法执行所述心理声学音频编码，以获得所述经编码的前景音频信号。3.根据权利要求1所述的设备，其中，所述一个或多个处理器被配置为：针对所述前景音频信号执行形状和增益分析，以获得表示所述前景音频信号的形状和增益；针对所述增益执行量化，以获得粗略量化增益和一个或多个精细量化残差；以及基于分配给所述粗略量化增益和一个或多个精细量化残差中的每一个的比特数，确定所述第二比特分配。4.根据权利要求1所述的设备，其中，所述一个或多个处理器被配置为：确定所述前景音频信号相对于由所述基于场景的音频数据表示的声场的频谱感知重要性；以及基于所述频谱感知重要性，确定所述第一比特分配。5.根据权利要求4所述的设备，其中，所述一个或多个处理器被配置为：基于所述频谱感知重要性和分配给所述粗略量化增益的比特数，确定静态空间比特分布；基于分配给所述一个或多个精细量化残差中的每一个的比特数，确定动态空间比特分布；以及基于所述静态空间比特分布和所述动态空间比特分布，确定所述第二比特分配。6.根据权利要求1所述的设备，其中，所述一个或多个处理器被配置为：针对所述基于场景的音频数据执行线性可逆变换，以获得所述前景音频信号和对应的空间分量。7.根据权利要求1所述的设备，其中，所述基于场景的音频数据包括与大于1的阶相对应的环绕声系数。8.根据权利要求1所述的设备，其中，所述基于场景的音频数据包括与大于零的阶相对应的环绕声系数。9.根据权利要求1所述的设备，其中，所述基于场景的音频数据包括在球谐域中定义的音频数据。10.根据权利要求1所述的设备，
其中，所述前景音频信号包括在球谐域中定义的前景音频信号，并且其中，所述空间分量包括在所述球谐域中定义的空间分量。11.根据权利要求1所述的设备，其中，所述基于场景的音频数据包括混合阶环绕声音频数据。12.根据权利要求1所述的设备，还包括被配置为捕获所述基于场景的音频数据的麦克风。13.一种对基于场景的音频数据进行编码的方法，所述方法包括：针对所述基于场景的音频数据执行空间音频编码，以获得前景音频信号和对应的空间分量，所述空间分量定义所述前景音频信号的空间特征；针对所述前景音频信号执行心理声学音频编码，以获得经编码的前景音频信号；当针对所述前景音频信号执行心理声学音频编码时，确定所述前景音频信号的第一比特分配；基于所述前景音频信号的所述第一比特分配，确定所述空间分量的第二比特分配；基于所述空间分量的所述第二比特分配，对所述空间分量进行量化，以获得经量化的空间分量；以及在比特流中指定所述经编码的前景音频信号和所述经量化的空间分量。14.一种被配置为对表示经编码的基于场景的音频数据的比特流进行解码的设备，所述设备包括：存储器，其被配置为存储所述比特流，所述比特流包括经编码的前景音频信号和对应的经量化的空间分量，所述空间分量定义所述前景音频信号的空间特征；以及一个或多个处理器，其被配置为：针对所述经编码的前景音频信号执行心理声学音频解码，以获得前景音频信号；当针对所述经编码的前景音频信号执行所述心理声学音频解码时，确定所述经编码的前景音频信号的第一比特分配；基于所述经编码的前景音频信号的所述第一比特分配，确定所述经量化的空间分量的第二比特分配；基于所述经量化的空间分量的所述第二比特分配，对所述经量化的空间分量进行反量化，以获得空间分量；以及基于所述前景音频信号和所述空间分量来重构所述基于场景的音频数据。15.根据权利要求14所述的设备，其中，所述一个或多个处理器被配置为：针对所述经编码的前景音频信号，根据解压缩算法执行所述心理声学音频解码，以获得所述前景音频信号。16.根据权利要求14所述的设备，其中，所述一个或多个处理器被配置为：从所述比特流获得分配给粗略量化增益和一个或多个精细量化残差中的每一个的比特数，所述粗略量化增益和所述一个或多个精细量化残差表示所述前景音频信号的增益；以及基于分配给所述粗略量化增益和一个或多个精细量化残差中的每一个的比特数，确定所述第二比特分配。17.根据权利要求14所述的设备，其中，所述一个或多个处理器被配置为：
确定所述经编码的前景音频信号相对于由所述基于场景的音频数据表示的声场的频谱感知重要性；以及基于所述频谱感知重要性，确定所述第一比特分配。18.根据权利要求17所述的设备，其中，所述一个或多个处理器被配置为：基于所述频谱感知重要性和分配给所述粗略量化增益的比特数，确定静态空间比特分布；基于分配给所述一个或多个精细量化残差中的每一个的比特数，确定动态空间比特分布；以及基于所述静态空间比特分布和所述动态空间比特分布，确定所述第二比特分配。19.根据权利要求14所述的设备，其中，所述基于场景的音频数据包括与大于1的阶相对应的环绕声系数。20.根据权利要求14所述的设备，其中，所述基于场景的音频数据包括在球谐域中定义的音频数据。21.根据权利要求14所述的设备，其中，所述前景音频信号包括在球谐域中定义的前景音频信号，并且其中，所述空间分量包括在所述球谐域中定义的空间分量。22.根据权利要求14所述的设备，其中，所述一个或多个处理器还被配置为：将所述基于场景的音频数据渲染到一个或多个扬声器馈送；以及基于所述扬声器馈送，再现由所述基于场景的音频数据表示的声场。23.根据权利要求14所述的设备，其中，所述一个或多个处理器还被配置为将所述基于场景的音频数据渲染到一个或多个扬声器馈送，并且其中，所述设备包括一个或多个扬声器，所述一个或多个扬声器被配置为：基于所述扬声器馈送，再现由所述基于场景的音频数据表示的声场。24.根据权利要求14所述的设备，其中，所述基于场景的音频数据包括混合阶环绕声音频数据。25.根据权利要求14所述的设备，其中，所述一个或多个处理器还被配置为：将所述基于场景的音频数据渲染到一个或多个扬声器馈送；以及将所述扬声器馈送输出到一个或多个扬声器，以基于所述扬声器馈送，再现由所述基于场景的音频数据表示的声场。26.根据权利要求14所述的设备，其中，所述一个或多个处理器还被配置为将所述基于场景的音频数据渲染到一个或多个扬声器馈送，并且其中，所述设备包括一个或多个扬声器，所述一个或多个扬声器被配置为基于所述扬声器馈送，再现由所述基于场景的音频数据表示的声场。27.一种对表示基于场景的音频数据的比特流进行解码的方法，所述方法包括：从所述比特流获得经编码的前景音频信号和对应的经量化的空间分量，所述经量化的空间分量定义所述经编码的前景音频信号的空间特征；针对所述经编码的前景音频信号执行心理声学音频解码，以获得前景音频信号；
当针对所述经编码的前景音频信号执行心理声学音频解码时，确定所述经编码的前景音频信号的第一比特分配；基于所述经编码的前景音频信号的所述第一比特分配，确定所述经量化的空间分量的第二比特分配；基于所述经量化的空间分量的所述第二比特分配，对所述经量化的空间分量进行反量化，以获得空间分量；以及基于所述前景音频信号和所述空间分量来重构所述基于场景的音频数据。

技术总结
一般而言，描述了用于基于为心理声学音频编解码确定的比特分配来量化空间分量的技术。包括存储器和一个或多个处理器的设备可以执行这些技术。存储器可以存储包括经编码的前景音频信号和对应的经量化的空间分量的比特流。一个或多个处理器可以针对经编码的前景音频信号执行心理声学音频解码，以获得前景音频信号，并且当执行心理声学音频解码时，确定经编码的前景音频信号的第一比特分配。一个或多个处理器还可以基于第一比特分配，确定第二比特分配，并且基于第二比特分配，对经量化的空间分量进行反量化，以获得空间分量。一个或多个处理器可以基于前景音频信号和空间分量来重构基于场景的音频数据。构基于场景的音频数据。构基于场景的音频数据。

技术研发人员：F.奥利维耶里 T.沙巴齐米尔扎哈桑洛 N.G.彼得斯
受保护的技术使用者：高通股份有限公司
技术研发日：2020.06.23
技术公布日：2022/1/28

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

基于为心理声学音频编解码确定的比特分配对空间分量进行量化的制作方法

相关文献

最热文献