一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于编码空间音频表示的装置和方法以及用于使用传输元数据来解码经编码的音频信号的装置和方法,以及相关的计算机程序与流程

2021-10-09 06:58:00 来源:中国专利 TAG:方向性 声道 传输 信令 编码

技术特征:
1.一种用于对表示音频场景的空间音频表示进行编码以获得经编码的音频信号的装置,所述装置包括:传输表示发生器(600),用于根据所述空间音频表示来生成传输表示,并且用于生成与所述传输表示的生成有关或指示所述传输表示的一个或多个方向属性的传输元数据;以及输出接口(640),用于生成所述经编码的音频信号,所述经编码的音频信号包括与所述传输表示有关的信息以及与所述传输元数据有关的信息。2.根据权利要求1所述的装置,还包括:参数处理器(620),用于根据所述空间音频表示来导出空间参数,其中所述输出接口(640)被配置用于生成所述经编码的音频信号,使得所述经编码的音频信号附加地包括与所述空间参数有关的信息。3.根据权利要求1或2所述的装置,其中所述空间音频表示是包括多个系数信号的一阶ambisonics或更高阶ambisonics表示,或者是包括多个音频声道的多声道表示,其中所述传输表示发生器(600)被配置为从所述一阶ambisonics或更高阶ambisonics表示中选择一个或多个系数信号,或者组合来自所述一阶ambisonics或更高阶ambisonics表示的系数,或者其中所述传输表示发生器(600)被配置为从所述多声道表示中选择一个或多个音频声道,或者组合来自所述多声道表示的两个或更多个音频声道,并且其中所述传输表示发生器(600)被配置为生成如下内容作为所述传输元数据:指示选择了哪个或哪些特定的一个或多个系数信号或音频声道的信息,或者指示如何组合了两个或更多个系数信号或音频声道或者组合了所述一阶ambisonics或更高阶ambisonics系数信号或音频声道中的哪些的信息。4.根据权利要求1、2或3所述的装置,其中所述传输表示发生器(600)被配置为确定大部分声能是否位于水平平面中,或者其中响应于所述确定或响应于音频编码器设置,仅选择全向系数信号、x系数信号和y系数信号作为所述传输表示,并且其中所述传输表示发生器(600)被配置为确定所述传输元数据以使得所述传输元数据包括与对系数信号的选择有关的信息。5.根据权利要求1、2或3所述的装置,其中所述传输表示发生器(600)被配置为确定大部分声能是否位于x

z平面中,或者其中响应于所述确定或响应于音频编码器设置,仅选择全向系数信号、x系数信号和z系数信号作为所述传输表示,并且其中所述传输表示发生器(600)被配置为确定所述传输元数据以使得所述传输元数据包括与对系数信号的选择有关的信息。6.根据权利要求1、2或3所述的装置,其中所述传输表示发生器(600)被配置为确定大部分声能是否位于y

z平面中,或者其中响应于所述确定或响应于音频编码器设置,仅选择全向系数信号、y系数信号和z系数信号作为所述传输表示,并且其中所述传输表示发生器(600)被配置为确定所述传输元数据以使得所述传输元数据包括与对系数信号的选择有关的信息。
7.根据权利要求1、2或3所述的装置,其中所述传输表示发生器(600)被配置为确定主要声能是否源自特定扇区或半球,例如左半球或右半球或前半球或后半球,或者其中所述传输表示发生器(600)被配置为根据主要声能所源自的所述特定扇区或半球或响应于音频编码器设置来生成第一传输信号,以及根据不同的扇区或半球来生成第二传输信号,所述不同的扇区或半球是例如相对于参考位置以及相对于所述特定扇区或半球具有相反方向的扇区或半球,以及其中所述传输表示发生器(600)被配置为确定所述传输元数据以使得所述传输元数据包括识别所述特定扇区或半球的信息,或者识别所述不同的扇区或半球的信息。8.根据前述权利要求中的一项所述的装置,其中所述传输表示发生器(600)被配置为组合所述空间音频表示的系数信号,使得作为第一传输信号的第一所得信号对应于指向特定扇区或半球的方向性麦克风信号,并且作为第二传输信号的第二所得信号对应于指向不同扇区或半球的方向性麦克风信号。9.根据前述权利要求中的一项所述的装置,还包括:用户接口(650),用于接收用户输入,其中所述传输表示发生器(600)被配置为基于在所述用户接口(650)处接收到的用户输入来生成所述传输表示,以及其中所述传输表示发生器(600)被配置为生成所述传输元数据以使得所述传输元数据具有与所述用户输入有关的信息。10.根据前述权利要求中的一项所述的装置,其中所述传输表示发生器(600)被配置为以时变或频率相关的方式来生成所述传输表示和所述传输元数据,以使得第一帧的传输表示和传输元数据与第二帧的传输表示和传输元数据不同,或者使得第一频带的传输表示和传输元数据与不同的第二频带的传输表示和传输元数据不同。11.根据前述权利要求中的一项所述的装置,其中所述传输表示发生器(600)被配置为通过所述空间音频表示的两个或更多个系数信号的加权组合(602)来生成一个或两个传输信号,以及其中所述传输表示发生器(600)被配置为计算所述传输元数据以使得所述传输元数据包括与在所述加权组合中使用的权重有关的信息、或与作为所生成的方向性麦克风信号的查看方向的方位角和/或仰角有关的信息、或与指示方向性麦克风信号的方向特性的形状参数有关的信息。12.根据前述权利要求中的一项所述的装置,其中所述传输表示发生器(600)被配置为生成定量传输元数据,以量化(605a)所述定量传输元数据以获得经量化的传输元数据,并对所述经量化的传输元数据进行熵编码(605b),并且其中所述输出接口(640)被配置为将经编码的传输元数据包括到所述经编码的音频信号中。13.根据权利要求1至11中的一项所述的装置,其中所述传输表示发生器(600)被配置为将所述传输元数据转换为表索引或预设参数,以及
其中所述输出接口(640)被配置为将所述表索引或预设参数包括在所述经编码的音频信号中。14.根据前述权利要求中的一项所述的装置,其中所述空间音频表示包括至少两个音频信号和空间参数,其中所述参数处理器(620)被配置为通过从所述空间音频表示中提取所述空间参数来从所述空间音频表示中导出所述空间参数,其中所述输出接口(640)被配置为将与所述空间参数有关的信息包括在所述经编码的音频信号中,或将与从所述空间参数中导出的经处理的空间参数有关的信息包括在所述经编码的音频信号中,或者其中所述传输表示发生器(600)被配置为:选择所述至少两个音频信号的子集作为所述传输表示并且生成所述传输元数据以使得所述传输元数据指示对所述子集的选择,或者组合所述至少两个音频信号或所述至少两个音频信号的子集并且计算所述传输元数据以使得所述传输元数据包括与为计算所述空间音频表示的所述传输表示而执行的音频信号的组合有关的信息。15.根据前述权利要求中的一项所述的装置,其中所述空间音频表示包括由麦克风阵列获取的一组至少两个麦克风信号,其中所述传输表示发生器(600)被配置为选择与特定位置或与所述麦克风阵列的特定麦克风相关联的一个或多个特定麦克风信号,并且其中所述传输元数据包括与如下内容有关的信息:所述特定位置或所述特定麦克风,或与选择的麦克风信号相关联的位置之间的麦克风距离;或者包括与如下内容有关的信息:与选择的麦克风信号相关联的麦克风的麦克风朝向,或与选择的麦克风相关联的麦克风信号的麦克风方向模式。16.根据权利要求15所述的装置,其中所述传输表示发生器(600)被配置为:根据由用户接口接收的用户输入来选择所述空间音频表示的一个或多个信号(650),对所述空间音频表示执行(606)关于哪个位置具有哪种声能的分析,并且根据分析结果来选择(602)所述空间音频表示的一个或多个信号,或者执行声源定位并且根据所述声源定位的结果来选择(602)所述空间音频表示的一个或多个信号。17.根据权利要求1至15中的一项所述的装置,其中所述传输表示发生器(600)被配置为选择空间音频表示的所有信号,并且其中所述传输表示发生器(600)被配置为生成所述传输元数据以使得所述传输元数据识别从中导出所述空间音频表示的麦克风阵列。18.根据前述权利要求中的一项所述的装置,其中所述传输表示发生器(600)被配置为使用空间滤波或波束成形来组合(602)包括在所述空间音频表示中的音频信号,并且其中所述传输表示发生器(600)被配置为将与所述传输表示的查看方向有关的信息或将与在计算所述传输表示时使用的波束成形权重有关的信息包括在所述传输元数据中。19.根据前述权利要求中的一项所述的装置,
其中所述空间音频表示是对与参考位置相关的声场的描述,以及其中参数处理器(620)被配置为从所述空间音频表示中导出空间参数,其中所述空间参数定义与声音在所述参考位置的到达方向有关的时变参数或频率相关参数,或与所述声场在所述参考位置的扩散度有关的时变参数或频率相关参数,或者其中所述传输表示发生器(600)包括下混器(601),所述下混器用于生成下混表示作为所述传输表示,所述下混表示具有少于所述空间音频表示中包括的第一数量的独立信号的第二数量的独立信号,其中所述下混器(601)被配置为选择所述空间音频表示中包括的独立信号的子集,或者组合所述空间音频表示中包括的独立信号以便将第一数量的信号减少为第二数量的信号。20.根据前述权利要求中的一项所述的装置,其中参数处理器(620)包括空间音频分析器(621),所述空间音频分析器用于通过执行音频信号分析来从所述空间音频表示中导出所述空间参数,以及其中所述传输表示发生器(600)被配置为基于所述空间音频分析器(621)的结果来生成所述传输表示,或者其中所述传输表示包括核心编码器(603),所述核心编码器用于对所述传输表示的传输信号的一个或多个音频信号进行核心编码,或者其中所述参数处理器(620)被配置为对所述空间参数进行量化和熵编码(622),以及其中所述输出接口(640)被配置为将经核心编码的传输表示(611)作为与所述传输表示有关的信息包括在所述经编码的音频信号中,或者将经熵编码的空间参数(612)作为与空间参数有关的信息包括在所述经编码的音频信号中。21.一种用于对经编码的音频信号进行解码的装置,包括:输入接口(700),用于接收经编码的音频信号,所述经编码的音频信号包括与传输表示有关的信息和与传输元数据有关的信息;以及空间音频合成器(750),用于使用所述与传输表示有关的信息和所述与传输元数据有关的信息来合成空间音频表示。22.根据权利要求21所述的装置,其中所述输入接口(700)被配置为接收附加地包括与空间参数有关的信息的经编码的音频信号,以及其中所述空间音频合成器(750)被配置用于附加地使用所述与空间参数有关的信息来合成所述空间音频表示。23.根据权利要求21或22所述的装置,其中所述空间音频合成器(750)包括:核心解码器(751),用于对表示所述与传输表示有关的信息的两个或更多个经编码的传输信号进行核心解码,以获得两个或更多个经解码的传输信号,或者其中所述空间音频合成器(750)被配置为计算所述空间音频表示的一阶ambisonics或更高阶ambisonics表示(754)或多声道信号(755)或对象表示(756)或双耳表示,或者其中所述空间音频合成器(750)包括元数据解码器(752),所述元数据解码器用于对所述与传输元数据有关的信息进行解码以导出经解码的传输元数据(720),或用于对所述与空间参数有关的信息(722)进行解码以获得经解码的空间参数。24.根据权利要求21、22或23所述的装置,其中所述空间音频表示包括多个分量信号,
其中所述空间音频合成器(750)被配置为使用所述与传输表示(711)有关的信息和所述与传输元数据(710)有关的信息来针对所述空间音频表示的分量信号确定(760)参考信号,以及使用所述参考信号和所述与空间参数有关的信息来计算(770)所述空间音频表示的分量信号,或使用所述参考信号来计算(770)所述空间音频表示的分量信号。25.根据权利要求22至24中的一项所述的装置,其中所述空间参数包括时变或频率相关的到达方向或扩散度参数中的至少一个,其中所述空间音频合成器(750)被配置为使用所述空间参数来执行方向性音频编码(dirac)合成,以生成所述空间音频表示的多个不同分量,其中所述空间音频表示的第一分量是使用至少两个传输信号中的一个或所述至少两个传输信号的第一组合来确定的,其中所述空间音频表示的第二分量是使用所述至少两个传输信号中的另一个或所述至少两个传输信号的第二组合来确定的,其中所述空间音频合成器(750)被配置为根据所述传输元数据来执行(760)对所述至少两个传输信号中的一个或不同的一个的确定,或执行(760)对所述第一组合或不同的所述第二组合的确定。26.根据权利要求21至25中的一项所述的装置,其中所述传输元数据将第一传输信号指示为涉及与所述空间音频表示的参考位置相关的第一扇区或半球,并且将第二传输信号指示为涉及与所述空间音频表示的所述参考位置相关的不同的第二扇区或半球,其中所述空间音频合成器(750)被配置为使用所述第一传输信号而不使用所述第二传输信号来生成(915)所述空间音频表示的与所述第一扇区或半球相关联的分量信号,或者其中所述空间音频合成器(750)被配置为使用所述第二传输信号而不使用所述第一传输信号来生成(915)所述空间音频表示的与所述第二扇区或半球相关联的另一分量信号,或者其中所述空间音频合成器(750)被配置为使用所述第一传输信号和所述第二传输信号的第一组合来生成(915)与所述第一扇区或半球相关联的分量信号,或者使用所述第一传输信号和所述第二传输信号的第二组合来生成(915)与不同的第二扇区或半球相关联的分量信号,其中所述第一组合受所述第一传输信号的影响比所述第二组合更强,或者其中所述第二组合受所述第二传输信号的影响比第一组合更强。27.根据权利要求21至26中的一项所述的装置,其中所述传输元数据包括与如下内容有关的信息:与所述传输表示的传输信号相关联的方向特性,其中所述空间音频合成器(750)被配置为使用一阶ambisonics或更高阶ambisonics信号、扬声器位置和所述传输元数据来计算(911)虚拟麦克风信号,或者其中所述空间音频合成器(750)被配置为使用所述传输元数据来确定(911)所述传输信号的方向特性,并且与所述传输信号的所确定的方向特性一致地确定所述传输信号中的一阶ambisonics或更高阶ambisonics分量(754),或者根据回退过程确定(911)与所述传输信号的所述方向特性无关的一阶ambisonics或更高阶ambisonics分量(754)。
28.根据权利要求21至27中的一项所述的装置,其中所述传输元数据包括与如下内容有关的信息:与第一传输信号相关联的第一查看方向,以及与第二传输信号相关联的第二查看方向,其中所述空间音频合成器(750)被配置为基于所述传输元数据和与所述空间音频表示的分量信号相关联的扬声器的位置来选择(771)用于计算所述空间音频表示的所述分量信号的参考信号。29.根据权利要求28所述的装置,其中所述第一查看方向指示左半球或前半球,其中所述第二查看方向指示右半球或后半球,其中,对于左半球中的扬声器的分量信号的计算,使用所述第一传输信号而不是所述第二传输信号(771),或者其中对于右半球中的扬声器信号的计算,使用所述第二传输信号而不是所述第一传输信号(771),或者其中对于前半球中的扬声器的计算,使用所述第一传输信号而不是所述第二传输信号(771),或者其中对于后半球中的扬声器的计算,使用所述第二传输信号而不是所述第一传输信号(771),或者其中对于中心区域中的扬声器的计算,使用左传输信号和所述第二传输信号的组合(771),或者其中对于与前半球和后半球之间的区域中的扬声器相关联的扬声器信号的计算,使用所述第一传输信号和所述第二传输信号的组合(771)。30.根据权利要求21至29中的一项所述的装置,其中所述与传输元数据有关的信息指示左传输信号的左方向作为第一查看方向,并且指示第二传输信号的右查看方向作为第二查看方向,其中所述空间音频合成器(750)被配置为通过将所述第一传输信号和所述第二传输信号相加(920)来计算第一ambisonics分量,或者通过将所述第一传输信号和所述第二传输信号相减(921)来计算第二ambisonics分量,或者其中使用所述第一传输信号和所述第二传输信号的和来计算(922)另一ambisonics分量。31.根据权利要求21至27中的一项所述的装置,其中所述传输元数据针对第一传输信号指示前查看方向并且针对第二传输信号指示后查看方向,其中所述空间音频合成器(750)被配置为通过执行对所述第一传输信号与所述第二传输信号之间的差值(921)的计算来计算x方向的一阶ambisonics分量,并且使用所述第一传输信号和所述第二传输信号的相加(920)来计算全向一阶ambisonics分量,以及使用所述第一传输信号和所述第二传输信号的和来计算(922)另一个一阶ambisonics分量。32.根据权利要求21至26中的一项所述的装置,其中所述传输元数据指示与所述传输表示的传输信号的加权系数或查看方向有关的信息,其中所述空间音频合成器(750)被配置为使用与所述查看方向或所述加权系数有关的信息、使用所述传输信号和所述空间参数来计算(932)所述空间音频表示的不同的一阶ambisonics分量,或者其中所述空间音频合成器(750)被配置为使用与所述查看方向或所
述加权系数有关的信息并使用所述传输信号来计算(932)所述空间音频表示的不同的一阶ambisonics分量。33.根据权利要求21至32中的一项所述的装置,其中所述传输元数据包括与在两个不同位置处或在不同查看方向下从麦克风信号中导出的传输信号有关的信息,其中所述空间音频合成器(750)被配置为选择(931)位置最接近扬声器位置的参考信号,或者选择(932)相对于从所述空间音频表示的参考位置到扬声器位置的方向具有最接近的查看方向的参考信号,或者其中所述空间音频合成器(750)被配置为执行所述传输信号的线性组合(771),以确定被放置在由所述传输元数据指示的两个查看方向之间的扬声器的参考信号。34.根据权利要求21至33中的一项所述的装置,其中所述传输元数据包括与如下内容有关的信息:与所述传输信号相关联的麦克风位置之间的距离,其中所述空间音频合成器(750)包括扩散信号发生器(830、823、824),并且其中所述扩散信号发生器(830、823、824)被配置为使用与所述距离有关的信息来控制由所述扩散信号发生器生成的扩散信号中的去相关信号的量,以使得与针对第二距离的去相关信号的量相比,针对第一距离在所述扩散信号中包括更大量的去相关信号,其中所述第一距离小于所述第二距离,或者其中所述空间音频合成器(750)被配置为:针对所述麦克风位置之间的第一距离,使用去相关滤波器(823)的输出信号以及利用从声音到达方向信息中导出的增益进行加权(822)的参考信号来计算所述空间音频表示的分量信号,所述去相关滤波器被配置用于对参考信号或缩放的参考信号进行去相关;以及针对所述麦克风位置之间的第二距离,使用利用从声音到达方向信息中导出的增益进行加权(822)的所述参考信号来计算所述空间音频表示的分量信号,而不进行任何去相关处理,所述第二距离大于所述第一距离或大于距离阈值。35.根据权利要求21至34中的一项所述的装置,其中所述传输元数据包括与如下内容有关的信息:与所述传输表示的所述传输信号相关联的波束成形或空间滤波,以及其中所述空间音频合成器(750)被配置为使用如下传输信号来生成(932)扬声器的扬声器信号:具有最接近从所述空间音频表示的参考位置到所述扬声器的查看方向的查看方向的传输信号。36.根据权利要求21至35中的一项所述的装置,其中所述空间音频合成器(750)被配置为将所述空间音频表示的分量信号确定为直达声音分量和扩散声音分量的组合(825),其中所述直达声音分量是通过使用取决于扩散度参数或方向参数的因子缩放(822)参考信号来获得的,其中所述方向参数取决于声音的到达方向,其中对所述参考信号的确定是基于所述与传输元数据有关的所述信息来执行(821、760)的,并且其中所述扩散声音分量是使用相同的所述参考信号和所述扩散度参数来确定(823、824)的。37.根据权利要求21至36中的一项所述的装置,
其中所述空间音频合成器(750)被配置为将所述空间音频表示的分量信号确定为直达声音分量和扩散声音分量的组合(825),其中所述直达声音分量是通过使用取决于扩散度参数或方向参数的因子缩放(822)参考信号来获得的,其中所述方向参数取决于声音的到达方向,其中对所述参考信号的确定是基于所述与传输元数据有关的所述信息来执行(821、760)的,并且其中所述扩散声音分量是使用去相关滤波器(823)、相同的所述参考信号以及所述扩散度参数来确定(823、824)的。38.根据权利要求21至37中的一项所述的装置,其中所述传输表示包括至少两个不同的麦克风信号,其中所述传输元数据包括指示至少两个不同的麦克风信号是否是全向信号、偶极信号或心形信号中的至少一者的信息,以及其中所述空间音频合成器被配置用于:使参考信号确定适用(915)于所述传输元数据,以针对所述空间音频表示的分量确定独立参考信号;以及使用针对相应的分量确定的独立参考信号来计算(916)所述相应的分量。39.一种用于对表示音频场景的空间音频表示进行编码以获得经编码的音频信号的方法,所述方法包括:根据所述空间音频表示生成传输表示;生成与所述传输表示的生成相关或指示所述传输表示的一个或多个方向属性的传输元数据;以及生成经编码的音频信号,所述经编码的音频信号包括与所述传输表示有关的信息以及与所述传输元数据有关的信息。40.根据权利要求39所述的方法,还包括:从所述空间音频表示中导出空间参数,并且其中所述经编码的音频信号附加地包括与所述空间参数有关的信息。41.一种用于对经编码的音频信号进行解码的方法,所述方法包括:接收包括与传输表示有关的信息和与传输元数据有关的信息的经编码的音频信号;以及使用与传输表示有关的所述信息和与传输元数据有关的所述信息来合成空间音频表示。42.根据权利要求41所述的方法,还包括:接收与空间参数有关的信息,并且其中所述合成附加地使用所述与空间参数有关的信息。43.一种计算机程序,所述计算机程序当在计算机或处理器上运行时用于执行根据权利要求39至42中任一项所述的方法。44.一种经编码的音频信号,包括:与空间音频表示的传输表示(611)有关的信息;以及与传输元数据(610)有关的信息。45.根据权利要求44所述的经编码的音频信号,还包括与如下内容有关的信息:与所述传输表示(611)相关联的空间参数(612)。

技术总结
一种用于对表示音频场景的空间音频表示进行编码以获得经编码的音频信号的装置,包括:传输表示发生器(600),用于根据空间音频表示生成传输表示(611),并且用于生成与传输表示(611)的生成有关或指示传输表示(611)的一个或多个方向属性的传输元数据(610);以及输出接口(640),用于生成经编码的音频信号,该经编码的音频信号包括与传输表示(611)有关的信息,以及与传输元数据(610)有关的信息。以及与传输元数据(610)有关的信息。以及与传输元数据(610)有关的信息。


技术研发人员:法比恩
受保护的技术使用者:弗劳恩霍夫应用研究促进协会
技术研发日:2020.01.21
技术公布日:2021/10/8
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜