参数编码与解码的制作方法

2022-04-01 10:03:51 来源：中国专利 TAG：

技术特征：

1.一种音频合成器(300)，用于从降混信号(246，x)产生合成信号(336，340，yR)，所述合成信号(336，340，yR)具有多个合成声道，所述音频合成器(300)包括：

输入接口(312)，被配置用于接收所述降混信号(246，x)，所述降混信号(246，x)具有多个降混声道和侧信息(228)，所述侧信息(228)包括原始信号(212，y)的声道电平和相关信息(314，ξ，χ)，所述原始信号(212，y)具有多个原始声道；以及

合成处理器(404)，被配置用于根据至少一个混合规则，使用以下来产生所述合成信号(336，340，yR)：

所述原始信号(212，y)的声道电平和相关信息(220，314，ξ，χ)；以及

与所述降混信号(324，246，x)相关联的协方差信息(Cx)。

2.根据权利要求1所述的音频合成器(300)，包括：

原型信号计算器(326)，被配置用于从所述降混信号(324，246，x)计算原型信号(328)，所述原型信号(328)具有所述多个合成声道；

混合规则计算器(402)，被配置用于使用以下来计算至少一个混合规则(403)：

所述原始信号(212，y)的所述声道电平和相关信息(314，ξ，χ)；以及

与所述降混信号(324，246，x)相关联的所述协方差信息(Cx)；

其中所述合成处理器(404)被配置用于使用所述原型信号(328)和所述至少一个混合规则(403)产生所述合成信号(336，340，yR)。

3.根据权利要求1或者2所述的音频合成器，被配置为重构(386)所述原始信号的目标协方差信息(Cy)。

4.根据权利要求3所述的音频合成器，被配置为重构适应于所述合成信号(336，340，yR)的声道数量的所述目标协方差信息(Cy)。

5.根据权利要求4所述的音频合成器，被配置为通过将原始声道的组分配至单个合成声道，重构适应于所述合成信号(336，340，yR)的所述声道数量的所述协方差信息(Cy)，或者反之亦然，以使得经重构的目标协方差信息被报告给所述合成信号(336，340，yR)的所述多个声道。

6.根据权利要求5所述的音频合成器，被配置为通过产生针对原始声道的数量的目标协方差信息并且随后应用降混规则或升混规则以及能量补偿以得出针对所述合成声道的所述目标协方差，重构适应于所述合成信号(336，340，yR)的所述声道数量的所述协方差信息(Cy)。

7.根据权利要求3至6中任一项所述的音频合成器，被配置为基于原始协方差信息(Cy)的估计版本重构所述协方差信息(Cy)的目标版本其中所述原始协方差信息(Cy)的所述估计版本被报告给所述多个合成声道或者所述多个原始声道。

8.根据权利要求7所述的音频合成器，被配置为从与所述降混信号(324，246，x)相关联的协方差信息(Cx)获得所述原始协方差信息的所述估计版本

9.根据权利要求8所述的音频合成器，被配置为通过将估计规则(Q)应用于与所述降混信号(324，246，x)相关联的所述协方差信息(Cx)，获得所述原始协方差信息(220)的所述估计版本所述估计规则(Q)是用于计算所述原型信号(326)的原型规则或者与用于计算所述原型信号(326)的原型规则相关联。

10.根据权利要求8或者9所述的音频合成器，被配置为针对至少一个声道对，将所述原始协方差信息(Cy)的所述估计版本标准化到所述声道对中的声道的电平的平方根上。

11.根据权利要求10所述的音频合成器，被配置为利用经标准化的所述原始协方差信息(Cy)的所述估计版本来构造矩阵。

12.根据权利要求11所述的音频合成器，被配置为通过插入在位流(248)的侧信息(228)中获得的项(908)来完成所述矩阵。

13.根据权利要求10至12中任一项所述的音频合成器，被配置为通过按形成所述声道对的所述声道的所述电平的所述平方根缩放所述原始协方差信息(Cy)的所述估计版本对所述矩阵进行去标准化。

14.根据权利要求8至13中任一项所述的音频合成器，被配置为在所述降混信号(324，246，x)的所述侧信息(228)之中检索声道电平和相关信息(ξ，χ)，所述音频合成器还被配置为通过来自以下两者的所述原始声道电平和相关信息(220)的估计版本来重构所述协方差信息(Cy)的所述目标版本

用于至少一个第一声道或者声道对的协方差信息(Cx)；以及

用于至少一个第二声道或者声道对的声道电平和相关信息(ξ，χ)。

15.根据权利要求14所述的音频合成器，被配置为优选从位流(248)的侧信息(228)获得的描述所述声道或者声道对的所述声道电平和相关信息(ξ，χ)，而不是优选针对相同声道或者声道对从所述降混信号(324，246，x)重构的所述协方差信息(Cy)。

16.根据权利要求3至15中任一项所述的音频合成器，其中原始协方差信息(Cy)的经重构的目标版本描述在一对声道之间的能量关系，或者是至少部分地基于与所述一对声道中的每个声道相关联的电平。

17.根据前述权利要求中任一项所述的音频合成器，被配置为获得所述降混信号(246，x)的频域FD版本(324)，所述降混信号(246，x)的所述FD版本(324)被划分为频带或者频带组，其中不同声道电平和相关信息(220)与不同频带或者频带组相关联，

其中所述音频合成器被配置为针对不同频带或者频带组而不同地操作，以获得针对不同频带或者频带组的不同混合规则(403)。

18.根据前述权利要求中任一项所述的音频合成器，其中所述降混信号(324，246，x)被划分为时隙，其中不同的声道电平和相关信息(220)与不同时隙相关联，并且所述音频合成器被配置为针对不同时隙而不同地操作，以获得针对不同时隙的不同混合规则(403)。

19.根据前述权利要求中任一项所述的音频合成器，其中所述降混信号(324，246，x)被划分为帧，并且每个帧被划分为时隙，其中所述音频合成器被配置为当一个帧中的瞬态的存在和位置被用信号通知(261)为处于一个瞬态时隙中时：

将当前的声道电平和相关信息(220)与所述瞬态时隙和/或所述帧的瞬态时隙后续的时隙相关联；以及

将所述帧的所述瞬态时隙以前的时隙与所述以前的时隙的所述声道电平和相关信息(220)相关联。

20.根据前述权利要求中任一项所述的音频合成器，被配置为选择原型规则(Q)，所述原型规则(Q)被配置用于在所述多个合成声道的基础上计算原型信号(328)。

21.根据权利要求20所述的音频合成器，被配置为在多个预存储的原型规则之中选择所述原型规则(Q)。

22.根据前述权利要求中任一项所述的音频合成器，被配置为在手动选择的基础上定义原型规则(Q)。

23.根据权利要求21或者22所述的音频合成器，其中所述原型规则包括矩阵(Q)，所述矩阵(Q)具有第一维度和第二维度，其中所述第一维度与所述降混声道的数量相关联，并且所述第二维度与所述合成声道的数量相关联。

24.根据前述权利要求中任一项所述的音频合成器，被配置为在等于或者低于160kbit/s的位速率下操作。

25.根据前述权利要求中任一项所述的音频合成器，还包括熵解码器(312)，用于获得具有所述侧信息(314)的所述降混信号(246，x)。

26.根据前述权利要求中任一项所述的音频合成器，还包括去相关模块(614b，614c，330)，以减少不同声道之间的相关量。

27.根据权利要求1至25中任一项所述的音频合成器，其中所述原型信号(328)在不执行去相关的情况下被直接提供给所述合成处理器(600a，600b，404)。

28.根据前述权利要求中任一项所述的音频合成器，其中所述原始信号(212，y)的所述声道电平和相关信息(ξ，χ)、所述至少一个混合规则(403)和与所述降混信号(246，x)相关联的所述协方差信息(Cx)中的至少一个为矩阵形式。

29.根据前述权利要求中任一项所述的音频合成器，其中所述侧信息(228)包括所述原始声道的标识；

其中所述音频合成器还被配置用于使用所述原始信号(212，y)的所述声道电平和相关信息(ξ，χ)、与所述降混信号(246，x)相关联的协方差信息(Cx)、所述原始声道的所述标识、和所述合成声道的标识中的至少一个来计算所述至少一个混合规则(403)。

30.根据前述权利要求中任一项所述的音频合成器，被配置为通过奇异值分解SVD来计算至少一个混合规则。

31.根据前述权利要求中任一项所述的音频合成器，其中所述降混信号被划分为帧，所述音频合成器被配置为使用与针对先前帧获得的参数、经估计或者经重构的值或者混合矩阵的线性组合来平滑所接收的参数、经估计或者经重构的值或者混合矩阵。

32.根据权利要求31所述的音频合成器，被配置为当一个帧中的瞬态的存在和/或位置被用信号通知(261)时，停用所述所接收的参数、经估计或者经重构的值或者混合矩阵的所述平滑。

33.根据前述权利要求中任一项所述的音频合成器，其中所述降混信号被划分为帧，并且所述帧被划分为时隙，其中所述原始信号(212，y)的所述声道电平和相关信息(220，ξ，χ)是以逐帧方式从位流(248)的侧信息(228)获得的，所述音频合成器被配置为针对当前帧使用混合规则，所述混合规则是通过按沿着所述当前帧的后续时隙增加的系数对针对当前帧计算的混合规则进行缩放、并且通过以按沿着所述当前帧的所述后续时隙减少的系数缩放后的版本添加用于先前帧的混合规则而获得的。

34.根据前述权利要求中任一项所述的音频合成器，其中所述合成声道的数量大于所述原始声道的数量。

35.根据前述权利要求中任一项所述的音频合成器，其中所述合成声道的数量小于所述原始声道的数量。

36.根据前述权利要求中任一项所述的音频合成器，其中所述合成声道的数量、所述原始声道的数量和所述降混声道的数量中的至少一个数量为多个。

37.根据前述权利要求中任一项所述的音频合成器，其中所述至少一个混合规则包括第一混合矩阵(MM)和第二混合矩阵(MR)，所述音频合成器包括：

第一路径(610c’)，包括：

第一混合矩阵块(600c)，被配置用于根据从以下计算出的所述第一混合矩阵(MM)合成所述合成信号的第一分量(336M’)：

与所述合成信号(212)相关联的协方差矩阵所述协方差矩阵是从所述声道电平和相关信息(220)重构的；以及

与所述降混信号(324)相关联的协方差矩阵(Cx)，

第二路径(610c)，用于合成所述合成信号的第二分量(336R’)，所述第二分量(336R’)是残余分量，所述第二路径(610c)包括：

原型信号块(612c)，被配置用于将所述降混信号(324)从所述降混声道的数量升混到所述合成声道的数量；

去相关器(614c)，被配置用于对经升混的原型信号(613c)进行去相关；

第二混合矩阵块(618c)，被配置用于根据第二混合矩阵(MR)从所述降混信号(324)的去相关版本(615c)合成所述合成信号的所述第二分量(336R’)，所述第二混合矩阵(MR)是残余混合矩阵，

其中所述音频合成器(300)被配置为从以下估计(618c)所述第二混合矩阵(MR)：

由所述第一混合矩阵块(600c)提供的残余协方差矩阵(Cr)；以及

从与所述降混信号(324)相关联的所述协方差矩阵(Cx)获得的经去相关的原型信号的协方差矩阵的估计，

其中所述音频合成器(300)还包括加法器块(620c)，用于将所述合成信号的所述第一分量(336M’)与所述合成信号的所述第二分量(336R’)进行求和。

38.一种音频合成器(300)，用于从具有多个降混声道的降混信号(324，x)产生合成信号(336)，所述合成信号(336)具有多个合成声道，所述降混信号(324，x)是具有多个原始声道的原始信号(212)的降混版本，所述音频合成器(300)包括：

第一路径(610c’)，包括：

第一混合矩阵块(600c)，被配置用于根据从以下计算出的第一混合矩阵(MM)合成所述合成信号的第一分量(336M’)：

与所述合成信号(212)相关联的协方差矩阵以及

与所述降混信号(324)相关联的协方差矩阵(Cx)；

第二路径(610c)，用于对所述合成信号的第二分量(336R’)进行合成，其中所述第二分量(336R’)是残余分量，所述第二路径(610c)包括：

原型信号块(612c)，被配置用于将所述降混信号(324)从所述降混声道的数量升混到所述合成声道的数量；

去相关器(614c)，被配置用于对经升混的原型信号(613c)进行去相关；

其中所述音频合成器(300)被配置为从以下计算(618c)所述第二混合矩阵(MR)：

由所述第一混合矩阵块(600c)提供的残余协方差矩阵(Cr)；以及

从与所述降混信号(324)相关联的所述协方差矩阵(Cx)获得的经去相关的原型信号的协方差矩阵的估计，

其中所述音频合成器(300)还包括加法器块(620c)，用于将所述合成信号的所述第一分量(336M’)与所述合成信号的所述第二分量(336R’)进行求和。

39.根据权利要求37或者38所述的音频合成器，其中通过从与所述合成信号(212)相关联的所述协方差矩阵减去通过将所述第一混合矩阵(MM)应用于与所述降混信号(324)相关联的所述协方差矩阵(Cx)而获得的矩阵，获得所述残余协方差矩阵(Cr)。

40.根据权利要求37或者38或者39所述的音频合成器，被配置为从以下定义所述第二混合矩阵(MR)：

第二矩阵(Kr)，其通过分解与所述合成信号相关联的所述残余协方差矩阵(Cr)而获得；

第一矩阵其是从所述经去相关的原型信号的所述协方差矩阵的所述估计(711)获得的对角矩阵的逆矩阵或者经正则化的逆矩阵。

41.根据权利要求40所述的音频合成器，其中通过将平方根函数(712)应用于所述经去相关的原型信号的所述协方差矩阵的主对角元素，获得所述对角矩阵

42.根据权利要求40至41中任一项所述的音频合成器，其中通过将奇异值分解SVD(702)应用于与所述合成信号相关联的所述残余协方差矩阵(Cr)，获得所述第二矩阵(Kr)。

43.根据权利要求40至42中任一项所述的音频合成器，被配置为通过将所述第二矩阵(Kr)与从所述经去相关的原型信号的所述协方差矩阵的所述估计获得的所述对角矩阵的逆矩阵或者经正则化的逆矩阵以及第三矩阵(P)进行相乘(742)，定义所述第二混合矩阵(MR)。

44.根据权利要求43所述的音频合成器，被配置为通过将SVP(738)应用于从所述经去相关的原型信号的所述协方差矩阵的经标准化的版本获得的矩阵(K’y)，获得所述第三矩阵(P)，其中所述标准化是相对于所述残余协方差矩阵(Cr)、所述对角矩阵和所述第二矩阵(Kr)的主对角线进行。

45.根据权利要求37至44中任一项所述的音频合成器，被配置为从第二矩阵以及第二矩阵的逆矩阵或者经正则化的逆矩阵来定义所述第一混合矩阵(MM)，

其中通过分解与所述降混信号相关联的所述协方差矩阵来获得所述第二矩阵，以及

通过分解与所述降混信号相关联的经重构的目标协方差矩阵来获得所述第二矩阵。

46.根据权利要求37至45中任一项所述的音频合成器，被配置为从矩阵的对角项估计所述经去相关的原型信号的所述协方差矩阵，所述矩阵是通过将在所述原型块(612c)处使用的用于将所述降混信号(324)从所述降混声道的数量升混到所述合成声道的数量的原型规则(Q)应用于与所述降混信号(324)相关联的所述协方差矩阵(Cx)而获得的。

47.根据前述权利要求中任一项所述的音频合成器，其中所述音频合成器与所述解码器无关。

48.根据前述权利要求中任一项所述的音频合成器，其中频带被彼此聚合为聚合频带组，其中关于所述聚合频带组的信息是在位流(248)的侧信息(228)中提供的，其中所述原始信号(212，y)的所述声道电平和相关信息(220，ξ，χ)是按每个频带组提供的，以便针对相同聚合频带组的不同频带计算相同的至少一个混合矩阵。

49.一种音频编码器(200)，用于从原始信号(212，y)产生降混信号(246，x)，所述原始信号(212，y)具有多个原始声道，所述降混信号(246，x)具有多个降混声道，所述音频编码器(200)包括：

参数估计器(218)，被配置用于估计所述原始信号(212，y)的声道电平和相关信息(220)，以及

位流写入器(226)，用于将所述降混信号(246，x)编码至位流(248)中，使得所述降混信号(246，x)被编码在所述位流(248)中，以便具有侧信息(228)，所述侧信息(228)包括所述原始信号(212，y)的声道电平和相关信息(220)。

50.根据权利要求49所述的音频编码器，被配置为作为标准化值来提供所述原始信号(212，y)的所述声道电平和相关信息(220)。

51.根据权利要求49或者50所述的音频编码器，其中被编码在所述侧信息(228)中的所述原始信号(212，y)的所述声道电平和相关信息(220)至少包括或者表示与所述原始声道的总数量相关联的声道电平信息。

52.根据权利要求49至51中任一项所述的音频编码器，其中被编码在所述侧信息(228)中的所述原始信号(212，y)的所述声道电平和相关信息(220)至少包括或者表示相关信息(220，908)，所述相关信息(220，908)描述在至少一对、但少于所述原始声道的总数量的不同原始声道之间的能量关系。

53.根据权利要求49至52中任一项所述的音频编码器，其中所述原始信号(212，y)的所述声道电平和相关信息(220)包括至少一个相干值(ξi,j)，所述相干值(ξi,j)描述在一对原始声道中的两个声道之间的相干。

54.根据权利要求53所述的音频编码器，其中相干值被标准化。

55.根据权利要求53至54中任一项所述的音频编码器，其中相干值是

其中是声道i和j之间的协方差，和分别是与声道i和j相关联的电平。

56.根据权利要求49至55中任一项所述的音频编码器，其中所述原始信号(212，y)的所述声道电平和相关信息(220)包括至少一个声道间电平差ICLD。

57.根据权利要求56所述的音频编码器，其中所述至少一个ICLD是作为对数值提供的。

58.根据权利要求56至57所述的音频编码器，其中所述至少一个ICLD被标准化。

59.根据权利要求58所述的音频编码器，其中所述ICLD是

其中

-χi是针对声道i的ICLD，

-Pi是当前声道i的功率，

-Pdmx,i是所述降混信号的所述协方差信息的值的线性组合。

60.根据权利要求49至59中任一项所述的音频编码器，被配置为在状态信息(252)的基础上选择(250)是否对所述原始信号(212，y)的所述声道电平和相关信息(220)的至少一部分进行编码或者不对其进行编码，以便在有效载荷相对较低的情况下，在所述侧信息(228)中包括增加数量的声道电平和相关信息(220)。

61.根据权利要求49至60中任一项所述的音频编码器，被配置为在关于声道的量度(252)的基础上选择(250)要将所述原始信号(212，y)的所述声道电平和相关信息(220)的哪一部分编码在所述侧信息(228)中，以便在所述侧信息(228)中包括与更敏感的量度相关联的声道电平和相关信息(220)。

62.根据权利要求49至61中任一项所述的音频编码器，其中所述原始信号(212，y)的所述声道电平和相关信息(220)是矩阵(Cy)的项的形式。

63.根据权利要求62所述的音频编码器，其中所述矩阵是对称矩阵或者厄米特矩阵，其中所述声道电平和相关信息(220)的所述项是针对所述矩阵(Cy)的对角线中的全部项或者少于总数量的项和/或针对少于所述矩阵(Cy)的非对角元素的一半提供的。

64.根据权利要求49至63中任一项所述的音频编码器，其中所述位流写入器(226)被配置为对至少一个声道的标识进行编码。

65.根据权利要求49至64中任一项所述的音频编码器，其中所述原始信号(212，y)或者其经处理的版本(216)被划分为多个具有相等时间长度的后续帧。

66.根据权利要求65所述的音频编码器，被配置为将针对每个帧特定的所述原始信号(212，y)的声道电平和相关信息(220)编码在所述侧信息(228)中。

67.根据权利要求66所述的音频编码器，被配置为将共同地与多个连续帧相关联的所述原始信号(212，y)的相同声道电平和相关信息(220)编码在所述侧信息(228)中。

68.根据权利要求66至67中任一项所述的音频编码器，被配置为选择为其选择了所述原始信号(212，y)的相同声道电平和相关信息(220)的连续帧的数量，以使得：

相对较高的位速率或者较高的有效载荷隐含表明所述原始信号(212，y)的相同声道电平和相关信息(220)所关联的所述连续帧的数量的增加，反之亦然。

69.根据权利要求67至68中任一项所述的音频编码器，被配置为在检测到瞬态时减少所述原始信号(212，y)的相同声道电平和相关信息(220)所关联的所述连续帧的数量。

70.根据权利要求65至69中任一项所述的音频编码器，其中每个帧被细分为整数数量的连续时隙。

71.根据权利要求70所述的音频编码器，被配置为针对每个时隙估计所述声道电平和相关信息(220)，并且将针对不同时隙估计的所述声道电平和相关信息(220)的总和或者平均值或者另一预定线性组合编码在所述侧信息(228)中。

72.根据权利要求71所述的音频编码器，被配置为对所述帧的时域版本执行瞬态分析(258)，以确定在所述帧内的瞬态的发生。

73.根据权利要求72所述的音频解码器，被配置为确定所述瞬态已经发生在所述帧的哪个时隙中，并且：

对与其中所述瞬态已经发生的时隙和/或所述帧中的后续时隙相关联的所述原始信号(212，y)的所述声道电平和相关信息(220)进行编码，

不对与所述瞬态以前的时隙相关联的所述原始信号(212，y)的所述声道电平和相关信息(220)进行编码。

74.根据权利要求72或者73所述的音频编码器，被配置为在所述侧信息(228)中用信号通知(261)所述瞬态的发生是发生在所述帧的一个时隙中。

75.根据权利要求74所述的音频编码器，被配置为在所述侧信息(228)中用信号通知(261)所述瞬态已经发生在所述帧的哪个时隙中。

76.根据权利要求72至74中任一项所述的音频编码器，被配置为估计与所述帧的多个时隙相关联的所述原始信号(212，y)的声道电平和相关信息(220)，并且对它们求和或者对它们进行平均或者将它们线性组合，以获得与所述帧相关联的声道电平和相关信息(220)。

77.根据权利要求49至76中任一项所述的音频编码器，其中所述原始信号(212，y)被转换(263)为频域信号(264，266)，其中所述音频编码器被配置为以逐个频带的方式将所述原始信号(212，y)的所述声道电平和相关信息(220)编码在所述侧信息(228)中。

78.根据权利要求77所述的音频编码器，被配置为将所述原始信号(212，y)的多个频带聚合(265)为数量更为减少的频带(266)，以便以逐个聚合频带的方式将所述原始信号(212，y)的所述声道电平和相关信息(220)编码在所述侧信息(228)中。

79.根据权利要求77至78所述的音频编码器，被配置为在检测到所述帧中的瞬态的情况下进一步聚合(265)所述频带，使得：

所述频带(266)的数量被减少；和/或

至少一个频带的宽度通过与另一频带聚合而被增加。

80.根据权利要求77至79中任一项所述的音频编码器，还被配置为将一个频带的至少一个声道电平和相关信息(220)作为相对于先前编码的声道电平和相关信息的增量编码(226)在位流(248)中。

81.根据权利要求49至80中任一项所述的音频编码器，被配置为将相对于由所述估计器(218)估计的所述声道电平和相关信息(220)的所述声道电平和相关信息(220)的不完整版本编码在所述位流(248)的所述侧信息(228)中。

82.根据权利要求81所述的音频编码器，被配置为在由所述估计器(218)估计的整体的声道电平和相关信息(220)之中适应性地选择要被编码在所述位流(248)的所述侧信息(228)中的所选择信息，使得不对由所述估计器(218)估计的声道电平和/或相关信息(220)的剩余未选择信息进行编码。

83.根据权利要求81所述的音频编码器，被配置为从所选择的声道电平和相关信息(220)重构所述声道电平和相关信息(220)，由此模拟在解码器(300)处的未选择的声道电平和相关信息(220)的估计，并且计算以下之间的误差信息：

由所述编码器估计的所述未选择的声道电平和相关信息(220)；与

通过模拟在所述解码器(300)处的未编码的声道电平和相关信息(220)的估计而被重构的所述未选择的声道电平和相关信息；以及

使得在所计算的误差信息的基础上区分：

可正确重构的声道电平和相关信息；与

不可正确重构的声道电平和相关信息，

以便决定：

选择要被编码在所述位流(248)的所述侧信息(228)中的所述不可正确重构的声道电平和相关信息；以及

不选择所述可正确重构的声道电平和相关信息，由此避免将所述可正确重构的声道电平和相关信息编码在所述位流(248)的所述侧信息(228)中。

84.根据权利要求82至83中任一项所述的音频编码器，其中根据预定排序对所述声道电平和相关信息(220)进行索引，其中所述编码器被配置为在所述位流(248)的所述侧信息(228)中用信号通知与所述预定排序相关联的索引，所述索引指示所述声道电平和相关信息(220)中的哪一个被编码。

85.根据权利要求84所述的音频编码器，其中所述索引是通过位图提供的。

86.根据权利要求84至85中任一项所述的音频编码器，其中所述索引是根据将一维索引与矩阵的项相关联的组合编号系统定义的。

87.根据权利要求84至86中任一项所述的音频编码器，被配置为在以下之间进行选择：

所述声道电平和相关信息(220)的适应性提供，其中与所述预定排序相关联的索引被编码在所述位流的所述侧信息中；与

所述声道电平和相关信息(220)的固定提供，使得经编码的所述声道电平和相关信息(220)被预先确定，并且根据预定的固定排序被排序，而不提供索引。

88.根据权利要求87所述的音频编码器，被配置为在所述位流(248)的所述侧信息(228)中用信号通知是否根据适应性提供或者根据固定提供来提供所述声道电平和相关信息(220)。

89.根据权利要求49至88中任一项所述的音频编码器，还被配置为将当前的声道电平和相关信息(220t)作为相对于先前的声道电平和相关信息(220(t-1))的增量(220k)编码(226)在所述位流(248)中。

90.根据权利要求49至89中任一项所述的音频编码器，还被配置为根据静态降混(244)产生所述降混信号(246)。

91.根据权利要求49至90中任一项所述的音频编码器，其中所述音频编码器与所述音频合成器无关。

92.一种系统，包括根据权利要求1至48中任一项所述的音频合成器和根据权利要求49至91中任一项所述的音频编码器。

93.根据权利要求92所述的系统，其中所述音频编码器与所述音频合成器无关。

94.根据权利要求92至93中任一项所述的系统，其中所述音频合成器与所述编码器无关。

95.一种用于从降混信号产生合成信号的方法，所述合成信号具有多个合成声道，所述方法包括：

接收降混信号(246，x)和侧信息(228)，所述降混信号(246，x)具有多个降混声道，所述侧信息(228)包括：

原始信号(212，y)的声道电平和相关信息(220)，所述原始信号(212，y)具有多个原始声道；

使用所述原始信号(212，y)的所述声道电平和相关信息(220)以及与所述信号(246，x)相关联的协方差信息(Cx)产生所述合成信号。

96.根据权利要求95所述的方法，所述方法包括：

从所述降混信号(246，x)计算原型信号，所述原型信号具有所述多个合成声道；

使用所述原始信号(212，y)的所述声道电平和相关信息以及与所述降混信号(246，x)相关联的协方差信息来计算混合规则；以及

使用所述原型信号和所述混合规则产生所述合成信号。

97.一种用于从原始信号(212，y)产生降混信号(246，x)的方法，所述原始信号(212，y)具有多个原始声道，所述降混信号(246，x)具有多个降混声道，所述方法包括：

估计(218)所述原始信号(212，y)的声道电平和相关信息(220)，

将所述降混信号(246，x)编码(226)至位流(248)中，使得所述降混信号(246，x)被编码在所述位流(248)中，以便具有侧信息(228)，所述侧信息(228)包括所述原始信号(12，y)的声道电平和相关信息(220)。

98.一种用于从具有多个降混声道的降混信号(324，x)产生合成信号(336)的方法，所述合成信号(336)具有多个合成声道，所述降混信号(324，x)是具有多个原始声道的原始信号(212)的降混版本，所述方法包括以下阶段：

第一阶段(610c’)，包括：

根据从以下计算出的第一混合矩阵(MM)合成所述合成信号的第一分量(336M’)：

与所述合成信号(212)相关联的协方差矩阵以及

与所述降混信号(324)相关联的协方差矩阵(Cx)，

第二阶段(610c)，用于合成所述合成信号的第二分量(336R’)，其中所述第二分量(336R’)是残余分量，所述第二阶段(610c)包括：

原型信号步骤(612c)，将所述降混信号(324)从所述降混声道的数量升混到所述合成声道的数量；

去相关器步骤(614c)，对经升混的原型信号(613c)进行去相关化；

第二混合矩阵步骤(618c)，根据第二混合矩阵(MR)从所述降混信号(324)的去相关版本(615c)合成所述合成信号的所述第二分量(336R’)，所述第二混合矩阵(MR)是残余混合矩阵，

其中所述方法从以下计算所述第二混合矩阵(MR)：

由所述第一混合矩阵步骤(600c)提供的残余协方差矩阵(Cr)；以及

从与所述降混信号(324)相关联的所述协方差矩阵(Cx)获得的经去相关的原型信号的协方差矩阵的估计，

其中所述方法还包括加法器步骤(620c)，将所述合成信号的所述第一分量(336M’)与所述合成信号的所述第二分量(336R’)求和，由此获得所述合成信号(336)。

99.一种存储指令的非暂时性存储单元，所述指令当由处理器执行时致使所述处理器执行根据权利要求95至98中任一项所述的方法。

技术总结
公开了编码和解码技术的几个示例。特别地，一种音频合成器(300)，用于从降混信号(246，x)产生合成信号(336，340，yR)，包括：输入接口(312)，用于接收降混信号(246，x)，降混信号(246，x)具有多个降混声道和侧信息(228)，侧信息(228)包括原始信号(212，y)的声道电平和相关信息(314，ξ，χ)，原始信号(212，y)具有多个原始声道；以及合成处理器(404)，用于根据至少一个混合规则，使用以下来产生合成信号(336，340，yR)：原始信号(212，y)的声道电平和相关信息(220，314，ξ，χ)；以及与降混信号(324，246，x)相关联的协方差信息(Cx)。

技术研发人员：亚历山德拉·博塞翁;吉约姆·福克斯;马尔库斯·穆特鲁斯;法比安·库赤;奥利弗·蒂尔加特;斯特凡·拜耳;萨沙·迪施;于尔根·赫勒;
受保护的技术使用者：弗劳恩霍夫应用研究促进协会;
技术研发日：2020.06.15
技术公布日：2022.04.01

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：数据集构建和任务式对话方法、电子设备和存储介质与流程

参数编码与解码的制作方法

相关文献

最热文献