一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种音频编码方法和音频编码装置与流程

2021-12-17 18:03:00 来源:中国专利 TAG:


1.本技术涉及音频信号编码技术领域,尤其涉及一种音频编码方法和音频编码装置。


背景技术:

2.随着生活质量的提高,人们对高质量音频的需求不断增大。为了利用有限的带宽更好地传输音频信号,需要先对音频信号进行编码,然后将编码处理后的码流传输到解码端。解码端对接收到的码流进行解码处理,获得解码后的音频信号,解码后的音频信号用于回放。
3.其中,如何提高音频信号的编码质量,成为一个亟需解决的技术问题。


技术实现要素:

4.本技术实施例提供了一种音频编码方法和音频编码装置,用于提高音频信号的编码质量。
5.为解决上述技术问题,本技术实施例提供以下技术方案:
6.第一方面,本技术实施例提供一种音频编码方法,包括:获取音频信号的当前帧,所述当前帧包括高频带信号;对所述高频带信号进行编码,以获得所述当前帧的编码参数,所述编码包括:音调成分筛选;所述编码参数用于表示所述高频带信号的目标音调成分的信息,所述目标音调成分是经过所述音调成分筛选后获得的,所述音调成分的信息包括所述音调成分的位置信息、数量信息、以及幅度信息或能量信息;对所述编码参数进行码流复用,以获得编码码流。在本技术实施例中对高频带信号进行编码,以获得当前帧的编码参数,该编码包括音调成分筛选,编码参数用于表示经过音调成分筛选后获得的目标音调成分,该编码参数通过码流复用可以获得编码码流,本技术实施例获得的编码码流中携带的目标音调成分的信息是经过音调成分筛选的,因此可以高效地利用有限的编码比特数获得更好的音调成分编码效果,提升音频信号的编码质量。
7.在一种可能的实现方式中,所述高频带信号对应的高频带包括至少一个频率区域,所述至少一个频率区域包括当前频率区域;所述对所述高频带信号进行编码,以获得所述当前帧的编码参数,包括:根据所述当前频率区域的高频带信号获得所述当前频率区域的候选音调成分的信息;对所述当前频率区域的候选音调成分的信息进行音调成分筛选,以获得所述当前频率区域的目标音调成分的信息;根据所述当前频率区域的目标音调成分的信息获得所述当前频率区域的编码参数。在上述方案中,本技术实施例中编码过程中包括针对候选音调成分的信息进行的音调成分筛选,编码参数用于表示经过音调成分筛选后获得的目标音调成分,该编码参数通过码流复用可以获得编码码流,在本技术实施例获得的编码码流中携带的目标音调成分的信息是经过音调成分筛选的,因此可以高效地利用有限的编码比特数获得更好的音调成分编码效果,提升音频信号的编码质量。
8.在一种可能的实现方式中,所述高频带信号对应的高频带包括至少一个频率区
域,所述至少一个频率区域包括当前频率区域;所述对所述高频带信号进行编码,以获得所述当前帧的编码参数,包括:根据所述当前频率区域的高频带信号进行峰值搜索,以获得所述当前频率区域的峰值信息,所述当前频率区域的峰值信息包括:所述当前频率区域的峰值数量信息、峰值位置信息、以及峰值能量信息或峰值幅度信息;对所述当前频率区域的峰值信息进行峰值筛选,以获得所述当前频率区域的候选音调成分的信息;对所述当前频率区域的候选音调成分的信息进行音调成分筛选,以获得所述当前频率区域的目标音调成分的信息;根据所述当前频率区域的目标音调成分的信息获得所述当前频率区域的编码参数。在上述方案中,编码过程中包括针对当前频率区域的峰值信息的峰值筛选,以及针对候选音调成分的信息进行的音调成分筛选,编码参数用于表示经过音调成分筛选后获得的目标音调成分,该编码参数通过码流复用可以获得编码码流,在本技术实施例获得的编码码流中携带的目标音调成分的信息是经过音调成分筛选的,因此可以高效地利用有限的编码比特数获得更好的音调成分编码效果,提升音频信号的编码质量。
9.在一种可能的实现方式中,所述当前频率区域包括至少一个子带;所述对所述当前频率区域的候选音调成分的信息进行音调成分筛选,以获得所述当前频率区域的目标音调成分的信息,包括:对所述当前频率区域中子带序号相同的候选音调成分进行合并处理,以获得所述当前频率区域的合并处理后的候选音调成分的信息;根据所述当前频率区域的合并处理后的候选音调成分的信息获得所述当前频率区域的目标音调成分的信息。在上述方案中,音频编码装置可以获得当前频率区域中的所有候选音调成分对应的子带序号,对当前频率区域中子带序号相同的两个或者更多的候选音调成分进行合并处理。针对当前频率区域完成合并处理之后,得到合并处理后的候选音调成分的信息。在本技术实施例获得的编码码流中携带的目标音调成分的信息是经过合并处理的,因此可以高效地利用有限的编码比特数获得更好的音调成分编码效果,提升音频信号的编码质量。
10.在一种可能的实现方式中,所述至少一个子带包括当前子带;所述当前频率区域的合并处理后的候选音调成分的信息,包括:所述当前子带的合并处理后的候选音调成分的位置信息、所述当前子带的合并处理后的候选音调成分的幅度信息或能量信息;所述当前子带的合并处理后的候选音调成分的位置信息包括:所述当前子带的合并处理前的候选音调成分中的一个候选音调成分的位置信息;所述当前子带的合并处理后的候选音调成分的幅度信息或能量信息包括:所述一个候选音调成分的幅度信息或能量信息,或者所述当前子带的合并处理后的候选音调成分的幅度信息或能量信息是根据所述当前子带的合并处理前的候选音调成分的幅度信息或能量信息计算获得的。在上述方案中,经过合并处理,通过当前子带的候选音调成分的信息可以得到当前子带的合并处理后的候选音调成分的信息。
11.在一种可能的实现方式中,所述当前频率区域的合并处理后的候选音调成分的信息,还包括:所述当前频率区域的合并处理后的候选音调成分的数量信息;所述当前频率区域的合并处理后的候选音调成分的数量信息和所述当前频率区域中具有候选音调成分的子带的数量信息相同。在上述方案中,当前频率区域中具有候选音调成分的子带是指当前频率区域中合并处理前包含候选音调成分的子带。本技术实施例中,经过合并处理,根据当前频率区域的候选音调成分的信息,可以得到当前频率区域的合并处理后的候选音调成分的信息。
12.在一种可能的实现方式中,所述对所述当前频率区域中子带序号相同的候选音调成分进行合并处理之前,所述方法还包括:根据所述当前频率区域的候选音调成分的位置信息,对所述当前频率区域的候选音调成分按照位置递增或位置递减进行排列,以获得所述当前频率区域中位置排列后的候选音调成分;所述对所述当前频率区域中子带序号相同的候选音调成分进行合并处理包括:根据所述当前频率区域中位置排列后的候选音调成分,对所述当前频率区域中子带序号相同的候选音调成分进行合并处理。在上述方案中,合并处理可以是根据当前频率区域的候选音调成分的位置信息,按位置信息递增或递减对候选音调成分进行排列;对于按位置信息递增或递减排列后的候选音调成分,计算位置信息相邻的两个候选音调成分对应的子带序号;若位置相邻的两个候选音调成分对应的子带序号相同,则对两个候选音调成分进行合并处理,获得当前频率区域合并后的候选音调成分的数量信息,位置信息以及能量或幅度信息。本技术实施例中通过对当前频率区域的候选音调成分按照位置递增或位置递减进行排列,从而可以得到当前频率区域中位置排列后的候选音调成分,使用当前频率区域中位置排列后的候选音调成分进行合并处理,可以提高合并处理的效率。
13.在一种可能的实现方式中,所述根据所述当前频率区域的合并处理后的候选音调成分的信息获得所述当前频率区域的目标音调成分的信息包括:根据所述当前频率区域的合并处理后的候选音调成分的信息和所述当前频率区域中可以编码的最大音调成分数量信息,获得所述当前频率区域的目标音调成分的信息。在上述方案中,根据合并处理后的候选音调成分的信息和当前频率区域中可以编码的最大音调成分数量信息进行数量筛选之后,得到当前频率区域的数量筛选后的候选音调成分的信息,则当前频率区域的数量筛选后的候选音调成分的信息是当前频率区域的目标音调成分的信息。本技术实施例中音频编码装置根据当前频率区域中可以编码的最大音调成分数量信息对合并处理后的候选音调成分的信息进行数量筛选处理,从而可以获得当前频率区域的数量筛选后的候选音调成分的信息,通过数量筛选处理,可以减少当前频率区域中的候选音调成分的数量,从而提高音频信号的编码效率。
14.在一种可能的实现方式中,所述根据所述当前频率区域的合并处理后的候选音调成分的信息和所述当前频率区域中可以编码的最大音调成分数量信息,获得所述当前频率区域的目标音调成分的信息包括:根据所述当前频率区域的合并处理后的候选音调成分的信息,对所述当前频率区域的合并处理后的候选音调成分按照能量信息或幅度信息进行排列,以获得能量信息或幅度信息排列后的候选音调成分的信息;根据所述能量信息或幅度信息排列后的候选音调成分的信息和所述当前频率区域中可以编码的最大音调成分数量信息,获得所述当前频率区域的目标音调成分的信息。在上述方案中,按位置信息递增或递减对候选音调成分进行排列之后,对能量信息或幅度信息排列后的候选音调成分的信息进行数量筛选处理,当前频率区域中可以编码的最大音调成分数量信息是指当前频率区域中能够用于编码的最大音调成分数量,当前频率区域中可以编码的最大音调成分数量信息可以设定为预设的第二数值,或根据编码速率进行选择得到。可以获得当前频率区域的数量筛选后的候选音调成分的信息,通过数量筛选处理,可以减少当前频率区域中的候选音调成分的数量,从而提高音频信号的编码效率。
15.在一种可能的实现方式中,所述根据所述当前频率区域的合并处理后的候选音调
成分的信息获得所述当前频率区域的目标音调成分的信息包括:根据所述当前频率区域的合并处理后的候选音调成分的信息和所述当前频率区域中可以编码的最大音调成分数量信息,获得所述当前频率区域的数量筛选后的候选音调成分的信息;根据所述当前频率区域的数量筛选后的候选音调成分的信息,获得所述当前频率区域的目标音调成分的信息。在上述方案中,音频编码装置根据当前频率区域中可以编码的最大音调成分数量信息对合并处理后的候选音调成分的信息进行数量筛选处理,从而可以获得当前频率区域的数量筛选后的候选音调成分的信息,通过数量筛选处理,可以减少当前频率区域中的候选音调成分的数量,从而提高音频信号的编码效率。
16.在一种可能的实现方式中,所述根据所述当前频率区域的合并处理后的候选音调成分的信息和所述当前频率区域中可以编码的最大音调成分数量信息,获得所述当前帧的当前频率区域的数量筛选后的候选音调成分的信息包括:根据所述当前频率区域的合并处理后的候选音调成分的信息,对所述当前频率区域的合并处理后的候选音调成分按照能量信息或幅度信息进行排列,以获得能量信息或幅度信息排列后的候选音调成分的信息;根据所述能量信息或幅度信息排列后的候选音调成分的信息和所述当前频率区域中可以编码的最大音调成分数量信息,获得所述当前帧的当前频率区域的数量筛选后的候选音调成分的信息。在上述方案中,音频编码装置可以对能量信息或幅度信息排列后的候选音调成分的信息进行数量筛选处理,在进行数量筛选处理时还需要获取当前频率区域中可以编码的最大音调成分数量信息,当前频率区域中可以编码的最大音调成分数量信息是指当前频率区域中能够用于编码的最大音调成分数量,当前频率区域中可以编码的最大音调成分数量信息可以设定为预设的第二数值,或根据编码速率进行选择得到。
17.在一种可能的实现方式中,所述根据所述当前频率区域的数量筛选后的候选音调成分的信息,获得所述当前频率区域的目标音调成分的信息,包括:根据所述当前帧的当前频率区域的数量筛选后的候选音调成分的位置信息,对所述当前帧的当前频率区域的数量筛选后的候选音调成分按照位置递增或位置递减进行排列,以获得所述当前帧的当前频率区域的数量筛选后的位置排列后的候选音调成分;根据所述当前帧的当前频率区域的数量筛选后的位置排列后的候选音调成分,获得所述当前帧的当前频率区域的数量筛选后的位置排序后的候选音调成分对应的子带序号;获取所述当前帧的前一帧的当前频率区域的数量筛选后的位置排序后的候选音调成分对应的子带序号;若所述当前帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息和所述前一帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息满足预设条件,且所述当前帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分对应的子带序号和所述前一帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分对应的子带序号不同,则对所述当前帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息进行修正,以获得所述当前频率区域的目标音调成分的信息,所述第n个候选音调成分为所述当前频率区域中的数量筛选后的位置排序后的任意一个候选音调成分。在上述方案中,音频编码装置在进行帧间连续性修正处理之后,可以得到当前频率区域的目标音调成分的信息,通过上述帧间连续性修正处理,考虑了相邻帧之间的音调成分的连续性以及音调成分的子带分布,高效地利用有限的编码比特数获得更好的音调成分编码效果,提升编码质量。
18.在一种可能的实现方式中,所述预设条件包括:所述当前帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息和所述前一帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息之间的差值小于或等于预设阈值。在上述方案中,预设阈值的取值大小不做限定,本技术实施例中预设条件的设置有多种实现方式,上述举例只是一种可选方案,基于上述的预设条件还可以设置其他的预设条件,例如当前帧的当前频率区域中的第n个候选音调成分的位置信息和前一帧的当前频率区域中的第n个候选音调成分的位置信息之间的比值小于或等于另一个预设阈值,对于另一个预设阈值的取值方式不做限定。
19.在一种可能的实现方式中,所述对所述当前帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息进行修正,包括:将所述当前帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息修正为所述前一帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息。在上述方案中,对频率区域中当前帧第n个候选音调成分的位置信息进行修正,具体地可以是将当前帧的当前频率区域中的第n个候选音调成分的位置信息修正为与前一帧的当前频率区域中的第n个候选音调成分相同。根据修正后的候选音调成分的数量信息,位置信息和能量或幅度信息,确定当前频率区域的目标音调成分的数量信息、位置信息以及幅度或能量信息。通过上述帧间连续性修正处理,考虑了相邻帧之间的音调成分的连续性以及音调成分的子带分布,高效地利用有限的编码比特数获得更好的音调成分编码效果,提升编码质量。
20.在一种可能的实现方式中,所述当前频率区域包括至少一个子带;所述对所述当前频率区域的候选音调成分的信息进行音调成分筛选,以获得所述当前频率区域的目标音调成分的信息,包括:对所述当前频率区域中子带序号相同的候选音调成分进行合并处理,以获得所述当前频率区域的目标音调成分的信息。在上述方案中,音频编码装置可以获得当前频率区域中的所有候选音调成分对应的子带序号,对当前频率区域中子带序号相同的候选音调成分进行合并处理,例如当前频率区域中两个候选音调成分的子带序号相同,则这两个候选音调成分可以合并为当前频率区域中的一个合并后的候选音调成分。针对当前频率区域完成合并处理之后,得到当前频率区域的目标音调成分的信息。在本技术实施例获得的编码码流中携带的目标音调成分的信息是经过合并处理的,因此可以高效地利用有限的编码比特数获得更好的音调成分编码效果,提升音频信号的编码质量。
21.在一种可能的实现方式中,所述当前频率区域包括至少一个子带,所述对所述当前频率区域的候选音调成分的信息进行音调成分筛选,以获得所述当前频率区域的目标音调成分的信息,包括:根据所述当前帧的当前频率区域中的候选音调成分的位置信息获得所述当前帧的当前频率区域中的候选音调成分对应的子带序号;获取所述当前帧的前一帧的当前频率区域中的候选音调成分对应的子带序号;若所述当前帧的当前频率区域的第n个候选音调成分的位置信息和所述前一帧的当前频率区域的第n个候选音调成分的位置信息满足预设条件,且所述当前帧的当前频率区域的第n个候选音调成分对应的子带序号和所述前一帧的当前频率区域的第n个候选音调成分对应的子带序号不同,对所述当前帧的当前频率区域的第n个候选音调成分的位置信息进行修正,以获得所述当前频率区域的目标音调成分的信息,所述第n个候选音调成分为所述当前频率区域中的任意一个候选音调成分。在上述方案中,通过上述帧间连续性修正处理,考虑了相邻帧之间的音调成分的连续
性以及音调成分的子带分布,高效地利用有限的编码比特数获得更好的音调成分编码效果,提升编码质量。
22.在一种可能的实现方式中,所述根据所述当前帧的当前频率区域中的候选音调成分的位置信息获得所述当前帧的当前频率区域中的候选音调成分对应的子带序号包括:根据所述当前帧的当前频率区域的候选音调成分的位置信息,对所述当前帧的当前频率区域中的候选音调成分按照位置递增或位置递减进行排列,以获得所述当前帧的当前频率区域中位置排列后的候选音调成分;根据所述当前频率区域中位置排列后的候选音调成分,获取所述当前帧的当前频率区域中的候选音调成分对应的子带序号。在上述方案中,通过对当前频率区域的候选音调成分按照位置递增或位置递减进行排列,从而可以得到当前频率区域中位置排列后的候选音调成分,使用当前频率区域中位置排列后的候选音调成分进行帧间连续性修正处理,可以提高帧间连续性修正处理的效率。
23.在一种可能的实现方式中,所述预设条件包括:所述当前帧的当前频率区域的第n个候选音调成分的位置信息和所述前一帧的当前频率区域的第n个候选音调成分的位置信息之间的差值小于或等于预设阈值。在上述方案中,预设阈值的取值大小不做限定,本技术实施例中预设条件的设置有多种实现方式,上述举例只是一种可选方案,基于上述的预设条件还可以设置其他的预设条件,例如当前帧的当前频率区域中的第n个候选音调成分的位置信息和前一帧的当前频率区域中的第n个候选音调成分的位置信息之间的比值小于或等于另一个预设阈值,对于另一个预设阈值的取值方式不做限定。
24.在一种可能的实现方式中,所述对所述当前帧的当前频率区域的第n个候选音调成分的位置信息进行修正,包括:将所述当前帧的当前频率区域的第n个候选音调成分的位置信息修正为所述前一帧的当前频率区域的第n个候选音调成分的位置信息。在上述方案中,对频率区域中当前帧第n个候选音调成分的位置信息进行修正,具体地可以是将当前帧的当前频率区域中的第n个候选音调成分的位置信息修正为与前一帧的当前频率区域中的第n个候选音调成分相同。根据修正后的候选音调成分的数量信息,位置信息和能量或幅度信息,确定当前频率区域的目标音调成分的数量信息、位置信息以及幅度或能量信息。通过上述帧间连续性修正处理,考虑了相邻帧之间的音调成分的连续性以及音调成分的子带分布,高效地利用有限的编码比特数获得更好的音调成分编码效果,提升编码质量。
25.在一种可能的实现方式中,所述对所述当前频率区域的候选音调成分的信息进行音调成分筛选,以获得所述当前频率区域的目标音调成分的信息,包括:根据所述当前频率区域的候选音调成分的信息和所述当前频率区域中可以编码的最大音调成分数量信息,获得所述当前频率区域的目标音调成分的信息。在上述方案中,音频编码装置根据当前频率区域中可以编码的最大音调成分数量信息对合并处理后的候选音调成分的信息进行数量筛选处理,从而可以获得当前频率区域的数量筛选后的候选音调成分的信息,通过数量筛选处理,可以减少当前频率区域中的候选音调成分的数量,从而提高音频信号的编码效率。
26.在一种可能的实现方式中,所述根据所述当前频率区域的候选音调成分的信息和所述当前频率区域中可以编码的最大音调成分数量信息,获得所述当前频率区域的目标音调成分的信息,包括:根据所述当前频率区域中可以编码的最大音调成分数量信息选择所述当前频率区域中的候选音调成分的能量信息或幅度信息最大的x个候选音调成分,所述x小于或等于所述当前频率区域中可以编码的最大音调成分的数量,所述x为正整数;确定所
述x个候选音调成分的信息为所述当前频率区域的目标音调成分的信息,所述x表示所述当前频率区域的目标音调成分的数量。在上述方案中,频编码装置可以直接将x个候选音调成分的信息作为当前频率区域的目标音调成分的信息,x表示当前频率区域的目标音调成分的数量。或者,根据x个候选音调成分的信息进一步确定当前频率区域的目标音调成分的信息。例如,对x个候选音调成分的信息进行帧间连续性修正处理,将修正后的x个候选音调成分的信息作为当前频率区域的目标音调成分的信息。或者对x个候选音调成分的能量信息或幅度信息进行加权调整,将加权调整后的x个候选音调成分的信息作为当前频率区域的目标音调成分的信息。
27.在一种可能的实现方式中,所述候选音调成分的信息包括:所述候选音调成分的幅度信息或能量信息,所述候选音调成分的幅度信息或能量信息包括:所述候选音调成分的功率谱比值,其中,所述候选音调成分的功率谱比值为所述候选音调成分的功率谱的值与所述当前频率区域的功率谱的平均值的比值。
28.第二方面,本技术实施例还提供一种音频编码装置,所述装置包括:获取模块,用于获取音频信号的当前帧,所述当前帧包括高频带信号;编码模块,用于对所述高频带信号进行编码,以获得所述当前帧的编码参数,所述编码包括:音调成分筛选;所述编码参数用于表示所述高频带信号的目标音调成分的信息,所述目标音调成分是经过所述音调成分筛选后获得的,所述音调成分的信息包括所述音调成分的位置信息、数量信息、以及幅度信息或能量信息;码流复用模块,用于对所述编码参数进行码流复用,以获得编码码流。在本技术实施例中对高频带信号进行编码,以获得当前帧的编码参数,该编码包括音调成分筛选,编码参数用于表示经过音调成分筛选后获得的目标音调成分,该编码参数通过码流复用可以获得编码码流,本技术实施例获得的编码码流中携带的目标音调成分的信息是经过音调成分筛选的,因此可以高效地利用有限的编码比特数获得更好的音调成分编码效果,提升音频信号的编码质量。
29.在一种可能的实现方式中,所述高频带信号对应的高频带包括至少一个频率区域,所述至少一个频率区域包括当前频率区域;所述编码模块,用于根据所述当前频率区域的高频带信号获得所述当前频率区域的候选音调成分的信息;对所述当前频率区域的候选音调成分的信息进行音调成分筛选,以获得所述当前频率区域的目标音调成分的信息;根据所述当前频率区域的目标音调成分的信息获得所述当前频率区域的编码参数。
30.在一种可能的实现方式中,所述高频带信号对应的高频带包括至少一个频率区域,所述至少一个频率区域包括当前频率区域;所述编码模块,用于根据所述当前频率区域的高频带信号进行峰值搜索,以获得所述当前频率区域的峰值信息,所述当前频率区域的峰值信息包括:所述当前频率区域的峰值数量信息、峰值位置信息、以及峰值能量信息或峰值幅度信息;对所述当前频率区域的峰值信息进行峰值筛选,以获得所述当前频率区域的候选音调成分的信息;对所述当前频率区域的候选音调成分的信息进行音调成分筛选,以获得所述当前频率区域的目标音调成分的信息;根据所述当前频率区域的目标音调成分的信息获得所述当前频率区域的编码参数。
31.在一种可能的实现方式中,所述当前频率区域包括至少一个子带;所述编码模块,用于对所述当前频率区域中子带序号相同的候选音调成分进行合并处理,以获得所述当前频率区域的合并处理后的候选音调成分的信息;根据所述当前频率区域的合并处理后的候
选音调成分的信息获得所述当前频率区域的目标音调成分的信息。
32.在一种可能的实现方式中,所述至少一个子带包括当前子带;所述当前频率区域的合并处理后的候选音调成分的信息,包括:所述当前子带的合并处理后的候选音调成分的位置信息、所述当前子带的合并处理后的候选音调成分的幅度信息或能量信息;所述当前子带的合并处理后的候选音调成分的位置信息包括:所述当前子带的合并处理前的候选音调成分中的一个候选音调成分的位置信息;所述当前子带的合并处理后的候选音调成分的幅度信息或能量信息包括:所述一个候选音调成分的幅度信息或能量信息,或者所述当前子带的合并处理后的候选音调成分的幅度信息或能量信息是根据所述当前子带的合并处理前的候选音调成分的幅度信息或能量信息计算获得的。
33.在一种可能的实现方式中,所述当前频率区域的合并处理后的候选音调成分的信息,还包括:所述当前频率区域的合并处理后的候选音调成分的数量信息;所述当前频率区域的合并处理后的候选音调成分的数量信息和所述当前频率区域中具有候选音调成分的子带的数量信息相同。
34.在一种可能的实现方式中,所述编码模块,用于对所述当前频率区域中子带序号相同的候选音调成分进行合并处理之前,根据所述当前频率区域的候选音调成分的位置信息,对所述当前频率区域的候选音调成分按照位置递增或位置递减进行排列,以获得所述当前频率区域中位置排列后的候选音调成分;所述编码模块,用于根据所述当前频率区域中位置排列后的候选音调成分,对所述当前频率区域中子带序号相同的候选音调成分进行合并处理。
35.在一种可能的实现方式中,所述编码模块,用于根据所述当前频率区域的合并处理后的候选音调成分的信息和所述当前频率区域中可以编码的最大音调成分数量信息,获得所述当前频率区域的目标音调成分的信息。
36.在一种可能的实现方式中,所述编码模块,用于根据所述当前频率区域的合并处理后的候选音调成分的信息,对所述当前频率区域的合并处理后的候选音调成分按照能量信息或幅度信息进行排列,以获得能量信息或幅度信息排列后的候选音调成分的信息;根据所述能量信息或幅度信息排列后的候选音调成分的信息和所述当前频率区域中可以编码的最大音调成分数量信息,获得所述当前频率区域的目标音调成分的信息。
37.在一种可能的实现方式中,所述编码模块,用于根据所述当前频率区域的合并处理后的候选音调成分的信息和所述当前频率区域中可以编码的最大音调成分数量信息,获得所述当前频率区域的数量筛选后的候选音调成分的信息;根据所述当前频率区域的数量筛选后的候选音调成分的信息,获得所述当前频率区域的目标音调成分的信息。
38.在一种可能的实现方式中,所述编码模块,用于根据所述当前频率区域的合并处理后的候选音调成分的信息,对所述当前频率区域的合并处理后的候选音调成分按照能量信息或幅度信息进行排列,以获得能量信息或幅度信息排列后的候选音调成分的信息;根据所述能量信息或幅度信息排列后的候选音调成分的信息和所述当前频率区域中可以编码的最大音调成分数量信息,获得所述当前帧的当前频率区域的数量筛选后的候选音调成分的信息。
39.在一种可能的实现方式中,所述编码模块,用于根据所述当前帧的当前频率区域的数量筛选后的候选音调成分的位置信息,对所述当前帧的当前频率区域的数量筛选后的
候选音调成分按照位置递增或位置递减进行排列,以获得所述当前帧的当前频率区域的数量筛选后的位置排列后的候选音调成分;根据所述当前帧的当前频率区域的数量筛选后的位置排列后的候选音调成分,获得所述当前帧的当前频率区域的数量筛选后的位置排序后的候选音调成分对应的子带序号;获取所述当前帧的前一帧的当前频率区域的数量筛选后的位置排序后的候选音调成分对应的子带序号;若所述当前帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息和所述前一帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息满足预设条件,且所述当前帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分对应的子带序号和所述前一帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分对应的子带序号不同,则对所述当前帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息进行修正,以获得所述当前频率区域的目标音调成分的信息,所述第n个候选音调成分为所述当前频率区域中的数量筛选后的位置排序后的任意一个候选音调成分。
40.在一种可能的实现方式中,所述预设条件包括:所述当前帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息和所述前一帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息之间的差值小于或等于预设阈值。
41.在一种可能的实现方式中,所述编码模块,用于将所述当前帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息修正为所述前一帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息。
42.在一种可能的实现方式中,所述当前频率区域包括至少一个子带;所述编码模块,用于对所述当前频率区域中子带序号相同的候选音调成分进行合并处理,以获得所述当前频率区域的目标音调成分的信息。
43.在一种可能的实现方式中,所述当前频率区域包括至少一个子带,所述编码模块,用于根据所述当前帧的当前频率区域中的候选音调成分的位置信息获得所述当前帧的当前频率区域的候选音调成分对应的子带序号;获取所述当前帧的前一帧的当前频率区域中的候选音调成分对应的子带序号;若所述当前帧的当前频率区域的第n个候选音调成分的位置信息和所述前一帧的当前频率区域的第n个候选音调成分的位置信息满足预设条件,且所述当前帧的当前频率区域的第n个候选音调成分对应的子带序号和所述前一帧的当前频率区域的第n个候选音调成分对应的子带序号不同,则对所述当前帧的当前频率区域的第n个候选音调成分的位置信息进行修正,以获得所述当前频率区域的目标音调成分的信息,所述第n个候选音调成分为所述当前频率区域中的任意一个候选音调成分。
44.在一种可能的实现方式中,所述编码模块,用于根据所述当前帧的当前频率区域的候选音调成分的位置信息,对所述当前帧的当前频率区域中的候选音调成分按照位置递增或位置递减进行排列,以获得所述当前帧的当前频率区域中位置排列后的候选音调成分;根据所述当前频率区域中位置排列后的候选音调成分,获取所述当前帧的当前频率区域中的候选音调成分对应的子带序号。
45.在一种可能的实现方式中,所述预设条件包括:所述当前帧的当前频率区域的第n个候选音调成分的位置信息和所述前一帧的当前频率区域的第n个候选音调成分的位置信息之间的差值小于或等于预设阈值。
46.在一种可能的实现方式中,所述编码模块,用于将所述当前帧的当前频率区域的第n个候选音调成分的位置信息修正为所述前一帧的当前频率区域的第n个候选音调成分的位置信息。
47.在一种可能的实现方式中,所述编码模块,用于根据所述当前频率区域的候选音调成分的信息和所述当前频率区域中可以编码的最大音调成分数量信息,获得所述当前频率区域的目标音调成分的信息。
48.在一种可能的实现方式中,所述编码模块,用于根据所述当前频率区域中可以编码的最大音调成分数量信息选择所述当前频率区域中的候选音调成分的能量信息或幅度信息最大的x个候选音调成分,所述x小于或等于所述当前频率区域中可以编码的最大音调成分的数量,所述x为正整数;确定所述x个候选音调成分的信息为所述当前频率区域的目标音调成分的信息,所述x表示所述当前频率区域的目标音调成分的数量。
49.在一种可能的实现方式中,所述候选音调成分的信息包括:所述候选音调成分的幅度信息或能量信息,所述候选音调成分的幅度信息或能量信息包括:所述候选音调成分的功率谱比值,其中,所述候选音调成分的功率谱比值为所述候选音调成分的功率谱的值与所述当前频率区域的功率谱的平均值的比值。
50.在本技术的第二方面中,音频编码装置的组成模块还可以执行前述第一方面以及各种可能的实现方式中所描述的步骤,详见前述对第一方面以及各种可能的实现方式中的说明。
51.第三方面,本技术实施例提供一种音频编码装置,包括:相互耦合的非易失性存储器和处理器,所述处理器调用存储在所述存储器中的程序代码以如上述第一方面中任一项所述的方法。
52.第四方面,本技术实施例提供一种音频编码装置,包括:编码器,所述编码器用于执行如如上述第一方面中任一项所述的方法。
53.第五方面,本技术实施例提供一种计算机可读存储介质,包括计算机程序,所述计算机程序在计算机上被执行时,使得所述计算机执行上述第一方面中任一项所述的方法。
54.第六方面,本技术实施例提供一种计算机可读存储介质,包括根据上述第一方面中任一项所述的方法获得的编码码流。
55.第七方面,本技术提供一种计算机程序产品,该计算机程序产品包括计算机程序,当所述计算机程序被计算机执行时,用于执行上述第一方面中任一项所述的方法。
56.第八方面,本技术提供一种芯片,包括处理器和存储器,所述存储器用于存储计算机程序,所述处理器用于调用并运行所述存储器中存储的计算机程序,以执行如上述第一方面中任一项所述的方法。
附图说明
57.图1为本技术实施例中的音频编码及解码系统实例的示意图;
58.图2为本技术实施例中的音频编码应用的示意图;
59.图3为本技术实施例中的音频编码应用的示意图;
60.图4为本技术实施例的一种音频编码方法的流程图;
61.图5为本技术实施例的另一种音频编码方法的流程图;
62.图6为本技术实施例的另一种音频编码方法的流程图;
63.图7为本技术实施例的另一种音频编码方法的流程图;
64.图8为本技术实施例的另一种音频编码方法的流程图;
65.图9为本技术实施例的一种音频解码方法的流程图;
66.图10为本技术实施例的一种音频编码装置的示意图;
67.图11为本技术实施例的另一种音频编码装置的示意图。
具体实施方式
68.本技术实施例提供了一种音频编码方法和音频编码装置,用于提高音频信号的编码质量。
69.下面结合附图,对本技术的实施例进行描述。
70.本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,这仅仅是描述本技术的实施例中对相同属性的对象在描述时所采用的区分方式。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,以便包含一系列单元的过程、方法、系统、产品或设备不必限于那些单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它单元。
71.应当理解,在本技术中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“a和/或b”可以表示:只存在a,只存在b以及同时存在a和b三种情况,其中a,b可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c分别可以是单个,也可以分别是多个,也可以是部分是单个,部分是多个。
72.下面描述本技术实施例所应用的系统架构。参见图1,图1示例性地给出了本技术实施例所应用的音频编码及解码系统10的示意性框图。如图1所示,音频编码及解码系统10可包括源设备12和目的地设备14,源设备12产生经编码的音频数据,因此,源设备12可被称为音频编码装置。目的地设备14可对由源设备12所产生的经编码的音频数据进行解码,因此,目的地设备14可被称为音频解码装置。源设备12、目的地设备14或两个的各种实施方案可包含一或多个处理器以及耦合到所述一或多个处理器的存储器。所述存储器可包含但不限于随机存取存储器(random access memory,ram)、只读存储器(read only memory,rom)、带电可擦可编程只读存储器(electrically erasable programmable read only memory,eeprom)、快闪存储器或可用于以可由计算机存取的指令或数据结构的形式存储所要的程序代码的任何其它媒体,如本文所描述。源设备12和目的地设备14可以包括各种装置,包含桌上型计算机、移动计算装置、笔记型(例如,膝上型)计算机、平板计算机、机顶盒、所谓的“智能”电话等电话手持机、电视机、音箱、数字媒体播放器、视频游戏控制台、车载计算机、无线通信设备或其类似者。
73.虽然图1将源设备12和目的地设备14绘示为单独的设备,但设备实施例也可以同时包括源设备12和目的地设备14或同时包括两者的功能性,即源设备12或对应的功能性以
及目的地设备14或对应的功能性。在此类实施例中,可以使用相同硬件和/或软件,或使用单独的硬件和/或软件,或其任何组合来实施源设备12或对应的功能性以及目的地设备14或对应的功能性。
74.源设备12和目的地设备14之间可通过链路13进行通信连接,目的地设备14可经由链路13从源设备12接收经编码的音频数据。链路13可包括能够将经编码的音频数据从源设备12移动到目的地设备14的一或多个媒体或装置。在一个实例中,链路13可包括使得源设备12能够实时将经编码的音频数据直接发射到目的地设备14的一或多个通信媒体。在此实例中,源设备12可根据通信标准(例如无线通信协议)来调制经编码的音频数据,且可将经调制的音频数据发射到目的地设备14。所述一或多个通信媒体可包含无线和/或有线通信媒体,例如射频(rf)频谱或一或多个物理传输线。所述一或多个通信媒体可形成基于分组的网络的一部分,基于分组的网络例如为局域网、广域网或全球网络(例如,因特网)。所述一或多个通信媒体可包含路由器、交换器、基站或促进从源设备12到目的地设备14的通信的其它设备。
75.源设备12包括编码器20,另外可选地,源设备12还可以包括音频源16、预处理器18、以及通信接口22。具体实现形态中,所述编码器20、音频源16、预处理器18、以及通信接口22可能是源设备12中的硬件部件,也可能是源设备12中的软件程序。分别描述如下:
76.音频源16,可以包括或可以为任何类别的声音捕获设备,用于例如捕获现实世界的声音,和/或任何类别的音频生成设备。音频源16可以为用于捕获声音的麦克风或者用于存储音频数据的存储器,音频源16还可以包括存储先前捕获或产生的音频数据和/或获取或接收音频数据的任何类别的(内部或外部)接口。当音频源16为麦克风时,音频源16可例如为本地的或集成在源设备中的集成麦克风;当音频源16为存储器时,音频源16可为本地的或例如集成在源设备中的集成存储器。当所述音频源16包括接口时,接口可例如为从外部音频源接收音频数据的外部接口,外部音频源例如为外部声音捕获设备,比如麦克风、外部存储器或外部音频生成设备。接口可以为根据任何专有或标准化接口协议的任何类别的接口,例如有线或无线接口、光接口。
77.本技术实施例中,由音频源16传输至预处理器18的音频数据也可称为原始音频数据17。
78.预处理器18,用于接收原始音频数据17并对原始音频数据17执行预处理,以获取经预处理的音频19或经预处理的音频数据19。例如,预处理器18执行的预处理可以包括滤波、或去噪等。
79.编码器20(或称音频编码器20),用于接收经预处理的音频数据19,并用于执行后文所描述的各个实施例,以实现本技术所描述的音频编码方法在编码侧的应用。
80.通信接口22,可用于接收经编码的音频数据21,并可通过链路13将经编码的音频数据21传输至目的地设备14或任何其它设备(如存储器),以用于存储或直接重构,所述其它设备可为任何用于解码或存储的设备。通信接口22可例如用于将经编码的音频数据21封装成合适的格式,例如数据包,以在链路13上传输。
81.目的地设备14包括解码器30,另外可选地,目的地设备14还可以包括通信接口28、音频后处理器32和扬声设备34。分别描述如下:
82.通信接口28,可用于从源设备12或任何其它源接收经编码的音频数据21,所述任
何其它源例如为存储设备,存储设备例如为经编码的音频数据存储设备。通信接口28可以用于藉由源设备12和目的地设备14之间的链路13或藉由任何类别的网络传输或接收经编码音频数据21,链路13例如为直接有线或无线连接,任何类别的网络例如为有线或无线网络或其任何组合,或任何类别的私网和公网,或其任何组合。通信接口28可以例如用于解封装通信接口22所传输的数据包以获取经编码的音频数据21。
83.通信接口28和通信接口22都可以配置为单向通信接口或者双向通信接口,以及可以用于例如发送和接收消息来建立连接、确认和交换任何其它与通信链路和/或例如经编码的音频数据传输的数据传输有关的信息。
84.解码器30(或称为音频解码器30),用于接收经编码的音频数据21并提供经解码的音频数据31或经解码的音频31。在一些实施例中,解码器30可以用于执行后文所描述的各个实施例,以实现本技术所描述的音频编码方法在解码侧的应用。
85.音频后处理器32,用于对经解码的音频数据31(也称为经重构的音频数据)执行后处理,以获得经后处理的音频数据33。音频后处理器32执行的后处理可以包括:例如渲染,或任何其它处理,还可用于将将经后处理的音频数据33传输至扬声设备34。
86.扬声设备34,用于接收经后处理的音频数据33以向例如用户或观看者播放音频。扬声设备34可以为或可以包括任何类别的用于呈现经重构的声音的扬声器。
87.虽然,图1将源设备12和目的地设备14绘示为单独的设备,但设备实施例也可以同时包括源设备12和目的地设备14或同时包括两者的功能性,即源设备12或对应的功能性以及目的地设备14或对应的功能性。在此类实施例中,可以使用相同硬件和/或软件,或使用单独的硬件和/或软件,或其任何组合来实施源设备12或对应的功能性以及目的地设备14或对应的功能性。
88.本领域技术人员基于描述明显可知,不同单元的功能性或图1所示的源设备12和/或目的地设备14的功能性的存在和(准确)划分可能根据实际设备和应用有所不同。源设备12和目的地设备14可以包括各种设备中的任一个,包含任何类别的手持或静止设备,例如,笔记本或膝上型计算机、移动电话、智能手机、平板或平板计算机、摄像机、台式计算机、机顶盒、电视机、相机、车载设备、音响、数字媒体播放器、音频游戏控制台、音频流式传输设备(例如内容服务服务器或内容分发服务器)、广播接收器设备、广播发射器设备、智能眼镜、智能手表等,并可以不使用或使用任何类别的操作系统。
89.编码器20和解码器30都可以实施为各种合适电路中的任一个,例如,一个或多个微处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application-specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)、离散逻辑、硬件或其任何组合。如果部分地以软件实施所述技术,则设备可将软件的指令存储于合适的非暂时性计算机可读存储介质中,且可使用一或多个处理器以硬件执行指令从而执行本公开的技术。前述内容(包含硬件、软件、硬件与软件的组合等)中的任一者可视为一或多个处理器。
90.在一些情况下,图1中所示音频编码及解码系统10仅为示例,本技术的技术可以适用于不必包含编码和解码设备之间的任何数据通信的音频编码设置(例如,音频编码或音频解码)。在其它实例中,数据可从本地存储器检索、在网络上流式传输等。音频编码设备可以对数据进行编码并且将数据存储到存储器,和/或音频解码设备可以从存储器检索数据
并且对数据进行解码。在一些实例中,由并不彼此通信而是仅编码数据到存储器和/或从存储器检索数据且解码数据的设备执行编码和解码。
91.上述编码器可以是多声道编码器,例如,立体声编码器,5.1声道编码器,或7.1声道编码器等。当然可以理解的,上述编码器也可以是单声道编码器。
92.上述音频数据也可以称为音频信号,本技术实施例中的音频信号是指音频编码设备中的输入信号,该音频信号中可以包括多个帧,例如当前帧可以特指音频信号中的某一个帧,本技术实施例中以当前帧音频信号的编解码进行示例说明,音频信号中当前帧的前一帧或者后一帧都可以根据该当前帧音频信号的编解码方式进行相应的编解码,对于音频信号中当前帧的前一帧或者后一帧的编解码过程不再逐一说明。另外,本技术实施例中的音频信号可以是单声道音频信号,或者,也可以为多声道信号,例如,立体声信号。其中,立体声信号可以是原始的立体声信号,也可以是多声道信号中包括的两路信号(左声道信号和右声道信号)组成的立体声信号,还可以是由多声道信号中包含的至少三路信号产生的两路信号组成的立体声信号,本技术实施例中对此并不限定。
93.示例性的,如图2所示,本实施例以编码器20设置于移动终端230中、解码器30设置于移动终端240中,移动终端230与移动终端240是相互独立的具有音频信号处理能力的电子设备,例如可以是手机,可穿戴设备,虚拟现实(virtual reality,vr)设备,或增强现实(augmented reality,ar)设备等等,且移动终端230与移动终端240之间通过无线或有线网络连接为例进行说明。
94.可选地,移动终端230可以包音频源16、预处理器18、编码器20和信道编码器232,其中,音频源16、预处理器18、编码器20和信道编码器232连接。
95.可选地,移动终端240可以包括信道解码器242、解码器30、音频后处理器32和扬声设备34,其中,信道解码器242、解码器30、音频后处理器32和扬声设备34连接。
96.移动终端230通过音频源16获取到音频信号后,通过预处理器18对该音频进行预处理,之后通过编码器20对该音频信号进行编码,获得编码码流;然后,通过信道编码器232对编码码流进行编码,获得传输信号。
97.移动终端230通过无线或有线网络将该传输信号发送至移动终端240。
98.移动终端240接收到该传输信号后,通过信道解码器242对传输信号进行解码获得编码码流;通过解码器30对编码码流进行解码获得音频信号;通过音频后处理器32对该音频信号进行处理,之后通过扬声设备34播放该音频信号。可以理解的是,移动终端230也可以包括移动终端240所包括的各个功能模块,移动终端240也可以包括移动终端230所包括的功能模块。
99.示例性地,如图3所示,以编码器20和解码器30设置于同一核心网或无线网中具有音频信号处理能力的网元350中为例进行说明。该网元350可以实现转码,例如,将其他音频编码器(非多声道编码器)的编码码流转换为多声道编码器的编码码流。该网元350可以是无线接入网或核心网的媒体网关、转码设备、或媒体资源服务器等。
100.可选地,网元350包括信道解码器351、其他音频解码器352、编码器20和信道编码器353。其中,道解码器351、其他音频解码器352、编码器20和信道编码器353连接。
101.信道解码器351接收到其它设备发送的传输信号后,对该传输信号进行解码获得第一编码码流;通过其他音频解码器352对第一编码码流进行解码获得音频信号;通过编码
器20对该音频信号进行编码,获得第二编码码流;通过信道编码器353对该第二编码码流进行编码获得传输信号。即实现将第一编码码流转码为第二编码码流。
102.其中,其它设备可以是具有音频信号处理能力的移动终端;或者,也可以是具有音频信号处理能力的其它网元,本实施例对此不作限定。
103.可选地,本技术实施例中可以将安装有编码器20的设备称为音频编码设备,在实际实现时,该音频编码设备也可以具有音频解码功能,本技术实施对此不作限定。
104.可选地,本技术实施例中可以将安装有解码器30的设备称为音频解码设备,在实际实现时,该音频解码设备也可以具有音频编码功能,本技术实施对此不作限定。
105.上述编码器可以执行本技术实施例的音频编码方法,其中,第一编码过程中包括频带扩展编码,高频带信号的每个频点对应有频谱保留标志,通过该频谱保留标志指示从频带扩展编码之前到频带扩展编码之后高频带信号中的某个频点的频谱值是否被保留,根据高频带信号的每个频点的频谱保留标志对高频带信号进行第二编码,高频带信号的每个频点的频谱保留标志可以用于避免对频带扩展编码中已经保留的音调成分进行重复编码,从而可提升音调成分的编码效率。
106.例如,上述音频编码装置或音频编码装置内部的核心编码器在对高频带信号和低频带信号进行第一编码时包括频带扩展编码,从而可以记录高频带信号的每个频点的频谱保留标志,即通过高频带信号的每个频点的频谱保留标志确定每个频点在频带扩展前后的频谱是否发生变化,高频带信号的每个频点的频谱保留标志可以用于避免对频带扩展编码中已经保留的音调成分进行重复编码,从而可提升音调成分的编码效率。其具体实施方式可以参见下述图4所示实施例的具体解释说明。
107.图4为本技术实施例的一种音频编码方法的流程图,本技术实施例的执行主体可以是上述音频编码装置或音频编码装置内部的核心编码器,如图4所示,本实施例的方法可以包括:
108.401、获取音频信号的当前帧,当前帧包括高频带信号。
109.其中,当前帧可以是音频信号中的任意一个帧,当前帧中可以包括高频带信号。不限定的是,本技术实施例中当前帧中除了包括高频带信号,还可以包括低频带信号,其中,高频带信号和低频带信号的划分可以通过频带阈值确定,高于该频带阈值的信号为高频带信号,低于该频带阈值的信号为低频带信号,对于频带阈值的确定可以根据传输带宽、音频编码装置和音频解码装置的数据处理能力来确定,此处不做限定。
110.其中,高频带信号和低频带信号是相对的,例如低于某个频率阈值的信号为低频带信号,高于该频率阈值的信号为高频带信号(该频率阈值对应的信号既可以划到低频带信号,也可以划到高频带信号)。该频率阈值根据当前帧的带宽不同会有不同。例如,在当前帧为信号带宽为0-8千赫兹(khz)的宽带信号时,该频率阈值可以为4khz;在当前帧为信号带宽为0-16khz的超宽带信号时,该频率阈值可以为8khz。
111.需要说明的是,本发明实施例中,所述高频带信号可以是高频区域中的部分或全部信号,具体地,高频区域根据当前帧的信号带宽的不同会有不同,也会根据频率阈值的不同会有不同。例如,在当前帧的信号带宽为0-8khz,频率阈值为4khz时,所述高频区域为4-8khz,则所述高频带信号可以是覆盖整个高频区域的4-8khz的信号,也可以是仅覆盖部分高频区域的信号,例如高频带信号可以是4-7khz,5-8khz,5-7khz,或4-6khz以及7-8khz(即
所述高频带信号在频域上可以是不连续的)等等;在当前帧的信号带宽为0-16khz,频率阈值为8khz时,高频区域为8-16khz,则所述高频带信号可以是覆盖整个高频区域的8-16khz的信号,也可以是仅覆盖部分高频区域的信号,例如高频带信号可以是8-15khz,9-16khz,9-15khz,或8-10khz以及11-16khz(即所述高频带信号在频域上可以是不连续的)等等。可以理解的是,所述高频带信号覆盖的频率范围可以根据需要进行设置,或者根据需要进行后续步骤402中编码的频率范围自适应地确定,例如,可以根据需要进行音调成分筛选的频率范围自适应地确定。
112.其中,需要进行音调成分筛选的频率范围可以根据需要进行音调成分筛选的频率区域的数量来确定,具体的,需要进行音调成分筛选的频率区域的数量可以是预先指定的。
113.402、对高频带信号进行编码,以获得当前帧的编码参数,编码包括:音调成分筛选;编码参数用于表示高频带信号的目标音调成分的信息,目标音调成分是经过音调成分筛选后获得的,音调成分的信息包括音调成分的位置信息、数量信息、以及幅度信息或能量信息。
114.其中,音频编码装置针对当前帧中的高频带信号进行编码,编码后可以输出当前帧的编码参数,该编码参数也可以称为高频带参数。在步骤402所示的编码过程中包括音调成分筛选,音调成分筛选是指针对编码过程中的高频带信号的音调成分进行筛选,编码参数用于表示经过音调成分筛选后获得的目标音调成分,目标音调成分用于特指在高频带信号的编码过程中经过音调成分筛选获得的音调成分。本技术实施例中编码参数携带的目标音调成分的信息是经过音调成分筛选的,因此可以高效地利用有限的编码比特数获得更好的音调成分编码效果,提升音频信号的编码质量。
115.在本技术实施例中,当前帧的编码参数用于表示高频带信号包括的目标音调成分的位置、数量以及幅度或能量。例如,当前帧的编码参数包括目标音调成分的位置数量参数、以及目标音调成分的幅度参数或能量参数。又例如,当前帧的编码参数包括目标音调成分的位置参数、数量参数、以及目标音调成分的幅度参数或能量参数。
116.本技术实施例中,高频带信号对应的高频带包括至少一个频率区域,一个频率区域包括至少一个子带。根据高频带信号获取当前帧的编码参数的过程可以按照高频带的频率区域划分和/或子带划分来进行。
117.频率区域的数量可以是预先确定的,也可以是根据算法计算得到的,本技术实施例中对于频率区域的确定方式不做限定。后续实施例中以在一个频率区域中确定目标音调成分的位置数量参数以及目标音调成分的幅度参数或能量参数为例进行进一步的说明。
118.在本技术实施例中,高频带可以包括k个频率区域(例如每个频率区域称为一个tile),每一个频率区域内又可以包括m个子带,音调成分筛选可以以频率区域为单位进行,也可以以子带为单位进行。可以理解的是,不同的频率区域包括的子带的数量可以是不相同的。
119.需要说明的是,在步骤401执行之后,除了执行前述步骤402,还可以执行如下步骤a1:
120.a1、对高频带信号和低频带信号进行第一编码,以获得当前帧的第一编码参数,第一编码包括频带扩展编码。
121.在获取到高频带信号和低频带信号之后,音频编码装置可以对高频带信号和低频
带信号进行第一编码,其中,第一编码可以包括频带扩展编码,(即音频频带扩展编码,后续简称为频带扩展),通过频带扩展编码可以获得频带扩展编码参数(简称为频带扩展参数),解码端可以根据频带扩展编码参数重建音频信号中的高频信息,从而扩展音频信号的有效带宽,提升音频信号的质量。
122.本技术实施例中,在第一编码过程中会对高频带信号和低频带信号进行编码,以获得当前帧的第一编码参数,该第一编码参数可以用于码流复用。其中,在一些实施例中,第一编码除了包括频带扩展编码外,还可以包括时域噪声整形、频域噪声整形、或频谱量化等处理;相应地,第一编码参数除了包括频带扩展编码参数之外,还可以包括:时域噪声整形参数、频域噪声整形参数、或频谱量化参数等。对于第一编码的过程,本技术实施例中不再赘述。
123.需要说明的是,在上述步骤a1中针对高频带信号和低频带信号的编码可以称为第一编码,在步骤a1执行之后可以执行前述的步骤402,则步骤402中针对高频带信号的编码可以称为第二编码。后续实施例中以步骤402中包括音调成分筛选的编码过程为第二编码进行说明。
124.403、对编码参数进行码流复用,以获得编码码流。
125.其中,音频编码装置对编码参数进行码流复用,以获得编码码流,例如该编码码流可以是载荷码流。载荷码流中可以携带音频信号的各个帧的具体信息,例如,可以携带上述各个帧的目标音调成分的信息。该编码参数通过码流复用可以获得编码码流,在本技术实施例获得的编码码流中携带的目标音调成分的信息是经过音调成分筛选的,因此可以高效地利用有限的编码比特数获得更好的音调成分编码效果,提升音频信号的编码质量。
126.在本技术的一些实施例中,对高频带信号和低频带信号进行编码得到的编码参数可以定义为第一编码参数,步骤402中得到的编码参数可以定义为第二编码参数,则在步骤403中还可以对第一编码参数和第二编码参数进行码流复用,以获得编码码流,例如,该编码码流可以是载荷码流。
127.在一些实施例中,该编码码流还可以包括配置码流,该配置码流中可以携带音频信号中各个帧共用的配置信息。载荷码流和配置码流可以是相互独立的码流,也可以包括于同一码流中,即载荷码流和配置码流可以是同一码流中的不同部分。
128.音频编码装置将编码码流发送至音频解码装置,音频解码装置对该编码码流进行码流解复用,以获取该编码参数,进而准确获取该音频信号的当前帧。
129.通过前述实施例对本技术的举例说明可知,获取音频信号的当前帧,当前帧包括高频带信号,对高频带信号进行编码,以获得当前帧的编码参数,编码包括:音调成分筛选;编码参数用于表示高频带信号的目标音调成分的信息,目标音调成分是经过音调成分筛选后获得的,音调成分的信息包括音调成分的位置信息、数量信息、以及幅度信息或能量信息,对编码参数进行码流复用,以获得编码码流。本技术实施例中编码过程中包括音调成分筛选,编码参数用于表示经过音调成分筛选后获得的目标音调成分,该编码参数通过码流复用可以获得编码码流,在本技术实施例获得的编码码流中携带的目标音调成分的信息是经过音调成分筛选的,因此可以高效地利用有限的编码比特数获得更好的音调成分编码效果,提升音频信号的编码质量。
130.接下来请参阅本技术提供的另一些实施例,本技术实施例的执行主体可以是上述
音频编码装置或音频编码装置内部的核心编码器,如图5所示,本技术实施例提供的音频编码方法可以包括如下步骤:
131.501、获取音频信号的当前帧,当前帧包括高频带信号。
132.其中,音频编码装置执行的步骤501与前述实施例中步骤401相类似,此处不再赘述。
133.在音频编码装置执行步骤501之后,音频编码装置可以对当前帧的高频带信号进行编码,以获得当前帧的编码参数。高频带信号对应的高频带包括至少一个频率区域,本技术实施例中对于高频带包括的频率区域的个数不做限定。例如,至少一个频率区域包括当前频率区域,当前频率区域可以是至少一个频率区域中的某一个频率区域或者是至少一个频率区域中的任意一个频率区域,此处不做限定。
134.接下来以当前频率区域的高频带信号的编码过程进行示例说明,具体的,音频编码装置可以执行后续步骤502至步骤504。
135.502、根据当前频率区域的高频带信号获得当前频率区域的候选音调成分的信息。
136.在本技术实施例中,音频编码装置在获得当前频率区域的高频带信号之后,从该当前频域区域的高频带信号中提取得到当前频率区域的候选音调成分的信息。其中,候选音调成分的信息可以包括:候选音调成分的位置信息、数量信息、以及幅度信息或能量信息。该候选音调成分的信息需要进行后续步骤503的音调成分筛选之后,才能得到目标音调成分的信息。
137.其中,音频编码装置可以根据当前频率区域的高频带信号进行峰值搜索,直接将获得的当前频率区域的峰值信息作为当前频率区域的候选音调成分的信息,当前频率区域的峰值信息包括:所述当前频率区域的峰值数量信息、峰值位置信息、以及峰值能量信息或峰值幅度信息。具体地,可以根据当前频率区域的高频带信号,获取当前频率区域的高频带信号功率谱;根据当前频率区域(简称为当前区域)的高频带信号功率谱,搜索功率谱的峰值,将功率谱中峰值的数量作为当前区域的峰值数量信息,将功率谱中峰值对应的频点序号作为当前区域的峰值位置信息,将功率谱中峰值的幅度或能量作为当前区域的峰值幅度信息或峰值能量信息。也可以根据当前频率区域的高频带信号,获取当前频率区域的当前频点的功率谱比值,当前频点的功率谱比值为当前频点的功率谱的值与当前频率区域的功率谱的平均值的比值;根据当前频点的功率谱比值在当前频率区域进行峰值搜索,以获取当前频率区域的峰值的数量信息、峰值的位置信息、峰值的幅度信息或峰值的能量信息。其中,峰值的幅度信息或峰值的能量信息包括:峰值的功率谱比值,峰值的功率谱比值为峰值对应频点的功率谱的值与当前频率区域的功率谱的平均值的比值。当然,也可以采用其他方式进行峰值搜索,获得当前区域的峰值数量信息、峰值位置信息以及峰值幅度信息或峰值能量信息,本技术实施例不做限定。
138.在本技术的一些实施例中,候选音调成分的数量信息可以是峰值搜索得到的峰值数量信息,候选音调成分的位置信息可以是峰值搜索得到的峰值位置信息,候选音调成分的幅度信息可以是峰值搜索得到的峰值幅度信息,候选音调成分的能量信息可以是峰值是峰值搜索得到的峰值能量信息。
139.在本技术的一个实施例中,将当前频率区域的候选音调成分的位置信息和能量信息分别存储在peak_idx和peak_val数组中,将当前频率区域的候选音调成分的数量信息记
作peak_cnt。
140.其中,进行峰值搜索的高频带信号可以是频域信号,也可以是时域信号。
141.具体地,在一个实施方式中,峰值搜索具体可以根据当前频率区域的功率谱、能量谱或幅度谱中的至少一种进行。
142.503、对当前频率区域的候选音调成分的信息进行音调成分筛选,以获得当前频率区域的目标音调成分的信息。
143.在本技术实施例中,音频编码装置对当前频率区域的候选音调成分的信息进行音调成分筛选,在完成音调成分筛选之后,可以获得当前频率区域的目标音调成分的信息。
144.具体地,候选音调成分的信息包括候选音调成分的数量信息、位置信息以及幅度信息或能量信息,根据候选音调成分的数量信息、位置信息以及幅度信息或能量信息可以进行音调成分筛选,获得音调成分筛选后的候选音调成分的数量信息、位置信息以及幅度信息或能量信息;将音调成分筛选后的候选音调成分的数量信息、位置信息以及幅度信息或能量信息,作为当前频率区域的目标音调成分的数量信息、位置信息、幅度信息或能量信息。其中,音调成分筛选可以是合并处理、数量筛选、帧间连续性修正等处理中的一种或多种。本技术实施例对是否进行其他处理以及其他处理所包含种类及处理使用的方法不做限定。
145.504、根据当前频率区域的目标音调成分的信息获得当前频率区域的编码参数。
146.在本技术实施例中,音频编码装置可以根据当前频率区域的目标音调成分的信息,获得当前频率区域的编码参数。需要说明的是,此处得到的当前频率区域的编码参数与前述实施例中步骤402中得到的编码参数类似,区别在于,步骤402得到的是当前帧的编码参数,而步骤504中得到的当前帧中的当前频率区域的编码参数,通过与步骤504相类似的实现方式,可以得到当前帧中的所有频率区域的编码参数,当前帧中的所有频率区域的编码参数构成当前帧的编码参数。另外步骤504中得到的当前频率区域的编码参数可以称为第二编码参数。当前频率区域的第二编码参数包括当前频率区域的目标音调成分的位置数量参数、以及目标音调成分的幅度参数或能量参数,其中,位置数量参数用于指示高频带信号的目标音调成分的位置信息和数量信息,幅度参数用于指示高频带信号的目标音调成分的幅度信息,能量参数用于指示高频带信号的目标音调成分的能量信息。
147.505、对编码参数进行码流复用,以获得编码码流。
148.其中,前述实施例中音频编码装置通过步骤504获取到编码参数,最后对编码参数进行码流复用,以获得编码码流,该编码码流可以是载荷码流。载荷码流中可以携带音频信号的各个帧的具体信息。例如,可以携带上述各个帧的音调成分信息。该编码参数通过码流复用可以获得编码码流,在本技术实施例获得的编码码流中携带的目标音调成分的信息是经过音调成分筛选的。
149.音频编码装置将编码码流发送至音频解码装置,音频解码装置对该编码码流进行码流解复用,从而获取该编码参数,进而准确获取该音频信号的当前帧。
150.通过前述实施例对本技术的举例说明可知,本技术实施例中编码过程中包括针对候选音调成分的信息进行的音调成分筛选,编码参数用于表示经过音调成分筛选后获得的目标音调成分,该编码参数通过码流复用可以获得编码码流,在本技术实施例获得的编码码流中携带的目标音调成分的信息是经过音调成分筛选的,因此可以高效地利用有限的编
码比特数获得更好的音调成分编码效果,提升音频信号的编码质量。
151.接下来请参阅本技术提供的另一些实施例,本技术实施例的执行主体可以是上述音频编码装置或音频编码装置内部的核心编码器,如图6所示,本实施例的方法可以包括:
152.601、获取音频信号的当前帧,当前帧包括高频带信号。
153.其中,音频编码装置执行的步骤601与前述实施例中步骤401相类似,此处不再赘述。
154.在音频编码装置执行步骤601之后,音频编码装置可以对当前帧的高频带信号进行编码,以获得当前帧的编码参数,高频带信号对应的高频带包括至少一个频率区域,本技术实施例中对于高频带包括的频率区域的个数不做限定。例如,至少一个频率区域包括当前频率区域,当前频率区域可以是至少一个频率区域中的某一个频率区域或者是至少一个频率区域中的任意一个频率区域,此处不做限定。
155.接下来以当前频率区域的高频带信号的编码过程进行示例说明,具体的,音频编码装置可以执行后续步骤602至步骤605。
156.602、根据当前频率区域的高频带信号进行峰值搜索,以获得当前频率区域的峰值信息,当前频率区域的峰值信息包括:当前频率区域的峰值数量信息、峰值位置信息、以及峰值能量信息或峰值幅度信息。
157.在本技术实施例中,音频编码装置可以根据当前频率区域的高频带信号进行峰值搜索,获得当前频率区域的峰值信息。具体地,可以根据当前频率区域的高频带信号,获取当前频率区域的高频带信号功率谱;根据当前频率区域(简称为当前区域)的高频带信号功率谱,搜索功率谱的峰值,将功率谱中峰值的数量作为当前区域的峰值数量信息,将功率谱中峰值对应的频点序号作为当前区域的峰值位置信息,将功率谱中峰值的幅度或能量作为当前区域的峰值幅度信息或峰值能量信息。也可以根据当前频率区域的高频带信号,获取当前频率区域的当前频点的功率谱比值,当前频点的功率谱比值为当前频点的功率谱的值与当前频率区域的功率谱的平均值的比值;根据当前频点的功率谱比值在当前频率区域进行峰值搜索,以获取当前频率区域的峰值的数量信息、峰值的位置信息、峰值的幅度信息或峰值的能量信息。其中,峰值的幅度信息或峰值的能量信息包括:峰值的功率谱比值,其中,峰值的功率谱比值为峰值对应频点的功率谱的值与当前频率区域的功率谱的平均值的比值。当然,也可以采用其他方式进行峰值搜索,获得当前区域的峰值数量信息、峰值位置信息以及峰值幅度信息或峰值能量信息,本技术实施例不做限定。
158.在本技术的一个实施例中,峰值搜索具体可以根据当前频率区域的功率谱、能量谱或幅度谱中的至少一种进行。
159.603、对当前频率区域的峰值信息进行峰值筛选,以获得当前频率区域的候选音调成分的信息。
160.其中,音频编码装置在获取到当前频率区域的峰值信息之后,针对当前频率区域的峰值信息进行峰值筛选,可以得到当前频率区域的候选音调成分的信息。峰值筛选的具体方式可以是根据当前频率区域的频带扩展的频谱保留标志信息和当前频率区域的峰值数量信息、峰值位置信息以及峰值幅度信息或峰值能量信息,获得当前频率区域筛选后的峰值数量信息、峰值位置信息以及峰值幅度信息或峰值能量信息。当前频率区域筛选后的峰值数量信息、峰值位置信息以及峰值幅度信息或峰值能量信息作为当前频率区域的候选
音调成分的信息。其中,峰值幅度信息或峰值能量信息可以包括峰值的能量比,或者峰值的功率谱比值。
161.在本技术的一些实施例中,候选音调成分的数量信息可以是峰值筛选后的峰值数量信息,候选音调成分的位置信息可以是峰值筛选后的峰值位置信息,候选音调成分的幅度信息可以是峰值筛选后的峰值幅度信息,候选音调成分的能量信息可以是峰值筛选后的峰值能量信息。
162.其中,音频编码装置可以通过多种方式获取到高频带信号中每个频点的频谱保留标志的取值,接下来进行详细说明。
163.在本技术的一些实施例中,至少一个频率区域中的当前频率区域中不属于频带扩展编码的频率范围内的第一频点的频谱保留标志的值为第一预设值;
164.如果当前频率区域中属于频带扩展的频率范围内的第二频点对应的频带扩展编码前的频谱值与频带扩展编码后的频谱值满足预设条件,则第二频点的频谱保留标志的值为第二预设值,如果第二频点对应的频带扩展编码前的频谱值与频带扩展编码后的频谱值不满足预设条件,则第二频点的频谱保留标志的值为第三预设值。
165.其中,音频编码装置首先确定当前频率区域中的频点是否属于频带扩展编码的频率范围内,例如定义第一频点为当前频率区域中不属于频带扩展编码的频率范围内的频点,定义第二频点为当前频率区域中属于频带扩展编码的频率范围内的频点。则第一频点的频谱保留标志的值为第一预设值。第二频点的频谱保留标志的值具有两种,例如分别为第二预设值和第三预设值。具体的,第二频点对应的频带扩展编码前的频谱值与频带扩展编码后的频谱值满足预设条件时,第二频点的频谱保留标志的值为第二预设值,第二频点对应的频带扩展编码前的频谱值与频带扩展编码后的频谱值不满足预设条件时,第二频点的频谱保留标志的值为第三预设值。对于预设条件的实现方式有多种,此处不做限定,例如预设条件是针对频带扩展编码前的频谱值与频带扩展编码后的频谱值设置的条件,具体可以结合应用场景确定。
166.604、对当前频率区域的候选音调成分的信息进行音调成分筛选,以获得当前频率区域的目标音调成分的信息。
167.在本技术实施例中,音频编码装置获取的当前频率区域的候选音调成分的信息包括:候选音调成分的位置信息、数量信息、以及幅度信息或能量信息。针对当前频率区域的候选音调成分的信息进行音调成分筛选,可以获得当前频率区域的目标音调成分的信息。
168.具体地,候选音调成分的信息包括候选音调成分的数量信息、位置信息以及幅度信息或能量信息,根据候选音调成分的数量信息、位置信息以及幅度信息或能量信息可以进行音调成分筛选,获得音调成分筛选后的候选音调成分的数量信息、位置信息以及幅度信息或能量信息;将音调成分筛选后的候选音调成分的数量信息、位置信息以及幅度信息或能量信息,作为当前频率区域的目标音调成分的数量信息、位置信息、幅度信息或能量信息。其中,音调成分筛选可以是合并处理、数量筛选、帧间连续性修正等处理中的一种或多种。本技术实施例对是否进行其他处理以及其他处理所包含种类及处理使用的方法不做限定。
169.605、根据当前频率区域的目标音调成分的信息获得当前频率区域的编码参数。
170.在本技术实施例中,音频编码装置可以根据当前频率区域的目标音调成分的信
息,获得当前频率区域的编码参数,需要说明的是,此处得到的当前频率区域的编码参数与前述实施例中步骤402中得到的编码参数类似,区别在于,步骤402得到的是当前帧的编码参数,而步骤605中得到的当前帧中的当前频率区域的编码参数,通过与步骤605相类似的实现方式,可以得到当前帧中的所有频率区域的编码参数,当前帧中的所有频率区域的编码参数。另外步骤605中得到的当前频率区域的编码参数可以称为第二编码参数。当前频率区域的第二编码参数包括当前频率区域的目标音调成分的位置数量参数、以及目标音调成分的幅度参数或能量参数,位置数量参数用于指示高频带信号的目标音调成分的位置信息和数量信息,幅度参数用于指示高频带信号的目标音调成分的幅度信息,能量参数用于指示高频带信号的目标音调成分的能量信息。
171.606、对编码参数进行码流复用,以获得编码码流。
172.其中,音频编码装置对编码参数进行码流复用,以获得编码码流,例如该编码码流可以是载荷码流。载荷码流中可以携带音频信号的各个帧的具体信息。例如,可以携带上述各个帧的音调成分信息。该编码参数通过码流复用可以获得编码码流,在本技术实施例获得的编码码流中携带的目标音调成分的信息是经过音调成分筛选的。
173.音频编码装置将编码码流发送至音频解码装置,音频解码装置对该编码码流进行码流解复用,从而获取该编码参数,进而准确获取该音频信号的当前帧。
174.通过前述实施例对本技术的举例说明可知,本技术实施例中编码过程中包括针对当前频率区域的峰值信息的峰值筛选,以及针对候选音调成分的信息进行的音调成分筛选,编码参数用于表示经过音调成分筛选后获得的目标音调成分,该编码参数通过码流复用可以获得编码码流,在本技术实施例获得的编码码流中携带的目标音调成分的信息是经过音调成分筛选的,因此可以高效地利用有限的编码比特数获得更好的音调成分编码效果,提升音频信号的编码质量。
175.在本技术的一些实施例中,高频带信号对应的高频带包括至少一个频率区域,本技术实施例中对于高频带包括的频率区域的个数不做限定。例如,至少一个频率区域包括当前频率区域,当前频率区域可以是至少一个频率区域中的某一个频率区域或者是至少一个频率区域中的任意一个频率区域,此处不做限定。
176.接下来以当前频率区域的高频带信号的编码过程进行示例说明,在音频编码装置获取到当前频率区域的候选音调成分的信息之后,音频编码装置可以执行前述实施例中的步骤503或者步骤604,对当前频率区域的候选音调成分的信息进行音调成分筛选,以获得当前频率区域的目标音调成分的信息。
177.本技术实施例中当前频率区域可以包括一个或多个子带,对于当前频率区域包括的子带个数不做限定。例如,当前频率区域包括当前子带,当前子带可以是当前频率区域中的某一个子带或者是当前频率区域中的任意一个子带,此处不做限定。
178.接下来以当前子带的音调成分筛选的过程进行示例说明。本技术实施例中,音调成分筛选可以包括如下至少一种:候选音调成分的合并处理、帧间连续性修正处理和数量筛选。
179.具体的,如图7所示,以音调成分筛选包括合并处理为例进行说明,音频编码装置对当前频率区域的候选音调成分的信息进行音调成分筛选,以获得当前频率区域的目标音调成分的信息,包括:
180.701、对当前频率区域中子带序号相同的候选音调成分进行合并处理,以获得当前频率区域的合并处理后的候选音调成分的信息。
181.其中,音频编码装置可以获得当前频率区域中的所有候选音调成分对应的子带序号,对当前频率区域中子带序号相同的候选音调成分进行合并处理,例如当前频率区域中两个候选音调成分均属于同一个子带,则这两个候选音调成分可以合并为当前频率区域中的一个合并处理后的候选音调成分。对于当前频率区域中只包含一个候选音调成分或没有候选音调成分的子带,无需进行合并处理。针对当前频率区域完成合并处理之后,得到合并处理后的候选音调成分的信息。不限定的是,本技术实施例中,当前频率区域中三个或者更多个候选音调成分属于同一个子带,则这三个或更多个候选音调成分可以合并为当前频率区域中的一个候选音调成分。
182.在本技术的一些实施例中,当前频率区域的每个子带具有子带序号,子带序号通过当前频率区域的候选音调成分的位置信息和当前频率区域的子带宽度确定。例如根据当前频率区域的子带宽度和当前频率区域的候选音调成分的位置信息,计算获得当前频率区域中的每个候选音调成分对应的子带序号。
183.在本技术的一些实施例中,当前频率区域的子带宽度是预设的第一数值,或当前频率区域的子带宽度根据高频带信号对应的高频带包括的当前频率区域的序号确定。
184.其中,当前频率区域的子带宽度的取值有多种,例如当前频率区域的子带宽度为第一数值,即当前频率区域的子带宽度为固定的值。或者当前频率区域的子带宽度通过计算得到,例如当前频率区域的子带宽度根据高频带信号对应的高频带包括的当前频率区域的序号确定,根据当前频率区域的不同进行自适应选择,子带宽度可以是一个子带所包含的频点个数,不同频率区域的子带宽度可以不同。
185.在本技术的一些实施例中,步骤701对当前频率区域中子带序号相同候选音调成分进行合并处理,以获得合并处理后的候选音调成分的信息,具体可以包括如下步骤:
186.若当前频率区域的候选音调成分的数量大于等于2,确定当前频率区域中位置相邻的两个候选音调成分为当前频率区域中的第一候选音调成分和第二候选音调成分;
187.分别获取到第一候选音调成分对应的第一子带序号,第二候选音调成分对应的第二子带序号,若第一子带序号和第二子带序号相同,对第一候选音调成分和第二候选音调成分进行合并处理,以获得第一合并候选音调成分的信息。第一合并候选音调成分对应的子带序号等于第一子带序号和第二子带序号。
188.进一步的,若当前频率区域的候选音调成分中还存在与第二候选音调成分位置相邻的第三候选音调成分,则获取第三候选音调成分对应的第三子带序号,若第三子带序号和第一合并候选音调成分对应的子带序号相同,则对第一合并候选音调成分和第三候选音调成分进行合并处理,以获得当前频率区域合并处理后的候选音调成分的信息。
189.若当前频率区域的候选音调成分不存在与第二候选音调成分相邻的第三候选音调成分,则第一合并候选音调成分即为合并处理后的候选音调成分的信息。
190.可以理解的是,若当前频率区域中还存在与第三候选音调成分相邻的第四候选音调成分,同样可以基于上述方式在子带序号相同时进行合并,以得到当前频率区域的合并处理后的候选音调成分的信息。
191.在本技术的一些实施例中,至少一个子带包括当前子带;
192.当前频率区域的合并处理后的候选音调成分的信息,包括:当前子带的合并处理后的候选音调成分的位置信息、当前子带的合并处理后的候选音调成分的幅度信息或能量信息;
193.其中,当前子带的合并处理后的候选音调成分的位置信息包括:当前子带的合并处理前的候选音调成分中的一个候选音调成分的位置信息;
194.当前子带的合并处理后的候选音调成分的幅度信息或能量信息包括:当前子带的合并处理前的候选音调成分中的一个候选音调成分的幅度信息或能量信息,或者当前子带的合并处理后的候选音调成分的幅度信息或能量信息是根据当前子带的合并处理前的候选音调成分的幅度信息或能量信息计算获得的。
195.具体的,至少一个子带包括当前子带,当前子带的合并处理后的候选音调成分可以是当前子带的候选音调成分中的一个候选音调成分。即当前子带的候选音调成分中的一个候选音调成分的信息是当前子带的合并处理后的候选音调成分。具体的,当前子带的合并处理后的候选的位置信息包括当前子带的候选音调成分中的一个候选音调成分的位置信息,当前子带的合并处理后的候选音调成分的幅度信息或能量信息包括当前子带的候选音调成分中的一个候选音调成分的幅度信息或能量信息,或者当前子带的合并处理后的候选音调成分的幅度信息或能量信息是根据当前子带的候选音调成分的幅度信息或能量信息计算获得的。对于计算的方式不做限定,例如可以是取当前子带的多个候选音调成分的幅度信息或能量信息的平均值作为当前子带的合并处理后的候选的幅度信息或能量信息,又如,可以是取当前子带的多个候选音调成分的幅度信息或能量信息之和作为当前子带的合并处理后的候选的幅度信息或能量信息,又如,计算的方式还可以是对当前子带的多个候选音调成分的幅度信息或能量信息进行加权平均,此处不做限定。本技术实施例中,经过合并处理,通过当前子带的候选音调成分的信息可以得到当前子带的合并处理后的候选音调成分的信息。
196.在本技术的一些实施例中,当前频率区域的合并处理后的候选音调成分的信息,还包括:当前频率区域的合并处理后的候选音调成分的数量信息;
197.当前频率区域的合并处理后的候选音调成分的数量信息和所述当前频率区域中具有候选音调成分的子带的数量信息相同。其中,当前频率区域中具有候选音调成分的子带是指当前频率区域中合并处理前包含候选音调成分的子带。本技术实施例中,经过合并处理,根据当前频率区域的候选音调成分的信息,可以得到当前频率区域的合并处理后的候选音调成分的信息。
198.在本技术的一些实施例中,步骤701对当前频率区域中子带序号相同候选音调成分进行合并处理之前,本技术实施例提供的音频编码方法还包括如下步骤:
199.b1、根据当前频率区域的候选音调成分的位置信息,对当前频率区域的候选音调成分按照位置递增或位置递减进行排列,以获得当前频率区域中位置排列后的候选音调成分。
200.具体的,在前述执行步骤b1的情况下,前述步骤701对当前频率区域中子带序号相同候选音调成分进行合并处理,具体可以包括如下步骤:
201.根据当前频率区域中位置排列后的候选音调成分,对当前频率区域中子带序号相同候选音调成分进行合并处理。
202.其中,合并处理可以是根据当前频率区域的候选音调成分的位置信息,按位置信息递增或递减对候选音调成分进行排列;对于按位置信息递增或递减排列后的候选音调成分,计算位置信息相邻的两个候选音调成分对应的子带序号;若位置相邻的两个候选音调成分对应的子带序号相同,则对两个候选音调成分进行合并处理,获得当前频率区域合并后的候选音调成分的数量信息,位置信息以及能量或幅度信息。子带序号由候选音调成分的位置信息和当前频率区域的子带宽度确定。当前频率区域的子带宽度可以是预设值,或根据频率区域不同进行自适应选择。子带宽度可以是一个子带所包含的频点个数。不同频率区域的子带宽度可以不同。合并后的候选音调成分的位置信息可以是位置相邻的两个候选音调成分中任意一个的位置信息;合并后的候选音调成分的能量或幅度信息可以是位置相邻的两个候选音调成分中任意一个的能量或幅度信息,或者根据位置相邻的两个候选音调成分的能量或幅度信息计算得到。
203.702、根据当前频率区域的合并处理后的候选音调成分的信息获得当前频率区域的目标音调成分的信息。
204.其中,音频编码装置执行步骤701得到当前频率区域的合并处理后的候选音调成分的信息之后,可以根据当前频率区域的合并处理后的候选音调成分的信息获得当前频率区域的目标音调成分的信息。具体的,当前频率区域的合并处理后的候选音调成分的信息和目标音调成分的信息之间的关联关系有多种实现方式。
205.在本技术的一些实施例中,直接将合并处理后的候选音调成分的信息作为目标音调成分的信息。
206.在本技术的一些实施例中,步骤702根据当前频率区域的合并处理后的候选音调成分的信息获得当前频率区域的目标音调成分的信息包括:
207.c1、根据当前频率区域的合并处理后的候选音调成分的信息和当前频率区域中可以编码的最大音调成分数量信息,获得当前频率区域的目标音调成分的信息。
208.其中,音调成分筛选可以包括数量筛选处理,音频编码装置可以根据当前频率区域中可以编码的最大音调成分数量信息,对步骤701中得到的合并处理后的候选音调成分的信息进行数量筛选处理,当前频率区域中可以编码的最大音调成分数量信息是指当前频率区域中能够用于编码的最大音调成分数量,当前频率区域中可以编码的最大音调成分数量信息可以设定为预设的第二数值,或根据编码速率进行选择得到。根据合并处理后的候选音调成分的信息和当前频率区域中可以编码的最大音调成分数量信息进行数量筛选之后,得到当前频率区域的数量筛选后的候选音调成分的信息,则当前频率区域的数量筛选后的候选音调成分的信息是当前频率区域的目标音调成分的信息。
209.本技术实施例中音频编码装置根据当前频率区域中可以编码的最大音调成分数量信息对合并处理后的候选音调成分的信息进行数量筛选处理,从而可以获得当前频率区域的数量筛选后的候选音调成分的信息,通过数量筛选处理,可以减少当前频率区域中的候选音调成分的数量,从而提高音频信号的编码效率。
210.进一步的,在本技术的一些实施例中,步骤c1根据当前频率区域的合并处理后的候选音调成分的信息和当前频率区域中可以编码的最大音调成分数量信息,获得当前频率区域的目标音调成分的信息包括:
211.c11、根据当前频率区域的合并处理后的候选音调成分的信息,对当前频率区域的
合并处理后的候选音调成分按照能量信息或幅度信息进行排列,以获得能量信息或幅度信息排列后的候选音调成分的信息。
212.其中,音频编码装置在获取到当前频率区域的合并处理后的候选音调成分的信息之后,可以先根据当前频率区域的候选音调成分的能量信息或幅度信息,按能量信息或幅度信息递增或递减对候选音调成分进行排列。
213.c12、根据能量信息或幅度信息排列后的候选音调成分的信息和当前频率区域中可以编码的最大音调成分数量信息,获得当前频率区域的目标音调成分的信息。
214.其中,按位置信息递增或递减对候选音调成分进行排列之后,步骤c11中得到的能量信息或幅度信息排列后的候选音调成分的信息进行数量筛选处理,当前频率区域中可以编码的最大音调成分数量信息是指当前频率区域中能够用于编码的最大音调成分数量,当前频率区域中可以编码的最大音调成分数量信息可以设定为预设的第二数值,或根据编码速率进行选择得到。根据能量信息或幅度信息排列后的候选音调成分的信息和当前频率区域中可以编码的最大音调成分数量信息进行数量筛选之后,得到当前频率区域的数量筛选后的候选音调成分的信息,则当前频率区域的数量筛选后的候选音调成分的信息是当前频率区域的目标音调成分的信息。
215.在本技术的一些实施例中,步骤702根据当前频率区域的合并处理后的候选音调成分的信息获得当前频率区域的目标音调成分的信息包括:
216.d1、根据当前频率区域的合并处理后的候选音调成分的信息和当前频率区域中可以编码的最大音调成分数量信息,获得当前频率区域的数量筛选后的候选音调成分的信息。
217.其中,音调成分筛选可以包括数量筛选处理,音频编码装置可以根据当前频率区域中可以编码的最大音调成分数量信息,对步骤701中得到的合并处理后的候选音调成分的信息进行数量筛选处理,当前频率区域中可以编码的最大音调成分数量信息是指当前频率区域中能够用于编码的最大音调成分数量,当前频率区域中可以编码的最大音调成分数量信息可以设定为预设的第二数值,或根据编码速率进行选择得到。
218.d2、根据当前频率区域的数量筛选后的候选音调成分的信息,获得当前频率区域的目标音调成分的信息。
219.本技术实施例中音频编码装置根据当前频率区域中可以编码的最大音调成分数量信息对合并处理后的候选音调成分的信息进行数量筛选处理,从而可以获得当前频率区域的数量筛选后的候选音调成分的信息,通过数量筛选处理,可以减少当前频率区域中的候选音调成分的数量,从而提高音频信号的编码效率。
220.进一步的在本技术的一些实施例中,前述的步骤d1根据当前频率区域的合并处理后的候选音调成分的信息和当前频率区域中可以编码的最大音调成分数量信息,获得当前帧的当前频率区域的数量筛选后的候选音调成分的信息包括:
221.d11、根据当前频率区域的合并处理后的候选音调成分的信息,对当前频率区域的合并处理后的候选音调成分按照能量信息或幅度信息进行排列,以获得能量信息或幅度信息排列后的候选音调成分的信息。
222.在进行数量筛选处理之前,音频编码装置可以根据合并处理后的候选音调成分的信息,对合并处理后的候选音调成分按照能量信息或幅度信息进行排列,以获得能量信息
或幅度信息排列后的候选音调成分的信息。
223.d12、根据能量信息或幅度信息排列后的候选音调成分的信息和当前频率区域中可以编码的最大音调成分数量信息,获得当前帧的当前频率区域的数量筛选后的候选音调成分的信息。
224.音频编码装置可以对步骤d11中得到能量信息或幅度信息排列后的候选音调成分的信息进行数量筛选处理,在进行数量筛选处理时还需要获取当前频率区域中可以编码的最大音调成分数量信息,当前频率区域中可以编码的最大音调成分数量信息是指当前频率区域中能够用于编码的最大音调成分数量,当前频率区域中可以编码的最大音调成分数量信息可以设定为预设的第二数值,或根据编码速率进行选择得到。
225.进一步的,根据当前频率区域的候选音调成分的数量信息、位置信息和能量或幅度信息,以及当前频率区域中可以编码的最大音调成分数量信息,确定当前频率区域的数量筛选后的音调成分的数量信息、位置信息以及幅度或能量信息,可以是选择当前频率区域中能量信息或幅度信息排列后的候选音调成分中能量或幅度信息最大的x个候选音调成分,其对应的位置信息和能量或幅度信息,作为当前频率区域的数量筛选后的音调成分的位置信息和能量或幅度信息。x为当前频率区域的数量筛选后的音调成分的数量信息。其中,x小于等于当前频率区域中可以编码的最大音调成分数量信息。
226.在本技术的一些实施例中,步骤d2根据当前频率区域的数量筛选后的候选音调成分的信息,获得当前频率区域的目标音调成分的信息,包括:
227.d21、根据当前帧的当前频率区域的数量筛选后的候选音调成分的位置信息,对当前帧的当前频率区域的数量筛选后的候选音调成分按照位置递增或位置递减进行排列,以获得当前帧的当前频率区域的数量筛选后的位置排列后的候选音调成分。
228.具体的,音频编码装置首先对当前帧的当前频率区域的数量筛选后的候选音调成分按照位置递增或位置递减进行排列,以获得当前帧的当前频率区域中数量筛选后的位置排列后的候选音调成分。
229.d22、根据当前帧的当前频率区域的数量筛选后的位置排列后的候选音调成分,获得当前帧的当前频率区域的数量筛选后的位置排序后的候选音调成分对应的子带序号。
230.其中,音频编码装置可以获得当前帧的当前频率区域的数量筛选后的位置排序后的候选音调成分对应的子带序号,子带序号由候选音调成分的位置信息和当前频率区域的子带宽度确定。当前频率区域的子带宽度可以是预设值,或根据频率区域不同进行自适应选择。子带宽度可以是一个子带所包含的频点个数。不同频率区域的子带宽度可以不同。
231.d23、获取当前帧的前一帧的当前频率区域的数量筛选后的位置排序后的候选音调成分对应的子带序号。
232.其中,音频编码装置可以获得当前帧的前一帧的当前频率区域的数量筛选后的位置排序后的候选音调成分对应的子带序号,子带序号由候选音调成分的位置信息和当前频率区域的子带宽度确定。当前频率区域的子带宽度可以是预设值,或根据频率区域不同进行自适应选择。当前帧的前一帧是指位于当前帧的位置之前的一个帧,例如当前帧为第m个帧,则前一帧可以是第m-1个帧,m的取值为大于或等于0的整数。
233.d24、若当前帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息和前一帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的
位置信息满足预设条件,且当前帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分对应的子带序号和前一帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分对应的子带序号不同,则对当前帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息进行修正,以获得当前频率区域的目标音调成分的信息,第n个候选音调成分为当前频率区域中的数量筛选后的位置排序后的任意一个候选音调成分。
234.其中,音频编码装置可以对当前帧和前一帧的候选音调成分的位置信息进行判断,以确定当前帧的候选音调成分的位置信息是否需要修正,并且设置了预设条件。例如,以当前帧和前一帧的第n个候选音调成分进行示例说明,当前帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息和前一帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息满足预设条件,且当前帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分对应的子带序号和前一帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分对应的子带序号不同,则对当前帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息进行修正,以获得当前频率区域的目标音调成分的信息,第n个候选音调成分为当前频率区域中的数量筛选后的位置排序后的任意一个候选音调成分,例如n可以是大于或等于0的整数。
235.进一步的,在上述步骤d24中,对当前帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息进行修正之后,可以直接得到当前频率区域的目标音调成分的信息。或者,对当前帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息进行修正之后,得到当前频率区域的修正后的候选音调成分的信息,再根据修正后的候选音调成分的信息,获得当前频率区域的目标音调成分的信息。例如,根据获得的当前频率区域的目标音调成分的信息,对当前频率区域的修正后的候选音调成分的幅度信息或者能量信息进行加权调整,获得当前频率区域的目标音调成分的信息。
236.在本技术的一些实施例中,预设条件包括:当前帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息和前一帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息之间的差值小于或等于预设阈值。
237.其中,预设阈值的取值大小不做限定,本技术实施例中预设条件的设置有多种实现方式,上述举例只是一种可选方案,基于上述的预设条件还可以设置其他的预设条件,例如当前帧的当前频率区域中的第n个候选音调成分的位置信息和前一帧的当前频率区域中的第n个候选音调成分的位置信息之间的比值小于或等于另一个预设阈值,对于另一个预设阈值的取值方式不做限定。
238.在本技术的一些实施例中,对当前帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息进行修正,包括:
239.将当前帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息修正为前一帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息。
240.举例说明如下,对频率区域中当前帧第n个候选音调成分的位置信息进行修正,具体地可以是将当前帧的当前频率区域中的第n个候选音调成分的位置信息修正为与前一帧的当前频率区域中的第n个候选音调成分相同。根据修正后的候选音调成分的数量信息,位
置信息和能量或幅度信息,确定当前频率区域的目标音调成分的数量信息、位置信息以及幅度或能量信息。
241.在本技术实施例中,音频编码装置在进行上述步骤d24中的帧间连续性修正处理之后,可以得到当前频率区域的目标音调成分的信息,通过上述帧间连续性修正处理,考虑了相邻帧之间的音调成分的连续性以及音调成分的子带分布,高效地利用有限的编码比特数获得更好的音调成分编码效果,提升编码质量。
242.通过前述实施例对本技术的举例说明可知,本技术实施例中编码过程中包括针对候选音调成分的信息进行的音调成分筛选,音调成分筛选可以包括如下至少一种:合并处理、帧间连续性修正处理和数量筛选。通过音调成分筛选后的高频带信号可以生成编码参数,编码参数用于表示经过音调成分筛选后获得的目标音调成分,该编码参数通过码流复用可以获得编码码流,在本技术实施例获得的编码码流中携带的目标音调成分的信息是经过音调成分筛选的,因此可以高效地利用有限的编码比特数获得更好的音调成分编码效果,提升音频信号的编码质量。
243.本技术的一些实施例中,当前频率区域包括至少一个子带,至少一个子带包括当前子带,音频编码装置在进行音调成分筛选时,还可以不执行步骤701和步骤702,而是通过如下步骤e1进行合并处理。具体的,前述实施例中的步骤503或者步骤604,对当前频率区域的候选音调成分的信息进行音调成分筛选,以获得当前频率区域的目标音调成分的信息,包括:
244.e1、对当前频率区域中子带序号相同候选音调成分进行合并处理,以获得当前频率区域的目标音调成分的信息。
245.其中,音频编码装置可以获得当前频率区域中的所有候选音调成分对应的子带序号,对当前频率区域中子带序号相同的候选音调成分进行合并处理,例如当前频率区域中两个候选音调成分的子带序号相同,则这两个候选音调成分可以合并为当前频率区域中的一个合并后的候选音调成分。针对当前频率区域完成合并处理之后,得到当前频率区域的目标音调成分的信息。
246.在本技术的一些实施例中,至少一个子带包括当前子带,当前子带的目标音调成分可以是当前子带的候选音调成分中的一个候选音调成分。具体的,当前子带的目标音调成分的位置信息包括当前子带的候选音调成分中的一个候选音调成分的位置信息,当前子带的目标音调成分的幅度信息或能量信息包括当前子带的候选音调成分中的一个候选音调成分的幅度信息或能量信息,或者当前子带的目标音调成分的幅度信息或能量信息是根据当前子带的候选音调成分的幅度信息或能量信息计算获得的。对于计算的方式不做限定,例如可以是取当前子带的多个候选音调成分的幅度信息或能量信息的平均值作为当前子带的目标音调成分的幅度信息或能量信息,又如,可以是取当前子带的多个候选音调成分的幅度信息或能量信息之和作为当前子带的合并处理后的候选的幅度信息或能量信息。又如,计算的方式还可以是对当前子带的多个候选音调成分的幅度信息或能量信息进行加权平均,此处不做限定。本技术实施例中,经过合并处理,通过当前子带的候选音调成分的信息可以得到当前子带的目标音调成分的信息。
247.本技术的一些实施例中,音频编码装置在进行音调成分筛选时,还可以不执行步骤701和步骤702,而是通过如下步骤进行音调成分筛选。具体的,如图8所示,以音调成分筛
选包括帧间连续性修正处理为例进行说明,前述实施例中的步骤503或者步骤604,音频编码装置对当前频率区域的候选音调成分的信息进行音调成分筛选,以获得当前频率区域的目标音调成分的信息,包括:
248.801、根据当前帧的当前频率区域中的候选音调成分的位置信息获得当前帧的当前频率区域中的候选音调成分对应的子带序号。
249.在本技术实施例中,音频编码装置首先获取当前帧的当前频率区域中的候选音调成分对应的子带序号,后续音调成分筛选过程可以使用候选音调成分对应的子带序号来实现。
250.其中,音频编码装置可以获得当前帧的当前频率区域的位置排序后的候选音调成分对应的子带序号,子带序号由候选音调成分的位置信息和当前频率区域的子带宽度确定。当前频率区域的子带宽度可以是预设值,或根据频率区域不同进行自适应选择。子带宽度可以是一个子带所包含的频点个数。不同频率区域的子带宽度可以不同。
251.进一步的,在本技术的一些实施例中,上述步骤801根据当前帧的当前频率区域中的候选音调成分的位置信息获得当前帧的当前频率区域中的候选音调成分对应的子带序号包括:
252.f1、根据当前帧的当前频率区域的候选音调成分的位置信息,对当前帧的当前频率区域中的候选音调成分按照位置递增或位置递减进行排列,以获得当前帧的当前频率区域中位置排列后的候选音调成分。
253.具体的,音频编码装置获取当前帧的当前频率区域的候选音调成分的位置信息,然后按照位置递增或位置递减对当前频率区域的候选音调成分进行排列,以获得当前帧的当前频率区域中位置排列后的候选音调成分。
254.f2、根据当前频率区域中位置排列后的候选音调成分,获取当前帧的当前频率区域中的候选音调成分对应的子带序号。
255.其中,音频编码装置在完成位置排列之后,确定当前频率区域中位置排列后的候选音调成分,由于在步骤f1中进行了位置排序,因此可以快速的获取当前帧的当前频率区域中的候选音调成分对应的子带序号。
256.802、获取当前帧的前一帧的当前频率区域中的候选音调成分对应的子带序号。
257.其中,音频编码装置可以获得当前帧的前一帧的当前频率区域的位置排序后的候选音调成分对应的子带序号,子带序号由候选音调成分的位置信息和当前频率区域的子带宽度确定。当前频率区域的子带宽度可以是预设值,或根据频率区域不同进行自适应选择。当前帧的前一帧是指位于当前帧的位置之前的一个帧,例如当前帧为第m个帧,则前一帧可以是第m-1个帧,m的取值为大于或等于0的整数。
258.803、若当前帧的当前频率区域的第n个候选音调成分的位置信息和前一帧的当前频率区域的第n个候选音调成分的位置信息满足预设条件,且当前帧的当前频率区域的第n个候选音调成分对应的子带序号和前一帧的当前频率区域的第n个候选音调成分对应的子带序号不同,则对当前帧的当前频率区域的第n个候选音调成分的位置信息进行修正,以获得当前频率区域的目标音调成分的信息,第n个候选音调成分为当前频率区域中的任意一个候选音调成分。
259.其中,音频编码装置可以对当前帧和前一帧中候选音调成分的位置信息进行判
断,以确定当前帧的候选音调成分的位置信息是否需要修正,并且设置了预设条件。例如,以当前帧和前一帧中的第n个候选音调成分进行示例说明,当前帧的当前频率区域的位置排序后的第n个候选音调成分的位置信息和前一帧的当前频率区域的位置排序后的第n个候选音调成分的位置信息满足预设条件,且当前帧的当前频率区域的位置排序后的第n个候选音调成分对应的子带序号和前一帧的当前频率区域的位置排序后的第n个候选音调成分对应的子带序号不同,则对当前帧的当前频率区域的位置排序后的第n个候选音调成分的位置信息进行修正,以获得当前频率区域的目标音调成分的信息,第n个候选音调成分为当前频率区域中的任意一个候选音调成分,例如n可以是大于或等于0的整数。
260.在本技术的一些实施例中,上述步骤803中的对当前帧的当前频率区域中的第n个候选音调成分的位置信息进行修正,包括:
261.将当前帧的当前频率区域的第n个候选音调成分的位置信息修正为前一帧的当前频率区域中的第n个候选音调成分的位置信息。
262.举例说明如下,对频率区域中当前帧第n个候选音调成分的位置信息进行修正,具体地可以是将当前帧的当前频率区域中的第n个候选音调成分的位置信息修正为与前一帧的当前频率区域中的第n个候选音调成分相同。根据修正后的候选音调成分的数量信息,位置信息和能量或幅度信息,确定当前频率区域的目标音调成分的数量信息、位置信息以及幅度或能量信息。
263.在本技术的一些实施例中,上述步骤803中的预设条件包括:当前帧的当前频率区域中的第n个候选音调成分的位置信息和前一帧的当前频率区域中的第n个候选音调成分的位置信息之间的差值小于或等于预设阈值。其中,预设阈值的取值大小不做限定,本技术实施例中预设条件的设置有多种实现方式,上述举例只是一种可选方案,基于上述的预设条件还可以设置其他的预设条件,例如当前帧的当前频率区域中的第n个候选音调成分的位置信息和前一帧的当前频率区域中的第n个候选音调成分的位置信息之间的比值小于或等于另一个预设阈值,对于另一个预设阈值的取值方式不做限定。
264.进一步的,在上述步骤803中,对当前帧的当前频率区域的的第n个候选音调成分的位置信息进行修正之后,可以直接得到当前频率区域的目标音调成分的信息。或者,对当前帧的当前频率区域的第n个候选音调成分的位置信息进行修正之后,得到当前频率区域的修正后的候选音调成分的信息,再根据修正后的候选音调成分的信息,获得当前频率区域的目标音调成分的信息。
265.在本技术实施例中,音频编码装置根据修正后的候选音调成分的信息,获得当前频率区域的目标音调成分的信息。通过帧间连续性修正处理,考虑了相邻帧之间的音调成分的连续性音以及音调成分的子带分布,高效地利用有限的编码比特数获得更好的音调成分编码效果,提升编码质量。
266.通过前述实施例对本技术的举例说明可知,本技术实施例中编码过程中包括针对候选音调成分的信息进行的音调成分筛选,音调成分筛选可以包括帧间连续性修正处理。通过音调成分筛选后的高频带信号可以生成编码参数,编码参数用于表示经过音调成分筛选后获得的目标音调成分,该编码参数通过码流复用可以获得编码码流,在本技术实施例获得的编码码流中携带的目标音调成分的信息是经过音调成分筛选的,因此可以高效地利用有限的编码比特数获得更好的音调成分编码效果,提升音频信号的编码质量。
267.在本技术的另一些实施例中,音调成分筛选还可以包括数量筛选处理,音频编码装置对当前频率区域的候选音调成分的信息进行音调成分筛选,以获得当前频率区域的目标音调成分的信息,包括:
268.g1、根据当前频率区域的候选音调成分的信息和当前频率区域中可以编码的最大音调成分数量信息,获得当前频率区域的目标音调成分的信息。
269.其中,音调成分筛选可以包括数量筛选处理,音频编码装置可以对当前频率区域的候选音调成分的信息进行数量筛选处理,在进行数量筛选处理时还需要获取当前频率区域中可以编码的最大音调成分数量信息,当前频率区域中可以编码的最大音调成分数量信息是指当前频率区域中能够用于编码的最大音调成分数量。
270.在本技术的一些实施例中,当前频率区域中可以编码的最大音调成分数量信息包括预设的第二数值,或当前频率区域中可以编码的最大音调成分数量信息根据当前帧的编码速率确定。
271.其中,当前频率区域中可以编码的最大音调成分数量信息可以设定为预设的第二数值,即每个频率区域的可以编码的最大音调成分数量是固定的。或,当前频率区域中可以编码的最大音调成分数量信息根据当前帧的编码速率确定,例如确定当前帧的编码速率,该当前帧的编码速率和当前频率区域中可以编码的最大音调成分数量具有对应关系,因此可以根据当前的编码速率进行选择,以得到当前频率区域中可以编码的最大音调成分数量。
272.在本技术的一些实施例中,前述步骤g1根据当前频率区域的候选音调成分的信息和当前频率区域中可以编码的最大音调成分数量信息,获得当前频率区域的目标音调成分的信息,包括:
273.g11、根据当前频率区域中可以编码的最大音调成分数量信息选择当前频率区域中的候选音调成分的能量信息或幅度信息最大的x个候选音调成分,x小于或等于当前频率区域中可以编码的最大音调成分的数量,x为正整数。
274.其中,当前频率区域中可以编码的最大音调成分数量信息是指当前频率区域中能够进行编码的音调成分数量的最大值,当前频率区域中可以编码的最大音调成分数量信息可以设定为预设的第二值,或根据编码速率进行选择得到。
275.g12、根据x个候选音调成分的信息确定当前频率区域的目标音调成分的信息,x表示当前频率区域的目标音调成分的数量。
276.其中,音频编码装置可以直接将x个候选音调成分的信息作为当前频率区域的目标音调成分的信息,x表示当前频率区域的目标音调成分的数量。或者,根据x个候选音调成分的信息进一步确定当前频率区域的目标音调成分的信息。例如,对x个候选音调成分的信息进行帧间连续性修正处理,将修正后的x个候选音调成分的信息作为当前频率区域的目标音调成分的信息。或者对x个候选音调成分的能量信息或幅度信息进行加权调整,将加权调整后的x个候选音调成分的信息作为当前频率区域的目标音调成分的信息。
277.在前述的实施例中,候选音调成分的信息包括:候选音调成分的幅度信息或能量信息,候选音调成分的幅度信息或能量信息包括:候选音调成分的功率谱比值。
278.其中,候选音调成分的功率谱比值为候选音调成分的功率谱的值与当前频率区域的功率谱的平均值的比值。
279.在本技术的上述实施例中,音调成分筛选包括如下至少一种:合并处理、帧间连续性修正处理和数量筛选,不同处理之间没有顺序限制。例如,可以先进行合并处理,获得当前频率区域合并后的候选音调成分的数量信息、位置信息以及幅度信息或能量信息;然后再对当前频率区域合并后的候选音调成分的数量信息、位置信息以及幅度信息或能量信息进行数量筛选处理,获得当前频率区域数量筛选后的候选音调成分的数量信息、位置信息以及幅度信息或能量信息;最后根据数量筛选后的候选音调成分的数量信息、位置信息以及幅度信息或能量信息,进行帧间连续性修正处理,得到当前频率区域修正后的候选音调成分的数量信息、位置信息以及幅度信息或能量信息,作为音调成分筛选的结果。
280.接下来以具体的应用场景进行详细说明,高频带信号对应的高频带包括至少一个频率区域,一个频率区域包括至少一个子带。因此,当前频率区域至少包括一个子带。根据当前频率区域的候选音调成分的数量信息、位置信息以及幅度信息或能量信息,获得当前频率区域的目标音调成分的数量信息、位置信息以及幅度或能量信息,一个具体的实施例包括如下步骤:
281.步骤一:按频点升序对候选音调成分的位置信息和幅度信息或能量信息进行排序,获得频点序号递增的候选音调成分序列。
282.候选音调成分的幅度信息或能量信息包括候选音调成分的功率谱比值。
283.频点序号递增的候选音调成分序列包括:按频点顺序升序排列后的位置信息peak_idx和功率谱比值信息peak_val。
284.步骤二:合并相同子带中的候选音调成分。
285.解码端重建算法中,每个子带中有且仅有一个音调成分,此音调成分放置于子带中间位置。因此,如果编码端在一个子带中检测到多个音调成分,需要在编码传输前对其信息进行合并处理。
286.对按频点顺序升序排列后的位置信息和功率谱比值信息进行合并处理:
287.对频点顺序相邻的两个候选音调成分,计算其所属的子带序号,表示如下:
288.band_idx_1=peak_idx[i]/tone_res[p],i∈[1,peak_cnt-1],
[0289]
band_idx_2=peak_idx[i-1]/tone_res[p],i∈[1,peak_cnt-1]。
[0290]
其中,peak_idx[i]和peak_idx[i-1]分别为第i和第i-1个候选音调成分的位置信息,band_idx_1和band_idx_2分别为第i和第i-1个候选音调成分对应的子带序号,tone_res[p]为第p个频率区域(tile)的子带宽度,本技术实施例中一个子带可以包含16个频点,即在48khz的采样率,2048点的改进离散余弦变换(modified discrete cosine transform,mdct)变换条件下,子带宽度为375hz。
[0291]
当band_idx_1和band_idx_2相同时,确定第i个候选音调成分和第i-1个候选音调成分位于同一个子带内,需要进行合并处理。
[0292]
合并算法的举例说明如下:第i个候选音调成分的功率谱比值合并到第i-1个候选音调成分,同时将第i个候选音调成分的功率谱比值信息和位置信息清零。举例说明如下:
[0293]
peak_val[i-1]=peak_val[i-1] peak_val[i],
[0294]
peak_val[i]=0,peak_idx[i]=0。
[0295]
第i个候选音调成分与第i-1个候选音调成分合并后,将第i 1到第peak_cnt-1个候选音调成分的信息(排序从0开始)前移,同时peak_cnt减一。
[0296]
通过上述的合并处理后,最终获得的候选音调成分数量记为peak_cnt_refine,更新后的位置信息peak_idx和功率谱比值信息peak_val作为当前频率区域合并后的候选音调成分的位置信息和幅度信息或能量信息。
[0297]
步骤三:对候选音调成分序列按功率谱比值降低的顺序进行重新排列。
[0298]
候选音调成分序列包括:步骤二中获得的更新后的位置信息peak_idx和功率谱比值信息peak_val。
[0299]
步骤四:将超过一定数量的候选音调成分的信息清零,只保留功率谱比值最大的前max_tonepertile个候选音调成分,即进行数量筛选处理。本技术实施例中设置max_tonepertile=3。
[0300]
如果步骤二中获得的peak_cnt_refine的小于等于max_tonepertile,则不需要进行清零处理。
[0301]
步骤四中保留的候选音调成分的数量信息作为数量筛选后的候选音调成分的数量信息,将步骤四中保留的候选音调成分的位置信息作为数量筛选后的候选音调成分的位置信息,将步骤四中保留的候选音调成分的功率谱比值作为数量筛选后的幅度信息或能量信息。
[0302]
步骤五:将候选音调成分序列按频点递增顺序重新排列。
[0303]
候选音调成分序列包括:步骤四中获得的数量筛选后的位置信息peak_idx和功率谱比值信息peak_val。
[0304]
步骤六:检测子带边缘的音调成分,保证解码端重建的连贯性。
[0305]
其中,某些候选音调成分可能位于子带的边缘位置,其位置信息可能在连续帧中不属于同一个子带,因此需要将位于子带的边缘位置的候选音调成分划分到同一个子带中,如果将其位置判断为不同的子带,则将引起解码端重建音调成分的不连续和频率跳变现象。
[0306]
检测和修正子带边缘的候选音调成分又称作帧间连续性修正处理,具体算法描述如下:
[0307]
设当前帧和前一帧的候选音调成分的位置信息序列分别为peak_idx和last_peak_idx,分别计算当前帧和前一帧第i个候选音调成分所属的子带序号:
[0308]
band_idx_cur=peak_idx[i]/tone_res[p],
[0309]
band_idx_last=last_peak_idx[i]/tone_res[p]。
[0310]
满足如下条件时,对当前帧的peak_idx进行修正:
[0311]
|peak_idx[i]-last_peak_idx[i]|==1&band_idx_cur!=band_idx_last。
[0312]
其中,当前帧第i个候选音调成分的位置与前一帧第i个候选音调成分的位置相差为1,且属于不同子带时,对当前帧的位置信息peak_idx进行修正。修正的具体处理过程如下:
[0313]
peak_idx[i]=last_peak_idx[i]。
[0314]
帧间连续性修正处理后,需要对前一帧的候选音调成分的位置信息进行更新。即更新last_peak_idx为peak_idx。
[0315]
在进行音调成分筛选后,可以获得音调成分的数量信息。在这个具体的实施例中,当前tile的音调成分数量记为tone_cnt[p]:
[0316]
tone_cnt[p]=peak_cnt_refine。
[0317]
在进行音调成分筛选后,可以获得音调成分的幅度信息或能量信息。在本技术实施例中,音调成分的能量信息表示为等效的mdct谱能量,计算方法如下:
[0318]
toneenergyr[i]=mean_powerspecr*(powerspectrum[index]/mean_powerspec)。
[0319]
其中,mean_powerspecr为当前tile的mdct能量平均值,mean_powerspec为当前tile的功率谱平均值,powerspectrum[index]为第i个音调成分的功率谱,index为第i个音调成分的频点位置,toneenergyr[i]为第i个音调成分的等效mdct能量。
[0320]
当前tile的mdct能量平均值mean_powerspecr计算如下:
[0321][0322]
其中,mdctspectrum为信号mdct谱,tile_width为tile宽度(即频点数),mean_powerspecr为mdct能量平均值。
[0323]
最后,根据当前频率区域的音调成分的数量信息、音调成分的位置信息以及音调成分的幅度或能量信息,确定当前频率区域的音调成分的位置数量参数、以及音调成分的幅度参数或能量参数。
[0324]
通过上述举例说明可知,本技术实施例的提供的音调成分筛选,不仅仅考虑了音调成分的能量或幅度以及能够进行编码的音调成分的最大数量,还考虑了相邻帧之间的音调成分的连续性以及音调成分的子带分布,高效地利用有限的编码比特数获得更好的音调成分编码效果,提升编码质量。
[0325]
前述实施例介绍了音频编码装置执行的音频编码方法,接下来介绍本技术实施例提供的音频解码装置执行的音频解码方法,如图9所示,主要包括如下步骤:
[0326]
901、获取编码码流。
[0327]
其中,编码码流由音频编码装置发送给音频解码装置。
[0328]
902、对所述编码码流进行码流解复用,以得到音频信号的当前帧的第一编码参数和所述当前帧的第二编码参数,所述当前帧的第二编码参数包括当前帧的高频带参数。
[0329]
第一编码参数和第二编码参数可以参考编码方法,此处不再赘述。
[0330]
903、根据所述第一编码参数得到所述当前帧的第一高频带信号和所述当前帧的第一低频带信号。
[0331]
其中,所述第一高频带信号可以包括:根据所述第一编码参数直接解码得到的解码高频带信号,以及根据所述第一低频带信号进行频带扩展得到的扩展高频带信号中的至少一种。
[0332]
904、根据所述第二编码参数得到所述当前帧的第二高频带信号,所述第二高频带信号包括重建音调信号。
[0333]
第二编码参数包括当前帧的高频带参数。高频带参数可以包括高频带信号的音调成分信息。例如,当前帧的高频带参数包括音调成分的位置数量参数、以及所述音调成分的幅度参数或能量参数。又例如,当前帧的高频带参数包括音调成分的位置参数、数量参数、以及所述音调成分的幅度参数或能量参数。当前帧的高频带参数可以参考编码方法,此处不再赘述。
[0334]
与编码端处理流程方法类似,解码端处理流程中根据高频带参数获得当前帧的重建高频带信号的过程,也会按照高频带的频率区域划分和/或子带划分来进行。高频带信号对应的高频带包括至少一个频率区域,一个所述频率区域包括至少一个子带。需要确定的高频带参数的频率区域数量可以是预先给定的,也可以是从码流中获取的。这里以在一个频率区域中根据音调成分的位置数量参数以及所述音调成分的幅度参数获得当前帧的重建高频带信号为例进行进一步描述。具体地,可以是:
[0335]
根据当前频率区域的音调成分的位置数量参数确定所述当前频率区域中音调成分的位置;
[0336]
根据所述当前频率区域的音调成分的幅度参数或能量参数确定所述音调成分的位置对应的幅度或能量;
[0337]
根据所述当前频率区域中音调成分的位置和所述音调成分的位置对应的幅度或能量获得重建音调信号;
[0338]
根据所述重建音调信号获得所述重建高频带信号。
[0339]
905、根据所述当前帧的第一低频带信号、第一高频带信号、第二高频带信号,得到所述当前帧的解码信号。
[0340]
本技术实施例中,在编码端进行了音调成分选择及编码方法,不仅仅考虑了峰值的能量或幅度以及能够进行编码的音调成分的最大数量,还考虑了相邻帧之间的音调成分的连续性音以及音调成分的子带分布,高效地利用有限的编码比特数获得更好的音调成分编码效果,提升编码质量。在相应的解码端,所需要解码的高频带信号是经过音调成分筛选的,因此也相应的提高了解码效率。
[0341]
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本技术并不受所描述的动作顺序的限制,因为依据本技术,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本技术所必须的。
[0342]
为便于更好的实施本技术实施例的上述方案,下面还提供用于实施上述方案的相关装置。
[0343]
请参阅图10所示,本技术实施例提供的一种音频编码装置1000,可以包括:获取模块1001、编码模块1002、和码流复用模块1003,其中,
[0344]
获取模块,用于获取音频信号的当前帧,所述当前帧包括高频带信号;
[0345]
编码模块,用于对所述高频带信号进行编码,以获得所述当前帧的编码参数,所述编码包括:音调成分筛选;所述编码参数用于表示所述高频带信号的目标音调成分的信息,所述目标音调成分是经过所述音调成分筛选后获得的,所述音调成分的信息包括所述音调成分的位置信息、数量信息、以及幅度信息或能量信息;
[0346]
码流复用模块,用于对所述编码参数进行码流复用,以获得编码码流。
[0347]
在本技术的一些实施例中,所述高频带信号对应的高频带包括至少一个频率区域,所述至少一个频率区域包括当前频率区域;
[0348]
所述编码模块,用于根据所述当前频率区域的高频带信号获得所述当前频率区域的候选音调成分的信息;对所述当前频率区域的候选音调成分的信息进行音调成分筛选,
以获得所述当前频率区域的目标音调成分的信息;根据所述当前频率区域的目标音调成分的信息获得所述当前频率区域的编码参数。
[0349]
在本技术的一些实施例中,所述高频带信号对应的高频带包括至少一个频率区域,所述至少一个频率区域包括当前频率区域;
[0350]
所述编码模块,用于根据所述当前频率区域的高频带信号进行峰值搜索,以获得所述当前频率区域的峰值信息,所述当前频率区域的峰值信息包括:所述当前频率区域的峰值数量信息、峰值位置信息、以及峰值能量信息或峰值幅度信息;对所述当前频率区域的峰值信息进行峰值筛选,以获得所述当前频率区域的候选音调成分的信息;对所述当前频率区域的候选音调成分的信息进行音调成分筛选,以获得所述当前频率区域的目标音调成分的信息;根据所述当前频率区域的目标音调成分的信息获得所述当前频率区域的编码参数。
[0351]
在本技术的一些实施例中,所述当前频率区域包括至少一个子带,所述至少一个子带包括当前子带;
[0352]
所述编码模块,用于对所述当前频率区域中子带序号相同的候选音调成分进行合并处理,以获得合并处理后的候选音调成分的信息;根据当前频率区域的合并处理后的候选音调成分的信息获得所述当前频率区域的目标音调成分的信息。
[0353]
在本技术的一些实施例中,所述至少一个子带包括当前子带;
[0354]
所述当前频率区域的合并处理后的候选音调成分的信息,包括:所述当前子带的合并处理后的候选音调成分的位置信息、所述当前子带的合并处理后的候选音调成分的幅度信息或能量信息;
[0355]
所述当前子带的合并处理后的候选音调成分的位置信息包括:所述当前子带的合并处理前的候选音调成分中的一个候选音调成分的位置信息;
[0356]
所述当前子带的合并处理后的候选音调成分的幅度信息或能量信息包括:所述一个候选音调成分的幅度信息或能量信息,或者所述当前子带的合并处理后的候选音调成分的幅度信息或能量信息是根据所述当前子带的合并处理前的候选音调成分的幅度信息或能量信息计算获得的。
[0357]
在本技术的一些实施例中,所述当前频率区域的合并处理后的候选音调成分的信息,还包括:所述当前频率区域的合并处理后的候选音调成分的数量信息;
[0358]
所述当前频率区域中的合并处理后的候选音调成分的数量信息和所述当前频率区域中具有候选音调成分的子带的数量信息相同。
[0359]
在本技术的一些实施例中,所述编码模块,用于对所述当前频率区域中子带序号相同的候选音调成分进行合并处理之前,根据所述当前频率区域的候选音调成分的位置信息,对所述当前频率区域的候选音调成分按照位置递增或位置递减进行排列,以获得所述当前频率区域中位置排列后的候选音调成分;
[0360]
所述编码模块,用于根据所述当前频率区域中位置排列后的候选音调成分,对所述当前频率区域中子带序号相同的候选音调成分进行合并处理。
[0361]
在本技术的一些实施例中,所述编码模块,用于根据当前频率区域的合并处理后的候选音调成分的信息和所述当前频率区域中可以编码的最大音调成分数量信息,获得所述当前频率区域的目标音调成分的信息。
[0362]
在本技术的一些实施例中,所述编码模块,用于根据当前频率区域的合并处理后的候选音调成分的信息,对所述当前频率区域的合并处理后的候选音调成分按照能量信息或幅度信息进行排列,以获得能量信息或幅度信息排列后的候选音调成分的信息;根据所述能量信息或幅度信息排列后的候选音调成分的信息和所述当前频率区域中可以编码的最大音调成分数量信息,获得所述当前频率区域的目标音调成分的信息。
[0363]
在本技术的一些实施例中,所述编码模块,用于根据所述当前频率区域的合并处理后的候选音调成分的信息和所述当前频率区域中可以编码的最大音调成分数量信息,获得所述当前频率区域的数量筛选后的候选音调成分的信息;根据所述当前频率区域的数量筛选后的候选音调成分的信息,获得所述当前频率区域的目标音调成分的信息。
[0364]
在本技术的一些实施例中,所述编码模块,用于根据所述当前频率区域的合并处理后的候选音调成分的信息,对所述当前频率区域的合并处理后的候选音调成分按照能量信息或幅度信息进行排列,以获得能量信息或幅度信息排列后的候选音调成分的信息;根据所述能量信息或幅度信息排列后的候选音调成分的信息和所述当前频率区域中可以编码的最大音调成分数量信息,获得所述当前帧的当前频率区域的数量筛选后的候选音调成分的信息。
[0365]
在本技术的一些实施例中,所述编码模块,用于根据所述当前帧的当前频率区域的数量筛选后的候选音调成分的位置信息,对所述当前帧的当前频率区域的数量筛选后的候选音调成分按照位置递增或位置递减进行排列,以获得所述当前帧的当前频率区域中位置排列后的候选音调成分;根据所述当前帧的当前频率区域的位置排列后的候选音调成分,获得所述当前帧的当前频率区域的数量筛选后的位置排序后的候选音调成分对应的子带序号;获取所述当前帧的前一帧的当前频率区域的数量筛选后的位置排序后的候选音调成分对应的子带序号;若所述当前帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息和所述前一帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息满足预设条件,且所述当前帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分对应的子带序号和所述前一帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分对应的子带序号不同,则对所述当前帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息进行修正,以获得所述频率区域的目标音调成分的信息,所述第n个候选音调成分为所述当前频率区域中的数量筛选后的位置排序后的任意一个候选音调成分。
[0366]
在本技术的一些实施例中,所述预设条件包括:所述当前帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息和所述前一帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息之间的差值小于或等于预设阈值。
[0367]
在本技术的一些实施例中,所述编码模块,用于将所述当前帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息修正为所述前一帧的当前频率区域的数量筛选后的位置排序后的第n个候选音调成分的位置信息。
[0368]
在本技术的一些实施例中,所述当前频率区域包括至少一个子带,所述至少一个子带包括当前子带;所述编码模块,用于对所述当前频率区域中子带序号相同的候选音调成分进行合并处理,以获得所述当前频率区域的目标音调成分的信息。
[0369]
在本技术的一些实施例中,所述当前频率区域包括至少一个子带,所述编码模块,用于根据所述当前帧的当前频率区域中的候选音调成分的位置信息获得所述当前帧的当前频率区域中的候选音调成分对应的子带序号;获取所述当前帧的前一帧的当前频率区域中的候选音调成分对应的子带序号;若所述当前帧的当前频率区域的第n个候选音调成分的位置信息和所述前一帧的当前频率区域的第n个候选音调成分的位置信息满足预设条件,且所述当前帧的当前频率区域的第n个候选音调成分对应的子带序号和所述前一帧的当前频率区域的第n个候选音调成分对应的子带序号不同,则对所述当前帧的当前频率区域的第n个候选音调成分的位置信息进行修正,以获得所述当前频率区域的目标音调成分的信息,所述第n个候选音调成分为所述当前频率区域中的任意一个候选音调成分。
[0370]
在本技术的一些实施例中,所述编码模块,用于根据所述当前帧的当前频率区域的候选音调成分的位置信息,对所述当前帧的当前频率区域中的候选音调成分按照位置递增或位置递减进行排列,以获得所述当前帧的当前频率区域中位置排列后的候选音调成分;根据所述当前频率区域中位置排列后的候选音调成分,获取所述当前帧的当前频率区域中的候选音调成分对应的子带序号。
[0371]
在本技术的一些实施例中,所述预设条件包括:所述当前帧的当前频率区域的第n个候选音调成分的位置信息和所述前一帧的当前频率区域的第n个候选音调成分的位置信息之间的差值小于或等于预设阈值。
[0372]
在本技术的一些实施例中,所述编码模块,用于将所述当前帧的当前频率区域的第n个候选音调成分的位置信息修正为所述前一帧的当前频率区域的第n个候选音调成分的位置信息。
[0373]
在本技术的一些实施例中,所述编码模块,用于根据所述当前频率区域的候选音调成分的信息和所述当前频率区域中可以编码的最大音调成分数量信息,获得所述当前频率区域的目标音调成分的信息。
[0374]
在本技术的一些实施例中,所述编码模块,用于根据所述当前频率区域中可以编码的最大音调成分数量信息选择所述当前频率区域中的候选音调成分的能量信息或幅度信息最大的x个候选音调成分,所述x小于或等于所述当前频率区域中可以编码的最大音调成分的数量,所述x为正整数;确定所述x个候选音调成分的信息为所述当前频率区域的目标音调成分的信息,所述x表示所述当前频率区域的目标音调成分的数量。
[0375]
在本技术的一些实施例中,所述候选音调成分的信息包括:所述候选音调成分的幅度信息或能量信息,所述候选音调成分的幅度信息或能量信息包括:所述候选音调成分的功率谱比值,其中,所述候选音调成分的功率谱比值为所述候选音调成分的功率谱的值与所述当前频率区域的功率谱的平均值的比值。
[0376]
通过前述实施例的举例说明可知,获取音频信号的当前帧,当前帧包括高频带信号,对高频带信号进行编码,以获得当前帧的编码参数,编码包括:音调成分筛选;编码参数用于表示高频带信号的目标音调成分的信息,目标音调成分是经过音调成分筛选后获得的,音调成分的信息包括音调成分的位置信息、数量信息、以及幅度信息或能量信息,对编码参数进行码流复用,以获得编码码流。本技术实施例中编码过程中包括音调成分筛选,编码参数用于表示经过音调成分筛选后获得的目标音调成分,该编码参数通过码流复用可以获得编码码流,在本技术实施例获得的编码码流中携带的目标音调成分的信息是经过音调
成分筛选的,因此可以高效地利用有限的编码比特数获得更好的音调成分编码效果,提升音频信号的编码质量。
[0377]
需要说明的是,上述装置各模块/单元之间的信息交互、执行过程等内容,由于与本技术方法实施例基于同一构思,其带来的技术效果与本技术方法实施例相同,具体内容可参见本技术前述所示的方法实施例中的叙述,此处不再赘述。
[0378]
基于与上述方法相同的发明构思,本技术实施例提供一种音频信号编码器,音频信号编码器用于编码音频信号,包括:如执行如上述一个或者多个实施例中所述的编码器,其中,音频编码装置用于编码生成对应的码流。
[0379]
基于与上述方法相同的发明构思,本技术实施例提供一种用于编码音频信号的设备,例如,音频编码装置,请参阅图11所示,音频编码装置1100包括:
[0380]
处理器1101、存储器1102以及通信接口1103(其中音频编码装置1100中的处理器1101的数量可以一个或多个,图11中以一个处理器为例)。在本技术的一些实施例中,处理器1101、存储器1102以及通信接口1103可通过总线或其它方式连接,其中,图11中以通过总线连接为例。
[0381]
存储器1102可以包括只读存储器和随机存取存储器,并向处理器1101提供指令和数据。存储器1102的一部分还可以包括非易失性随机存取存储器(non-volatile random access memory,nvram)。存储器1102存储有操作系统和操作指令、可执行模块或者数据结构,或者它们的子集,或者它们的扩展集,其中,操作指令可包括各种操作指令,用于实现各种操作。操作系统可包括各种系统程序,用于实现各种基础业务以及处理基于硬件的任务。
[0382]
处理器1101控制音频编码设备的操作,处理器1101还可以称为中央处理单元(central processing unit,cpu)。具体的应用中,音频编码设备的各个组件通过总线系统耦合在一起,其中总线系统除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图中将各种总线都称为总线系统。
[0383]
上述本技术实施例揭示的方法可以应用于处理器1101中,或者由处理器1101实现。处理器1101可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器1101中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器1101可以是通用处理器、数字信号处理器(digital signal processing,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本技术实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本技术实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器1102,处理器1101读取存储器1102中的信息,结合其硬件完成上述方法的步骤。
[0384]
通信接口1103可用于接收或发送数字或字符信息,例如可以是输入/输出接口、管脚或电路等。举例而言,通过通信接口1103发送上述编码码流。
[0385]
基于与上述方法相同的发明构思,本技术实施例提供一种音频编码设备,包括:相
互耦合的非易失性存储器和处理器,所述处理器调用存储在所述存储器中的程序代码以执行如上述一个或者多个实施例中所述的音频信号编码方法的部分或全部步骤。
[0386]
基于与上述方法相同的发明构思,本技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储了程序代码,其中,所述程序代码包括用于执行如上述一个或者多个实施例中所述的音频信号编码方法的部分或全部步骤的指令。
[0387]
基于与上述方法相同的发明构思,本技术实施例提供一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行如上述一个或者多个实施例中所述的音频信号编码方法的部分或全部步骤。
[0388]
以上各实施例中提及的处理器可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。处理器可以是通用处理器、数字信号处理器(digital signal processor,dsp)、特定应用集成电路(application-specific integrated circuit,asic)、现场可编程门阵列(field programmable gate array,fpga)或其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。本技术实施例公开的方法的步骤可以直接体现为硬件编码处理器执行完成,或者用编码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
[0389]
上述各实施例中提及的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,rom)、可编程只读存储器(programmable rom,prom)、可擦除可编程只读存储器(erasable prom,eprom)、电可擦除可编程只读存储器(electrically eprom,eeprom)或闪存。易失性存储器可以是随机存取存储器(random access memory,ram),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用,例如静态随机存取存储器(static ram,sram)、动态随机存取存储器(dynamic ram,dram)、同步动态随机存取存储器(synchronous dram,sdram)、双倍数据速率同步动态随机存取存储器(double data rate sdram,ddr sdram)、增强型同步动态随机存取存储器(enhanced sdram,esdram)、同步连接动态随机存取存储器(synchlink dram,sldram)和直接内存总线随机存取存储器(direct rambus ram,dr ram)。应注意,本文描述的系统和方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
[0390]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
[0391]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0392]
在本技术所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以
通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0393]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0394]
另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
[0395]
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0396]
以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以所述权利要求的保护范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献