一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于音频处理的心理声学模型的制作方法

2022-07-17 01:25:15 来源:中国专利 TAG:

技术特征:
1.一种用于处理音频信号的方法,所述音频信号包括多个频带中的音频数据,所述方法包括对于所述多个频带中的每个频带:确定所述频带的所述音频数据的能量值;确定所述频带的安静环境听觉阈值;使用所述能量值和所述安静环境听觉阈值来计算所述频带的灵敏度值sv;使用所述灵敏度值和所述能量值来计算所述频带的掩蔽阈值;使用所述能量值和所述掩蔽阈值来确定所述频带的比特分配值。2.如权利要求1所述的方法,其中,计算所述灵敏度值包括计算所述频带的所述能量值与所述频带的所述安静环境听觉阈值之间的比率或差异。3.如权利要求1或2所述的方法,其中,计算所述掩蔽阈值包括对以下各项之一应用扩展函数:所述频带的所述能量值;或所述频带的经变换能量值;以确定所述频带的激励值,以及将所述灵敏度值与所述激励值相组合。4.如权利要求1或2所述的方法,其中,计算所述掩蔽阈值包括将所述能量值与所述灵敏度值相组合以确定中间阈值,以及对所述中间阈值应用扩展函数以确定所述掩蔽阈值。5.如任一前述权利要求所述的方法,其中,确定所述比特分配值包括调整所述掩蔽阈值以实现满足所述音频信号的目标比特率的比特分配,其中,调整所述掩蔽阈值包括:通过在响度域中向所述掩蔽阈值添加恒定偏移直到所述音频信号的所述目标比特率得到满足来调整所述掩蔽阈值。6.如权利要求3或从属于权利要求3时的权利要求4至5中任一项所述的方法,其中,所述sv以db为单位被定义为对所述激励值的减法调整,其中,确定比特分配值的步骤包括为具有较高sv的频带分配比所述具有较低sv的频带更多的比特。7.如任一前述权利要求所述的方法,其中,计算所述频带的sv的步骤包括使用感觉水平计算第一sv,所述感觉水平是所述能量值与所述安静环境听觉阈值之间的以db为尺度差异。8.如权利要求7所述的方法,其中,计算第一sv的步骤包括将所述感觉水平乘以第一标量。9.如权利要求8所述的方法,其中,所述第一标量是频率相关的。10.如权利要求8所述的方法,其中,所述第一标量在所有频带上是恒定的。11.如权利要求7至10中任一项所述的方法,其中,计算sv的步骤包括使用所述第一sv作为所述频带的所述sv。12.如权利要求7至10中任一项所述的方法,其中,计算所述频带的sv的步骤包括使用所述感觉水平计算第二sv,以及基于所述音频信号的至少一个特性对所述第一sv和所述第二sv进行加权。13.如权利要求12所述的方法,其中,计算所述频带的第二sv的步骤包括将所述感觉水平乘以不同于所述第一标量的第三标量。
14.如权利要求12至13中任一项所述的方法,其中,基于所述音频信号的至少一个特性对所述第一sv和所述第二sv进行加权的步骤包括计算表示权重的值,所述值的范围介于0至1之间,其中,计算所述频带的所述sv的步骤包括将所述第一sv和所述第二sv中的一者与所述值相乘,并将所述第一sv或所述第二sv中的另一者与一减去所述值相乘,并将这两个结果加在一起以形成所述频带的所述sv。15.如权利要求12至14所述的方法,其中,所述至少一个特性定义所述音频信号的频带中的经估计调性水平。16.如权利要求15所述的方法,其中,所述经估计调性是使用从所述音频信号的所述频带计算的频率系数的自适应预测来计算的。17.如权利要求16所述的方法,其中,线性预测编码lpc基于计算mdct系数所根据的所述音频信号的频带而被自适应地应用于所述mdct系数。18.如权利要求17所述的方法,其中,lpc分析窗口长度根据所述频带而变化。19.如权利要求18所述的方法,其中,相对较长的lpc分析窗口用于相对较低的频带。20.如权利要求17至19中任一项所述的方法,其中,所述lpc的预测阶数根据所述频带而变化。21.如权利要求7至20中任一项所述的方法,进一步包括以下步骤:定义用于所述频带的取决于所述感觉水平的扩展函数,使得扩展函数在具有相对较高感觉水平的频带中的效果相比于所述扩展函数在具有相对较低感觉水平的频带中的效果而言较大。22.如前述权利要求中任一项所述的方法,其中,确定所述频带的安静环境听觉阈值的步骤包括使用定义至少一些频率的听觉阈值的预定义表。23.如前述权利要求中任一项所述的方法,进一步包括响应于所述比特分配值而量化所述频带的所述音频数据的音频样本。24.如权利要求23所述的方法,进一步包括将所述频带的经量化音频数据编码成比特流。25.如权利要求23至24中任一项所述的方法,其中,在量化所述频带的所述音频数据的音频样本之前,使用压缩扩展算法减小所述音频信号的动态范围。26.如权利要求1至22中任一项所述的方法,其中,所述音频信号是包括所述频带的经编码能量值的经编码比特流,并且其中,确定所述频带的所述音频数据的所述能量值包括对来自所述经编码比特流的所述经编码能量值进行解码。27.如权利要求26所述的方法,进一步包括响应于所述比特分配值而从所述经编码比特流中提取所述频带的所述音频数据的经量化音频样本。28.如权利要求27所述的方法,进一步包括对所述频带的所述音频数据的所述经量化音频样本进行去量化,以及组合每个频带的所述音频数据的经去量化音频样本以生成经解码音频信号。29.一种设备,包括:被配置为接收音频信号的接收部件,所述音频信号包括多个频带中的音频数据;被配置为确定所述音频信号的多个频带的分析部件;所述分析部件进一步被配置为对于所述多个频带中的每个频带;确定所述频带的所述音频数据的能量值;
确定所述频带的安静环境听觉阈值;使用所述能量值和所述安静环境听觉阈值来计算所述频带的灵敏度值sv;使用所述灵敏度值和所述能量值来计算所述频带的掩蔽阈值;使用所述能量值和所述掩蔽阈值来确定所述频带的比特分配值。30.一种计算机程序产品,所述计算机程序产品包括具有指令的计算机可读存储介质,所述指令被适配成当由具有处理能力的设备执行时执行如权利要求1至28中任一项所述的方法。

技术总结
本公开涉及音频编码领域,特别地,本公开涉及一种用于通过掩蔽模型对音频信号进行编码的方法,所述掩蔽模型基于所述音频信号的频率区间的听觉阈值和所述音频信号的针对对应频率区间的测得能量。本公开进一步涉及一种能够执行所述音频编码方法的编码器。够执行所述音频编码方法的编码器。够执行所述音频编码方法的编码器。


技术研发人员:G
受保护的技术使用者:杜比实验室特许公司
技术研发日:2020.12.03
技术公布日:2022/7/15
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献