语音编码、解码方法、装置、计算机设备和存储介质与流程

2022-10-13 01:13:58 来源：中国专利 TAG：

技术特征：
1.一种语音编码方法，其特征在于，所述方法包括：基于待编码的初始语音信号进行子带分解，得到至少两个子带激励信号；基于所述子带激励信号各频点的频点特征，确定所述子带激励信号的听觉感知表征值；所述听觉感知表征值用于描述所述子带激励信号的听觉感知强弱；基于所述听觉感知表征值与预设的听觉感知门限值之间的大小关系，从所述至少两个子带激励信号中确定第一子带激励信号和第二子带激励信号；确定所述第一子带激励信号相对于单位激励信号的目标增益；所述单位激励信号用于针对所述第一子带激励信号进行信号还原；将所述目标增益确定为所述第一子带激励信号对应的目标编码参数，以屏蔽对所述第一子带激励信号的量化编码；获取对所述第二子带激励信号进行量化编码得到的激励量化信号，根据所述目标编码参数和所述激励量化信号，确定所述初始语音信号对应的目标编码数据。2.根据权利要求1所述的方法，其特征在于，所述基于所述子带激励信号各频点的频点特征，确定所述子带激励信号的听觉感知表征值，包括：获取所述子带激励信号各频点各自的功率谱；获取所述子带激励信号各频点各自的听觉感知系数；其中，所述听觉感知系数与听觉响度成正相关，所述听觉响度用于描述声音的响亮程度；基于各频点各自的听觉感知系数对各频点各自的功率谱进行加权处理，以得到所述子带激励信号的听觉感知表征值。3.根据权利要求2所述的方法，其特征在于，所述获取所述子带激励信号各频点各自的听觉感知系数，包括：对声学等响曲线数据进行线性插值，得到各频点各自的听觉响度；所述声学等响曲线数据用于描述等响条件下声压级与声波频率之间的对应关系；根据各频点各自的听觉响度，确定各频点各自的听觉感知系数。4.根据权利要求1所述的方法，其特征在于，所述基于所述听觉感知表征值与预设的听觉感知门限值之间的大小关系，从所述至少两个子带激励信号中确定第一子带激励信号和第二子带激励信号，包括：在所述听觉感知表征值小于或者等于所述预设的听觉感知门限值的情况下，将所述子带激励信号确定为第一子带激励信号；在所述听觉感知表征值大于所述预设的听觉感知门限值的情况下，将所述子带激励信号确定为第二子带激励信号。5.根据权利要求1所述的方法，其特征在于，确定所述第一子带激励信号相对于单位激励信号的目标增益，包括：基于所述第一子带激励信号各样点的幅值，确定所述第一子带激励信号对应的能量值；获取单位激励信号对应的预设能量值，基于所述第一子带激励信号对应的能量值以及所述预设能量值，确定所述第一子带激励信号相对于单位激励信号的目标增益。6.根据权利要求1至5中任意一项所述的方法，其特征在于，所述第二子带激励信号包括多个，所述获取对所述第二子带激励信号进行量化编码得到的激励量化信号，包括：
按照听觉感知表征值从大到小对各个第二子带激励信号进行排序；基于各个第二子带激励信号各自的排序位置，按照不同的量化精度对各个第二子带激励信号进行量化编码，得到各个第二子带激励信号各自的激励量化信号；其中，至少一个排序位置在后的第二子带激励信号的量化精度小于排序位置在前的第二子带激励信号的量化精度。7.根据权利要求6所述的方法，其特征在于，所述按照不同的量化精度对各个第二子带激励信号进行量化编码，得到各个第二子带激励信号各自的激励量化信号包括：基于所述第二子带激励信号的排序位置，确定所述第二子带激励信号的目标增益；其中，至少一个排序位置在后的第二子带激励信号的目标增益大于排序位置在前的第二子带激励信号的目标增益；基于所述第二子带激励信号的目标增益，对所述第二子带激励信号进行量化编码，得到所述第二子带激励信号的激励量化信号。8.根据权利要求7所述的方法，其特征在于，所述基于所述第二子带激励信号的排序位置，确定所述第二子带激励信号的目标增益，包括：获取初始增益，所述初始增益是基于所述初始语音信号计算得到的；对所述初始增益按照预设的增益递增方式依次进行递增，得到多个目标增益，基于各个第二子带激励信号的排序位置，将所述多个目标增益分配给各个第二子带激励信号；所述根据所述目标编码参数和所述激励量化信号，确定所述初始语音信号对应的目标编码数据，包括：根据所述目标编码参数、所述激励量化信号和所述初始增益，确定所述初始语音信号对应的目标编码数据。9.根据权利要求1所述的方法，其特征在于，所述基于待编码的初始语音信号进行子带分解，得到至少两个子带激励信号，包括：对待编码的初始语音信号进行分帧处理，得到多帧子语音信号；对所述子语音信号进行信号分析处理和滤波处理，以得到所述子语音信号对应的初始激励信号；对所述初始激励信号进行信号子带分解，得到处于第一频率范围的分解信号和处于第二频率范围的分解信号；所述第二频率范围的频率值大于所述第一频率范围的频率值；将处于第一频率范围的分解信号确定为所述子语音信号对应的子带激励信号，并基于处于第二频率范围的分解信号确定所述子语音信号对应的子带激励信号。10.根据权利要求9所述的方法，其特征在于，所述基于处于第二频率范围的分解信号确定所述子语音信号对应的子带激励信号包括：将处于第二频率范围的分解信号作为中间激励信号；对所述中间激励信号进行信号子带分解，得到处于第三频率范围的分解信号和处于第四频率范围的分解信号；所述第三频率范围的频率值大于所述第四频率范围的频率值；将处于第三频率范围的分解信号和处于第四频率范围的分解信号，均作为所述子语音信号对应的子带激励信号。11.一种语音解码方法，其特征在于，所述方法包括：获取对初始语音信号进行编码得到的目标编码数据，解析所述目标编码数据得到目标
增益和激励量化信号，所述目标增益对应于基于初始语音信号进行子带分解得到的至少两个子带激励信号中的第一子带激励信号，所述激励量化信号对应于所述至少两个子带激励信号中的第二子带激励信号，所述目标增益是所述第一子带激励信号相对于单位激励信号的增益，所述第一子带激励信号和所述第二子带激励信号，是根据所述至少两个子带激励信号中各个子带激励信号的听觉感知表征值与预设的听觉感知门限值之间的大小关系确定的，所述听觉感知表征值用于描述子带激励信号的听觉感知强弱，是基于子带激励信号各频点的频点特征确定的；根据单位激励信号以及所述目标增益进行信号还原，得到第一激励还原信号；根据所述激励量化信号进行信号还原，得到第二激励还原信号；基于所述第一激励还原信号和所述第二激励还原信号进行信号子带合成，以得到目标语音信号。12.一种语音编码装置，其特征在于，所述装置包括：子带分解模块，用于基于待编码的初始语音信号进行子带分解，得到至少两个子带激励信号；听觉感知确定模块，用于基于所述子带激励信号各频点的频点特征，确定所述子带激励信号的听觉感知表征值；所述听觉感知表征值用于描述所述子带激励信号的听觉感知强弱；子带分类模块，用于基于所述听觉感知表征值与预设的听觉感知门限值之间的大小关系，从所述至少两个子带激励信号中确定第一子带激励信号和第二子带激励信号；增益确定模块，用于确定所述第一子带激励信号相对于单位激励信号的目标增益；所述单位激励信号用于针对所述第一子带激励信号进行信号还原；编码参数确定模块，用于将所述目标增益确定为所述第一子带激励信号对应的目标编码参数，以屏蔽对所述第一子带激励信号的量化编码；量化编码模块，用于获取对所述第二子带激励信号进行量化编码得到的激励量化信号，根据所述目标编码参数和所述激励量化信号，确定所述初始语音信号对应的目标编码数据。13.一种语音解码装置，其特征在于，所述装置包括：目标编码数据获取模块，用于获取对初始语音信号进行编码得到的目标编码数据，解析所述目标编码数据得到目标增益和激励量化信号，所述目标增益对应于基于初始语音信号进行子带分解得到的至少两个子带激励信号中的第一子带激励信号，所述激励量化信号对应于所述至少两个子带激励信号中的第二子带激励信号，所述目标增益是所述第一子带激励信号相对于单位激励信号的增益，所述第一子带激励信号和所述第二子带激励信号，是根据所述至少两个子带激励信号中各个子带激励信号的听觉感知表征值与预设的听觉感知门限值之间的大小关系确定的，所述听觉感知表征值用于描述子带激励信号的听觉感知强弱，是基于子带激励信号各频点的频点特征确定的；信号还原模块，用于根据单位激励信号以及所述目标增益进行信号还原，得到第一激励还原信号；根据所述激励量化信号进行信号还原，得到第二激励还原信号；子带合成模块，用于基于所述第一激励还原信号和所述第二激励还原信号进行信号子带合成，以得到目标语音信号。
14.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至10或者11中任一项所述的方法的步骤。15.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至10或者11中任一项所述的方法的步骤。16.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至10或者11中任一项所述的方法的步骤。

技术总结
本申请涉及一种语音编码、解码方法、装置、计算机设备和存储介质，包括：基于待编码的初始语音信号进行子带分解，得到至少两个子带激励信号；基于子带激励信号各频点的频点特征，确定子带激励信号的听觉感知表征值；基于听觉感知表征值与预设的听觉感知门限值之间的大小关系，从至少两个子带激励信号中确定第一子带激励信号和第二子带激励信号；确定第一子带激励信号相对于单位激励信号的目标增益；将目标增益确定为第一子带激励信号对应的目标编码参数，以屏蔽对第一子带激励信号的量化编码；获取对第二子带激励信号进行量化编码得到的激励量化信号，根据目标编码参数和激励量化信号得到目标编码数据。采用本方法能够提高语音编码效率。音编码效率。音编码效率。

技术研发人员：梁俊斌
受保护的技术使用者：腾讯科技（深圳）有限公司
技术研发日：2022.09.05
技术公布日：2022/10/11

再多了解一些

2/2 首页上一页 1 2

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种儿化音合成方法、装置、电子设备及存储介质与流程

语音编码、解码方法、装置、计算机设备和存储介质与流程

相关文献

最热文献