语音处理方法、系统、设备及存储介质与流程

2022-07-10 04:21:36 来源：中国专利 TAG：

技术特征：
1.一种语音处理方法，其特征在于，包括：对初始用户录制语音进行压限处理，获取压限后的用户录制语音；对压限后的用户录制语音进行不完全降噪处理，获取降噪后的用户录制语音；对降噪后的用户录制语音进行消歧，获取消歧后的用户录制语音；根据所述初始用户录制语音的平均音素数量，调整消歧后的用户录制语音中预先分帧的每一帧语音中的因素个数，获取调整后的每一帧语音；根据所述初始用户录制语音的平均音量大小，对调整后的每一帧语音的音量进行平衡处理，获取平衡化后的每一帧语音，并输出平衡化后的每一帧语音。2.根据权利要求1所述的语音处理方法，其特征在于，所述对压限后的用户录制语音进行不完全降噪处理，获取降噪后的用户录制语音，包括：对压限后的用户录制语音进行降噪，使得降噪后的用户录制语音中噪声能量在压限后的用户录制语音中的噪声能量的预设比例范围之内。3.根据权利要求1所述的语音处理方法，其特征在于，所述对初始用户录制语音进行压限处理，获取压限后的用户录制语音，之前包括：对原始用户录制语音进行静音检测，移除所述原始用户录制语音中的空白语音，获取静音检测后的用户录制语音，并将静音检测后的用户录制语音重新作为所述初始用户录制语音。4.根据权利要求1所述的语音处理方法，其特征在于，所述平均音素数量通过如下方式获得：获取所述初始用户录制语音中的所有音素数量；根据所述初始用户录制语音的时长和所有音素数量，获取所述平均音素数量。5.根据权利要求1所述的语音处理方法，其特征在于，所述根据所述初始用户录制语音的平均音素数量，调整消歧后的用户录制语音中预先分帧的每一帧语音中的因素个数，获取调整后的每一帧语音，具体包括：根据所述平均因素数量，对消歧后的用户录制语音中预先分帧的每一帧语音中因素个数进行调整，使得调整后的每一帧语音的音素数量均在预设音素范围之内，获取调整后的每一帧语音。6.根据权利要求1至5任一所述的语音处理方法，其特征在于，所述根据所述初始用户录制语音的平均音量大小，对调整后的每一帧语音的音量进行平衡处理，获取平衡化后的每一帧语音，包括：根据所述初始用户录制语音的平均音量，获取最大音量和最小音量；压缩调整后的每一帧语音中大于所述最大音量的音量，放大每一帧语音中小于所述最小音量的音量；获取平衡化后的每一帧语音。7.根据权利要求1至5所述的语音处理方法，其特征在于，所述对降噪后的用户录制语音进行消歧，获取消歧后的用户录制语音，包括：将降噪后的用户录制语音输入到消歧神经网络中，获取消歧后的用户录制语音。8.一种语音处理系统，其特征在于，包括：压限模块，用于对初始用户录制语音进行压限处理，获取压限后的用户录制语音；
降噪模块，用于对压限后的用户录制语音进行不完全降噪处理，获取降噪后的用户录制语音；消歧模块，用于对降噪后的用户录制语音进行消歧，获取消歧后的用户录制语音；分帧模块，用于根据所述初始用户录制语音的平均音素数量，调整消歧后的用户录制语音中预先分帧的每一帧语音中的因素个数，获取调整后的每一帧语音；平衡模块，用于根据所述初始用户录制语音的平均音量大小，对调整后的每一帧语音的音量进行平衡处理，获取平衡化后的每一帧语音，并输出平衡化后的每一帧语音。9.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述语音处理方法的步骤。10.一种计算机存储介质，所述计算机存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述语音处理方法的步骤。

技术总结
本发明提出一种语音处理方法、系统、设备及存储介质，该方法包括：对初始用户录制语音进行压限处理，获取压限后的用户录制语音；对压限后的用户录制语音进行不完全降噪处理，获取降噪后的用户录制语音；对降噪后的用户录制语音进行消歧，获取消歧后的用户录制语音；根据初始用户录制语音的平均音素数量，调整消歧后的用户录制语音中预先分帧的每一帧语音中因素的个数，获取调整后的每一帧语音；根据初始用户录制语音的平均音量大小，对调整后的每一帧语音的音量进行平衡处理，获取平衡化后的每一帧语音，并输出平均化后的每一帧语音。本发明使得用户录制语音更加顺畅，提升了听话人的听觉感受。的听觉感受。的听觉感受。

技术研发人员：邓园旻邹昆伦
受保护的技术使用者：平安科技（深圳）有限公司
技术研发日：2022.03.16
技术公布日：2022/7/8

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种音乐教学用乐器打击装置及其使用方法与流程

语音处理方法、系统、设备及存储介质与流程

相关文献

最热文献