一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

音频处理方法、装置、设备和计算机可读存储介质与流程

2022-05-21 04:45:09 来源:中国专利 TAG:

技术特征:
1.一种音频处理方法,其特征在于,所述方法包括:获取待处理音频;对所述待处理音频对应的音频特征进行分类,得到多种音源类型,并展示所述多种音源类型;针对展示的所述多种音源类型,响应于音源类型选择操作,选中目标音源类型;根据所述目标音源类型,对所述待处理音频进行降噪处理,得到目标音频。2.根据权利要求1所述的方法,其特征在于,所述获取待处理音频之后,所述方法还包括:对所述待处理音频进行多维度的特征提取,得到多个维度特征,所述多维度包括时域、频域、空域和幅度中的至少一项;分别对各个维度特征进行归一化,得到多个归一化后的维度特征;根据所述多个归一化后的维度特征,融合得到所述音频特征。3.根据权利要求2所述的方法,其特征在于,所述对所述待处理音频进行多维度的特征提取,得到多个维度特征,包括:根据预设的特征提取模型,对所述待处理音频进行所述多维度的特征提取,得到所述多个维度特征;所述预设的特征提取模型用于特征提取。4.根据权利要求3所述的方法,其特征在于,所述根据预设的特征提取模型,对所述待处理音频进行所述多维度的特征提取,得到所述多个维度特征之前,所述方法还包括:获取预设音源类型的音频样本,所述预设音源类型包括汽笛声、鸟叫声、水流声、风声、乐曲声和设备声中至少一项;基于初始特征提取模型,对各种所述预设音源类型的音频样本分别进行所述多维度的特征提取,得到各种所述预设音源类型的多个维度特征样本;根据各种所述预设音源类型的多个维度特征样本,确定各种所述预设音源类型的音频特征样本;计算各种所述预设音源类型的音频特征样本两两之间的区分度,得到多个特征区分度;若所述多个特征区分度均大于预设阈值,则得到所述预设的特征提取模型。5.根据权利要求4所述的方法,其特征在于,所述计算各种所述预设音源类型的音频特征样本两两之间的区分度,得到多个特征区分度之后,所述方法还包括:若所述多个特征区分度存在小于或等于所述预设阈值的特征区分度,则对所述初始特征提取模型进行参数调整,得到参数调整后的特征提取模型;根据所述参数调整后的特征提取模型,持续对各种所述预设音源类型的音频样本分别进行目标维度的特征提取,直至所述多个特征区分度均大于预设阈值时,得到所述预设的特征提取模型;其中,所述目标维度为所述多维度中的至少一项。6.根据权利要求1-5任一项所述的方法,其特征在于,所述对所述待处理音频对应的音频特征进行分类,得到多种音源类型,包括:基于预设的分类模型对所述待处理音频对应的音频特征进行分类,得到所述多种音源类型,其中,所述预设的分类模型是根据多种预设音源类型的音频特征进行训练得到的。7.根据权利要求1-5任一项所述的方法,其特征在于,所述对所述待处理音频对应的音
频特征进行分类,得到多种音源类型之后,所述方法还包括:基于预设的推荐模型对所述多种音源类型进行降噪预测,生成至少一个降噪方案,并展示所述至少一个降噪方案;其中,所述预设的推荐模型用于预测用户降噪偏好;响应于所述至少一个降噪方案的选择操作,确定目标降噪方案;根据所述目标降噪方案,对所述待处理音频进行降噪处理,得到所述目标音频。8.根据权利要求7所述的方法,其特征在于,所述基于预设的推荐模型对所述多种音源类型进行降噪预测,生成至少一个降噪方案之前,所述方法还包括:获取用户历史行为信息,其中,所述用户历史行为信息包括所选中的历史目标音源类型,和/或,历史降噪方案对应的历史选择方案;根据所述用户历史行为信息,对初始推荐模型进行训练,得到所述预设的推荐模型。9.根据权利要求7所述的方法,其特征在于,所述根据所述目标降噪方案,对所述待处理音频进行降噪处理,得到所述目标音频之后,所述方法还包括:针对同一种音源类型,根据历史选择方案和所述目标降噪方案,确定推荐偏差;根据所述推荐偏差,对所述预设的推荐模型进行调整,得到调整后的推荐模型,所述调整后的推荐模型用于下次推荐降噪方案的过程。10.一种音频处理装置,其特征在于,所述装置包括:获取模块,用于获取待处理音频;分类模块,用于对所述待处理音频对应的音频特征进行分类,得到多种音源类型,并展示所述多种音源类型;响应模块,用于针对展示的所述多种音源类型,响应于音源类型选择操作,选中目标音源类型;降噪模块,用于根据所述目标音源类型,对所述待处理音频进行降噪处理,得到目标音频。11.一种音频处理设备,其特征在于,所述设备包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1-9任一项所述方法中的步骤。12.一种计算机可读存储介质,其特征在于,其上存储有可执行指令,用于被处理器执行时,实现权利要求1-9任一项所述的方法。

技术总结
本申请实施例公开了一种音频处理方法、装置、设备和计算机可读存储介质。该方法包括:获取待处理音频;对待处理音频对应的音频特征进行分类,得到多种音源类型,并展示多种音源类型;通过分类出多种音源类型,便于用户根据自身实际录制环境选择合适的降噪策略。针对展示的多种音源类型,响应于音源类型选择操作,选中目标音源类型,通过用户界面交互,使得降噪策略更适合于不同用户和不同环境。根据目标音源类型对待处理音频进行降噪处理,得到目标音频,提高了音频处理效果。提高了音频处理效果。提高了音频处理效果。


技术研发人员:陈刚
受保护的技术使用者:OPPO广东移动通信有限公司
技术研发日:2022.02.21
技术公布日:2022/5/20
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献