一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

经由音频分类进行动态音量调节的方法和装置与流程

2021-11-05 18:34:00 来源:中国专利 TAG:

技术特征:
1.一种装置,所述装置包括:音频信号分类器,所述音频信号分类器利用神经网络对与第一音量水平相关联的音频信号的参数进行分析,以确定与所述音频信号相关联的分类组;输入音量检测器,所述输入音量检测器确定所述音频信号的输入音量;音量调节器,所述音量调节器向所述音频信号施加增益值,所述增益值基于所述分类组和所述输入音量,所述增益值将所述第一音量水平修改成第二音量水平;以及动态范围压缩器,所述动态范围压缩器向所述音频信号施加压缩值,所述压缩值将所述第二音量水平修改成满足目标音量阈值的第三音量水平。2.根据权利要求1所述的装置,所述装置还包括源改变确定器,所述源改变确定器确定所述音频信号的源是否已改变。3.根据权利要求2所述的装置,其中,所述源改变确定器基于以下至少一项来确定所述音频信号的所述源是否已改变:(1)所述音频信号所关联的当前压缩器增益与所述音频信号所关联的先前压缩器增益的比较,(2)所述音频信号所关联的rms功率与所述音频信号所关联的先前rms功率的比较,或者(3)所述音频信号所关联的当前音频样本值与所述音频信号所关联的先前音频样本值的比较。4.根据权利要求2所述的装置,其中,所述音量调节器还响应于确定所述音频信号的所述源已改变而重置所述音频信号的所述增益值。5.根据权利要求1所述的装置,其中,所述分类组与以下至少一项相关联:(1)由所述音频信号表示的音乐的流派,(2)由所述音频信号表示的所述音乐的时间段,或者(3)由所述音频信号表示的所述音乐中存在的乐器。6.根据权利要求1所述的装置,其中,所述输入音量检测器还确定第一时间段内的第四音量水平未落在所述目标音量阈值内,所述第一时间段在第二时间段之后发生,所述第三音量水平与所述第二时间段相关联;并且所述动态范围压缩器还调节所述压缩值以适应第五音量水平,经调节的压缩值将所述第四音量水平修改成满足所述目标音量阈值的第五音量水平。7.根据权利要求1所述的装置,其中,所述目标音量阈值处于5满刻度相对分贝(dbfs)至21dbfs内。8.一种非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质包括指令,所述指令在被执行时使处理器至少:利用神经网络对与第一音量水平相关联的音频信号的参数进行分析,以确定与所述音频信号相关联的分类组;确定所述音频信号的输入音量;向所述音频信号施加增益值,所述增益值基于所述分类组和所述输入音量,所述增益值将所述第一音量水平修改成第二音量水平;以及向所述音频信号施加压缩值,所述压缩值将所述第二音量水平修改成满足目标音量阈值的第三音量水平。9.根据权利要求8所述的非暂时性计算机可读存储介质,其中,所述指令在被执行时使所述处理器确定所述音频信号的源是否已改变。
10.根据权利要求9所述的非暂时性计算机可读存储介质,其中,确定所述音频信号的源是否已改变是基于以下至少一项进行的:(1)所述音频信号所关联的当前压缩器增益与所述音频信号所关联的先前压缩器增益的比较,(2)所述音频信号所关联的rms功率与所述音频信号所关联的先前rms功率的比较,或者(3)所述音频信号所关联的当前音频样本值与所述音频信号所关联的先前音频样本值的比较。11.根据权利要求9所述的非暂时性计算机可读存储介质,其中,所述指令在被执行时使所述处理器:响应于确定所述音频信号的所述源已改变,重置所述音频信号的所述增益值。12.根据权利要求11所述的非暂时性计算机可读存储介质,其中,所述分类组与以下至少一项相关联:(1)由所述音频信号表示的音乐的流派,(2)由所述音频信号表示的所述音乐的时间段,或者(3)由所述音频信号表示的所述音乐中存在的乐器。13.根据权利要求8所述的非暂时性计算机可读存储介质,其中,所述指令在被执行时使所述处理器:确定第一时间段内的第四音量水平未落在所述目标音量阈值内,所述第一时间段在第二时间段之后发生,所述第三音量水平与所述第二时间段相关联;以及调节所述压缩值以适应第五音量水平,经调节的压缩值将所述第四音量水平修改成满足所述目标音量阈值的第五音量水平。14.根据权利要求1所述的方法,其中,所述目标音量阈值处于5满刻度相对分贝(dbfs)至21dbfs内。15.一种方法,所述方法包括以下步骤:利用神经网络对与第一音量水平相关联的音频信号的参数进行分析,以确定与所述音频信号相关联的分类组;确定所述音频信号的输入音量;向所述音频信号施加增益值,所述增益值基于所述分类组和所述输入音量,所述增益值将所述第一音量水平修改成第二音量水平;以及向所述音频信号施加压缩值,所述压缩值将所述第二音量水平修改成满足目标音量阈值的第三音量水平。16.根据权利要求15所述的方法,所述方法还包括以下步骤:确定所述音频信号的源是否已改变。17.根据权利要求16所述的方法,其中,确定所述音频信号的源是否已改变的步骤是基于以下至少一项进行的:(1)所述音频信号所关联的当前压缩器增益与所述音频信号所关联的先前压缩器增益的比较,(2)所述音频信号所关联的rms功率与所述音频信号所关联的先前rms功率的比较,或者(3)所述音频信号所关联的当前音频样本值与所述音频信号所关联的先前音频样本值的比较。18.根据权利要求16所述的方法,所述方法还包括以下步骤:响应于确定所述音频信号的所述源已改变,重置所述音频信号的所述增益值。19.根据权利要求15所述的方法,其中,所述分类组与以下至少一项相关联:(1)由所述音频信号表示的音乐的流派,(2)由所述音频信号表示的所述音乐的时间段,或者(3)由所述音频信号表示的所述音乐中存在的乐器。
20.根据权利要求15所述的方法,所述方法还包括以下步骤:确定第一时间段内的第四音量水平未落在所述目标音量阈值内,所述第一时间段在第二时间段之后发生,所述第三音量水平与所述第二时间段相关联;以及调节所述压缩值,以将所述第四音量水平修改成满足所述目标音量阈值的第五音量水平。

技术总结
公开了经由音频分类进行动态音量调节的方法、装置、系统和制品。示例方法包括:利用经神经网络训练的模型对与第一音量水平相关联的音频信号的参数进行分析,以确定与音频信号相关联的分类组;确定音频信号的输入音量,所述选择基于与音频信号相关联的分类组;向音频信号施加增益值,所述增益值基于分类组和输入音量,所述增益值将第一音量水平修改成第二音量水平;以及向音频信号施加压缩值,所述压缩值将第二音量水平修改成满足目标音量阈值的第三音量水平。第三音量水平。第三音量水平。


技术研发人员:M
受保护的技术使用者:格雷斯诺特有限公司
技术研发日:2019.09.06
技术公布日:2021/11/4
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献