一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于无缝音频融合的方法、系统和介质与流程

2022-07-13 16:42:15 来源:中国专利 TAG:

技术特征:
1.一种用于在播放列表中的音频项之间过渡的方法,所述方法包括:识别音频项的播放列表中的音频项序列,其中所述音频项序列包括第一音频项和第二音频项,所述第二音频项将在所述第一音频项之后播放;和修改所述第一音频项的结束部分和所述第二音频项的开始部分,其中所述第一音频项的结束部分和所述第二音频项的开始部分将被同时播放以在所述第一音频项和所述第二音频项之间过渡,其中,所述第一音频项的结束部分和所述第二音频项的开始部分具有重叠持续时间,并且其中,修改所述第一音频项的结束部分和所述第二音频项的开始部分包括:生成与所述第一音频项的结束部分相对应的第一声谱图和与所述第二音频项的开始部分相对应的第二声谱图;对于一系列频带中的每个频带,识别所述第一音频项的结束部分内的所述第一声谱图和所述第二音频项的开始部分内的所述第二声谱图具有特定互相关的窗口;对于所述一系列频带中的每个频带,修改所述第一声谱图的结束部分和所述第二声谱图的开始部分,使得所述频带内的频率的幅度在所述第一声谱图内在所述第一声谱图的结束部分减小,并且所述频带内的频率的幅度在所述第二声谱图内在所述第二声谱图的开始部分增加;以及基于所述第一声谱图的修改的结束部分生成包括所述第一音频项的修改的结束部分的所述第一音频项的修改版本,并且基于所述第二声谱图的修改的开始部分生成包括所述第二音频项的修改的开始部分的所述第二音频项的修改版本。2.根据权利要求1所述的方法,还包括:基于所述第一声谱图和所述第二声谱图识别所述重叠持续时间。3.根据权利要求1或2所述的方法,其中,对于所述一系列频带中的每个频带识别所述第一音频项的结束部分内的所述第一声谱图和所述第二音频项的开始部分内的所述第二声谱图具有高互相关的窗口包括:基于在所述一系列频带中的最低频带内所述第一声谱图的结束部分和所述第二声谱图的开始部分的所述互相关,识别所述最低频带的第一窗口;以及基于在与所述最低频带相邻的频带内所述第一声谱图的结束部分和所述第二声谱图的开始部分的所述互相关,识别与所述最低频带相邻的频带的第二窗口,其中所述第二窗口短于所述第一窗口。4.根据权利要求3所述的方法,其中,所述第二窗口与所述第一窗口重叠。5.根据权利要求1至4中的任一项所述的方法,其中,与所述第二音频项的修改的开始部分叠加的所述第一音频项的修改的结束部分的声谱图的相位在所述重叠的开始部分处与所述第一音频项的相位匹配,并且在所述重叠的结束部分处与所述第二音频项的相位匹配。6.根据权利要求1至5中的任一项所述的方法,其中,修改所述第一音频项的结束部分和所述第二音频项的开始部分包括:修改在所述第一音频项的结束部分期间所述第一音频项的节奏和在所述第二音频项的开始部分期间所述第二音频项的节奏。7.根据权利要求6所述的方法,其中,修改在所述第一音频项的结束部分期间所述第一音频项的节奏和在所述第二音频项的开始部分期间所述第二音频项的节奏是响应于确定
在所述第一音频项的结束部分期间所述第一音频项的节奏与在所述第二歌曲的开始部分期间所述第二音频项的节奏相差超过预定阈值。8.根据权利要求1至7中的任一项所述的方法,其中,由所述用户设备产生所述音频项的播放列表包括:结合所述重叠持续时间的指示来向所述用户设备传输所述第一音频项的修改版本和所述第二音频项的修改版本。9.根据权利要求1至8中的任一项所述的方法,还包括:结合所述音频项的播放列表的标识符来存储所述第一音频项的修改版本和所述第二音频项的修改版本。10.根据权利要求1至9中的任一项所述的方法,还包括:从用户设备接收用于呈现所述音频项的播放列表的请求;和使得所述音频项的播放列表由所述用户设备呈现,其中呈现所述音频项的播放列表包括:呈现所述第一音频项的修改版本和所述第二音频项的修改版本,并且其中所述第一音频项的修改版本的修改的结束部分与所述第二音频项的修改版本的修改的开始部分是同时播放的。11.一种用于在播放列表中的音频项之间过渡的系统,所述系统包括:存储器;和硬件处理器,当执行所述存储器中的计算机可执行指令时,所述硬件处理器被配置成:识别音频项的播放列表中的音频项序列,其中所述音频项序列包括第一音频项和第二音频项,所述第二音频项将在所述第一音频项之后播放;和修改所述第一音频项的结束部分和所述第二音频项的开始部分,其中所述第一音频项的结束部分和所述第二音频项的开始部分将被同时播放以在所述第一音频项和所述第二音频项之间过渡,其中,所述第一音频项的结束部分和所述第二音频项的开始部分具有重叠持续时间,并且其中,修改所述第一音频项的结束部分和所述第二音频项的开始部分包括:生成与所述第一音频项的结束部分相对应的第一声谱图和与所述第二音频项的开始部分相对应的第二声谱图;对于一系列频带中的每个频带,识别所述第一音频项的结束部分内的所述第一声谱图和所述第二音频项的开始部分内的所述第二声谱图具有特定互相关的窗口;对于所述一系列频带中的每个频带,修改所述第一声谱图的结束部分和所述第二声谱图的开始部分,使得所述频带内的频率的幅度在所述第一声谱图内在所述第一声谱图的结束部分减小,并且所述频带内的频率的幅度在所述第二声谱图内在所述第二声谱图的开始部分增加;以及基于所述第一声谱图的修改的结束部分生成包括所述第一音频项的修改的结束部分的所述第一音频项的修改版本,并且基于所述第二声谱图的修改的开始部分生成包括所述第二音频项的修改的开始部分的所述第二音频项的修改版本。12.根据权利要求11所述的系统,其中,所述硬件处理器还被配置成:基于所述第一声谱图和所述第二声谱图识别所述重叠持续时间。13.根据权利要求11或12所述的系统,其中,对于所述一系列频带中的每个频带识别所述第一音频项的结束部分内的所述第一声谱图和所述第二音频项的开始部分内的所述第二声谱图具有高互相关的窗口包括:
基于在所述一系列频带中的最低频带内所述第一声谱图的结束部分和所述第二声谱图的开始部分的所述互相关,识别所述最低频带的第一窗口;以及基于在与所述最低频带相邻的频带内所述第一声谱图的结束部分和所述第二声谱图的开始部分的所述互相关,识别与所述最低频带相邻的频带的第二窗口,其中所述第二窗口短于所述第一窗口。14.根据权利要求13所述的系统,其中,所述第二窗口与所述第一窗口重叠。15.根据权利要求11至14中的任一项所述的系统,其中,与所述第二音频项的修改的开始部分叠加的所述第一音频项的修改的结束部分的声谱图的相位在所述重叠的开始部分处与所述第一音频项的相位匹配,并且在所述重叠的结束部分处与所述第二音频项的相位匹配。16.根据权利要求11至15中的任一项所述的系统,其中,修改所述第一音频项的结束部分和所述第二音频项的开始部分包括:修改在所述第一音频项的结束部分期间所述第一音频项的节奏和在所述第二音频项的开始部分期间所述第二音频项的节奏。17.根据权利要求16所述的系统,其中,修改在所述第一音频项的结束部分期间所述第一音频项的节奏和在所述第二音频项的开始部分期间所述第二音频项的节奏是响应于确定在所述第一音频项的结束部分期间所述第一音频项的节奏与在所述第二音频项的开始部分期间所述第二音频项的节奏相差超过预定阈值。18.根据权利要求11至17中的任一项所述的系统,其中,由所述用户设备产生所述音频项的播放列表包括:结合所述重叠持续时间的指示来向所述用户设备传输所述第一音频项的修改版本和所述第二音频项的修改版本。19.根据权利要求11至18中的任一项所述的系统,其中,所述硬件处理器还被配置成:结合所述音频项的播放列表的标识符来存储所述第一音频项的修改版本和所述第二音频项的修改版本。20.根据权利要求11至19中的任一项所述的系统,其中,所述硬件处理器还被配置成:从用户设备接收用于呈现所述音频项的播放列表的请求;和使得所述音频项的播放列表由所述用户设备呈现,其中呈现所述音频项的播放列表包括:呈现所述第一音频项的修改版本和所述第二音频项的修改版本,并且其中所述第一音频项的修改版本的修改的结束部分与所述第二音频项的修改版本的修改的开始部分是同时播放的。21.一种包含计算机可执行指令的计算机可读介质,所述计算机可执行指令当由处理器执行时使得所述处理器执行用于在播放列表中的音频项之间过渡的方法,所述方法包括:识别音频项的播放列表中的音频项序列,其中所述音频项序列包括第一音频项和第二音频项,所述第二音频项将在所述第一音频项之后播放;和修改所述第一音频项的结束部分和所述第二音频项的开始部分,其中所述第一音频项的结束部分和所述第二音频项的开始部分将被同时播放以在所述第一音频项和所述第二音频项之间过渡,其中,所述第一音频项的结束部分和所述第二音频项的开始部分具有重叠持续时间,并且其中,修改所述第一音频项的结束部分和所述第二音频项的开始部分包括:
生成与所述第一音频项的结束部分相对应的第一声谱图和与所述第二音频项的开始部分相对应的第二声谱图;对于一系列频带中的每个频带,识别所述第一音频项的结束部分内的所述第一声谱图和所述第二音频项的开始部分内的所述第二声谱图具有特定互相关的窗口;对于所述一系列频带中的每个频带,修改所述第一声谱图的结束部分和所述第二声谱图的开始部分,使得所述频带内的频率的幅度在所述第一声谱图内在所述第一声谱图的结束部分减小,并且所述频带内的频率的幅度在所述第二声谱图内在所述第二声谱图的开始部分增加;以及基于所述第一声谱图的修改的结束部分生成包括所述第一音频项的修改的结束部分的所述第一音频项的修改版本,并且基于所述第二声谱图的修改的开始部分生成包括所述第二音频项的修改的开始部分的所述第二音频项的修改版本。

技术总结
根据所公开主题的一些实施例,提供了用于在播放列表中的音频项之间的无缝音频融合的机制。在一些实施例中,提供了一种用于在播放列表中的音频项之间过渡的方法,包括:识别音频项的播放列表中的音频项序列,其中音频项序列包括第一音频项和第二音频项,第二音频项将在第一音频项之后播放;和修改第一音频项的结束部分和第二音频项的开始部分,其中第一音频项的结束部分和第二音频项的开始部分将被同时播放以在第一音频项和第二音频项之间过渡,其中,第一音频项的结束部分和第二音频项的开始部分具有重叠持续时间,并且其中,修改第一音频项的结束部分和第二音频项的开始部分包括:生成对应于第一音频项的结束部分的第一声谱图和对应于第二音频项的开始部分的第二声谱图;对于一系列频带中的每个频带,识别第一音频项的结束部分内的第一声谱图和第二音频项的开始部分内的第二声谱图在其上具有特定的互相关的窗口;对于一系列频带中的每个频带,修改第一声谱图的结束部分和第二声谱图的开始部分,使得频带内的频率幅度在第一声谱图内在第一声谱图的结束部分上减小,并且频带内的频率幅度在第二声谱图内在第二声谱图的开始部分上增加;以及基于第一声谱图的修改的结束部分生成包括第一音频项的修改的结束部分的第一音频项的修改版本,并且基于第二声谱图的修改的开始部分生成包括第二音频项的修改的开始部分的第二音频项的修改版本。的开始部分的第二音频项的修改版本。的开始部分的第二音频项的修改版本。


技术研发人员:米歇尔
受保护的技术使用者:谷歌有限责任公司
技术研发日:2019.12.02
技术公布日:2022/7/12
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献