一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种相似歌曲检索方法、装置、设备以及存储介质与流程

2021-10-19 23:54:00 来源:中国专利 TAG:人工智能 深度 装置 检索 公开

技术特征:
1.一种相似歌曲检索方法,包括:获取待识别的目标音频;提取所述目标音频中的常数q变换cqt音频特征;其中,cqt音频特征为通过cqt算法所提取的音频特征;将所述目标音频的cqt音频特征输入预先训练的目标网络模型,得到所述目标音频的特征向量;其中,所述目标网络模型是基于样本音频的样本特征训练得到的、用于进行特征向量提取的模型;所述样本特征是基于所述样本音频的cqt音频特征所确定的音频特征;基于多个备选歌曲的特征向量和所述目标音频的特征向量的相似度,从多个备选歌曲中查找所述目标音频的相似歌曲。2.根据权利要求1所述的方法,其中,所述样本特征是将所述样本音频的cqt音频特征进行指定预处理后所得到的音频特征;其中,所述指定预处理包括随机化处理,所述随机化处理包括利用指定数值随机替换部分特征内容,和/或,利用随机数值替换指定的部分特征内容。3.根据权利要求2所述的方法,其中,所述指定预处理还包括:对随机化处理后的cqt特征进行归一化处理。4.根据权利要求1

3任一项所述的方法,其中,所述目标网络模型是预先训练的歌曲分类模型中的特征向量提取网络;其中,所述歌曲分类模型是基于所述样本音频的样本特征和所述样本音频的歌曲分类结果所训练得到的模型。5.根据权利要求1

4任一项所述的方法,其中,所述基于多个备选歌曲的特征向量和所述目标音频的特征向量的相似度,从多个备选歌曲中查找所述目标音频的相似歌曲,包括:从多个备选歌曲的特征向量中,检索与所述目标音频的特征向量相似度最高的目标特征向量;若所述目标特征向量与所述目标音频的特征向量的相似度大于预设相似度阈值,则将所述目标特征向量所属的备选歌曲,确定为所述目标音频的相似歌曲。6.根据权利要求5所述的方法,其中,从多个备选歌曲的特征向量中,检索与所述目标音频的特征向量相似度最高的目标特征向量,包括:以所述目标音频的特征向量作为检索的输入内容,基于图索引检索的方式,从多个备选歌曲的特征向量中,检索与所述目标音频的特征向量相似度最高的目标特征向量。7.根据权利要求6所述的方法,其中,所述多个备选歌曲的特征向量存储于多个数据库中;所述目标特征向量包括对应于所述多个数据库的多个子目标特征向量;所述若所述目标特征向量与所述目标音频的特征向量的相似度大于预设相似度阈值,则将所述目标特征向量所属的备选歌曲,确定为所述目标音频的相似歌曲之前,所述方法还包括:从多个子目标特征向量中,选取与所述目标音频的特征向量的相似度最高的子目标特征向量;若所述目标特征向量与所述目标音频的特征向量的相似度大于预设相似度阈值,则将所述目标特征向量所属的备选歌曲,确定为所述目标音频的相似歌曲,包括:若选取的子目标特征向量与所述目标音频的特征向量的相似度大于预设相似度阈值,
则将选取的子目标特征向量所属的备选歌曲,确定为所述目标音频的相似歌曲。8.一种相似歌曲检索装置,包括:获取模块,用于获取待识别的目标音频;提取模块,用于提取所述目标音频中的常数q变换cqt音频特征;其中,cqt音频特征为通过cqt算法所提取的音频特征;特征向量生成模块,用于将所述目标音频的cqt音频特征输入预先训练的目标网络模型,得到所述目标音频的特征向量;其中,所述目标网络模型是基于样本音频的样本特征训练得到的、用于进行特征向量提取的模型;所述样本特征是基于所述样本音频的cqt音频特征所确定的音频特征;查找模块,用于基于多个备选歌曲的特征向量和所述目标音频的特征向量的相似度,从多个备选歌曲中查找所述目标音频的相似歌曲。9.根据权利要求8所述的装置,其中,所述样本特征是将所述样本音频的cqt音频特征进行指定预处理后所得到的音频特征;其中,所述指定预处理包括随机化处理,所述随机化处理包括利用指定数值随机替换部分特征内容,和/或,利用随机数值替换指定的部分特征内容。10.根据权利要求9所述的装置,其中,所述指定预处理还包括:对随机化处理后的cqt特征进行归一化处理。11.根据权利要求8

10任一项所述的装置,其中,所述目标网络模型是预先训练的歌曲分类模型中的特征向量提取网络;其中,所述歌曲分类模型是基于所述样本音频的样本特征和所述样本音频的歌曲分类结果所训练得到的模型。12.根据权利要求8

11任一项所述的装置,其中,所述查找模块,包括:检索子模块,用于从多个备选歌曲的特征向量中,检索与所述目标音频的特征向量相似度最高的目标特征向量;确定子模块,用于若所述目标特征向量与所述目标音频的特征向量的相似度大于预设相似度阈值,则将所述目标特征向量所属的备选歌曲,确定为所述目标音频的相似歌曲。13.根据权利要求12所述的装置,其中,所述检索子模块,还用于:以所述目标音频的特征向量作为检索的输入内容,基于图索引检索的方式,从多个备选歌曲的特征向量中,检索与所述目标音频的特征向量相似度最高的目标特征向量。14.根据权利要求13所述的装置,其中,所述多个备选歌曲的特征向量存储于多个数据库中;所述目标特征向量包括对应于所述多个数据库的多个子目标特征向量;所述装置还包括:选取子模块,用于在若所述目标特征向量与所述目标音频的特征向量的相似度大于预设相似度阈值,则将所述目标特征向量所属的备选歌曲,确定为所述目标音频的相似歌曲之前,从多个子目标特征向量中,选取与所述目标音频的特征向量的相似度最高的子目标特征向量;所述确定子模块,还用于:若选取的子目标特征向量与所述目标音频的特征向量的相似度大于预设相似度阈值,则将选取的子目标特征向量所属的备选歌曲,确定为所述目标音频的相似歌曲。
15.一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1

7中任一项所述的方法。16.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1

7中任一项所述的方法。17.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1

7中任一项所述的方法。

技术总结
本公开提供了一种相似歌曲检索方法,涉及人工智能领域,尤其涉及深度学习领域。具体实现方案为:获取待识别的目标音频;提取所述目标音频中的常数Q变换CQT音频特征;将所述目标音频的CQT音频特征输入预先训练的目标网络模型,得到所述目标音频的特征向量;其中,所述目标网络模型是基于样本音频的样本特征训练得到的、用于进行特征向量提取的模型;所述样本特征是基于所述样本音频的CQT音频特征所确定的音频特征;以及,基于多个备选歌曲的特征向量和所述目标音频的特征向量的相似度,从多个备选歌曲中查找所述目标音频的相似歌曲。备选歌曲中查找所述目标音频的相似歌曲。备选歌曲中查找所述目标音频的相似歌曲。


技术研发人员:戴兵
受保护的技术使用者:北京百度网讯科技有限公司
技术研发日:2021.07.09
技术公布日:2021/10/18
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜