一种数字音乐识别分类方法及系统

2022-11-30 11:42:58 来源：中国专利 TAG：

1.本发明涉及一种数字音乐识别分类方法，特别涉及一种数字音乐识别分类方法及系统，属于数字音频技术领域。

背景技术：

2.数字音乐，是用数字格式存储的，可以通过网络来传输的音乐。无论被下载、复制、播放多少遍，其品质都不会发生变化。数字音乐产业已经确立了它在我国数字内容产业中的重要地位，传统音乐产业、电信运营企业和数字技术新贵们争相进入这一领域，一批具有一定规模、拥有各自竞争优势的代表性企业相继涌现，对在中国市场条件下发展数字音乐产业进行了大量的探索和尝试。
3.目前的数字音乐在音乐根据特性进行识别时，音乐表达的感情色彩是随着乐曲的播放不断变化的，基于整首音乐的分析难以准确的表达音乐情感的跌宕起伏，从而影响音乐的分类识别效果。

技术实现要素：

4.本发明的目的在于提供一种数字音乐识别分类方法及系统，以解决上述背景技术中提出的问题。
5.为实现上述目的，本发明提供如下技术方案：包括以下步骤：
6.s1：把乐曲划分成若干独立小节,通过小节特征,实现音乐特征空间向小节空间的映射；
7.s2：小节特征提取，包括音符特征、节拍特征及小节线的位置信息；
8.s3：根据乐段的特征进行乐段设定乐段划分算法；
9.s4：乐段特征提取，利用字符串匹配算法统计出乐段中的大、小三度的个数从而计算出大、小三度在音乐的乐段中所占的比例；
10.s5：分类识别模型的建立，通过乐段的特征对多个小节进行分类。
11.作为本发明的一种优选技术方案，所述步骤s1中的音乐特征空间向小节空间的映射具体为：从数字音乐存储文件中提取音符的特征根据音符特征提取小节特征，并利用向量夹角余弦判断若干相邻小节的相似性，从而把乐曲划分成若干独立小节，提取小节特征从而实现音乐特征空间向小节空间的映射。
12.作为本发明的一种优选技术方案，所述步骤s2中的小节特征提取具体为：通过小节的音符特征、节拍特征及小节线的位置信息，在音符特征的基础上构建小节的特征向量表示为：bv＝(pa,ps，ia，is,da,ds)其中pa、ps、ia、is、da、ds分别表示小节中音符音高的平均值、音高的稳定性、音强的平均值、音强的稳定性、音长的平均值和音长的稳定性。
13.作为本发明的一种优选技术方案，所述步骤s3中的乐段划分算法具体为：设定三相似性特征向量相似阈值est、最大长度阈值malt和最小长度阈值mnlt，特征向量相似阈值est表示两个相邻小节的相似程度，最大长度阈值malt表示最多有多少小节连接到一起，这
个阈值的设定与乐曲的长短有关通常乐曲是由2至4种特性组成乐曲表达的特性最多不能超过4种，根据乐曲的长短和类型综合设定malt的取值，最小长度阈值mnlt表示最少有多少小节连接到一起，乐曲中有很多特性过渡的小节这种小节仅仅起到过渡作用，不能独立表达特性内涵在本文中把这些小节归到特性转换个，中的下一个特性类型，乐段中小节的个数用pb表示，乐曲中小节的总的个数用mb表示，两个相邻小节bi和b
i 1
之间的特征向量为bvi、bv
i 1
算法如下
14.第一步：如果i≥mb跳到第五步，如果i《mb，利用向量夹角余弦计算两个特征向量间的距离量度，继续第二步；
15.第二步：距离量度大于est，继续第三步，否则跳到第四步；
16.第三步：pb＜malt，连接bi和b
i 1
；i ；pb ，并重复第一步，否则开设一个新乐段，i ；pb＝0，并重复第一步；
17.第四步：如果pb＜mnlt，连接bi和b
i 1
；i ；pb ，并重复第一步，否则开设一个新乐段，i ；pb＝0，并重复第一步；
18.第五步：退出循环，算法结束。
19.作为本发明的一种优选技术方案，所述阈值的选取为经验值。
20.作为本发明的一种优选技术方案，所述步骤s4中的计算出大、小三度在音乐的乐段中所占的比例具体为：
21.乐段中的大、小三度的个数(分别用n1、n2表示)从而计算出大、小三度在音乐的乐段中所占的比例(分别用ma1、ma2表示)，n标识乐段中音符个数则：
22.ma1＝n1/n-1；ma2＝n2/n-1。
23.作为本发明的一种优选技术方案，所述步骤s5的分类识别模型建立包括以下步骤：
24.第一步：输入层和输出层的设计，将乐段分为：分为神圣、悲伤、向往、抒情、轻盈、快乐、热情、生机8种类型；
25.第二步：网路结构的设计，根据kolmogorov定理构建网络结构，对样本进行训练；
26.第三步：网络训练参数的设定，用归一化函数prestd把特征参数归一化到[0，1]之间.通过训练集不断修正网络的连接权值和阈值使网络收敛然后利用测试集检验bp网络识别的准确性构建分类识别模型。
[0027]
作为本发明的一种优选技术方案，应用于权利要求1-7任意一项所述的一种数字音乐识别分类方法，包括预处理模块、特征提取模块、em算法重估模块、hmm模板和bp识别模型模块；
[0028]
预处理模块：把乐曲划分成若干独立小节,通过小节特征,实现音乐特征空间向小节空间的映射；
[0029]
特征提取模块：小节特征提取和乐段特征提取；
[0030]
em算法重估模块：根据乐段的特征进行乐段设定乐段划分；
[0031]
hmm模板：计算出大、小三度在音乐的乐段中所占的比例；
[0032]
bp识别模型模块：用于数字音乐识别分类。
[0033]
与现有技术相比，本发明的有益效果是：
[0034]
本发明一种数字音乐识别分类方法及系统，通过将数字音乐按照将乐曲特性划分
为若干独立的小节提取乐段特征，并利用bp神经网络进行建模，对分段式乐曲特性进行识别分类，有效的改善数字音乐的分类方式，提高了音乐的分类效果，便于对数字音乐进行归类整理。
附图说明
[0035]
图1为本发明的系统框图；
具体实施方式
[0036]
下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0037]
请参阅图1，本发明提供了一种数字音乐识别分类方法及系统的技术方案：
[0038]
根据图1所示，包括以下步骤：
[0039]
s1：把乐曲划分成若干独立小节,通过小节特征,实现音乐特征空间向小节空间的映射；
[0040]
s2：小节特征提取，包括音符特征、节拍特征及小节线的位置信息；
[0041]
s3：根据乐段的特征进行乐段设定乐段划分算法；
[0042]
s4：乐段特征提取，利用字符串匹配算法统计出乐段中的大、小三度的个数从而计算出大、小三度在音乐的乐段中所占的比例；
[0043]
s5：分类识别模型的建立，通过乐段的特征对多个小节进行分类。
[0044]
步骤s1中的音乐特征空间向小节空间的映射具体为：从数字音乐存储文件中提取音符的特征根据音符特征提取小节特征，并利用向量夹角余弦判断若干相邻小节的相似性，从而把乐曲划分成若干独立小节，提取小节特征从而实现音乐特征空间向小节空间的映射。
[0045]
步骤s2中的小节特征提取具体为：通过小节的音符特征、节拍特征及小节线的位置信息，在音符特征的基础上构建小节的特征向量表示为：bv＝(pa,ps，ia，is,da,ds)其中pa、ps、ia、is、da、ds分别表示小节中音符音高的平均值、音高的稳定性、音强的平均值、音强的稳定性、音长的平均值和音长的稳定性。
[0046]
步骤s3中的乐段划分算法具体为：设定三相似性特征向量相似阈值est、最大长度阈值malt和最小长度阈值mnlt，特征向量相似阈值est表示两个相邻小节的相似程度，最大长度阈值malt表示最多有多少小节连接到一起，阈值的选取为经验值，这个阈值的设定与乐曲的长短有关通常乐曲是由2至4种特性组成乐曲表达的特性最多不能超过4种，根据乐曲的长短和类型综合设定malt的取值，最小长度阈值mnlt表示最少有多少小节连接到一起，乐曲中有很多特性过渡的小节这种小节仅仅起到过渡作用，不能独立表达特性内涵在本文中把这些小节归到特性转换个，中的下一个特性类型，乐段中小节的个数用pb表示，乐曲中小节的总的个数用mb表示，两个相邻小节bi和b
i 1
之间的特征向量为bvi、bv
i 1
算法如下
[0047]
第一步：如果i≥mb跳到第五步，如果i《mb，利用向量夹角余弦计算两个特征向量间的距离量度，继续第二步；
[0048]
第二步：距离量度大于est，继续第三步，否则跳到第四步；
[0049]
第三步：pb＜malt，连接bi和b
i 1
；i ；pb ，并重复第一步，否则开设一个新乐段，i ；pb＝0，并重复第一步；
[0050]
第四步：如果pb＜mnlt，连接bi和b
i 1
；i ；pb ，并重复第一步，否则开设一个新乐段，i ；pb＝0，并重复第一步；
[0051]
第五步：退出循环，算法结束。
[0052]
步骤s4中的计算出大、小三度在音乐的乐段中所占的比例具体为：
[0053]
乐段中的大、小三度的个数(分别用n1、n2表示)从而计算出大、小三度在音乐的乐段中所占的比例(分别用ma1、ma2表示)，n标识乐段中音符个数则：
[0054]
ma1＝n1/n-1；ma2＝n2/n-1。
[0055]
步骤s5的分类识别模型建立包括以下步骤：
[0056]
第一步：输入层和输出层的设计，将乐段分为：分为神圣、悲伤、向往、抒情、轻盈、快乐、热情、生机8种类型；
[0057]
第二步：网路结构的设计，根据kolmogorov定理构建网络结构，对样本进行训练；
[0058]
第三步：网络训练参数的设定，用归一化函数prestd把特征参数归一化到[0，1]之间.通过训练集不断修正网络的连接权值和阈值使网络收敛然后利用测试集检验bp网络识别的准确性构建分类识别模型。
[0059]
训练阶段：训练中对数字语音的特征向量初始化得到初始模型，用baum-welch算法对初始模型进行训练，整个过程一般需要多次迭代并得出最
[0060]
结果，同时给出结束迭代时候的条件。实验开始要先计算所有观察序列的输出概率，并对其进行累加，要得到其总和输出的概率，当这个概率的相对变化小到一定数值时就可以结束迭代，另外，训练过程中还要设定最大迭代次数为一个常数，当迭代的次数超过这个常数时，迭代停止参数估计问题是其在语音信号处理应用中的重要问题，在训练过程中，模型收敛、停止训练的判定方法为：。
[0061]
1、当前后2次的输出概率差值小于一定差值或者模型参数基本不变为
[0062]
2、训练采用固定训练次数的方法。
[0063]
一种数字音乐识别分类方法，包括预处理模块、特征提取模块、em算法重估模块、hmm模板和bp识别模型模块；
[0064]
预处理模块：把乐曲划分成若干独立小节,通过小节特征,实现音乐特征空间向小节空间的映射；
[0065]
特征提取模块：小节特征提取和乐段特征提取；
[0066]
em算法重估模块：根据乐段的特征进行乐段设定乐段划分；
[0067]
hmm模板：计算出大、小三度在音乐的乐段中所占的比例；
[0068]
bp识别模型模块：用于数字音乐识别分类。
[0069]
在本发明的描述中，需要理解的是，指示的方位或位置关系为基于所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。
[0070]
在本发明中，除非另有明确的规定和限定，例如，可以是固定连接，也可以是可拆卸连接，或成一体；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒
介间接相连，可以是两个元件内部的连通或两个元件的相互作用关系，除非另有明确的限定，对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。
[0071]
尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：动态智能预测和跟踪企业财年预算的方法及装置与流程

一种数字音乐识别分类方法及系统

相关文献

最热文献