一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种音乐作品提取方法与流程

2022-07-10 12:23:55 来源:中国专利 TAG:


1.本发明涉及在线教育技术领域,尤其涉及一种音乐作品提取方法。


背景技术:

2.在线教育是一种新生事物,产生与发展的时间不长,人们对在线教育的认识也在不断深化和完善。当前对在线教育的认识有多种观点,目前我们认为在线教育既是一种教育理念,也是一种教育手段,又是一种教学组织形式,同时还是一种学习方式。它是以计算机通信技术和网络技术为依托,结合了现代信息技术,采用远程实时多点、双向交互式的多媒体现代化教学手段,可以实时传送文本、声音、图像、图形、电子课件和教师板书的实现跨越时空的教育传递过程,为人们提供丰富的学习资源创造具有良好的交互性、智能化乃至仿真的学习环境―虚拟学校、虚拟课堂、虚拟图书馆等,是人们获得“自我教育”和“终身教育”的最佳方式。
3.而对于音乐课程在网络上进行教学的时,通常需要先对音乐作品中各乐器进行学习,而常有的音乐作品中,乐器的涉及往往不止一种且较为复杂,在进行音乐教学时,无法清晰的识别出不同乐器的音乐,大大增加了对于在线教育而言音乐教学的难度。


技术实现要素:

4.为了现有技术存在的上述技术缺陷,本发明提供了一种音乐作品提取方法,可以有效解决背景技术中的问题。
5.为了解决上述技术问题,本发明提供的技术方案具体如下:
6.本发明实施例公开了一种音乐作品提取方法,所述方法包括以下步骤:将样本音乐根据不同乐器的参数进行小波包分解,并获得特征向量;将获得的特征向量进行降维处理,并减少不重要特征对重要特征及图形特征提取的干扰;基于特征向量通过bp神经网络对实际音乐进行乐器声音识别。
7.在上述任一方案中优选的是,通过对音乐作品进行分析,将每一种乐器所创造的作品进行分类,对每一个语音样本都进行2n层小波包分解,以实现通过小波包分解对每一个语音样本的频域进行细微的划分。
8.在上述任一方案中优选的是,设置采集的信号为30khz,根据采样定理可包含0-15khz的频率宽度,对每一个分解得到的系数分量计算系数能量比参数re,提取到的re参数对于每一个音频可形成2
(n 1)-2个维度特征向量。
9.在上述任一方案中优选的是,定义小波包系数能量为:其中cp为小波包分解第p个节点的系数,l为整个节点的系数长度,小波包系数能量比re可通过cep除于原信号能量得到。
10.在上述任一方案中优选的是,设待处理的高维数据样本的集合为x=(x1,x2,

,xi,

,xn),n为样本总数,xi=(x
i1
,x
i2
,

,x
im
),m为特征维数,并绘制雷达图。
11.在上述任一方案中优选的是,通过以下步骤绘制雷达图:
12.(1)通过公式对样本进行归一化,归一化后,可以消除数据的量纲,其中
13.(2)绘制一个单位圆,并将其m等分。每一维数据在雷达图上的角度数2π/m,起始的角度为0;
14.(3)绘制每一维数据在其对应角度上的数值轴,将x
ij
,(j=1,2,

,m)分别画到m等分的轴上,将这m个点以折线连接起来,从而构成一个闭合的多边形,其每个样本的每维的坐标公式为:(a
ij
=x
ij
cosθ
ij
,b
ij
=x
ij
sinθ
ij
),其中,
15.(4)重复步骤(3),直到把每个样本均绘制完毕。
16.在上述任一方案中优选的是,设原始特征pf为(x1,x2,

,xi,

,xn),xi表示第i维特征,n为特征维数;特征融合降维的算法如下:
17.输入:原始特征pf(x1,x2,

,xi,

,xn)
18.输出:特征融合降维后特征vis-pf
19.(ⅰ)fvalue值计算:对每维特征xi计算其fvalue值fi;
20.(ⅱ)特征排序:对所有特征(x1,x2,

,xi,

,xn)按fvalue值的大小降序排列,得到排列后的特征(x
’1,x
’2,

,x’i
,

,x’n
)及fvalue值排列(f
’1,f
’2,

,f’i
,

,f’n
),其中f
’1≥f
’2≥

≥f’i


≥f’n

21.(ⅲ)分层:对所有特征的fvalue值求平均,得到f_mean,求得第一个小于f_mean的点f_first,即f
’1≥f
’2≥f’f-first-1
≥f_mean,f_mean<f’f-first-1
,则将(x
’1,x
’2,

,x’f-first-1
)作为第一层,计算f_first至n的fvalue的平均值f_mean2,同理求得第一个小于f_mean2的点f_second,将(x’f-first
,x’f2
,

,x’n
)作为第二层;
22.(ⅳ)可视化融合:对第一层数据构成雷达图,并求取雷达图的三角形的重心特征,以完成可视化特征融合,对第二层数据构成雷达图,并求取雷达图的四边形的中心特征,以完成可视化特征融合,将每层特征融合后的特征组合构造出初始特征融合集s


23.(

)对初始特征融合集s

,重复(
ⅰ‑ⅲ
)步骤,得到降维后特征vis-pf。
24.在上述任一方案中优选的是,在(ⅰ)中,用fvalue的定义式计算fvalue值,并按fvalue值的大小进行特征排序,依次映射至雷达图上,其中,fvalue的定义为给定训练样本集xk∈rm,k=1,2,

,n;l(l>2)为样本类别数,nj为第j类的样本个数,j=1,2,,l;训练样本第i个特征的fvalue定义为:本第i个特征的fvalue定义为:为第i个特征在整个训练集上的平均值,为第i个特征在第j类数据集上的平均值,x
jk,i
为第j类的第k个样本点的第i维特征的特征值。
25.9在上述任一方案中优选的是,将实际音乐中每个语音进行小波包分解,获得实际
音乐特征向量并将获得的实际音乐特征向量进行降维处理,得到降维后的实际音乐特征向量。
26.10在上述任一方案中优选的是,将降维后样本音乐的特征向量输入至bp神经网络,并对bp神经网络进行训练,得到bp神经网络的连接权值和阈值,进而将降维后实际音乐特征向量输入至bp网络中,通过训练好的bp网络对实际音乐声音进行识别,进而在实际音乐中识别出不同乐器所演奏的音乐。
27.与现有技术相比,本发明的有益效果:
28.本发明提供的一种音乐作品提取方法通过将样本音乐根据不同乐器的参数进行小波包分解,并获得特征向量;将获得的特征向量进行降维处理,并减少不重要特征对重要特征及图形特征提取的干扰;基于特征向量通过bp神经网络对实际音乐进行乐器声音识别;能够将音乐作品进行分层处理,解决了复杂的音乐作品提取困难的情况,同时可以在一段音乐中识别出不同乐曲的音乐,大大提高了识别音乐乐器的效率。
附图说明
29.附图用于对本发明的进一步理解,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
30.图1是本发明一种音乐作品提取方法的流程图;
31.图2是本发明一种音乐作品提取方法中小波包分解树示意图;
具体实施方式
32.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
33.需要说明的是,当元件被称为“固定于”或“设置于”另一个元件,它可以直接在另一个元件上或者间接在该另一个元件上。当一个元件被称为是“连接于”另一个元件,它可以是直接连接到另一个元件或间接连接至该另一个元件上。
34.在本发明的描述中,需要理解的是,术语“长度”、“宽度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
35.此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
36.为了更好地理解上述技术方案,下面将结合说明书附图及具体实施方式对本发明技术方案进行详细说明。
37.如图1所示,本发明提供了一种音乐作品提取方法,所述方法包括以下步骤:
38.步骤1,将样本音乐根据不同乐器的参数进行小波包分解,并获得特征向量。
39.具体的,在目前音乐作品中,通常会运用多种乐器进行配合演奏,例如钢琴,小提琴,手风琴,竖笛,架子鼓等等,通过对音乐作品进行赏析,可将每一种乐器所创造的作品进行分类,进而针对不同乐器的不同参数进行分类,例如振幅、周期、频率、音高、音色、音量等。
40.其中,音色是区分不同乐器的主要参数,音色又称音品,是指音的感觉特性,主要是由其谐音的多寡、各谐音的特性所决定,例如频率分布、相对强度等;在音乐作品中,某种乐器的演奏曲目是不确定的,没有规律的,甚至比较复杂,但是某种乐器所具有的特定的基波和基波的一系列谐波是固定的,针对不同乐器的音色特征提取可在乐器的演奏中提取频率特征,进而通过频率对音色进行鉴定。
41.进一步的,对音乐作品中每一个语音样本都进行2n层小波包分解,小波包分解树如图2所示,s
i,j
代表第i层,第j个子带的小波包分解;通过小波包分解可以对每一个语音样本的频域进行细微的划分,在音乐作品中,乐器的一般频率范围为0-15khz,设置采集的信号为30khz,根据采样定理可以包含0-15khz的频率宽度,在第一层小波包分解,原始信号被分解为s
1,0
和s
1,1
;其中s
1,0
代表的是0-7500hz频段,s
1,1
代表的是7500-15khz频段,在第二层s
1,0
被继续分解为s
2,1
(0-3750hz)和s
2,2
(3750-7500hz),依次类推。
42.进一步的,在小波包分解的基础上,对于每一个分解得到的系数分量计算系数能量比参数re,首先定义小波包系数能量为:其中c
p
为小波包分解第p个节点的系数,l为整个节点的系数长度,进而,小波包系数能量比re可通过cep除于原信号能量得到,进而最终提取的到的re参数对于每一个音频可形成2
(n 1)-2个维度特征向量。
43.步骤2,将获得的特征向量进行降维处理,并减少不重要特征对重要特征及图形特征提取的干扰。
44.具体的,设待处理的高维数据样本的集合为x=(x1,x2,

,xi,

,xn),n为样本总数,xi=(x
i1
,x
i2
,

,x
im
),m为特征维数,通过以下步骤绘制雷达图:
45.(1)通过公式对样本进行归一化,归一化后,可以消除数据的量纲,其中
46.(2)绘制一个单位圆,并将其m等分。每一维数据在雷达图上的角度数2π/m,起始的角度为0;
47.(3)绘制每一维数据在其对应角度上的数值轴,将x
ij
,(j=1,2,

,m)分别画到m等分的轴上,将这m个点以折线连接起来,从而构成一个闭合的多边形,其每个样本的每维的坐标公式为:(a
ij
=x
ij
cosθ
ij
,b
ij
=x
ij
sinθ
ij
),其中,
48.(4)重复步骤(3),直到把每个样本均绘制完毕。
49.进一步的,设原始特征pf为(x1,x2,

,xi,

,xn),xi表示第i维特征,n为特征维数,可视化特征融合与降维方法的算法如下:
50.输入:原始特征pf(x1,x2,

,xi,

,xn)
51.输出:特征融合降维后特征vis-pf
52.(ⅰ)特征评价值fvalue值计算:对每维特征xi计算其fvalue值fi;
53.(ⅱ)特征排序:对所有特征(x1,x2,

,xi,

,xn)按fvalue值的大小降序排列,得到排列后的特征(x
’1,x
’2,

,x’i
,

,x’n
)及fvalue值排列(f
’1,f
’2,

,f’i
,

,f’n
),其中f
’1≥f
’2≥

≥f’i


≥f’n

54.(ⅲ)分层:对所有特征的fvalue值求平均,得到f_mean,求得第一个小于f_mean的点f_first,即f
’1≥f
’2≥f’f-first-1
≥f_mean,f_mean<f’f-first-1
,则将(x
’1,x
’2,

,x’f-first-1
)作为第一层,计算f_first至n的fvalue的平均值f_mean2,同理求得第一个小于f_mean2的点f_second,将(x’f-first
,x’f2
,

,x’n
)作为第二层;
55.(ⅳ)可视化融合:对第一层数据构成雷达图,并求取雷达图的三角形的重心特征,以完成可视化特征融合,对第二层数据构成雷达图,并求取雷达图的四边形的中心特征,以完成可视化特征融合,将每层特征融合后的特征组合构造出初始特征融合集s


56.(

)对初始特征融合集s

,重复(
ⅰ‑ⅲ
)步骤,得到降维后特征vis-pf。
57.其中,fvalue是一种衡量单个特征对两类样本分辨能力的评价指标,fvalue的定义为给定训练样本集xk∈rm,k=1,2,

,n;l(l>2)为样本类别数,nj为第j类的样本个数,j=1,2,,l。
58.而训练样本第i个特征的fvalue定义为:其中,为第i个特征在整个训练集上的平均值,为第i个特征在第j类数据集上的平均值,x
jk,i
为第j类的第k个样本点的第i维特征的特征值。
59.进一步的,由于fvalue是基于类内类间距离的类别可分性评价指标,其分子表示各类的类间距离之和,分母表示总类内样本协方差,fvalue值越大,表示类间越疏,类内越密,此特征的类辨能力越强,用此特征分类效果越好。
60.在上述(ⅰ)中,通过公式计算fvalue值,并按fvalue值的大小进行特征排序,依次映射至雷达图上,使得区分性好的特征相邻,能够减少不重要特征对重要特征对图像特征提取的干扰。
61.步骤3,基于特征向量通过bp神经网络对实际音乐进行乐器声音识别。
62.具体的,对于实际音乐再次通过上述步骤1-2,将实际音乐中每个语音进行小波包分解,获得实际音乐特征向量并将获得的实际音乐特征向量进行降维处理,得到降维后的实际音乐特征向量。
63.进一步的,将降维后样本音乐的特征向量输入至bp神经网络,并对bp神经网络进行训练,得到bp神经网络的连接权值和阈值,进而将降维后实际音乐特征向量输入至bp网络中,通过训练好的bp网络对实际音乐声音进行识别,进而在实际音乐中识别出不同乐器所演奏的音乐。
64.与现有技术相比,本发明提供的有益效果是:
65.本发明提供的一种音乐作品提取方法通过将样本音乐根据不同乐器的参数进行小波包分解,并获得特征向量;将获得的特征向量进行降维处理,并减少不重要特征对重要特征及图形特征提取的干扰;基于特征向量通过bp神经网络对实际音乐进行乐器声音识别;能够将音乐作品进行分层处理,解决了复杂的音乐作品提取困难的情况,同时可以在一段音乐中识别出不同乐曲的音乐,大大提高了识别音乐乐器的效率。
66.以上仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献