一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于特征分层和改进ECAPA-TDNN的声学场景分类的方法

2022-08-14 01:46:58 来源:中国专利 TAG:

技术特征:
1.一种基于特征分层和改进ecapa-tdnn的声学场景分类的方法,其特征在于,包括:步骤s1、在特征提取阶段,通过预加重、分帧、加窗、滤波操作得到梅尔频谱图;步骤s2、利用梅尔频谱结合谐波增强部分、打击源增强部分和残差部分的相对分量得到梅尔频谱谐波分量、打击源分量和残差分量;步骤s3、得到三层分量后,再将分量作为特征输入进结合群卷积的ecapa-tdnn当中。2.根据权利要求1所述的基于特征分层和改进ecapa-tdnn的声学场景分类的方法,其特征在于,所述步骤s1具体包括:步骤s11、对输入音频信号的高频分离进行补偿,增强其高频部分提高信噪比,弥补其在传输过程中高频分量的衰减;步骤s12、对分帧加窗后的各帧信号做一个n点傅里叶变换来计算频谱;步骤s13、将声音频带从低到高按临界带宽由密到疏设置三角滤波器。3.根据权利要求1所述的基于特征分层和改进ecapa-tdnn的声学场景分类的方法,其特征在于,在步骤s2中,将梅尔频谱的时域分量s
m
(t)和频域分量s
m
(f)的绝对值作为输入信号输入中值滤波器,其输出信号为梅尔频谱的谐波增强部分h
m
和打击源增强部分p
m
;将梅尔频谱的残差部分r
m
定义为:r
m
=|s
m
|-(p
m
h
m
)然后,基于梅尔频谱的谐波增强部分h
m
、打击源增强部分p
m
和残差部分r
m
,计算出其各自的相对分量m
hm
、m
pm
和m
rm
如下:如下:如下:最后,利用梅尔频谱结合谐波增强部分、打击源增强部分和残差部分的相对分量得到梅尔频谱谐波分量c
msh
、梅尔频谱打击源分量c
msp
和梅尔频谱残差分量c
msr
分别为:分别为:分别为:4.根据权利要求1所述的基于特征分层和改进ecapa-tdnn的声学场景分类的方法,其特征在于,在步骤s3中,将时间注意机制进一步扩展到信道维度,能够关注到多个向量间的内部联系,充分激活临近或相似输入向量的隐含特征;设群卷积有三个卷积核,每个卷积核对应一个通道与之独立连接,卷积操作在每个组内完成,组间不共享特征映射,各个组完成卷积后将输出叠在一起作为这一层的最终输出通道。

技术总结
本发明公开了一种基于特征分层和改进ECAPA-TDNN的声学场景分类的方法,包括在特征提取阶段,通过预加重、分帧、加窗、滤波操作得到梅尔频谱图;利用梅尔频谱结合谐波增强部分、打击源增强部分和残差部分的相对分量得到梅尔频谱谐波分量、打击源分量和残差分量;得到三层分量后,再将分量作为特征输入进结合群卷积的ECAPA-TDNN当中。本发明的基于特征分层和改进ECAPA-TDNN的声学场景分类的方法能够忽略背景噪音的同时,减少分类误差,并提升模型分类速度。型分类速度。型分类速度。


技术研发人员:艾欣 赵帅
受保护的技术使用者:辽宁工程技术大学
技术研发日:2022.06.22
技术公布日:2022/8/12
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献