一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于特征分解分类器与自适应后处理的声学事件检测系统的制作方法

2021-11-29 13:57:00 来源:中国专利 TAG:

技术特征:
1.基于特征分解分类器与自适应后处理的声学事件检测系统,其特征在于,包括:特征提取网络、特征分解分类器和自适应后处理模块,所述特征提取网络用于获取输入音频特征的高级特征表示;所述特征分解分类器用于分解所述高级特征表示并根据不同事件类型选择相应子特征空间;根据子特征空间信息输出帧级别检测结果;所述自适应后处理模块用于对所述帧级别检测结果做平滑处理,得到最终的检测结果。2.根据权利要求1所述的基于特征分解分类器与自适应后处理的声学事件检测系统,其特征在于,所述特征提取网络包括:复杂教师模型和轻量化学生模型。3.根据权利要求2所述的基于特征分解分类器与自适应后处理的声学事件检测系统,其特征在于,所述复杂教师模型包括:5组双层卷积神经网络模块和2层循环神经网络模块,所述2层循环神经网络模块用于提取所述卷积神经网络模块的时间信息;所述轻量化学生模型包括:3组单层卷积神经网络模块、2层循环神经网络模块;其中,每个卷积神经网络模块包括:标准化层,池化层以及激活函数。4.根据权利要求3所述的基于特征分解分类器与自适应后处理的声学事件检测系统,其特征在于,所述循环神经网络模块的节点个数均与上层所连接的卷积神经网络模块的最后一层节点个数相同。5.根据权利要求2所述的基于特征分解分类器与自适应后处理的声学事件检测系统,其特征在于,所述特征提取网络还用于:通过监督学习与无监督学习相结合的方式,学习不同标注类型音频数据的特征信息;所述不同标注类型音频数据包括:强标记音频数据、弱标记音频数据和无标记音频数据。6.根据权利要求5所述的基于特征分解分类器与自适应后处理的声学事件检测系统,其特征在于,所述监督学习使用交叉熵损失函数;所述无监督学习使用均方误差损失函数;计算所述复杂教师模型与所述轻量化学生模型之间的均方误差损失函数;随着训练的进行,所述轻量化学生模型趋于稳定,使用较小权重μ微调所述复杂教师模型。7.根据权利要求6所述的基于特征分解分类器与自适应后处理的声学事件检测系统,其特征在于,所述总体的损失函数表示为:其中,分别是基于事件级别的分类损失函数和基于帧级别的声学事件检测损失函数;表示复杂教师模型的弱标签损失,表示轻量化学生模型的弱标签损失,表示复杂教师模型的强标签损失,表示轻量化学生模型的强标签损失;表示复杂的教师模型指导学生模型,表示学生模型微调教师模型。
8.根据权利要求7所述的基于特征分解分类器与自适应后处理的声学事件检测系统,其特征在于,每次迭代训练时,最小化所述复杂教师模型与所述轻量化学生模型之间的均方误差损失函数,使得所述轻量化学生模型与所述复杂教师模型的预测结果输出特征趋于一致性。9.根据权利要求1所述的基于特征分解分类器与自适应后处理的声学事件检测系统,其特征在于,所述特征分解分类器还用于:计算事件类型所要保留的特征子空间维度参考因子:根据所述事件类型所要保留的特征子空间维度参考因子计算单类事件类型所要保留高级特征表示的维度。10.根据权利要求1所述的基于特征分解分类器与自适应后处理的声学事件检测系统,其特征在于,所述特征分解分类器还包括:分类器部分,所述分类器部分包括:声学事件检测任务分支和声学事件分类任务分支;所述声学事件检测任务分支包括;具有较大隐藏状态的全连接层,预设事件类类型个数相同的多组全连接层以及sigmoid激活函数,每个单独的全连接层中均包括二分类操作;所述二分类操作用于获取每一帧特征信息中是否存在事件;所述声学事件分类任务分支包括:注意力模块。11.根据权利要求5所述的基于特征分解分类器与自适应后处理的声学事件检测系统,其特征在于,所述声学事件检测任务分支用于确定帧级别检测后验概率;所述声学事件分类任务分支用于确定事件级别的分类后验概率。12.根据权利要求1所述的基于特征分解分类器与自适应后处理的声学事件检测系统,其特征在于,所述自适应后处理模块用于对所述帧级别检测结果做平滑处理,得到最终的检测结果,包括:根据训练集中强标签数据集中事件分布,确定不同事件的平均持续时间;根据目标事件特性确定中值滤波窗口,对所述帧级别检测后验概率做后处理操作,得到所述最终的检测结果。

技术总结
本发明涉及基于特征分解分类器与自适应后处理的声学事件检测系统,包括:特征提取网络、特征分解分类器和自适应后处理模块,特征提取网络用于获取输入音频特征的高级特征表示;特征分解分类器用于分解高级特征表示并根据不同事件类型选择相应子特征空间;根据子特征空间信息输出帧级别检测结果;自适应后处理模块用于对帧级别检测结果做平滑处理,得到最终的检测结果。本申请实施例的系统能依据目标事件,针对性学习单一事件的特征信息,并且针对目标事件的特征分解,减轻了重叠事件中其他事件特征的干扰,同时采用自适应后处理方法,过滤系统预测结果中包含的错误时间信息,平滑音频中的事件分布,极大提高了对事件时间戳检测的准确性。测的准确性。测的准确性。


技术研发人员:龙艳花 梁芸浩 李轶杰
受保护的技术使用者:云知声(上海)智能科技有限公司
技术研发日:2021.08.24
技术公布日:2021/11/28
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献