一种基于声学特征的多类型噪声数据族谱的制作方法

2022-02-20 13:12:07 来源：中国专利 TAG：

1.本发明涉及一种多类型噪声数据族谱，特别涉及一种基于声学特征的多类型噪声数据族谱，属于噪声数据族谱技术领域。

背景技术：

2.从生理学观点来看，凡是干扰人们休息、学习和工作以及对人们所要听的声音产生干扰的声音，即不需要的声音，统称为噪声。当噪声对人及周围环境造成不良影响时，就形成噪声污染。
3.在很多声学应用场景中需要对噪声进行处理，在进行满足特定功能需求的处理之前往往需要对噪声作预处理，主要是针对特定的噪声根据其时域、频域、时频域特征来进行噪声处理，现有技术的处理方式只能对单一或者非常相似的噪声有效，来一种新噪声就需要重新处理，而自然场景下的噪声往往包含多类型噪声源，单一处理模式无法快捷有效的应对多类型噪声。

技术实现要素：

4.本发明的目的在于提供一种基于声学特征的多类型噪声数据族谱，以解决上述背景技术中提出的现有技术的处理方式只能对单一或者非常相似的噪声有效，来一种新噪声就需要重新处理，而自然场景下的噪声往往包含多类型噪声源，单一处理模式无法快捷有效的应对多类型噪声的问题。
5.为实现上述目的，本发明提供如下技术方案：一种基于声学特征的多类型噪声数据族谱，所述噪声数据族谱的构建步骤如下：
6.s1：采集各种纯净的噪声源的噪声信号，形成声信号文件；
7.s2：选择部分多种类型的噪声信号文件提取mfcc，根据相似度训练神经网络，输入为一个向量，训练的依据为：mfcc相近的向量具有更多的相同或者相近分量，mfcc差异大的向量之间相同或者相近的分量很少，从而可以通过向量的相似度判断信号之间的相似度；
8.s3：将声信号文件加窗分成一帧一帧的短时音频系列，相邻帧间有部分重叠，对所有帧计算短时傅里叶变换，得到一系列语谱图；
9.s4：将每一张语谱图输入到预训练好的卷积神经网络中，得到一个向量，将一系列语谱图得到的结果进行进行求和平均，得到该信号文件的特征向量；
10.s5：将采集到的多种类型声信号文件得到的向量根据其相互间的相似度构建一个噪声谱系，用于实际的噪声处理。
11.与现有技术相比，本发明的有益效果是：
12.1.本发明一种基于声学特征的多类型噪声数据族谱，本发明利用mfcc的相似性训练神经网络，使其输出的向量在相似的mfcc时具有更多的相同或相近的项，在不同的mfcc时对应项值比较差异大，能够对多类型的噪声通过预训练好的网络得到的向量依据其相似度建立噪声族谱体系，本发明得到的噪声数据族谱能够在噪声处理，比如降噪中一次处理
一系列在同一族系分支中的多种噪声，大幅提升噪声的效率和效果，实用性强。
附图说明
13.图1为本发明噪声数据族谱构建步骤流程示意图。
具体实施方式
14.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
15.请参阅图1，本发明提供了一种基于声学特征的多类型噪声数据族谱的技术方案：
16.噪声数据族谱的构建步骤如下：
17.s1：采集各种纯净的噪声源的噪声信号，形成声信号文件；
18.s2：选择部分多种类型的噪声信号文件提取mfcc，根据相似度训练神经网络，输入为一个向量，训练的依据为：mfcc相近的向量具有更多的相同或者相近分量，mfcc差异大的向量之间相同或者相近的分量很少，从而可以通过向量的相似度判断信号之间的相似度；
19.s3：将声信号文件加窗分成一帧一帧的短时音频系列，相邻帧间有部分重叠，对所有帧计算短时傅里叶变换，得到一系列语谱图；
20.s4：将每一张语谱图输入到预训练好的卷积神经网络中，得到一个向量，将一系列语谱图得到的结果进行进行求和平均，得到该信号文件的特征向量；
21.s5：将采集到的多种类型声信号文件得到的向量根据其相互间的相似度构建一个噪声谱系，用于实际的噪声处理。
22.具体使用时，本发明一种基于声学特征的多类型噪声数据族谱，首先采集各种纯净的噪声源的噪声信号，形成声信号文件；选择部分多种类型的噪声信号文件提取mfcc，根据相似度训练神经网络，输入为一个向量，训练的依据为：mfcc相近的向量具有更多的相同或者相近分量，mfcc差异大的向量之间相同或者相近的分量很少，从而可以通过向量的相似度判断信号之间的相似度；将声信号文件加窗分成一帧一帧的短时音频系列，相邻帧间有部分重叠，对所有帧计算短时傅里叶变换，得到一系列语谱图；将每一张语谱图输入到预训练好的卷积神经网络中，得到一个向量，将一系列语谱图得到的结果进行进行求和平均，得到该信号文件的特征向量；将采集到的多种类型声信号文件得到的向量根据其相互间的相似度构建一个噪声谱系，用于实际的噪声处理；综上所述，本发明利用mfcc的相似性训练神经网络，使其输出的向量在相似的mfcc时具有更多的相同或相近的项，在不同的mfcc时对应项值比较差异大，能够对多类型的噪声通过预训练好的网络得到的向量依据其相似度建立噪声族谱体系，本发明得到的噪声数据族谱能够在噪声处理，比如降噪中一次处理一系列在同一族系分支中的多种噪声，大幅提升噪声的效率和效果，实用性强。
23.在本发明的描述中，需要理解的是，指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。
24.在本发明中，除非另有明确的规定和限定，例如，可以是固定连接，也可以是可拆
卸连接，或成一体；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通或两个元件的相互作用关系，除非另有明确的限定，对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。
25.尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

技术特征：
1.一种基于声学特征的多类型噪声数据族谱，其特征在于，所述噪声数据族谱的构建步骤如下：s1：采集各种纯净的噪声源的噪声信号，形成声信号文件；s2：选择部分多种类型的噪声信号文件提取mfcc，根据相似度训练神经网络，输入为一个向量，训练的依据为：mfcc相近的向量具有更多的相同或者相近分量，mfcc差异大的向量之间相同或者相近的分量很少，从而可以通过向量的相似度判断信号之间的相似度；s3：将声信号文件加窗分成一帧一帧的短时音频系列，相邻帧间有部分重叠，对所有帧计算短时傅里叶变换，得到一系列语谱图；s4：将每一张语谱图输入到预训练好的卷积神经网络中，得到一个向量，将一系列语谱图得到的结果进行进行求和平均，得到该信号文件的特征向量；s5：将采集到的多种类型声信号文件得到的向量根据其相互间的相似度构建一个噪声谱系，用于实际的噪声处理。

技术总结
本发明公开了一种基于声学特征的多类型噪声数据族谱，所述噪声数据族谱的构建步骤如下：S1：采集各种纯净的噪声源的噪声信号，形成声信号文件；S2：选择部分多种类型的噪声信号文件提取MFCC，根据相似度训练神经网络，输入为一个向量，训练的依据为：MFCC相近的向量具有更多的相同或者相近分量，MFCC差异大的向量之间相同或者相近的分量很少，从而可以通过向量的相似度判断信号之间的相似度；本发明利用MFCC的相似性训练神经网络，使其输出的向量在相似的MFCC时具有更多的相同或相近的项，在不同的MFCC时对应项值比较差异大，能够对多类型的噪声通过预训练好的网络得到的向量依据其相似度建立噪声族谱体系。相似度建立噪声族谱体系。相似度建立噪声族谱体系。

技术研发人员：余永生杜旭浩章林柯
受保护的技术使用者：武汉声与声科技合伙企业（有限合伙）
技术研发日：2021.09.13
技术公布日：2022/1/14

再多了解一些

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：基于BS架构的音频数据识别方法、系统及可读存储介质与流程

一种基于声学特征的多类型噪声数据族谱的制作方法

相关文献

最热文献