一种基于音频信息的烧结机尾关键帧提取方法与流程

2022-02-22 18:09:05 来源：中国专利 TAG：

1.本发明涉及钢铁生产的技术领域，尤其涉及一种基于音频信息的烧结机尾关键帧提取方法。

背景技术：

2.钢铁产业中，烧结矿的质量控制是铁前产品生产的重要一环，其中，烧结矿较为重要的质量指标有转鼓强度，低温还原分化度，碱度，feo含量等，实际生产中，由于烧结过程具有大时滞性，对当前烧结质量的判断通常是通过专家技术人员在烧结机尾处进行观测得出，之后再定期的与烧结矿质量的物理化学分析值进行对比。
3.在机尾处，烧结专家技术人员对烧结质量指标的判断通常包括烧结矿的转鼓强度和feo含量，由于烧结矿的理化性能的差异，会在图像和声音上有所区别，通常，在烧结机尾掉落的烧结矿，其声音特性中，频率越低，即声音越沉闷，通常可以说明烧结矿的孔隙结构更小，即烧结矿的转鼓强度和feo值含量越高，因此，提取烧结矿掉落帧可以有利于进一步的对基于音频的烧结矿的质量特性进行研究，而提取掉落帧后一帧，可以有利于对基于视频的烧结矿的质量特性进行研究。
4.目前，对烧结质量判定中较为准确的是理化分析法，但是从取样到化验存在时滞，不能实时反应烧结矿的烧结质量变化，而对于基于烧结机尾的烧结质量判断，多集中于对烧结机尾图像的分析，少有利用烧结机尾音频对烧结矿质量进行分析的研究，经对现有文献检索发现，最相近似的实现方案为中国专利申请号为：cn201910115518.2，名称为：一种带式烧结机机尾机器视觉指导生产过程方法，该专利申请的具体做法为：通过自动检测烧结过程红层温度和轮廓变化，采用比对人工经验数据以建立机器视觉库，再通过机器学习不断完善机器视觉库，进而指导生产，该方法中可见光相机由振动传感器触发，但其未对音频进行具体的分析，提出详细的去噪和掉落帧提取方法，由于现场环境噪声条件恶劣，需要相应的算法，对掉落帧进行提取。

技术实现要素：

5.本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本技术的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊，而这种简化或省略不能用于限制本发明的范围。
6.鉴于上述现有存在的问题，提出了本发明。
7.因此，本发明解决的技术问题是：通常只对烧结机尾部的视频信息进行研究，未对音频信息做相应的研究；未考虑现场复杂的噪声条件，进行针对烧结机尾现场的噪声处理；目前尚无根据烧结机尾音频进行关键帧提取的具体方法。
8.为解决上述技术问题，本发明提供如下技术方案：采集烧结机尾的音频信息并提取噪声部分；利用维纳滤波算法对所述噪声部分进行去噪处理；利用谱减法对去噪处理后的噪声去除背景噪声；提取去噪后音频的突变位置为掉落帧位置，并将所述掉落帧后一帧
作为掉落后帧，实现烧结机尾关键帧的提取。
9.作为本发明所述的基于音频信息的烧结机尾关键帧提取方法的一种优选方案，其中：所述采集的烧结机尾的音频信息包括将音频的前0.5s，作为声音的背景部分，即静默状态或噪声状态下的底层噪声。
10.作为本发明所述的基于音频信息的烧结机尾关键帧提取方法的一种优选方案，其中：利用维纳滤波算法对所述噪声部分进行去噪处理包括，利用噪声活动性检测在无语音帧时的信号功率谱得到对噪声功率谱的近似估计；采用后验信噪比和先验信噪比进行加权组合得到先验信噪比估计；将增益函数和噪声信息进行相乘，得到增强后的语音信号谱。
11.作为本发明所述的基于音频信息的烧结机尾关键帧提取方法的一种优选方案，其中：所述先验信噪比的估计包括，
[0012][0013]
其中，α取0.99，表示在第m-1帧频点wk处的增强信号功率谱，yk(m)和dk(m)分别表示第m帧频点处写图片描述处的带噪语音和噪声功率谱。
[0014]
作为本发明所述的基于音频信息的烧结机尾关键帧提取方法的一种优选方案，其中：所述先验信噪比的增益函数包括，
[0015][0016]
其中，为在wk处的先验信噪比估计。
[0017]
作为本发明所述的基于音频信息的烧结机尾关键帧提取方法的一种优选方案，其中：所述增强后的语音信号谱包括，
[0018]
x
i 1
(w)＝hi(w)y(w)
[0019]
其中，y(w)为带噪语音y(n)的频谱。
[0020]
作为本发明所述的基于音频信息的烧结机尾关键帧提取方法的一种优选方案，其中：所述利用谱减法对去噪处理后的噪声去除背景噪声包括，任何一帧语音信号xi(m)做dft，即变换到频域后为：
[0021][0022]
其中，x(n)为语音的事件序列，加窗分帧处理后可以得到第i帧语音信号为xi(m)，帧长为n。
[0023]
作为本发明所述的基于音频信息的烧结机尾关键帧提取方法的一种优选方案，其中：还包括，提取幅值|x(k)|，以及相位角：
[0024][0025]
作为本发明所述的基于音频信息的烧结机尾关键帧提取方法的一种优选方案，其中：还包括，根据静音段估计噪声，利用噪声段的平均能量值来描述噪声成分，其能量值为：
[0026][0027]
其中，噪声段时长为is，对应的帧数为nis。
[0028]
本发明的有益效果：本发明考虑了烧结现场复杂的噪声条件，对其进行了分析并进行了去噪增强；利用噪声信息对掉落帧及掉落后帧进行了提取，为之后的基于烧结机尾的声音和视频研究奠定了基础；首次给出利用烧结机尾的音频信息对烧结机尾关键帧进行分析的方法。
附图说明
[0029]
为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其它的附图。其中：
[0030]
图1为本发明一个实施例提供的一种基于音频信息的烧结机尾关键帧提取方法的基本流程示意图；
[0031]
图2为本发明一个实施例提供的一种基于音频信息的烧结机尾关键帧提取方法的谱减法流程示意图；
[0032]
图3为本发明一个实施例提供的一种基于音频信息的烧结机尾关键帧提取方法的原始信号时频示意图；
[0033]
图4为本发明一个实施例提供的一种基于音频信息的烧结机尾关键帧提取方法的维纳滤波去噪后的时频示意图；
[0034]
图5为本发明一个实施例提供的一种基于音频信息的烧结机尾关键帧提取方法的谱减法去噪后的时频示意图；
[0035]
图6为本发明一个实施例提供的一种基于音频信息的烧结机尾关键帧提取方法的图3对应的语谱示意图；
[0036]
图7为本发明一个实施例提供的一种基于音频信息的烧结机尾关键帧提取方法的图4对应的语谱示意图；
[0037]
图8为本发明一个实施例提供的一种基于音频信息的烧结机尾关键帧提取方法的图5对应的语谱示意图。
具体实施方式
[0038]
为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合说明书附图对本发明的具体实施方式做详细的说明，显然所描述的实施例是本发明的一部分实施例，而不是全部实施例。基于本发明中的实施例，本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明的保护的范围。
[0039]
在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是本发明还可以采用其他不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本发明内涵的情况下做类似推广，因此本发明不受下面公开的具体实施例的限制。
[0040]
其次，此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方
式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例，也不是单独的或选择性的与其他实施例互相排斥的实施例。
[0041]
本发明结合示意图进行详细描述，在详述本发明实施例时，为便于说明，表示器件结构的剖面图会不依一般比例作局部放大，而且所述示意图只是示例，其在此不应限制本发明保护的范围。此外，在实际制作中应包含长度、宽度及深度的三维空间尺寸。
[0042]
同时在本发明的描述中，需要说明的是，术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一、第二或第三”仅用于描述目的，而不能理解为指示或暗示相对重要性。
[0043]
本发明中除非另有明确的规定和限定，术语“安装、相连、连接”应做广义理解，例如：可以是固定连接、可拆卸连接或一体式连接；同样可以是机械连接、电连接或直接连接，也可以通过中间媒介间接相连，也可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。
[0044]
实施例1
[0045]
参照图1～2，为本发明的一个实施例，提供了一种基于音频信息的烧结机尾关键帧提取方法，包括：
[0046]
s1：采集烧结机尾的音频信息并提取噪声部分；
[0047]
需要说明的是，将音频的前0.5s，作为声音的背景部分，即静默状态或噪声状态下的底层噪声。
[0048]
s2：利用维纳滤波算法对噪声部分进行去噪处理；
[0049]
需要说明的是，利用维纳滤波算法对噪声部分进行去噪处理包括利用步骤s1的噪声部分对噪声频谱的估计，先验信噪比的估计，以及去噪后语音的估计，具体为：
[0050]
利用噪声活动性检测在无语音帧时的信号功率谱得到对噪声功率谱的近似估计；
[0051]
采用后验信噪比和先验信噪比进行加权组合得到先验信噪比估计；
[0052]
将增益函数和噪声信息进行相乘，得到增强后的语音信号谱。
[0053]
其中，先验信噪比的估计包括：
[0054][0055]
其中，α取0.99，表示在第m-1帧频点wk处的增强信号功率谱，yk(m)和dk(m)分别表示第m帧频点处写图片描述处的带噪语音和噪声功率谱。
[0056]
之后，得到先验信噪比的增益函数包括：
[0057][0058]
其中，为在wk处的先验信噪比估计。
[0059]
最后，增强后的语音信号谱由下式获得：
[0060]
x
i 1
(w)＝hi(w)y(w)
[0061]
其中，y(w)为带噪语音y(n)的频谱。
[0062]
s3：利用谱减法对去噪处理后的噪声去除背景噪声；
[0063]
需要说明的是，如图2所示，利用谱减法对去噪处理后的噪声去除背景噪声包括：
[0064]
任何一帧语音信号xi(m)做dft，即变换到频域后为：
[0065][0066]
其中，x(n)为语音的事件序列，加窗分帧处理后可以得到第i帧语音信号为xi(m)，帧长为n。
[0067]
接着，提取幅值|x(k)|，以及相位角：
[0068][0069]
最后，根据静音段估计噪声，利用噪声段的平均能量值来描述噪声成分，其能量值为：
[0070][0071]
其中，噪声段时长为is，对应的帧数为nis。
[0072]
s4：提取去噪后音频的突变位置为掉落帧位置，并将掉落帧后一帧作为掉落后帧，实现烧结机尾关键帧的提取。
[0073]
本发明提出的一种基于音频信息的烧结机尾关键帧提取方法，通过提取提取噪声部分、维纳滤波去噪以及谱减法去除背景噪声，提取掉落帧位置，获取掉落后帧位置，从而服务于之后的基于音频和视频的烧结机尾研究。
[0074]
实施例2
[0075]
参照图3～8为本发明另一个实施例，该实施例不同于第一个实施例的是，提供了一种基于音频信息的烧结机尾关键帧提取方法的验证测试，为对本方法中采用的技术效果加以验证说明，本实施例采用本发明方法进行测试，以科学论证的手段验证本方法所具有的真实效果。
[0076]
根据本发明实施例1的具体步骤可以得到图3～8的实验结果图，如图3所示，为原始信号时频图，经过维纳滤波算法对噪声部分进行去噪处理后如图4所示，再利用谱减法对去噪处理后的噪声去除背景噪声得到如图5所示的时频图，其中图6～8为其所对应的语谱图，其体现了本方法所具有的真实效果。
[0077]
应说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的精神和范围，其均应涵盖在本发明的权利要求范围当中。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：基于人工智能的坐席外呼质检方法与流程

一种基于音频信息的烧结机尾关键帧提取方法与流程

相关文献

最热文献