一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种信号处理方法、装置、设备及存储介质与流程

2022-04-14 03:22:51 来源:中国专利 TAG:


1.本技术涉及数字信号处理技术领域,具体而言,涉及一种信号处理方法、装置、设备及存储介质。


背景技术:

2.语音、视频信号中的暂态噪声在时域中是非连续、间歇、脉冲式的,其噪声能量主要集中在较短的时域区间内,而在频域分布则很宽。由于暂态噪声通常具有突发性、脉冲性等特点,可以具体分为冲激脉冲类噪声和短时脉冲类噪声;典型的暂态噪声如桌子敲击声、鼓掌声、键盘击键声、鼠标按键声、锤子击打声等,它们常出现助听器、手机、视讯会议设备等语音通信终端设备中。
3.暂态噪声的存在严重影响音频质量。目前,谱减法,维纳滤波,自适应滤波等噪声抑制算法大多仅针对稳态噪声进行抑制,由于多数暂态噪声与原始信号在频域完全重叠,这些算法对暂态噪声抑制效果较差;同时,现有的一些暂态噪声抑制方法有中值滤波,贝叶斯框架等噪声抑制算法,也存在很多缺陷,比如中值滤波算法实现简单但容易引起信号失真,贝叶斯框架算法抑制效果好,但计算复杂度高。


技术实现要素:

4.第一方面,本技术实施例提供一种信号处理方法,用于消除输入信号中的暂态噪声,以得到目标信号,所述方法包括:对所述输入信号进行预处理,获得暂态噪声区分信号;其中,所述暂态噪声区分信号包括增强幅值后的暂态噪声;对所述暂态噪声区分信号的冲激脉冲类噪声进行时域替换处理,以得到第一消除暂态噪声信号;对所述第一消除暂态噪声信号中的短时脉冲类噪声进行时域限幅处理,以得到第二消除暂态噪声信号;以及对所述第二消除暂态噪声信号进行频域相干性抑制,获得所述目标信号。
5.在上述实现过程中,首先在时域直接对暂态噪声中的冲激脉冲类噪声、短时脉冲类噪声分别进行替换、限幅处理,然后变换到频域对暂态噪声中剩余的短时脉冲类噪声根据相干性进行进一步抑制,最终实现了冲激脉冲类噪声的基本完全消除,极大地消除了短时脉冲类噪声,改善了输入信号的质量,并在信号失真与复杂度之间取得了较好的平衡。
6.在一可选的实施例中,所述对所述第二消除暂态噪声信号进行频域相干性抑制,获得所述目标信号,包括:将所述第二消除暂态噪声信号变换到频域;处理所述第二消除暂态噪声信号,得到所述第二消除暂态噪声信号的谐波相干性系数;基于所述谐波相干性系数,对所述第二消除暂态噪声信号进行加权抑制,获得所述目标信号。
7.在上述实现过程中,通过在频域计算第二消除暂态噪声信号的谐波相干性系数的方式,具体可以进行互相关谐波功率运算,从而将暂态噪声与目标信号或带稳态噪声的目标信号区分开来;对暂态噪声基于谐波相干性系数加权抑制后,短时脉冲类噪声可以被极大的消除,此时,目标信号虽也会有部分被抑制,但可以通过调节相关参数,使得暂态噪声基本被完全消除后,目标信号依然能够不失真,从而得到输入信号中消除暂态噪声的目标
信号。
8.在一可选的实施例中,所述处理所述第二消除暂态噪声信号,得到所述第二消除暂态噪声信号的谐波相干性系数,包括:基于变换到频域的第二消除暂态噪声信号,计算所述第二消除暂态噪声信号的当前帧的谐波功率、所述当前帧的前一任意帧的谐波功率、以及所述当前帧与所述前一任意帧的互相关谐波功率;基于平滑滤波后的所述当前帧的谐波功率、所述当前帧的前一任意帧的谐波功率、以及所述当前帧与所述前一任意帧的互相关谐波功率,进行归一化运算,得到所述第二消除暂态噪声信号的谐波相干性系数。
9.在上述实现过程中,通过计算当前帧及其前一任意帧的自相关谐波功率、互相关谐波功率,再进行平滑滤波以及归一化处理,避免了数据突变,从而减小了误差,归一化后的谐波相干性系数在一个固定区间,方便量化以及后续加权抑制。
10.在一可选的实施例中,所述基于所述谐波相干性系数,对所述第二消除暂态噪声信号进行加权抑制,获得所述目标信号,包括:通过采用单调递增的凸曲线对所述谐波相干性系数进行加权,获得平滑谐波相干性系数;通过采用单调递增的凸曲线对所述平滑谐波相干性系数进行加权,获得所述暂态噪声的抑制系数;基于所述暂态噪声的抑制系数进行抑制,确定出所述目标信号。
11.在上述实现过程中,首先,对谐波相干性系数结合上一帧的结果采用单调递增的凸曲线做平滑滤波加权,使得高频部分变化更快、低频部分变化更慢;然后,采用单调递增的凸曲线作为平滑谐波相干性系数的指数进行加权;最后,基于两次加权最终得到的抑制系数对第二消除暂态噪声信号进行频域抑制,极大地抑制了输入信号的噪声高频成分。
12.在一可选的实施例中,所述对所述输入信号进行预处理,获得暂态噪声区分信号,包括:对输入信号进行分帧加窗,获得分帧信号;对所述分帧信号进行预白化处理,获得暂态噪声区分信号。
13.在上述实现过程中,将带噪的输入信号经分帧加窗处理后,接着将每一帧的信号预白化,通过估计每一帧自回归模型参数,对带稳态噪声和暂态噪声的输入信号进行预白化处理,使得输入信号幅值强度减小到白噪声水平,暂态噪声中的冲激脉冲类噪声幅值强度几乎不变,从而能更好地区分出输入信号中的暂态噪声。
14.在一可选的实施例中,所述对所述暂态噪声区分信号中的冲激脉冲类噪声进行时域替换处理,以得到第一消除暂态噪声信号,包括:判断所述暂态噪声区分信号的峰均比是否不低于预设阈值,若是,则确定所述暂态噪声区分信号包含所述冲激脉冲类噪声;通过自回归模型估计值对所述暂态噪声区分信号中的所述冲激脉冲类噪声的当前实际帧进行时域替换,以得到第一消除暂态噪声信号。
15.在上述实现过程中,计算峰均比从而检测出暂态噪声区分信号中突出部分的冲激脉冲类噪声,将该突出部分的采样点幅值进行替换,从而使得冲激脉冲类噪声基本被完全消除。
16.在一可选的实施例中,所述对所述第一消除暂态噪声信号中的短时脉冲类噪声进行时域限幅处理,以得到第二消除暂态噪声信号,包括:基于所述第一消除暂态噪声信号中的短时脉冲类噪声的前一帧幅值的最大值和最小值,对所述短时脉冲类噪声的当前帧进行时域限幅,以得到第二消除暂态噪声信号;其中,所述前一帧幅值的最大值和最小值通过对当前帧幅值的最大值和最小值进行平滑滤波获得。
17.在上述实现过程中,对暂态噪声中剩下的短时脉冲类噪声在时域进行抑制处理,具体可通过前一帧的幅值来限制短时脉冲噪声,同时,选择合适的平滑参数对幅值进行平滑滤波,以实现对第一消除暂态噪声信号的动态限幅,从而得到消除了冲激脉冲类噪声,同时初步消除了短时脉冲噪声的输入信号。
18.第二方面,本技术实施例提供了一种信号处理装置,所述装置用于消除输入信号中的暂态噪声,以得到目标信号,所述装置包括:预处理模块,用于对所述输入信号进行预处理,获得暂态噪声区分信号;替换模块,用于对所述暂态噪声区分信号中的冲激脉冲类噪声进行时域替换处理,以得到第一消除暂态噪声信号;限幅模块,用于对所述第一消除暂态噪声信号中的短时脉冲类噪声进行时域限幅处理,以得到第二消除暂态噪声信号;抑制模块,用于对所述第二消除暂态噪声信号进行频域相干性抑制,获得所述目标信号。
19.在上述实现过程中,预处理模块可以用于对输入信号进行预处理,获得暂态噪声区分信号;替换模块可以用于对暂态噪声区分信号中的冲激脉冲类噪声进行时域替换处理,以得到第一消除暂态噪声信号;限幅模块可以用于对第一消除暂态噪声信号中的短时脉冲类噪声进行时域限幅处理,以得到第二消除暂态噪声信号;抑制模块可以用于对第二消除暂态噪声信号进行频域相干性抑制,获得目标信号。
20.第三方面,本技术实施例还提供一种电子设备,包括:处理器、存储器,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述机器可读指令被所述处理器执行时执行上述的方法的步骤。
21.第四方面,本技术实施例提供一种计算机可读存储介质,所述存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述的方法的步骤。
22.为使本技术的上述目的、特征和优点能更明显易懂,下文特举实施例,并配合所附附图,作详细说明如下。
23.有益效果:综上,本技术实施例的目的在于提供一种信号处理方法、装置、设备及存储介质,通过在时域对暂态噪声中的冲激脉冲类噪声、短时脉冲类噪声分别进行处理,变换到频域对暂态噪声进行进一步地相干性抑制,极大地消除了暂态噪声,改善了输入信号的质量,计算复杂度较低,并且保证了原有输入信号的较小失真度,即在信号失真与算法复杂度之间取得了较好的平衡。
附图说明
24.为了更清楚地说明本技术实施例的技术方案,下面将对本技术实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
25.图1为本技术实施例提供的第一种信号处理方法的流程图;图2为本技术实施例提供的第二种信号处理方法的流程图;图3为本技术实施例提供的消除暂态噪声中冲激脉冲类噪声前后对比图;图4为本技术实施例提供的第三种信号处理方法的流程图;图5为本技术实施例提供的消除暂态噪声中短时脉冲类噪声前后对比图;图6为本技术实施例提供的信号处理装置的功能模块示意图;以及
图7为本技术实施例提供的电子设备的方框示意图。
26.图标:210-预处理模块;220-替换模块;230-限幅模块;240-抑制模块;300-电子设备;311-存储器;312-存储控制器;313-处理器;314-外设接口;315-输入输出单元;316-显示单元。
具体实施方式
27.下面将结合本技术实施例中附图,对本技术实施例中的技术方案进行描述。
28.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本技术的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
29.本技术发明人注意到,基于webrtc(web real-time communication:网页即时通信)噪声抑制的开源算法消除语音信号中的噪声,该算法能够有效地抑制稳态噪声,但对暂态噪声抑制效果不佳。暂态噪声能量通常集中在较短的时间内,暂态噪声中的冲激脉冲类噪声持续时间更短,而暂态噪声中的短时脉冲类噪声会有一个初始的峰值和一段较长的衰减时间。现有的一些消除暂态噪声的方法容易引入谐波失真,且计算复杂度较高,未对不同类型的暂态噪声分别针对处理,去噪效果大大降低。
30.基于上述研究,本技术实施例提供了一种信号处理方法及装置,通过对接收的输入信号加窗分帧后,对每一帧信号进行数据白化预处理;然后根据峰均比检测信号中的冲激脉冲类噪声,在时域用自回归模型估计系数替换冲激脉冲类噪声采样点的实际帧;接着,在时域对短时脉冲类噪声信号采用前一帧的幅值进行动态限幅;最后,变换到频域基于谐波相干性进行进一步地短时脉冲类噪声抑制,从而极大地消除了暂态噪声,复杂度较低,并且保证了原有输入信号的较小失真度。
31.可选地,通过在webrtc噪声抑制开始之前,加入了前处理,即暂态噪声估计和抑制,能够有效的抑制冲激脉冲类噪声和短时脉冲类噪声,将剩余的短时脉冲类噪声在频域进一步抑制,改善了音频质量,提高了听者的主观感受,并在信号失真与复杂度之间取得了较好的平衡。
32.请参阅图1,图1为本技术实施例提供的第一种信号处理方法的流程图。下面将对图1所示的具体流程进行详细阐述。本技术实施例提供的信号处理方法可以具体包括:步骤100:对输入信号进行预处理,获得暂态噪声区分信号;其中,暂态噪声区分信号包括增强幅值后的暂态噪声;步骤120:对暂态噪声区分信号的冲激脉冲类噪声进行时域替换处理,以得到第一消除暂态噪声信号;步骤140:对第一消除暂态噪声信号中的短时脉冲类噪声进行时域限幅处理,以得到第二消除暂态噪声信号;以及步骤160:对第二消除暂态噪声信号进行频域相干性抑制,获得目标信号。
33.其中,针对步骤100:对所述输入信号进行预处理,获得暂态噪声区分信号;其中,所述暂态噪声区分信号包括增强幅值后的暂态噪声。
34.示例性地,稳态噪声是噪声强度波动范围在5db以内的连续性噪声。白噪声的采样点xi可以是一个时间序列在相继时间点i=1,2...的幅值,且白噪声序列中没有时间上的相
关性,术语“白”源于白噪声的能谱在所有频率上是一个常数。
35.输入信号可以是同时带暂态噪声、稳态噪声的语音信号或视频信号等多种音频信号中的一种,本技术以语音信号为例。暂态噪声区分信号可以是对输入信号在时域经过一系列数据预处理后,将输入信号幅值强度减小到白噪声水平,暂态噪声中的冲激脉冲类噪声幅值强度几乎不变,从而能更好地区分出暂态噪声的区分信号。
36.在一个实施例中,步骤100可以具体包括步骤101和步骤102。
37.步骤101:对输入信号进行分帧加窗,获得分帧信号;步骤102:对分帧信号进行预白化处理,获得暂态噪声区分信号。
38.其中,针对步骤101:对输入信号进行分帧加窗,获得分帧信号。
39.示例性地,窗函数是一种除在给定区间之外取值均为0的实函数,任何函数与窗函数之积仍为窗函数,所以相乘的结果就像透过窗口“看”其他函数一样。窗函数可以包括幂窗、三角函数窗、指数窗等不同类型,常用的矩形窗是幂窗中的一种。矩形窗是在给定区间内为常数而在区间外为0的窗函数,矩形窗属于时间变量的零次幂窗。不加窗实质是使信号通过了矩形窗。
40.由于输入的语音信号在宏观整体上是不平稳的,在微观局部上是平稳的,具有短时平稳性,在后续的处理中需要对一个稳定的信号进行处理,因此需要对整个输入信号首先进行分帧处理,即将其分割成多个短段,每一个短段称为一帧(chunk)。
41.分帧处理后,由于每一帧的开始和结束都会出现间断,因此分帧处理时,分割的帧越多,与原始输入信号的误差就越大。可选地,通过在时间域中加矩形窗函数进行加窗处理,使成帧后的信号变得连续,并且每一帧都会表现出周期函数的特性,进而得到虚拟的输入信号,从而解决分帧产生的误差问题。
42.分帧、加窗都是对输入信号提取特征的预处理阶段,先分帧,后加窗,加窗的代价是一帧信号的两端部分被削弱了,所以在分帧的时候,帧与帧之间需要有重叠。可选地,将输入信号先进行缓存,将缓存的信号加矩形窗分段分析。具体的,取10ms数据为一帧,采样频率为160khz时,每帧的数据长度为160。通过分帧加矩形窗处理后,使得分帧信号主瓣比较集中,主瓣窄,旁瓣大,提高了频率、幅值的识别精度。
43.步骤102:对分帧信号进行预白化处理,获得暂态噪声区分信号。
44.示例性地,预白化即为数据白化预处理,使得输入信号具有如下性质:(i)特征之间相关性较低;(ii)所有特征具有相同的方差。levinson-durbin迭代算法可以用来求解自回归模型的最佳线性预测系数。
45.由于输入的语音信号采样点之间存在相关性,可以基于levinson-durbin迭代算法用过去的采样点值来预测或未来的采样点值。具体地,可以通过实际语音信号:和线性预测结果:之间的误差信号:在某个准则下达到最小值来确定最佳的一组线性预测系数,而这组系数就能反映输入语音信号的特性。
46.可选地,将输入的带噪语音信号经分帧加窗处理后,接着将每一帧的信号预白化。为了更好的区分暂态噪声和语音信号,通过估计每一帧自回归模型参数,对带稳态噪声和暂态噪声的输入信号进行预白化处理,或称为解相关。假设输入信号可以表示为:
其中,为纯语音信号,为稳态噪声,为暂态噪声。假设输入信号在每帧内被模型化为自回归过程,则纯语音信号可以表示为:其中,为p阶自回归模型系数,可以采用levinson-durbin算法进行线性预测估计获得,p可以为线性预测滤波器的阶数,阶数取值范围可以为10~30;为纯语音信号经过线性预测后的误差信号,类似白噪声。基于levinson-durbin算法进行线性预测估计,则预白化后的输入信号可以经过推导得到:其中,为白噪声,为稳态噪声,假设稳态噪声为白噪声,白噪声样点之间相互独立,那么也为白噪声,即为白噪声,因此可以将一起表示成;为暂态噪声中的冲激脉冲类噪声,容易得到。因此可以得到将输入信号转换到误差域的暂态噪声区分信号:其中,也为白噪声,但此时白噪声的幅值能量相对于冲激脉冲类噪声低很多,从而冲激脉冲类噪声会更加突出,所以可以区分出冲激脉冲类噪声。
47.通过预白化处理,输入信号幅值强度减小到白噪声水平,暂态噪声中的冲激脉冲类噪声幅值强度几乎不变,从而能更好地区分出输入信号中的暂态噪声。
48.步骤120:对暂态噪声区分信号的冲激脉冲类噪声进行时域替换处理,以得到第一消除暂态噪声信号。
49.示例性地,时域和频域是分析信号的两种不同角度,时域(time domain)可以是描述输入信号随着时间的变化,是真实世界唯一实际存在的域。频域(frequency domain)可以是描述输入信号在频率方面特性时用到的一种坐标系,频域中的任何波形都可用正弦波
组合形成。
50.经过上述步骤100,暂态噪声区分信号中的冲激脉冲类噪声的幅值被突出,输入信号中的纯语音信号和稳态噪声减小到白噪声水平,然后就可以对突出部分的冲激脉冲类噪声在时域进行抑制处理,具体可基于levinson-durbin线性预测估计值将该突出部分的采样点幅值进行替换,从而得到消除冲激脉冲类噪声的输入信号,即第一消除暂态噪声信号。
51.在一个实施例中,请参阅图2,图2为本技术实施例提供的第二种信号处理方法的流程图。步骤120可以具体包括步骤121和步骤122。
52.步骤121:判断暂态噪声区分信号的峰均比是否不低于预设阈值,若是,则确定暂态噪声区分信号包含所述冲激脉冲类噪声;步骤122:通过自回归模型估计值对暂态噪声区分信号中的冲激脉冲类噪声的当前实际帧进行时域替换,以得到第一消除暂态噪声信号。
53.针对步骤121:判断所述暂态噪声区分信号的峰均比是否不低于预设阈值,若是,则确定所述暂态噪声区分信号包含所述冲激脉冲类噪声。
54.示例性地,峰均比是一种对波形的测量参数,即波形的振幅与有效值(rms)的一个比值。
55.可选地,输入信号从时域上观测是幅度不断变化的正弦波,幅度并不恒定,一个周期内的信号幅度峰值和其他周期内的幅度峰值是不一样的,因此每个周期的平均功率和峰值功率是不一样的。这里,峰值功率可以是暂态噪声区分信号中的暂态噪声的瞬态功率,可以将峰值功率跟系统总的平均功率的比定义为峰均比。
56.进一步地,通过计算暂态噪声区分信号的峰均比,来判断、检测输入信号幅值中突出部分的暂态噪声是否包含冲激脉冲类噪声。具体地,可以先求解每帧的平均功率,定义以下公式进行计算:其中,n为每帧的采样点数目,为将暂态噪声区分信号的一帧内峰值功率求和得到的总峰值功率;为总的平均功率。
57.预设阈值可以是用户按照实际需求定义的数值,假设预设阈值,那么暂态噪声区分信号某一个采样点的峰均比与预设阈值的关系可以表示为:其中,为暂态噪声区分信号中第n个采样点的峰值功率,当某一个采样点的峰均比不低于预设阈值时,则该采样点为冲激脉冲类噪声。
58.步骤122:通过自回归模型估计值对暂态噪声区分信号中的冲激脉冲类噪声的当前实际帧进行时域替换,以得到第一消除暂态噪声信号。
59.示例性地,通过上述步骤121,可以确定出暂态噪声区分信号中的冲激脉冲类噪声。在判断该采样点为冲激脉冲类噪声后,以levinson-durbin自回归模型线性预测估计值代替该采样点的实际值,具体的,可以由以下公式描述:
其中,输入信号中峰均比大于或等于预设阈值的采样点实际值由线性预测估计值:代替,小于预设阈值的采样点数值不变,原样输出。
60.参阅图3,图3为本技术实施例提供的消除暂态噪声中冲激脉冲类噪声前后对比图。其中,纵坐标是频率,横坐标是采样时间。图3中(a)图是时域替换处理前的信号语谱图,可以看到冲激脉冲类噪声的能量很高,输入信号中真正的语音信号能量主要集中在低频区域。经过时域替换处理后的输入信号如图3中(b)图所示,可以看到冲激脉冲类噪声基本被完全消除了,留下了低频区域清晰的语音信号,即可以是本方案的第一消除暂态噪声信号。
61.步骤140:对第一消除暂态噪声信号中的短时脉冲类噪声进行时域限幅处理,以得到第二消除暂态噪声信号。
62.示例性地,限幅通常意义是将信号的电压、电流、功率等某种特性超过预定门限值的所有瞬时值减弱至接近此门限值,而对其他所有的瞬时值予以保留的操作。
63.经过上述步骤120,将输入信号中的冲激脉冲类噪声可以具体通过计算峰均比,并与预设阈值比对,从而检测出输入信号中的冲激脉冲类噪声,进而对其进行时域替换处理,得到消除冲激脉冲类噪声的第一消除暂态噪声信号。对暂态噪声中剩下的短时脉冲类噪声在时域进行抑制处理,具体可通过前一帧的幅值来限制短时脉冲噪声,选择合适的平滑参数对幅值要进行平滑滤波,从而得到消除了冲激脉冲类噪声,同时初步消除了短时脉冲噪声的输入信号,即第二消除暂态噪声信号。
64.在一个实施例中,步骤140可以具体包括步骤141。
65.步骤141:基于第一消除暂态噪声信号中的短时脉冲类噪声的前一帧幅值的最大值和最小值,对短时脉冲类噪声的当前帧进行时域限幅,以得到第二消除暂态噪声信号;其中:前一帧幅值的最大值和最小值通过对当前帧幅值的最大值和最小值进行平滑滤波获得。
66.针对步骤141:基于第一消除暂态噪声信号中的短时脉冲类噪声的前一帧幅值的最大值和最小值,对短时脉冲类噪声的当前帧进行时域限幅,以得到第二消除暂态噪声信号。
67.示例性地,对于第一消除暂态噪声信号中的短时脉冲类噪声,可以在时域直接利用前一帧幅值的最大值和最小值进行限幅操作。如果输入信号当前帧超过调节后的最大值,则当前帧的取值为调节后的最大值;如果输入信号当前帧低于调节后的最小值,则当前帧的取值为调节后的最小值;如果输入信号当前帧在调节后的幅值最小值和幅值最大值之间,则当前帧的取值保持不变,原样输出。具体可以由如下公式表示:其中,为乘积运算;k为调节系数,可以根据实际需求确定,可选地取值为1.5;
为当前帧的实际值;为输入信号中短时脉冲类噪声当前帧的前一帧信号幅值的均值;为输入信号中短时脉冲类噪声当前帧的前一帧信号幅值的最大值;为输入信号中短时脉冲类噪声当前帧的前一帧信号幅值的最小值。
68.其中:前一帧幅值的最大值和最小值通过对当前帧幅值的最大值和最小值进行平滑滤波获得。
69.示例性地,经过限幅操作后,将输入信号中幅值较高的短时脉冲类噪声限制在一定区间内,从而得到第二消除暂态噪声信号。进一步对每一帧的幅值的最大值和最小值进行平滑滤波,相当于进行低通滤波,去除高频成分,从而获得第二消除暂态噪声信号的包络。具体地,对当前帧的幅值最大值和幅值最小值进行平滑滤波,并缓存在前一帧的幅值最大值和幅值最小值两个变量中:其中,max()为求最大值运算;min()为求最小值运算;为平滑参数,取值范围可以小于0.3,可选地取值为0.01。
70.应当理解:缓存在前一帧的幅值最大值和幅值最小值两个变量中,为了当前帧的下一帧进行限幅做准备,下一帧利用当前的前一帧变量缓存的值进行限幅后,再进行同样地平滑滤波、缓存,为下一帧的下一帧进行限幅做准备,重复循环限幅、平滑滤波、缓存等操作,当处理完所有噪声帧后,停止操作。
71.步骤160:对第二消除暂态噪声信号进行频域相干性抑制,获得目标信号。
72.示例性地,时域分析是以时间轴为坐标表示输入信号的关系;频域分析是把输入信号通过傅里叶级数或傅里叶变换从时间域转换到频率域,即变换为以频率轴为坐标表示出来。其中,周期信号利用傅里叶级数,非周期信号利用傅里叶变换;本方案中输入信号是非周期信号,因此可以通过傅里叶变换实现频域分析。相干性表示振动频率相同、相差恒定,在频域中,相干性是包含相位信息的,例如:一个单位正弦波和一个单位余弦波,它们是相干的,因为具有相同的频率,即恒定的相位差。
73.可选地,在本方案中也可采用其他的将信号从时间域转换到频率域的变换,例如拉普拉斯变换和z变换;相应地,从频率域转换到时间域的变换,也可采用除傅里叶逆变换之外的,如拉普拉斯变换的逆变换和z变换的逆变换之类的方法。为方便理解和统一说明,本文中的时间域转换到频率域的变换均利用傅里叶变换进行说明。
74.经过步骤100、步骤120和步骤140,具体地可以对输入信号在时间域中进行预处理、替换、限幅平滑等处理后,可以得到完全消除了暂态噪声中的冲激脉冲类噪声,同时初步消除了暂态噪声中的短时脉冲噪声的输入信号,即第二消除暂态噪声信号。
75.进一步地,可以将第二消除暂态噪声信号经过傅里叶变换从时间域转换到频率域,根据输入信号中帧之间的相干性来进行暂态噪声的进一步抑制,从而达到可以完全消除暂态噪声,还原输入的纯净语音信号或者仅携带稳态噪声的输入信号,即目标信号。
76.在一个实施例中,请参阅图4,图4为本技术实施例提供的第三种信号处理方法的
流程图。步骤160可以具体包括步骤161、步骤162和步骤163。
77.步骤161:将第二消除暂态噪声信号变换到频域;步骤162:处理第二消除暂态噪声信号,得到第二消除暂态噪声信号的谐波相干性系数;步骤163:基于谐波相干性系数,对第二消除暂态噪声信号进行加权抑制,获得所述目标信号。
78.针对步骤161:将第二消除暂态噪声信号变换到频域。
79.示例性地,短时傅里叶变换(stft,short-time fourier transform)是和傅里叶变换相关的一种数学变换,用以确定时变信号其局部区域正弦波的频率与相位。
80.由于在一段时间内,输入信号中有很多信号先出现后消失,直接做傅里叶变换无法判断出不同信号出现的先后顺序,而stft可以通过每次取出信号中的一小帧加窗后,做傅里叶变换来反映信号随时间的变化。可选地,对第二消除暂态噪声信号做stft,每次取出一帧信号加窗,然后再做傅里叶变换,将得到的结果拼接到一起,可以得到其频谱。增加帧的长度,第二消除暂态噪声信号在频域的信息会越准确。
81.步骤162:处理第二消除暂态噪声信号,得到第二消除暂态噪声信号的谐波相干性系数。
82.示例性地,由于纯语音信号或带稳态噪声的语音信号的谐波比暂态噪声具有更长的连续性,基于此,可以通过在频域计算第二消除暂态噪声信号的谐波相干性系数的方式,即将第二消除暂态噪声信号进行互相关处理,从而将暂态噪声和纯语音信号或带稳态噪声的语音信号区分开来。
83.在一个实施例中,步骤162可以具体包括步骤162a和步骤162b。
84.162a:基于变换到频域的第二消除暂态噪声信号,计算第二消除暂态噪声信号的当前帧的谐波功率、当前帧的前一任意帧的谐波功率、以及当前帧与前一任意帧的互相关谐波功率;162b:基于平滑滤波后的当前帧的谐波功率、当前帧的前一任意帧的谐波功率、以及当前帧与前一任意帧的互相关谐波功率,进行归一化运算,得到第二消除暂态噪声信号的谐波相干性系数。
85.示例性地,互相关运算:反映了两个信号之间相似性的量度,通常互相关的结果是第一个函数依次作复共轭、平移,然后与第二个函数相乘的无穷积分。例如:对于实函数f(x)和h(x)而言,其互相关运算相当于求两函数的曲线相对平移一个参变量x后形成的重叠部分与横轴所围区域的面积。
86.可选地,将stft后的第二消除暂态噪声信号当前帧的频域信号与前一任意帧,例如前帧经stft后的频域信号做互相关,从而将暂态噪声和纯语音信号或带稳态噪声的语音信号区分开来。具体地,先求解谐波功率,可以由以下关系式表示:音信号区分开来。具体地,先求解谐波功率,可以由以下关系式表示:音信号区分开来。具体地,先求解谐波功率,可以由以下关系式表示:
其中,表示第二消除暂态噪声信号当前帧做了stft的频域信号,表示第二消除暂态噪声信号前帧做了stft的频域信号,为的复共轭,为当前帧的自相关谐波功率,为前帧的自相关谐波功率,为当前帧与前帧两帧之间的互相关谐波功率。
87.为了防止数据突变,减小误差,将上述求解的谐波功率变量进行平滑滤波,可以分别表示为:别表示为:别表示为:其中,γ为平滑滤波系数, i为帧号,k为子载波。由于子载波k为同一个,值相同,因此γ可以为固定值平滑滤波系数。进一步地,计算第二消除暂态噪声信号的谐波相干性系数,可以由以下关系式表示:其中,为归一化后的谐波相干性系数,为当前帧和前帧的互相关谐波功率的平方。由于短时脉冲类噪声持续时间一般为10~20ms,所以可以取2。
88.步骤163:基于谐波相干性系数,对第二消除暂态噪声信号进行加权抑制,获得目标信号。
89.示例性地,经过上述步骤161、步骤162,将时域处理后的第二消除暂态噪声信号可以通过stft变换到频域,在频域计算第二消除暂态噪声信号的谐波相干性系数,具体可以进行互相关谐波功率运算,从而将暂态噪声和纯语音信号或带稳态噪声的语音信号区分开来,以进行进一步地暂态噪声抑制,从而得到输入信号中消除暂态噪声的目标信号。
90.在一个实施例中,步骤163可以具体包括步骤163a、步骤163b和步骤163c。
91.步骤163a:通过采用单调递增的凸曲线对谐波相干性系数进行加权,获得平滑谐波相干性系数;步骤163b:通过采用单调递增的凸曲线对平滑谐波相干性系数进行加权,获得所述暂态噪声的抑制系数;步骤163c:基于暂态噪声的抑制系数进行抑制,确定出目标信号。
92.示例性地,基于步骤162求解的谐波相干性系数,具体可以根据,即当前帧和前帧的互相关功率的平方,除以自相关功率即可以得到归一化的谐波相干性系数。
93.进一步地,对谐波相干性系数结合上一帧的结果做加权,即平滑滤波。
由于要求高频部分变化更快,需要用大的平滑系数;要求低频部分变化更慢,需要用小的平滑系数;即针对不同的子载波,不同的k,需要用不同的平滑滤波系数,因此可以通过使用一条单调递增的凸曲线来进行加权,可以具体由下式表示:其中,i为当前帧号;i-1为前一帧;k为子载波,代表从低频到高频的各个子载波。即经加权平滑滤波后,得到平滑谐波相干性系数。
94.进一步地,越小,表示相干性越差,当前信号中含有越多噪声,即越需要对当前谐波进行抑制。具体地,用一条单调递增凸曲线对进行加权,取值范围可以为[1,2]。
[0095]
假设 为暂态噪声的抑制系数,为了更多的抑制高频成分,将单调递增的凸曲线,作为谐波相干性的指数进行运算,具体可以由下式表示:当相干性较大时,例如:,,0.99^2=0.9801,几乎没做抑制;而当相干性较小时,例如:,,0.1^2=0.01,就会做非常多的抑制。可选地,可以设置一个阈值,阈值取值为0.8,即当,即相干性大于0.8时,可以判断为是不带暂态噪声的目标信号,不需要做抑制,否则会对目标信号造成一定的损伤。阈值可以根据需求进行调整,即自定义什么范围就不做抑制。
[0096]
进一步地,基于暂态噪声的抑制系数进行抑制,即将抑制系数与变换到频域的第二消除暂态噪声信号求乘积运算,进而确定出不带暂态噪声的频域目标信号,具体可以由下式确定:将其进行傅里叶逆变换变换到时域,从而得到真实的目标信号。
[0097]
请参阅图5,图5为本技术实施例提供的消除暂态噪声中短时脉冲类噪声前后对比图。其中,纵坐标是频率,横坐标是采样时间。图5中(a)图是消除冲激脉冲类噪声后的第一消除暂态噪声信号,可以看到短时脉冲类噪声的幅值很高,输入信号中真正的语音信号幅度主要集中在低频区域。经过时域限幅处理、再变换到频域进行相干性抑制后的输入信号如图5中(b)图所示,可以看到短时脉冲类噪声被极大的消除,带稳态噪声的语音信号或纯语音信号作为消除暂态噪声的目标信号会有一些抑制,可以通过调节相关参数,来达到暂态噪声抑制与目标信号清晰的一个平衡。
[0098]
请参阅图6,图6为本技术实施例提供的信号处理装置的功能模块示意图。本实施例中的信号处理装置中的各个模块用于执行上述方法实施例中的各个步骤。信号处理装置包括预处理模块210、替换模块220、限幅模块230及抑制模块240,所述装置用于消除输入信
号中的暂态噪声,以得到目标信号。
[0099]
其中,预处理模块210,用于对所述输入信号进行预处理,获得暂态噪声区分信号;替换模块220,用于对所述暂态噪声区分信号中的冲激脉冲类噪声进行时域替换处理,以得到第一消除暂态噪声信号;限幅模块230,用于对所述第一消除暂态噪声信号中的短时脉冲类噪声进行时域限幅处理,以得到第二消除暂态噪声信号;以及抑制模块240,用于对所述第二消除暂态噪声信号进行频域相干性抑制,获得所述目标信号。
[0100]
一种可选的实施方式中,抑制模块240,还用于:将所述第二消除暂态噪声信号变换到频域;处理所述第二消除暂态噪声信号,得到所述第二消除暂态噪声信号的谐波相干性系数;基于所述谐波相干性系数,对所述第二消除暂态噪声信号进行加权抑制,获得所述目标信号。
[0101]
一种可选的实施方式中,抑制模块240,还用于:基于变换到频域的第二消除暂态噪声信号,计算所述第二消除暂态噪声信号的当前帧的谐波功率、所述当前帧的前一任意帧的谐波功率、以及所述当前帧与所述前一任意帧的互相关谐波功率;基于平滑滤波后的所述当前帧的谐波功率、所述当前帧的前一任意帧的谐波功率、以及所述当前帧与所述前一任意帧的互相关谐波功率,进行归一化运算,得到所述第二消除暂态噪声信号的谐波相干性系数。
[0102]
一种可选的实施方式中,抑制模块240,还用于:通过采用单调递增的凸曲线对所述谐波相干性系数进行加权,获得平滑谐波相干性系数;通过采用单调递增的凸曲线对所述平滑谐波相干性系数进行加权,获得所述暂态噪声的抑制系数;基于所述暂态噪声的抑制系数进行抑制,确定出所述目标信号。
[0103]
一种可选的实施方式中,预处理模块210,还用于:对输入信号进行分帧加窗,获得分帧信号;对所述分帧信号进行预白化处理,获得暂态噪声区分信号。
[0104]
一种可选的实施方式中,替换模块210,还用于:判断所述暂态噪声区分信号的峰均比是否不低于预设阈值,若是,则确定所述暂态噪声区分信号包含所述冲激脉冲类噪声;通过自回归模型估计值对所述暂态噪声区分信号中的所述冲激脉冲类噪声的当前实际帧进行时域替换,以得到第一消除暂态噪声信号。
[0105]
一种可选的实施方式中,限幅模块220,还用于:基于所述第一消除暂态噪声信号中的短时脉冲类噪声的前一帧幅值的最大值和最小值,对所述短时脉冲类噪声的当前帧进行时域限幅,以得到第二消除暂态噪声信号;其中,所述前一帧幅值的最大值和最小值通过对当前帧幅值的最大值和最小值进
行平滑滤波获得。请参阅图7,图7是电子设备的方框示意图。电子设备300可以包括存储器311、存储控制器312、处理器313、外设接口314、输入输出单元315、显示单元316。本领域普通技术人员可以理解,图7所示的结构仅为示意,其并不对电子设备300的结构造成限定。例如,电子设备300还可包括比图7中所示更多或者更少的组件,或者具有与图7所示不同的配置。
[0106]
上述的存储器311、存储控制器312、处理器313、外设接口314、输入输出单元315、显示单元316各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。上述的处理器313用于执行存储器中存储的可执行模块。
[0107]
其中,存储器311可以是,但不限于,随机存取存储器(random access memory,简称ram),只读存储器(read only memory,简称rom),可编程只读存储器(programmable read-only memory,简称prom),可擦除只读存储器(erasable programmable read-only memory,简称eprom),电可擦除只读存储器(electric erasable programmable read-only memory,简称eeprom)等。其中,存储器311用于存储程序,所述处理器313在接收到执行指令后,执行所述程序,本技术实施例任一实施例揭示的过程定义的电子设备300所执行的方法可以应用于处理器313中,或者由处理器313实现。
[0108]
上述的处理器313可能是一种集成电路芯片,具有信号的处理能力。上述的处理器313可以是通用处理器,包括中央处理器(central processing unit,简称cpu)、网络处理器(network processor,简称np)等;还可以是数字信号处理器(digital signal processor,简称dsp)、专用集成电路(application specific integrated circuit,简称asic)、现场可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本技术实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0109]
上述的外设接口314将各种输入/输出装置耦合至处理器313以及存储器311。在一些实施例中,外设接口314,处理器313以及存储控制器312可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。
[0110]
上述的输入输出单元315用于提供给用户输入数据。所述输入输出单元315可以是,但不限于,鼠标和键盘等。
[0111]
上述的显示单元316在电子设备300与用户之间提供一个交互界面(例如用户操作界面)给用户参考。在本实施例中,所述显示单元316可以是液晶显示器或触控显示器。液晶显示器或触控显示器可以对处理器执行所述程序的过程进行显示。
[0112]
本实施例中的电子设备300可以用于执行本技术实施例提供的各个方法中的各个步骤。
[0113]
此外,本技术实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中的步骤。
[0114]
本技术实施例所提供的上述方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行上述方法实施例中的步骤,具体可参见上述方法实施例,在此不再赘述。
[0115]
综上所述:本技术实施例提供了一种信号处理方法、装置、设备及存储介质,用于
消除输入信号中的暂态噪声,以得到目标信号,该方法包括:对输入信号进行预处理,获得暂态噪声区分信号;其中,暂态噪声区分信号包括增强幅值后的暂态噪声;对暂态噪声区分信号的冲激脉冲类噪声进行时域替换处理,得到第一消除暂态噪声信号;对第一消除暂态噪声信号中的短时脉冲类噪声进行时域限幅处理,以得到第二消除暂态噪声信号;以及对第二消除暂态噪声信号进行频域相干性抑制,获得目标信号。
[0116]
在上述实现过程中,通过对接收的输入信号加窗分帧后,对每一帧信号进行数据白化预处理;然后根据峰均比检测信号中的冲激脉冲类噪声,在时域用自回归模型估计系数替换冲激脉冲类噪声采样点的实际帧;接着,在时域对短时脉冲类噪声信号采用前一帧的幅值进行动态限幅;最后,变换到频域基于谐波相干性进行进一步地短时脉冲类噪声抑制,从而极大地消除了暂态噪声,复杂度较低,并且保证了原有输入信号的较小失真度。
[0117]
在本技术所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。在本技术实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
[0118]
需要说明的是,功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,rom)随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0119]
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
[0120]
以上所述仅为本技术的实施例而已,并不用于限制本技术的保护范围,对于本领域的技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献