一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种风噪检测方法、装置、设备和存储介质与流程

2021-08-06 18:27:00 来源:中国专利 TAG:技术 数据处理 音频处理 语音 检测方法
一种风噪检测方法、装置、设备和存储介质与流程

本公开涉及数据处理技术领域,尤其涉及音频处理技术和语音技术,具体涉及一种风噪检测方法、装置、设备和存储介质。



背景技术:

随着科学技术在生活工作各个领域的不断发展,个人便携式设备逐步普及,基于户外场景的各种语音设备随之应运而生。在户外进行实时语音通讯、录音或与智能语音助手进行交互时,不可避免地受到风噪的干扰。风噪的存在严重影响实时通话和语音可懂度,而风噪对语音识别的影响是灾难性的。

为了降低风噪对语音的影响,去风噪算法的引入在一定程度上缓解了风噪对语音的影响,而风噪检测作为去风噪的重要组成部分,对于去风噪算法的最终效果起着至关重要的影响。

现有技术一般可利用双麦克风采集信号来检测风噪,但是,由于产生风噪的环境复杂,所以容易出现误检或漏检的情况,导致检测时准确率较低,鲁棒性较差。



技术实现要素:

本申请提供了一种风噪检测方法、装置、设备和存储介质,以优化风噪检测方案。

根据本申请的一方面,提供了一种风噪检测方法,所述方法包括:

获取至少两个麦克风分别采集到的音频信号序列;

计算至少两个音频信号序列的互相关数据,并根据所述互相关数据计算风噪检测值;

根据所述风噪检测值表征的风噪存在可能性,调整风噪检测门限值的检测区域范围;

根据所述互相关数据与所述检测区域范围的关系,确定风噪检测结果。

根据本申请的另一方面,提供了一种风噪检测装置,所述装置包括:

音频信号序列获取模块,用于获取至少两个麦克风分别采集到的音频信号序列;

风噪检测值计算模块,用于计算至少两个音频信号序列的互相关数据,并根据所述互相关数据计算风噪检测值;

检测区域范围调整模块,用于根据所述风噪检测值表征的风噪存在可能性,调整风噪检测门限值的检测区域范围;

风噪检测结果确定模块,用于根据所述互相关数据与所述检测区域范围的关系,确定风噪检测结果。

根据本申请的另一方面,提供一种电子设备,该电子设备包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如本申请实施例任一项所述的风噪检测方法。

根据本申请的一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如本申请实施例任一项所述的风噪检测方法。

根据本申请的一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如本申请实施例任一项所述的风噪检测方法。

本申请实施例的技术方案,能够改善风噪检测方案,提高风噪检测的准确率和鲁棒性。

应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案,不构成对本申请的限定。其中:

图1是根据本申请实施例的一种风噪检测方法的示意图;

图2是根据本申请实施例的另一种风噪检测方法的示意图;

图3是根据本申请实施例的又一种风噪检测方法的示意图;

图4是根据本申请实施例的又一种风噪检测方法的示意图;

图5是根据本申请实施例的又一种风噪检测方法的示意图;

图6a是根据本申请实施例的又一种风噪检测方法的示意图;

图6b是根据本申请实施例的一种优选的风噪检测方法的示意图;

图7是根据本申请实施例的一种风噪检测装置的示意图;

图8是用来实现本申请实施例的一种风噪检测方法的电子设备的框图;

具体实施方式

以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

图1是根据本申请实施例的一种风噪检测方法的示意图。本实施例可适用于在利用去风噪算法对语音设备进行降风噪处理时,对语音设备存在是否风噪进行检测的情况,从而减少风噪检测时出现的误检或者漏检,提高风噪检测的准确率和鲁棒性。本实施例公开的风噪检测方法可以由风噪检测方法装置来执行,该装置可以由软件和/或硬件的方式实现,配置于具备计算和存储功能的电子设备中。该电子设备可以为终端设备、耳机、服务器、或智能音箱等具有音频处理能力的语音设备。

参见图1,本实施例提供的一种风噪检测方法,包括:

s110、获取至少两个麦克风分别采集到的音频信号序列。

其中,音频信号序列是由配置在同一语音设备的不同麦克风采集到的同一段语音信号。音频信号序列可以是用户在户外通过语音设备进行实时语音通讯、录音或与智能语音助手进行交互时,由配置在该语音设备中的麦克风采集得到的。

至少两个麦克风设置于同一个语音设备上,距离临近,可通过相互比对音频的互相关性来检测风噪。在一个可选的实施例中,至少两个麦克风包括分别设置在一个蓝牙耳机上的主麦克风和辅助麦克风,主麦克风距离辅助麦克风为3-4厘米;主麦克风相对于辅助麦克风临近用户嘴部。

音频信号序列可以是时序信号也可以是频域信号,优选的,音频信号序列为频域信号。若音频信号序列为时序信号,可将时序信号转换为频域信号。

在一个可选的实施例中,获取至少两个麦克风分别采集的时域格式的音频信号序列,每个所述音频信号序列包括至少两帧音频信号;将各时域格式的音频信号序列转换为频域格式的音频信号序列。

其中,音频信号序列可以包括多个音频信号帧,示例性的,麦克风在1秒内可采集60帧音频信号。在对音频信号序列进行风噪检测时,为保证风噪检测的准确性,获取的音频信号序列包括至少两帧音频信号。

由于时域信号是描述信号在不同时刻取值的函数。频域信号描述了信号的频率结构及频率与该频率信号幅度的关系。因为信号不仅随时间变化,还与频率、相位等信息有关,这就需要分析信号的频率结构,并在频率域中对信号进行描述。音频信号为合成信号,根据傅立叶定理分解成为多个正弦谐波函数的和,在频域对音频信号的幅频和相频特性进行分析,更直观。

在一个可选的实施例中,将各时域格式的音频信号序列转换为频域格式的音频信号序列包括:针对每个时域格式的音频信号序列,基于窗函数,将至少两帧时域格式的音频信号序列采用重叠保留法进行拼接,以形成时域格式的音频信号;将所述时域格式的音频信号进行傅里叶变换,以形成多个采样频点的音频信号,作为频域格式的音频信号序列。

其中,重叠保留法是指通过保留分段信号前端一定位数的原输入序列来延长信号序列。就其中一个时域格式的音频信号序列而言,基于窗函数,将至少两帧时域格式的音频信号序列采用重叠保留法进行拼接,具体的是将该音频信号序列的历史帧拼接到当前帧,历史帧与当前帧重叠区域的大小与窗函数中窗的大小相关,这样做,可以将音频信号序列延长至所需长度。

由于,音频信号序列中除了包括纯净语音信号以外,还可能包括风噪。时域的音频信号序列可以用公式y(m)=x(m) d(m)表示,其中,x(m)表示纯净语音信号;d(m)表示风噪。

具体的,采用下式,将所述时域格式的音频信号进行傅里叶变换:

yi(m,k)=dft(yi(m)w)

其中,yi(m)w为使用重叠保留法(overlap-save)对输入信号yi(m)进行拼接得到的拼接结果。i=1,2表示第i个麦克风,y1(m)和y2(m)分别为第1个麦克风和第2个麦克风采集到的时域音频信号序列,m表示当前帧,w是窗函数,k表示第k个频点,yi(m,k)是经过离散时间傅里叶变换后的频域音频信号序列。

频域音频信号序列包括多个频点。其中,频点是给固定频率的编号。具体的,将时域音频信号序列变换得到的频域音频信号覆盖的全部频率区间进行等分,划分后得到一定数量的频段,依次对每个频段进行编号,那编号即为频点。示例性的,频率间隔都为200khz。这样就依照200khz的频率间隔从890mhz、890.2mhz、890.4mhz、890.6mhz、890.8mhz、891mhz…915mhz分为125个频率段,并对每个频段进行编号,从1、2、3、4…125;这些对固定频率的编号就是所说的频点。

s120、计算至少两个音频信号序列的互相关数据,并根据所述互相关数据计算风噪检测值。

其中,互相关数据描述的是音频信号序列之间相关程度,以及组成各个音频信号序列本身的各音频信号之间的相关程度。互相关数据是音频信号序列之间以及音频信号序列中音频信号自身相似性的度量。

风噪检测值是根据互相关数据计算得到的,根据风噪检测值能大致知道当前音频信号序列中是否存在风噪,当检测值较小时说明当前音频信号序列中更倾向有风噪。

s130、根据所述风噪检测值表征的风噪存在可能性,调整风噪检测门限值的检测区域范围。

可选的,风噪检测门限值包括上风噪检测门限值和下风噪检测门限值。

风噪检测门限值的检测区域范围,即为上风噪检测门限值和下风噪检测门限值共同确定的区间。风噪检测门限值的检测区域直接决定着风噪检测的准确性,风噪检测值可以表征的风噪存在可能性。在检测风噪时,风噪检测值较小时,表明风噪存在的可能性较大,此时,对风噪检测门限值的检测范围进行调整,使风噪检测值或互相关数据尽量落入检测区域范围尽量的中部,而避免落入检测区域范围的边缘,这样可以有效减少误检的情况。其中,误检是指将不存在风噪的音频信号序列错误的判断为存在风噪的情况。上述方案中,大于上风噪检测门限值的情况,一般表明肯定不存在风噪,而小于下风噪检测门限值的情况,一般表明肯定存在风噪,属于风噪检测的确定区域,发生误检的概率较低。而落入检测区域范围内的检测值,可能存在风噪或不存在风噪,是不确定区域。本申请实施例的技术方案,针对不确定区域,进一步根据风噪存在可能性,对检测区域范围进行动态调整,使得对不确定区域内的检测更加准确。

s140、根据所述互相关数据与所述检测区域范围的关系,确定风噪检测结果。

其中,互相关数据与所述检测区域范围的关系是指互相关数据与检测区域范围之间的相对位置关系。具体的,相对位置关系包括:互相关数据位于风噪检测区间的左侧、右侧或者落入检测区域范围内。

其中,风噪检测结果即为音频信号序列中是否存在风噪。通过判断互相关数据与检测区域范围的相对位置关系即可确定音频信号序列中是否存在风噪

本申请实施例的技术方案通过计算至少两个音频信号序列的互相关数据,并根据所述互相关数据计算风噪检测值,再根据所述风噪检测值表征的风噪存在可能性,调整风噪检测门限值的检测区域范围;最后根据所述互相关数据与所述检测区域范围的关系,确定风噪检测结果。本申请根据风噪存在可能性,对风噪检测门限值的检测区域范围进行截断,提高了风噪检测的可靠性,同时降低了误检测率。

图2是根据本申请实施例的另一种风噪检测方法的示意图;本实施例是在上述实施例的基础上提出的一种可选方案。具体的,是对根据所述风噪检测值表征的风噪存在可能性,调整风噪检测门限值的检测区域范围的细化。

参见图2,本实施例提供的风噪检测方法包括:

s210、获取至少两个麦克风分别采集到的音频信号序列。

s220、计算至少两个音频信号序列的互相关数据,并根据所述互相关数据计算风噪检测值。

s230、如果所述风噪检测值表征的风噪存在可能性小于设定可能性阈值,则调整风噪检测门限值的检测区域范围,以使风噪检测结果为无风噪的概率增加。

其中,设定可能性阈值是作为是否对风噪检测门限值的检测范围进行调整的依据。设定可能性阈值是相关技术人员根据实际情况设置的经验值,在这里不作限定,具体实际情况确定,在一个可选的实施例中,当风噪存在可能性的取值范围在0-1之间时,则设定可能性阈值的取值范围是0.4-0.5。

如果所述风噪检测值表征的风噪存在可能性小于设定可能性阈值,则说明当前音频信号序列中存在风噪的可能性更大,此时调整风噪检测门限值的检测区域范围,可以降低检测区域下限值和检测区域上限值,以实现降低误检率。

如果所述风噪检测值表征的风噪存在可能性大于等于设定可能性阈值,则说明当前音频信号序列中存在风噪的可能性更小,更倾向于无风噪。此时,则不再需要对风噪检测门限值的检测范围进行调整,将原风噪检测门限值的检测区域范围,用于后续计算即可。

在一个可选的实施例中,按照如下公式调整所述风噪检测门限值的检测区域范围:

其中,clow(m),cup(m)为检测区域下限值和检测区域上限值,ηlow,ηup为检测区域初始下限值和检测区域初始上限值;β为检测区域下限值的调整系数,γ为检测区域上限值的调整系数,0<β<γ<1,γthres是所述设定可能性阈值。

由于,β和γ均为0到1之间的小数,且β<γ,利用β和γ对检测区域下限值和检测区域上限值进行调整,将使得由ηlow和ηup确定的风噪检测门限值的检测区域范围,产生截断原始风噪检测门限值的检测区域范围的效果。

s240、根据所述互相关数据与所述检测区域范围的关系,确定风噪检测结果。

本申请实施例的技术方案,通过在风噪检测值表征的风噪存在可能性小于设定可能性阈值的情况下,调整风噪检测门限值的检测区域范围,提高了风噪检测的可靠性,同时降低了误检测率。

图3是根据本申请实施例的又一种风噪检测方法的示意图;本实施例是在上述实施例的基础上提出的一种可选方案。具体的,音频信号序列为频域格式的音频信号序列,本实施例是对上述实施例中操作“计算至少两个音频信号序列的互相关数据,并根据所述互相关数据计算风噪检测值是对根据所述风噪检测值表征的风噪存在可能性,调整风噪检测门限值的检测区域范围”的细化。

参见图3,本实施例提供的风噪检测方法包括:

s310、获取至少两个麦克风分别采集到的音频信号序列。

s320、针对每个音频信号序列中每个频点的音频信号,计算自相关值。

其中,自相关值是指音频信号序列中每个频点的音频信号,在该频点标识的频段内任意不同频率的取值之间的相关程度。

计算得到的自相关值的数量与音频信号序列划分的频点的数量一致,每个频点均对应一个自相关值。

示例性的,以麦克风数量为2的情况进行说明。具体的,针对每个音频信号序列中每个频点的音频信号,可以通过下列公式计算自相关值:

其中,为y1(m,k)共轭,为y2(m,k)共轭。y1(m,k)和y2(m,k)是y1(m)和y2(m)经过离散时间傅里叶变换后的频域音频信号序列。φy1y1(m,k)是y1(m)的自相关值,φy2y2(m,k)是y2(m)的自相关值。m表示麦克风采集到的第m帧音频信号;k表示频域格式的音频信号序列的频点序号。

s330、针对每个频点,分别计算音频信号两两之间的互相关值。

其中,互相关值是计算两个音频信号在各个频点间的相关程度。

计算得到的互相关值的数量与音频序列划分的频点的数量一致,每个频点均对应一个互相关值。

继续上例进行说明,具体的,针对每个频点,可以通过下列公式计算音频信号两两之间的互相关值:

其中,φy1y2(m,k)为y1(m)和y2(m)之间的互相关值。

可以知道的是,步骤s320和步骤s330之间并不存在先后的逻辑关系,既可以先计算自相关值,同样可以先计算互相关值。

s340、针对每个频点,根据所述自相关值和互相关值,计算至少两个音频信号的互相关数据。

可以知道的是,在计算音频信号的自相关值和互相值时,音频信号均为频域上的音频信号。

自相关值反映的是音频信号自身每个频点的音频信号之间的相关程度,互相关值反映的是两个音频信号在每个频点的音频信号之间的相关程度。音频信号的自相关值可以反映在遇到突变噪声或两个麦克风本底低频噪声的情况。音频信号的互相关值可以反映两个麦克风在同一时刻受到风噪的情况。综合考虑自相关值和互相关值,可以减少在遇到突变噪声或两个麦克风本底低频噪声不一致时可能导致误检的发生。以及当两个麦克风在同一时刻均受到较为相似的风噪影响时,出现漏检的情况。从而提高风噪检测的准确率和鲁棒性。

s350、根据各频点的所述互相关数据计算风噪检测值。

由于音频信号序列中的每个频点均存在对应的自相关值和与其他音频信号序列的互相关值,根据计算得到的互相关值和自相关值,计算各频点对应的风噪检测值。

s360、根据所述风噪检测值表征的风噪存在可能性,调整风噪检测门限值的检测区域范围。

s370、根据所述互相关数据与所述检测区域范围的关系,确定风噪检测结果。

本申请实施例综合考虑了每个音频信号序列中每个频点的自相关值,同时考虑了每个频点,音频信号两两之间的互相关值,综合根据自相关值和互相关值,得到互相关数据。综合考虑自相关值和互相关值,可以减少在遇到突变噪声或两个麦克风本底低频噪声不一致时可能导致误检的发生。以及当两个麦克风在同一时刻均受到较为相似的风噪影响时,出现漏检的情况。从而提高风噪检测的准确率和鲁棒性。

图4是根据本申请实施例的又一种风噪检测方法的示意图;本实施例是在上述实施例的基础上提出的一种可选方案。具体的,是在“根据所述自相关值和互相关值,计算至少两个音频信号的互相关数据”之前,追加“分别对所述自相关值和互相关值进行平滑处理”操作。

参见图4,本实施例提供的风噪检测方法包括:

s410、获取至少两个麦克风分别采集到的音频信号序列。

s420、针对每个音频信号序列中每个频点的音频信号,计算自相关值。

s430、针对每个频点,分别计算音频信号两两之间的互相关值。

s440、分别对所述自相关值和互相关值进行平滑处理。

对自相关值和互相关值进行平滑处理可以有效避免由于频域相干性的波动导致的计算结果随时间波动过快的情况。

在一个可选的实施例中,采用如下公式,分别对所述自相关值或互相关值进行平滑处理:

φsmooth(m,k)=αφsmooth(m,k) (1-α)φ(m,k)

其中,α为平滑常数,φ(m,k)为平滑前的自相关值或互相关值;φsmooth(m,k)为平滑后的自相关值或互相关值;m表示麦克风采集到的第m帧音频信号;k表示频域格式的音频信号序列的频点序号。

其中,平滑常数α是相关技术人员根据实际情况设置的经验值,α的具体数值在这里不作限定,具体依据实际情况确定。示例性的,可以选择介于0.8~0.95之间的数值作为α的取值。。

s450、针对每个频点,根据所述自相关值和互相关值,计算至少两个音频信号的互相关数据。

为了降低风噪检测的后续流程操作的复杂度,便于后续处理。在一个可选的实施例中,针对每个频点,根据所述自相关值和互相关值进行互相关值的归一化处理,以得到互相关系数,作为所述互相关数据。

其中,归一化处理是将互相关值的范围约束在0~1。

在一个可选的实施例中,按照如下公式进行归一化处理,以得到互相关系数:

其中,cy1y2(m,k)是所述互相干系数;m表示麦克风采集到的第m帧音频信号;k表示频域格式的音频信号序列的频点序号;音频信号序列的数量为两个,y1表示第一个音频信号序列,y2表示第二个音频信号序列;φy1y2(m,k)为所述互相关值,φy1y1(m,k)和φy2y2(m,k)分别为所述自相关值。值得注意的是φy1y2(m,k)、φy1y1(m,k)和φy2y2(m,k)优选可以为平滑处理以后的数值,φsmooth_y1y2(m,k)、φsmooth_y1y1(m,k)和φsmooth_y2y2(m,k)。

则,

s460、根据各频点的所述互相关数据计算风噪检测值。

s470、根据所述风噪检测值表征的风噪存在可能性,调整风噪检测门限值的检测区域范围。

s480、根据所述互相关数据与所述检测区域范围的关系,确定风噪检测结果。

本申请实施例的技术方案通过在计算得到每个音频信号序列中每个频点的自相关值和音频信号两两之间的互相关值,以后别对所述自相关值和互相关值进行平滑处理,从而减少频域相干性的波动对检测算法的影响,进而提高了风噪检测的准确性和可靠性。

图5是根据本申请实施例的又一种风噪检测方法的示意图;本实施例是在上述实施例的基础上提出的一种可选方案。具体的,是对“根据各频点的所述互相关数据计算风噪检测值”的细化。

参见图5,本实施例提供的风噪检测方法包括:

s510、获取至少两个麦克风分别采集到的音频信号序列。

s520、针对每个音频信号序列中每个频点的音频信号,计算自相关值。

s530、针对每个频点,分别计算音频信号两两之间的互相关值。

s540、针对每个频点,根据所述自相关值和互相关值,计算至少两个音频信号的互相关数据。

s550、根据各频点的所述互相关数据,计算设定频带范围内互相关系数的均值,以得到所述风噪检测值。

由于不同频点的互相关系数之间可能在较大差异,个别频点的互相关系数可能出现远大于或远小于大多数频点的互相关系数的情况,这些极值并不能反映音频信号的集中趋势。计算设定频带范围内互相关系数的均值,可以更好的反映设定频带范围内互相关系数的集中趋势。

其中,设定频带范围是相关技术人员根据实际情况确定的,在这里不作限定,具体依据实际情况确定。由于风噪主要集中在音频信号的低频部分,因此设定频带范围主要取低频范围。因为,频点为频段的编号,设定频带范围可以通过选定频点确定。

在一个可选的实施例中,按照如下公式,计算设定频带范围内互相关系数的均值,以得到所述风噪检测值:

其中,ind1为所述设定频带范围的下限,ind2为所述设定频带范围的上限,γ(m)是风噪检测值;‖‖2代表二范数;m表示麦克风采集到的第m帧音频信号;k表示频域格式的音频信号序列的频点序号;音频信号序列的数量为两个,y1表示第一个音频信号序列,y2表示第二个音频信号序列。

其中,‖‖2代表二范数,具体的是将cy1y2(m,k)的实部与虚部平方和再开方。

在确定了设定频带范围以后,可以根据设定频带范围和频点数量确定ind1和ind2。示例性的,当傅里叶变换阶数为128,由于傅里叶变换把有效频谱为8k的信号等分为128/2份(采样定理),即64等份,那么若设定频带范围为0~2000hz,映射到频点就是0~2000/8000*64,即0~16,此时可以确定ind1=0,ind2=16。

s560、根据所述风噪检测值表征的风噪存在可能性,调整风噪检测门限值的检测区域范围。

s570、根据所述互相关数据与所述检测区域范围的关系,确定风噪检测结果。

本申请实施例的技术方案在计算得到每个音频信号序列中每个频点的自相关值和音频信号两两之间的互相关值以后,根据自相关值和互相关值,计算至少两个音频信号的互相关数据,再根据各频点的互相关数据,计算设定频带范围内互相关系数的均值。本申请通过在风噪更可能出现的设定频带范围内计算互相关系数的均值,更好的反映设定频带范围内互相关系数的集中趋势,进而提高了风噪检测的准确性和可靠性。

图6是根据本申请实施例的又一种风噪检测方法的示意图;本实施例是在上述实施例的基础上提出的一种可选方案。具体的,是对“根据所述互相关数据与所述检测区域范围的关系,确定风噪检测结果”的细化。

s610、获取至少两个麦克风分别采集到的音频信号序列。

s620、针对每个音频信号序列中每个频点的音频信号,计算自相关值。

s630、针对每个频点,分别计算音频信号两两之间的互相关值。

s640、针对每个频点,根据所述自相关值和互相关值,计算至少两个音频信号的互相关数据。

s650、根据各频点的所述互相关数据,计算设定频带范围内互相关系数的均值,以得到所述风噪检测值。

s660、根据所述风噪检测值表征的风噪存在可能性,调整风噪检测门限值的检测区域范围。

s670、从各频点的所述互相关数据中,截取落入所述检测区域范围内的数值,以更新各频点的所述互相关数据。

在风噪检测门限的检测区域范围调整以后,根据各频点的互相关数据与风噪检测门限值的检测区域范围之间的相对位置关系,确定用于更新互相关数据的更新数据,利用更新数据更新各频点的互相关数据。

其中,检测区域范围是用于判断音频信号序列中是否存在风噪的。一般而言,若互相关数据落入检测区域范围之外,则据此可以得到相对明确的音频信号序列中是否存在风噪判断结果,即音频信号序列中存在或者不存在风噪。本申请实施例将关注点落在风噪判断结果不确定的情况,即互相关数据落入检测区域范围内的情况。从各频点的所述互相关数据中截取落入所述检测区域范围内的数值,利用更新数据更新这些数值。

在一个可选的实施例中,按照如下公式确定风噪检测结果

其中,clow(m),cup(m)为检测区域下限值和检测区域上限值;为调整后的互相干系数。

若互相关数据落入检测区域范围左侧,即互相关数据小于检测区域下限值,则确定更新数据为0;若互相关数据落入检测区域范围右侧,即互相关数据大于检测区域上限值,则确定更新数据为1;若互相关数据落入检测区域范围内,即互相关数据介于检测区域下限值和检测区域上限值之间,则确定更新数据为cy1y2(m,k)-clow(m)。

s680、根据更新后的各频点的互相关数据在所述检测区域范围内的比例值,计算各频点存在风噪的风噪存在概率。

其中,更新后的各频点的互相关数据在所述检测区域范围内的比例值,具体的,该比例可以通过互相关数据与检测区域下限值差值和检测区域下限值与检测区域上限值差值的比值确定。

示例性的,在将落入检测区域范围内的互相关数值的更新数据确定为cy1y2(m,k)-clow(m)的情况下,可以通过下式计算比例值

各频点存在风噪的风噪存在概率则可以通过如下公式确定:

其中,为调整后的互相干系数,在互相关数据在检测区域范围内的情况下,

s690、针对风噪检测频率范围内各频点的风噪存在概率进行统计。

由于音频信号序列的检测频率范围包括多个频点,该范围每个频点的风噪存在概率判断对音频信号序列是否存在风噪均有参考价值。因此,需要针对风噪检测频率范围内各频点的风噪存在概率进行统计。

在一个可选的实施例中,按照如下公式进行统计:

其中,n(m)为统计结果,i()为指示函数。n(m)是指对风噪存在概率进行二值化处理后,特定频率范围内(由ind1和ind2确定的)风噪存在概率为1的统计量。

在一个可选的实施例中,在针对风噪检测频率范围内各频点的风噪存在概率进行统计之前,还包括:根据风噪存在概率门限值,对所述风噪存在概率进行二值化处理。

其中,二值化处理即为将风噪存在概率与风噪存在概率门限值进行比较,根据比较结果将风噪存在概率设置为0或者1的操作。

在一个可选的实施例中,按照如下公式对所述风噪存在概率进行二值化处理:

其中,pthres为所述风噪存在概率门限值,ε(m,k)为二值化处理后的风噪存在概率。其中,p(h1|y(m,k))表示各频点存在风噪的风噪存在概率。

其中,风噪存在概率门限值是由相关技术人员根据实际情况确定的经验值,在这里不作限定,具体依据实际情况确定,pthres为常数。若风噪存在概率p(h1|y(m,k))大于pthres则将风噪存在概率设置为1;否则,则将风噪存在概率设置为0。

s695、根据各频点风噪存在概率的统计结果与风噪统计门限值之间的关系,则确定所述风噪检测结果。

其中,各频点风噪存在概率的统计结果即为各频点风噪存在概率为1的数量。将各频点风噪存在概率的统计结果和风噪统计门限值进行比较,根据比较结果确定风噪检测结果。

在一个可选的实施例中,按照如下公式确定所述风噪检测结果:

其中,swindnoise(m)为所述风噪检测结果,nthres为所述风噪检测频率范围对应的风噪统计门限值。

若各频点风噪存在概率为1的数量大于风噪统计门限值,则风噪检测结果为1,即表明音频信号序列中存在风噪;若各频点风噪存在概率为1的数量小于等于风噪统计门限值,则风噪检测结果为0,即表明音频信号序列中不存在风噪。

本申请实施例的技术方案通过计算至少两个音频信号序列的互相关数据,并根据所述互相关数据计算风噪检测值,再根据所述风噪检测值表征的风噪存在可能性,调整风噪检测门限值的检测区域范围;最后根据所述互相关数据与所述检测区域范围的关系,确定风噪检测结果。本申请根据风噪存在可能性,对风噪检测门限值的检测区域范围进行截断,提高了风噪检测的可靠性,同时降低了误检测率。

图6b是根据本申请实施例的一种优选的风噪检测方法的示意图,如图6b所示,以麦克风数量为2的情况进行说明。在一个优选的实施例中,风噪检测的包括以下流程:

步骤1、对麦克风1和麦克风2采集到的时域音频信号序列y1和y2进行离散傅里叶变换(dft)得到频域音频信号序列y1(m,k)和y2(m,k);

步骤2、再分别计算y1(m,k)和y2(m,k)的自相关值与y1(m,k)和y2(m,k)之间的互相关值,得到自相关值φy1y1(m,k)和φy2y2(m,k)以及互相关值φy1y2(m,k)。

步骤3、分别对所述自相关值φy1y1(m,k)和φy2y2(m,k)或互相关值φy1y2(m,k)进行平滑处理得到平滑处理结果φsmooth_y1y1(m,k)、φsmooth_y2y2(m,k)和φsmooth_y1y2(m,k)。

步骤4、然后通过对平滑处理结果进行频域相干系数的计算,得到互相关系数cy1y2(m,k)

步骤5、通过公式对平滑互相关值做归一化处理。

步骤6、根据频域相干系数,通过公式

计算设定频带范围内互相关系数的均值,从而得到风噪检测值。

步骤7、根据风噪检测值表征的风噪存在可能性,调整风噪检测门限值的检测区域范围;

其中,β,γ是区间调整系数,0<β<γ<1,ηlow,ηup为检测区域初始下限值和检测区域初始上限值,clow(m),cup(m)为检测区域下限值和检测区域上限值,γthres是设定可能性阈值。

步骤8、从各频点的所述互相关数据中,截取落入所述检测区域范围内的数值,以更新各频点的所述互相关数据。

其中,是调整后的互相干系数。

步骤9、根据更新后的各频点的互相关数据在所述检测区域范围内的比例值,计算各频点存在风噪的风噪存在概率

其中,p(h1|y(m,k))是风噪存在概率。

步骤10、根据风噪存在概率门限值,对所述风噪存在概率进行二值化处理。

其中,ε(m,k)是将风噪存在概率进行二值化处理后的结果。pthres是语音存在概率的门限值。

步骤11、在风噪检测频率范围内,统计当前时刻处风噪状态为1的数目。

其中i()为指示函数,n(m)是特定频率范围内风噪存在概率为1的统计量。

步骤12、若当前时刻风噪存在概率为1的数目超过风噪统计门限值nthres,则认为当前音频信号序列存在风噪,否则风噪不存在。

其中,swindnoise(m)为所述风噪检测结果,nthres为所述风噪检测频率范围对应的风噪统计门限值。

本申请实施例的技术方案通过根据风噪检测值表征的风噪存在可能性,调整风噪检测门限值的检测区域范围,以使风噪检测结果为无风噪的概率增加,降低了风噪检测的误检测率。示例性的,若在风噪检验值为0.6,设定可能性阈值为0.5的情况下,由于0.6大于0.5,此时说明当前音频信号序列更倾向于无风噪。若初始风噪检测门限值的检测区域为[0.5,0.9],β和γ均为0.8,则调整后的风噪检测门限值的检测区域为[0.5*0.8,0.9*0.8],即[0.4,0.72],若未对风噪检测门限值的检测区域进行调整,根据步骤9中提供的风噪存在概率计算公式,最终算出p=1-(0.6-0.5)/(0.9-0.5)=0.75,表示0.75概率有风噪,而如果引入调整系数β和γ,最终算出p=1-(0.6-0.4)/(0.72-0.4)=0.375概率有风噪。可见,两种计算结果从数值上看还是相差很远的。

图7是根据本申请实施例的一种风噪检测装置的示意图;参见图7,本申请实施例公开了一种风噪检测装置700,该装置700可以包括:音频信号序列获取模块710、风噪检测值计算模块720、检测区域范围调整模块730和风噪检测结果确定模块740。

音频信号序列获取模块710,用于获取至少两个麦克风分别采集到的音频信号序列;

风噪检测值计算模块720,用于计算至少两个音频信号序列的互相关数据,并根据所述互相关数据计算风噪检测值;

检测区域范围调整模块730,用于根据所述风噪检测值表征的风噪存在可能性,调整风噪检测门限值的检测区域范围;

风噪检测结果确定模块740,用于根据所述互相关数据与所述检测区域范围的关系,确定风噪检测结果。

本申请实施例的技术方案通过计算至少两个音频信号序列的互相关数据,并根据所述互相关数据计算风噪检测值,再根据所述风噪检测值表征的风噪存在可能性,调整风噪检测门限值的检测区域范围;最后根据所述互相关数据与所述检测区域范围的关系,确定风噪检测结果。本申请根据风噪存在可能性,对风噪检测门限值的检测区域范围进行截断,提高了风噪检测的可靠性,同时降低了误检测率。

可选的,检测区域范围调整模块,具体用于:如果所述风噪检测值表征的风噪存在可能性小于设定可能性阈值,则调整风噪检测门限值的检测区域范围,以使风噪检测结果为无风噪的概率增加。

可选的,检测区域范围调整模块具体用于:按照如下公式调整所述风噪检测门限值的检测区域范围:

其中,clow(m),cup(m)为检测区域下限值和检测区域上限值,ηlow,ηup为检测区域初始下限值和检测区域初始上限值;β为检测区域下限值的调整系数,γ为检测区域上限值的调整系数,0<β<γ<1,гthres是所述设定可能性阈值。

可选的,所述设定可能性阈值的取值范围是0.4-0.5。

可选的,所述至少两个麦克风包括分别设置在一个蓝牙耳机上的主麦克风和辅助麦克风,主麦克风距离辅助麦克风为3-4厘米;主麦克风相对于辅助麦克风临近用户嘴部。

可选的,音频信号序列获取模块,包括:时域格式音频信号序列获取子模块,用于获取至少两个麦克风分别采集的时域格式的音频信号序列,每个所述音频信号序列包括至少两帧音频信号;音频信号序列格式转换子模块,用于将各时域格式的音频信号序列转换为频域格式的音频信号序列。

可选的,音频信号序列格式转换子模块,包括:音频信号序列拼接单元,用于针对每个时域格式的音频信号序列,基于窗函数,将至少两帧时域格式的音频信号序列采用重叠保留法进行拼接,以形成时域格式的音频信号;音频信号傅里叶变换单元,用于将所述时域格式的音频信号进行傅里叶变换,以形成多个采样频点的音频信号,作为频域格式的音频信号序列。

可选的,音频信号序列为频域格式的音频信号序列,则风噪检测值计算模块,包括:自相关值计算子模块,用于针对每个音频信号序列中每个频点的音频信号,计算自相关值;互相关值计算子模块,用于针对每个频点,分别计算音频信号两两之间的互相关值;互相关数据计算子模块,用于针对每个频点,根据所述自相关值和互相关值,计算至少两个音频信号的互相关数据;风噪检测值计算子模块,用于根据各频点的所述互相关数据计算风噪检测值。

可选的,所述装置,还包括:平滑处理模块,用于在根据所述自相关值和互相关值,计算至少两个音频信号的互相关数据之前,分别对所述自相关值和互相关值进行平滑处理。

可选的,平滑处理模块具体用于:采用如下公式,分别对所述自相关值或互相关值进行平滑处理:

φsmooth(m,k)=αφsmooth(m,k) (1-α)φ(m,k)

其中,α为平滑常数,φ(m,k)为平滑前的自相关值或互相关值;φsmooth(m,k)为平滑后的自相关值或互相关值;m表示麦克风采集到的第m帧音频信号;k表示频域格式的音频信号序列的频点序号。

可选的,互相关数据计算子模块,包括:互相关系数确定单元,用于针对每个频点,根据所述自相关值和互相关值进行互相关值的归一化处理,以得到互相关系数,作为所述互相关数据。

可选的,互相关系数确定单元,具体用于:按照如下公式进行归一化处理,以得到互相关系数:

其中,cy1y2(m,k)是所述互相干系数;m表示麦克风采集到的第m帧音频信号;k表示频域格式的音频信号序列的频点序号;音频信号序列的数量为两个,y1表示第一个音频信号序列,y2表示第二个音频信号序列;φy1y2(m,k)为所述互相关值,φy1y1(m,k)和φy2y2(m,k)分别为所述自相关值。

可选的,风噪检测值计算子模块,包括:风噪检测值确定单元,用于根据各频点的所述互相关数据,计算设定频带范围内互相关系数的均值,以得到所述风噪检测值。

可选的,风噪检测值确定单元,具体用于:按照如下公式,计算设定频带范围内互相关系数的均值,以得到所述风噪检测值:

其中,ind1为所述设定频带范围的下限,ind2为所述设定频带范围的上限,γ(m)是风噪检测值;‖‖2代表二范数;m表示麦克风采集到的第m帧音频信号;k表示频域格式的音频信号序列的频点序号;音频信号序列的数量为两个,y1表示第一个音频信号序列,y2表示第二个音频信号序列。

可选的,风噪检测结果确定模块,包括:互相关数据更新子模块,用于从各频点的所述互相关数据中,截取落入所述检测区域范围内的数值,以更新各频点的所述互相关数据;风噪存在概率计算子模块,用于根据更新后的各频点的互相关数据在所述检测区域范围内的比例值,计算各频点存在风噪的风噪存在概率;风噪存在概率统计子模块,用于针对风噪检测频率范围内各频点的风噪存在概率进行统计;

风噪检测结果确定子模块,用于根据各频点风噪存在概率的统计结果与风噪统计门限值之间的关系,则确定所述风噪检测结果。

可选的,互相关数据更新子模块,具体用于:按照如下公式确定风噪检测结果:

其中,clow(m),cup(m)为检测区域下限值和检测区域上限值;为调整后的互相干系数。

可选的,风噪存在概率计算子模块,具体用于:按照如下公式计算各频点存在风噪的风噪存在概率:

其中,p(h1|y(m,k))为所述风噪存在概率。

可选的,所述装置还包括:风噪存在概率二值化模块,具体用于:在针对风噪检测频率范围内各频点的风噪存在概率进行统计之前,根据风噪存在概率门限值,对所述风噪存在概率进行二值化处理。

可选的,风噪存在概率二值化模块,具体用于:按照如下公式对所述风噪存在概率进行二值化处理:

其中,pthres为所述风噪存在概率门限值,ε(m,k)为二值化处理后的风噪存在概率。

可选的,风噪存在概率统计子模块,具体用于:按照如下公式进行统计:

其中,n(m)为统计结果,i()为指示函数。

可选的,风噪检测结果确定子模块,具体用于:按照如下公式确定所述风噪检测结果:

其中,swindnoise(m)为所述风噪检测结果,nthres为所述风噪检测频率范围对应的风噪统计门限值。

图8示出了可以用来实施本申请的实施例的示例电子设备800的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图8所示,设备800包括计算单元801,其可以根据存储在只读存储器(rom)802中的计算机程序或者从存储单元808加载到随机访问存储器(ram)803中的计算机程序,来执行各种适当的动作和处理。在ram803中,还可存储设备800操作所需的各种程序和数据。计算单元801、rom802以及ram803通过总线804彼此相连。输入/输出(i/o)接口805也连接至总线804。

设备800中的多个部件连接至i/o接口805,包括:输入单元806,例如键盘、鼠标等;输出单元807,例如各种类型的显示器、扬声器等;存储单元808,例如磁盘、光盘等;以及通信单元809,例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理,例如风噪检测方法。例如,在一些实施例中,风噪检测方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元808。在一些实施例中,计算机程序的部分或者全部可以经由rom802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序加载到ram803并由计算单元801执行时,可以执行上文描述的风噪检测方法的一个或多个步骤。备选地,在其他实施例中,计算单元801可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行风噪检测方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本申请的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本申请的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)、区块链网络和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务中,存在的管理难度大,业务扩展性弱的缺陷。

应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。

上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜