一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

语音检测方法、装置、存储介质及电子设备与流程

2022-07-02 12:09:28 来源:中国专利 TAG:


1.本技术涉及通信技术领域,尤其涉及一种语音检测方法、装置、存储介质及电子设备。


背景技术:

2.随着通信技术的发展,通过移动终端进行网络通话成为人们不可或缺的通信方式之一,因而网络通话的质量显得越来越重要。
3.在当前的语音网络通话过程中,近端受话器的信号通过声学路径会回传至近端的送话器,再通过网络环境从对端的声学路径返回并形成反馈(即啸叫),严重影响网络通话质量,为了避免啸叫对网络通话质量产生的不良影响,需要及时检测出啸叫并抑制。当前通常采用峰值均值功率比、峰值谐波功率比和帧间幅度谱斜率偏差等方法进行啸叫检测,然而上述方法在啸叫检测时普遍存在漏检或错检的问题,导致啸叫检测的准确度较低。


技术实现要素:

4.本技术提供一种语音检测方法、装置、存储介质及电子设备,用于缓解当前啸叫检测准确度较低的技术问题。
5.为了解决上述技术问题,本技术提供以下技术方案:
6.本技术提供一种语音检测方法,包括:
7.获取待检测语音帧信号;
8.当所述待检测语音帧信号的时域能量,与,时域谐波含量满足疑似啸叫条件,确定所述待检测语音帧信号为疑似啸叫帧信号;
9.根据所述疑似啸叫帧信号中的候选啸叫频点所处的频点区间,与,初始参考啸叫频点所处的频点区间,更新所述初始参考啸叫频点,得到目标参考啸叫频点;
10.当所述目标参考啸叫频点满足啸叫条件,确定所述疑似啸叫帧信号为啸叫帧信号。
11.其中,所述获取待检测语音帧信号的步骤,包括:
12.获取待检测语音信号;
13.对所述待检测语音信号进行分帧处理以及加窗处理,得到至少一个所述待检测语音帧信号。
14.其中,所述当所述待检测语音帧信号的时域能量,与,时域谐波含量满足疑似啸叫条件,确定所述待检测语音帧信号为疑似啸叫帧信号的步骤,包括:
15.根据所述待检测语音帧信号的信号长度,计算所述待检测语音帧信号的所述时域能量,并根据所述待检测语音帧信号的归一化自相关函数,确定所述待检测语音帧信号的所述时域谐波含量;
16.当所述时域能量大于或等于时域能量阈值,且所述时域谐波含量大于或等于时域谐波含量阈值,确定所述时域能量与所述时域谐波含量满足所述疑似啸叫条件,并确定所
述待检测语音帧信号为所述疑似啸叫帧信号。
17.其中,在所述根据所述疑似啸叫帧信号中的候选啸叫频点所处的频点区间,与,初始参考啸叫频点所处的频点区间,更新所述初始参考啸叫频点,得到目标参考啸叫频点的步骤之前,还包括:
18.获取所述疑似啸叫帧信号的幅度谱;
19.对所述幅度谱进行平滑处理,并确定平滑处理后的所述幅度谱中的极值;
20.当所述极值大于或等于候选啸叫阈值,确定所述极值为所述候选啸叫频点;其中,所述候选啸叫阈值包括候选啸叫频点绝对值,以及,幅度谱总能量相对值。
21.其中,所述根据所述疑似啸叫帧信号中的候选啸叫频点所处的频点区间,与,初始参考啸叫频点所处的频点区间,更新所述初始参考啸叫频点,得到目标参考啸叫频点的步骤,包括:
22.当所述候选啸叫频点与所述初始参考啸叫频点所处的频点区间相同,将所述候选啸叫频点与所述初始参考啸叫频点合并,得到所述目标参考啸叫频点;其中,所述目标参考啸叫频点包括所述候选啸叫频点和所述初始参考啸叫频点。
23.其中,所述啸叫条件包括初始啸叫条件和目标啸叫条件,所述当所述目标参考啸叫频点满足啸叫条件,确定所述疑似啸叫帧信号为啸叫帧信号的步骤,包括:
24.当所述目标参考啸叫频点的持续时间大于或等于预设时间,确定所述目标参考啸叫频点满足所述初始啸叫条件;
25.当满足所述初始啸叫条件的所述目标参考啸叫频点满足所述目标啸叫条件,确定所述疑似啸叫帧信号为所述啸叫帧信号。
26.其中,所述当满足所述初始啸叫条件的所述目标参考啸叫频点满足所述目标啸叫条件,确定所述疑似啸叫帧信号为所述啸叫帧信号的步骤,包括:
27.当满足所述初始啸叫条件的所述目标参考啸叫频点的出现次数在预设周期内连续增大,确定满足所述初始啸叫条件的所述目标参考啸叫频点满足所述目标啸叫条件,并确定所述疑似啸叫帧信号为所述啸叫帧信号。
28.本技术实施例还提供了一种语音检测装置,包括:
29.语音帧信号获取模块,用于获取待检测语音帧信号;
30.疑似啸叫帧信号确定模块,用于当所述待检测语音帧信号的时域能量,与,时域谐波含量满足疑似啸叫条件,确定所述待检测语音帧信号为疑似啸叫帧信号;
31.目标参考啸叫频点获取模块,用于根据所述疑似啸叫帧信号中的候选啸叫频点所处的频点区间,与,初始参考啸叫频点所处的频点区间,更新所述初始参考啸叫频点,得到目标参考啸叫频点;
32.确定模块,用于当所述目标参考啸叫频点满足啸叫条件,确定所述疑似啸叫帧信号为啸叫帧信号。
33.本技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有多条指令,所述指令适于由处理器加载以执行上述语音检测方法中的步骤。
34.本技术实施例还提供了一种电子设备,包括处理器和存储器,所述处理器与所述存储器电性连接,所述存储器用于存储指令和数据,所述处理器用于执行上述语音检测方法中的步骤。
35.有益效果:本技术实施例提供一种语音检测方法、装置、存储介质及电子设备,基于时域能量与时域谐波含量对待检测语音帧信号进行初次啸叫检测以确定疑似啸叫帧信号,再基于目标参考啸叫频点对疑似啸叫帧信号进行二次啸叫检测以确定啸叫帧信号,有效提高啸叫检测的准确度,从而缓解当前啸叫检测准确度较低的技术问题。
附图说明
36.下面结合附图,通过对本技术的具体实施方式详细描述,将使本技术的技术方案及其它有益效果显而易见。
37.图1是本技术实施例提供的语音检测方法的流程示意图。
38.图2a是本技术实施例提供的初始参考啸叫频点-频点出现次数的直方图。
39.图2b是本技术实施例提供的目标参考啸叫频点-频点出现次数的直方图。
40.图3是本技术实施例提供的另一目标参考啸叫频点-频点出现次数的直方图。
41.图4是本技术实施例提供的语音检测装置的结构示意图。
42.图5是本技术实施例提供的电子设备的结构示意图。
43.图6是本技术实施例提供的电子设备的另一结构示意图。
具体实施方式
44.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
45.本技术实施例提供一种语音检测方法、装置、存储介质及电子设备。
46.如图1所示,图1是本技术实施例提供的语音检测方法的流程示意图,具体流程可以如下:
47.s101.获取待检测语音帧信号。
48.其中,待检测语音帧信号为需要进行啸叫检测的帧信号。具体地,在当前的语音网络通话过程中,近端受话器的信号通过声学路径会回传至近端的送话器,再通过网络环境从对端的声学路径返回,从而形成反馈(即啸叫),常表现为同一语音内容重复多次,严重影响网络通话质量,为了避免啸叫对网络通话质量产生的不良影响,需要及时检测出啸叫并进行抑制。
49.可选地,上述步骤s101具体包括:
50.获取待检测语音信号;
51.对待检测语音信号进行分帧处理以及加窗处理,得到至少一个待检测语音帧信号。
52.其中,待检测语音信号包括网络通话过程中提取出的语音信号。具体地,由于待检测语音信号整体上不稳定,为了保证后续啸叫检测的可靠性,需要尽可能保证所检测的待检测语音信号的稳定性,因此需要对待检测语音信号进行分帧处理,以将其分割成多个待检测语音帧信号,由于每一待检测语音帧信号的开始和结束都会出现间断,分割出的待检测语音帧信号越多,与原始的待检测语音信号的误差就越大,为了避免该误差对后续啸叫
检测造成影响,故通过对各待检测语音帧信号进行加窗处理以使各待检测语音帧信号之间变得连续,且每待检测语音帧信号都表现出周期函数的特性。
53.可选地,在本实施例中,采用汉宁窗作为窗函数以进行加窗处理,待检测语音帧信号的获取过程可通过s
l
(n)=s(n)
·
win(n)体现,其中,l为待检测语音帧信号的编号,n为采样点数,s
l
(n)为待检测语音帧信号,s(n)为待检测语音信号,win(n)为窗函数。
54.s102.当待检测语音帧信号的时域能量,与,时域谐波含量满足疑似啸叫条件,确定待检测语音帧信号为疑似啸叫帧信号。
55.其中,时域能量用于表征待检测语音帧信号在时域中的能量大小,时域谐波含量用于表征待检测语音帧信号在时域中的谐波含有量,疑似啸叫条件为用于初步判断待检测语音帧信号是否可能为啸叫帧信号(即疑似啸叫帧信号)的依据。
56.可选地,在本实施例中,首先根据待检测语音帧信号的信号长度计算出待检测语音帧信号的时域能量,并根据待检测语音帧信号的归一化自相关函数确定待检测语音帧信号的时域谐波含量,当时域能量大于或等于时域能量阈值,且时域谐波含量大于或等于时域谐波含量阈值,则确定时域能量与时域谐波含量满足疑似啸叫条件,并确定待检测语音帧信号为疑似啸叫帧信号。
57.具体地,其中,n为待检测语音帧信号的信号长度;其中,n为待检测语音帧信号的信号长度;其中,待检测语音帧信号的归一化自相关函数为:
[0058][0059]
其中,m为归一化自相关函数的滞后量,m为归一化自相关函数的最大滞后量(为待检测语音帧信号的信号长度,fs为采样频率,优选地,fs=16khz,l为待检测语音帧信号的总数量),m0为γ
l
(m)首个过零点的位置。
[0060]
例如,待检测语音帧信号a的时域能量阈值为80,时域谐波含量阈值为0.8,通过上述公式计算得到时域能量为100,时域谐波含量为0.9,由于时域能量大于时域能量阈值,且时域谐波含量大于时域谐波含量阈值,则确定时域能量与时域谐波含量满足疑似啸叫条件,并确定待检测语音帧信号a为疑似啸叫帧信号。
[0061]
s103.根据疑似啸叫帧信号中的候选啸叫频点所处的频点区间,与,初始参考啸叫频点所处的频点区间,更新初始参考啸叫频点,得到目标参考啸叫频点。
[0062]
其中,候选啸叫频点为疑似啸叫帧信号的幅度谱中的极值,初始参考啸叫频点用于监测候选啸叫频点的出现次数,目标参考啸叫频点为疑似啸叫帧信号是否为啸叫帧信号的判断依据(即候选啸叫频点的出现次数的监测结果的分析依据)。
[0063]
具体地,在上述步骤中已对待检测语音帧信号进行了初步筛选,得到可能为啸叫
帧信号的疑似啸叫帧信号,为了保证啸叫检测的准确度,在本实施例中,对疑似啸叫帧继续进行检测,以进一步筛选出真正的啸叫帧信号。
[0064]
在实际应用过程中,通常按照200khz的频率间隔将频率分为890mhz、890.2mhz、890.4mhz、890.6mhz、890.8mhz、891mhz
……
915mhz总共125个无线频段,并对每个频段进行从1、2、3、4
……
125的编号,这些对各频段的编号即为频点。
[0065]
进一步地,在上述步骤s103之前,还包括:
[0066]
获取疑似啸叫帧信号的幅度谱;
[0067]
对幅度谱进行平滑处理,并确定平滑处理后的幅度谱中的极值;
[0068]
当极值大于或等于候选啸叫阈值,确定极值为候选啸叫频点;其中,候选啸叫阈值包括候选啸叫频点绝对值,以及,幅度谱总能量相对值。
[0069]
其中,由于幅度谱中的曲线常有细微的起伏,这些起伏容易对后续的啸叫检测过程造成不良影响,为此,在本实施例中,首先对疑似啸叫帧信号的幅度谱进行平滑处理,以使幅度谱中的曲线更加平滑、稳定。
[0070]
具体地,首先对s
l
(n)进行傅里叶变换,然后求其绝对值即可得到疑似啸叫帧信号的幅度谱,也即疑似啸叫帧信号的幅度谱=s
l
(w)=abs(fft(s
l
(n))),然后对幅度谱进行平滑处理,即平滑后的,即平滑后的大于或等于候选啸叫频点绝对值以及幅度谱总能量相对值,则确定该极值为候选啸叫频点。可选地,可根据实际需求设置极值数量的上限。
[0071]
例如,候选啸叫频点绝对值为82,幅度谱总能量相对值为98,极值数量的上限为4,所确定的极值分别为80、99、103和115,由于95小于幅度谱总能量相对值,99、103和115均大于候选啸叫频点绝对值以及幅度谱总能量相对值,故确定99、103和115为候选啸叫频点。
[0072]
进一步地,在一个实施例中,当候选啸叫频点与初始参考啸叫频点(可根据实际需求进行设定)所处的频点区间(即候选啸叫频点与初始参考啸叫频点相同或相近,可根据实际应用场景划分进行频点区间的划分)相同,将候选啸叫频点与初始参考啸叫频点合并,得到目标参考啸叫频点(包含候选啸叫频点和初始参考啸叫频点)。
[0073]
可选地,初始参考啸叫频点在直方图中展现,且该直方图可表征各初始参考啸叫频点的出现次数,当候选啸叫频点与初始参考啸叫频点所处的频点区间相同,则将候选啸叫频点与初始参考啸叫频点合并得到目标参考啸叫频点,并累加重叠以及新增部分的频点的出现次数,减少未叠加部分的频点的出现次数,并在直方图中展现各目标参考啸叫频点的出现次数。
[0074]
例如,预先划分出频点区间[f1,f2,f3,f4]、[f5,f6,f7,f8]
……
[f122、f123、f124、f125],如图2a-图2b所示,初始参考啸叫频点包括[f1,f2,f3],其在t1对应的出现次数为[2,2,4],候选啸叫频点包括[f2,f3,f4],由于初始参考啸叫频点与候选啸叫频点位于同一频点区间,故将二者进行合并,得到目标参考啸叫频点[f1,f2,f3,f4],其中,由于f2、f3为叠加部分的频点,f4为新增的频点,故将f2、f3、f4的出现次数分别增加1,f1为未叠加部分的频点,故将f1的出现次数减少1,也即在t2时目标参考啸叫频点[f1,f2,f3,f4]对应
的出现次数为[1,3,5,1]。
[0075]
在另一个实施例中,当候选啸叫频点与初始参考啸叫频点所处的频点区间不同(即候选啸叫频点与初始参考啸叫频点均不同且不相近),增加另一组初始参考啸叫频点以与候选啸叫频点进行比对,直至候选啸叫频点与初始参考啸叫频点位于同一频点区间,将候选啸叫频点与初始参考啸叫频点合并,得到目标参考啸叫频点。
[0076]
例如,预先划分出频点区间[f1,f2,f3,f4]、[f5,f6,f7,f8]
……
[f122、f123、f124、f125],初始参考啸叫频点a包括[f1,f2,f3],候选啸叫频点包括[f9,f10,f11],由于初始参考啸叫频点与候选啸叫频点位于不同频点区间,故增加一组初始参考啸叫频点b[f10,f11,f12],此时候选啸叫频点与初始参考啸叫频点b位于同一频点区间,故将二者进行合并,得到目标参考啸叫频点[f9,f10,f11,f12],其中,由于f10、f11为叠加部分的频点,f9为新增的频点,故将f9、f10、f11的出现次数分别增加1,f12为未叠加部分的频点,故将f12的出现次数减少1。
[0077]
s104.当目标参考啸叫频点满足啸叫条件,确定疑似啸叫帧信号为啸叫帧信号。
[0078]
其中,啸叫条件为判断疑似啸叫帧信号是否为啸叫帧信号的依据。
[0079]
具体地,在本实施例中,啸叫条件包括初始啸叫条件和目标啸叫条件,当目标参考啸叫频点的持续时间大于或等于预设时间,确定目标参考啸叫频点满足初始啸叫条件,当满足初始啸叫条件的目标参考啸叫频点满足目标啸叫条件,确定该疑似啸叫帧信号为啸叫帧信号。可选地,当满足初始啸叫条件的目标参考啸叫频点的出现次数在预设周期内连续增大,确定该满足初始啸叫条件的目标参考啸叫频点满足目标啸叫条件。
[0080]
例如,如图3所示,设置预设时间为3,目标参考啸叫频点[f1,f2,f3,f4]在t1时对应的出现次数为[2,2,4,0],故至此f1、f2、f3的持续时间为1(即f1、f2、f3在t1时存在),f4的持续时间为0;在t2时对应的出现次数为[1,3,5,1],故至此f1、f2、f3的持续时间为2(即f1、f2、f3由t1持续至t2),f4的持续时间为1(即f4从t2起开始存在);在t3时对应的出现次数为[0,4,6,2],故至此f1的持续时间为2(即f1由t1持续至t2后停留在t2),f2、f3的持续时间为3(即f2、f3由t1持续至t3),f4的持续时间为2(即f4由t2持续至t3后停留在t3),由于f2、f3的持续时间等于3,故确定f2、f3满足初始啸叫条件。
[0081]
进一步地,假设预设周期为3(即t1-t3),由于f2在周期t1-t3内的出现次数连续增大(由2增大至3,再由3增大至4),且f3在周期t2-t4内的出现次数也在连续增大(由4增大至5,再由5增大至6),故确定f2和f3满足目标啸叫条件,并确定该疑似啸叫帧信号为啸叫帧信号。
[0082]
可选地,在检测出啸叫帧信号后可输出啸叫警示,以便于后续及时地针对啸叫帧信号进行抑制处理,从而提高通信质量。
[0083]
由上述可知,本技术提供的语音检测方法,首先获取待检测语音帧信号,当待检测语音帧信号的时域能量与时域谐波含量满足疑似啸叫条件,确定待检测语音帧信号为疑似啸叫帧信号,然后根据疑似啸叫帧信号中的候选啸叫频点所处的频点区间与初始参考啸叫频点所处的频点区间更新初始参考啸叫频点,得到目标参考啸叫频点,最后当目标参考啸叫频点满足啸叫条件,确定该疑似啸叫帧信号为啸叫帧信号。基于时域能量与时域谐波含量对待检测语音帧信号进行初次啸叫检测以确定疑似啸叫帧信号,再基于目标参考啸叫频点对疑似啸叫帧信号进行二次啸叫检测以确定啸叫帧信号,有效提高啸叫检测的准确度,
从而缓解当前啸叫检测准确度较低的技术问题。
[0084]
根据上述实施例所描述的方法,本实施例将从语音检测装置的角度进一步进行描述。
[0085]
请参阅图4,图4具体描述了本技术实施例提供的语音检测装置,该语音检测装置可以包括:语音帧信号获取模块10、疑似啸叫帧信号确定模块20、目标参考啸叫频点获取模块30以及确定模块40,其中:
[0086]
(1)语音帧信号获取模块10
[0087]
语音帧信号获取模块10,用于获取待检测语音帧信号。
[0088]
其中,语音帧信号获取模块10具体用于:
[0089]
获取待检测语音信号;
[0090]
对待检测语音信号进行分帧处理以及加窗处理,得到至少一个待检测语音帧信号。
[0091]
(2)疑似啸叫帧信号确定模块20
[0092]
疑似啸叫帧信号确定模块20,用于当待检测语音帧信号的时域能量,与,时域谐波含量满足疑似啸叫条件,确定待检测语音帧信号为疑似啸叫帧信号。
[0093]
其中,疑似啸叫帧信号确定模块20具体用于:
[0094]
根据待检测语音帧信号的信号长度,计算待检测语音帧信号的时域能量,并根据待检测语音帧信号的归一化自相关函数,确定待检测语音帧信号的时域谐波含量;
[0095]
当时域能量大于或等于时域能量阈值,且时域谐波含量大于或等于时域谐波含量阈值,确定时域能量与时域谐波含量满足疑似啸叫条件,并确定待检测语音帧信号为疑似啸叫帧信号。
[0096]
(3)目标参考啸叫频点获取模块30
[0097]
目标参考啸叫频点获取模块30,用于根据疑似啸叫帧信号中的候选啸叫频点所处的频点区间,与,初始参考啸叫频点所处的频点区间,更新初始参考啸叫频点,得到目标参考啸叫频点。
[0098]
其中,目标参考啸叫频点获取模块30具体用于:
[0099]
当候选啸叫频点与初始参考啸叫频点所处的频点区间相同,将候选啸叫频点与初始参考啸叫频点合并,得到目标参考啸叫频点;其中,目标参考啸叫频点包括候选啸叫频点和初始参考啸叫频点。
[0100]
(4)确定模块40
[0101]
确定模块40,用于当目标参考啸叫频点满足啸叫条件,确定疑似啸叫帧信号为啸叫帧信号。
[0102]
其中,啸叫条件包括初始啸叫条件和目标啸叫条件,确定模块40具体用于:
[0103]
当目标参考啸叫频点的持续时间大于或等于预设时间,确定目标参考啸叫频点满足初始啸叫条件;
[0104]
当满足初始啸叫条件的目标参考啸叫频点满足目标啸叫条件,确定疑似啸叫帧信号为啸叫帧信号。
[0105]
具体地,确定模块40还用于:
[0106]
当满足初始啸叫条件的目标参考啸叫频点的出现次数在预设周期内连续增大,确
定该满足初始啸叫条件的目标参考啸叫频点满足啸叫条件满足目标啸叫条件,并确定该疑似啸叫帧信号为啸叫帧信号。
[0107]
具体实施时,以上各个模块可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个模块的具体实施可参见前面的方法实施例,在此不再赘述。
[0108]
由上述可知,本技术提供的语音检测装置,首先通过语音帧信号获取模块10获取待检测语音帧信号,当待检测语音帧信号的时域能量与时域谐波含量满足疑似啸叫条件,通过疑似啸叫帧信号确定模块20确定待检测语音帧信号为疑似啸叫帧信号,然后通过目标参考啸叫频点获取模块30根据疑似啸叫帧信号中的候选啸叫频点所处的频点区间与初始参考啸叫频点所处的频点区间更新初始参考啸叫频点,得到目标参考啸叫频点,最后当目标参考啸叫频点满足啸叫条件,通过确定模块40确定该疑似啸叫帧信号为啸叫帧信号。基于时域能量与时域谐波含量对待检测语音帧信号进行初次啸叫检测以确定疑似啸叫帧信号,再基于目标参考啸叫频点对疑似啸叫帧信号进行二次啸叫检测以确定啸叫帧信号,有效提高啸叫检测的准确度,从而缓解当前啸叫检测准确度较低的技术问题。
[0109]
相应的,本发明实施例还提供一种语音检测系统,包括本发明实施例所提供的任一种语音检测装置,该语音检测装置可以集成在电子设备中。
[0110]
其中,获取待检测语音帧信号;当待检测语音帧信号的时域能量,与,时域谐波含量满足疑似啸叫条件,确定待检测语音帧信号为疑似啸叫帧信号;根据疑似啸叫帧信号中的候选啸叫频点所处的频点区间,与,初始参考啸叫频点所处的频点区间,更新初始参考啸叫频点,得到目标参考啸叫频点;当目标参考啸叫频点满足啸叫条件,确定疑似啸叫帧信号为啸叫帧信号。
[0111]
以上各个设备的具体实施可参见前面的实施例,在此不再赘述。
[0112]
由于该语音检测系统可以包括本发明实施例所提供的任一种语音检测装置,因此,可以实现本发明实施例所提供的任一种语音检测装置所能实现的有益效果,详见前面的实施例,在此不再赘述。
[0113]
另外,本技术实施例还提供一种电子设备。如图5所示,电子设备500包括处理器501、存储器502。其中,处理器501与存储器502电性连接。
[0114]
处理器501是电子设备500的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或加载存储在存储器502内的应用程序,以及调用存储在存储器502内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。
[0115]
在本实施例中,电子设备500中的处理器501会按照如下的步骤,将一个或一个以上的应用程序的进程对应的指令加载到存储器502中,并由处理器501来运行存储在存储器502中的应用程序,从而实现各种功能:
[0116]
获取待检测语音帧信号;
[0117]
当待检测语音帧信号的时域能量,与,时域谐波含量满足疑似啸叫条件,确定待检测语音帧信号为疑似啸叫帧信号;
[0118]
根据疑似啸叫帧信号中的候选啸叫频点所处的频点区间,与,初始参考啸叫频点所处的频点区间,更新初始参考啸叫频点,得到目标参考啸叫频点;
[0119]
当目标参考啸叫频点满足啸叫条件,确定疑似啸叫帧信号为啸叫帧信号。
[0120]
图6示出了本发明实施例提供的电子设备的具体结构框图,该电子设备可以用于实施上述实施例中提供的语音检测方法。
[0121]
rf电路610用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯。rf电路610可包括各种现有的用于执行这些功能的电路元件,例如,天线、射频收发器、数字信号处理器、加密/解密芯片、用户身份模块(sim)卡、存储器等等。rf电路610可与各种网络如互联网、企业内部网、无线网络进行通讯或者通过无线网络与其他设备进行通讯。上述的无线网络可包括蜂窝式电话网、无线局域网或者城域网。上述的无线网络可以使用各种通信标准、协议及技术,包括但并不限于全球移动通信系统(global system for mobile communication,gsm)、增强型移动通信技术(enhanced data gsm environment,edge),宽带码分多址技术(wideband code division multiple access,wcdma),码分多址技术(code division access,cdma)、时分多址技术(time division multiple access,tdma),无线保真技术(wireless fidelity,wi-fi)(如美国电气和电子工程师协会标准ieee 802.11a,ieee 802.11b,ieee802.11g和/或ieee 802.11n)、网络电话(voice over internet protocol,voip)、全球微波互联接入(worldwide interoperability for microwave access,wi-max)、其他用于邮件、即时通讯及短消息的协议,以及任何其他合适的通讯协议,甚至可包括那些当前仍未被开发出来的协议。
[0122]
存储器620可用于存储软件程序以及模块,处理器680通过运行存储在存储器620内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现存储5g能力信息的功能。存储器620可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器620可进一步包括相对于处理器680远程设置的存储器,这些远程存储器可以通过网络连接至电子设备600。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0123]
输入单元630可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,输入单元630可包括触敏表面631以及其他输入设备632。触敏表面631,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面631上或在触敏表面631附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面631可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器680,并能接收处理器680发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面631。除了触敏表面631,输入单元630还可以包括其他输入设备632。具体地,其他输入设备632可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
[0124]
显示单元640可用于显示由用户输入的信息或提供给用户的信息以及电子设备600的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元640可包括显示面板641,可选的,可以采用lcd(liquid crystal display,液晶显示器)、oled(organic light-emitting diode,有机发光二极管)等形式来配置显示
面板641。进一步的,触敏表面631可覆盖显示面板641,当触敏表面631检测到在其上或附近的触摸操作后,传送给处理器680以确定触摸事件的类型,随后处理器680根据触摸事件的类型在显示面板641上提供相应的视觉输出。虽然在图6中,触敏表面631与显示面板641是作为两个独立的部件来实现输入和输出功能,但是在某些实施例中,可以将触敏表面631与显示面板641集成而实现输入和输出功能。
[0125]
电子设备600还可包括至少一种传感器650,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板641的亮度,接近传感器可在电子设备600移动到耳边时,关闭显示面板641和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于电子设备600还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
[0126]
音频电路660、扬声器661,传声器662可提供用户与电子设备600之间的音频接口。音频电路660可将接收到的音频数据转换后的电信号,传输到扬声器661,由扬声器661转换为声音信号输出;另一方面,传声器662将收集的声音信号转换为电信号,由音频电路660接收后转换为音频数据,再将音频数据输出处理器680处理后,经rf电路610以发送给比如另一终端,或者将音频数据输出至存储器620以便进一步处理。音频电路660还可能包括耳塞插孔,以提供外设耳机与电子设备600的通信。
[0127]
电子设备600通过传输模块670(例如wi-fi模块)可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图6示出了传输模块670,但是可以理解的是,其并不属于电子设备600的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
[0128]
处理器680是电子设备600的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器620内的软件程序和/或模块,以及调用存储在存储器620内的数据,执行电子设备600的各种功能和处理数据。可选的,处理器680可包括一个或多个处理核心;在一些实施例中,处理器680可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器680中。
[0129]
电子设备600还包括给各个部件供电的电源690(比如电池),在一些实施例中,电源可以通过电源管理系统与处理器680逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源690还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
[0130]
尽管未示出,电子设备600还可以包括摄像头(如前置摄像头、后置摄像头)、蓝牙模块等,在此不再赘述。具体在本实施例中,电子设备的显示单元是触摸屏显示器,电子设备还包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行一个或者一个以上程序包含用于进行以下操作的指令:
[0131]
获取待检测语音帧信号;
[0132]
当待检测语音帧信号的时域能量,与,时域谐波含量满足疑似啸叫条件,确定待检测语音帧信号为疑似啸叫帧信号;
[0133]
根据疑似啸叫帧信号中的候选啸叫频点所处的频点区间,与,初始参考啸叫频点所处的频点区间,更新初始参考啸叫频点,得到目标参考啸叫频点;
[0134]
当目标参考啸叫频点满足啸叫条件,确定疑似啸叫帧信号为啸叫帧信号。
[0135]
具体实施时,以上各个模块可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个模块的具体实施可参见前面的方法实施例,在此不再赘述。
[0136]
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。为此,本发明实施例提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本发明实施例所提供的任一种语音检测方法中的步骤。
[0137]
其中,该存储介质可以包括:只读存储器(rom,read only memory)、随机存取记忆体(ram,random access memory)、磁盘或光盘等。
[0138]
由于该存储介质中所存储的指令,可以执行本发明实施例所提供的任一种语音检测方法中的步骤,因此,可以实现本发明实施例所提供的任一种语音检测方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
[0139]
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
[0140]
综上,虽然本技术已以优选实施例揭露如上,但上述优选实施例并非用以限制本技术,本领域的普通技术人员,在不脱离本技术的精神和范围内,均可作各种更动与润饰,因此本技术的保护范围以权利要求界定的范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献