一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

利用残差网络的伪装语音检测方法与流程

2021-10-16 02:16:00 来源:中国专利 TAG:伪装 语音 检测方法 语音识别 利用

技术特征:
1.利用残差网络的伪装语音检测方法,其特征在于,包括以下步骤,s1:利用特征提取模块对语音信号x(n)进行处理后得到基于调制频谱的语音特征

常q调制包络;s2:将提取出来的常q调制包络特征以q调制包络特征图的形式输出,经预处理后输入到改进后的resnet分类网络中;s3:q调制包络特征以图片的形式输入到分类网络中后,首先通过1个7
×
7卷积层和一个3
×
3池化层,然后通过16个残差单元实现深度特征提取;s4:经过16个残差单元后,通过平均池化层,最终通过全连接层和softmax层输出语音分类。2.根据权利要求1所述的利用残差网络的伪装语音检测方法,其特征在于,步骤s1中,特征提取模块对语音信号x(n)进行处理包括以下步骤,s11:将输入的语音x(n)通过一个分频滤波器组,将语音分成k个不同频段的信号x
k
(n),其中k=1,2,

,k;s12:对分频求得的信号x
k
(n)提取包络;s13:对语音包络进行非线性处理;s14:将经过非线性处理的包络lg(m
k
(n))通过常数q变换变换到频域;m
k
(n)为x
k
(n)的谱包络;s15:计算每个频率段的均方值,得到基于调制频谱的语音特征——常q调制包络。3.根据权利要求1所述的利用残差网络的伪装语音检测方法,其特征在于:步骤s2中,q调制包络特征图为以频率——幅值为横纵坐标绘制的图像。4.根据权利要求1所述的利用残差网络的伪装语音检测方法,其特征在于,步骤s2中,输入到resnet分类网络的调制包络特征图经过预处理将大小调整为224
×
224
×
3。5.根据权利要求1所述的利用残差网络的伪装语音检测方法,其特征在于,步骤s2中,resnet分类网络为50层的残差网络。6.根据权利要求5所述的利用残差网络的伪装语音检测方法,其特征在于,残差网络包含5个卷积块;第1个卷积块为64个7
×
7的卷积核构成的卷积层,第2个卷积块由1个3
×
3的最大池化层和3个残差单元构成。7.根据权利要求6所述的利用残差网络的伪装语音检测方法,其特征在于,每一残差单元由3层卷积构成,第1层卷积核大小为1
×
1,通过mmn激活函数结合dropout技术与第2层3
×
3卷积相连,第2层卷积通过relu激活函数与第3层1
×
1卷积相连,输出与shortcut连接的输出相加,再次经过relu激活函数非线性处理后传递到下一残差单元。8.根据权利要求7所述的利用残差网络的伪装语音检测方法,其特征在于,结合dropout技术的mmn激活函数,第3层卷积块由4个残差单元构成,第4层卷积块由6个残差单元构成,第5层卷积块由3个残差单元构成,各层卷积块中残差单元的通道数不断递进。9.根据权利要求9所述的利用残差网络的伪装语音检测方法,其特征在于,经过5层卷积块,对输出进行平均池化。

技术总结
本发明涉及语音识别领域,尤其涉及一种利用残差网络的伪装语音检测方法。包括以下步骤,S1:利用特征提取模块对语音信号x(n)进行处理后得到基于调制频谱的语音特征


技术研发人员:简志华 徐嘉 韦凤瑜 朱雅楠 于佳祺 吴超 游林
受保护的技术使用者:杭州电子科技大学
技术研发日:2021.06.28
技术公布日:2021/10/15
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜