一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种二值化神经网络语音唤醒方法及系统与流程

2021-09-18 03:01:00 来源:中国专利 TAG:唤醒 语音 神经网络 方法 系统

技术特征:
1.一种二值化神经网络语音唤醒方法,其特征在于,包括:获取待识别音频文件;并提取所述待识别音频文件的语音特征;所述语音特征包括:梅尔倒谱系数特征矩阵;根据语音特征和语音唤醒模型,确定待识别音频文件的识别结果;所述语音唤醒模型通过训练后的二值化的深度可分离卷积神经网络进行建立;所述二值化的深度可分离卷积神经网络包括:第一卷积层、第二卷积层以及全连接层;所述语音唤醒模型具体的识别过程为:利用所述第一卷积层对输入进行量化处理;所述第一卷积层的输入为待识别音频文件的语音特征;根据量化后的语音特征与网络层的二值量化参数权重以及网络层修正因子做卷积乘法,并将卷积后的数据与第一卷积层的偏置系数做加法,得到第一卷积层的输出;所述网络层修正因子为网络层的参数权重未二值化前的32bit浮点数的按通道均值;将所述第一卷积层的输出作为第二卷积层的输入;并将所述第一卷积层替换为第二卷积层,返回利用所述第一卷积层对输入进行量化处理的步骤,确定第二卷积层的输出,并重复上述步骤,直至输出识别结果。2.根据权利要求1所述的一种二值化神经网络语音唤醒方法,其特征在于,利用所述第一卷积层对输入进行量化处理,具体包括:利用公式进行量化处理;其中,为二值化后的参数,x表示参数权重或参数激活值。3.根据权利要求2所述的一种二值化神经网络语音唤醒方法,其特征在于,所述根据量化后的语音特征与网络层的二值量化参数权重以及网络层修正因子做卷积乘法,并将卷积后的数据与第一卷积层的偏置系数做加法,得到第一卷积层的输出,具体包括:利用公式确定偏置系数;其中,是卷积层的均值,是卷积层的方差,是卷积层的偏置,是卷积层的权重,为常数。4.根据权利要求3所述的一种二值化神经网络语音唤醒方法,其特征在于,所述根据量化后的语音特征与网络层的二值量化参数权重以及网络层修正因子做卷积乘法,并将卷积后的数据与第一卷积层的偏置系数做加法,得到第一卷积层的输出,具体包括:利用公式out = alpha(x* w offset/alpha)确定第一卷积层的输出;其中,out为输出,alpha为网络层修正因子,且为正数,w为二值量化参数权重。5.一种二值化神经网络语音唤醒系统,其特征在于,包括:语音特征确定模块,用于获取待识别音频文件;并提取所述待识别音频文件的语音特征;所述语音特征包括:梅尔倒谱系数特征矩阵;识别结果确定模块,用于根据语音特征和语音唤醒模型,确定待识别音频文件的识别
结果;所述语音唤醒模型通过训练后的二值化的深度可分离卷积神经网络进行建立;所述二值化的深度可分离卷积神经网络包括:第一卷积层、第二卷积层以及全连接层;所述语音唤醒模型具体的识别过程为:利用所述第一卷积层对输入进行量化处理;所述第一卷积层的输入为待识别音频文件的语音特征;根据量化后的语音特征与网络层的二值量化参数权重以及网络层修正因子做卷积乘法,并将卷积后的数据与第一卷积层的偏置系数做加法,得到第一卷积层的输出;所述网络层修正因子为网络层的参数权重未二值化前的32bit浮点数的按通道均值;将所述第一卷积层的输出作为第二卷积层的输入;并将所述第一卷积层替换为第二卷积层,返回利用所述第一卷积层对输入进行量化处理的步骤,确定第二卷积层的输出,并重复上述步骤,直至输出识别结果。6.根据权利要求5所述的一种二值化神经网络语音唤醒系统,其特征在于,所述识别结果确定模块具体包括:利用公式进行量化处理;其中,为二值化后的参数,x表示参数权重或参数激活值。7.根据权利要求6所述的一种二值化神经网络语音唤醒系统,其特征在于,所述识别结果确定模块具体包括:利用公式确定偏置系数;其中,是卷积层的均值,是卷积层的方差,是卷积层的偏置,是卷积层的权重,为常数。8.根据权利要求7所述的一种二值化神经网络语音唤醒系统,其特征在于,所述识别结果确定模块具体包括:利用公式out = alpha(x* w offset/alpha)确定第一卷积层的输出;其中,out为输出,alpha为网络层修正因子,且为正数,w为二值量化参数权重。

技术总结
本发明涉及一种二值化神经网络语音唤醒方法及系统。该方法包括:获取待识别音频文件;并提取待识别音频文件的语音特征;根据语音特征和语音唤醒模型,确定待识别音频文件的识别结果;语音唤醒模型通过训练后的二值化的深度可分离卷积神经网络进行建立;语音唤醒模型具体的识别过程为:利用所述第一卷积层对输入进行量化处理;根据量化后的语音特征与网络层的二值量化参数权重以及网络层修正因子做卷积乘法,并将卷积后的数据与第一卷积层的偏置系数做加法;将第一卷积层的输出作为第二卷积层的输入;并将第一卷积层替换为第二卷积层,返回量化的步骤,直至输出识别结果。本发明能够在保证识别准确度的基础上,降低功耗。降低功耗。降低功耗。


技术研发人员:乔树山 付冠宇 尚德龙 周玉梅
受保护的技术使用者:中科南京智能技术研究院
技术研发日:2021.08.18
技术公布日:2021/9/17
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜