一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

唤醒词能量计算方法、系统、语音唤醒系统及存储介质与流程

2022-02-25 23:17:04 来源:中国专利 TAG:

技术特征:
1.一种唤醒词能量计算方法,其特征在于,所述方法包括:获取唤醒词音频信号;对所述唤醒词音频信号进行第一转换,获得唤醒词音频的短时能量谱;对所述短时能量谱进行取对数,获得唤醒词音频的对数谱;将所述对数谱输入到预设神经网络模型中,以使所述预设神经网络模型根据所述对数谱,生成预测的概率矩阵;对所述预测的概率矩阵进行二值化,获得二值矩阵;对所述短时能量谱和所述二值矩阵进行第二转换,确定所述唤醒词音频信号的唤醒词语音能量。2.根据权利要求1所述的方法,其特征在于,所述预设神经网络模型的训练过程,包括:将带噪语音数据的对数谱输入到初始神经网络中进行处理,获得预测的训练概率矩阵;基于交叉熵损失函数计算所述训练概率矩阵与标签矩阵的误差值;根据所述误差值,利用预设优化算法对所述初始神经网络进行迭代更新,直至满足训练截至条件,得到所述预设神经网络模型。3.根据权利要求2所述的方法,其特征在于,在对所述初始神经网络进行训练之前,还包括:训练数据处理和/或训练数据特征提取,其中,所述训练数据处理包括:对唤醒词语音的训练数据进行所述第一转换,获得所述训练数据的短时能量谱;对所述训练数据的短时能量谱进行所述取对数,获得所述训练数据的对数谱;对所述训练数据的对数谱进行所述二值化,获得所述标签矩阵;其中,所述训练数据特征提取包括:按照信噪比将噪声训练数据插入到所述训练数据中,获得所述带噪语音数据;对所述带噪语音数据进行所述第一转换,获得所述带噪语音数据的短时能量谱;对所述带噪语音数据的短时能量谱进行所述取对数,获得所述带噪语音数据的对数谱。4.根据权利要求1所述的方法,其特征在于,所述将所述对数谱输入到预设神经网络模型中,以使所述预设神经网络模型根据所述对数谱,生成预测的概率矩阵,包括:所述预设神经网络将接收到的所述对数谱的时频点映射为所述预测的概率矩阵,所述预测的概率矩阵中的每个元素均表示该元素对应的所述时频点属于唤醒数据的概率值。5.根据权利要求4所述的方法,其特征在于,所述对所述预测的概率矩阵进行二值化,获得二值矩阵,包括:根据所述预设神经网络模型中的预设门限值,对所述预测的概率矩阵进行所述二值化,获得所述二值矩阵,其中,所述二值化是判断所述预测的概率矩阵中的每一个元素是否大于所述预设门限值,若是,则将该元素置为1;若所述元素不大于所述预设门限值,则将该元素置为0。6.根据权利要求1所述的方法,其特征在于,所述方法应用于分布式语音唤醒系统,所述方法还包括:所述分布式语音唤醒系统中的多台电子设备,根据所述方法分别计算本设备的所述唤醒词语音能量,并将所述本设备的所述唤醒词语音能量与其它设备的所述唤醒词语音能量
进行比较,所述唤醒词语音能量最大的设备执行唤醒操作,除执行所述唤醒操作的设备外的其它设备不执行所述唤醒操作。7.根据权利要求1所述的方法,其特征在于,所述唤醒词音频信号是包含有唤醒关键词的语音信号,以及所述分布式语音唤醒系统所处场景的场景噪音信号的音频信号。8.一种唤醒词能量计算系统,其特征在于,所述系统应用于分布式语音唤醒系统所述系统包括:信号获取模块:用于获取唤醒词音频信号;第一转换模块:用于对所述唤醒词音频信号进行第一转换,获得唤醒词音频的短时能量谱;第二转换模块,用于对所述短时能量谱进行取对数,获得唤醒词音频的对数谱;矩阵生成模块:用于将所述对数谱输入到预设神经网络模型中,以使所述预设神经网络模型根据所述对数谱,生成预测的概率矩阵;第三转换模块:用于对所述预测的概率矩阵进行二值化,获得二值矩阵;第四转换模块:用于对所述短时能量谱和所述二值矩阵进行第二转换,确定所述唤醒词音频信号的唤醒词语音能量。9.一种语音唤醒系统,其特征在于,所述系统包括:多台电子设备,所述电子设备被配置为执行指令,以实现如上述权利要求1至7中任一项所述的唤醒词能量计算方法。10.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述设备能够执行如权利要求1至7中任一项所述的唤醒词能量计算方法。

技术总结
本发明实施例提供了一种唤醒词能量计算方法、系统、语音唤醒系统及存储介质,其中,方法包括:获取唤醒词音频信号,对唤醒词音频信号进行第一转换,获得唤醒词音频的短时能量谱,对短时能量谱进行取对数,获得唤醒词音频的对数谱,将对数谱输入到预设神经网络模型中,以使预设神经网络模型根据对数谱,生成预测的概率矩阵,对预测的概率矩阵进行二值化,获得二值矩阵,对短时能量谱和二值矩阵进行第二转换,确定唤醒词音频信号的唤醒词语音能量。本发明通过引入预设神经网络模型对唤醒词语音成分进行估计,提高了对不同应用场景下的噪声时频点和唤醒词时频点的区别精度,提高了最终计算唤醒词能量在背景噪声条件下的鲁棒性和准确度。性和准确度。性和准确度。


技术研发人员:贾基东
受保护的技术使用者:海尔智家股份有限公司
技术研发日:2021.11.26
技术公布日:2022/2/24
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献