一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

语音唤醒方法及系统与流程

2021-07-16 20:24:00 来源:中国专利 TAG:

技术特征:
1.一种语音唤醒方法,包括:语音唤醒模型在第一阶段预测当前语句包含唤醒词后,将所述唤醒词对应的语音唤醒模型中的隐层值作为后验纠正分类器的输入;基于后验纠正分类器的第二阶段的预测结果,判断所述音频流是否包含唤醒词。2.根据权利要求1所述的方法,其中,所述将所述唤醒词对应的语音唤醒模型中的隐层值作为后验纠正分类器的输入包括:将所述唤醒词中每个字的声学后验概率的极值点对应的语音唤醒模型中的隐层值拼接在一起,作为后验纠正分类器的输入。3.根据权利要求1所述的方法,其中,所述语音唤醒模型包括:基于动态规划的语音唤醒模型。4.根据权利要求1所述的方法,其中,所述方法还包括:基于多任务学习对所述隐层值自适应压缩,以降低所述隐层值的维度,将维度降低后的隐层值,作为后验纠正分类器的输入。5.根据权利要求1所述的方法,其中,所述方法还包括:当所述语音唤醒模型误判断音频流内的语句包含唤醒词时,确定误判断的唤醒词的声学得分大于预设阈值的时间区间;提取出所述时间区间内对应的语音唤醒模型中的隐层值,作为所述后验纠正分类器的训练样本。6.一种语音唤醒系统,包括:隐层值输入程序模块,用于语音唤醒模型在第一阶段预测当前语句包含唤醒词后,将所述唤醒词对应的语音唤醒模型中的隐层值作为后验纠正分类器的输入;唤醒程序模块,用于基于后验纠正分类器的第二阶段的预测结果,判断所述音频流是否包含唤醒词。7.根据权利要求6所述的系统,其中,所述隐层值输入程序模块用于:将所述唤醒词中每个字的声学后验概率的极值点对应的语音唤醒模型中的隐层值拼接在一起,作为后验纠正分类器的输入。8.根据权利要求6所述的系统,其中,所述语音唤醒模型包括:基于动态规划的语音唤醒模型。9.根据权利要求6所述的系统,其中,所述系统还包括:压缩程序模块,用于:基于多任务学习对所述隐层值自适应压缩,以降低所述隐层值的维度,将维度降低后的隐层值,作为后验纠正分类器的输入。10.根据权利要求6所述的系统,其中,所述系统还包括:后验纠正分类器训练程序模块,用于:当所述语音唤醒模型误判断音频流内的语句包含唤醒词时,确定误判断的唤醒词的声学得分大于预设阈值的时间区间;提取出所述时间区间内对应的语音唤醒模型中的隐层值,作为所述后验纠正分类器的训练样本。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜