语音唤醒方法及系统与流程

2021-07-16 20:24:00 来源：中国专利 TAG：

技术特征：
1.一种语音唤醒方法，包括：语音唤醒模型在第一阶段预测当前语句包含唤醒词后，将所述唤醒词对应的语音唤醒模型中的隐层值作为后验纠正分类器的输入；基于后验纠正分类器的第二阶段的预测结果，判断所述音频流是否包含唤醒词。2.根据权利要求1所述的方法，其中，所述将所述唤醒词对应的语音唤醒模型中的隐层值作为后验纠正分类器的输入包括：将所述唤醒词中每个字的声学后验概率的极值点对应的语音唤醒模型中的隐层值拼接在一起，作为后验纠正分类器的输入。3.根据权利要求1所述的方法，其中，所述语音唤醒模型包括：基于动态规划的语音唤醒模型。4.根据权利要求1所述的方法，其中，所述方法还包括：基于多任务学习对所述隐层值自适应压缩，以降低所述隐层值的维度，将维度降低后的隐层值，作为后验纠正分类器的输入。5.根据权利要求1所述的方法，其中，所述方法还包括：当所述语音唤醒模型误判断音频流内的语句包含唤醒词时，确定误判断的唤醒词的声学得分大于预设阈值的时间区间；提取出所述时间区间内对应的语音唤醒模型中的隐层值，作为所述后验纠正分类器的训练样本。6.一种语音唤醒系统，包括：隐层值输入程序模块，用于语音唤醒模型在第一阶段预测当前语句包含唤醒词后，将所述唤醒词对应的语音唤醒模型中的隐层值作为后验纠正分类器的输入；唤醒程序模块，用于基于后验纠正分类器的第二阶段的预测结果，判断所述音频流是否包含唤醒词。7.根据权利要求6所述的系统，其中，所述隐层值输入程序模块用于：将所述唤醒词中每个字的声学后验概率的极值点对应的语音唤醒模型中的隐层值拼接在一起，作为后验纠正分类器的输入。8.根据权利要求6所述的系统，其中，所述语音唤醒模型包括：基于动态规划的语音唤醒模型。9.根据权利要求6所述的系统，其中，所述系统还包括：压缩程序模块，用于：基于多任务学习对所述隐层值自适应压缩，以降低所述隐层值的维度，将维度降低后的隐层值，作为后验纠正分类器的输入。10.根据权利要求6所述的系统，其中，所述系统还包括：后验纠正分类器训练程序模块，用于：当所述语音唤醒模型误判断音频流内的语句包含唤醒词时，确定误判断的唤醒词的声学得分大于预设阈值的时间区间；提取出所述时间区间内对应的语音唤醒模型中的隐层值，作为所述后验纠正分类器的训练样本。

再多了解一些

2/3 首页上一页 1 2 3 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

语音唤醒方法及系统与流程

相关文章

最热文献