技术总结
本发明实施例提供一种语音唤醒方法。该方法包括:语音唤醒模型在第一阶段预测当前语句包含唤醒词后,将唤醒词对应的语音唤醒模型中的隐层值作为后验纠正分类器的输入;基于后验纠正分类器的第二阶段的预测结果,判断音频流是否包含唤醒词。本发明实施例还提供一种语音唤醒系统。本发明实施例使用了stage 1中的声学模型的隐层值作为stage 2中分类器的输入进行模型的训练和测试,能够有效进行二次预测,解决了使用动态规划算法做后处理的唤醒模型区分性弱的问题,提高了唤醒的区分性能。并且,为了减小stage 2带来的内存占用,尝试了基于多任务学习训练的后验纠正分类器压缩方案,在减小内存占用的同时,保证了唤醒的准确率。保证了唤醒的准确率。保证了唤醒的准确率。
技术研发人员:王蒙 薛少飞 唐健
受保护的技术使用者:思必驰科技股份有限公司
技术研发日:2021.04.27
技术公布日:2021/7/15
本发明实施例提供一种语音唤醒方法。该方法包括:语音唤醒模型在第一阶段预测当前语句包含唤醒词后,将唤醒词对应的语音唤醒模型中的隐层值作为后验纠正分类器的输入;基于后验纠正分类器的第二阶段的预测结果,判断音频流是否包含唤醒词。本发明实施例还提供一种语音唤醒系统。本发明实施例使用了stage 1中的声学模型的隐层值作为stage 2中分类器的输入进行模型的训练和测试,能够有效进行二次预测,解决了使用动态规划算法做后处理的唤醒模型区分性弱的问题,提高了唤醒的区分性能。并且,为了减小stage 2带来的内存占用,尝试了基于多任务学习训练的后验纠正分类器压缩方案,在减小内存占用的同时,保证了唤醒的准确率。保证了唤醒的准确率。保证了唤醒的准确率。
技术研发人员:王蒙 薛少飞 唐健
受保护的技术使用者:思必驰科技股份有限公司
技术研发日:2021.04.27
技术公布日:2021/7/15
再多了解一些
本文用于企业家、创业者技术爱好者查询,结果仅供参考。