一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种低误唤醒率的关键词计算模型的训练方法及装置与流程

2022-02-24 13:16:14 来源:中国专利 TAG:

技术特征:
1.一种低误唤醒率的关键词计算模型的训练方法,其特征在于,所述方法包括:获取训练样本,所述训练样本包括唤醒词样本及非唤醒词样本;根据所述训练样本,训练低误唤醒率的关键词计算模型。2.根据权利要求1所述的低误唤醒率的关键词计算模型的训练方法,其特征在于,所述获取训练样本包括获取非唤醒词样本:获取唤醒词及第一非唤醒词;根据低误唤醒率的关键词计算模型及所述第一非唤醒词,确定所述第一非唤醒词被误唤醒的概率值;当所述第一非唤醒词被误唤醒的概率值高于设定值,将所述第一非唤醒词标记为第二非唤醒词;当所述第二非唤醒词的数量达到预设阈值,将所述第二非唤醒词加入所述非唤醒词样本;将所述唤醒词加入所述唤醒词样本,使用所述唤醒词样本和所述非唤醒词样本反复训练所述低误唤醒率的关键词计算模型。3.根据权利要求2所述的低误唤醒率的关键词计算模型的训练方法,其特征在于,获取第一非唤醒词包括:获取非唤醒词数据;对所述非唤醒词数据执行音频切割,获取所述第一非唤醒词。4.根据权利要求3所述的低误唤醒率的关键词计算模型的训练方法,其特征在于,所述获取非唤醒词数据至少包括:从网络中爬取所述非唤醒词数据、下载音频数据并从所述音频数据中获取所述非唤醒词数据。5.根据权利要求2所述的低误唤醒率的关键词计算模型的训练方法,其特征在于,所述根据低误唤醒率的关键词计算模型及所述第一非唤醒词,确定所述第一非唤醒词被误唤醒的概率值之后还包括:当所述第一非唤醒词被误唤醒的概率值低于所述设定值,丢弃所述第一非唤醒词,重新获取新的第一非唤醒词。6.根据权利要求2所述的低误唤醒率的关键词计算模型的训练方法,其特征在于,将所述第一非唤醒词标记为第二非唤醒词之后还包括:当所述第二非唤醒词的数量未达到所述预设阈值,继续获取新的第一非唤醒词,直到所述第二非唤醒词的数量达到所述预设阈值。7.一种低误唤醒率的关键词计算模型的训练装置,其特征在于,所述装置包括:训练样本获取单元,用于获取训练样本,所述训练样本包括唤醒词样本及非唤醒词样本;模型训练单元,用于根据所述训练样本,训练低误唤醒率的关键词计算模型。8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-6的任意一项低误唤醒率的关键词计算模型的训练方法。9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-6的任意一项低误唤醒率的关键词计算模型的训练方法。

技术总结
本文涉及智能语音领域,尤其涉及一种低误唤醒率的关键词计算模型的训练方法及装置。该方法包括:获取训练样本,所述训练样本包括唤醒词样本及非唤醒词样本;根据所述训练样本,训练低误唤醒率的关键词计算模型。本方案的低误唤醒率的关键词计算模型的训练方法,可以训练一个性能良好的低误唤醒率的关键词计算模型,大大降低日常语音交互场景中语音误唤醒的概率,提高唤醒准确率,进一步提升用户体验。进一步提升用户体验。进一步提升用户体验。


技术研发人员:唐坤 孙伟 刘峰
受保护的技术使用者:北京核芯达科技有限公司
技术研发日:2021.11.08
技术公布日:2022/2/23
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献