基于关键词识别技术的语音唤醒方法、装置、设备以及可读存储介质与流程

2022-08-11 05:57:51 来源：中国专利 TAG：

技术特征：
1.基于关键词识别技术的语音唤醒方法，其特征在于，包括：将获取到的语音数据输入预先训练好的神经网络模型进行计算，以获取所述语音数据的语音特征的概率分布；将所述概率分布输入所述神经网络模型进行快速校验；对所述快速校验的结果进行判断，若所述快速校验的结果为可信，则进行语音唤醒；若所述结果为不可信，则对所述语音数据进行持续时间和阈值的判断；若所述语音数据的持续时间和阈值达到了最低要求，则对所述语音数据进行对唤醒词的语音识别，若所述语音识别的结果为通过，则进行语音唤醒；若所述语音识别的结果为不通过，则不进行语音唤醒；若所述概率分布的持续时间和阈值没有达到最低要求，则不进行语音唤醒。2.如权利要求1所述的基于关键词识别技术的语音唤醒方法，其特征在于，所述预先训练神经网络模型，包括：建立神经网络模型；重复多次将语音数据输入所述神经网络模型进行快速校验的训练和判断所述语音数据的持续时间与阈值的训练。3.如权利要求1所述的基于关键词识别技术的语音唤醒方法，其特征在于，所述概率分布，包括：所述语音数据的首个音的概率、最后一个音的概率、单个音的持续时间以及整个词的概率。4.如权利要求1所述的基于关键词识别技术的语音唤醒方法，其特征在于，在所述将获取到的语音数据输入预先训练好的神经网络模型进行计算，以获取所述语音数据的语音特征的概率分布的步骤之后，还包括：若所述神经网络模型输出的所述概率分布不为音或字的概率，则对所述概率分布进行预处理。5.如权利要求4所述的基于关键词识别技术的语音唤醒方法，其特征在于，所述预处理的方式包括平滑。6.如权利要求3所述的基于关键词识别技术的语音唤醒方法，其特征在于，所述快速校验，包括：判断所述语音数据的所述首个音的概率、所述最后一个音的概率、所述单个音的持续时间以及所述整个词的概率是否都满足阈值。7.基于关键词识别技术的语音唤醒装置，其特征在于，包括：计算模块；所述计算模块用于计算获取的所述语音数据的语音特征的概率分布；校验模块；所述校验模块用于将所述概率分布输入所述神经网络模型进行快速校验；判断模块；所述判断模块用于对所述快速校验的结果进行判断；若所述快速校验的结果为可信，则进行语音唤醒；若所述结果为不可信，则对所述语音数据进行持续时间和阈值的判断；若所述语音数据的持续时间和阈值达到了最低要求，则对所述语音数据进行对唤醒词的语音识别，若所述语音识别的结果为通过，则进行语音唤醒；若所述语音识别的结果为不通过，则不进行语音唤醒；若所述概率分布的持续时间和阈值没有达到最低要求，则不进行语音唤醒。
8.一种设备，其特征在于，所述设备包括存储器和处理器；所述存储器用于存储程序；所述处理器用于执行所述程序并在执行所述程序时实现如权利要求1至6中任一项所述的基于关键词识别技术的语音唤醒方法。9.一种可读存储介质，其特征在于，所述可读存储介质存储有程序，所述程序被处理器执行时使所述处理器实现如权利要求1至6中任一项所述的基于关键词识别技术的语音唤醒方法。

技术总结
本发明公开了基于关键词识别技术的语音唤醒方法、装置、设备以及可读存储介质，包括：将获取到的语音数据输入预先训练好的神经网络模型进行计算，以获取语音数据的语音特征的概率分布；将概率分布输入神经网络模型进行快速校验；对快速校验的结果进行判断，若快速校验的结果为可信，则进行语音唤醒；若结果为不可信，则对语音数据进行持续时间和阈值的判断；若语音数据的持续时间和阈值达到了最低要求，则对语音数据进行对唤醒词的语音识别。本申请实施例通过提供基于关键词识别技术的语音唤醒方法、装置、设备以及可读存储介质，解决了现有技术中语音识别准确性不足的问题，实现了语音识别的性能功耗与准确性的平衡。了语音识别的性能功耗与准确性的平衡。了语音识别的性能功耗与准确性的平衡。

技术研发人员：赵茂祥李全忠何国涛蒲瑶
受保护的技术使用者：普强时代（珠海横琴）信息技术有限公司
技术研发日：2022.06.22
技术公布日：2022/8/9

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：多通道语音信号增强方法和装置及计算机设备和存储介质

基于关键词识别技术的语音唤醒方法、装置、设备以及可读存储介质与流程

相关文献

最热文献