技术总结
本公开公开了获取语音识别模型的方法、语音识别的方法及对应装置,涉及智能语音、深度学习等人工智能技术。具体实现方案为:获取训练数据,所述训练数据包括语音帧序列及其对应的文本标注,所述语音帧序列包括多于一个的语音帧;对所述语音帧序列中的各帧进行拼帧处理,得到拼帧序列;对所述拼帧序列进行降采样,得到跳帧序列;利用所述拼帧序列以及对应的文本标注训练得到第一语音识别模型;基于所述第一语音识别模型,利用所述跳帧序列以及对应的文本标注训练得到第二语音识别模型,第二语音识别模型用以进行语音识别。本公开能够有效降低语音识别的计算量。低语音识别的计算量。低语音识别的计算量。
技术研发人员:梁鸣心 付晓寅 白锦峰
受保护的技术使用者:北京百度网讯科技有限公司
技术研发日:2021.03.12
技术公布日:2021/7/15
本公开公开了获取语音识别模型的方法、语音识别的方法及对应装置,涉及智能语音、深度学习等人工智能技术。具体实现方案为:获取训练数据,所述训练数据包括语音帧序列及其对应的文本标注,所述语音帧序列包括多于一个的语音帧;对所述语音帧序列中的各帧进行拼帧处理,得到拼帧序列;对所述拼帧序列进行降采样,得到跳帧序列;利用所述拼帧序列以及对应的文本标注训练得到第一语音识别模型;基于所述第一语音识别模型,利用所述跳帧序列以及对应的文本标注训练得到第二语音识别模型,第二语音识别模型用以进行语音识别。本公开能够有效降低语音识别的计算量。低语音识别的计算量。低语音识别的计算量。
技术研发人员:梁鸣心 付晓寅 白锦峰
受保护的技术使用者:北京百度网讯科技有限公司
技术研发日:2021.03.12
技术公布日:2021/7/15
再多了解一些
本文用于企业家、创业者技术爱好者查询,结果仅供参考。