技术总结
本发明涉及一种提升语音识别准确性的方法和设备,应用于设置有SDM的用于语音识别的ASR系统,ASR系统设置有用于进行解码的解码网络;该方法包括:通过SDM获取输入ASR系统的原始音频和解码网络输出的历史解码信息;通过SDM对原始音频进行处理,得到原始音频的多个信号特征;通过SDM基于多个信号特征以及历史解码信息进行处理,得到原始音频的最终特征。在ASR系统解码阶段新增SDM,充分利用了各个维度的信息,包括直接从音频获取的信号特征、从历史解码信息中得到的上下文信息等,结合ASR系统中原有的通过海量数据训练出的声学模型,能够提升ASR系统在任何复杂场景下,对输入语音的打分和辨识能力,提升识别率。提升识别率。提升识别率。
技术研发人员:范红亮 蒋莹 李轶杰 梁家恩
受保护的技术使用者:厦门云知芯智能科技有限公司
技术研发日:2021.01.30
技术公布日:2021/6/3
本发明涉及一种提升语音识别准确性的方法和设备,应用于设置有SDM的用于语音识别的ASR系统,ASR系统设置有用于进行解码的解码网络;该方法包括:通过SDM获取输入ASR系统的原始音频和解码网络输出的历史解码信息;通过SDM对原始音频进行处理,得到原始音频的多个信号特征;通过SDM基于多个信号特征以及历史解码信息进行处理,得到原始音频的最终特征。在ASR系统解码阶段新增SDM,充分利用了各个维度的信息,包括直接从音频获取的信号特征、从历史解码信息中得到的上下文信息等,结合ASR系统中原有的通过海量数据训练出的声学模型,能够提升ASR系统在任何复杂场景下,对输入语音的打分和辨识能力,提升识别率。提升识别率。提升识别率。
技术研发人员:范红亮 蒋莹 李轶杰 梁家恩
受保护的技术使用者:厦门云知芯智能科技有限公司
技术研发日:2021.01.30
技术公布日:2021/6/3
再多了解一些
本文用于企业家、创业者技术爱好者查询,结果仅供参考。