语音识别系统优化方法和装置与流程

2021-12-15 01:24:00 来源：中国专利 TAG：

技术特征：
1.一种语音识别系统优化方法，包括：将待筛选音频数据分别输入至目标优化asr系统和n个可用asr系统中进行语音识别得到n 1个语音识别结果；对所述n 1个语音识别结果进行度量，确定m个语音识别结果并将所述m个语音识别结果送入标注专家进行标注；将所述标注专家标注过的m个语音识别结果再输入至所述目标asr系统以对所述目标asr系统进行优化。2.根据权利要求1所述的方法，其中，在所述将待筛选音频数据分别输入至目标优化asr系统和n个可用asr系统中进行语音识别得到n 1个语音识别结果之前，所述方法还包括：对所述待筛选音频数据进行数据扩增形成多个扩增结果。3.根据权利要求2所述的方法，其中，所述数据扩增的方式包括pitch改变、加噪声、加混响和/或音频压缩。4.根据权利要求2所述的方法，其中，所述对所述n 1个语音识别结果进行度量包括：对所述n个可用asr系统中的任意两个系统对所述待筛选音频数据的识别结果进行第一差异度计算；对所述目标优化asr系统对所述待筛选音频数据的第一识别结果和所述可用asr系统对所述待筛选音频数据的第二识别结果进行第二差异性计算；对所述可用asr系统对所述待筛选音频数据的第一扩增结果的第三识别结果和所述可用asr系统对所述待筛选音频数据的第二扩增结果的第四识别结果进行第一困惑度计算；和/或对所述目标asr系统对所述待筛选音频数据的第一扩增结果的第三识别结果和所述目标asr系统对所述待筛选音频数据的第二扩增结果的第四识别结果进行第二困惑度计算。5.根据权利要求4所述的方法，其中，所述确定m个语音识别结果并将所述m个语音识别结果送入标注专家进行标注包括：基于所述第一差异度计算的结果、所述第二差异度计算的结果、所述第一困惑度计算的结果和/或所述第二困惑度计算的结果形成标注价值判断函数；利用所述标注价值判断函数计算所述n 1个识别结果的标注价值；基于所述标注价值确定所述n 1个识别结果中需要标注的m个语音识别结果并将所述m个语音识别结果送入标注专家进行标注。6.根据权利要求5所述的方法，其中，所述第二困惑度计算的结果越大，所述标注价值判断函数的标注价值越高；所述第二差异度计算的结果越大，所述标注价值判断函数的标注价值越高；和/或所述第一差异度计算的结果越小、所述第一困惑度计算的结果越小且所述第二差异度计算的结果越大、所述第二困惑度计算的结果越大，所述标注价值判断函数的标注价值越高。7.根据权利要求1
‑
6中任一项所述的方法，其中，所述度量的指标包括编辑距离和/或各asr系统的置信度。8.一种语音识别系统优化装置，包括：
识别程序模块，配置为将待筛选音频数据分别输入至目标优化asr系统和n个可用asr系统中进行语音识别得到n 1个语音识别结果；标注程序模块，配置为对所述n 1个语音识别结果进行度量，确定m个语音识别结果并将所述m个语音识别结果送入标注专家进行标注；优化程序模块，配置为将所述标注专家标注过的m个语音识别结果再输入至所述目标asr系统以对所述目标asr系统进行优化。9.一种电子设备，其包括：至少一个处理器，以及与所述至少一个处理器通信连接的存储器，其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1至7中任一项所述方法的步骤。10.一种存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现权利要求1至7中任一项所述方法的步骤。

技术总结
本发明公开一种语音识别系统优化方法和装置，其中，语音识别系统优化方法，包括：将待筛选音频数据分别输入至目标优化ASR系统和N个可用ASR系统中进行语音识别得到N 1个语音识别结果；对N 1个语音识别结果进行度量，确定M个语音识别结果并将M个语音识别结果送入标注专家进行标注；以及将标注专家标注过的M个语音识别结果再输入至目标ASR系统以对所述目标ASR系统进行优化。本申请实施例的方案通过将待优化指标(识别准确率)融入到系统设计中，使得设计出的主动学习方法能够优化这一指标，能够有效提升主动学习在语音识别应用中的效果，并且可以在只获得语音识别文字结果的情况下，利用多系统进行优化，大大降低了应用主动学习技术的门槛。学习技术的门槛。学习技术的门槛。

技术研发人员：薛少飞
受保护的技术使用者：思必驰科技股份有限公司
技术研发日：2021.09.14
技术公布日：2021/12/14

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

语音识别系统优化方法和装置与流程

相关文献

最热文献