一种语音识别的置信度估计方法、装置及计算机设备与流程

2022-04-25 04:29:34 来源：中国专利 TAG：

技术特征：
1.一种语音识别的置信度估计方法，其特征在于，包括：获取待估计语句；将所述待估计语句送入声学模型进行计算和解码，以获取所述待估计语句中每个音素对应所述声学模型状态的后验值作为识别结果；将所述音素的后验值送入预先构建的音素模糊矩阵，计算单音素置信度；根据所述单音素置信度计算所述识别结果的置信度。2.如权利要求1所述的一种基于音素模糊的置信度估计方法，其特征在于，所述将所述待估计语句送入声学模型进行计算和解码，以获取所述待估计语句中每个音素对应所述声学模型状态的后验值，包括：将所述待估计语句的语言信号分帧后转换成特征序列；将所述特征序列中后验概率最大的词序列作为每个音素对应声学模型状态的后验值。3.如权利要求1所述的一种基于音素模糊的置信度估计方法，其特征在于，所述预先构建的音素模糊矩阵包括：所述音素模糊矩阵对于每一个音素选取与其相似度较高的音素作为其模糊音素。4.如权利要求3所述的一种基于音素模糊的置信度估计方法，其特征在于，所述计算单音素置信度，包括：对所述每个音素及其所述模糊音素的后验值加权，所述加权系数为其模糊系数，得到所述每个音素对应的声学置信度。5.如权利要求4所述的一种基于音素模糊的置信度估计方法，其特征在于，所诉根据所述单音素置信度计算所述识别结果的置信度包括：根据所述每个音素对应的声学置信度，计算所述识别结果的声学模型置信度；根据所述识别结果的声学模型置信度，计算所述识别结果的语言模型置信度；根据所述识别结果的语言模型置信度，计算所述识别结果的置信度。6.如权利要求5所述的一种基于音素模糊的置信度估计方法，其特征在于，所述计算所述识别结果的声学模型置信度包括：基于每个音素对应的帧长加权其声学置信度计算得到所述识别结果的声学模型置信度。7.如权利要求5所述的一种基于音素模糊的置信度估计方法，其特征在于，所述计算所述识别结果的语言模型置信度包括：对于所述识别结果，计算整个所述识别结果的语言模型的得分，并根据所述待估计语句的词组个数进行平均值计算，所述计算结果作为所述识别结果的语言模型置信度。8.如权利要求5所述的一种基于音素模糊的置信度估计方法，其特征在于，所述计算所述识别结果的置信度，包括：加权计算所述声学模型置信度和所述语言模型置信度，作为所述识别结果的置信度。9.一种语音识别的置信度估计装置，其特征在于，包括：接收模块，所述接收模块用于获取所述待估计语句；特征提取模块，所述特征提取模块用于将所述待估计语句送入声学模型进行计算和解码，以获取所述待估计语句中每个音素对应所述声学模型状态的后验值；音素模糊模块，所述音素模糊模块将所述音素的后验值送入预先构建的音素模糊矩
阵，计算单音素置信度；计算模块，所述计算模块根据所述单音素置信度计算所述待估计语句的置信度。10.一种计算机设备，其特征在于，所述计算机设备包括存储器和处理器；所述存储器用于存储计算机程序；所述处理器用于执行所述计算机程序并在执行所述计算机程序时实现如权利要求1至8中任一项所述的语音识别的置信度估计方法。

技术总结
本发明公开了一种语音识别的置信度估计方法、装置及设备，包括：获取待估计语句；将待估计语句送入声学模型进行计算和解码，以获取待估计语句中每个音素对应声学模型状态的后验值；将音素的后验值送入预先构建的音素模糊矩阵，计算单音素置信度；根据单音素置信度计算待估计语句的置信度。本发明通过利用音素模糊矩阵，来进行单音素置信度的计算，以得到整体语音的置信度，解决了在现有的置信度计算方法中，存在计算置信度效果不理想、计算量大、影响准确率等问题。响准确率等问题。响准确率等问题。

技术研发人员：张钰辉赵茂详李全忠何国涛蒲瑶
受保护的技术使用者：普强时代（珠海横琴）信息技术有限公司
技术研发日：2022.01.10
技术公布日：2022/4/22

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种可调噪声抑制深度的神经网络语音增强方法

一种语音识别的置信度估计方法、装置及计算机设备与流程

相关文献

最热文献