一种语音数据的识别方法、装置、设备及存储介质与流程

2021-10-29 20:01:00 来源：中国专利 TAG：语音识别装置计算机方法

技术特征：
1.一种语音数据的识别方法，其特征在于，包括：获取目标用户输入的语音数据和所述目标用户的位置信息；从多个地域语言模型中确定与所述位置信息所属目标地域对应的目标地域语言模型，所述多个地域语言模型中任一地域语言模型是基于所述任一地域所包括的信息点进行训练得到的；调用所述目标地域语言模型和通用语言模型对所述语音数据进行第一解码处理，得到n个候选识别结果；调用所述目标地域语言模型和神经网络语言模型对所述n个候选识别结果中每个候选识别结果进行第二解码处理，以从所述n个候选识别结果中选取目标识别结果。2.根据权利要求1所述的方法，其特征在于，所述调用所述目标地域语言模型和神经网络语言模型对所述n个候选识别结果中每个候选识别结果进行第二解码处理，以从所述n个候选识别结果中选取目标识别结果，包括：获取所述n个候选识别结果中每个候选识别结果的第一融合概率，任一候选识别结果的第一融合概率是在对所述语音数据进行第一编码处理的过程中得到的；调用所述目标地域语言模型和所述神经网络语言模型分别对所述每个候选识别结果进行处理，得到所述每个候选识别结果的第二融合概率；基于所述每个候选识别结果的第一融合概率和所述每个候选识别结果的第二融合概率，从所述n个候选识别结果中选取目标识别结果。3.根据权利要求2所述的方法，其特征在于，所述基于所述每个候选识别结果的第一融合概率和所述每个候选识别结果的第二融合概率，从所述n个候选识别结果中选取目标识别结果，包括：将所述每个候选识别结果的第一融合概率和相应的候选识别结果的第二融合概率进行融合处理，得到所述每个候选识别结果的目标融合概率；将所述n个候选识别结果中目标融合概率最大的候选识别结果作为目标识别结果。4.根据权利要求3所述的方法，其特征在于，所述将所述每个候选识别结果的第一融合概率和相应的候选识别结果的第二融合概率进行融合处理，得到所述每个候选识别结果的目标融合概率，包括：获取所述n个候选识别结果中任一候选识别结果对应的声学概率，所述任一候选识别结果对应的声学概率是在对所述语音数据进行第一解码处理过程中得到的；获取声学缩放参数以及融合比例参数，将所述声学概率进行对数运算，并将对数运算结果与所述声学缩放参数进行相乘运算，并按照所述融合比例参数将所述第一融合概率和所述第二融合概率进行融合处理；将相乘运算结果和融合处理结果进行相加运算，得到所述任一候选识别结果的目标融合概率。5.根据权利要求2所述的方法，其特征在于，所述n个候选识别结果中包括目标候选识别结果，所述获取所述n个候选识别结果中每个候选识别结果的第一融合概率，包括：调用所述目标地域语言模型对所述语音数据进行第一解码处理，得到所述目标候选识别结果的第一语言概率；调用所述通用语言模型对所述语音数据进行第一解码处理，得到所述目标候选识别结
果的第二语言概率；采用第一融合参数对所述目标候选识别结果的第一语言概率和所述目标候选识别结果的第二语言概率进行融合处理，得到所述目标候选识别结果的融合语言概率；基于所述目标候选识别结果的融合语言概率与所述目标候选识别结果的第二语言概率，得到所述目标候选识别结果的第一融合概率。6.根据权利要求5所述的方法，其特征在于，所述调用所述目标地域语言模型和所述神经网络语言模型分别对所述每个候选识别结果进行处理，得到所述每个候选识别结果的第二融合概率，包括：获取所述目标候选识别结果的第一语言概率；调用所述神经网络语言模型对所述目标候选识别结果进行第二解码处理，得到所述目标候选识别结果的第三语言概率；采用第二融合参数对所述目标候选识别结果的第一语言概率和所述目标候选识别结果的第三语言概率进行融合处理，得到所述目标候选识别结果的第二融合概率。7.根据权利要求1所述的方法，其特征在于，在所述基于所述位置信息从多个地域语言模型中确定所述语音数据对应的目标地域语言模型之前，所述方法还包括：获取目标地域包括的信息点数据，所述信息点数据包括至少一个信息点，以及所述至少一个信息点中每个信息点的信息点特征，任一信息点的信息点特征包括以下一种或两种：信息点名称以及信息点别名；采用所述每个信息点的信息点特征进行地域语言模型训练，得到所述目标地域对应的目标地域语言模型。8.一种语音数据的识别装置，其特征在于，包括：获取单元，用于获取目标用户输入的语音数据和所述目标用户的位置信息；确定单元，用于从多个地域语言模型中确定与所述位置信息所属目标地域对应的目标地域语言模型；处理单元，用于调用所述目标地域语言模型和通用语言模型对所述语音数据进行第一解码处理，得到n个候选识别结果；所述处理单元，还用于调用所述目标地域语言模型和神经网络语言模型对所述n个候选识别结果中每个候选识别结果进行第二解码处理，以从所述n个候选识别结果中选取目标识别结果。9.一种语音数据的识别设备，其特征在于，该设备包括输入接口和输出接口，还包括：处理器，适于实现一条或多条指令；计算机存储介质，所述计算机存储介质存储有一条或多条指令，所述一条或多条指令适于由所述处理器加载并执行如权利要求1
‑
7中任一项所述的语音数据的识别方法。10.一种计算机存储介质，其特征在于，所述计算机存储介质存储有一条或多条指令，所述一条或多条指令适于由处理器加载并执行如权利要求1
‑
7中任一项所述的语音数据的识别方法。

技术总结
本发明实施例公开了一种语音数据的识别方法、装置、设备及存储介质，其中，该方法包括：通过获取目标用户输入的语音数据和目标用户的位置信息；从多个地域语言模型中确定与所述位置信息所属目标地域对应的目标地域语言模型，所述多个地域语言模型中任一地域语言模型是基于该任一地域所包括的信息点进行训练得到的；调用目标地域语言模型和通用语言模型对语音数据进行第一解码处理，得到N个候选识别结果；调用目标地域语言模型和神经网络语言模型对N个候选识别结果中每个候选识别结果进行第二解码处理，以从N个候选识别结果中选取目标识别结果，可提高语音数据的识别准确率。可提高语音数据的识别准确率。可提高语音数据的识别准确率。

技术研发人员：张一珂马龙
受保护的技术使用者：腾讯科技（深圳）有限公司
技术研发日：2021.01.15
技术公布日：2021/10/28

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：音频信号编码方法、音频信号解码方法、程序、编码装置、音频系统及解码装置与流程

一种语音数据的识别方法、装置、设备及存储介质与流程

相关文献

最热文献