一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

语音意图识别方法及装置、存储介质、电子设备与流程

2022-02-24 13:25:38 来源:中国专利 TAG:

技术特征:
1.一种语音意图识别方法,其特征在于,包括:获取与待识别语音对应的待识别频谱特征,并根据所述待识别频谱特征计算所述待识别语音的全局特征;根据所述待识别语音的全局特征计算所述待识别语音的文本识别结果,并计算所述文本识别结果的上下文值;根据所述文本识别结果的上下文值对所述待识别语音的意图进行识别。2.根据权利要求1所述的语音意图识别方法,其特征在于,所述根据所述待识别频谱特征计算所述待识别语音的全局特征,包括:将所述待识别频谱特征输入至预设的意图识别模型中所包括的卷积神经网络中,得到所述待识别语音所包括的局部特征;将所述待识别语音所包括的局部特征输入至所述意图识别模型中所包括的自注意力模块中,得到所述待识别语音的全局特征。3.根据权利要求2所述的语音意图识别方法,其特征在于,所述根据所述全局特征计算所述待识别语音的文本识别结果,包括:利用所述意图识别模型中所包括的第一全连接层对所述待识别语音的全局特征进行分类处理,得到所述待识别语音的文本识别结果。4.根据权利要求2所述的语音意图识别方法,其特征在于,所述计算所述文本识别结果的上下文值,包括:利用所述意图识别模型中所包括的双向长短期记忆网络,计算所述文本识别结果的上下文值。5.根据权利要求2所述的语音意图识别方法,其特征在于,所述根据所述文本识别结果的上下文值对所述待识别语音的意图进行识别,包括:利用所述意图识别模型中所包括的时间最大池化层对所述文本识别结果的上下文值进行降维处理;利用所述意图识别模型中所包括的第二全连接层对降维处理后的上下文值进行分类处理,得到所述待识别语音的初始意图识别结果;利用所述意图识别模型中所包括的归一化指数函数层对所述初始意图识别结果进行归一化处理,得到目标意图识别结果。6.根据权利要求2所述的语音意图识别方法,其特征在于,所述语音意图识别方法还包括:获取历史语音数据,并利用预设的短时傅里叶变换模型对所述历史语音数据进行采样,得到多个标准频谱特征;根据各所述标准频谱特征以及所述历史语音数据的意图类别标注结果构建训练数据集;利用所述训练数据集对预设的网络模型进行训练,得到所述意图识别模型。7.根据权利要求6所述的语音意图识别方法,其特征在于,所述预设的网络模型包括语音识别模块以及意图预测模块;其中,利用所述训练数据集对预设的网络模型进行训练,得到所述意图识别模型包括:将所述训练数据集中的标准频谱特征输入至所述语音识别模块中,得到与所述标准频
谱特征对应的历史语音数据的标准文本;将所述标准文本输入至所述意图预测模块中,得到与所述标准频谱特征对应的历史语音数据的意图预测结果;根据所述意图预测结果以及与所述标准频谱特征对应的历史语音数据的意图类别标注结果构建目标损失函数,并基于所述目标损失函数对所述预设的网络模型进行训练,得到所述意图识别模型。8.根据权利要求7所述的语音意图识别方法,其特征在于,根据所述意图预测结果以及与所述标准频谱特征对应的历史语音数据的意图类别标注结果构建目标损失函数包括:根据与所述标准频谱特征对应的历史语音数据的意图类别标注结果,构建第一损失函数;根据所述意图类别标注结果所包括的类别数、所述意图预测结果以及意图类别标注结果构建第二损失函数;根据所述意图预测模块中所包括的参数的二范数构建第三损失函数;根据所述第一损失函数、第二损失函数以及第三损失函数,构建所述目标损失函数。9.一种语音意图识别装置,其特征在于,包括:第一计算模块,用于获取与待识别语音对应的待识别频谱特征,并根据所述待识别频谱特征计算所述待识别语音的全局特征;第二计算模块,用于根据所述待识别语音的全局特征计算所述待识别语音的文本识别结果,并计算所述文本识别结果的上下文值;意图识别模块,用于根据所述文本识别结果的上下文值对所述待识别语音的意图进行识别。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-8任一项所述的语音意图识别方法。11.一种电子设备,其特征在于,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-8任一项所述的语音意图识别方法。

技术总结
本发明实施例是关于一种语音意图识别方法及装置、存储介质、电子设备,涉及语音语义识别技术领域,该方法包括:获取与待识别语音对应的待识别频谱特征,并根据所述待识别频谱特征计算所述待识别语音的全局特征;根据所述待识别语音的全局特征计算所述待识别语音的文本识别结果,并计算所述文本识别结果的上下文值;根据所述文本识别结果的上下文值对所述待识别语音的意图进行识别。本发明实施例提高了意图识别结果的准确率。意图识别结果的准确率。意图识别结果的准确率。


技术研发人员:付立 刘子菡
受保护的技术使用者:京东科技控股股份有限公司
技术研发日:2020.08.20
技术公布日:2022/2/23
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献