语音情绪识别模型训练方法、语音情绪识别方法及装置与流程

2021-07-16 17:24:00 来源：中国专利 TAG：语音识别情绪方法装置

技术特征：
1.一种语音情绪识别模型训练方法，其特征在于，包括：获取多个语音信息样本；分别对多个所述语音信息样本进行预处理，生成多个音频信息样本；分别对多个所述音频信息样本进行特征提取，得到多个所述音频信息样本的情绪特征数据样本；将多个所述情绪特征数据样本输入到待训练的语音情绪识别模型，对所述待训练的语音情绪识别模型进行迭代训练，其中，所述语音情绪识别模型的网络框架是按预设系数对基准网络框架扩张调整确定，所述基准网络框架的参数数量小于所述语音情绪识别模型的网络框架的参数数量；当所述训练满足预设的训练条件时，将训练后的语音情绪识别模型作为目标语音情绪识别模型。2.根据权利要求1所述的方法，其特征在于，在将多个所述语音信息样本输入待训练的语音情绪识别模型之前，还包括：按预设系数对基准网络框架扩张调整确定所述语音情绪识别模型的网络框架；所述按预设系数对基准网络框架扩张调整确定所述语音情绪识别模型的网络框架，具体包括：根据参数搜索算法，确定基准网络框架，以获取所述基准网络框架的运算量；根据在预定的选取条件下选取的至少一个预设系数，对所述运算量进行扩张，得到至少一个扩张后的运算量和对应的至少一组扩张后的第一超参数；将扩张后的所述运算量和所述第一超参数进行回归操作，确定所述运算量和所述第一超参数的回归关系；根据所述回归关系，得到所述语音情绪识别模型的第二超参数，以确定所述语音情绪识别模型的网络框架；其中，所述基准网络框架的运算量不大于所述语音情绪识别模型的网络框架的运算量。3.一种语音情绪识别的方法，其特征在于，包括：获取用户的语音信息；对所述语音信息进行预处理，生成音频信息；对所述音频信息进行特征提取，得到所述音频信息的情绪特征数据；将所述情绪特征数据输入语音情绪识别模型中，识别出所述用户的语音情绪结果，其中所述语音情绪识别模型是利用权利要求1-2任意一项所述的语音情绪识别模型的训练方法训练得到的。4.根据权利要求3所述的方法，其特征在于，所述对音频信息进行特征提取，得到音频信息的情绪特征数据，包括：获取所述音频信息中的第一情绪信息；比对所述第一情绪信息与预先设置的情绪关键词语音的第二情绪信息，确定所述第一情绪信息与所述第二情绪信息的情绪相似系数；将所述第一情绪信息中与所述第二情绪信息的情绪相似系数达到预定阈值的第一情绪信息确定为第三情绪信息；
将所述第三情绪信息添加至人工特征集，其中，所述人工特征集包括根据所述音频信息已生成的人工特征数据；根据所述人工特征集，确定第一情绪特征数据；对所述音频信息进行时频分析处理，提取第二情绪特征数据。5.根据权利要求4所述的方法，其特征在于，所述比对所述第一情绪信息与预先设置的情绪关键词语音的第二情绪信息，确定所述第一情绪信息与所述第二情绪信息的情绪相似系数，包括：获取所述情绪关键词语音的第二情绪信息；将所述音频信息的第一情绪信息与所述情绪关键词语音的第二情绪信息进行波形匹配，确定匹配相关系数，将所述匹配相关系数作为所述情绪相似系数。6.根据权利要求4或5所述的方法，其特征在于，所述第二情绪特征数据表示为声谱图。7.根据权利要求4所述的方法，其特征在于，所述语音情绪识别模型包括第一神经网络和第二神经网络，将所述情绪特征数据输入利用权利要求1-2任意一项所述的语音情绪识别模型的训练方法训练得到的所述语音情绪识别模型中，识别出所述用户的语音情绪结果，包括：将所述第一情绪特征数据输入到所述第一神经网络，输出第一情绪分析数据；将所述第二情绪特征数据输入到所述第二神经网络，输出第二情绪分析数据；拼接所述第一情绪分析数据和所述第二情绪分析数据，得到拼接数据结果；通过分类算法对所述拼接数据结果进行分类识别，得到所述用户的语音情绪结果。8.一种语音情绪识别模型训练的装置，其特征在于，所述装置包括：第一获取模块，用于获取多个语音信息样本；样本预处理模块，用于分别对多个所述语音信息样本进行预处理，生成多个音频信息样本；第一提取模块，用于分别对多个所述音频信息样本进行特征提取，得到多个所述音频信息样本的情绪特征数据样本；训练模块，用于将多个所述情绪特征数据样本输入到待训练的语音情绪识别模型，对所述待训练的语音情绪识别模型进行迭代训练，其中，所述语音情绪识别模型的网络框架是按预设系数对基准网络框架扩张调整确定，所述基准网络框架的参数数量小于所述语音情绪识别模型的网络框架的参数数量；确定模块，用于当所述训练满足预设的训练条件时，将训练后的语音情绪识别模型作为目标语音情绪识别模型。9.一种语音情绪识别的装置，其特征在于，所述装置包括：第二获取模块，用于获取用户的语音信息；预处理模块，用于对所述语音信息进行预处理，生成音频信息；第二提取模块，用于对所述音频信息进行特征提取，得到所述音频信息的情绪特征数据；识别模块，用于将所述情绪特征数据输入语音情绪识别模型中，识别出所述用户的语音情绪结果，其中所述语音情绪识别模型是利用权利要求1-2任意一项所述的语音情绪识别模型的训练方法训练得到的。
10.一种语音情绪识别模型训练的设备，其特征在于，所述设备包括：处理器以及存储有计算机程序指令的存储器；所述处理器执行所述计算机程序指令时实现如权利要求1-2任意一项所述的语音情绪识别模型训练的方法。11.一种语音情绪识别的设备，其特征在于，所述设备包括：处理器以及存储有计算机程序指令的存储器；所述处理器执行所述计算机程序指令时实现如权利要求3-7任意一项所述的语音情绪识别的方法。12.一种计算机存储介质，其特征在于，所述计算机存储介质上存储有计算机程序指令，所述计算机程序指令被处理器执行时实现如权利要求1-2任意一项所述的语音情绪识别模型训练的方法。13.一种计算机存储介质，其特征在于，所述计算机存储介质上存储有计算机程序指令，所述计算机程序指令被处理器执行时实现如权利要求3-7任意一项所述的语音情绪识别的方法。

再多了解一些

2/3 首页上一页 1 2 3 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种音频处理的方法、装置、可读存储介质和电子设备与流程

语音情绪识别模型训练方法、语音情绪识别方法及装置与流程

相关文章

最热文献