一种通过语音识别实现情绪判断的方法和系统与流程

2022-06-01 16:39:42 来源：中国专利 TAG：

1.本发明涉及智能交互技术领域，具体为一种通过语音识别实现情绪判断的方法和系统。

背景技术：

2.现有的基于词典的情感分类，简单易行，而且通用性也能够得到保障。但仍然有很多不足：精度不高，语言是一个高度复杂的东西，采用简单的线性叠加显然会造成很大的精度损失，词语权重同样不是一成不变的，而且也难以做到准确，因此需要一种通过语音识别实现情绪判断的方法和系统对上述问题做出改善。

技术实现要素：

3.本发明的目的在于提供一种通过语音识别实现情绪判断的方法和系统，以解决上述背景技术中提出的问题。
4.为实现上述目的，本发明提供如下技术方案：
5.一种通过语音识别实现情绪判断的方法和系统，包括以下步骤：
6.s1，语音信号预处理：(1)语音信号采集；(2)分帧；(3)预加重；(4)加窗；
7.s2，特征提取；
8.s3，载入情感词典和情感词典的构建；
9.s4，语音识别参数提取；
10.s5，情感分类。
11.优选的，所述s2特征提取基于大量的文本语料库，通过类似神经网络模型训练，将每个词语映射成一个定维度的向量，维度在几十到化百维之间，每个向量就代表着这个词语，词语的语义和语法相似性和通过向量之间的相似度来判断，选用word2vec主要是cbow和skip-gram两种模型，由于这两个模型实际上就是一个三层的深度神经网络，其实nnlm的升级，去掉了隐藏层，由输入层、投影层、输出层三层构成，简化了模型和提升了模型的训练速度，其在时间效率上、语法语义表达上效果明显都变好，word2vec通过训练大量的语料最终用定维度的向量来表示每个词语，词语之间语义和语法相似度都可以通过向量的相似度来表示。
12.优选的，所述s4载入情感词典和情感词典的构建，将积极情感词表、消极情感词表、否定词表和程度副词表载入情感词典对情感词典进行构建。
13.优选的，所述s4采用mfcc系数进行语音识别参数提取。
14.优选的，所述s5情感分类基于词典的文本匹配算法逐个遍历分词后的语句中的词语，如果词语命中词典，则进行相应权重的处理，正面词权重为加法，负面词权重为减法，否定词权重取相反数，程度副词权重则和它修饰的词语权重相乘，利用最终输出的权重值，区分是正面、负面还是中性情感。
15.优选的，包括预处理、特征提取和语音识别参数提取，所述预处理包括预滤波、采
样和量化、分帧、加窗、预加重、端点检测；
16.所述特征提取从语音信号中提取出语音的特征序列，提取的语音特征应该能完全、准确地表达语音信号，特征提取的目的是提取语音信号中能代表语音特征的信息，减少语音识别时所要处理的数据量；
17.所述语音识别参数提取主要对经过预处理的语音数据配合特征提取进行特征参数提取。
18.与现有技术相比，本发明的有益效果是：
19.本发明中，通过设置的语音信号预处理、特征提取、载入情感词典和情感词典的构建和语音识别参数提取，能够对预处理后的语音特征进行提取，提高语音提取的准确性，并且语音识别参数提取能够对语音的特征参数进行提取，提高语音识别实现情绪判断的准确性。
附图说明
20.图1为本发明整体流程图；
21.图2为本发明情感分类流程图；
22.图3为本发明情感词典架构图；
23.图4为本发明情感词典文本分类图。
具体实施方式
24.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例，基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
25.请参阅图1-4，本发明提供一种技术方案：
26.一种通过语音识别实现情绪判断的方法和系统，包括以下步骤：
27.s1，语音信号预处理：(1)语音信号采集；(2)分帧；(3)预加重；(4)加窗；
28.s2，特征提取；
29.s3，载入情感词典和情感词典的构建；
30.s4，语音识别参数提取；
31.s5，情感分类。
32.所述s2特征提取基于大量的文本语料库，通过类似神经网络模型训练，将每个词语映射成一个定维度的向量，维度在几十到化百维之间，每个向量就代表着这个词语，词语的语义和语法相似性和通过向量之间的相似度来判断，选用word2vec主要是cbow和skip-gram两种模型，由于这两个模型实际上就是一个三层的深度神经网络，其实nnlm的升级，去掉了隐藏层，由输入层、投影层、输出层三层构成，简化了模型和提升了模型的训练速度，其在时间效率上、语法语义表达上效果明显都变好，word2vec通过训练大量的语料最终用定维度的向量来表示每个词语，词语之间语义和语法相似度都可以通过向量的相似度来表示。
33.所述s4载入情感词典和情感词典的构建，将积极情感词表、消极情感词表、否定词
表和程度副词表载入情感词典对情感词典进行构建。
34.所述s4采用mfcc系数进行语音识别参数提取。
35.所述s5情感分类基于词典的文本匹配算法逐个遍历分词后的语句中的词语，如果词语命中词典，则进行相应权重的处理，正面词权重为加法，负面词权重为减法，否定词权重取相反数，程度副词权重则和它修饰的词语权重相乘，利用最终输出的权重值，区分是正面、负面还是中性情感。
36.包括预处理、特征提取和语音识别参数提取，所述预处理包括预滤波、采样和量化、分帧、加窗、预加重、端点检测；
37.所述特征提取从语音信号中提取出语音的特征序列，提取的语音特征应该能完全、准确地表达语音信号，特征提取的目的是提取语音信号中能代表语音特征的信息，减少语音识别时所要处理的数据量；
38.所述语音识别参数提取主要对经过预处理的语音数据配合特征提取进行特征参数提取。
39.实施例：语音信号的采样和量化，语音信号是一个时间和幅度都连续变化的一维模拟信号，而语音识别的过程是一个对语音信号进行数字处理的过程，在对语音信号处理之前，必须要对其进行数字化，这个过程就是模/数(a/d)转化、模/数转化过程要经过采样和量化两个过程，从而得到时间和幅度上的离散数字信号，根据奈奎斯特采样定律，采样频率应为原始信号频率的两倍以上，才能使采样过程中不会丢失信息，而且能从采样信号中准确的重构原始信号的波形，语音信号的预加重语音信号从嘴唇辐射后，高频端大约在800hz以上有6db/倍频的衰减，因此，在对语音信号进行分析之前，一般要对语音信号加以提升(预加重)，“预加重的目的是滤除低频干扰，尤其是50hz或者60hz的工频干扰，提升对语音识别有用的高频部分，使信号的频谱变得平坦，以便于进行频谱分析或声道参数分析”，语音信号的加窗处理为了能对语音信号进行处理，我们可以假定在1oms～30ms之间语音信号是平稳的，语音频谱特性和语音特征参数恒定，因此需将语音信号划分为一个一个的短时段，每一个短时段称为一帧，为了从语音信号中切去出样本信号，就要用时间窗函数乘以原始语音信号，这种操作就称为加窗，语音信号的端点检测其目的是从语音信号中检测出语音信号段和噪音段，准确的端点检测不仅可以减少计算量，而且可以提高系统的识别率，常用的端点检测是基于双门限比较法的端点检测，就是根据语音信号的特征参数(能量和过零率)进行清音，噪音判别，从而完成端点检测的，经过对语音信号的预处理之后就要进行特征参数的提取，特征提取基于大量的文本语料库，通过类似神经网络模型训练，将每个词语映射成一个定维度的向量，维度在几十到化百维之间，每个向量就代表着这个词语，词语的语义和语法相似性和通过向量之间的相似度来判断，选用word2vec主要是cbow和skip-gram两种模型，由于这两个模型实际上就是一个三层的深度神经网络，其实nnlm的升级，去掉了隐藏层，由输入层、投影层、输出层三层构成，简化了模型和提升了模型的训练速度，其在时间效率上、语法语义表达上效果明显都变好，word2vec通过训练大量的语料最终用定维度的向量来表示每个词语，词语之间语义和语法相似度都可以通过向量的相似度来表示，mfcc系数进行语音识别参数提取，mfcc系数的计算过程如下：
40.(1)预处理：确定每一-帧语音采样序列的长度(如n＝256)，并对每帧序列s(n)进行预加重、分帧和加窗处理；
41.(2)计算离散功率谱：对预处理的每帧进行离散fft变换得到其频谱，再取模的平方作为离散功率谱s(n)；
42.(3)将功率谱通过滤波器组:计算s(n)通过m个hm(n)后所得的功率值，即计算s(n)和hm(n)在各离散频率点上的乘积之和，得到m个参数pm，m＝0，1，
……
m-l；
43.(4)取对数：计算pm的自然对数，得到lm，m＝0，1，
……
m-l；
44.(5)离散余弦变换：对lm计算其离散余弦变换，得到dm，m＝0，1，
……
m-l，舍去代表直流成份的d0，取d1，d2，
……
，dk作为mfcc参数。
45.在mat1ab环境中计算m个滤波器的系数可以调用语音工具箱voicebox中的函数melbankm(m，n，fs)来实现，其中m为滤波器的个数，n为语音帧长，fs为采样频率，计算mfcc系数的函数为melcepst(s，fs)，s为语音信号，情感分类基于词典的文本匹配算法逐个遍历分词后的语句中的词语，如果词语命中词典，则进行相应权重的处理，正面词权重为加法，负面词权重为减法，否定词权重取相反数，程度副词权重则和它修饰的词语权重相乘，利用最终输出的权重值，区分是正面、负面还是中性情感，通过设置的语音信号预处理、特征提取、载入情感词典和情感词典的构建和语音识别参数提取，能够对预处理后的语音特征进行提取，提高语音提取的准确性，并且语音识别参数提取能够对语音的特征参数进行提取，提高语音识别实现情绪判断的准确性。
46.尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

一种通过语音识别实现情绪判断的方法和系统与流程

相关文献

最热文献