一种数据处理方法以及设备与流程

2021-06-08 12:07:00 来源：中国专利 TAG：互联网数据处理申请方法设备

1.本申请涉及互联网技术领域，尤其涉及一种数据处理方法以及设备。

背景技术：

2.在进行语音情感分类任务时，需要准备大量已经标注的语音情感样本，对分类模型进行训练，采用训练后的模型对语音情感进行分类。但在训练过程中，通常标注的样本只有汉语情感样本，而需要识别的语言种类是多种多样的。不同语言种类对不同情感的表达也会稍有差异，重新标注其他语言的情感样本需要耗费大量的时间和资源进行样本数据的标注。为合理利用现有的汉语训练数据库以实现跨语料库的识别，例如，用汉语情感库作为训练，识别英语样本的情感类型，现有技术通过采用去噪自编码的形式，但自编码涉及到超参数的设置，并且容易导致网络不收敛，进而影响对语音情感进行分类的准确率。

技术实现要素：

3.本申请实施例提供一种数据处理方法以及设备，可以节省资源和开发成本，提高语音情感分类的准确率。
4.本申请实施例一方面提供了一种数据处理方法，可包括：
5.从训练语音集合中获取第一语音样本，从目标语音集合中获取第二语音样本；第一语音样本是情感类型已知的语音样本；第一语音样本对应的语言类型与第二语音样本对应的语言类型不同；
6.采用主成分分析法获取第一语音样本对应的第一低维特征和第二语音样本对应的第二低维特征；
7.将第二低维特征映射至第一低维特征对应的第一低维空间，生成第二低维特征在第一低维空间的第二映射特征；
8.根据第二映射特征和第二低维特征生成第一低维特征在第二低维空间对应的第一映射特征；
9.根据第一映射特征生成情感识别模型，情感识别模型用于预测与第二语音样本的语言类型相同的待识别语音的情感类型。
10.其中，还包括：
11.对目标语言类型的第一语音样本进行情感类型的标记，将标记后的第一语音样本存储至训练语音集合；
12.将非目标语言类型的第二语音样本存储至目标语音集合。
13.其中，从训练语音集合中获取第一语音样本，从目标语音集合中获取第二语音样本，包括：
14.从训练语音集合中获取第一语音样本，检测第一语音样本的第一语言类型，确定与第一语言类型不相同的第二语言类型；
15.从目标语音集合中获取具有第二语言类型的语音样本，作为第二语音样本。
16.其中，采用主成分分析法获取第一语音样本对应的第一低维特征和第二语音样本对应的第二低维特征，包括：
17.提取第一语音样本中的第一特征参数和第二语音样本中的第二特征参数；
18.采用主成分分析法对第一特征参数进行降维生成第一特征参数对应的第一低维特征，以及第一低维特征对应的第一低维空间；
19.采用主成分分析法对第二特征参数进行降维生成第二特征参数对应的第二低维特征，以及第二低维特征对应的第二低维空间。
20.其中，根据第二映射特征和第二低维特征生成第一低维特征在第二低维空间对应的第一映射特征，包括：
21.获取第二低维特征对应的第二低维空间与第一低维特征对应的第一低维空间之间的转换函数；转换函数用于使第二低维空间中的第二低维特征与第二低维特征在第一低维空间中的第二映射特征之间的差异性最小；
22.根据转换函数生成第一低维特征在第二低维空间对应的第一映射特征。
23.其中，获取第二低维特征对应的第二低维空间与第一低维特征对应的第一低维空间之间的转换函数，包括：
24.将第二映射特征输入初始映射模型，获取初始映射模型的输出；初始映射模型的初始参数包括初始转换函数；
25.获取初始映射模型的输出与第二低维特征之间的差值，根据差值调整初始映射模型中的初始转换函数；
26.当差值小于阈值时，将调整后的初始转换函数确定为第二低维特征对应的第二低维空间与第一低维特征对应的第一低维空间之间的转换函数。
27.其中，还包括：
28.获得语言类型与第二语音样本的语言类型相同的待识别语音；
29.采用主成分分析法获得待识别语音的低维特征；
30.将待识别语音的低维特征输入情感识别模型，以得到情感识别模型输出的待识别语音的情感类型。
31.本申请实施例一方面提供了一种数据处理设备，可包括：
32.样本获取单元，用于从训练语音集合中获取第一语音样本，从目标语音集合中获取第二语音样本；第一语音样本是情感类型已知的语音样本；第一语音样本对应的语言类型与第二语音样本对应的语言类型不同；
33.低维特征获取单元，用于采用主成分分析法获取第一语音样本对应的第一低维特征和第二语音样本对应的第二低维特征；
34.第二映射特征获取单元，用于将第二低维特征映射至第一低维特征对应的第一低维空间，生成第二低维特征在第一低维空间的第二映射特征；
35.第一映射特征获取单元，用于根据第二映射特征和第二低维特征生成第一低维特征在第二低维空间对应的第一映射特征；
36.模型生成单元，用于根据第一映射特征生成情感识别模型，情感识别模型用于预测与第二语音样本的语言类型相同的待识别语音的情感类型。
37.其中，还包括：
38.样本标记单元，用于对目标语言类型的第一语音样本进行情感类型的标记，将标记后的第一语音样本存储至训练语音集合；
39.将非目标语言类型的第二语音样本存储至目标语音集合。
40.其中，样本获取单元具体用于：
41.从训练语音集合中获取第一语音样本，检测第一语音样本的第一语言类型，确定与第一语言类型不相同的第二语言类型；
42.从目标语音集合中获取具有第二语言类型的语音样本，作为第二语音样本。
43.其中，低维特征获取单元具体用于：
44.提取第一语音样本中的第一特征参数和第二语音样本中的第二特征参数；
45.采用主成分分析法对第一特征参数进行降维生成第一特征参数对应的第一低维特征，以及第一低维特征对应的第一低维空间；
46.采用主成分分析法对第二特征参数进行降维生成第二特征参数对应的第二低维特征，以及第二低维特征对应的第二低维空间。
47.其中，第一映射特征获取单元，包括：
48.转换函数获取子单元，用于获取第二低维特征对应的第二低维空间与第一低维特征对应的第一低维空间之间的转换函数；转换函数用于使第二低维空间中的第二低维特征与第二低维特征在第一低维空间中的第二映射特征之间的差异性最小；
49.特征获取子单元，用于根据转换函数生成第一低维特征在第二低维空间对应的第一映射特征。
50.其中，转换函数获取子单元具体用于：
51.将第二映射特征输入初始映射模型，获取初始映射模型的输出；初始映射模型的初始参数包括初始转换函数；
52.获取初始映射模型的输出与第二低维特征之间的差值，根据差值调整初始映射模型中的初始转换函数；
53.当差值小于阈值时，将调整后的初始转换函数确定为第二低维特征对应的第二低维空间与第一低维特征对应的第一低维空间之间的转换函数。
54.其中，还包括：
55.情感类型预测单元，用于获得语言类型与第二语音样本的语言类型相同的待识别语音；
56.采用主成分分析法获得待识别语音的低维特征；
57.将待识别语音的低维特征输入情感识别模型，以得到情感识别模型输出的待识别语音的情感类型。
58.本申请实施例一方面提供了一种计算机可读存储介质，计算机存储介质存储有多条指令，指令适于由处理器加载并执行上述的方法步骤。
59.本申请实施例一方面提供了一种计算机设备，包括处理器和存储器；其中，存储器存储有计算机程序，计算机程序适于由处理器加载并执行上述的方法步骤。
60.本申请实施例一方面提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该
计算机设备执行上述的方法步骤。
61.在本申请实施例中，通过从训练语音集合中获取第一语音样本，从目标语音集合中获取第二语音样本；采用主成分分析法获取第一语音样本对应的第一低维特征和第二语音样本对应的第二低维特征；将第二低维特征映射至第一低维特征对应的第一低维空间，生成第二低维特征在第一低维空间的第二映射特征；根据第二映射特征和第二低维特征生成第一低维特征在第二低维空间对应的第一映射特征；根据第一映射特征生成情感识别模型，采用情感识别模型预测与第二语音样本的语言类型相同的待识别语音的情感类型。在对不同语言种类进行语音情感分类时，避免了重新标注语音情感样本的问题，同时，情感识别模型不涉及超参数的设置，避免了设置超参数容易导致网络不收敛的问题，因此，采用本方案中的方法，节省了资源和开发成本，提高了语音情感分类的准确率。
附图说明
62.为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
63.图1是本申请实施例提供的一种数据处理的系统架构图；
64.图2是本申请实施例提供的一种数据处理方法的流程示意图；
65.图3是本申请实施例提供的一种数据处理方法的流程示意图；
66.图4是本申请实施例提供的一种数据处理设备的结构示意图；
67.图5是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
68.下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。
69.请参见图1，是本发明实施例提供的一种数据处理的系统架构图。服务器10f通过交换机10e和通信总线10d与用户终端集群建立连接，用户终端集群可包括：用户终端10a、用户终端10b、...、用户终端10c。数据库10g中存储了多个语音样本，包括第一语音样本和第二语音样本，第一语音样本是情感类型已知的语音样本；第一语音样本对应的语言类型与第二语音样本对应的语言类型不同。服务器10f从数据库10g中提取出第一语音样本和第二语音样本，采用主成分分析法获取第一语音样本对应的第一低维特征和第二语音样本对应的第二低维特征，将第二低维特征映射至第一低维特征对应的第一低维空间，生成第二低维特征在第一低维空间的第二映射特征，根据第二映射特征和第二低维特征生成第一低维特征在第二低维空间对应的第一映射特征，根据第一映射特征生成情感识别模型，采用情感识别模型可以预测与第二语音样本的语言类型相同的待识别语音的情感类型。
70.本申请实施例涉及的用户终端包括：平板电脑、智能手机、个人电脑(pc)、笔记本电脑、掌上电脑等终端设备。
71.请参见图2，为本申请实施例提供了一种数据处理方法的流程示意图。如图2所示，本申请实施例的方法可以包括以下步骤s101
‑
步骤s105。
72.s101，从训练语音集合中获取第一语音样本，从目标语音集合中获取第二语音样本；
73.具体的，数据处理设备从训练语音集合中获取第一语音样本，从目标语音集合中获取第二语音样本，可以理解的是，第一语音样本是情感类型已知的语音样本，第一语音样本对应的语言类型与第二语音样本对应的语言类型不同，训练语音集合用于存储情感类型已知的语音样本，即第一语音样本是情感类型已知的语音样本，通常第一语音样本是汉语语音样本，情感类型为语音样本对应的用户的情绪状态，情感类型可以包括积极、消极和中性，例如，用户在高兴的情绪下说话生成的音频数据对应的情感类型为积极；目标语音集合用于存储情感类型未知的语音样本，即第二语音样本的情感类型未知，第一语音样本对应的语言类型与第二语音样本对应的语言类型不同，例如，第一语音样本的语言类型为汉语，第二语音样本的语言类型可以为英语。
74.s102，采用主成分分析法获取第一语音样本对应的第一低维特征和第二语音样本对应的第二低维特征；
75.具体的，数据处理设备提取第一语音样本中的第一特征参数和第二语音样本中的第二特征参数，可以理解的是，数据处理设备对第一语音样本进行特征提取生成第一特征参数，对第二语音样本进行特征提取生成第二特征参数，特征参数的提取方法是对语音样本提取对应的多维特征向量，特征参数的提取方法有很多种，包括感知线性预测(perceptuallinearpredictive，plp)、线性预测系数(linearpredictioncoefficients，lpc)和mel
‑
频率倒谱系数(melfrequencycepstral coefficient，mfcc)；
76.采用主成分分析法对第一特征参数进行降维生成第一特征参数对应的第一低维特征，以及第一低维特征对应的第一低维空间；第一低维空间是第一低维特征所属的维度空间，第一低维空间可以通过一组基向量表示，采用主成分分析法对第二特征参数进行降维生成第二特征参数对应的第二低维特征，以及第二低维特征对应的第二低维空间，第二低维空间是第二低维特征所属的维度空间，第二低维空间可以通过一组基向量表示。
77.s103，将第二低维特征映射至第一低维特征对应的第一低维空间，生成第二低维特征在第一低维空间的第二映射特征；
78.具体的，数据处理设备将第二低维特征映射至第一低维特征对应的第一低维空间，生成第二低维特征在第一低维空间的第二映射特征，可以理解的是，第一低维空间和第二低维空间分别对应一组基向量，根据第一低维空间基向量与第二低维空间基向量之间的转换关系，可以将第二低维特征映射至第一低维空间，生成第二低维特征在第一低维空间的第二映射特征。
79.s104，根据第二映射特征和第二低维特征生成第一低维特征在第二低维空间对应的第一映射特征；
80.具体的，数据处理设备根据第二映射特征和第二低维特征生成第一低维特征在第二低维空间对应的第一映射特征，可以理解的是，第二特征参数分别在第一低维空间和第二低维空间对应第二映射特征和第二低维特征，根据第二映射特征和第二低维特征之间的关系，可以获取第一低维特征在第二低维空间对应的第一映射特征，具体的，数据处理设备
获取第二低维特征对应的第二低维空间与第一低维特征对应的第一低维空间之间的转换函数，转换函数用于使第二低维空间中的第二低维特征与第二低维特征在第一低维空间中的第二映射特征之间的差异性最小，再根据转换函数生成第一低维特征在第二低维空间对应的第一映射特征。需要说明的是，转换函数可以是回归神经网络。
81.例如，对第一语音样本的第一特征参数进行降维后的第一低维特征为xs，xs对应的第一低维子空间为ws，对第二语音样本的第二特征参数进行降维后的第二低维特征为xt，xt对应的第二低维子空间为wt，将第二低维特征xt映射至第一低维空间，得到第二低维特征xt在第一低维空间上的第二映射特征xts，第一低维子空间ws与第二低维子空间wt之间的差异性h可以通过第二低维特征xt与第二映射特征xts计算得到，差异性h可以表示为h＝||xt
‑
g(xts)||2，其中，函数g是可调整的，当差异性h取最小值时，函数g则为第二低维空间与第一低维空间之间的转换函数。转换函数可以将第一低维空间中的特征转换至第二低维空间中，即将第一语音样本的特征迁移至第二语音样本中，具体的，第一低维子空间ws中的第一低维特征xs，通过转换函数g，生成第一低维特征在第二低维空间对应的第一映射特征g(xs)。可以采用第一映射特征训练识别模型，以识别第二语音样本的情感类型。
82.s105，根据第一映射特征生成情感识别模型。
83.具体的，数据处理设备根据第一映射特征生成情感识别模型，可以理解的是，数据处理设备将第一映射特征输入初始情感识别模型，获取初始情感识别模型的输出，根据初始情感识别模型的输出和第一映射特征，对初始情感识别模型进行训练，当初始情感识别模型的参数满足收敛条件时，将初始情感识别模型确定为情感识别模型，初始情感识别模型的满足收敛条件的判断过程如下：计算情感识别模型的输出和第一映射特征之间的差值，当差值小于预设阈值，或者初始情感识别模型的训练次数大于预设次数阈值时，初始情感识别模型的参数满足收敛条件。需要说明的是，本申请对情感识别模型的具体结构并不做限定，其可以是本领域技术人员能够期望得到的用于进行情感类型识别的任意神经网络模型。
84.情感识别模型训练完成后，将第二语音样本对应的第二低维特征输入情感识别模型，根据情感识别模型的输出预测第二语音样本的情感类型，需要说明的是，情感识别模型可以用于预测与第二语音样本的语言类型相同的待识别语音的情感类型。
85.在本申请实施例中，通过从训练语音集合中获取第一语音样本，从目标语音集合中获取第二语音样本；采用主成分分析法获取第一语音样本对应的第一低维特征和第二语音样本对应的第二低维特征；将第二低维特征映射至第一低维特征对应的第一低维空间，生成第二低维特征在第一低维空间的第二映射特征；根据第二映射特征和第二低维特征生成第一低维特征在第二低维空间对应的第一映射特征；根据第一映射特征生成情感识别模型，采用情感识别模型预测与第二语音样本的语言类型相同的待识别语音的情感类型。在对不同语言种类进行语音情感分类时，避免了重新标注语音情感样本的问题，同时，情感识别模型不涉及超参数的设置，避免了设置超参数容易导致网络不收敛的问题，因此，采用本方案中的方法，节省了资源和开发成本，提高了语音情感分类的准确率。
86.请参见图3，为本申请实施例提供了一种数据处理方法的流程示意图。如图3所示，本申请实施例的方法可以包括以下步骤s201
‑
步骤s207。
87.s201，对目标语言类型的第一语音样本进行情感类型的标记，将标记后的第一语
音样本存储至训练语音集合；将非目标语言类型的第二语音样本存储至目标语音集合。
88.具体的，数据处理设备对目标语言类型的第一语音样本进行情感类型的标记，将标记后的第一语音样本存储至训练语音集合；将非目标语言类型的第二语音样本存储至目标语音集合，可以理解的是，目标语言类型为预先设定的语言类型，非目标语言类型为与目标语言类型不同的语言类型，例如目标语言类型可以是汉语，即对汉语语音样本进行情感类型的标记，非目标语言类型可以为英语；
89.训练语音集合用于存储标记的语音样本，目标语音集合用于存储与目标语言类型不相同的语音样本，目标语音集合中的语音样本为未进行标记的语音样本，目标语音集合中可以存储多种类型的语音样本。
90.s202，从训练语音集合中获取第一语音样本，检测第一语音样本的第一语言类型，确定与第一语言类型不相同的第二语言类型；从目标语音集合中获取具有第二语言类型的语音样本，作为第二语音样本。
91.具体的，数据处理设备从训练语音集合中获取第一语音样本，检测第一语音样本的第一语言类型，确定与第一语言类型不相同的第二语言类型可以理解的是，第二语言类型为需要进行情感预测的语音样本的语言类型，例如，第一语音样本的语言类型为汉语，则第一语言类型为汉语，第二语言类型是与汉语不同的其他任意语言类型，第二语言类型具体可以是英语；目标语音集合中可以存储多种类型的语音样本，从目标语音集合中获取具有第二语言类型的语音样本，作为第二语音样本。
92.s203，采用主成分分析法获取第一语音样本对应的第一低维特征和第二语音样本对应的第二低维特征；
93.具体的，数据处理设备提取第一语音样本中的第一特征参数和第二语音样本中的第二特征参数，可以理解的是，数据处理设备对第一语音样本进行特征提取生成第一特征参数，对第二语音样本进行特征提取生成第二特征参数，特征参数的提取方法是对语音样本提取对应的多维特征向量，特征参数的提取方法有很多种，包括plp、lpc和mfcc；
94.采用主成分分析法对第一特征参数进行降维生成第一特征参数对应的第一低维特征，以及第一低维特征对应的第一低维空间；第一低维空间是第一低维特征所属的维度空间，第一低维空间可以通过一组基向量表示，第一低维特征可以通过第一低维空间的基向量表示，采用主成分分析法对第二特征参数进行降维生成第二特征参数对应的第二低维特征，以及第二低维特征对应的第二低维空间，第二低维空间是第二低维特征所属的维度空间，第二低维空间可以通过一组基向量表示，第二低维特征可以通过第二低维空间的基向量表示。
95.s204，将第二低维特征映射至第一低维特征对应的第一低维空间，生成第二低维特征在第一低维空间的第二映射特征；
96.具体的，数据处理设备将第二低维特征映射至第一低维特征对应的第一低维空间，生成第二低维特征在第一低维空间的第二映射特征，可以理解的是，第一低维空间和第二低维空间分别对应一组基向量，根据第一低维空间基向量与第二低维空间基向量之间的转换关系，可以将第二低维特征映射至第一低维空间，生成第二低维特征在第一低维空间的第二映射特征。
97.s205，获取第二低维特征对应的第二低维空间与第一低维特征对应的第一低维空
间之间的转换函数；
98.具体的，数据处理设备获取第二低维特征对应的第二低维空间与第一低维特征对应的第一低维空间之间的转换函数，可以理解的是，转换函数用于使第二低维空间中的第二低维特征与第二低维特征在第一低维空间中的第二映射特征之间的差异性最小，例如，对第一语音样本的第一特征参数进行降维后的第一低维特征为xs，xs对应的第一低维子空间为ws，对第二语音样本的第二特征参数进行降维后的第二低维特征为xt，xt对应的第二低维子空间为wt，将第二低维特征xt映射至第一低维空间，得到第二低维特征xt在第一低维空间上的第二映射特征xts，第一低维子空间ws与第二低维子空间wt之间的差异性h可以通过第二低维特征xt与第二映射特征xts计算得到，差异性h可以表示为h＝||xt
‑
g(xts)||2，其中，函数g是可调整的，当差异性h取最小值时，函数g则为第二低维空间与第一低维空间之间的转换函数。
99.转换函数g可以采用映射模型最小化差异性h获取，映射模型具体可以是神经网络模型，具体的，将第二映射特征输入初始映射模型，获取初始映射模型的输出，初始映射模型的初始参数包括初始转换函数，获取初始映射模型的输出与第二低维特征之间的差值，根据差值调整初始映射模型中的初始转换函数；当差值小于阈值时，则初始映射模型收敛，将调整后的初始转换函数确定为第二低维特征对应的第二低维空间与第一低维特征对应的第一低维空间之间的转换函数。
100.需要说明的是，转换函数g可以采用映射模型最小化差异性h获取，也可以通过矩阵计算的方式获取，具体的，采用矩阵计算获取第二低维特征和第二映射特征之间的关系矩阵，例如，xt与xts之间的关系可以用矩阵w表示，即，第二低维特征xt和第二映射特征xts之间可表示为：xtsw＝xt，则矩阵w可根据xts
‑1xt计算得到，矩阵w可以作为第二低维空间与第一低维空间之间的转换函数g，矩阵w可表示第二低维空间与第一低维空间的关系，进而实现特征的迁移。
101.s206，根据转换函数生成第一低维特征在第二低维空间对应的第一映射特征。
102.具体的，数据处理设备根据转换函数生成第一低维特征在第二低维空间对应的第一映射特征，可以理解的是，转换函数可以将第一低维空间中的特征转换至第二低维空间中，即将第一语音样本的特征迁移至第二语音样本中，具体的，第一低维子空间ws中的第一低维特征xs，通过转换函数g，生成第一低维特征在第二低维空间对应的第一映射特征g(xs)。可以采用第一映射特征训练识别模型，识别第二语音样本的情感类型。
103.s207，根据第一映射特征生成情感识别模型，获得语言类型与第二语音样本的语言类型相同的待识别语音；采用主成分分析法获得待识别语音的低维特征；将待识别语音的低维特征输入情感识别模型，以得到情感识别模型输出的待识别语音的情感类型。
104.具体的，数据处理设备根据第一映射特征生成情感识别模型，采用情感识别模型预测第二语音样本的情感类型，可以理解的是，数据处理设备将第一映射特征输入初始情感识别模型，获取初始情感识别模型的输出，根据初始情感识别模型的输出和第一映射特征，对初始情感识别模型进行训练，当初始情感识别模型的参数满足收敛条件时，将初始情感识别模型确定为情感识别模型，初始情感识别模型的满足收敛条件的判断过程如下：计算情感识别模型的输出和第一映射特征之间的差值，当差值小于预设阈值，或者初始情感识别模型的训练次数大于预设次数阈值时，初始情感识别模型的参数满足收敛条件。
105.情感识别模型训练完成后，可以采用情感识别模型预测与第二语音样本的语言类型相同的待识别语音的情感类型，具体的，获得语言类型与第二语音样本的语言类型相同的待识别语音，采用主成分分析法获得待识别语音的低维特征，将待识别语音的低维特征输入上述训练完成的情感识别模型，根据情感识别模型的输出预测待识别语音的情感类型。
106.在本申请实施例中，通过从训练语音集合中获取第一语音样本，从目标语音集合中获取第二语音样本；采用主成分分析法获取第一语音样本对应的第一低维特征和第二语音样本对应的第二低维特征；将第二低维特征映射至第一低维特征对应的第一低维空间，生成第二低维特征在第一低维空间的第二映射特征；根据第二映射特征和第二低维特征生成第一低维特征在第二低维空间对应的第一映射特征；根据第一映射特征生成情感识别模型，采用情感识别模型预测与第二语音样本的语言类型相同的待识别语音的情感类型。在对不同语言种类进行语音情感分类时，避免了重新标注语音情感样本的问题，同时，情感识别模型不涉及超参数的设置，避免了设置超参数容易导致网络不收敛的问题，因此，采用本方案中的方法，节省了资源和开发成本，提高了语音情感分类的准确率。
107.请参见图4，为本申请实施例提供了一种数据处理设备的结构示意图。数据处理设备可以是运行于计算机设备中的一个计算机程序(包括程序代码)，例如该数据处理设备为一个应用软件；该设备可以用于执行本申请实施例提供的方法中的相应步骤。如图4所示，本申请实施例的数据处理设备1可以包括：样本获取单元11、低维特征获取单元12、第二映射特征获取单元13、第一映射特征获取单元14、模型生成单元15。
108.样本获取单元11，用于从训练语音集合中获取第一语音样本，从目标语音集合中获取第二语音样本；第一语音样本是情感类型已知的语音样本；第一语音样本对应的语言类型与第二语音样本对应的语言类型不同；
109.低维特征获取单元12，用于采用主成分分析法获取第一语音样本对应的第一低维特征和第二语音样本对应的第二低维特征；
110.第二映射特征获取单元13，用于将第二低维特征映射至第一低维特征对应的第一低维空间，生成第二低维特征在第一低维空间的第二映射特征；
111.第一映射特征获取单元14，用于根据第二映射特征和第二低维特征生成第一低维特征在第二低维空间对应的第一映射特征；
112.模型生成单元15，用于根据第一映射特征生成情感识别模型，采用情感识别模型预测第二语音样本的情感类型。
113.请参见图4，本申请实施例的数据处理设备1可以还包括：样本标记单元16；
114.样本标记单元16，用于对目标语言类型的第一语音样本进行情感类型的标记，将标记后的第一语音样本存储至训练语音集合；
115.将非目标语言类型的第二语音样本存储至目标语音集合。
116.样本获取单元11具体用于：
117.从训练语音集合中获取第一语音样本，检测第一语音样本的第一语言类型，确定与第一语言类型不相同的第二语言类型；
118.从目标语音集合中获取具有第二语言类型的语音样本，作为第二语音样本。
119.低维特征获取单元12具体用于：
120.提取第一语音样本中的第一特征参数和第二语音样本中的第二特征参数；
121.采用主成分分析法对第一特征参数进行降维生成第一特征参数对应的第一低维特征，以及第一低维特征对应的第一低维空间；
122.采用主成分分析法对第二特征参数进行降维生成第二特征参数对应的第二低维特征，以及第二低维特征对应的第二低维空间。
123.请参见图4，本申请实施例的第一映射特征获取单元14可以包括：转换函数获取子单元141，特征获取子单元142；
124.转换函数获取子单元141，用于获取第二低维特征对应的第二低维空间与第一低维特征对应的第一低维空间之间的转换函数；转换函数用于使第二低维空间中的第二低维特征与第二低维特征在第一低维空间中的第二映射特征之间的差异性最小；
125.特征获取子单元142，用于根据转换函数生成第一低维特征在第二低维空间对应的第一映射特征。
126.转换函数获取子单元141具体用于：
127.将第二映射特征输入初始映射模型，获取初始映射模型的输出；初始映射模型的初始参数包括初始转换函数；
128.获取初始映射模型的输出与第二低维特征之间的差值，根据差值调整初始映射模型中的初始转换函数；
129.当差值小于阈值时，将调整后的初始转换函数确定为第二低维特征对应的第二低维空间与第一低维特征对应的第一低维空间之间的转换函数。
130.请参见图4，本申请实施例的数据处理设备1可以还包括：情感类型预测单元17；
131.情感类型预测单元17，用于获得语言类型与第二语音样本的语言类型相同的待识别语音；
132.采用主成分分析法获得待识别语音的低维特征；
133.将待识别语音的低维特征输入情感识别模型，以得到情感识别模型输出的待识别语音的情感类型。
134.在本申请实施例中，通过从训练语音集合中获取第一语音样本，从目标语音集合中获取第二语音样本；采用主成分分析法获取第一语音样本对应的第一低维特征和第二语音样本对应的第二低维特征；将第二低维特征映射至第一低维特征对应的第一低维空间，生成第二低维特征在第一低维空间的第二映射特征；根据第二映射特征和第二低维特征生成第一低维特征在第二低维空间对应的第一映射特征；根据第一映射特征生成情感识别模型，采用情感识别模型预测与第二语音样本的语言类型相同的待识别语音的情感类型。在对不同语言种类进行语音情感分类时，避免了重新标注语音情感样本的问题，同时，情感识别模型不涉及超参数的设置，避免了设置超参数容易导致网络不收敛的问题，因此，采用本方案中的方法，节省了资源和开发成本，提高了语音情感分类的准确率。
135.请参见图5，为本申请实施例提供了一种计算机设备的结构示意图。如图5所示，计算机设备1000可以包括：至少一个处理器1001，例如cpu，至少一个网络接口1004，用户接口1003，存储器1005，至少一个通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。其中，用户接口1003可以包括显示屏(display)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如
wi
‑
fi接口)。存储器1005可以是随机存取存储器(random access memory，ram)，也可以是非易失性存储器(non
‑
volatile memory，nvm)，例如至少一个磁盘存储器。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图5所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及数据处理应用程序。
136.在图5所示的计算机设备1000中，网络接口1004可提供网络通讯功能，用户接口1003主要用于为用户提供输入的接口；而处理器1001可以用于调用存储器1005中存储的数据处理应用程序，以实现上述图2
‑
图3任一个所对应实施例中对数据处理方法的描述，在此不再赘述。
137.应当理解，本申请实施例中所描述的计算机设备1000可执行前文图2
‑
图3任一个所对应实施例中对数据处理方法的描述，也可执行前文图4所对应实施例中对数据处理设备的描述，在此不再赘述。另外，对采用相同方法的有益效果描述，也不再进行赘述。
138.此外，这里需要指出的是：本申请实施例还提供了一种计算机可读存储介质，且计算机可读存储介质中存储有前文提及的数据处理设备所执行的计算机程序，且计算机程序包括程序指令，当处理器执行程序指令时，能够执行前文图2
‑
图3任一个所对应实施例中对数据处理方法的描述，因此，这里将不再进行赘述。另外，对采用相同方法的有益效果描述，也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节，请参照本申请方法实施例的描述。作为示例，程序指令可被部署为在一个计算设备上执行，或者在位于一个地点的多个计算设备上执行，又或者，在分布在多个地点且通过通信网络互连的多个计算设备上执行，分布在多个地点且通过通信网络互连的多个计算设备可以组成区块链系统。
139.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，存储介质可为磁碟、光盘、nvm或ram等。
140.以上所揭露的仅为本申请较佳实施例而已，当然不能以此来限定本申请之权利范围，因此依本申请权利要求所作的等同变化，仍属本申请所涵盖的范围。

再多了解一些

1/3 1 2 3 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

一种数据处理方法以及设备与流程

相关文章

最热文献