一种语音特征提取方法、装置、设备及存储介质与流程

2021-09-04 03:04:00 来源：中国专利 TAG：人工智能提取语音装置特征

技术特征：
1.一种语音特征提取方法，其特征在于，所述方法包括：获取样本语音信号，所述样本语音信号中包括多个采样点采集到的未标注的语音信号；将所述样本语音信号输入预设的卷积神经网络中，得到与所述样本语音信号中多个采样点采集到的语音信号对应的语音特征集；对所述样本语音信号对应的语音特征集进行拆分处理，得到第一语音特征集和第二语音特征集；将第一语音特征集中的各个语音特征输入第一gru网络模型，得到所述第一语音特征集中的所有语音特征对应的第一特征向量；将所述第一特征向量和所述第二语音特征集中的各个语音特征输入第二gru网络模型中进行训练，得到语音特征预测模型。2.根据权利要求1所述的方法，其特征在于，所述对所述样本语音信号对应的语音特征集进行拆分处理，得到第一语音特征集和第二语音特征集，包括：根据预设规则确定所述样本语音信号对应的语音特征集的拆分点；根据所述拆分点对所述语音特征集进行拆分处理，得到所述第一语音特征集和第二语音特征集。3.根据权利要求2所述的方法，其特征在于，所述根据预设规则确定所述样本语音信号对应的语音特征集的拆分点，包括：确定所述样本语音信号对应的语音特征集中所有语音特征的总帧数；根据所述预设规则确定拆分区域，并在所述拆分区域中随机选取所述拆分点，所述预设规则为所述第二语音特征集对应的语音特征的帧数大于预设帧数阈值。4.根据权利要求1所述的方法，其特征在于，所述将所述第一特征向量和所述第二语音特征集中的各个语音特征输入第二gru网络模型中进行训练，得到语音特征预测模型，包括：将所述第一特征向量和所述第二语音特征集中的各个语音特征输入第二gru网络模型中，计算得到所述第一特征向量与所述第二语音特征集中的所有语音特征之间的互信息；通过最大化所述互信息训练所述第二gur网络模型得到所述语音特征预测模型。5.根据权利要求4所述的方法，其特征在于，所述将所述第一特征向量和所述第二语音特征集中的各个语音特征输入第二gru网络模型中，计算得到所述第一特征向量与所述第二语音特征集中的所有语音特征之间的互信息，包括：将所述第一特征向量和所述第二语音特征集中的第一语音特征输入所述第二gru网络模型中，得到第二特征向量；将所述第二特征向量和所述第二语音特征集中的第二语音特征输入所述第二gru网络模型中，得到所述第二特征向量和所述第二语音特征之间的互信息。6.根据权利要求4所述的方法，其特征在于，所述将所述第一特征向量和所述第二语音特征集中的各个语音特征输入第二gru网络模型中，计算得到所述第一特征向量与所述第二语音特征集中的所有语音特征之间的互信息，包括：根据预设的降采样系数从所述第二语音特征集中的各个语音特征中选取部分语音特征；
将所述第一特征向量和从所述第二语音特征集中选取的部分语音特征输入所述第二gru网络模型中，计算得到所述第一特征向量与所述第二语音特征集中的所述部分语音特征之间的互信息。7.根据权利要求4所述的方法，其特征在于，所述通过最大化所述互信息训练所述第二gur网络模型得到所述语音特征预测模型，包括：根据所述互信息调整所述第二gur网络模型的模型参数；将所述第一特征向量和所述第二语音特征集中的所有语音特征输入调整模型参数后的第二gru网络模型中，得到新的互信息；当新的互信息满足预设阈值时，确定得到所述语音特征预测模型。8.一种语音特征提取装置，其特征在于，包括：获取单元，用于获取样本语音信号，所述样本语音信号中包括多个采样点采集到的未标注的语音信号；第一提取单元，用于将所述样本语音信号输入预设的卷积神经网络中，得到与所述样本语音信号中多个采样点采集到的语音信号对应的语音特征集；拆分单元，用于对所述样本语音信号对应的语音特征集进行拆分处理，得到第一语音特征集和第二语音特征集；第二提取单元，用于将第一语音特征集中的各个语音特征输入第一gru网络模型，得到所述第一语音特征集中的所有语音特征对应的第一特征向量；训练单元，用于将所述第一特征向量和所述第二语音特征集中的各个语音特征输入第二gru网络模型中进行训练，得到语音特征预测模型。9.一种计算机设备，其特征在于，包括处理器、输入设备、输出设备和存储器，所述处理器、输入设备、输出设备和存储器相互连接，其中，所述存储器用于存储计算机程序，所述计算机程序包括程序，所述处理器被配置用于调用所述程序，执行如权利要求1
‑
7任一项所述的方法。10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行以实现权利要求1
‑
7任一项所述的方法。

技术总结
本发明实施例涉及人工智能领域，公开了一种语音特征提取方法、装置、设备及存储介质，该方法包括：将未标注的样本语音信号输入预设的卷积神经网络中，得到与样本语音信号中多个采样点采集到的语音信号对应的语音特征集；对语音特征集进行拆分处理，得到第一语音特征集和第二语音特征集；将第一语音特征集中的各个语音特征输入第一GRU网络模型，得到第一特征向量；将第一特征向量和第二语音特征集中的各个语音特征输入第二GRU网络模型中进行训练，得到语音特征预测模型，提高了语音特征提取的准确率，有助于提高语音识别的准确率。本发明涉及区块链技术，如可将语音数据写入区块链中，以用于数据取证等场景。以用于数据取证等场景。以用于数据取证等场景。

技术研发人员：王璐陈雨龙魏韬马骏王少军肖京
受保护的技术使用者：平安科技（深圳）有限公司
技术研发日：2021.05.31
技术公布日：2021/9/3

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：语音识别方法、装置、电子设备及存储介质与流程

一种语音特征提取方法、装置、设备及存储介质与流程

相关文章

最热文献