车内含噪语音数据生成方法、装置以及设备与流程

2021-09-18 00:43:00 来源：中国专利 TAG：语音车内交互装置生成

技术特征：
1.一种车内含噪语音数据生成方法，其特征在于，包括：预先创建语音素材库，所述语音素材库包含纯人声音频数据以及实车纯噪音音频数据；接收并解析用户输入的数据需求；根据解析后的数据需求，从所述语音素材库中分别匹配出与用户需求对应的纯人声音频数据以及实车纯噪音音频数据；将匹配到的纯人声音频数据以及实车纯噪音音频数据进行混音处理，生成车内含噪语音数据。2.根据权利要求1所述的车内含噪语音数据生成方法，其特征在于，所述预先创建语音素材库包括：预先录制不同的纯人声声源素材，并对各纯人声声源素材标注出人声声源信息，得到纯人声音频数据；预先录制在不同场景下的实车纯噪音素材，并对各实车纯噪音素材标注出场景噪声信息，得到实车纯噪音音频数据。3.根据权利要求2所述的车内含噪语音数据生成方法，其特征在于，所述解析用户输入的数据需求包括：根据用户输入的数据需求、标注人声声源信息的纯人声音频数据、标注场景噪声信息的实车纯噪音音频数据以及预先训练的基于语义分析的预测模型，得到解析后的数据需求。4.根据权利要求2所述的车内含噪语音数据生成方法，其特征在于，所述解析后的数据需求包括如下需求信息：主要说话人的人声特征与实车噪音场景信息，和/或人声声源能量与实车噪音能量的比例关系。5.根据权利要求4所述的车内含噪语音数据生成方法，其特征在于，所述根据解析后的数据需求，从所述语音素材库中分别匹配出对应的纯人声音频数据以及实车纯噪音音频数据包括：基于所述需求信息以及标注出的所述人声声源信息，从所述语音素材库中匹配出最优的纯人声音频数据；基于所述需求信息以及标注出的所述场景噪声信息，从所述语音素材库中匹配出最优的实车纯噪音音频数据。6.根据权利要求1～5任一项所述的车内含噪语音数据生成方法，其特征在于，所述方法还包括：从匹配出的纯人声音频数据中提取当前人声的语音基元；利用所述语音基元以及预设的若干个车用交互文本，合成出批量的纯人声音频数据；将合成的纯人声音频数据逐一与匹配出的实车纯噪音音频数据进行混音处理，得到批量的车内含噪语音数据。7.一种车内含噪语音数据生成装置，其特征在于，包括：语音素材库创建模块，用于预先创建语音素材库，所述语音素材库包含纯人声音频数据以及实车纯噪音音频数据；
数据需求获取模块，用于接收并解析用户输入的数据需求；需求匹配模块，用于根据解析后的数据需求，从所述语音素材库中分别匹配出与用户需求对应的纯人声音频数据以及实车纯噪音音频数据；目标数据生成模块，用于将匹配到的纯人声音频数据以及实车纯噪音音频数据进行混音处理，生成车内含噪语音数据。8.根据权利要求7所述的车内含噪语音数据生成装置，其特征在于，所述装置还包括：语音基元提取模块，用于从匹配出的纯人声音频数据中提取当前人声的语音基元；语音合成模块，用于利用所述语音基元以及预设的若干个车用交互文本，合成出批量的纯人声音频数据；目标数据扩增模块，用于将合成的纯人声音频数据逐一与匹配出的实车纯噪音音频数据进行混音处理，得到批量的车内含噪语音数据。9.一种电子设备，其特征在于，包括：一个或多个处理器、存储器以及一个或多个计算机程序，其中所述一个或多个计算机程序被存储在所述存储器中，所述一个或多个计算机程序包括指令，当所述指令被所述设备执行时，使得所述设备执行权利要求1～6任一项所述的车内含噪语音数据生成方法。10.一种计算机数据存储介质，其特征在于，所述计算机数据存储介质中存储有计算机程序，当所述计算机程序在计算机上运行时，使得计算机执行权利要求1～6任一项所述的车内含噪语音数据生成方法。

技术总结
本发明公开了一种车内含噪语音数据生成方法、装置以及设备，本发明的构思在于预先采集纯实景车噪及纯人声声源以构造出车用语音素材库，该车用语音素材库中的音频资源用于与用户所提需求结合，分别得到符合用户期望的车内含噪语音数据的两个独立元素，纯人声声源以及纯实景车噪，然后将匹配出的纯人声声源以及纯实景车噪进行通道融合，生成用户所需的目标车内含噪语音数据。本发明实现了对语音素材的复用，解决了当前实车实景人工录制方式费时、费力、高成本等弊端，并有效提升了车用交互语音数据样本的制作效率。音数据样本的制作效率。音数据样本的制作效率。

技术研发人员：朱培培邓引引于超敏
受保护的技术使用者：科大讯飞股份有限公司
技术研发日：2021.06.22
技术公布日：2021/9/17

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

车内含噪语音数据生成方法、装置以及设备与流程

相关文章

最热文献