一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种支持声音克隆的智能车载语音交互系统的制作方法

2021-06-30 00:30:00 来源:中国专利 TAG:交互 语音 克隆 声音 支持

1.本发明涉及语音交互技术领域,特别是涉及一种支持声音克隆的智能车载语音交互系统。


背景技术:

2.近年来,随着我国经济水平和人民生活质量的高速发展,汽车已成为人们日常出行中必不可少的重要交通工具,在日常通勤、假日出游、货物运输等各类场景下发挥着极大作用。车载智能交互系统不仅能提供便捷迅速的驾车辅助服务,更极大提升了驾乘人员的行车体验,使汽车从冰冷的运载工具升级为人性化的情感伙伴。其中,语音交互具有输入更快捷、操作更简化、安全更有保障等突出优势,是天然适应车载环境的智能交互方式,可以提供申请查询、智能导航、音乐播放、执行驾乘操作等多种服务。
3.目前,车载语音交互系统功能十分有限,部分车型通过接入语音控制终端能够实现一些简单操作,但其语音识别能力差、功能简单且稳定性不足、交互过程机械,无法满足日趋智能化、人性化、个性化的交互需求。
4.声音克隆技术能够提取特定说话人的声音特征和逻辑特点,模拟其独特音色和惯用语汇。将声音克隆技术应用于构建车载语音交互系统,能够根据用户喜好提供“千人千声”的定制化服务,在智能解读并稳定执行用户指令的同时,与用户产生情感互动,提升行车体验,加强用户与车辆的羁绊感。


技术实现要素:

5.针对上述问题,本发明实例提供一种支持声音克隆的智能车载语音交互系统,以提高车载语音交互的质量和服务体验。
6.为实现上述目的,本发明实例提供如下技术方案:
7.一种支持声音克隆的智能车载语音交互系统,包括语料采集模块、(文本特征提取模块、语音特征提取模块、)指令接收模块、指令分析模块、指令执行模块、文本回应模块、克隆合成模块、语音输出模块、基础支持模块。
8.语料采集模块:通过外设语音接收器采集用户希望进行克隆的原始目标语料,对所述原始目标语料进行降噪、滤波、音量均衡等预处理,并将预处理后的目标语料输入文本特征提取模块和语音特征提取模块。
9.文本特征提取模块:接收所述语料采集模块输入的所述目标语料,对所述目标语料进行语音识别,得到所述目标语料的文本信息。将所述文本信息转换为文本特征向量,形成所述文本信息的特征向量空间,储存所述文本特征向量空间。
10.语音特征提取模块:接收所述语料采集模块输入的所述目标语料,提取所述目标语料的声学特征(如线性预测编码特征、梅尔频率倒谱系数、声门波等)、韵律特征(语调、时域分布、重音等)、能量特征(短时能量、短时平均幅度等)、音色特征(基音周期和基音频率、共振峰等),形成语音特征向量空间,储存所述语音特征向量空间。
11.指令接收模块:通过外设语音接收器接收用户行车过程中发出的原始语音指令,并进行用户身份验证、用户权限确定、环境声分离等预处理,将预处理后的语音指令输入指令分析模块。
12.指令分析模块:接收所述指令接收模块输入的所述语音指令,智能化分析用户意图,得出相应的指令处理结果,激活并将所述指令处理结果输入指令执行模块和/或文本回应模块。
13.指令执行模块:与汽车控制端口连接。由所述指令分析模块激活后,接收所述指令分析模块输入的所述指令处理结果,根据所述指令处理结果的内容向相应的前述控制端口发出执行命令。
14.文本回应模块:由所述指令分析模块激活后,接收所述指令分析模块输入的所述指令处理结果,调用所述文本特征提取模块储存的文本特征向量空间,智能化生成与克隆对象遣词造句特点相似的回应文本,输入语音合成模块。
15.克隆合成模块:接收所述文本回应模块输入的所述回应文本,调用所述语音特征提取模块储存的语音特征向量空间,以所述语音特征向量空间参数训练语音合成模型(merlin、wavenet、tacotron、clarinet等语音合成模型),生成与克隆对象声音相似的语音频谱图,并将所述语音频谱图输入语音交互模块。
16.语音输出模块:接收所述语音合成模块输入的所述语音频谱图,以声码器(wavernn、griffin

lim声码器等)解码生成语音信号,并通过外设语音播放器给出语音回应,与用户达成智能语音交互。
17.基础支持模块:支持本发明所提出支持声音克隆的智能车载语音交互系统所需的基本功能,如删除、选定、内存清理、版本更新、自检报错等操作。
18.相比于现有技术,本发明的技术效果和优点:本发明提出了一种支持声音克隆的智能车载语音交互系统,不仅能与用户进行实时的语音交互,还可按照用户需求,为语音回应定制特定的声音、习惯用语。因此,本发明实例中的语音交互系统能够快速、便捷地将用户语音指令转变为实际驾乘操作,保障了用户行车安全,更重要的是能提供“千人千声”的智能化、个性化、人性化交互,为车辆应答系统赋予了情感色彩,极大提升用户的驾乘体验,使旅途更加温馨、舒适。
附图说明
19.图1为本发明实例支持声音克隆的智能车载语音交互系统在某具体应用场景中的流程示意图。
具体实施方式
20.为了便于理解和实施本发明实例,下面将结合本发明实例中的附图,对本发明实施例中的技术方案进行清楚、完善的描述。显然,所描述的实例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动成果前提下所获得的所有其他实施例,都属于本发明保护的范围。
21.除非另有定义,本文所使用的所有技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体
的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
22.为了实现上述构建车载语音交互系统,根据用户喜好提供“千人千声”定制化服务,在智能解读并稳定执行用户指令的同时,与用户产生情感互动,提升行车体验的目的,本发明提供了支持声音克隆的智能车载语音交互系统实例1;图1为本发明实现智能语音交互的实施例1的流程示意图;如图1所示,可以包括以下模块和步骤:
23.本专利提供一种支持声音克隆的智能车载语音交互系统,包括语料采集模块、文本特征提取模块、语音特征提取模块、指令接收模块、指令分析模块、指令执行模块、文本回应模块、克隆合成模块、语音输出模块、基础支持模块。
24.语料采集模块:通过车辆或其他环境中的外设语音接收器(如车载麦克风阵列等,不包含在本发明保护范围内)采集用户希望进行克隆的原始目标语料。为保证所述原始目标语料的可用性,所述原始目标语料应在较为安静的环境中录制,不同克隆目标应录制10~50条左右。录制完成后,语料采集模块将自动对所述原始目标语料进行降噪、滤波、音量均衡等预处理,并将预处理后的目标语料输入文本特征提取模块和语音特征提取模块。
25.文本特征提取模块:接收所述语料采集模块输入的所述目标语料,对所述目标语料进行语音识别,得到所述目标语料的文本信息。将所述文本信息转换为文本特征向量,形成并储存所述文本特征向量空间。
26.语音特征提取模块:接收所述语料采集模块输入的所述目标语料,提取所述目标语料的声学特征(如线性预测编码特征、梅尔频率倒谱系数、声门波等)、韵律特征(语调、时域分布、重音等)、能量特征(短时能量、短时平均幅度等)、音色特征(基音周期和基音频率、共振峰等),形成并储存语音特征向量空间。
27.指令接收模块:通过外设语音接收器接收用户行车过程中发出的原始语音指令,并进行用户身份验证、用户权限确定、环境声分离等预处理,将预处理后的语音指令输入指令分析模块。如非权限用户指令“打开车窗”,则不予理会。
28.指令分析模块:接收所述指令接收模块输入的所述语音指令,智能化分析用户意图,得出相应的指令处理结果,激活并将所述指令处理结果输入指令执行模块和/或文本回应模块。如权限用户指令“打开车窗”,则激活指令执行模块,向其中发送开启车窗命令;并同时激活文本回应模块,向其中输入处理结果“要求打开车窗”。
29.指令执行模块:与汽车其他控制端口连接。由所述指令分析模块激活后,接收所述指令分析模块输入的所述指令处理结果,根据所述指令处理结果的内容向相应的前述控制端口发出执行指令的命令。如处理结果指令“打开车窗”,连接车窗控制模块,自动降下车窗。
30.文本回应模块:由所述指令分析模块激活后,接收所述指令分析模块输入的所述指令处理结果,调用所述文本特征提取模块储存的文本特征向量空间,智能化生成与克隆对象遣词造句特点相似的回应文本,输入语音合成模块。如收到处理结果“要求打开车窗”,分析用户意图后,结合所述文本特征向量空间给出的克隆对象用语特点,如常用疑问句、关心体贴等,生成回应文本“已经为您打开车窗了,这个高度合适吗?”31.克隆合成模块:接收所述文本回应模块输入的所述回应文本,调用所述语音特征提取模块储存的语音特征向量空间,以所述语音特征向量空间参数训练语音合成模型
(merlin、wavenet、tacotron、clarinet等语音合成模型),生成与克隆对象声音相似的语音频谱图,并将所述语音频谱图输入语音输出模块。
32.语音输出模块:接收所述语音合成模块输入的所述语音频谱图,以声码器(wavernn、griffin

lim声码器等)解码生成语音信号,并通过外设语音播放器给出语音回应,与用户达成智能语音交互。若回应“已经为您打开车窗了,这个高度合适吗?”后,如用户有其他回复,则继续从指令接收模块开始回应。
33.基础支持模块:支持本发明实例所提出支持声音克隆的智能车载语音交互系统所需的基本功能,如删除、选定、内存清理、版本更新、自检报错等操作。
34.以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并没有因此而理解为对本申请专利范围的限制。应当指出,本发明的各种不同的实施方式之间也可以进行随意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜