一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种具有宽广时域感受野的高仿真语音合成技术方案的制作方法

2021-07-30 17:59:00 来源:中国专利 TAG:
一种具有宽广时域感受野的高仿真语音合成技术方案的制作方法
本发明涉及计算机语音合成领域,具体涉及到一种具有宽广时域感受野的高仿真语音合成技术方案。
背景技术
:在语音合成领域中,基于时间序列的样本自回归技术能够合成高仿真度的自然语音。文献1“wavenet:agenerativemodelforrawaudio,arxiv:1609.03499v2”公开了一种基于样本自回归技术的语音合成技术wavenet。wavenet通过使用基于条件概率的生成模型,利用当前时间点之前的样本进行自回归运算,从而得到当前时间点的样本。针对大时长语音和高采样频率引发的语音样本数量巨大和自回归模型复杂的问题,wavenet采用扩大的因果卷积层技术不仅降低了回归模型的复杂度,还能在卷积层层数固定的情况下,以2的指数形式的增长增加回归模型在时域上的感受野,从而实现了合成高仿真度的自然语音。wavenet在真人语音生成上取得了比共振峰合成方法和参数合成方法更好的效果。文献1公开的方法虽然利用扩大的因果卷积层增加了回归模型的感受野,但是该方法在因果卷积层的层数数目偏小的条件下,时域感受野增加的程度仍然不能够满足高仿真度语音合成的需要。技术实现要素:本发明提供了一种具有宽广时域感受野的高仿真语音合成技术方案,包括下述步骤:(a)确定扩大的因果卷积层的层数l;(b)根据公式(1),确定扩大的因果卷积层每一层的局部感受野si:si=l 2-ii=1,2,3,……,l(1)其中i代表第i层扩大的因果卷积层,si为第i层扩大的因果卷积层对应的局部时域感受野的数目,本步骤的主要作用是:随着扩大的因果卷积层从第l层到第1层,扩大的因果卷积层对应的局部时域感受野是线性增加的,从而导致最终扩大的因果卷积层的整体时域感受野进一步扩大,从而处理高频率采样导致的超大样本数目的情况;(c)根据公式(2),使用μ法则压扩变换对扩大的因果卷积层软概率输出层的值进行转换:其中xt为t时刻的声音样本,fs(xt)为采用μ法则压扩变换后的概率值。sign函数为符号函数,ln函数为自然对数函数,|xt|为xt的绝对值,μ为μ法则压扩变换的参数,μ等于255;(d)采用公式(3)所列出的门激活单元对(c)步骤中的结果进行激活后输出。z=tanh(wf,i*x)·σ(wg,i*x)(3)其中z为激活后的输出,tanh函数为双曲正切函数,i代表第i层扩大的因果卷积层,f为过滤器,g为门函数,wf,i为第i层可学习的卷积过滤器,wg,i为第i层与门相关的卷积过滤器,*为卷积操作,·为点积操作,σ为sigmoid函数,x为输入信息;(e)使用残差技术和跳跃连接技术对(d)步骤的输出进行操作后输出至输出层。本发明的有益效果是:采用本发明的技术,在相同的扩大的因果卷积层的层数下,在第l层,本发明的扩大的因果卷积层的整体时域感受野比文献1中的扩大的因果卷积层的整体时域感受野多个,因此更适合处理语音信号高频率采样导致的大样本量的情况。其中l为扩大的因果卷积层的层数,i代表第i层扩大的因果卷积层。附图说明附图1为本发明的流程图。具体实施方式以下将结合具体实施例对本发明进行详细说明,实施案例所需材料:16位音频文件(wave格式)、tensorflow、wavenet源代码(该代码已公开)实施案例所需音频文件预处理:16位原始音频文件总时长1s,以40khz的频率取样,,共生成40000个样本点,并将样本点数据导入wavenet。实施步骤:(a)在tensorflow中的wavenet中设定扩大的因果卷积层的层数l为4。(b)在wavenet中修改扩大的因果卷积层的局部时域感受野的设置,将扩大的因果卷积层每一层的局部时域感受野设置为:s1=5,s2=4,s3=3,s4=2。(c)使用μ法则压扩变换对软概率输出层的值进行转换,由于16位的声音文件采样点有65536种采样结果,经过μ法则压扩变换后,65536个采样值会转换成256个值。(d)采用门激活单元对(c)步骤中的输出结果进行激活后输出,门激活单元中的双曲正切函数部分将输入改变成在-1到1之间的输出,该输出与sigmoid函数相乘后会改变波形的幅值,最终的输出仍然会处于-1到1之间。(e)使用残差技术叠加扩大的因果卷积层的底层和它上层的输出,用来防止梯度信息在深层次网络中的消失。最后采用跳跃连接将底层输出叠加到输出层增加模型的收敛性。采用本发明提出的方法实施产生的扩大的因果卷积层总体感受野的数目与文献1中的方法实施产生的扩大的因果卷积总体感受野的数目对比如表1所示。表1第一层第二层第三层第四层本发明中的方法52060120文献1中方法24816最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。当前第1页12
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜