一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于滤波器组频率区分的深度网络波形合成方法及装置

2022-08-11 03:58:50 来源:中国专利 TAG:

技术特征:
1.一种基于滤波器组频率区分的深度网络波形合成方法,其特征在于,所述方法包括:采用解析方法设计多个任意频率通带的滤波器组;将生成器输出的语音信号并行馈入到滤波器组中,获得多个窄频带的信号;将窄频带的信号分别输入到各个子鉴别器中进行处理,综合子鉴别器的损失函数对生成对抗网络的参数进行训练,将测试文本馈入到给定的声学模型前端网络中,生成测试梅尔谱,再将该测试梅尔谱输入到生成器中,生成语音信号。2.根据权利要求1所述的一种基于滤波器组频率区分的深度网络波形合成方法,其特征在于,所述生成对抗网络包括:生成器网络和鉴别器网络,其中,所述生成器网络包括:转置卷积模块和多感受野融合模块;所述鉴别器网络由若干子鉴别器组成,每个子鉴别器对输入语音波形的某一任意指定的窄频段内的信号进行处理。3.根据权利要求1所述的一种基于滤波器组频率区分的深度网络波形合成方法,其特征在于,所述综合子鉴别器的损失函数对生成对抗网络的参数进行训练具体为:1)随机初始化生成器网络g(θ)与鉴别器网络d(φ)的网络参数;2)从训练集中采集m条语音样本,{x
(m)
},1≤m≤m;训练梅尔谱数据集中选出与这m条语音样本对应的梅尔谱样本,{s
(m)
},1≤m≤m;3)将{s
(m)
},1≤m≤m输入到生成器中,得到生成语音{y
(m)
},1≤m≤m,y
(m)
=g(s
(m)
);4)将x
(m)
与y
(m)
依次输入到k个长度为2n-1的解析窄带滤波器g1(n),....,g
k
(n)中,其中,k=1...k,p、q分别为用于控制滤波器g
k
(n)的通带起始频点和带宽的整数参数,w
c
(n)为卷积窗,将x
(m)
与y
(m)
各自分为k个窄频段信号,再将窄频段信号分别输入对应的子鉴别器中,根据非消失梯度的迭代策略来最小化鉴别器损失函数l
d
,更新鉴别器网络d(φ);5)从训练梅尔谱数据集中采集m条样本,6)将m条样本输入到生成器中,经过转置卷积使输出序列的长度与原始波形x的时间分辨率相匹配;将序列输入到多感受野融合模块中,并行观察各种不同序列长度的模式,输出多个残差模块的总和,作为生成语音进而根据非消失梯度的迭代策略来最小化生成器损失函数l
g
,更新生成器网络g(θ)。4.一种基于滤波器组频率区分的深度网络波形合成装置,其特征在于,所述装置包括:所述装置包括:处理器和存储器,所述存储器中存储有程序指令,所述处理器调用存储器中存储的程序指令以使装置执行权利要求1-3中的任一项所述的方法步骤。

技术总结
本发明公开了一种基于滤波器组频率区分的深度网络波形合成方法及装置,方法包括:采用解析方法设计多个任意频率通带的滤波器组;将生成器输出的语音信号并行馈入到滤波器组中,获得多个窄频带的信号;将窄频带的信号分别输入到各个子鉴别器中进行处理,综合子鉴别器的损失函数对生成对抗网络的参数进行训练,将测试文本馈入到给定的声学模型前端网络中,生成测试梅尔谱,再将该测试梅尔谱输入到生成器中,生成语音信号。装置包括:处理器和存储器。本发明提出的语音波形合成GAN网络解决了高频部分混叠失效的问题,大大减轻了高频频段的频谱失真。的频谱失真。的频谱失真。


技术研发人员:黄翔东 王俊芹 甘霖 王文俊
受保护的技术使用者:天津大学
技术研发日:2022.04.13
技术公布日:2022/8/9
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献