技术特征:
1.一种用于英语语音的信息采集方法,其特征在于,该信息采集方法包括以下步骤:
s1、采集音频信号并放大;
s2、将放大后的音频信号进行模拟滤波;
s3、将模拟滤波后的信号转换为数字信号并提取数字音频信号的音频特征参数:起音时间、频谱质心、频谱通量、基音频率、尖锐度等;
s4、将上述音频特征参数与标准音源数据库中的音源模型匹配,然后将数字音频信号与音源模型中的音节、音位匹配得出匹配度,根据匹配度差距大小进行音素纠正;
s5、将纠正后的音素组合进数字音频信号;
s6、对合成后的数字音频信号进行模糊滤波,并输出音频信号。
2.根据权利要求1所述的一种用于英语语音的信息采集方法,其特征在于:所述s4中的标准音源数据库中的音源模型有多个不同类型的。
3.根据权利要求1和2所述的一种用于英语语音的信息采集方法,其特征在于:所述s4中的匹配度计算方法具体如下:采用皮尔森相关系数的方式来计算匹配度,起音时间、频谱质心、频谱通量、基音频率、尖锐度等多个特征参数作为向量。
4.根据权利要求1所述的一种用于英语语音的信息采集方法,其特征在于:所述s6中的模糊滤波实现方式为:结合工作在时域的相位模糊滤波器,根据未纠正音素与音源模型中的差值对纠正后的音素进行能量平滑处理。
5.根据权利要求4所述的一种用于英语语音的信息采集方法,其特征在于:计算所述向量的相关系数,所述相关系数作为匹配度。
技术总结
本发明公开了一种用于英语语音的信息采集方法,该信息采集方法包括以下步骤:S1、采集音频信号并放大;S2、将放大后的音频信号进行模拟滤波;S3、将模拟滤波后的信号转换为数字信号并提取数字音频信号的音频特征参数:起音时间、频谱质心、频谱通量、基音频率、尖锐度等;S4、将上述音频特征参数与标准音源数据库中的音源模型匹配,然后将数字音频信号与音源模型中的音节、音位匹配得出匹配度,根据匹配度差距大小进行音素纠正;S5、将纠正后的音素组合进数字音频信号;S6、对合成后的数字音频信号进行模糊滤波,并输出音频信号。
技术研发人员:张敏;李琦;丁桂芝;牛明敏;王晓靖;李静
受保护的技术使用者:郑州铁路职业技术学院
技术研发日:2021.03.01
技术公布日:2021.06.15
再多了解一些
本文用于企业家、创业者技术爱好者查询,结果仅供参考。