一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种多语种语音翻译方法及系统

2022-06-01 01:29:48 来源:中国专利 TAG:

技术特征:
1.一种多语种语音翻译方法,其特征在于,包括以下步骤:步骤1、获取源语音音频和目标语种类别;步骤2、对源语音音频进行音频预处理,得到预处理后的源语音音频;步骤3、对于预处理后的源语音音频,进行语种识别,得到待翻译的源语种类别;步骤4、依据源语种类别,采用对应的语音识别模型,将预处理后的源语音音频转换成源语音文本;步骤5、将源语音文本输入文本翻译模型中,得到目标语种文本。2.根据权利要求1所述的一种多语种语音翻译方法,其特征在于,所述步骤2中,所述预处理包括语音增强和噪声过滤。3.根据权利要求1所述的一种多语种语音翻译方法,其特征在于,所述步骤3中,进行语种识别的具体过程为:步骤3.1、对于待识别的语音音频,进行特征提取,得到多个音频特征;步骤3.2、基于神经网络的注意力机制,选出主要音频特征;步骤3.3、基于所述主要音频特征,确定语种识别结果。4.根据权利要求3所述的一种多语种语音翻译方法,其特征在于,所述步骤3.1中,进行特征提取的具体过程为:对待识别的语音音频进行分段,对于每段语音音频,提取其zcpa特征作为音频特征。5.根据权利要求3所述的一种多语种语音翻译方法,其特征在于,所述步骤3.3中,需调用预设的语种特征库,根据音频特征,确定语种识别结果。6.根据权利要求1所述的一种多语种语音翻译方法,其特征在于,所述步骤4中,预设有多个语音识别模型,用于对不同语种的语音音频进行语音识别。7.根据权利要求6所述的一种多语种语音翻译方法,其特征在于,所述步骤4中,对语音识别模型进行训练的方法为:使用网络爬虫获取不同语种的训练数据,所述训练数据中至少包括语音音频和对应的语音文本;使用对应语种的训练数据,训练对应的神经网络模型,得到多个语音识别模型。8.根据权利要求1所述的一种多语种语音翻译方法,其特征在于,所述步骤5中,进行文本翻译的过程为:调取目标语种类别的词向量库和语法规则库;将源语音文本输入文本翻译模型中,依据对应的词向量库和语法规则库,进行词向量整合,得到目标语种文本。9.一种多语种语音翻译系统,其特征在于,包括语音采集装置、交互装置、存储器和处理器、文本显示装置;所述处理器分别与语音采集装置、交互装置、存储器、文本显示装置连接;所述语音采集装置用于采集源语音音频;所述交互装置用于获取目标语种类别;所述处理器内存储有计算机程序,用于对源语音音频进行处理,得到目标语种文本;所述处理器执行所述计算机程序时实现如权利要求1-8任一所述的一种多语种语音翻译方法;
所述存储器,包含有多个数据库;所述文本显示装置用于显示目标语种文本。10.根据权利要求9所述的一种多语种语音翻译系统,其特征在于,所述交互装置和文本显示装置集成于一体,通过显示屏的方式进行交互和文本显示。

技术总结
本发明公开了一种多语种语音翻译方法及系统,涉及语音翻译技术领域,首先获取源语音音频和目标语种类别;对源语音音频进行音频预处理,得到预处理后的源语音音频;对于预处理后的源语音音频,进行语种识别,得到待翻译的源语种类别;依据源语种类别,采用对应的语音识别模型,将预处理后的源语音音频转换成源语音文本;将源语音文本输入文本翻译模型中,得到目标语种文本。本发明能够克服源语音的噪声影响,提高模型识别的准确率,并且能够对多种不同的语言类型进行准确的识别和翻译,提高用户的使用体验感。户的使用体验感。户的使用体验感。


技术研发人员:陈倩
受保护的技术使用者:郑州科技学院
技术研发日:2022.03.02
技术公布日:2022/5/30
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献