一种多语种语音翻译方法及系统

2022-06-01 01:29:48 来源：中国专利 TAG：

技术特征：
1.一种多语种语音翻译方法，其特征在于，包括以下步骤：步骤1、获取源语音音频和目标语种类别；步骤2、对源语音音频进行音频预处理，得到预处理后的源语音音频；步骤3、对于预处理后的源语音音频，进行语种识别，得到待翻译的源语种类别；步骤4、依据源语种类别，采用对应的语音识别模型，将预处理后的源语音音频转换成源语音文本；步骤5、将源语音文本输入文本翻译模型中，得到目标语种文本。2.根据权利要求1所述的一种多语种语音翻译方法，其特征在于，所述步骤2中，所述预处理包括语音增强和噪声过滤。3.根据权利要求1所述的一种多语种语音翻译方法，其特征在于，所述步骤3中，进行语种识别的具体过程为：步骤3.1、对于待识别的语音音频，进行特征提取，得到多个音频特征；步骤3.2、基于神经网络的注意力机制，选出主要音频特征；步骤3.3、基于所述主要音频特征，确定语种识别结果。4.根据权利要求3所述的一种多语种语音翻译方法，其特征在于，所述步骤3.1中，进行特征提取的具体过程为：对待识别的语音音频进行分段，对于每段语音音频，提取其zcpa特征作为音频特征。5.根据权利要求3所述的一种多语种语音翻译方法，其特征在于，所述步骤3.3中，需调用预设的语种特征库，根据音频特征，确定语种识别结果。6.根据权利要求1所述的一种多语种语音翻译方法，其特征在于，所述步骤4中，预设有多个语音识别模型，用于对不同语种的语音音频进行语音识别。7.根据权利要求6所述的一种多语种语音翻译方法，其特征在于，所述步骤4中，对语音识别模型进行训练的方法为：使用网络爬虫获取不同语种的训练数据，所述训练数据中至少包括语音音频和对应的语音文本；使用对应语种的训练数据，训练对应的神经网络模型，得到多个语音识别模型。8.根据权利要求1所述的一种多语种语音翻译方法，其特征在于，所述步骤5中，进行文本翻译的过程为：调取目标语种类别的词向量库和语法规则库；将源语音文本输入文本翻译模型中，依据对应的词向量库和语法规则库，进行词向量整合，得到目标语种文本。9.一种多语种语音翻译系统，其特征在于，包括语音采集装置、交互装置、存储器和处理器、文本显示装置；所述处理器分别与语音采集装置、交互装置、存储器、文本显示装置连接；所述语音采集装置用于采集源语音音频；所述交互装置用于获取目标语种类别；所述处理器内存储有计算机程序，用于对源语音音频进行处理，得到目标语种文本；所述处理器执行所述计算机程序时实现如权利要求1-8任一所述的一种多语种语音翻译方法；
所述存储器，包含有多个数据库；所述文本显示装置用于显示目标语种文本。10.根据权利要求9所述的一种多语种语音翻译系统，其特征在于，所述交互装置和文本显示装置集成于一体，通过显示屏的方式进行交互和文本显示。

技术总结
本发明公开了一种多语种语音翻译方法及系统，涉及语音翻译技术领域，首先获取源语音音频和目标语种类别；对源语音音频进行音频预处理，得到预处理后的源语音音频；对于预处理后的源语音音频，进行语种识别，得到待翻译的源语种类别；依据源语种类别，采用对应的语音识别模型，将预处理后的源语音音频转换成源语音文本；将源语音文本输入文本翻译模型中，得到目标语种文本。本发明能够克服源语音的噪声影响，提高模型识别的准确率，并且能够对多种不同的语言类型进行准确的识别和翻译，提高用户的使用体验感。户的使用体验感。户的使用体验感。

技术研发人员：陈倩
受保护的技术使用者：郑州科技学院
技术研发日：2022.03.02
技术公布日：2022/5/30

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：音频增强方法和装置、计算机存储介质与流程

一种多语种语音翻译方法及系统

相关文献

最热文献