语音翻译方法、装置、设备及存储介质与流程

2021-10-24 09:30:00 来源：中国专利 TAG：人工智能但不限于语音装置

技术特征：
1.一种语音翻译方法，包括：获取源语音信号，识别所述源语音信号中的实义要素；顺序积累至少一个所述实义要素形成判断单元；基于bert分类模型，计算所述判断单元在预设分类结果条件下的概率值；若所述概率值大于第一阈值，则所述判断单元为实义单元；对所述实义单元进行分段，形成目标词段；基于transformer翻译模型，对所述目标词段进行翻译并输出。2.根据权利要求1所述的语音翻译方法，其特征在于，所述基于bert分类模型，计算所述判断单元在确定分类结果条件下的概率值，包括：顺序积累未进入所述判断单元的所述实义要素，形成预备单元，其中，预备单元包括至少一个实义要素；基于bert分类模型，输入所述判断单元与所述预备单元，计算所述判断单元在分类结果为实义单元条件下的概率值。3.根据权利要求1所述的语音翻译方法，其特征在于，所述对所述实义单元进行分段，形成目标词段，包括：获取当前所述实义单元中每个实义要素的注意力值，并判断所述注意力值最大的实义要素所出现的位置，其中，所述注意力值通过注意力机制模型获得；若所述注意力值最大的实义要素出现在所述实义单元的预设位置，则对所述实义单元进行分段，形成目标词段。4.根据权利要求1所述的语音翻译方法，其特征在于，所述对所述实义单元进行分段，形成目标词段，包括：获取当前所述实义单元中每个实义要素的注意力值，并判断所述注意力值最大的实义要素所出现的位置，其中，所述注意力值通过注意力机制模型获得；若所述注意力值最大的实义要素出现在当前所述实义单元的非预设位置，则对当前所述实义单元进行扩展；获取扩展后的实义单元中每个所述实义要素的注意力值，并判断注意力值最大的所述单词所出现的位置，直至所述注意力值最大的实义要素出现在所述实义单元的预设位置，停止扩展；对最终扩展组成的实义单元进行分段，形成目标词段。5.根据权利要求1所述的语音翻译方法，其特征在于，基于bleu模型计算目标词段翻译的准确程度，若所述准确程度小于第二预设阈值，则扩展所述实义单元，包括：基于当前的所述实义单元，顺序增加所述实义要素，直至形成新的实义单元。6.根据权利要求1
‑
5任一项所述的语音翻译方法，其特征在于，所述实义要素至少为以下之一：单字、字符、单词、短语、成语。7.一种语音翻译装置，其特征在于，包括：语音识别模块，用于获取源语音信号，识别源语音信号中的实义要素；实义单元获取模块，用于顺序积累至少一个所述实义要素形成判断单元，基于bert分类模型，计算所述判断单元在预设分类结果条件下的概率值，并选取概率值大于第一阈值的判断单元作为实义单元；
分段模块，用于对所述实义单元进行分段，形成目标词段；翻译模块，用于接收目标词段，翻译并输出。8.根据权利要求7所述的语音翻译装置，其特征在于，还包括：注意力识别模块，用于获取所述实义单元中每个所述实义要素的注意力值，并判断所述注意力值最大的实义要素所出现的位置。9.一种电子设备，所述设备包括处理器、存储器，以及一个或多个程序，所述一个或多个程序被存储在所述存储器中，并且被配置由所述处理器执行，所述程序包括用于执行如权利要求1
‑
6任一项所述的语音翻译方法。10.一种计算机可读存储介质，其特征在于，存储有处理器可运行的程序指令，所述程序指令用于执行如权利要求1
‑
6任一项所述的语音翻译方法。

技术总结
本申请实施例提供了一种语音翻译方法、装置、设备及存储介。本方法通过对输入的语音信号，进行识别判断，积累至少一个所述实义要素形成判断单元，基于BERT分类模型和判断单元得到实义单元，再对所述实义单元进行分段，形成目标词段；最后基于Transformer翻译模型，对所述目标词段进行翻译并输出。采用本方案大大缩短了需翻译句子的长度，避免长句中语义以及语句成份复杂带来的翻译问题，提升了翻译的准确度；同时，语音的输入、目标词段的形成以及翻译可以同步进行，提高了翻译速度。提高了翻译速度。提高了翻译速度。

技术研发人员：于凤英王健宗
受保护的技术使用者：平安科技（深圳）有限公司
技术研发日：2021.06.30
技术公布日：2021/10/23

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：许可证号的验证方法、系统、计算机设备及存储介质与流程

语音翻译方法、装置、设备及存储介质与流程

相关文献

最热文献