语音识别方法、装置和电子设备与流程

2021-09-08 00:42:00 来源：中国专利 TAG：电子设备介质计算机信息装置可读

技术特征：
1.一种语音识别方法，其特征在于，包括：接收用户语音并生成语音信号；对所述语音信号中的音素进行分析，得到第一文本序列；识别所述第一文本序列中的多个词语，并生成所述多个词语的特征向量；根据所述多个词语的特征向量，计算多头注意力值，所述多头注意力值反映了所述多个词语中每个词语与其上下文词语之间的相关性；根据所述多头注意力值，生成第二文本序列，作为对所述用户语音的识别结果。2.根据权利要求1所述的方法，其特征在于，所述多个词语的特征向量包括语义特征向量、片段特征向量和位置特征向量，所述语义特征向量用于反映所述多个词语本身的语义，所述片段特征向量用于指示所述多个词语所在的句子，所述位置特征向量用于表示所述多个词语在所述句子中的位置。3.根据权利要求1所述的方法，其特征在于，所述根据所述多头注意力值，生成第二文本序列，包括：从所述第一文本序列中选择目标词，根据所述目标词的上下文词语在预测所述目标词的位置的词语，根据预测结果生成所述第二文本序列。4.根据权利要求1所述的方法，其特征在于，所述根据所述多头注意力值，生成第二文本序列，包括：判断所述第一文本序列中的第一句子是否为第二句子的下一句，根据判断结果生成所述第二文本序列。5.根据权利要求1所述的方法，其特征在于，所述识别所述第一文本序列中的多个词语，包括：获取用户的身份特征，根据所述身份特征识别所述多个词语，所述多个词语中包括至少一个与所述身份特征匹配的词语。6.根据权利要求1所述的方法，其特征在于，所述识别所述第一文本序列中的多个词语，包括：获取用户所在的业务场景，根据所述业务场景识别所述多个词语，所述多个词语中包括至少一个与所述业务场景匹配的词语。7.一种语音识别装置，其特征在于，包括：语音信号生成模块，接收用户语音并生成语音信号；第一文本分析模块，对所述语音信号中的音素进行分析，得到第一文本序列；特征向量生成模块，识别所述第一文本序列中的多个词语，并生成所述多个词语的特征向量；多头注意力计算模块，根据所述多个词语的特征向量，计算多头注意力值，所述多头注意力值反映了所述多个词语中每个词语与其上下文词语之间的相关性；第二文本分析模块，根据所述多头注意力值，生成第二文本序列，作为对所述用户语音的识别结果。8.根据权利要求7所述的装置，其特征在于，所述多个词语的特征向量包括语义特征向量、片段特征向量和位置特征向量，所述语义特征向量用于反映所述多个词语本身的语义，所述片段特征向量用于指示所述多个词语所在的句子，所述位置特征向量用于表示所述多
个词语在所述句子中的位置。9.一种电子设备，包括：处理器；以及存储计算机可执行指令的存储器，所述计算机可执行指令在被执行时使所述处理器执行根据权利要求1
‑
6中任一项所述的方法。10.一种计算机可读存储介质，其中，所述计算机可读存储介质存储一个或多个程序，当所述一个或多个程序被处理器执行时，实现权利要求1
‑
6中任一项所述的方法。

技术总结
本发明公开了一种语音识别方法、装置和电子设备，该方法包括：接收用户语音并生成语音信号；对语音信号中的音素进行分析，得到第一文本序列；识别对第一文本序列中的多个词语，并生成多个词语的特征向量；根据多个词语的特征向量，计算多头注意力值，多头注意力值反映了多个词语中每个词语与其上下文词语之间的相关性；根据多头注意力值，生成第二文本序列，作为对用户语音的识别结果。根据本发明，实现了对第一文本序列中每个词的特征的并行提取，提升了文本识别效率，更容易判断每个词的动态表征，确保文本识别的准确性。确保文本识别的准确性。确保文本识别的准确性。

技术研发人员：郑渊中燕鹏举张家兴
受保护的技术使用者：上海淇玥信息技术有限公司
技术研发日：2021.07.02
技术公布日：2021/9/7

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种防尘可升降的电钢琴架的制作方法

语音识别方法、装置和电子设备与流程

相关文章

最热文献