农林渔牧食品/饮料服装/饰品纺织/造纸医疗/保健机械/机床家具/门窗喷涂/染料道路/铁路

摄影/光学乐器/声学照明/工业冶金/铸造安全/消防建筑/工具控制/调节计算,推算其他产品

热搜：真空泵封装包装食品玩具

首页 > 乐器,声学设备的制造及制作,分析技术 > 正文

生成词典与语音识别的方法、装置与流程

2021-08-13 19:22:00 来源：中国专利 TAG：自然语言数据处理电子设备词典语音

技术特征：

1.一种生成词典的方法，包括：

获取英文词典；

根据所述英文词典中各英文单词的发音来切分各英文单词，使得切分各英文单词所得到的词片段的数目等于各英文单词的发音片段的数目；

根据各英文单词的词片段，生成词典。

2.根据权利要求1所述的方法，其中，所述根据各英文单词的词片段，生成词典包括：

根据各词片段的发音，将各词片段进行分类；

在确定与发音对应的分类中包含多个词片段的情况下，使用该发音的发音片段代替所述多个词片段，生成所述词典。

3.根据权利要求1所述的方法，还包括：

在根据各英文单词的词片段生成词典之后，对所述词典中各词片段的标识信息进行标注，所述标识信息与各词片段的发音片段相对应。

4.一种语音识别的方法，包括：

获取输入音频；

在词典中查找与所述输入音频的发音片段对应的目标词片段，根据查找得到的目标词片段生成所述输入音频的识别结果；

其中，所述词典是根据权利要求1-3中任一项方法预先生成的。

5.根据权利要求4所述的方法，其中，所述在词典中查找与所述输入音频的发音片段对应的目标词片段包括：

在所述词典中查找与所述发音片段对应的词片段；

在确定所查找到的词片段与所述发音片段相同时，根据预设的对应关系，从与所述发音片段对应的多个词片段中选取一个作为所述目标词片段。

6.根据权利要求4所述的方法，还包括：

在词典中查找与所述输入音频的发音片段对应的目标词片段之后，将所查找到的目标词片段进行上屏。

7.一种生成词典的装置，包括：

第一获取单元，用于获取英文词典；

切分单元，用于根据所述英文词典中各英文单词的发音来切分各英文单词，使得切分各英文单词所得到的词片段的数目等于各英文单词的发音片段的数目；

生成单元，用于根据各英文单词的词片段，生成词典。

8.根据权利要求7所述的装置，其中，所述生成单元在根据各英文单词的词片段，生成词典时，具体执行：

根据各词片段的发音，将各词片段进行分类；

在确定与发音对应的分类中包含多个词片段的情况下，使用该发音的发音片段代替所述多个词片段，生成所述词典。

9.根据权利要求7所述的方法，所述生成单元还用于执行：

在根据各英文单词的词片段生成词典之后，对所述词典中各词片段的标识信息进行标注，所述标识信息与各词片段的发音片段相对应。

10.一种语音识别的装置，包括：

第二获取单元，用于获取输入音频；

识别单元，用于在词典中查找与所述输入音频的发音片段对应的目标词片段，根据查找得到的目标词片段生成所述输入音频的识别结果；

其中，所述词典是根据权利要求7-9中任一项装置预先生成的。

11.根据权利要求10所述的装置，其中，所述识别单元在词典中查找与所述输入音频的发音片段对应的目标词片段时，具体执行：

在所述词典中查找与所述发音片段对应的词片段；

在确定所查找到的词片段与所述发音片段相同时，根据预设的对应关系，从与所述发音片段对应的多个词片段中选取一个作为所述目标词片段。

12.根据权利要求10所述的装置，还包括上屏单元，具体执行：

在所述识别单元在词典中查找与所述输入音频的发音片段对应的目标词片段之后，将所查找到的目标词片段进行上屏。

13.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-6中任一项所述的方法。

14.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行权利要求1-6中任一项所述的方法。

15.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-6中任一项所述的方法。

技术总结
本发明公开了一种生成词典与语音识别的方法，涉及自然语言处理、语音处理技术领域。其中，生成词典的方法包括：获取英文词典；根据所述英文词典中各英文单词的发音来切分各英文单词，使得切分各英文单词所得到的词片段的数目等于各英文单词的发音片段的数目；根据各英文单词的词片段，生成词典。语音识别的方法包括：获取输入音频；在词典中查找与所述输入音频的发音片段对应的目标词片段，根据查找得到的目标词片段生成所述输入音频的识别结果。本公开所生成的词典中的词片段与英文单词的发音片段一一对应，能够提升语音识别的准确性与效率。

技术研发人员：张辽;臧启光;付晓寅;蒋正翔;赵银楼
受保护的技术使用者：北京百度网讯科技有限公司
技术研发日：2021.04.15
技术公布日：2021.08.13

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：模型训练方法、语音识别方法、装置、服务器及存储介质与流程

生成词典与语音识别的方法、装置与流程

相关文章

最热文献