语音识别模型生成方法、装置、设备以及存储介质与流程

2021-12-04 02:05:00 来源：中国专利 TAG：

技术特征：
1.一种语音识别模型生成方法，其特征在于，包括：获取语音样本数据；所述语音样本数据包括所述语音样本和所述语音样本标签；构建第一语音识别超网络，所述第一语音识别超网络包括多层网络结构，每层网络结构对应搜索特征取值的多个不同组合，所述搜索特征包括分支个数、网络层维度和通道选择维度；基于所述语音样本和所述语音样本标签，对所述第一语音识别超网络执行训练操作，得到第二语音识别超网络；所述语音样本标签作为所述语音样本对应的期望识别值；对所述第二语音识别超网络进行网络搜索，以得到目标语音识别子网络；所述目标语音识别子网络包括所述多层网络结构，每层网络结构对应所述搜索特征取值的一个组合；对所述目标语音识别子网络进行重训练，得到语音识别模型。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：确定所述第一语音识别超网络中每层网络结构的多个分支个数，并根据每个分支个数，构建所述每层网络结构的分支模块；对所述每层网络结构的分支模块的特征进行第一数据处理，得到所述每层网络结构的多个网络层维度，所述第一数据处理包括合并处理、多阶处理或拼接处理中的至少一个。3.根据权利要求1所述的方法，其特征在于，所述方法还包括：确定所述第一语音识别超网络中每层网络结构的多个分支个数，并根据每个分支个数，构建所述每层网络结构的多个分支模块；对所述每层网络结构的分支模块的通道选择层进行第二数据处理，得到所述每层网络结构的多个通道选择维度，所述第二数据处理包括全连接处理和/或矩阵处理。4.根据权利要求1所述的方法，其特征在于，所述基于所述语音样本和所述语音样本标签，对所述第一语音识别超网络执行训练操作，得到第二语音识别超网络，包括：步骤a：对所述第一语音识别超网络中每层网络结构对应搜索特征取值的多个不同组合进行随机采样，得到所述每层网络结构对应搜索特征取值的一个组合；基于所述每层网络结构对应搜索特征取值的一个组合，得到所述第一语音识别子网络；步骤b：根据所述语音样本和所述语音样本标签训练所述第一语音识别子网络，得到第二语音识别子网络；步骤c：将所述第二语音识别子网络中的参数同步至所述第一语音识别超网络中；迭代执行步骤a
‑
步骤c，得到所述第二语音识别超网络。5.根据权利要求4所述的方法，其特征在于，所述语音样本包括多组语音子样本，所述步骤b，包括：根据所述语音样本和所述语音样本标签，多批次训练所述第一语音识别子网络，得到多个所述第二语音识别子网络，其中，每批次训练采用一组语音子样本。6.根据权利要求1所述的方法，其特征在于，所述对所述第二语音识别超网络进行网络搜索，以得到目标语音识别子网络，包括：对所述第二语音识别超网络进行多次抽样处理，得到多个第三语音识别子网络，所述抽样处理包括对所述第二语音识别超网络中每层网络结构对应搜索特征取值的多个不同组合进行随机采样，根据随机采样获得的所述每层网络结构对应搜索特征取值的一个组合，得到所述第三语音识别子网络；
确定多个第三语音识别子网络的错误率；将多个第三语音识别子网络中，错误率满足预设条件的第三语音识别子网络确定为所述目标语音识别子网络。7.一种语音识别模型生成装置，其特征在于，包括：获取模块，被配置为获取语音样本数据；所述语音样本数据包括所述语音样本和所述语音样本标签；处理模块，被配置为构建第一语音识别超网络，所述第一语音识别超网络包括多层网络结构，每层网络结构对应搜索特征取值的多个不同组合，所述搜索特征包括分支个数、网络层维度和通道选择维度；所述处理模块，还被配置为基于所述语音样本和所述语音样本标签，对所述第一语音识别超网络执行训练操作，得到第二语音识别超网络；所述语音样本标签作为所述语音样本对应的期望识别值；所述处理模块，还被配置为对所述第二语音识别超网络进行网络搜索，以得到目标语音识别子网络；所述目标语音识别子网络包括所述多层网络结构，每层网络结构对应所述搜索特征取值的一个组合；所述处理模块，还被配置为对所述目标语音识别子网络进行重训练，得到语音识别模型。8.一种电子设备，其特征在于，所述电子设备包括：处理器；用于存储所述处理器可执行指令的存储器；其中，所述处理器被配置为执行所述指令，以实现如权利要求1
‑
6中任一项所述的语音识别模型生成方法。9.一种计算机可读存储介质，所述计算机可读存储介质上存储有指令，其特征在于，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行如权利要求1
‑
6中任一项所述的语音识别模型生成方法。10.一种计算机程序产品，包括计算机指令，其特征在于，当所述计算机指令被电子设备执行时，实现如权利要求1
‑
6中任一项所述的语音识别模型生成方法。

技术总结
本公开提供一种语音识别模型生成方法、装置、设备以及存储介质，涉及网络信息处理技术领域，以得到更优的语音识别模型。该方法包括：获取语音样本数据；构建第一语音识别超网络，第一语音识别超网络包括多层网络结构，每层网络结构对应搜索特征取值的多个不同组合，搜索特征包括分支个数、网络层维度和通道选择维度；搜索特征包括分支个数、网络层维度和通道选择维度；基于语音样本和语音样本标签，对第一语音识别超网络执行训练操作，得到第二语音识别超网络；语音样本标签作为语音样本对应的期望识别值；对第二语音识别超网络进行网络搜索，以得到目标语音识别子网络；对目标语音识别子网络进行重训练，得到语音识别模型。得到语音识别模型。得到语音识别模型。

技术研发人员：朱文涛陆顺孔天龙李吉祥张大威邓峰王晓瑞杨森刘霁
受保护的技术使用者：北京达佳互联信息技术有限公司
技术研发日：2021.09.17
技术公布日：2021/12/3

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：语音数据处理方法、装置、设备、存储介质及程序产品与流程

语音识别模型生成方法、装置、设备以及存储介质与流程

相关文献

最热文献