声学模型训练方法及装置与流程

2021-06-25 14:53:00 来源：中国专利 TAG：模型训练声学装置方法

技术特征：
1.一种声学模型训练方法，其特征在于，包括：获取来自至少两个信道的多个语音帧，一个信道对应一种信道类别；针对所述多个语音帧中的每个语音帧，确定所述语音帧所来自信道对应的信道类别，并对所述信道类别进行独热编码，获得所述语音帧对应的独热编码向量；获取用于表示所述语音帧的语音特征的特征向量；根据所述语音帧对应的独热编码向量和所述语音帧对应的特征向量，获得所述语音帧对应的第一向量；根据所述多个语音帧中每个语音帧对应的第一向量对待训练的声学模型进行模型训练。2.如权利要求1所述的方法，其特征在于，所述根据所述语音帧对应的独热编码向量和所述语音帧对应的特征向量，获得所述语音帧对应的第一向量，包括：拼接所述语音帧对应的独热编码向量和所述语音帧对应的特征向量，获得所述语音帧对应的第一向量。3.如权利要求1所述的方法，其特征在于，所述根据所述语音帧对应的独热编码向量和所述语音帧对应的特征向量，获得所述语音帧对应的第一向量，包括：利用嵌入层embedding对所述语音帧对应的独热编码向量进行处理，获得所述语音帧对应的第二向量；拼接所述语音帧对应的第二向量和所述语音帧对应的特征向量，获得所述语音帧对应的第一向量。4.如权利要求3所述的方法，其特征在于，所述声学模型包括依次连接的多个隐藏层，所述方法还包括：从所述多个隐藏层中确定至少一个选定隐藏层，所述至少一个选定隐藏层是除所述多个隐藏层的第一个隐藏层外的隐藏层；针对所述至少一个选定隐藏层中的每个选定隐藏层，获取在所述选定隐藏层之前的隐藏层输出的所述语音帧对应的中间向量；拼接所述语音帧对应的第二向量和所述语音帧对应的中间向量，获得所述语音帧对应的第三向量；根据所述多个语音帧中每个语音帧对应的第一向量对待训练的声学模型进行模型训练，包括：将所述多个语音帧中每个语音帧对应的第一向量输入所述待训练的声学模型的第一个隐藏层；以及，将所述多个语音帧中每个语音帧对应的第三向量输入所述待训练的声学模型的所述选定隐藏层，以对所述声学模型进行模型训练。5.如权利要求3所述的方法，其特征在于，所述方法还包括：获取所述声学模型的模型参数向量的维度大小，并根据所述声学模型的模型参数向量的维度大小，对所述嵌入层的模型参数向量的维度大小进行调整；所述利用嵌入层embedding对所述语音帧对应的独热编码向量进行处理，获得所述语音帧对应的第二向量，包括：利用调整后的所述嵌入层对所述语音帧对应的独热编码向量进行处理，获得所述语音帧对应的第二向量。
6.如权利要求3所述的方法，其特征在于，所述方法还包括：获取用于表示所述至少两个信道中各个信道之间的差异程度的状态量，并根据所述状态量，对所述嵌入层的模型参数向量的维度大小进行调整；所述利用嵌入层embedding对所述语音帧对应的独热编码向量进行处理，获得所述语音帧对应的第二向量，包括：利用调整后的所述嵌入层对所述语音帧对应的独热编码向量进行处理，获得所述语音帧对应的第二向量。7.如权利要求1
‑
6任一项所述的方法，其特征在于，所述特征向量包括梅尔频率倒谱系数mfcc特征向量或滤波器组参数特征向量。8.一种声学模型训练装置，其特征在于，包括：第一获取单元，用于获取来自至少两个信道的多个语音帧；第一确定单元，用于针对所述多个语音帧中的每个语音帧，确定所述语音帧所来自信道对应的信道类别，并对所述信道类别进行独热编码，获得所述语音帧对应的独热编码向量；第二获取单元，用于获取用于表示所述语音帧的语音特征的特征向量；第三获取单元，用于根据所述语音帧对应的独热编码向量和所述语音帧对应的特征向量，获得所述语音帧对应的第一向量；模型训练单元，用于根据所述多个语音帧中每个语音帧对应的第一向量对待训练的声学模型进行模型训练。9.一种声学模型训练装置，其特征在于，包括处理器、存储器以及通信接口，所述处理器、存储器和通信接口相互连接，其中，所述通信接口用于接收和发送数据，所述存储器用于存储程序代码，所述处理器用于调用所述程序代码，执行如权利要求1至7任一项所述的方法。10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行以实现权利要求1至7任一项所述的方法。

再多了解一些

2/3 首页上一页 1 2 3 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种具有民谣吉他和十二弦吉他双拾音器的双头吉他面板的制作方法

声学模型训练方法及装置与流程

相关文章

最热文献