模型训练的方法、装置和语音信号的处理方法、装置与流程

2021-09-10 19:41:00 来源：中国专利 TAG：信号处理语音装置模型训练

技术特征：
1.一种模型训练的方法，包括：利用教师模型对第一真实数据集合中的混合语音信号进行语音分离处理，所述第一真实数据集合中的混合语音信号不具有标签，所述教师模型利用第一合成数据集合进行训练，所述第一合成数据集合中的混合语音信号具有标签；根据语音分离处理结果，生成所述第一真实数据集合中的混合语音信号的标签；根据所述第一真实数据集合及其对应的标签、所述第一合成数据集合及其对应的标签，训练用于进行语音分离处理的第一学生模型；利用训练后的第一学生模型，重新训练所述教师模型，直至满足训练结束条件。2.根据权利要求1所述的模型训练的方法，其中，所述利用训练后的第一学生模型，重新训练所述教师模型包括：根据训练后的第一学生模型的参数，更新所述教师模型的参数。3.根据权利要求1所述的模型训练的方法，其中，所述根据所述第一真实数据集合及其对应的标签、所述第一合成数据集合及其对应的标签，训练用于进行语音分离处理的第一学生模型包括：为所述第一真实数据集合中的每一条混合语音信号增加k种噪声，生成第二真实数据集合，k为大于或等于2的正整数；为所述第一合成数据集合中的每一条混合语音信号增加k种噪声，生成第二合成数据集合；根据所述第一真实数据集合中混合语音信号的标签，生成所述第二真实数据集合中已增加k种噪声的混合语音信号的标签；根据所述第二真实数据集合及其对应的标签、所述第二合成数据集合及其对应的标签，训练所述第一学生模型。4.根据权利要求3所述的模型训练的方法，其中，所述为所述第一真实数据集合中的每一条混合语音信号增加k种噪声，生成第二真实数据集合，为所述第一合成数据集合中的每一条混合语音信号增加k种噪声，生成第二合成数据集合包括：为所述第一真实数据集合中的每一条混合语音信号增加k种噪声，生成所述第二真实数据集合中的k条具有不同噪声的混合语音信号；为所述第一合成数据集合中的每一条混合语音信号增加k种噪声，生成所述第二合成数据集合中的k条具有不同噪声的混合语音信号。5.根据权利要求3所述的模型训练的方法，其中，所述根据所述第二真实数据集合及其对应的标签、所述第二合成数据集合及其对应的标签，训练所述第一学生模型包括：从所述第二真实数据集合和所述第二合成数据集合中选择多条已增加k种噪声的混合语音信号作为多条训练数据，用于训练所述第一学生模型，所述多条训练数据的数量根据所述k种噪声的种类的数量确定。6.根据权利要求5所述的模型训练的方法，其中，所述从所述第二真实数据集合和所述第二合成数据集合中选择多条已增加k种噪声的混合语音信号作为训练数据包括：从所述第二真实数据集合和所述第二合成数据集合中选择(1\k)
×
n条已增加k种噪声的混合语音信号作为训练数据，n为所述第二真实数据集合和所述第二合成数据集合的数据总数。
7.根据权利要求1所述的模型训练的方法，还包括：增加所述第一学生模型的层数或者节点数量中的至少一项，生成第二学生模型；根据所述第一真实数据集合及其标签、所述第一合成数据集合及其标签，训练所述第二学生模型；利用训练后的第二学生模型，重新训练所述教师模型。8.根据权利要求1所述的模型训练的方法，其中，所述教师模型、所述第一学生模型利用排列不变训练方式进行训练。9.根据权利要求2所述的模型训练的方法，其中，所述根据训练后的第一学生模型的参数，更新所述教师模型的参数包括：利用指数滑动平均ema算法进行训练，根据训练后的第一学生模型的参数，更新所述教师模型的参数。10.根据权利要求1
‑
9任一项所述的模型训练的方法，还包括：利用训练后的第一学生模型或者更新参数后的教师模型处理混合语音信号，确定语音分离结果。11.一种语音信号的处理方法，包括：利用第一学生模型或者教师模型处理混合语音信号，确定语音分离结果，所述第一学生模型和教师模型通过如下方式进行训练：利用教师模型对第一真实数据集合中的混合语音信号进行语音分离处理，所述第一真实数据集合中的混合语音信号不具有标签，所述教师模型利用第一合成数据集合进行训练，所述第一合成数据集合中的混合语音信号具有标签；根据语音分离处理结果，生成所述第一真实数据集合中的混合语音信号的标签；根据所述第一真实数据集合及其对应的标签、所述第一合成数据集合及其对应的标签，训练用于进行语音分离处理的第一学生模型；利用训练后的第一学生模型，重新训练所述教师模型，直至满足训练结束条件。12.一种模型训练的装置，包括：处理单元，用于利用教师模型对第一真实数据集合中的混合语音信号进行语音分离处理，所述第一真实数据集合中的混合语音信号不具有标签，所述教师模型利用第一合成数据集合进行训练，所述第一合成数据集合中的混合语音信号具有标签；生成单元，用于根据语音分离处理结果，生成所述第一真实数据集合中的混合语音信号的标签；训练单元，用于根据所述第一真实数据集合及其对应的标签、所述第一合成数据集合及其对应的标签，训练用于进行语音分离处理的第一学生模型，利用训练后的第一学生模型，重新训练所述教师模型，直至满足训练结束条件。13.根据权利要求12所述的模型训练的装置，其中，所述生成单元为所述第一真实数据集合中的每一条混合语音信号增加k种噪声，生成第二真实数据集合，k为大于或等于2的正整数，为所述第一合成数据集合中的每一条混合语音信号增加k种噪声，生成第二合成数据集合，根据所述第一真实数据集合中混合语音信号的标签，生成所述第二真实数据集合中已增加k种噪声的混合语音信号的标签；所述训练单元根据所述第二真实数据集合及其对应的标签、所述第二合成数据集合及
其对应的标签，训练所述第一学生模型。14.根据权利要求13所述的模型训练的装置，其中，所述训练单元从所述第二真实数据集合和所述第二合成数据集合中选择多条已增加k种噪声的混合语音信号作为多条训练数据，用于训练所述第一学生模型，所述多条训练数据的数量根据所述k种噪声的种类的数量确定。15.一种语音信号的处理装置，包括：处理单元，用于利用第一学生模型或者教师模型处理混合语音信号，确定语音分离结果，所述第一学生模型和教师模型通过如下方式进行训练：利用教师模型对第一真实数据集合中的混合语音信号进行语音分离处理，所述第一真实数据集合中的混合语音信号不具有标签，所述教师模型利用第一合成数据集合进行训练，所述第一合成数据集合中的混合语音信号具有标签；根据语音分离处理结果，生成所述第一真实数据集合中的混合语音信号的标签；根据所述第一真实数据集合及其对应的标签、所述第一合成数据集合及其对应的标签，训练用于进行语音分离处理的第一学生模型；利用训练后的第一学生模型，重新训练所述教师模型，直至满足训练结束条件。16.一种模型训练的装置，包括：存储器；和耦接至所述存储器的处理器，所述处理器被配置为基于存储在所述存储器中的指令，执行权利要求1
‑
10任一项所述的模型训练的方法。17.一种语音信号的处理装置，包括：存储器；和耦接至所述存储器的处理器，所述处理器被配置为基于存储在所述存储器中的指令，执行权利要求11所述的语音信号的处理方法。18.一种非易失性计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现权利要求1
‑
10任一项所述的模型训练的方法、或者权利要求11所述的语音信号的处理方法。

技术总结
本公开涉及一种模型训练的方法、装置和语音信号的处理方法、装置，涉及计算机技术领域。该模型训练的方法包括：利用教师模型对第一真实数据集合中的混合语音信号进行语音分离处理，第一真实数据集合中的混合语音信号不具有标签，教师模型利用第一合成数据集合进行训练，第一合成数据集合中的混合语音信号具有标签；根据语音分离处理结果，生成第一真实数据集合中的混合语音信号的标签；根据第一真实数据集合及其对应的标签、第一合成数据集合及其对应的标签，训练用于进行语音分离处理的第一学生模型；利用训练后的第一学生模型，重新训练教师模型，直至满足训练结束条件。直至满足训练结束条件。直至满足训练结束条件。

技术研发人员：龚亚光
受保护的技术使用者：北京世纪好未来教育科技有限公司
技术研发日：2021.08.12
技术公布日：2021/9/9

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：语音情感分类方法、装置、设备及介质与流程

模型训练的方法、装置和语音信号的处理方法、装置与流程

相关文章

最热文献