训练数据的筛选方法、装置、设备和存储介质与流程

2021-10-12 19:29:00 来源：中国专利 TAG：神经网络筛选装置训练方法

技术特征：
1.一种训练数据的筛选方法，其特征在于，包括：将获取的待筛选数据输入预先构建的语音活动检测模型进行检测，得到待筛选数据的语音帧和噪音帧；获取待筛选数据的语音帧级平均能量和噪音帧级平均能量；根据所述语音帧级平均能量和所述噪音帧级平均能量，确定所述待筛选数据的信噪比；若所述信噪比大于第一预设阈值，对所述待筛选数据进行混响抑制，得到抑制数据；根据所述语音帧级平均能量和获取的所述抑制数据的平均能量，确定混响分量的平均能量；根据所述混响分量的平均能量和所述语音帧级平均能量，确定混响占比；若所述混响占比小于第二预设阈值，保留所述待筛选数据。2.根据权利要求1所述的训练数据的筛选方法，其特征在于，根据所述语音帧级平均能量和获取的所述抑制数据的平均能量，确定混响分量的平均能量，包括：将所述语音帧级平均能量与所述抑制数据的平均能量的差值作为所述混响分量的平均能量。3.根据权利要求1所述的训练数据的筛选方法，其特征在于，所述语音活动检测模型的构建过程包括：以标定的需求语音数据作为基础数据，构造噪音数据；将所述噪音数据和所述需求语音数据分别输入待训练模型进行迭代训练，直到满足迭代停止条件，生成所述语音活动检测模型。4.根据权利要求3所述的训练数据的筛选方法，其特征在于，以标定的需求语音数据作为基础数据，构造噪音数据，包括：基于预设的噪音数据构造计算式，利用所述需求语音数据和从开源数据库中获取的加噪信号，构造所述噪音数据。5.根据权利要求4所述的训练数据的筛选方法，其特征在于，所述加噪信号包括冲激响应信号和噪音信号；所述噪音数据构造计算式为：其中，所述x(n)表示所述噪音数据，所述s(n)表示所述需求语音数据，h(n)表示所述冲激响应信号，noise(n)表示所述噪音信号，表示所述信噪比控制参数。6.根据权利要求1所述的训练数据的筛选方法，其特征在于，还包括：若所述信噪比小于或等于第一预设阈值，或者，所述混响占比大于或等于第二预设阈值，舍去所述待选数据。7.一种训练数据的筛选装置，其特征在于，包括：输入模块，用于将获取的待筛选数据输入预先构建的语音活动检测模型进行检测，得到待筛选数据的语音帧和噪音帧；获取模块，用于获取待筛选数据的语音帧级平均能量和噪音帧级平均能量；第一确定模块，用于根据所述语音帧级平均能量和所述噪音帧级平均能量，确定所述
待筛选数据的信噪比；混响抑制模块，用于若所述信噪比大于第一预设阈值，对所述待筛选数据进行混响抑制，得到抑制数据；第二确定模块，用于根据所述语音帧级平均能量和获取的所述抑制数据的平均能量，确定混响分量的平均能量；根据所述混响分量的平均能量和所述语音帧级平均能量，确定混响占比；筛选模块，用于若所述混响占比小于第二预设阈值，保留所述待筛选数据。8.根据权利要求7所述的训练数据的筛选装置，其特征在于，所述语音活动检测模型的构建过程包括：以标定的需求语音数据作为基础数据，构造噪音数据；将所述噪音数据输入待训练模型进行迭代训练，直到满足迭代停止条件，生成所述语音活动检测模型。9.一种训练数据的筛选设备，其特征在于，包括：处理器和存储器；所述处理器用于执行所述存储器中存储的训练数据的筛选的程序，以实现权利要求1
‑
7任一项所述的训练数据的筛选方法。10.一种存储介质，其特征在于，所述存储介质存储有一个或者多个程序，所述一个或者多个程序可被执行时实现权利要求1
‑
7任一项所述的训练数据的筛选方法。

技术总结
本发明涉及一种训练数据的筛选方法、装置、设备和存储介质，方法包括：将获取的待筛选数据输入预先构建的语音活动检测模型进行检测，得到待筛选数据的语音帧和噪音帧；根据获取的语音帧级平均能量和噪音帧级平均能量，确定待筛选数据的信噪比；若信噪比大于第一预设阈值，对待筛选数据进行混响抑制，得到抑制数据；根据语音帧级平均能量和获取的抑制数据的平均能量，确定混响分量的平均能量；根据混响分量的平均能量和语音帧级平均能量，确定混响占比；若混响占比小于第二预设阈值，保留待筛选数据，实现了自动筛选训练数据，提高了训练数据的筛选效率。数据的筛选效率。数据的筛选效率。

技术研发人员：关海欣梁家恩
受保护的技术使用者：云知声智能科技股份有限公司
技术研发日：2021.08.12
技术公布日：2021/10/11

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种环保工程用噪音防治设备的制作方法

训练数据的筛选方法、装置、设备和存储介质与流程

相关文章

最热文献