用于生成对抗声音信号的方法、装置、设备和介质与流程

2021-10-15 22:35:00 来源：中国专利 TAG：人工智能信号处理语音实施公开

技术特征：
1.一种生成对抗声音信号的方法，包括：获取传播拟合模型，所述传播拟合模型指示声音信号与将所述声音信号从声源经由环境传播并且由拾音器捕获后的传播声音信号之间的关联；获取能够被语音识别模型正确识别的目标声音信号；以及基于所述目标声音信号来生成用于所述语音识别模型的对抗声音信号，使由所述传播拟合模型从所述对抗声音信号确定的传播声音信号被所述语音识别模型错误识别。2.根据权利要求1所述的方法，其中获取所述传播拟合模型包括：获取训练样本对，所述训练样本对包括训练声音信号和所述训练声音信号从所述声源经由所述环境传播并且由所述拾音器捕获后的训练传播声音信号；以及基于所述训练样本对来生成所述传播拟合模型。3.根据权利要求2所述的方法，其中生成所述传播拟合模型包括：对所述训练声音信号和所述训练传播声音信号执行预处理操作；以及基于预处理后的所述训练声音信号和所述训练传播声音信号来生成所述传播拟合模型。4.根据权利要求2所述的方法，其中生成所述传播拟合模型包括：确定所述训练声音信号对应的第一频域特征和所述训练传播声音信号对应的第二频域特征；以及基于所述第一频域特征和所述第二频域特征来生成所述传播拟合模型，以使所生成的所述传播拟合模型能够从所述第一频域特征确定所述第二频域特征。5.根据权利要求1所述的方法，其中生成所述对抗声音信号包括：生成针对所述目标声音信号的扰动数据；通过将所述扰动数据添加到所述目标声音信号来确定扰动声音信号；利用所述传播拟合模型生成所述扰动声音信号对应的传播声音信号；以及通过确定所述语音识别模型是否正确识别所述传播声音信号，来确定所述对抗声音信号。6.根据权利要求5所述的方法，其中确定所述对抗声音信号包括：根据确定所述语音识别模型错误识别所述传播声音信号，将所述扰动声音信号确定为所述对抗声音信号；根据确定所述语音识别模型正确识别所述传播声音信号，通过向所述目标声音信号再次添加另外的扰动数据来确定所述对抗声音信号。7.根据权利要求1所述的方法，其中获取所述目标声音信号包括：确定所述目标声音信号，以使所述传播拟合模型从所述目标声音信号确定的传播声音信号被所述语音识别模型正确识别。8.根据权利要求1至7中任一项所述的方法，其中所述语音识别模型包括语音分类模型，所述语音分类模型被配置为确定输入的声音信号是否是人类语音。9.一种用于生成对抗样本的装置，包括：拟合模型获取模块，被配置为获取传播拟合模型，所述传播拟合模型指示声音信号与将所述声音信号从声源经由环境传播并且由拾音器捕获后的传播声音信号之间的关联；目标获取模块，被配置为获取能够被语音识别模型正确识别的目标声音信号；以及
对抗生成模块，被配置为基于所述目标声音信号来生成用于所述语音识别模型的对抗声音信号，使由所述传播拟合模型从所述对抗声音信号确定的传播声音信号被所述语音识别模型错误识别。10.根据权利要求9所述的装置，其中所述拟合模型获取模块包括：样本获取模块，被配置为获取训练样本对，所述训练样本对包括训练声音信号和所述训练声音信号从所述声源经由所述环境传播并且由所述拾音器捕获后的训练传播声音信号；以及模型生成模块，被配置为基于所述训练样本对来生成所述传播拟合模型。11.根据权利要求10所述的装置，其中所述模型生成模块包括：训练预处理模块，被配置为对所述训练声音信号和所述训练传播声音信号执行预处理操作；以及基于预处理的模型生成模块，被配置为基于预处理后的所述训练声音信号和所述训练传播声音信号来生成所述传播拟合模型。12.根据权利要求10所述的装置，其中所述模型生成模块包括：频域特征确定模块，被配置为确定所述训练声音信号对应的第一频域特征和所述训练传播声音信号对应的第二频域特征；以及基于频域的模型生成模块，被配置为基于所述第一频域特征和所述第二频域特征来生成所述传播拟合模型，以使所生成的所述传播拟合模型能够从所述第一频域特征确定所述第二频域特征。13.根据权利要求9所述的装置，其中所述对抗生成模块包括：扰动生成模块，被配置为生成针对所述目标声音信号的扰动数据；扰动添加模块，被配置为通过将所述扰动数据添加到所述目标声音信号来确定扰动声音信号；扰动传播拟合模块，被配置为利用所述传播拟合模型生成所述扰动声音信号对应的传播声音信号；以及对抗确定模块，被配置为通过确定所述语音识别模型是否正确识别所述传播声音信号，来确定所述对抗声音信号。14.根据权利要求13所述的装置，其中所述对抗确定模块包括：第一确定模块，被配置为根据确定所述语音识别模型错误识别所述传播声音信号，将所述扰动声音信号确定为所述对抗声音信号；以及第二确定模块，被配置为根据确定所述语音识别模型正确识别所述传播声音信号，通过向所述目标声音信号再次添加另外的扰动数据来确定所述对抗声音信号。15.根据权利要求9所述的装置，其中所述目标获取模块包括：目标信号确定模块，被配置为确定所述目标声音信号，以使所述传播拟合模型从所述目标声音信号确定的传播声音信号被所述语音识别模型正确识别。16.根据权利要求9至15中任一项所述的装置，其中所述语音识别模型包括语音分类模型，所述语音分类模型被配置为确定输入的声音信号是否是人类语音。17.一种电子设备，包括：一个或多个处理器；以及
存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1至8中任一项所述的方法。18.一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现如权利要求1至8中任一项所述的方法。

技术总结
本公开的实施例提供了用于生成对抗声音信号的方法、装置、设备和介质，涉及人工智能技术。一种用于生成对抗声音信号的方法包括获取传播拟合模型，传播拟合模型指示声音信号与将声音信号从声源经由环境传播并且由拾音器捕获后的传播声音信号之间的关联。该方法还包括获取能够被语音识别模型正确识别的目标声音信号，并且基于目标声音信号来生成用于语音识别模型的对抗声音信号，使由传播拟合模型从对抗声音信号确定的传播声音信号被语音识别模型错误识别。通过上述方式，借助传播拟合模型，所生成的对抗声音信号可以抵抗在到达语音识别模型之前的声音损失，从而能够保持对抗性用于测试语音识别模型的鲁棒性。于测试语音识别模型的鲁棒性。于测试语音识别模型的鲁棒性。

技术研发人员：熊俊峰王洋刘焱
受保护的技术使用者：百度在线网络技术(北京)有限公司
技术研发日：2020.03.24
技术公布日：2021/10/14

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：主动噪声控制方法、装置、存储介质和计算机设备与流程

用于生成对抗声音信号的方法、装置、设备和介质与流程

相关文章

最热文献