技术特征:
1.一种计算机系统,包括:
一个或多个硬件处理器和存储器,所述存储器包括:
计算机程序指令,其由所述一个或多个硬件处理器可执行;以及
音频水印检测器,其包括神经网络,所述神经网络被训练为从被测音频信号检测使用具体水印嵌入技术而被嵌入的具体音频水印的存在或者不存在;以及
音频真实性验证组件,其被配置为使用所述一个或多个硬件处理器来:
访问经降级的音频信号;
通过将所述经降级的音频信号的至少一部分的时域样本馈送到所述音频水印检测器中来对所述经降级的音频信号的至少所述一部分进行分类,以生成指示所述具体音频水印的所述存在或者不存在的分类标签;以及
基于所述分类标签来返回分类结果。
2.根据权利要求1所述的计算机系统,其中所述具体音频水印的存在指示源软件在生成所述被测音频信号的工作流中被使用。
3.根据权利要求2所述的计算机系统,其中所述源软件是声音操纵软件。
4.根据权利要求1所述的计算机系统,所述音频水印检测器作为生成式对抗网络的一部分与基于神经网络的攻击器一起被联合地训练。
5.根据权利要求1所述的计算机系统,其中所述音频真实性验证组件被配置为:使用所述音频水印检测器,通过从所述经降级的音频的滑动窗口标识所述时域样本,来迭代地对所述经降级的音频信号的连续分块进行分类。
6.根据权利要求1所述的计算机系统,其中所述分类结果包括对所述经降级的音频信号的总体分类,所述总体分类基于所述经降级的音频信号的分块被所述音频水印检测器分类为具有所述音频水印的阈值量。
7.一种用于音频水印检测的计算机化的方法,所述方法包括:
接收要测试的音频波形;
使用音频水印检测器来生成所述音频波形的二元分类,所述二元分类指示所述音频波形是否包括使用具体水印嵌入技术而被嵌入的具体音频水印,所述音频水印检测器包括被配置为检测所述具体音频水印的神经网络;以及
基于所述二元分类来返回分类结果。
8.根据权利要求7所述的方法,其中所述具体音频水印的存在指示源软件在生成所述音频波形的工作流中被使用。
9.根据权利要求8所述的方法,其中所述源软件是声音操纵软件。
10.根据权利要求7所述的方法,还包括:将所述音频水印检测器作为生成式对抗网络的一部分与基于神经网络的攻击器一起联合地训练。
11.根据权利要求7所述的方法,其中使用所述音频水印检测器来生成所述二元分类包括:使用所述音频水印检测器来迭代地对所述音频波形的多个分块进行分类,并且基于对所述多个分块的分类来生成所述二元分类。
12.根据权利要求7所述的方法,其中所述分类结果包括时间相关图,所述时间相关图指示所述音频波形的分块的随时间的分类,所述随时间的分类指示所述音频波形的所述分块是否包括所述具体音频水印。
13.根据权利要求7所述的方法,其中使用所述音频水印检测器来生成所述二元分类包括:将所述音频波形的时域样本馈送到所述音频水印检测器中,并且对所述时域样本执行一维(1d)卷积。
14.一种或多种存储计算机可使用指令的计算机存储介质,所述计算机可使用指令在由计算设备使用时使所述计算设备执行操作,所述操作包括:
经由音频真实性验证门户来接收经降级的音频片段;
将所述经降级的音频片段上传至远程服务器,所述远程服务器被配置为使用音频水印检测器基于神经网络来执行对所述经降级的音频片段的真实性的评估,所述神经网络被配置为从所述经降级的音频片段检测音频水印的存在,所述音频水印的所述存在指示源软件在生成所述经降级的音频片段的工作流中是否被使用;
从所述远程服务器接收基于所述真实性的评估的分类结果;以及
经由所述音频真实性验证门户来提供所述分类结果。
15.根据权利要求14所述的一种或多种计算机存储介质,其中所述经降级的音频片段包括深度伪造音频。
16.根据权利要求14所述的一种或多种计算机存储介质,其中所述经降级的音频片段被包括在视频文件的音轨中。
17.根据权利要求14所述的一种或多种计算机存储介质,所述音频水印检测器作为生成式对抗网络的一部分与基于神经网络的攻击器一起被联合地训练。
18.根据权利要求14所述的一种或多种计算机存储介质,其中所述远程服务器还被配置为:使用所述音频水印检测器来执行所述真实性的评估,以迭代地对所述经降级的音频片段的多个分块进行分类,并且基于对所述多个分块的分类来生成所述分类结果。
19.根据权利要求14所述的一种或多种计算机存储介质,其中所述分类结果包括时间相关图,所述时间相关图指示所述经降级的音频片段的分块的随时间的分类,所述随时间的分类指示所述经降级的音频片段的所述分块是否包括所述具体音频水印。
20.根据权利要求14所述的一种或多种计算机存储介质,其中所述远程服务器还被配置为:通过将所述经降级的音频片段的时域样本馈送到所述音频水印检测器中来执行所述真实性的评估。
技术总结
基于神经网络的安全音频水印加注。提供了用于安全音频水印加注和音频真实性验证的系统、方法和计算机存储介质。音频水印检测器可以包括被训练为检测具体音频水印和嵌入技术的神经网络,具体音频水印和嵌入技术可以指示在生成被测音频文件的工作流中所使用的源软件。例如水印可以指示音频文件使用声音操纵软件而被生成,因此,检测水印可以指示被操纵的音频,诸如,深度伪造音频和其他被攻击的音频信号。在一些实施例中,音频水印检测器可以作为生成式对抗网络的一部分被训练以使基础音频水印对于基于神经网络的攻击更稳健。通常,音频水印检测器可以对来自被测音频片段的分块的时域样本进行评估以检测音频水印的存在并且生成针对音频片段的分类。
技术研发人员:金泽宇;O·S·里泽-亚当斯
受保护的技术使用者:奥多比公司
技术研发日:2020.12.03
技术公布日:2021.08.13
本文用于企业家、创业者技术爱好者查询,结果仅供参考。