基于密集卷积神经网络的深度伪造视频频域检测方法与流程

2021-11-05 23:03:00 来源：中国专利 TAG：

1.本发明属于网络安全技术领域，尤其涉及一种基于密集卷积神经网络的深度伪造视频频域检测方法。

背景技术：

2.极其逼真的深度伪造视频对国家安全等方方面面产生了重大威胁，在社交网络的加持下，如果被敌方恶意利用深度伪造技术针对性的生成视频，极有可能会用来操纵舆情，抹黑国家重要人物，煽动恐怖和暴力情绪，破坏社会安全和国家稳定。针对这一威胁，国内外开展的深度伪造视频的检测研究已经有了相关的模型与方法，平常社交网络上传播的视频由于带宽约束、存储空间限制等因素通常经过压缩后进行传输，而视频压缩引入的降质技术使得当前检测模型难以训练、泛化性能下降、对深度伪造人脸视频的检测准确率降低。
3.现有检测深度伪造假脸视频的方法，从伪造视频中变换人脸的拼接处伪影入手，构建深度视频分类器，使用真实和伪造视频的特征对其进行训练，最后使用训练好的分类器进行分类。这种方法缺陷是：对于强压缩的视频，这种方法的误判率很高，而产生这个缺陷的根本原因就是：强压缩视频中出现了大量的冗余特征，导致基于伪影分类的分类器难以捕捉有效差异特征。

技术实现要素：

4.本发明针对现有检测深度伪造假脸视频的方法对于强压缩的视频误判率高的问题，提出一种基于密集卷积神经网络的深度伪造视频频域检测方法。
5.为了实现上述目的，本发明采用以下技术方案：一种基于密集卷积神经网络的深度伪造视频频域检测方法，包括：步骤1，对视频进行预处理：对真实和伪造视频进行分帧处理；对真实和伪造视频中的人脸进行定位，扩大选框后进行人脸图像提取；将提取出的人脸图像利用2d
‑
dct变换至频域；所述伪造视频包括深度伪造视频；步骤2，构建密集卷积神经网络并基于步骤1得出的频域数据进行训练；所述密集卷积神经网络包括密集块及过渡模块；步骤3，基于训练后的密集卷积神经网络检测深度伪造视频。
6.进一步地，所述步骤1包括：步骤1.1：使用opencv对真实和伪造视频进行分帧处理；步骤1.2：使用dlib对真实和伪造视频中的人脸进行定位，将原始矩形框扩大1.5倍后进行人脸图像提取；步骤1.3：将提取出的人脸图像利用2d
‑
dct变换至频域。
7.进一步地，所述步骤2包括：步骤2.1：构建密集块，所述密集块由批量归一化层、激活函数层、卷积层构成，层与层之间采用密集连接方式，各层特征能够在输入层和输出层间高速传递；
步骤2.2：构建过渡模块，所述过渡模块由1
×
1的卷积层以及池化层构成；步骤2.3：将密集块与过渡模块结合，并将卷积神经网络结构进行修改，使其能完成二分类，采用交叉熵损失函数作为损失函数，完成密集卷积神经网络构建；步骤2.4：通过步骤1生成的频域数据训练所构建的密集卷积神经网络。
8.进一步地，所述步骤3包括：步骤3.1：接收一个待检测视频；所述待检测视频包括深度伪造视频；步骤3.2：将视频进行分帧处理；步骤3.3：提取人脸图像后通过2d
‑
dct转化为频域数据；步骤3.4：将步骤3.3中所述频域数据输入训练好的密集卷积神经网络进行检测，并输出频域数据所属视频帧的检测准确率；步骤3.5：取所有帧检测准确率的平均值作为该视频最终的检测准确率。
9.与现有技术相比，本发明具有的有益效果：本发明在训练密集卷积神经网络时，以频域图像为单位对卷积神经网络检测模型进行训练，最后对频域图像检测结果融合判断后得出视频的检测结果，无论视频压缩在时域产生多少冗余特征，都不影响最终的检测效果。
附图说明
10.图1为本发明实施例一种基于密集卷积神经网络的深度伪造视频频域检测方法的基本流程图。
具体实施方式
11.下面结合附图和具体的实施例对本发明做进一步的解释说明：如图1所示，一种基于密集卷积神经网络的深度伪造视频频域检测方法，包括：步骤s101，对视频进行预处理：对真实和伪造视频进行分帧处理；对真实和伪造视频中的人脸进行定位，扩大选框后进行人脸图像提取；将提取出的人脸图像利用2d
‑
dct变换至频域；所述伪造视频包括深度伪造（假脸）（压缩）视频；步骤s102，构建密集卷积神经网络并基于步骤s101得出的频域数据进行训练；所述密集卷积神经网络包括密集块及过渡模块；步骤s103，基于训练后的密集卷积神经网络检测深度伪造（假脸）（压缩）视频。
12.进一步地，所述步骤s101包括：步骤s101.1：使用opencv对真实和伪造视频进行分帧处理；步骤s101.2：使用dlib对视频中的人脸进行定位，扩大选框后进行提取，因为提取视频帧中的人脸部分可以去除不利于检测的环境干扰信息，并可以使网络更专注于人脸的细微特征提取，从而提高验证以及测试的准确率。但原始dlib定位人脸的矩形框在一定情况下并不能将全脸包裹进来，故将原始矩形框扩大1.5倍后进行提取；步骤s101.3：将提取出的人脸图像利用二维离散余弦变换2d
‑
dct变换至频域，即首先沿着列计算一个dct，然后沿着行计算一个dct，绘制dct频谱时将dct系数描绘为热图。
13.进一步地，所述步骤s102包括：步骤s102.1：构建密集块，所述密集块由批量归一化层、激活函数层、卷积层构成，
层与层之间采用密集连接方式，各层特征能够在输入层和输出层间高速传递，确保层间信息流动的最大化；步骤s102.2：构建过渡模块，所述过渡模块由1
×
1的卷积层以及池化层构成；在进行池化操作之后，输出特征图的大小改变，无法进行密集连接操作，因此在密集块之间需要以上操作进行过渡；步骤s102.3：将密集块与过渡模块结合，并将卷积神经网络结构进行修改，使其能完成二分类，采用交叉熵损失函数作为损失函数，完成密集卷积神经网络构建；步骤s102.4：通过步骤s101.3生成的频域数据训练所构建的密集卷积神经网络。
14.进一步地，所述步骤s103包括：步骤s103.1：接收一个待检测视频；具体地，该待检测视频可以为深度伪造（假脸）（压缩）视频；步骤s103.2：将视频进行分帧处理；步骤s103.3：提取人脸图像后通过2d
‑
dct转化为频域数据；步骤s103.4：将步骤s103.3中所述频域数据输入训练好的密集卷积神经网络进行检测，并输出频域数据所属视频帧的检测准确率；步骤s103.5：取所有帧检测准确率的平均值作为该视频最终的检测准确率。
15.综上，本发明在训练密集卷积神经网络时，以频域图像为单位对卷积神经网络检测模型进行训练，最后对频域图像检测结果融合判断后得出视频的检测结果，无论视频压缩在时域产生多少冗余特征，都不影响最终的检测效果。
16.以上所示仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

技术特征：
1.一种基于密集卷积神经网络的深度伪造视频频域检测方法，其特征在于，包括：步骤1，对视频进行预处理：对真实和伪造视频进行分帧处理；对真实和伪造视频中的人脸进行定位，扩大选框后进行人脸图像提取；将提取出的人脸图像利用2d
‑
dct变换至频域；所述伪造视频包括深度伪造视频；步骤2，构建密集卷积神经网络并基于步骤1得出的频域数据进行训练；所述密集卷积神经网络包括密集块及过渡模块；步骤3，基于训练后的密集卷积神经网络检测深度伪造视频。2.根据权利要求1所述的基于密集卷积神经网络的深度伪造视频频域检测方法，其特征在于，所述步骤1包括：步骤1.1：使用opencv对真实和伪造视频进行分帧处理；步骤1.2：使用dlib对真实和伪造视频中的人脸进行定位，将原始矩形框扩大1.5倍后进行人脸图像提取；步骤1.3：将提取出的人脸图像利用2d
‑
dct变换至频域。3.根据权利要求1所述的基于密集卷积神经网络的深度伪造视频频域检测方法，其特征在于，所述步骤2包括：步骤2.1：构建密集块，所述密集块由批量归一化层、激活函数层、卷积层构成，层与层之间采用密集连接方式，各层特征能够在输入层和输出层间高速传递；步骤2.2：构建过渡模块，所述过渡模块由1
×
1的卷积层以及池化层构成；步骤2.3：将密集块与过渡模块结合，并将卷积神经网络结构进行修改，使其能完成二分类，采用交叉熵损失函数作为损失函数，完成密集卷积神经网络构建；步骤2.4：通过步骤1生成的频域数据训练所构建的密集卷积神经网络。4.根据权利要求1所述的基于密集卷积神经网络的深度伪造视频频域检测方法，其特征在于，所述步骤3包括：步骤3.1：接收一个待检测视频；所述待检测视频包括深度伪造视频；步骤3.2：将视频进行分帧处理；步骤3.3：提取人脸图像后通过2d
‑
dct转化为频域数据；步骤3.4：将步骤3.3中所述频域数据输入训练好的密集卷积神经网络进行检测，并输出频域数据所属视频帧的检测准确率；步骤3.5：取所有帧检测准确率的平均值作为该视频最终的检测准确率。

技术总结
本发明公开一种基于密集卷积神经网络的深度伪造视频频域检测方法，包括：步骤1，对视频进行预处理：对真实和伪造视频进行分帧处理；对所述视频中的人脸进行定位，扩大选框后进行人脸图像提取，并利用2D

技术研发人员：孙磊毛秀青张洪蒙汤桂花郭松辉李作辉戴乐育郭松窦睿彧胡翠云赵锟张帅
受保护的技术使用者：中国人民解放军战略支援部队信息工程大学
技术研发日：2021.07.30
技术公布日：2021/11/4

再多了解一些

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：信息推荐方法、装置、电子设备及存储介质与流程

基于密集卷积神经网络的深度伪造视频频域检测方法与流程

相关文献

最热文献