一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种Jpeg隐写分析方法及系统

2023-08-06 12:32:26 来源:中国专利 TAG:

一种jpeg隐写分析方法及系统
技术领域
1.本发明属于图像处理技术领域,涉及图像隐写分析技术,具体涉及一种jpeg隐写分析方法及系统。


背景技术:

2.图像隐写技术将秘密信息隐藏到图像中,作为隐写术的对立面,图像隐写分析的目的是分析与判断图像中是否含有秘密信息。jpeg图像是最突出的和广泛使用的图像文件格式,因此研究jpeg图像隐写分析方法具有重要的理论意义和实用价值。
3.早期的jpeg域图像隐写算法通过将dct系数的最低位替换为秘密信息来完成信息嵌入,主要包括nsf5、mb等。随着对自适应编码理解的深入,不断有新的自适应隐写算法被提出,例如通用小波失真隐写算法j-uniward,一致嵌入失真算法ued,及其对应改进的uerd算法。这类jpeg域自适应隐写算法可以将隐写嵌入所造成的失真降低到最小,且选定的嵌入秘密信息的位置相对集中在纹理复杂的区域使得隐写分析者难以进行统计建模。对此,研究者提出了一系列隐写分析模型,例如dctr、pharm和gfr,这些模型几乎都有相似的特征提取步骤,即先将jpeg图像解压到空域,并使用滤波器提取噪声残差,最后通过量化阶段处理提取统计特征。这些传统方法虽然取得了不错的检测结果,但是随着自适应隐写算法的不断发展,传统方法的局限性也越来越明显:一方面,设计特征时需要考虑更为复杂的图像统计特性,这就要求研究者对隐写技术有较高程度的理解;另一方面,特征参数的调节需要花费大量的计算力,过程繁琐,效率低下。
4.近年来,深度学习技术在计算机视领域取得了巨大的成功,帮助人类解决了很多复杂的问题,隐写分析本质上是二分类问题,国内外学者也不断尝试利用深度学习实现图像隐写分析。深度学习方法有着强大的特征学习和表达能力,使得隐写分析员只需致力于设计合适的架构,而无需手动设计复杂的高维特征。通过多个卷积和激活函数的组合可以有效提取图像的细节特征,并在同一个模型下完成图像的分类,通过大量的数据训练构建端到端的隐写分析器。现有的研究表明,相较于基于手工提取特征的隐写分析器,基于深度学习的隐写分析器性能有了明显的提升。为了提升模型的识别准确率,现有的jpeg隐写分析网络使用了各种技巧。在网络架构设计方面,结合了一些经典的cnn网络结构,如残差网络、密集网络,在训练策略方面,使用了迁移学习、数据增强、预训练等,另外有的模型还引入了相关领域知识,如jpeg相位感知、高通滤波器等。然而,现有的隐写分析模型还存在一些不足之处。一方面,几乎所有的jpeg隐写分析模型都采用单路径结构,这使得难以充分利用提取到的噪声残差;另一方面,大多数现有的隐写分析器缺乏对可能藏有秘密信息的纹理复杂的区域关注。


技术实现要素:

5.为解决上述问题,本发明提供了一种jpeg隐写分析方法及系统,在噪声提取阶段使用双路径网在保留隐写信号的基础上深入探索隐含特征;在噪声聚合阶段使用一种改进
的坐标注意力机制使模型迅速定位到可能藏有秘密信息的区域,提取更多有价值的特征,进而提高模型的性能。
6.为了达到上述目的,本发明提供如下技术方案:
7.一种jpeg隐写分析方法,包括如下步骤:
8.s1,构建基于双路径网络和改进的坐标注意力的jpeg隐写分析网络dcanet,包括噪声提取、噪声聚合及分类模块;所述噪声提取模块用于提取出输入图像的噪声残差分量,在保留噪声残差分量的基础上深入探索隐含特征,所述噪声聚合模块对前面提取到的噪声特征进行聚合统计,所述分类模块根据聚合后的特征判别图像是否含有秘密信息;
9.s2,准备数据集,将数据集划分为训练集、验证集和测试集,使用j-uniward和uerd这两种jpeg域自适应隐写算法对原始数据集进行隐写;
10.s3,dcanet模型的训练:使用随机梯度下降优化器adamax对提出的模型进行训练,每个epoch结束后对验证集进行检测,选取验证集准确率最高的模型作为最终模型应用到测试集上;
11.s4,利用训练好的网络模型对待测图像进行测试,根据预测的标签结果判定其中是否含有秘密信息。
12.进一步的,所述步骤s1包括以下子步骤:
13.s11,噪声提取模块包含预处理层和两个双路径模块;预处理层使用4个高通滤波器f
kv
、f
p
、fh和fv进行噪声残差的提取,其中f
kv
用来抑制图像本身内容,f
p
作为一个点高通滤波器,与f
kv
组合使用能够提取由jpeg隐写术引入的隐写信号;fh和fv分别是二阶水平和垂直gabor滤波器从不同的尺度和方向准确地描述图像纹理和边缘特征;这四个滤波器的参数在训练过程中进行更新;随后使用两个双路径模块实现了噪声特征的重用和挖掘,提取到了更深层次的特征;
14.s12,噪声聚合部分包括改进的坐标注意力模块和4个残差块,先通过改进的坐标注意力模块引导网络重点关注纹理复杂的可能藏有秘密信息的区域,通过残差连接实现了低层次特征和高层次特征的融合,随后使用4个残差块来聚合特征,并减小特征图的大小;
15.s13,分类模块使用全局协方差池化将特征图转换为特征向量,随后通过全连接层和softmax层得到判别结果。
16.进一步的,改进的坐标注意力模块实现如下功能:
17.首先,对输入s=[s1,s2,...,sc]∈r分别沿x轴方向和y轴方向进行一维平均池化操作,从而完成对每个通道的编码,获取空间上的精确位置信息;第c个通道在高度为h处的输出可以表示为:
[0018][0019]
其中,w代表特征图的宽度,sc(h,i)代表第c个通道在高度为h、宽度为i处进行平均池化后的特征值;随后对得到的特征向量首先沿着通道维度拼接,然后依次进行1
×
1的卷积、批量归一化处理和非线性操作,计算公式如下:
[0020]
f=δ(f1[zh,zw])
[0021]
其中,[,]表示特征向量的拼接运算,f1是卷积变换函数,作用是减少通道数量,δ是非线性激活函数,生成的f是包含水平和竖直方向信息的中间向量;接着,将f沿水平和竖
直方向分成两个独立的特征张量fh和fw,并通过两个1
×
1的卷积将其变换到和输入特征s具有相同的通道数,计算公式如下:
[0022]gh
=sigmoid(fh(fh))
[0023]gw
=sigmoid(fw(fw))
[0024]
其中,fh和fw都是卷积变换函数,gh和gw代表注意力权重;最后将输入特征图s和注意力权重对应相乘;在注意力模块中引入了残差连接,将输入与注意力输出相加形成残差学习模式,在不增加过多成本的条件下将高级特征和低级特征融合在一起;注意力模块的最终输出p表达如下:
[0025][0026]
进一步的,所述步骤s2包括以下子步骤:
[0027]
s21,调整数据集中图片大小,将数据集划分为训练集、验证集和测试集;
[0028]
s22,使用matlab中的imwrite函数分别以两种质量因子对图像进行压缩,得到不同质量因子的jpeg图像;
[0029]
s23,使用两种jpeg域自适应隐写方法j-uniward和uerd分别以4种不同嵌入率的秘密信息,共得到8个隐写数据集。
[0030]
进一步的,所述步骤s3包括以下子步骤:
[0031]
s31,使用随机梯度下降优化器adamax对提出的模型进行训练;
[0032]
s32,训练过程中使用合适的批数量,每个批次中的图像通过随机镜像和旋转90度进行数据增强,每次迭代后数据集被随机打乱防止模型过拟合;
[0033]
s33,将在高嵌入率隐写图像下训练的模型参数迁移到具有低嵌入率图像下,并在训练过程中对模型进行微调;
[0034]
s34,基于上述设置对网络进行训练,使用交叉熵作为损失函数,通过误检率来评估模型的性能。
[0035]
进一步的,通过如下公式评估模型性能:
[0036][0037]
其中,p
fa
和p
fn
分别表示虚警率和漏检率。
[0038]
进一步的,每次迭代后对模型进行保存,最后选取在验证集上分类准确率最高的模型作为步骤s4中训练好的网络模型应用到测试集进行测试。
[0039]
本发明还提供了一种jpeg隐写分析系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该计算机程序被加载至处理器时实现上述的jpeg隐写分析方法。
[0040]
与现有技术相比,本发明具有如下优点和有益效果:
[0041]
1.本发明提出的jpeg隐写分析网络,结合了不同网络的优点,可以使模型重点关注纹理复杂的可能藏有秘密信息的区域,相比典型的jpeg隐写分析方法取得了更好的检测结果。
[0042]
2.本发明噪声提取模块在预处理层之后没有直接进入噪声聚合模块,而是使用了两个双路径模块,结合残差网络和密集网络的优点,在保留隐写信号的基础上对隐含的特征进行深度探索,实现了噪声残差的重用和挖掘。
[0043]
3.本发明噪声聚合模块提出了一种改进的坐标注意力模块引导网络重点关注纹理复杂的区域,提取更多有利于隐写分析的特征,改进的残差连接将高层次特征和低层次特征结合,进一步提高注意力模块的学习能力。
[0044]
4.本发明采用j-uniward和uerd这两种jpeg域自适应隐写算法,在检测精度和泛化能力方面相对于srnet和danet有了明显的提升,同时实现了准确率和训练时间的平衡。
附图说明
[0045]
图1为本发明提供的jpeg隐写分析网络框架结构示意图。
[0046]
图2为噪声提取模块中双路径模块结构图。
[0047]
图3为改进的坐标注意力模块结构图;
[0048]
图4为残差模块结构图。
具体实施方式
[0049]
以下将结合具体实施例对本发明提供的技术方案进行详细说明,应理解下述具体实施方式仅用于说明本发明而不用于限制本发明的范围。
[0050]
本发明提供了一种jpeg隐写分析方法,包括如下步骤:
[0051]
s1,构建一种基于双路径网络和改进的坐标注意力的jpeg隐写分析网络dcanet,包括噪声提取、噪声聚合及分类模块;噪声提取模块专门负责提取出输入图像的噪声残差分量,并且在保留噪声残差分量的基础上深入探索隐含特征,噪声聚合模块对前面提取到的噪声特征进行聚合统计,分类模块根据聚合后的特征判别图像是否含有秘密信息。具体包括如下子步骤:
[0052]
(1.1)如图1所示,在jpeg隐写分析网络中,噪声提取模块包括预处理层和两个双路径模块,对应图1中的“preprocessing”、“dpb1”、“dpb2”。其中,预处理层使用了4个高通滤波器f
kv
、f
p
、fh和fv进行噪声残差的提取,其中f
kv
用来抑制图像本身内容,f
p
作为一个点高通滤波器,与f
kv
组合使用可以更好地提取由jpeg隐写术引入的隐写信号;fh和fv分别是二阶水平和垂直gabor滤波器从不同的尺度和方向准确地描述图像纹理和边缘特征。这四个滤波器的参数在训练过程中进行更新。
[0053]
残差网络可以重用图像特征且低冗余,但并不擅长挖掘新的图像特征,密集网络采用拼接的方式使得网络每一层都能接受到前面所有层的特征图,这种模式在训练时能够帮助网络挖掘到更多新的隐含特征。为了在尽可能保留隐写信号的基础上,挖掘出更深层次的隐含的特征,我们在预处理层之后采用了双路径网络模块(dpb)对噪声残差进行进一步的重用和深入探索。具体结构如图2所示。每个双路径块包含一种一个瓶颈块,该瓶颈块依次通过1
×
1卷积层、3
×
3卷积层和1
×
1卷积层,其中每个卷积层前面都是bn层和relu层。瓶颈块的输出分为两部分:64个特征图被添加到残差连接路径,其余16个特征图连接到密集连接路径。为了增强每个双路径块的学习能力,我们在3
×
3卷积层中使用分组卷。在dpb-1中,我们首先使用96个卷积核提高提取的噪声残差特征图的维数,并将所得的96个特征图分成两部分,其中32个特征图用于密集连接路径,其余64个特征图则用于残差连接。在dpb-2中,我们通过通道拼接的方式将两条路径的特征图融合得到一个输出,并将其输入到下一个模块中。
[0054]
(1.2)噪声聚合模块目的是将由噪声提取模块处理得到的噪声特征的统计信息进行聚合,同时减小特征图的大小,该模块包括一个改进的坐标注意力模块和四个残差块,分别对应于图1中的“ica”、“resblock”。jpeg自适应隐写算法大多根据图像的内容将秘密消息嵌入到复杂的纹理区域和边缘丰富的区域以获得更高的安全性,因此我们在噪声提取模块后添加了一个改进的坐标注意力模块引导网络重点关注这些可能藏有隐秘信息的区域,提取更多有用的特征。改进后的坐标注意力模块实现的功能具体包括坐标信息嵌入、坐标注意力生成和添加的残差连接,其设计如图3所示。首先,对输入s=[s1,s2,...,sc]∈r分别沿x轴方向和y轴方向进行一维平均池化操作,从而完成对每个通道的编码,获取空间上的精确位置信息。第c个通道在高度为h处的输出可以表示为:
[0055][0056]
其中,w代表特征图的宽度,sc(h,i)代表第c个通道在高度为h、宽度为i处进行平均池化后的特征值。随后对得到的特征向量首先沿着通道维度拼接,然后依次进行1
×
1的卷积、批量归一化处理和非线性操作,计算公式如下:
[0057]
f=δ(f1[zh,zw])
[0058]
其中,[,]表示特征向量的拼接运算,f1是卷积变换函数,作用是减少通道数量,δ是非线性激活函数,生成的f是包含水平和竖直方向信息的中间向量。接着,将f沿水平和竖直方向分成两个独立的特征张量fh和fw,并通过两个1
×
1的卷积将其变换到和输入特征s具有相同的通道数,计算公式如下:
[0059]gh
=sigmoid(fh(fh))
[0060]gw
=sigmoid(fw(fw))
[0061]
其中,fh和fw都是卷积变换函数,gh和gw代表注意力权重。最后将输入特征图s和注意力权重对应相乘。为了增强坐标注意力模块对图像细节特征的学习能力,我们对坐标注意力模块做了一定的改进,即在注意力模块中引入了残差连接,将输入与注意力输出相加形成残差学习模式,在不增加过多成本的条件下将高级特征和低级特征融合在一起。注意力模块的最终输出p表达如下:
[0062][0063]
每个残差块都有一个主干层和一个跳跃连接结构,如图4所示,残差块用于聚合特征,并减小特征图的大小。主干层依次由一个3
×
3卷积层、一个bn层、一个relu层、另一个3
×
3卷积层和一个bn层组成。考虑到公共平均池化在一定程度上削弱了隐写信号,我们通过将第二个3
×
3卷积层的步幅调整为2来实现特征图的降采样。该跳跃连接结构包括一个1
×
1的卷积层和一个bn层,其主要作用是调整维数,使输入可以直接添加到输出中。经过4个残差块后,得到一个大小为16
×
16
×
256的特征图。
[0064]
(1.3)分类模块的目的是根据聚合后的特征判定图像中是否含有秘密信息。首先,使用全局协方差池化替代常用的全局平均池化将256个16
×
16的特征图转换为维特征向量,然后将得到的特征向量输入到全连接层中。最后利用softmax函数计算概率分布并输出预测结果。
[0065]
s2,准备数据集,并按照4:1:5的比例将bossbase v1.01数据集划分为训练集、验
证集和测试集,使用j-uniward和uerd这两种jpeg域自适应隐写算法对原始数据集进行隐写;具体包括如下子步骤:
[0066]
(2.1)本发明中所用数据集来源于bossbase v1.01,其中包含10,000张512张
×
512张灰度图像。考虑到计算资源的限制,我们首先通过matlab中的“imrize”功能将图像大小调整到256
×
256。随机选择4000张图像进行训练,1000张进行验证,其余5000张用于测试。
[0067]
(2.2)为了生成jpeg格式的图像,使用matlab中的“imwrite”函数将原始图像进行压缩,质量因子分别为75和95,从而得到不同质量因子的jpeg图像。
[0068]
(2.3)对于每个质量因子,j-uniward和uerd这两种最先进的jpeg自适应隐写方法用来评估所提出的隐写分析方法的性能。使用matlab版本的代码实现了这两种隐写算法,分别嵌入0.1、0.2、0.3和0.4bpp的秘密数据,共得到了8个隐写数据集。为使结果更具有说服力,对比实验中所包含的所有网络模型都采用了相同的训练集、验证集和测试集。
[0069]
s3,dcanet模型的训练:使用随机梯度下降优化器adamax对提出的模型进行训练,每个epoch结束后对验证集进行检测,选取验证集准确率最高的模型作为最终模型应用到测试集上;具体包括如下子步骤:
[0070]
(3.1)使用随机梯度下降优化器adamax对提出的模型进行训练,其中动量值设为0.9,权重衰减率设置为0.0002。初始学习率设置为0.001,在训练150个epoch后衰减为0.0001,模型总共训练200个epoch;
[0071]
(3.2)考虑到gpu的限制,训练过程中使用的批数量为32(16个cover/stego对)。每个批次中的图像通过随机镜像和旋转90度进行数据增强,每次迭代后数据集被随机打乱防止模型过拟合;
[0072]
(3.3)为了进一步提高模型对于低嵌入率隐写图像的检测能力,对于相同类型的隐写算法,我们使用迁移学习的策略,即,我们将在高嵌入率隐写图像下训练的模型参数迁移到具有低嵌入率图像下,并在训练过程中对模型进行微调;对于嵌入率为0.4bpp、质量因子为95的隐写图像,我们将用质量因子为75、嵌入率为0.4bpp的隐写图像训练得到的模型参数来进行初始化并在训练过程中进行微调。
[0073]
(3.4)基于上述设置对网络进行训练,使用交叉熵作为损失函数,通过误检率来评估模型的性能。其数学表达式为:
[0074][0075]
其中,p
fa
和p
fn
分别表示虚警率和漏检率。
[0076]
s4,利用训练好的网络模型对待测图像进行测试,根据预测的标签结果判定其中是否含有秘密信息。作为改进,每次迭代后对模型进行保存,最后选取在验证集上分类准确率最高的模型应用到测试集进行测试。
[0077]
本发明还提供了一种jpeg隐写分析系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该计算机程序被加载至处理器时实现上述的jpeg隐写分析方法。
[0078]
本发明方案所公开的技术手段不仅限于上述实施方式所公开的技术手段,还包括由以上技术特征任意组合所组成的技术方案。应当指出,对于本技术领域的普通技术人员
来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表