一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种无参考图像质量评价方法及其系统与流程

2022-02-20 05:40:45 来源:中国专利 TAG:


1.本技术涉及图像处理系统性能评估技术领域,尤其涉及一种无参考图像质量评价方法及其系统。


背景技术:

2.随着科学技术的发展,成像技术在社交媒体、医学、农业、工业、交通、军事等领域得到了广泛的应用。但是在图像的获取、存储、传输和显示等过程中不可避免的会引入一些干扰因素,如噪声、模糊、数据丢失等,这些都会造成图像质量的下降。图像质量的好坏决定了图像信息的可信程度,影响人们对于图像的主观感受和信息量的获取。因此图像质量评价(image quality assessment,iqa)的研究受到人们的广泛重视。
3.图像质量评价分为主观评价方法和客观评价方法。主观评价由观察者对图像质量进行主观评分,一般采用平均主观得分(mean opinion score,mos)或平均主观得分差异(differentialmean opinion score,dmos)(即人眼对无失真图像和有失真图像评价得分的差异)表示,但主观评价工作量大、耗时长,使用起来很不方便;客观评价方法是由计算机根据一定方法计算得到图像的质量指标,根据评价时是否需要相应的清晰图像作为参考图像又可以分为全参考图像质量评价(full-reference image quality assessment,fr-iqa)、半参考图像质量评价(reduced-reference image quality assessment,rr-iqa)和无参考图像质量评价(no-reference image quality assessment,nr-iqa)三类。
4.fr-iqa方法在评价失真图像时,需要提供一个无失真的原始图像,经过对二者的比对,得到一个对失真图像的评价结果,这类方法的准确性较好,但其缺点是需要提供无失真的参考图像,这在实际应用中往往很难得到。
5.rr-iqa方法不需要将失真图像与原始图像相比较,而只需要将失真图像的某些特征与原始图像的相同特征进行比较,多应用于数字水印验证、视频质量监控和码流率控制等领域。
6.nr-iqa方法根据失真图像自身的特征来估计图像的质量,完全无需参考图像。无参考方法最具实用价值,有着非常广泛的应用范围。但正是由于没有参考图像,以及图像内容的千变万化,使得无参考图像质量评价相对更为困难。nr-iqa方法分为传统无参考图像质量评价方法和基于神经网络的无参考图像质量评价方法。传统无参考图像质量方法基于空域/频域提取图像特征信息,通过简单加权或滤波处理图像特征等到图像质量评价结果。基于神经网络的无参考图像质量评价方法通过神经网络实现由图像特征到图像质量的映射,从而评价图像质量。
7.模糊是图像质量损失最常见的原因,产生模糊的原因由两种:人工模糊和自然模糊人工模糊和自然模糊。人工模糊是通过不同类型的滤波器在参考图像中人为加入不同类型的失真类型,而自然模糊是取自真实图像由物体的运动或相机的抖动等引起的。
8.人工模糊图像通常采用高斯模糊降质,将参考图像与高斯滤波器卷积得到失真图像,模拟生活中比较常见的失焦模糊。自然模糊图像取自生活中真实发生模糊的图像,除了
失焦模糊外还包括运动模糊、混合模糊,如果在拍摄长距离场景时相机只是稍微平移,得到的模糊近似空间不变,会产生由于线性运动模糊,当远距离成像遇到湍流时,还会产生大气湍流模糊等。多种模糊情况的存在导致自然模糊图像包含多种失真类型的无序混合,难以通过数学模型实现拟合。
9.附图1中上面四张图为人工模糊图像,下面四张图为自然模糊图像,通过对比可以看出人工模糊图像的虽然模糊效果较好,但失真具有明显的规律性,而自然模糊图像的失真的规律性差,更加无序,包含色彩、光照等多种变化。
10.随着研究的深入,传统的无参考图像质量评价方法和基于神经网络的无参考图像质量评价方法对于人工模糊图片具有较好的评价效果,但对于自然模糊图像的评价效果较差。


技术实现要素:

11.本技术的目的在于针对上述现有技术的不足,提供一种无参考图像质量评价系统及其评价方法。
12.一种无参考图像质量评价系统,其包括:图像输入系统、特征提取系统、质量评价网络系统;所述图像输入系统的输出端与所述特征提取系统的输入端连接,所述特征提取系统的输出端与质量评价网络系统的输入端连接;
13.其中,所述图像输入系统用于选择图片;
14.其中,所述特征提取系统用于求解所述图像输入系统输入的图像的nss特征矩阵、简单特征矩阵和注意力机制特征、质量评价特征矩阵;
15.其中,所述质量评价网络系统用于求解图片质量估计值。
16.进一步,所述特征提取系统包括:卷积神经网络子系统、注意力机制特征增强网络子系统;
17.所述卷积神经网络子系统包括深度卷积神经网络以及浅层卷积神经网络,输入的图像通过深度卷积神经网络提取图像的nss特征矩阵f
nss
、通过浅层卷积神经网络提取图像的简单特征矩阵f
ba
以及得分向量
18.所述注意力机制特征增强网络子系统,其通过所述卷积神经网络子系统的得分向量简单特征矩阵f
ba
,求解质量评价特征矩阵fq:
19.浅层卷积神经网络的输出包括:简单特征矩阵f
ba
以及图片对应每类物体的得分向量其中l代表特征向量的个数;
20.简单特征矩阵和得分向量作为所述注意力机制特征增强网络子系统的输入,所述注意力机制特征增强网络子系统的输出为注意力特征f
sign
、质量评价特征矩阵fq:
21.所述注意力机制特征增强网络子系统的求解过程步骤如下:
22.a.计算得分向量的抑制向量
[0023][0024]
b.计算参数
[0025]
将输入到全连接层神经网络中,求解即作为全连接层神经网络的
输入值,输出结果为作为全连接层神经网络的输入值,输出结果为
[0026]
c.计算特征向量差以及计算上述特征向量差中的每个特征差值ei的权重θi:
[0027][0028]
输入到mlp多层感知机(实质也是一种神经网络)中,mlp神经网络输出结果为θi;上述过程可用下述数学公式来表述:
[0029][0030]
其中mlp代表多层感知机,ω4是mlp多层感知机的权重标志;
[0031]
d.根据权值θi对输入的特征向量进行筛选,得到显著性强的特征集合f1:
[0032]fba
是由l个特征向量构成的特征矩阵,其中每个特征向量与得分向量中的分值ai,得分差值ei和权值θi一一对应;将θi按照大小进行排序,选择前30%权值对应的特征向量予以保留作为显著性强的特征,其余特征向量改为0向量,得到显著性强的特征集合f1;
[0033]
上述举例说明如下:
[0034]
若θ5的大小属于前30%,就保留;若θ5的大小不在前30%,
[0035]
e.采用1
×
1卷积神经网络,调整简单特征矩阵f
ba
,得到特征f2:
[0036]
矩阵f
ba
输入到1
×
1卷积神经网络,得到矩阵f2,也即,矩阵f
ba
的数据作为1
×
1卷积神经网络的输入数据,1
×
1卷积神经网络的输出数据作为矩阵f2;
[0037]
f.计算最终的注意力特征f
sign

[0038]fsign
=f1·
f2[0039]
g.采用向量融合的方法将简单特征矩阵f
ba
、nss特征矩阵f
nss
和注意力特征f
sign
结合,得到质量评价特征矩阵fq:
[0040][0041]
其中α(即注意力机制权重)是控制显著性图重要性的一个非负参数。
[0042]
进一步,将质量评价特征矩阵fq作为输入值,通过所述质量评价网络求取图像质量估计值。
[0043]
进一步,α为0.3。
[0044]
进一步,在步骤s100前,还包括:通过数据集训练各个神经网络
[0045]
一种无参考图像质量评价方法的应用,得到图像质量评价分数后,根据图像质量分数判断图像成像质量,选择性去除成像质量低帧的图像,防止因某一帧模糊而导致的跟踪漂移。
[0046]
一种无参考图像质量评价方法,其特征在于,包括以下步骤:
[0047]
s100,读取图像;
[0048]
s200,对步骤s100获取的图像,提取自然图像统计特征:
[0049]
步骤s100获取的图像作为输入量,通过深层卷积神经网络输出nss特征矩阵
[0050]
s300,对步骤s100获取的图像,求解简单特征矩阵以及得分向量:
[0051]
步骤s100获取的图像作为输入量,使用浅层卷积神经网络scnn,输出为:简单特征矩阵f
ba
以及图片对应每类物体的得分向量其中l代表特征向量的个数;
[0052]
s400,求解质量评价特征矩阵;
[0053]
s500,求取图像质量估计值。
[0054]
进一步,所述步骤s400包括:
[0055]
s401,计算得分向量的抑制向量:
[0056][0057]
s402,计算参数
[0058][0059][0060]
其中ω3代表全连接层的权重,mean代表对向量的每一项取均值;
[0061]
s403,计算特征向量差以及计算上述特征向量差中的每个特征差值ei的权重θi:
[0062][0063]
输入到mlp多层感知机中,mlp神经网络输出结果为θi;
[0064]
s404,根据权值θi对f
ba
进行筛选,得到显著性强的特征矩阵f1:
[0065]fba
是由l个特征向量构成的特征矩阵,其中每个特征向量与得分向量中的分值ai、权值θi一一对应;
[0066]
将θi按照大小进行排序,选择前30%权值对应的特征向量予以保留作为显著性强的特征,其余特征向量改为0向量,得到显著性强的特征矩阵f1;
[0067]
s405,采用1
×
1卷积神经网络,调整简单特征矩阵f
ba
,得到特征f2:
[0068]
矩阵f
ba
输入到1
×
1卷积神经网络,得到矩阵f2,也即,矩阵f
ba
的数据作为1
×
1卷积神经网络的输入数据,1
×
1卷积神经网络的输出数据作为矩阵f2;
[0069]
s406,计算最终的注意力特征f
sign

[0070]fsign
=f1·
f2[0071]
s407,采用向量融合的方法将简单特征矩阵f
ba
、nss特征矩阵f
nss
和注意力特征f
sign
结合,得到质量评价特征矩阵fq:
[0072][0073]
其中α指的是注意力机制权重,是一个非负参数
[0074]
进一步,所述步骤s400包括:
[0075]
0.2≤α≤0.5。
[0076]
进一步,所述步骤s400包括:
[0077]
α=0.3。
[0078]
进一步,包括以下步骤:在步骤s100前,还包括:通过数据集训练各个神经网络
[0079]
本技术的有益效果在于:
[0080]
第一,本技术提出了一种注意力机制引导的基于神经网络的无参考图像质量评价方法及系统,其核心构思在于:引入了注意力机制。对于自然模糊图像的评价精度相比于其他基于卷积神经网络的无参考图像质量评价方法具有非常显著的效果(能够提升了14%~
40%),能够满足大部分领域对于图片质量评价的效果需求。
[0081]
上述具体体现在:
[0082]
所述注意力机制特征增强网络子系统的求解过程:
[0083]
a.计算得分向量的抑制向量
[0084][0085]
b.计算参数
[0086]
将输入到全连接层神经网络中,求解即作为全连接层神经网络的输入值,输出结果为作为全连接层神经网络的输入值,输出结果为
[0087]
c.计算特征向量差以及计算上述特征向量差中的每个特征差值ei的权重θi:
[0088][0089]
d.根据权值θi对输入的特征向量进行筛选,得到显著性强的特征集合f1:
[0090]fba
是由l个特征向量构成的特征矩阵,其中每个特征向量与得分向量中的分值ai,得分差值ei和权值θi一一对应;将θi按照大小进行排序,选择前30%权值对应的特征向量予以保留作为显著性强的特征,其余特征向量改为0向量,得到显著性强的特征集合f1;
[0091]
上述举例说明如下:
[0092]
若θ5的大小属于前30%,就保留;若θ5的大小不在前30%,
[0093]
e.采用1
×
1卷积神经网络,调整简单特征矩阵f
ba
,得到特征f2:
[0094]
矩阵f
ba
输入到1
×
1卷积神经网络,得到矩阵f2,也即,矩阵f
ba
的数据作为1
×
1卷积神经网络的输入数据,1
×
1卷积神经网络的输出数据作为矩阵f2;
[0095]
f.计算最终的注意力特征f
sign

[0096]fsign
=f1·
f2[0097]
g.采用向量融合的方法将简单特征矩阵f
ba
、nss特征矩阵f
nss
和注意力特征f
sign
结合,得到质量评价特征矩阵fq:
[0098][0099]
其中α(即注意力机制权重)是控制显著性图重要性的一个非负参数。
[0100]
第二,本技术通过实际案例,即选择了两个人工模糊数据集和一个自然模糊数据集,对包含本技术的方法在内的八种方法进行性能验证与对比;验证了本技术的方法的有效性。同时,发现:α为0.3效果最佳。
[0101]
第三,本技术的意义在于:图像质量评价算法得到的图像质量分数直接反映图像的模糊程度,质量分数越低代表图像越模糊,即图像的成像质量越差。图像质量分数是图像中所获取信息的可信度的量化表达方式,质量分数高的图像中得到的信息真实可靠,反之则可信度较低,其可以用于多种领域。在传统的图像融合中,红外图像、雷达图像、可见光图像的融合通常采用等比例融合或按照固定权值加权融合的方法,没有考虑天气、时间、光照、成像设备损坏等因素对于其中一种或两种图像成像质量的影响,这导致了大部分图像融合算法的抗干扰性较差。而应用本技术的图像质量评价算法后,可以根据图像质量分数
判断图像成像质量,选择性去除成像质量低帧的图像,防止因某一帧模糊而导致的跟踪漂移。
[0102]
第四,本技术的应用效果:对于模糊图像数据集,本算法的plcc系数可以达到0.870,srocc系数可以达到0.849,对于85%以上的图像具有超过80%的精确度,满足大部分领域对于图片质量评价的效果要求。相比于传统基于神经网络无参考图像质量评价算法最多提升了40%,相比于改进模型的基于神经网络的无参考图像质量评价算法提升了14%以上。
附图说明
[0103]
下面结合附图中的实施例对本技术作进一步的详细说明,但并不构成对本技术的任何限制。
[0104]
图1为人工模糊图像与自然模糊图像示意图。
[0105]
图2为本技术的无参考图像质量评价系统设计图。
具体实施方式
[0106]
为将本技术所述技术方案更清楚、深入、完整的描述,将根据附图说明从具体实施角度进行阐述,所述实施例是本技术的一部分实施例,而不是全部的实施例,所述实施例仅提供一种实施所提创新点的一种途径,并非唯一,不排除采用其它途径实现上述已经提到的发明。
[0107]
实施例1:本技术提出了一种注意力机制引导的基于神经网络的无参考图像质量评价方法(combined attentional mechanism deep learing network,cadnet),在现有基于神经网络方法的基础上引入了注意力机制,融合了多种特征。方法在保证对人工模糊数据集评价效果不变的情况下,对于自然模糊图像的评价精度相比于其他基于卷积神经网络的无参考图像质量评价方法最少提升了14%,最多提升了40%左右,能够满足大部分领域对于图片质量评价的效果需求。
[0108]
[方法设计]
[0109]
一种注意力机制引导的基于神经网络的无参考图像质量评价方法,包括以下步骤:
[0110]
s100,读取图像;
[0111]
s200,对步骤s100获取的图像,提取自然图像统计特征(步骤s200对应的执行机构是特征提取系统的卷积神经网络子系统):步骤s100获取的图像作为输入量,通过深层卷积神经网络(dcnn)输出nss特征矩阵(使用深层卷积神经网络处理图像的方式属于现有技术:https://blog.csdn.net/wutongyutt/article/details/80496860):
[0112]
s300,对步骤s100获取的图像,求解简单特征矩阵以及得分向量(步骤s300对应的执行机构是特征提取系统的卷积神经网络子系统,其中,本技术的浅层卷积神经网络scnn可采用vggnet16网络):
[0113]
步骤s100获取的图像作为输入量,使用浅层卷积神经网络scnn,输出为:简单特征矩阵f
ba
以及图片对应每类物体的得分向量其中l代表特征向量的个数;
[0114]
s400,求解质量评价特征矩阵(步骤s400对应的执行机构是特征提取系统的注意
力机制特征增强网络子系统);
[0115]
注意力机制特征可分为基于位置的注意力机制特征和基于项的注意力机制特征;基于位置的注意力机制特征的输入是具有空间维度的特征,基于项的注意力的输入是具有序列性的特征向量,采用位置与项结合的注意力机制特征;
[0116]
s400具体包括以下子步骤:
[0117]
s401,计算得分向量的抑制向量:
[0118][0119]
s402,计算参数
[0120][0121][0122]
其中ω3代表全连接层的权重,mean代表对向量的每一项取均值;
[0123]
s403,计算特征向量差以及计算上述特征向量差中的每个特征差值ei的权重θi:
[0124][0125]
输入到mlp多层感知机中,mlp神经网络输出结果为θi;
[0126]
s404,根据权值θi对f
ba
进行筛选,得到显著性强的特征矩阵f1:
[0127]fba
是由l个特征向量构成的特征矩阵,其中每个特征向量与得分向量中的分值ai、权值θi一一对应;
[0128]
将θi按照大小进行排序,选择前30%权值对应的特征向量予以保留作为显著性强的特征,其余特征向量改为0向量,得到显著性强的特征矩阵f1;
[0129]
s405,采用1
×
1卷积神经网络,调整简单特征矩阵f
ba
,得到特征f2:
[0130]
矩阵f
ba
输入到1
×
1卷积神经网络,得到矩阵f2,也即,矩阵f
ba
的数据作为1
×
1卷积神经网络的输入数据,1
×
1卷积神经网络的输出数据作为矩阵f2;
[0131]
s406,计算最终的注意力特征f
sign

[0132]fsign
=f1·
f2[0133]
s407,采用向量融合的方法将简单特征矩阵f
ba
、nss特征矩阵f
nss
和注意力特征f
sign
结合,得到质量评价特征矩阵fq:
[0134][0135]
其中α指的是注意力机制权重,是一个非负参数。
[0136]
s500,求取图像质量估计值(步骤s500对应的执行机构是质量评价网络):
[0137]
将质量评价特征矩阵fq作为输入值,然后求解图像质量估计值(该步骤属于现有技术)。
[0138]
[结构设计]
[0139]
一种注意力机制引导的基于神经网络的无参考图像质量评价系统,其包括:图像输入系统、特征提取系统、质量评价网络系统;
[0140]
所述图像输入系统的输出端与所述特征提取系统的输入端连接,所述特征提取系统的输出端与质量评价网络系统的输入端连接;
[0141]
所述特征提取系统用于求解所述图像输入系统输入的图像的nss特征矩阵、简单
特征矩阵和注意力机制特征;
[0142]
所述质量评价网络系统用于求解图片质量估计值。
[0143]
其中,特征提取系统包括:提取自然图像统计(natural scene statistics,nss)特征的卷积神经网络子系统、注意力机制特征增强网络子系统;
[0144]
所述卷积神经网络子系统,使用了深度卷积神经网络(deep convolutional neural networks,dcnn)提取了图像的nss特征矩阵(即自然图像统计特征natural scene statistics),且使用了浅层卷积神经网络(shallow convolutional neural networks,scnn)提取图像的简单特征矩阵。
[0145]
所述注意力机制特征增强网络子系统,其通过所述卷积神经网络子系统的得分向量简单特征矩阵f
ba
,求解质量评价特征矩阵fq;
[0146]
其中,所述质量评价网络(采用现有技术)包括:全局平均池化层子系统(global average pooling,gap)和深度神经网络子系统(deep neural networks,dnn);
[0147]
所述全局平均池化层子系统,其输入为融合特征,输出为特征向量(用于将融合特征降维成便于处理的特征向量;全局平均池化层通过特征图与通道的对应关系,简化了卷积结构,此外相比于全连接层,它的参数更少,不需要进行参数优化,可以有效的防止过拟合);
[0148]
所述深度神经网络子系统将所述全局平均池化层子系统输出的特征向量作为输入值,其输出为图像质量估计值。
[0149]
需要说明的是:所述注意力机制特征增强网络子系统,包括:全连接层神经网络、mlp多层感知机、1
×
1卷积神经网络(1
×
1卷积层)(这三个神经网络需要事前训练)。
[0150]fba
是由l个特征向量构成的特征矩阵,
[0151]
其设计要点在于以下四点:
[0152]
第一,全连接层神经网络、mlp多层感知机的目的,是为了求解θ1~θ
l
(l个数值);
[0153]
第二,基于θ1~θ
l
对f
ba
操作,求解得出f1;
[0154]
第三,求解f2为了增加f
ba
特征的非线性,提高fba的特征表达能力;
[0155]
第四,α如何计算,即其大小多少有利。
[0156]
其中,所述注意力机制特征增强网络子系统的求解过程步骤如下:
[0157]
a.计算得分向量的抑制向量
[0158][0159]
b.计算参数
[0160]
将输入到全连接层神经网络中,求解即作为全连接层神经网络的输入值,输出结果为作为全连接层神经网络的输入值,输出结果为
[0161]
c.计算特征向量差以及计算上述特征向量差中的每个特征差值ei的权重θi:
[0162][0163]
输入到mlp多层感知机(实质也是一种神经网络)中,mlp神经网络输出结果为θi;上述过程可用下述数学公式来表述:
[0164][0165]
其中mlp代表多层感知机,ω4是mlp多层感知机的权重标志;
[0166]
d.根据权值θi对输入的特征向量进行筛选,得到显著性强的特征集合f1:
[0167]fba
是由l个特征向量构成的特征矩阵,其中每个特征向量与得分向量中的分值ai,得分差值ei和权值θi一一对应;将θi按照大小进行排序,选择前30%权值对应的特征向量予以保留作为显著性强的特征,其余特征向量改为0向量,得到显著性强的特征集合f1;
[0168]
上述举例说明如下:
[0169]
若θ5的大小属于前30%,就保留;若θ5的大小不在前30%,
[0170]
e.采用1
×
1卷积神经网络,调整简单特征矩阵f
ba
,得到矩阵f2:
[0171]
矩阵f
ba
输入到1
×
1卷积神经网络,得到矩阵f2,也即,矩阵f
ba
的数据作为1
×
1卷积神经网络的输入数据,1
×
1卷积神经网络的输出数据作为矩阵f2;
[0172]
f.计算最终的注意力特征f
sign

[0173]fsign
=f1·
f2[0174]
g.采用向量融合的方法将简单特征矩阵f
ba
、nss特征矩阵f
nss
和注意力特征f
sign
结合,得到质量评价特征矩阵fq:
[0175][0176]
其中α(即注意力机制权重)是控制显著性图重要性的一个非负参数。
[0177]
[效果验证]
[0178]
为验证方法效果,选择了两个人工模糊数据集和一个自然模糊数据集,对包含本技术的方法在内的八种方法进行性能验证与对比。
[0179]
采用的人工数据集为:德克萨斯大学的图像与视频工厂实验室数据集(laboratory for image and video engineering,live)和2013年更新的坦佩雷图像数据集(tampere image database 2013,tid2013)。live数据集中含有29张原始图像和779张失真图像,5种失真类型,其中jpeg压缩图像175幅、jpeg2000压缩图像169幅、白噪声图像145幅、高斯模糊图像145幅、快速衰落图像145幅,每个失真类型包含4或5个失真级别,图像大小多为768
×
512。tid2013数据集中含有25张原始图像和3000张失真图像,17中失真类型,每个失真类型包含4个级别,图像大小为512
×
384。采用的自然模糊数据集为:德克萨斯大学的自然失真数据集(live in the wild image quality challenge database,clive)。clive包含1162张真实拍摄的模糊图片,分辨率为500
×
500。
[0180]
选取了两种nr-iqa评价指标评价方法性能:斯皮尔曼秩相关系数(spearman`s rank ordered correlation coefficient,srocc)和皮尔逊线性相关系数(pearson linear correlation coefficient,plcc),前者用于衡量方法估计值的单调性,后者用于描述方法估计值与真实值之间的相关性,这两个指标越接近1,表示方法的性能越好。
[0181]
方法训练时采用sgd with momentum,网络所有权重由预训练模型初始化,学习率设置为0.01,学习率设置为0.94,权重衰减系数为0.0005,训练次数为100代。将每个数据集
随机分为两个子集,80%的图像用于训练,20%用于测试,每个评价参数的结果是在重复五次数据随机分配过程后的平均值。注意力机制权重α分别设置为0.3,以突出图像原始特征的重要性,如表1所示。
[0182]
表1实验结果
[0183][0184][0185]
在人工模糊数据集上,结合了注意力机制模块的cadnet方法性能并不突出,在参考图片、模糊图片数量较少的live数据集上,与性能最好的sfa方法相比,srocc降低了3.11%,plcc降低了2.78%,与其他基于深度网络的nr-iqa方法的性能差距在3%以内。其原因是cadnet的主干网络较为简单且网络深度较浅,虽然引入了相关性特征与注意力特征,一定程度上弥补了图像简单特征矩阵描述能力差的问题,但其对于简单的人工模糊图像数据集的性能仍与使用resnet50作为主干网络的nr-iqa方法有一些差据。而在自然模糊数据集clive上,cadnet取得了相当不错的成绩,与sgdnet、db-cnn方法的性能基本相同,但前者需要预先提供显著性图片数据集,无法对未知图像进行评价,后者使用了双线性模型评估图像失真类型,速度较慢。相比于其他基于卷积神经网络的nr-iqa方法,cadnet性能最少提高了14%,最多提高了超过40%。
[0186]
为了验证注意力机制对于方法性能的作用,将cadnet的注意力机制权重分别设置为0、0.1、0.2、0.4、0.5,做了五组对照实验,结果如表2所示。
[0187]
从表2中可以看出:
[0188]
1)随着注意力机制的引入,方法性能显著性增强。
[0189]
2)在图像数量较少、失真情况较为简单的live人工模糊数据集上,随着注意力特征权重的增加,方法性能缓慢提高。当α为0.5时,性能提高了2%以上。
[0190]
3)在更加复杂的tid2013数据集上,随着注意力特征权重的增加,方法性能显著提高,当α为0.5时,性能提高了15%左右。而在自然模糊数据集clive上,随着注意力机制的引入,方法性能显著提高,当α为0.3时,性能提高了55%以上。当注意力特征权重过大时,降低了图像本身特征与质量预测任务的重要性,导致方法在自然模糊数据集上性能降低。由此可以看出,注意力机制的引用可以显著提高nr-iqa方法的性能。
[0191]
表2注意力机制效果验证
[0192][0193][0194]
以上所举实施例为本技术的较佳实施方式,仅用来方便说明本技术,并非对本技术作任何形式上的限制,任何所属技术领域中具有通常知识者,若在不脱离本技术所提技术特征的范围内,利用本技术所揭示技术内容所作出局部更动或修饰的等效实施例,并且未脱离本技术的技术特征内容,均仍属于本技术技术特征的范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献