一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种确定图片类型的方法和装置与流程

2021-12-07 21:15:00 来源:中国专利 TAG:


1.本发明涉及计算机技术领域,尤其涉及一种确定图片类型的方法和装置。


背景技术:

2.图片内容审查系统中的如图1所示,左图为原始图片(原始图片的内容是熊猫,人为规定包含有熊猫的图片是违规类型图片),中间图为噪音图片/攻击噪音,在人眼所见的信息不变的情况下,利用梯度上升方法把噪音图片加入到原始图片中即可得到右图的攻击图片。攻击图片的内容实际是熊猫,但是采用图片内容审查系统中的分类模型识别到的内容却是长臂猿,从而确定攻击图片不是违规类型图片,分类结果的置信概率高达99.3%。为了解决上述问题,现有技术中通过同时采用多个不同结构的分类模型对图片进行类型识别,并为多个模型设置不同的权重系数,以保证所确定的图片类型的准确性。
3.在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
4.现有技术中多个不同结构的分类模型均需要训练,导致确定图片类型的成本较高,且各不同的分类模型的权重系数的设置方式难以统一,导致分类模型对攻击噪音的防御能力和稳定性较差,所确定的图片类型的准确率较低。


技术实现要素:

5.有鉴于此,本发明实施例提供一种确定图片类型的方法和装置,通过对待分类图片中的像素进行处理得到多个第一图片,利用同一分类模型对该多个第一图片进行图片类型识别,降低了确定图片类型的成本,提升了分类模型对攻击噪音的防御能力和稳定性,提高了所确定图片类型的准确率。
6.为实现上述目的,根据本发明实施例的第一方面,提供了一种确定图片类型的方法,包括:
7.获取目标图片,基于对目标图片中的像素进行处理得到多个第一图片;
8.基于神经网络模型分别提取多个第一图片中的特征向量,将特征向量输入分类模型中进行分类处理,得到多个分类结果,多个分类结果与多个第一图片相对应;
9.根据多个分类结果确定目标图片的类型。
10.在一个实施例中,基于对目标图片中的像素进行处理得到多个第一图片的步骤包括:
11.对目标图片进行数据增强处理,以使得目标图片中像素点的产生位置偏移,进而得到第一图片,其中,数据增强处理包括下列处理方式中的至少一种:旋转处理、缩小处理、放大处理和平移处理。
12.在一个实施例中,在数据增强处理为旋转处理、缩小处理和平移处理中的至少一种时,基于对目标图片进行数据增强处理得到第一图片的步骤包括:
13.根据数据增强处理方式指示的偏移幅度和偏移方向对目标图片进行处理,得到第二图片,其中,偏移幅度是根据目标图片的大小确定的;
14.确定目标图片与第二图片对应的非重叠区域;
15.将非重叠区域内各像素点对应的像素值调整为目标图片的像素均值,得到调整后的非重叠区域;
16.将调整后的非重叠区域,以及第二图片与目标图片的重叠区域进行组合,得到第一图片。
17.在一个实施例中,在数据增强处理为放大处理时,基于对目标图片进行数据增强处理得到第一图片的步骤包括:
18.根据放大比例对目标图片进行放大处理,得到第二图片;
19.确定第二图片与目标图片的重叠区域为第一图片。
20.在一个实施例中,基于对目标图片中的像素进行处理得到多个第一图片的步骤还包括:
21.基于对目标图片中的像素进行滤波处理,以使得目标图片中像素点对应的像素值发生更改,进而得到第一图片;其中,滤波处理包括下列处理方式中的至少一种:方框滤波处理、均值滤波处理、高斯滤波处理、中值滤波处理和双边滤波处理。
22.在一个实施例中,根据多个分类结果确定目标图片的类型的步骤包括:
23.根据多个分类结果和投票规则确定目标图片的类型。
24.在一个实施例中,根据多个分类结果确定目标图片的类型的步骤还包括:
25.将多个分类结果进行加权处理,根据加权结果和结果数量阈值确定目标图片的类型。
26.为实现上述目的,根据本发明实施例的第二方面,提供了一种确定图片类型的装置,包括:
27.目标图片获取模块,用于获取目标图片,基于对目标图片中的像素进行处理得到多个第一图片;
28.分类处理模块,用于基于神经网络模型分别提取多个第一图片中的特征向量,将特征向量输入分类模型中进行分类处理,得到多个分类结果,多个分类结果与多个第一图片相对应;
29.类型确定模块,用于根据多个分类结果确定目标图片的类型。
30.为实现上述目的,根据本发明实施例的第三方面,提供了一种电子设备,包括:
31.一个或多个处理器;
32.存储装置,用于存储一个或多个程序,
33.当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上述任一种确定图片类型的方法。
34.为实现上述目的,根据本发明实施例的第四方面,提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上述任一种确定图片类型的方法。
35.上述发明中的一个实施例具有如下优点或有益效果:因为采用获取目标图片,基于对目标图片中的像素进行处理得到多个第一图片;基于神经网络模型分别提取多个第一图片中的特征向量,将特征向量输入分类模型中进行分类处理,得到多个分类结果,多个分类结果与多个第一图片相对应;根据多个分类结果确定目标图片的类型的技术手段,解决了现有技术中由于多个不同结构的分类模型均需要训练,导致确定图片类型的成本较高,
且各不同的分类模型的权重系数的设置方式难以统一,导致分类模型对攻击噪音的防御能力和稳定性较差,所确定的图片类型的准确率较低的技术问题,进而实现了通过对待分类图片中的像素进行处理得到多个第一图片,利用同一分类模型对该多个第一图片进行图片类型识别,降低确定图片类型的成本,提升分类模型对攻击噪音的防御能力和稳定性,提高所确定图片类型的准确率的技术效果。
36.上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
37.附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
38.图1是现有技术中原始图片、噪音图片和最终图片的示意图;
39.图2是根据本发明第一实施例提供的确定图片类型的方法的主要流程的示意图;
40.图3a是根据本发明第二实施例提供的确定图片类型的方法的主要流程的示意图;
41.图3b是图3a所述方法中对目标图片进行旋转处理的示意图;
42.图3c是图3a所述方法中对目标图片进行放大处理和缩小处理的示意图;
43.图3d是图3a所述方法中对目标图片进行平移处理的示意图;
44.图4是根据本发明实施例提供的确定图片类型的装置的主要模块的示意图;
45.图5是本发明实施例可以应用于其中的示例性系统架构图;
46.图6是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
47.以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
48.需要指出的是,在不冲突的情况下,本发明中的实施例以及实施例中的特征可以互相组合。
49.为了解决现有技术存在的问题,本发明第一实施例提供了一种确定图片类型的方法,如图2所示,该方法主要包括:
50.步骤s201,获取目标图片,基于对目标图片中的像素进行处理得到多个第一图片。
51.具体地,根据本发明实施例,通过对目标图片(目标图片是指审查图片内容和/或待确定图片类型的图片)中的像素进行处理,以使得像素点发生位置偏移和/或像素点对应的像素值发生变化,从而得到多个第一图片。在对目标图片中的像素进行处理的过程中,也使得攻击噪音对应的像素点产生位置偏移和/或像素点对应的像素值发生变化,从而让叠加在目标图片上的攻击噪音失效。这是由于攻击噪音是通过神经网络的梯度提升方法针对特定图片训练得到的,因此神经网络输入层向量(图片被拉成一维)即使发生一个神经元的位移(攻击噪音发送位置偏移),也会造成该特定攻击向量(指攻击噪音对应的特征向量)(图片被拉成一维)的失效,进而提高了后续利用分类模型对该多个第一图片进行类型识别
的准确率。
52.进一步地,根据本发明实施例,上述基于对目标图片中的像素进行处理得到多个第一图片的步骤包括:
53.对目标图片进行数据增强处理,以使得目标图片中像素点的产生位置偏移,进而得到第一图片,其中,数据增强处理包括下列处理方式中的至少一种:旋转处理、缩小处理、放大处理和平移处理。
54.需要说明的是,根据本发明实施例,上述对目标图片进行数据增强处理,使得目标图片中像素点产生几个像素的位移即可,(如产生一个像素点的位移或两个像素点的位移),较少的偏移幅度即可使得叠加在目标图片上的攻击噪音产生移位,从而使得攻击噪音失效。若是偏移幅度过大,会降低分类模型的识别准确率。
55.通过上述设置,对目标图片进行数据增强处理使得目标图片中像素点的产生位置偏移,进而完成对目标图片中的像素进行处理,得到多个第一图片。同时,通过对目标图片进行数据增强处理得到的多个第一图片,后续即可采用同一分类模型对该多个第一图片进行分类处理,得到多个分类结果,进而根据多个分类结果确定目标图片的类型。避免了现有技术中对多个分类模型分别进行训练产生较高成本的情形。
56.优选地,根据本发明实施例,上述在数据增强处理为旋转处理、缩小处理和平移处理中的至少一种时,基于对目标图片进行数据增强处理得到第一图片的步骤包括:
57.根据数据增强处理方式指示的偏移幅度和偏移方向对目标图片进行处理,得到第二图片,其中,偏移幅度是根据目标图片的大小确定的;
58.确定目标图片与第二图片对应的非重叠区域;
59.将非重叠区域内各像素点对应的像素值调整为目标图片的像素均值,得到调整后的非重叠区域;
60.将调整后的非重叠区域,以及第二图片与目标图片的重叠区域进行组合,得到第一图片。
61.通过上述设置,采用增强处理使得像素点的移位,从而使通过针对性训练获得的攻击噪音失效,提升了分类模型对攻击噪音的防御能力和稳定性。
62.优选地,根据本发明实施例,上述在数据增强处理为放大处理时,基于对目标图片进行数据增强处理得到第一图片的步骤包括:
63.根据放大比例对目标图片进行放大处理,得到第二图片;
64.确定第二图片与目标图片的重叠区域为第一图片。
65.通过上述设置,得到的第一图片中显著降低了攻击噪音对目标图片的影响,提高了后续利用分类模型获得的分类结果对确定图片类型的准确率。
66.可替代地,根据本发明实施例,上述基于对目标图片中的像素进行处理得到多个第一图片的步骤还包括:
67.基于对目标图片中的像素进行滤波处理,以使得目标图片中像素点对应的像素值发生更改,进而得到第一图片;其中,滤波处理包括下列处理方式中的至少一种:方框滤波处理、均值滤波处理、高斯滤波处理、中值滤波处理和双边滤波处理。
68.需要说明的是,根据本发明实施例,上述对目标图片进行数据增强处理,使得目标图片中像素点产生几个像素的差值即可,(如产生一个像素的差值或两个像素的差值),较
少的像素差值即可使得叠加在目标图片上的攻击噪音产生移位,从而使得攻击噪音失效。若是像素差值过大,会降低分类模型的识别准确率。
69.滤波处理也称平滑处理,通过改变像素值大小实现消除噪音。其中,均值滤波是一种典型的线性滤波,是指在图像上对目标像素给一个模板,该模板包括了其周围的临近像素(以目标象素为中心的周围8个像素,构成一个滤波模板,即去掉目标像素本身),再用模板中的全体像素的平均值来代替原来像素值;方框滤波和均值滤波核基本一致,区别是需不需要均一化处理;中值滤波是一种非线性平滑技术,它将每一像素点的灰度值设置为该点某邻域窗口内的所有像素点灰度值的中值,也就是将中心像素的值用所有像素值的中间值(不是平均值)替换。中值滤波通过选择中间值避免图像孤立噪声点的影响,对脉冲噪声有良好的滤除作用,特别是在滤除噪声的同时,能够保护信号的边缘,使之不被模糊;高斯滤波是一种线性平滑滤波,适用于消除高斯噪声,具体是对整幅图像进行加权平均的过程,每一个像素点的值,都由其本身和邻域内的其他像素值经过加权平均后得到;双边滤波(bilateral filter)是一种非线性的滤波方法,是依据每个像素及其领域构造一个加权平均值,加权计算包括两个部分,其中第一部分加权方式与高斯平滑中相同,第二部分也属于高斯加权,但不是基于中心像素点与其他像素点的空间距离之上的加权,而是基于其他像素与中心像素的亮度差值的加权。
70.根据本发明实施例,可以采用数据增强处理和/或滤波处理中对目标图片进行至少一次处理,若采用同一处理方式对目标图片进行多次处理,则每次处理对像素点的改变方式不同,如,若采用旋转处理对目标图片进行多次处理,则每次的旋转角度或方向需不一致。
71.步骤s202,基于神经网络模型分别提取多个第一图片中的特征向量,将特征向量输入分类模型中进行分类处理,得到多个分类结果,多个分类结果与多个第一图片相对应。
72.具体地,将上述多个第一图片分别输入神经网络模型中,从该神经网络模型的输出层输出各第一图片对应的特征向量,由于第一图片是针对目标图片的像素进行处理后得到的,因此第一图片对应的特征向量与目标图片对应的特征向量不同,以实现了对攻击噪声的干扰,再利用分类模型分别对各第一图片对应的特征向量进行分类处理,即可得到各第一图片对应的分类结果。通过上述设置避免了同时采用多个分类模型,减少了对多个不同结构的分类模型进行训练所产生的成本。分类模型可以为下列结构的分类模型:逻辑回归(logistic regression,一种经典的分类模型,它可以处理二元分类以及多元分类。)、svm(support vector machine,支持向量机,其在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中)、xgboost(extreme gradient boosting)极端梯度提升,是一种提升树模型,所以它是将许多树模型集成在一起,形成一个很强的分类器)等。分类模型是已经训练完成的模型,采用现有训练方法训练即可。
73.步骤s203,根据多个分类结果确定目标图片的类型。
74.图片的类型可以人为设定,如在图片审查过程中,可以根据相关要求设定违法类型图片、违规类型图片、涉黄类型图片,还可以将上述违法类型图片、违规类型图片、涉黄类型图片设定为禁止传播类型图片。
75.具体地,根据本发明实施例,上述根据多个分类结果确定目标图片的类型的步骤
包括:
76.根据多个分类结果和投票规则确定目标图片的类型。
77.上述投票规则为多数投票规则,是指只有当某类评估结果获得大于某个阈值的投票数目,就输出该结果,否则不输出评估结果。在不输出评估结果的情况下,可以采用人工介入进行评估的方式。这个阈值数一般为绝对多数,即大于总数目的一半,也根据实际情况进行设定。通过上述设置,在确定目标图片类型的过程中引入多数投票规则提升了所确定图片类型的准确率。
78.可替代地,根据本发明实施例,上述根据多个分类结果确定目标图片的类型的步骤还包括:
79.将多个分类结果进行加权处理,根据加权处理结果和结果数量阈值确定目标图片的类型。
80.由于采用同一分类模型分别对第一图片进行分类处理得到的分类结果,因此这里的加权只需将各权重设置为1/n即可,n为分类结果的数量。
81.根据本发明实施例的技术方案,因为采用获取目标图片,基于对目标图片中的像素进行处理得到多个第一图片;基于神经网络模型分别提取多个第一图片中的特征向量,将特征向量输入分类模型中进行分类处理,得到多个分类结果,多个分类结果与多个第一图片相对应;根据多个分类结果确定目标图片的类型的技术手段,解决了现有技术中由于多个不同结构的分类模型均需要训练,导致确定图片类型的成本较高,且各不同的分类模型的权重系数的设置方式难以统一,导致分类模型对攻击噪音的防御能力和稳定性较差,所确定的图片类型的准确率较低的技术问题,进而实现了通过对待分类图片中的像素进行处理得到多个第一图片,利用同一分类模型对该多个第一图片进行图片类型识别,降低确定图片类型的成本,提升分类模型对攻击噪音的防御能力和稳定性,提高所确定图片类型的准确率的技术效果。
82.图3a是根据本发明第二实施例提供的确定图片类型的方法的主要流程的示意图;如图3a所示,本发明实施例提供的确定图片类型的方法主要包括:
83.步骤s301,获取目标图片。
84.目标图片是指审查图片内容和/或待确定图片类型的图片,通常被叠加了对分类模型造成干扰的攻击噪音。目标图片可以是任何一个图片,例如,包含有花的图片,再例如,包含有牛仔裤的图片。
85.步骤s302,在数据增强处理为旋转处理、缩小处理和平移处理中的至少一种的情况下,根据数据增强处理方式指示的偏移幅度和偏移方向对目标图片进行处理,得到第二图片。
86.需要说明的是,根据本发明实施例,上述对目标图片进行数据增强处理,使得目标图片中像素点产生几个像素的位移即可,(如产生一个像素点的位移或两个像素点的位移),较少的偏移幅度即可使得叠加在目标图片上的攻击噪音产生移位,从而使得攻击噪音失效。若是偏移幅度过大,会降低分类模型的识别准确率。
87.通过上述设置,对目标图片进行数据增强处理使得目标图片中像素点的产生位置偏移,如图3b、3c和3d所示,指示了对目标图片进行旋转处理、缩小处理和平移处理时的示意图,但并不作为对本发明的限定。需要说明的是,若采取同一种处理方式对目标图片进行
多次处理(大于或等于两次),需要调整每次的偏移幅度和偏移方向(如旋转角度、旋转方向、缩小方向、缩小比例(缩小幅度)、放大方向、放大比例(放大幅度)等)以使得每次处理对像素点的改变方式不同。
88.根据本发明实施例,偏移幅度是根据目标图片的大小确定的。
89.在该实施例中,具体实施时,若目标图片的像素点数量大于预设数量,则将至少两个像素点确定为偏移量;若目标图片的像素点数量小于或等于预设数量,将一个像素点确定为偏移量。从而灵活处理各个目标图片。另外,偏移量(偏移幅度)不宜过大,以免影响图片识别的准确性。再者,预设数量可以根据需求设置,一般情况下,偏移幅度为一个像素点或两个像素点即可实现本发明实施例的效果。
90.步骤s303,确定目标图片与第二图片对应的非重叠区域。
91.如图3d所示,以对目标图片进行平行平移处理为例,虚线所示方框为目标图片,当目标图片向右侧进行平移处理时,得到实线所示区域为第二图片,此时,左侧虚线与左侧实线所构成的区域即为目标图片与第二图片对应的非重叠区域。
92.步骤s304,将非重叠区域内各像素点对应的像素值调整为目标图片的像素均值,得到调整后的非重叠区域。
93.具体地,获取目标图片中各像素点对应的像素值,将目标图片中每个像素点的像素值相加,得到总像素值;将总像素值与目标图片的像素点数量相除,得到目标图片的像素均值,以该像素均值作为非重叠区域内各像素点对应的像素值。
94.步骤s305,将调整后的非重叠区域,以及第二图片与目标图片的重叠区域进行组合,得到第一图片。
95.通过上述步骤s302至步骤s305获取的通过旋转处理、缩小处理和平移处理中的至少一种对目标图片进行处理得到的第一图片。该第一图片中因为像素位置发生了轻微变化,神经网络模型依然能正常提取正常图片的特征,但对于叠加了攻击噪音的图片,其攻击噪音会失效,进而提高了后续分类模型识别准确率。
96.步骤s306,在数据增强处理为放大处理的情况下,根据放大比例对目标图片进行放大处理,得到第二图片。
97.步骤s307,确定第二图片与目标图片的重叠区域为第一图片。
98.通过上述步骤s306至步骤s307获取的通过放大处理对目标图片进行处理得到的第一图片。也是通过调整像素位置使得攻击噪音失效。
99.步骤s308,对目标图片中的像素进行滤波处理以使得目标图片中像素点对应的像素值发生更改,进而得到第一图片。
100.通过上述设置,采用滤波处理也称平滑处理来改变像素值大小,改变了神经网络模型每一层的激活状态,使得第一图片的特征向量与目标图片的特征向量不同,从而达到消除噪音,使噪音图片失效,提升分类模型对攻击噪音的防御能力和稳定性的技术效果。
101.根据本发明实施例,可以采用数据增强处理和/或滤波处理中对目标图片进行至少一次处理,若采用同一处理方式对目标图片进行多次处理,则每次处理对像素点的改变方式不同,如,若采用旋转处理对目标图片进行多次处理,则每次的旋转角度或方向需不一致。
102.步骤s309,基于神经网络模型分别提取多个第一图片中的特征向量,将特征向量
输入分类模型中进行分类处理,得到多个分类结果,多个分类结果与多个第一图片相对应。
103.具体地,将上述多个第一图片分别输入神经网络模型中,从该神经网络模型的输出层输出各第一图片对应的特征向量,由于第一图片是针对目标图片的像素进行处理后得到的,因此第一图片对应的特征向量与目标图片对应的特征向量不同,以实现了对攻击噪声的干扰,再利用分类模型分别对各第一图片对应的特征向量进行分类处理,即可得到各第一图片对应的分类结果。通过上述设置避免了同时采用多个分类模型,减少了对多个不同结构的分类模型进行训练所产生的成本。分类模型可以为下列结果的分类模型:逻辑回归(logistic regression,一种经典的分类模型,它可以处理二元分类以及多元分类。)、svm(support vector machine,支持向量机,其在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中)、xgboost(extreme gradient boosting)极端梯度提升,是一种提升树模型,所以它是将许多树模型集成在一起,形成一个很强的分类器)。
104.步骤s310,根据多个分类结果和投票规则确定目标图片的类型。
105.上述投票规则指多数投票规则,是指只有当某类评估结果获得大于某个阈值的投票数目,就输出该结果,否则不输出评估结果。在不输出评估结果的情况下,可以采用人工介入进行评估的方式。这个阈值数一般为绝对多数,即大于总数目的一半,也根据实际情况进行设定。通过上述设置,在确定目标图片类型的过程中引入多数投票规则提升了所确定图片类型的准确率。
106.图片的类型可以人为设定,如在图片审查过程中,可以根据相关要求设定违法类型图片、违规类型图片、涉黄类型图片,还可以将上述违法类型图片、违规类型图片、涉黄类型图片设定为禁止传播类型图片。
107.根据本发明实施例,上述分类结果可以为目标图片类型为禁止传播图片的概率,对于每个第一图片是该禁止传播图片的概率,若该概率大于第一概率,则将该概率对应的第一图片为禁止传播图片;统计全部第一图片对应的类型为禁止传播图片的数量;若第一图片为禁止传播图片的数量大于或等于第一数量(多数投票原则),则确定该目标图片的类型为禁止传播图片;若第一图片为禁止传播图片的数量小于或等于第二数量,则确定该目标图片的类型为不是禁止传播图片;上述第一数量大于上述第二数量;若第一图片为禁止传播图片的数量大于上述第二数量,且小于上述第一数量,则将该目标图片类型确定为不能识别类型。
108.具体实施时,第一数量和第二数量可以人为设置,第一数量与第二数量的差值的绝对值越小,人工介入量越大,所确定的目标图片的类型的准确率越低,第一数量与第二数量的差值的绝对值越大,人工介入量越小,所确定的目标图片的类型的准确率越高。例如,第一数量为15,第二数量为5。另外,第一数量小于第一图片的数量,第二数量大于零。第一概率可以设置,例如,0.6。若分类模型的准确率越高(即性能越优良),则第一概率越低,所述绝对值越小(从而减少人工工作量);若分类模型的准确率越低,则第一概率越高,所述绝对值越大。第一信息和第二信息可以设置,第一信息与第二信息不同,第一信息可以为1,第二信息可以为0。具体地,对于分类模型不能识别类型的目标图片,可通过人工判断该目标图片对应的类型;若人工判定该目标片是禁止传播图片,则人工输入1,本发明实施例在接收到1时,确定该目标图片的类型是禁止传播图片;若人工判定该目标图片不是禁止传播图
片,则人工输入0,本发明实施例在接收到0时,确定该目标图片的类型不是禁止传播图片。
109.在该实施例中,通过第一数量和第二数量所形成的范围,与第一图片为禁止传播图片的数量的关系,判断目标图片的类型是否为禁止传播图片,直接输出可靠的目标图片类型,提高所确定的目标图片类型的准确率。
110.步骤s311,将多个分类结果进行加权处理,根据加权分类结果和结果数量阈值确定目标图片的类型。
111.由于采用同一分类模型分别对第一图片进行分类处理得到的分类结果,因此这里的加权只需将各权重设置为1/n即可,n为分类结果的数量。
112.根据本发明实施例的技术方案,因为采用获取目标图片,基于对目标图片中的像素进行处理得到多个第一图片;基于神经网络模型分别提取多个第一图片中的特征向量,将特征向量输入分类模型中进行分类处理,得到多个分类结果,多个分类结果与多个第一图片相对应;根据多个分类结果确定目标图片的类型的技术手段,解决了现有技术中由于多个不同结构的分类模型均需要训练,导致确定图片类型的成本较高,且各不同的分类模型的权重系数的设置方式难以统一,导致分类模型对攻击噪音的防御能力和稳定性较差,所确定的图片类型的准确率较低的技术问题,进而实现了通过对待分类图片中的像素进行处理得到多个第一图片,利用同一分类模型对该多个第一图片进行图片类型识别,降低确定图片类型的成本,提升分类模型对攻击噪音的防御能力和稳定性,提高所确定图片类型的准确率的技术效果。
113.图4是根据本发明实施例提供的确定图片类型的装置的主要模块的示意图;如图4所示,本发明实施例提供的确定图片类型的装置400主要包括:
114.目标图片获取模块401,用于获取目标图片,基于对目标图片中的像素进行处理得到多个第一图片。
115.具体地,根据本发明实施例,通过对目标图片(目标图片是指审查图片内容和/或待确定图片类型的图片)中的像素进行处理,以使得像素点发生位置偏移和/或像素点对应的像素值发生变化,从而得到多个第一图片。在对目标图片中的像素进行处理的过程中,也使得攻击噪音对应的像素点产生位置偏移和/或像素点对应的像素值发生变化,从而让叠加在目标图片上的攻击噪音失效,进而提高了后续利用分类模型对该多个第一图片进行类型识别的准确率。
116.进一步地,根据本发明实施例,上述目标图片获取模块401还用于:
117.对目标图片进行数据增强处理,以使得目标图片中像素点的产生位置偏移,进而得到第一图片,其中,数据增强处理包括下列处理方式中的至少一种:旋转处理、缩小处理、放大处理和平移处理。
118.通过上述设置,对目标图片进行数据增强处理使得目标图片中像素点的产生位置偏移,进而完成对目标图片中的像素进行处理,得到多个第一图片。同时,通过对目标图片进行数据增强处理得到的多个第一图片,后续即可采用同一分类模型对该多个第一图片进行分类处理,得到多个分类结果,进而根据多个分类结果确定目标图片的类型。避免了现有技术中对多个分类模型分别进行训练产生较高成本的情形。
119.优选地,根据本发明实施例,在数据增强处理为旋转处理、缩小处理和平移处理中的至少一种的情况下,上述目标图片获取模块401还用于:
120.根据数据增强处理方式指示的偏移幅度和偏移方向对目标图片进行处理,得到第二图片,其中,偏移幅度是根据目标图片的大小确定的;
121.确定目标图片与第二图片对应的非重叠区域;
122.将非重叠区域内各像素点对应的像素值调整为目标图片的像素均值,得到调整后的非重叠区域;
123.将调整后的非重叠区域,以及第二图片与目标图片的重叠区域进行组合,得到第一图片。
124.通过上述设置,采用增强处理使得像素点的移位,从而使通过针对性训练获得的攻击噪音失效,提升了分类模型对攻击噪音的防御能力和稳定性。
125.优选地,根据本发明实施例,在数据增强处理为放大处理的情况下,上述目标图片获取模块401还用于:
126.根据放大比例对目标图片进行放大处理,得到第二图片;
127.确定第二图片与目标图片的重叠区域为第一图片。
128.通过上述设置,得到的第一图片中显著降低了攻击噪音对目标图片的影响,提高了后续利用分类模型获得的分类结果对确定图片类型的准确率。
129.可替代地,根据本发明实施例,上述目标图片获取模块401还用于:
130.基于对目标图片中的像素进行滤波处理,以使得目标图片中像素点对应的像素值发生更改,进而得到第一图片;其中,滤波处理包括下列处理方式中的至少一种:方框滤波处理、均值滤波处理、高斯滤波处理、中值滤波处理和双边滤波处理。
131.滤波处理也称平滑处理,通过改变像素值大小实现消除噪音。
132.分类处理模块402,用于基于神经网络模型分别提取多个第一图片中的特征向量,将特征向量输入分类模型中进行分类处理,得到多个分类结果,多个分类结果与多个第一图片相对应。
133.具体地,将上述多个第一图片分别输入神经网络模型中,从该神经网络模型的输出层输出各第一图片对应的特征向量,由于第一图片是针对目标图片的像素进行处理后得到的,因此第一图片对应的特征向量与目标图片对应的特征向量不同,以实现了对攻击噪声的干扰,再利用分类模型分别对各第一图片对应的特征向量进行分类处理,即可得到各第一图片对应的分类结果。通过上述设置避免了同时采用多个分类模型,减少了对多个不同结构的分类模型进行训练所产生的成本。
134.类型确定模块403,用于根据多个分类结果确定目标图片的类型。
135.具体地,根据本发明实施例,上述类型确定模块403还用于:
136.根据多个分类结果和投票规则确定目标图片的类型。
137.多数投票规则,是指只有当某类评估结果获得大于某个阈值的投票数目,就输出该结果,否则不输出评估结果。在不输出评估结果的情况下,可以采用人工介入进行评估的方式。这个阈值数一般为绝对多数,即大于总数目的一半,也根据实际情况进行设定。通过上述设置,在确定目标图片类型的过程中引入多数投票规则提升了所确定图片类型的准确率。
138.可替代地,根据本发明实施例,上述类型确定模块403还用于:
139.将多个分类结果进行加权处理,根据加权处理结果和结果数量阈值确定目标图片
的类型。
140.由于采用同一分类模型分别对第一图片进行分类处理得到的分类结果,因此这里的加权只需将各权重设置为1/n即可,n为分类结果的数量。
141.根据本发明实施例的技术方案,因为采用获取目标图片,基于对目标图片中的像素进行处理得到多个第一图片;基于神经网络模型分别提取多个第一图片中的特征向量,将特征向量输入分类模型中进行分类处理,得到多个分类结果,多个分类结果与多个第一图片相对应;根据多个分类结果确定目标图片的类型的技术手段,解决了现有技术中由于多个不同结构的分类模型均需要训练,导致确定图片类型的成本较高,且各不同的分类模型的权重系数的设置方式难以统一,导致分类模型对攻击噪音的防御能力和稳定性较差,所确定的图片类型的准确率较低的技术问题,进而实现了通过对待分类图片中的像素进行处理得到多个第一图片,利用同一分类模型对该多个第一图片进行图片类型识别,降低确定图片类型的成本,提升分类模型对攻击噪音的防御能力和稳定性,提高所确定图片类型的准确率的技术效果。
142.图5示出了可以应用本发明实施例的识别图片的方法或识别图片的装置的示例性系统架构500。
143.如图5所示,系统架构500可以包括终端设备501、502、503,网络504和服务器505。网络504用以在终端设备501、502、503和服务器505之间提供通信链路的介质。网络504可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
144.用户可以使用终端设备501、502、503通过网络504与服务器505交互,以接收或发送消息等。终端设备501、502、503上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
145.终端设备501、502、503可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
146.服务器505可以是提供各种服务的服务器,例如对用户利用终端设备501、502、503所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的目标图片等数据进行分析等处理,并将分类结果(例如第一图片、分类结果和目标图片的类型
--
仅为示例)反馈给终端设备。
147.需要说明的是,本发明实施例所提供的识别图片的方法由服务器505或终端执行,相应地,识别图片的装置设置于服务器505或终端中。
148.应该理解,图5中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
149.下面参考图6,其示出了适于用来实现本发明实施例的终端设备的计算机系统600的结构示意图。图6示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
150.如图6所示,计算机系统600包括中央处理单元(cpu)601,其可以根据存储在只读存储器(rom)602中的程序或者从存储部分608加载到随机访问存储器(ram)603中的程序而执行各种适当的动作和处理。在ram 603中,还存储有系统600操作所需的各种程序和数据。cpu 601、rom 602以及ram 603通过总线604彼此相连。输入/输出(i/o)接口605也连接至总线604。
151.以下部件连接至i/o接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至i/o接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
152.特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(cpu)601执行时,执行本发明的系统中限定的上述功能。
153.需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。
154.附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个单元、程序段、或代码的一部分,上述单元、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
155.描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括目标图片获取模块、分类处理模块和类型确定模块。其中,这些模块的名称在某种情况下
并不构成对该模块本身的限定,例如,目标图片获取模块还可以被描述为“用于获取目标图片,基于对目标图片中的像素进行处理得到多个第一图片的模块”。
156.作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:获取目标图片,基于对目标图片中的像素进行处理得到多个第一图片;基于神经网络模型分别提取多个第一图片中的特征向量,将特征向量输入分类模型中进行分类处理,得到多个分类结果,多个分类结果与多个第一图片相对应;根据多个分类结果确定目标图片的类型。
157.根据本发明实施例的技术方案,因为采用获取目标图片,基于对目标图片中的像素进行处理得到多个第一图片;基于神经网络模型分别提取多个第一图片中的特征向量,将特征向量输入分类模型中进行分类处理,得到多个分类结果,多个分类结果与多个第一图片相对应;根据多个分类结果确定目标图片的类型的技术手段,解决了现有技术中由于多个不同结构的分类模型均需要训练,导致确定图片类型的成本较高,且各不同的分类模型的权重系数的设置方式难以统一,导致分类模型对攻击噪音的防御能力和稳定性较差,所确定的图片类型的准确率较低的技术问题,进而实现了通过对待分类图片中的像素进行处理得到多个第一图片,利用同一分类模型对该多个第一图片进行图片类型识别,降低确定图片类型的成本,提升分类模型对攻击噪音的防御能力和稳定性,提高所确定图片类型的准确率的技术效果。
158.上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献