违规图像检测方法、装置、计算机设备及存储介质与流程

2022-12-07 02:56:30 来源：中国专利 TAG：

1.本发明涉及图像检测领域，具体而言，涉及一种违规图像检测方法、装置、计算机设备及存储介质。

背景技术：

2.违规图像是指不符合特定业务场景以及业务描述的图像，例如，当业务场景为防止私人信息泄露，那么凡是图像内带有身份证、护照、机动车驾驶证、学位证等元素，那么所有包含这些元素的图像均为违规图像。
3.目前对图像是否违规进行检测的方法主要是人工检测，但由于网络上待检测的图像的数量较大，人工检测的方式需花费大量的人力成本，检测效率低，且人工检测具有主观性，会影响检测结果的准确性。

技术实现要素：

4.为了克服现有技术的不足，本发明实施例提供了一种违规图像检测方法、装置、计算机设备和存储介质，其能够避免人工检测方式所耗费的大量人力成本，提高检测效率以及检测结果的准确性。
5.本发明实施例的技术方案可以这样实现：
6.第一方面，本发明实施例提供一种违规图像检测方法，所述方法包括：
7.获取待检测图像；
8.将所述待检测图像输入预先训练的违规图像检测模型，得到用于表征所述待检测图像为违规图像的置信度；
9.若所述置信度小于预设阈值，则利用预先建立的违规图像库，确认所述待检测图像是否为违规图像。
10.可选地，所述违规图像库包括多张参考图像和每张所述参考图像的指纹，所述利用预先建立的违规图像库，确认所述待检测图像是否为违规图像的步骤包括：
11.基于所述待检测图像的指纹和每张所述参考图像的指纹，判断所述多张参考图像中是否存在与所述待检测图像相似的目标图像；
12.若存在所述目标图像，则判定所述待检测图像为违规图像；
13.若不存在所述目标图像，则判定所述待检测图像不为违规图像。
14.可选地，所述基于所述待检测图像的指纹和每张所述参考图像的指纹，判断所述多张参考图像中是否存在与所述待检测图像相似的目标图像的步骤包括：
15.针对每张所述参考图像，利用所述待检测图像的指纹和所述参考图像的指纹，计算所述待检测图像与所述参考图像的汉明距离，得到所述待检测图像与每张所述参考图像的汉明距离；
16.若所述待检测图像与每张所述参考图像的汉明距离均不在预设区间内，则判定所述多张参考图像中不存在所述目标图像；
17.若所述待检测图像与至少一张所述参考图像的汉明距离在所述预设区间内，则判定所述多张参考图像中存在所述目标图像。
18.可选地，在所述获取待检测图像的步骤之前，所述方法还包括建立违规图像库的步骤，其包括：
19.获取多张网络图像，每张所述网络图像均包含违规内容；
20.对所述多张网络图像进行清洗，并标注清洗后的每张所述网络图像中的违规内容，得到多张参考图像；
21.计算每张所述参考图像的指纹；
22.基于所述多张参考图像和每张所述参考图像的指纹，建立所述违规图像库。
23.可选地，所述违规图像库包括多张参考图像，在所述获取待检测图像的步骤之前，所述方法还包括训练违规图像检测模型的步骤，其包括：
24.按照预设比例将所述多张参考图像划分为训练样本集和测试样本集；
25.利用所述训练样本集对预先构建的yolo v4模型进行训练，得到训练后的yolo v4模型；
26.利用所述测试样本集对所述训练后的yolo v4模型进行测试，得到所述训练后的yolo v4模型的测试结果；
27.若所述测试结果满足预设条件，则将所述训练后的yolo v4模型作为所述违规图像检测模型。
28.第二方面，本发明实施例提供一种违规图像检测装置，所述装置包括：
29.获取模块，用于获取待检测图像；
30.检测模块，用于：
31.将所述待检测图像输入预先训练的违规图像检测模型，得到用于表征所述待检测图像为违规图像的置信度；
32.若所述置信度小于预设阈值，则利用预先建立的违规图像库，确认所述待检测图像是否为违规图像。
33.可选地，所述装置还包括建立模型；
34.所述建立模块，用于：
35.获取多张网络图像，每张所述网络图像均包含违规内容；
36.对所述多张网络图像进行清洗，并标注清洗后的每张所述网络图像中的违规内容，得到多张参考图像；
37.计算每张所述参考图像的指纹；
38.基于所述多张参考图像和每张所述参考图像的指纹，建立所述违规图像库。
39.可选地，所述装置还包括训练模块；
40.所述训练模块，用于：
41.按照预设比例将所述多张参考图像划分为训练样本集和测试样本集；
42.利用所述训练样本集对预先构建的yolo v4模型进行训练，得到训练后的yolo v4模型；
43.利用所述测试样本集对所述训练后的yolo v4模型进行测试，得到所述训练后的yolo v4模型的测试结果；
44.若所述测试结果满足预设条件，则将所述训练后的yolo v4模型作为所述违规图像检测模型。
45.第三方面，本发明实施例提供一种计算机设备，其包括存储器和处理器，所述存储器存储有计算机程序，所述处理器在执行所述计算机程序时实现如第一方面所述的违规图像检测方法。
46.第四方面，一种计算机可读存储介质，其存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如第一方面所述的违规图像检测方法。
47.相较于现有技术，本发明实施例提供的一种违规图像检测方法、装置、计算机设备及存储介质，首先，获取待检测图像；然后，将待检测图像输入预先训练的违规图像检测模型，得到用于表征待检测图像为违规图像的置信度；若置信度小于预设阈值，则利用预先建立的违规图像库，确认待检测图像是否为违规图像。由于本发明实施例利用预先训练的违规图像检测模型对待检测图像是否为违规图像进行初步确认，再利用预先建立的违规图像库对模型的检测结果进行二次确认，从而在避免人工检测所耗费的大量人力成本、提高检测效率的同时，提高检测结果的准确性。
附图说明
48.为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。
49.图1为本发明实施例提供的一种违规图像检测方法的流程示意图；
50.图2为本发明实施例提供的一种建立违规图像库的流程示意图；
51.图3为本发明实施例提供的一种训练违规图像检测模型的流程示意图；
52.图4为本发明实施例提供的一种yolo v4模型的网络结构示意图；
53.图5为本发明实施例提供的一种违规图像检测装置的功能单元框图；
54.图6为本发明实施例提供的一种计算机设备的结构示意框图。
55.图标：100-违规图像检测装置；101-获取模块；102-检测模块；103-建立模块；104-训练模块；200-计算机设备；210-存储器；220-处理器。
具体实施方式
56.为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
57.因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
58.应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一
个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。
59.需要说明的是，在不冲突的情况下，本发明的实施例中的特征可以相互结合。
60.为了避免人工检测方式所耗费的大量人力成本，提高检测效率以及检测结果的准确性，本发明实施例提供了一种违规图像检测方法，下面将进行详细介绍。
61.请参照图1，该违规图像检测方法包括步骤s101～s102。
62.s101，获取待检测图像。
63.其中，待检测图像可以是从服务器推送给客户端，以供用户浏览的图像。
64.s102，将待检测图像输入预先训练的违规图像检测模型，得到用于表征待检测图像为违规图像的置信度。
65.其中，置信度通常小于1，可以理解为模型输出的检测结果“待检测图像为违规图像”的准确率。
66.例如，当置信度为0.85，则表示待检测图像为违规图像的概率为85％。
67.在本发明实施例中，违规图像检测模型可以是基于yolo v4算法得到的，即对预先构建的yolo v4模型进行训练，将通过测试的训练后的yolo v4模型作为违规检测模型。
68.s103，若置信度小于预设阈值，则利用预先建立的违规图像库，确认待检测图像是否为违规图像。
69.其中，预设阈值可以人为按照需求进行设定，在一种可能的实现方式中，预设阈值可以为0.75。
70.当模型输出的待检测图像为违规图像的置信度小于预设值时，则需利用违规图像库中的图像，对待检测图像是否为违规图像进行二次确认。
71.在本发明实施例中，步骤s103的实现过程可以如下：
72.s103-1，基于待检测图像的指纹和每张参考图像的指纹，判断多张参考图像中是否存在与待检测图像相似的目标图像。
73.其中，所述违规图像库包括违规多张参考图像和每张参考图像的指纹。
74.在本发明实施例中，待检测图像的指纹和每张参考图像的指纹均可以使用差别hash算法或dhash算法得到。
75.作为一种可能的实现方式，步骤s103-1包括如下步骤s103-1-1～s103-1-3。
76.s103-1-1，针对每张参考图像，利用待检测图像的指纹和参考图像的指纹，计算待检测图像与参考图像的汉明距离，得到待检测图像与每张参考图像的汉明距离。
77.其中，图像的指纹具有64位数据，汉明距离(hamming distance)是指两个图像的指纹中有多少位数据是不相等的。
78.例如，待检测图像与参考图像1的汉明距离为5，待检测图像的指纹与参考图像2和汉明距离为3，意味着待检测图像的指纹与参考图像1的指纹中有5位数据是不相等的，待检测图像的指纹与参考图像2的指纹中有3位数据是不相等的。
79.s103-1-2，若待检测图像与每张参考图像的汉明距离均不在预设区间内，则判定多张参考图像中不存在目标图像。
80.其中，预设区间可以是人为按照实际需求设定的。
81.在一种可能的实现方式中，预设区间可以为0～5，假设待检测图像与参考图像1、参考图像2和参考图像3的汉明距离分别是7、9和10，由于像与参考图像1、参考图像2和参考
图像3的汉明距离均不在0～5内，所以参考图像1、参考图像2和参考图像3中不存在目标图像。
82.s103-1-3，若待检测图像与至少一张参考图像的汉明距离在预设区间内，则判定多张参考图像中存在目标图像。
83.假设预设区间为0～5，待检测图像与参考图像1、参考图像2和参考图像3的汉明距离分别是3、9和8，由于待检测图像与参考图像1汉明距离在0～5内，所以参考图像1为目标图像。
84.在本发明实施例中，若存在目标图像，则执行步骤s103-2，若不存在目标图像，则执行步骤s103-3。
85.s103-2，判定所述待检测图像为违规图像。
86.s103-3，判定所述待检测图像不为违规图像。
87.可以理解地，当模型输出的待检测图像为违规图像的置信度不小于预设值时，则可以直接判定待检测图像为违规图像。
88.由于上述违规图像检测方法是基于预先建立的违规图像库和预先训练的违规图像检测模型实现的，因此，该违规图像检测方法在执行步骤s101之前，还包括建立违规图像库和训练违规图像检测模型的步骤。
89.下面将对建立违规图像库的步骤进行介绍。
90.请参照图2，建立违规图像库的步骤包括步骤s201～s204。
91.s201，获取多张网络图像。
92.其中，每张网络图像均包含违规内容。
93.s202，对多张网络图像进行清洗，并标注清洗后的每张网络图像中的违规内容，得到多张参考图像。
94.其中，清洗是指根据算法规则或者业务规则,使用人力或者自动化脚本,把多张网络图像中的错误数据,或不满足使用要求的数据去除掉的过程。
95.s203，计算每张参考图像的指纹。
96.在本发明实施例中，可以利用差别hash算法或dhash算法得到每张参考图像的指纹。
97.s204，基于多张参考图像和每张参考图像的指纹，建立违规图像库。
98.在本发明实施例中，可以将多张参考图像和每张参考图像存储至设定位置，得到违规图像库。
99.下面将对训练违规图像检测模型的步骤进行介绍。
100.请参照图3，训练违规图像检测模型的步骤包括步骤s301～s305。
101.s301，按照预设比例将多张参考图像划分为训练样本集和测试样本集。
102.其中，预设比例可以是人为按照需求进行设定。
103.由于每张参考图像均是被标注了违规内容的图像，因此可以直接将多张参考图像按照预设比例划分为训练样本集和测试样本集，且训练样本集中标注了不同的违规内容的参考图像的数量分布情况与测试样本集相同。
104.s302，利用训练样本集对预先构建的yolo v4模型进行训练，得到训练后的yolo v4模型。
105.如图4所示，yolo v4模型的网络结构主要包括输入端、backbone、neck以及prediction四个部分，yolo v4模型是在原yolo目标检测架构基础上优化而来的，其使用了cnn领域中的优化策略，从数据处理、主干网络、网络训练、激活函数、损失函数等各方面都进行了不同程度的优化，得到了一个高效且强大的模型。
106.在本发明实施例中，yolo v4模型利用mosaic数据增强技术对4张作为训练样本的参考图像进行随机缩放、裁剪、排列的方式进行拼接成一张新图像，将新图像输入神经网络去学习计算时，相当于一次计算了4张参考图像的数据，可以提高神经网络的计算数据，同时还能降低模型的内存要求。yolo v4模型还通过使用平滑的mish函数来提高模型的精度。
107.s303，利用测试样本集对训练后的yolo v4模型进行测试，得到训练后的yolo v4模型的测试结果。
108.其中，测试结果包括测试成功率，其可以为被检测为违规图像的测试样本的数量与测试样本的总数量的比值。
109.s304，若测试结果满足预设条件，则将训练后的yolo v4模型作为违规图像检测模型。
110.其中，预设条件可以是测试成功率大于设定值。
111.可以理解地，当测试结果满足预设条件时，即测试成功率大于设定值，则可以直接将训练后的yolo v4模型作为违规检测模型。
112.当测试结果不满足预设条件时，即测试成功率不大于设定值时，则需要根据测试结果调整预先构建的yolo v4模型的参数，对预先构建的yolo v4模型进行优化，再重新执行上述步骤s302～s303，直至测试结果满足预设条件。
113.相较于现有技术，本发明实施例具有以下技术效果：
114.(1)利用预先训练的违规图像检测模型对待检测图像是否为违规图像进行初步确认，再利用预先建立的违规图像库对模型的检测结果进行二次确认，从而在避免人工检测所耗费的大量人力成本、提高检测效率的同时，提高检测结果的准确性。
115.(2)违规图像检测模型通过训练yolo v4模型得到，yolo v4模型利用mosaic数据增强技术对4张作为训练样本的参考图像进行随机缩放、裁剪、排列的方式进行拼接成一张新图像，将新图像输入神经网络去学习计算时，从而提高了神经网络的计算数据，同时还能降低模型的内存要求。
116.(3)yolo v4模型利用拼接的新图像进行训练，丰富了被检测物体的背景，提高在复杂场景下检测精度。
117.(4)yolo v4模型使用了mish函数来提高模型的精度。
118.为了执行上述方法实施例及各个可能的实施方式中的相应步骤，下面给出一种违规图像检测装置100的实现方式。
119.请参照图5，该违规图像检测装置包括获取模块101、检测模块102、建立模块103以及训练模块104。
120.获取模块101，用于获取待检测图像。
121.检测模块102，用于将待检测图像输入预先训练的违规图像检测模型，得到用于表征待检测图像为违规图像的置信度；若置信度小于预设阈值，则利用预先建立的违规图像库，确认待检测图像是否为违规图像。
122.可选地，违规图像库包括多张参考图像和每张参考图像的指纹，检测模块102具体用于基于待检测图像的指纹和每张参考图像的指纹，判断多张参考图像中是否存在与待检测图像相似的目标图像。若存在目标图像，则判定待检测图像为违规图像；若不存在目标图像，则判定待检测图像不为违规图像。
123.可选地，检测模块102在用于基于待检测图像的指纹和每张参考图像的指纹，判断多张参考图像中是否存在与待检测图像相似的目标图像时，具体用于针对每张参考图像，利用待检测图像的指纹和参考图像的指纹，计算待检测图像与参考图像的汉明距离，得到待检测图像与每张参考图像的汉明距离；若待检测图像与每张参考图像的汉明距离均不在预设区间内，则判定多张参考图像中不存在目标图像；若待检测图像与至少一张参考图像的汉明距离在预设区间内，则判定多张参考图像中存在目标图像。
124.建立模块103，用于获取多张网络图像，每张网络图像均包含违规内容；对多张网络图像进行清洗，并标注清洗后的每张网络图像中的违规内容，得到多张参考图像；计算每张参考图像的指纹；基于多张参考图像和每张参考图像的指纹，建立违规图像库。
125.训练模块104，用于按照预设比例将多张参考图像划分为训练样本集和测试样本集；利用训练样本集对预先构建的yolo v4模型进行训练，得到训练后的yolo v4模型；利用测试样本集对训练后的yolo v4模型进行测试，得到训练后的yolo v4模型的测试结果；若测试结果满足预设条件，则将训练后的yolo v4模型作为违规图像检测模型。
126.所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的违规图像检测装置100的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。
127.进一步地，本发明实施例还提供了一种计算机设备200，请参照图6，计算机设备200可以包括存储器210和处理器220。
128.其中，处理器220可以是一个通用的中央处理器(central processing unit，cpu)，微处理器，特定应用集成电路(application-specific integrated circuit，asic)，或一个或多个用于控制上述方法实施例提供的违规图像检测方法的程序执行的集成电路。
129.存储器210可以是rom或可存储静态信息和指令的其它类型的静态存储设备，ram或者可存储信息和指令的其它类型的动态存储设备，也可以是电可擦可编程只读存储器(electrically erasable programmabler-only memory，eeprom)、只读光盘(compactdisc read-only memory，cd-rom)或其它光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其它磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其它介质，但不限于此。存储器210可以是独立存在，通过通信总线与处理器220相连接。存储器210也可以和处理器220集成在一起。其中，存储器210用于存储执行本技术方案的机器可执行指令。处理器220用于执行存储器210中存储的机器可执行指令，以实现上述的方法实施例。
130.本发明实施例还提供一种包含计算机程序的计算机可读存储介质，计算机程序在被执行时可以用于执行上述的方法实施例提供的违规图像检测方法中的相关操作。
131.综上，本发明实施例提供的一种违规图像检测方法、装置、计算机设备及存储介质，首先，获取待检测图像；然后，将待检测图像输入预先训练的违规图像检测模型，得到用于表征待检测图像为违规图像的置信度；若置信度小于预设阈值，则利用预先建立的违规
图像库，确认待检测图像是否为违规图像。由于本发明实施例利用预先训练的违规图像检测模型对待检测图像是否为违规图像进行初步确认，再利用预先建立的违规图像库对模型的检测结果进行二次确认，从而在避免人工检测所耗费的大量人力成本、提高检测效率的同时，提高检测结果的准确性。
132.以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种基于改进Hu不变矩和Zernike矩的图像被动盲检测方法

违规图像检测方法、装置、计算机设备及存储介质与流程

相关文献

最热文献