违禁品检测模型训练方法、检测方法、装置及计算机设备与流程

2023-02-19 02:24:47 来源：中国专利 TAG：

1.本技术涉及人工智能技术领域，具体涉及一种违禁品检测模型训练方法、检测方法、装置及计算机设备。

背景技术：

2.x光违禁品检测是指通过安检机摄像头拍摄x光学图片，利用算法来检测图片上是否包含违禁物品，在机场、地铁、火车站等需要安检的地方有着广泛的应用。
3.目前基于深度学习的x光违禁品检测方法，通常是线下获取安检机拍摄的图片，然后标注后进行模型的训练。因为x光违禁品类别众多，训练所需的数据量大，线下数据管理麻烦，用户每次进行数据筛选和训练要花费较多的时间，且容易出错。

技术实现要素：

4.基于此，有必要针对上述技术问题，提供一种违禁品检测模型训练方法、检测方法、装置及计算机设备，用以提高违禁品检测模型的训练效率。
5.第一方面，本技术提供一种违禁品检测模型训练方法，包括：
6.获取待标注的原始违禁品图片；
7.获取已检测的预设类别的分类违禁品图片；
8.对原始违禁品图片进行标注得到标注图片；
9.根据标注图片和分类违禁品图片，确定样本数据集；
10.根据样本数据集对预设初始模型进行训练，得到违禁品检测模型。
11.在本技术一些实施例中，所述分类违禁品图片包括第一分类违禁品图片，获取已检测的预设类别的分类违禁品图片，包括：
12.接收安检设备发送的已检测的预设类别的第一分类违禁品图片，第一分类违禁品图片为安检设备对采集的待识别图片进行违禁品检测后、回传的包含有预设类别的违禁品的图片。
13.在本技术一些实施例中，所述分类违禁品图片包括第二分类违禁品图片，获取已检测的预设类别的分类违禁品图片，包括：
14.获取待检测图片；
15.对待检测图片进行检测，识别出包含违禁品的违禁品图片以及包含的违禁品的违禁品类别；
16.根据违禁品类别，从违禁品图片中获取预设类别的第二分类违禁品图片。
17.在本技术一些实施例中，获取待检测图片，包括：
18.获取原始待检测图片；
19.按照预设格式对原始待检测图片进行重命名；
20.对重命名之后的原始待检测图片进行去白边操作，得到有效待检测图片；
21.选取预设尺寸的有效待检测图片得到待检测图片。
22.在本技术一些实施例中，对待检测图片进行检测，识别出包含违禁品的违禁品图片以及包含的违禁品的违禁品类别，包括：
23.对待检测图片进行检测，得到违禁品类别以及类别置信度；
24.当类别置信度大于等于预设的置信度阈值时，确定类别置信度对应的待检测图片为包含违禁品的违禁品图片。
25.在本技术一些实施例中，对原始违禁品图片进行标注得到标注图片，包括：
26.对原始违禁品图片进行标注，得到正常样本和异常样本；
27.对正常样本进行标注，得到标注图片，标注图片包括正样本和负样本，正样本的图片包含违禁品，负样本的图片不包含违禁品。
28.在本技术一些实施例中，获取已检测的预设类别的分类违禁品图片之后，方法还包括：
29.基于分类违禁品图片，对原始违禁品图片进行预处理去重操作，得到预处理图片；
30.对原始违禁品图片进行标注得到标注图片，包括：
31.对预处理图片进行标注得到标注图片。
32.第二方面，本技术提供一种违禁品检测方法，包括：
33.获取待检测的原始图片；
34.根据预设的违禁品检测模型对原始图片进行检测，得到违禁品检测数据，违禁品检测模型为应用上述的违禁品检测模型训练方法得到的检测模型。
35.第三方面，本技术提供一种违禁品检测模型训练装置，包括：
36.图片获取模块，用于获取原始违禁品图片和已检测的预设类别的分类违禁品图片；
37.样本标注模块，与图片获取模块通讯连接，用于对原始违禁品图片进行标注得到标注图片；
38.数据集获取模块，与图片获取模块和样本标注模块通讯连接，用于根据标注图片和分类违禁品图片，确定样本数据集；
39.模型训练模块，与数据集获取模块通讯连接，用于根据样本数据集对预设初始模型进行训练，得到违禁品检测模型。
40.在本技术一些实施例中，图片获取模块还用于接收安检设备发送的已检测的预设类别的第一分类违禁品图片，第一分类违禁品图片为安检设备对采集的待识别图片进行违禁品检测后、回传的包含有预设类别的违禁品的图片，分类违禁品图片包括第一分类违禁品图片。
41.在本技术一些实施例中，图片获取模块还用于获取待检测图片；对待检测图片进行检测，识别出包含违禁品的违禁品图片以及包含的违禁品的违禁品类别；根据违禁品类别，从违禁品图片中获取预设类别的第二分类违禁品图片，分类违禁品图片包括第二分类违禁品图片。
42.在本技术一些实施例中，图片获取模块还用于获取原始待检测图片；按照预设格式对原始待检测图片进行重命名；对重命名之后的原始待检测图片进行去白边操作，得到有效待检测图片；选取预设尺寸的有效待检测图片得到待检测图片。
43.在本技术一些实施例中，图片获取模块还用于对待检测图片进行检测，得到违禁
品类别以及类别置信度；当类别置信度大于等于预设的置信度阈值时，确定类别置信度对应的待检测图片为包含违禁品的违禁品图片。
44.在本技术一些实施例中，样本标注模块还用于对原始违禁品图片进行标注，得到正常样本和异常样本；对正常样本进行标注，得到标注图片，标注图片包括正样本和负样本，正样本的图片包含违禁品，负样本的图片不包含违禁品。
45.在本技术一些实施例中，样本标注模块还用于基于分类违禁品图片，对原始违禁品图片进行预处理去重操作，得到预处理图片；对预处理图片进行标注得到标注图片。
46.第四方面，本技术还提供一种服务器，服务器包括：
47.一个或多个处理器；
48.存储器；以及
49.一个或多个应用程序，其中一个或多个应用程序被存储于存储器中，并配置为由处理器执行以实现的违禁品检测模型训练方法。
50.第五方面，本技术还提供一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器进行加载，以执行的违禁品检测模型训练方法中的步骤。
51.第六方面，本技术实施例提供一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述第一方面提供的方法。
52.上述违禁品检测模型训练方法、检测方法、装置及计算机设备，通过获取已检测的预设类别的分类违禁品图片，结合原始违禁品图片标注之后的标注图片，得到样本数据集进行模型的训练。采用本方法，可减少需要标注的违禁品图片的数量，降低标注量，提高实际业务场景中的分类效率。
附图说明
53.为了更清楚地说明本技术实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
54.图1是本技术实施例中违禁品检测模型训练方法的场景示意图；
55.图2是本技术实施例中违禁品检测模型训练方法的流程示意图；
56.图3是本技术实施例中违禁品检测方法的流程示意图；
57.图4是本技术实施例中违禁品检测模型训练装置的结构示意图；
58.图5是本技术实施例中计算机设备的结构示意图。
具体实施方式
59.下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
60.在本技术的描述中，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本技术的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。
61.在本技术的描述中，“例如”一词用来表示“用作例子、例证或说明”。本技术中被描述为“例如”的任何实施例不一定被解释为比其它实施例更优选或更具优势。为了使本领域任何技术人员能够实现和使用本发明，给出了以下描述。在以下描述中，为了解释的目的而列出了细节。应当明白的是，本领域普通技术人员可以认识到，在不使用这些特定细节的情况下也可以实现本发明。在其它实例中，不会对公知的结构和过程进行详细阐述，以避免不必要的细节使本发明的描述变得晦涩。因此，本发明并非旨在限于所示的实施例，而是与符合本技术所公开的原理和特征的最广范围相一致。
62.在本技术实施例中，违禁品检测模型训练方法主要涉及人工智能(artificial intelligence，ai)中的计算机视觉技术(computer vision，cv)。其中，人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。
63.计算机视觉是一门研究如何使机器“看”的科学，更进一步的说，就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科，计算机视觉研究相关的理论和技术，试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、光学字符识别(optical character recognition，ocr)、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3d技术、虚拟现实、增强现实、同步定位与地图构建等技术，还包括常见的人脸识别、指纹识别等生物特征识别技术。
64.在本技术实施例中，需要说明的是，本技术提供的违禁品检测模型训练方法由于是在计算机设备中执行，各计算机设备的处理对象均以数据或信息的形式存在，例如时间，实质为时间信息，可以理解的是，后续实施例中若提及尺寸、数量、位置等，均为对应的数据存在，以便计算机设备进行处理，具体此处不作赘述。
65.在本技术实施例中，还需说明的是，本技术实施例提供的违禁品检测模型训练方法，可以应用于如图1所示的违禁品检测模型训练系统中。其中，该违禁品检测模型训练系统包括终端100和服务器200，终端100可以是既包括接收和发射硬件的设备，即具有能够在双向通信链路上，执行双向通信的接收和发射硬件的设备。这种设备可以包括：蜂窝或其他通信设备，其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备。终端100具体可以是台式终端或移动终端，终端100具体还可以是手机、平板电脑、笔记本电脑等中的一种，又或是安装于监控现场用于信息采集、存储、传输的摄像头。服务器200可以是独立的服务器，也可以是服务器组成的服务器网络或服务器集群，其包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云服务器。其中，云服务器由基于云计算(cloud computing)的大量计算机或网络服务器构成。
66.本领域技术人员可以理解，图1中示出的应用环境，仅仅是与本技术方案一种应用场景，并不构成对本技术方案应用场景的限定，其他的应用环境还可以包括比图1中所示更多或更少的计算机设备，例如图1中仅示出1个服务器200，可以理解的，该违禁品检测模型训练系统还可以包括一个或多个其他服务器，具体此处不作限定。另外，如图1所示，该违禁品检测模型训练系统还可以包括存储器，用于存储数据，如存储安检视频信息。
67.还需说明的是，图1所示违禁品检测模型训练系统的场景示意图仅仅是一个示例，本发明实施例描述的违禁品检测模型训练系统以及场景是为了更加清楚的说明本发明实施例的技术方案，并不构成对于本发明实施例提供的技术方案的限定，本领域普通技术人员可知，随着违禁品检测模型训练系统的演变和新业务场景的出现，本发明实施例提供的技术方案对于类似的技术问题，同样适用。
68.参阅图2，本技术实施例提供了一种违禁品检测模型训练方法，主要以该方法应用于上述图1中的服务器200来举例说明，该方法包括步骤s201～s205，具体如下：
69.s201，获取待标注的原始违禁品图片。
70.其中，原始违禁品图片是指需要标注其中是否包含违禁品以及所包含的违禁品的种类的图片，可以是直接获取的图片，也可以是通过获取的视频中提取图片；视频包括但不局限于短视频、长视频等格式，短视频可以是长度小于10分钟的视频，长视频可以是长度大于10分钟的视频。
71.具体地，服务器200执行违禁品检测模型训练任务之前，用户可通过终端100向服务器200发送训练请求，训练请求携带需要进行训练的原始违禁品图片和分类违禁品图片。服务器200在接收到训练请求之后，即可按照违禁品检测模型训练方法，基于原始违禁品图片和分类违禁品图片进行模型训练。又或者，服务器200执行违禁品检测模型训练任务之前，服务器200无需获取终端100发送的训练请求，此时的终端100是具有摄像功能的摄像机，终端100定时或实时采集获取到原始违禁品图片之后，即可发送至服务器200执行违禁品检测模型训练任务。而更进一步的是，终端100上可装载有图像获取装置，终端100定时或实时采集视频或图像，截取原始违禁品图片发送至服务器200，以使服务器200执行违禁品检测模型训练任务。
72.s202，获取已检测的预设类别的分类违禁品图片。
73.其中，分类违禁品图片是包含有违禁品同时对违禁品的位置以及类别均已进行标注的图片。基于模型训练的需求，获取预设类别的分类违禁品图片，例如枪，刀等，对于未选择的违禁品类别，虽然也检测是违禁品，但是不是需要的数据，则不需要获取。
74.具体地，将需要检测的图片输入至预设的检测模型，即可得到模型输出的违禁品检测结果，即标出需要检测的图片中的违禁品信息，标出形式可以是边界框，即利用边界框标出需要检测的图片中的违禁品信息。
75.具体地，本技术实施例提出的违禁品检测模型训练方法，并非是完全基于未检测的原始违禁品图片进行模型训练，而是结合已检测的预设类别的分类违禁品图片，由于已检测的预设类别的分类违禁品图片中已标注有违禁品类别或是标注有边界框，因此能够减少标注量，提高模型训练效率。本实施例中涉及的分类违禁品图片获取步骤将在下文详细说明，其中，分类违禁品图片包括服务器200从安检设备等装置直接获取的第一分类违禁品图片，还包括服务器200自身检测得到的第二分类违禁品图片。
76.在一个实施例中，本步骤包括：s301，接收安检设备发送的已检测的预设类别的第一分类违禁品图片，所述第一分类违禁品图片为所述安检设备对采集的待识别图片进行违禁品检测后、回传的包含有预设类别的违禁品的图片。
77.其中，服务器200直接接收安检设备发送的已检测的预设类别的第一分类违禁品图片，并不对图片进行检测以及分类，减少自身的工作量，提高模型训练效率。
78.其中，安检设备对采集的待识别图片进行违禁品检测，从部署安检设备的场地摄像头里面获取原始图片，根据实时的视频流按照所设置的帧间隔进行抽取，得到原始的待识别图片，然后对原始的待识别图片进行预处理。
79.具体地，预处理包括但不限于重命名操作、去白边操作、尺寸筛选操作等，其目的为例更加便于后续的违禁品检测步骤的实施。对于待识别图片按照预设格式进行统一的重命名操作，例如，待识别图片命名的格式为：《场地代码》_《线体编码id》_《条码》_《时间戳》_《小车号》_《照相机id》_《索引号》_《结果》_《图像序号》_《物料编码》.jpg，图片命名格式统一方便进行管理，能够快速地找到该待识别图片对应的场地、时间等信息。去白边操作：安检设备采集的待识别图片四周可能会包含一定的白边，如果白边过大会影响算法对于违禁品的检测性能，因此安检设备对于得到的待识别图片会做统一的白边去除操作，使得待识别图片只包括拍摄的有效区域，减少后续需要处理的图像信息。尺寸筛选操作：安检设备采集的待识别图片可能存在不同的尺寸大小，尺寸太小或者长宽比异常的图片送入算法resize到固定尺寸之后会导致图像模糊或者严重变形，因此需要对尺寸异常的待识别图片进行筛选，一是图像尺寸筛选，例如去除最小单边小于25像素的待识别图片；二是图像比例筛选，例如去除长宽比在[1/4,4]之外的待识别图片。
[0080]
具体地，将待识别图片进行去白边操作和尺寸筛选操作之后，使用预设的检测模型进行检测得到违禁品检测结果，即标出需要检测的待识别图片中的违禁品信息，标出形式可以是边界框，同时标出其所属的违禁品类别。之后，安检设备的数据回传机制选取预设类别的第一分类违禁品图片回传至服务器200进行模型训练。
[0081]
需要说明的是，本实施例中的第一分类违禁品图片是由安检设备检测分析之后回传至服务器200，服务器200则直接使用分类违禁品图片进行模型训练，减少了分类违禁品图片的检测，能够减少数据处理量，提升模型训练的效率。但实际上分类违禁品图片的检测分析也可以由服务器200完成，其具体步骤将在下文详细描述。
[0082]
在一个实施例中，本步骤包括：s401，获取待检测图片；s402，对所述待检测图片进行检测，识别出包含违禁品的违禁品图片以及包含的违禁品的违禁品类别；s403，根据所述违禁品类别，从所述违禁品图片中获取预设类别的第二分类违禁品图片。
[0083]
其中，待检测图片为经过预处理之后的图片，可以直接使用预设的检测模型进行检测，从而识别出包含违禁品的违禁品图片以及包含的违禁品的违禁品类别。其中，通过边界框标注图片中违禁品的位置以及对应的类别。最后根据违禁品类别从违禁品图片中获取训练需要的预设类别的第二分类违禁品图片。
[0084]
在一个实施例中，获取待检测图片的步骤，包括：s501，获取原始待检测图片；s502，按照预设格式对所述原始待检测图片进行重命名；s503，对重命名之后的原始待检测图片进行去白边操作，得到有效待检测图片；s504，选取预设尺寸的所述有效待检测图片得到所述待检测图片。
[0085]
其中，原始待检测图片是指需要检测其中是否包含违禁品以及所包含的违禁品的种类的图片，与原始违禁品图片类似，同样可以是直接获取的图片，也可以是通过获取的视频中提取图片；视频包括但不局限于短视频、长视频等格式，短视频可以是长度小于10分钟的视频，长视频可以是长度大于10分钟的视频。
[0086]
具体地，本实施例中对待检测图片执行的操作与上述实施例中安检设备预处理的操作相同，区别仅在与执行的设备主体不同。本实施例中同样执行重命名操作、去白边操作、尺寸筛选操作。按照预设格式对所述原始待检测图片进行重命名，对重命名之后的原始待检测图片进行去白边操作，得到有效待检测图片，然后选取预设尺寸的有效待检测图片得到待检测图片。其中预处理中各个步骤的具体操作方式与上述实施例中安检设备预处理的操作相同。
[0087]
在一个实施例中，对所述待检测图片进行检测，识别出包含违禁品的违禁品图片以及包含的违禁品的违禁品类别的步骤，包括：s601，对所述待检测图片进行检测，得到违禁品类别以及类别置信度；s602，当所述类别置信度大于等于预设的置信度阈值时，确定所述类别置信度对应的待检测图片为包含违禁品的违禁品图片。
[0088]
其中，通过预设的检测模型对待检测图片进行检测，得到违禁品类别以及类别置信度，同时还标注有边界框，每个边界框均有其对应的违禁品类别以及类别置信度。
[0089]
其中，当类别置信度大于等于预设的置信度阈值时，确定类别置信度对应的待检测图片为包含违禁品的违禁品图片，不同类别的违禁品的置信度阈值不同，可以根据模型训练的要求设置置信度阈值。此外，对于具有多个边界框的待检测图片，任意一个边界框的违禁品类别以及类别置信度符合要求，即可以作为后续模型训练的样本数据集。
[0090]
s203，对所述原始违禁品图片进行标注得到标注图片。
[0091]
其中，标注图片为对原始违禁品图片逐一进行标注其是否包含有违禁品以及包含的违禁品的类别。此外，为了避免分类违禁品图片中存在误检，还可以进一步对分类违禁品图片进行再次审核，分类违禁品图片标出有边界框以及对应的类别，因此能够比较快速地进行再次分类。
[0092]
具体地，服务器200可以是automl平台，机器学习的应用需要大量的人工干预，这些人工干预表现在：特征提取、模型选择、参数调节等机器学习的各个方面。automl视图将这些与特征、模型、优化、评价有关的重要步骤进行自动化地学习，使得机器学习模型无需人工干预即可被应用。从机器学习角度讲，automl可以看作是一个在给定数据和任务上学习和泛化能力非常强大的系统。从自动化角度讲，automl则可以看作是设计一系列高级的控制系统去操作机器学习模型，使得模型可以自动化地学习到合适的参数和配置而无需人工干预。automl平台支持多种上传数据的方式，例如案件设备回传的分类违禁品图片，自身本地上传的原始违禁品图片等。
[0093]
在一个实施例中，本步骤包括：s701，对所述原始违禁品图片进行标注，得到正常样本和异常样本；s702，对所述正常样本进行标注，得到标注图片，所述标注图片包括正样本和负样本，所述正样本的图片包含违禁品，所述负样本的图片不包含违禁品。
[0094]
其中，正常样本为可以进行模型训练的图片，异常样本为不能进行模型训练的异常数据，例如，图片花屏/图像内容确实/过曝/多张图像堆叠显示等。因此第一步的标记就是筛选出不参与模型训练的异常样本，因此可以在训练之前将原始违禁品图片里面的异常
样本进行删除。正常样本中为符合模型训练要求的图片，第二步对正常样本进行标注得到标注图片，标注图片包括正样本和负样本，正样本的图片包含违禁品，且进一步标注其包含的违禁品类别，负样本的图片不包含违禁品。此外，本实施例中是为了便于描述将原始违禁品图片的标注过程分步骤描述，但实际上直接得到最终的标注结果，即分别是异常样本、正样本以及负样本。
[0095]
在一个实施例中，获取已检测的预设类别的分类违禁品图片步骤之后，方法还包括：s801，基于所述分类违禁品图片，对所述原始违禁品图片进行预处理去重操作，得到预处理图片。对所述原始违禁品图片进行标注得到标注图片的步骤，包括：s802，对所述预处理图片进行标注得到标注图片。
[0096]
其中，因为原始违禁品图片和分类违禁品图片初始的待检测图片部分来源于安检设备摄像头实时拍摄，一是安检设备传带上没有行李通过的时候，所获取图片基本一致，二是获取图片的时间间隔较短时，所获取的图片也存在较大的相似性。相似的图片会增加无效的标注，且对于算法来说是冗余的，因此原始违禁品图片进行预处理去重操作，删除相似性较大的图片得到预处理图片。预处理去重操作的算法不做具体限定，其中key根据两幅图像的orb(oriented fast and rotated brief)特征来判断是否相似，具体做法是先读取两张图片，然后分别对图片进行orb特征提取，根据特征点的汉明距离来进行特征点的匹配判断两幅图像是否相似(通过预先设置阈值进行判断)，对于相似的图片进行删除。由于分类违禁品图片为已经检测标注违禁品类别的图片，因此当存在原始违禁品图片与分类违禁品图片相似度超过阈值时，优选选择删除原始违禁品图片，进一步减少标注工作量。之后对预处理之后的预处理图片进行标注得到标注图片。
[0097]
s204，根据所述标注图片和所述分类违禁品图片，确定样本数据集。
[0098]
其中，样本数据集中包含正样本数据集和负样本数据集，正样本数据集的图片包含违禁品，负样本数据集的图片不包含违禁品，正样本数据集包含上述实施例的正样本，且其中的图片还可以根据所包含的违禁品的类别进行分类。负样本数据集包含上述实施例的负样本。此外，可以直接将分类违禁品图片依照所包含的违禁品的类别划分至正样本数据集中不同类别中，减少样本处理的数据量。也可以为了提高样本的准确度，对分类违禁品图片基于其标注的边界框和违禁品类别进行再次审核分类，在提高样本准确度的同时尽量减少标注的工作量。
[0099]
s205，根据所述样本数据集对预设初始模型进行训练，得到违禁品检测模型。
[0100]
其中，预设初始模型为根据模型训练参数创建的初始模型，模型训练参数包括但不仅限于训练验证数据比例、图像尺寸、数据类别数、训练批处理大小、训练迭代次数、学习率、是否加载预训练模型等。
[0101]
具体地，根据样本数据集对预设初始模型进行训练，首先根据模型训练参数中的目标数据集类别选择进行模型训练的目标数据集，样本数据集中的负样本数据集视情况而定是否参与训练，若算法对于某个场景下的误检率很高，则可以将这个场景下的负样本数据集加入到目标数据集中，否则在训练之前需要将样本数据集里面的负样本数据集进行删除，也就是说负样本数据集一般不进行训练。此外，对于正样本数据集中的图片也是可以根据需要选择包含特定类别的违禁品的图片。其次，根据模型训练参数中的训练验证数据比例将从样本数据集中所选的目标数据集随机切分为训练集和验证集，根据模型训练参数中
的超参更新训练参数，随后可进行自动化训练，模型训练过程中会实时显示迭代的loss和模型在验证集上的检测map，并保存当前最优模型。完成指定迭代次数之后，automl平台会将最终保存的最优模型转化为可部署的模型，得到违禁品检测模型，如pytorch模型转为onnx模型，可以通过tensorrt直接进行部署；并将可部署模型进行压缩，用户可以通过前端页面进行下载。
[0102]
上述违禁品检测模型训练方法中，通过预处理操作(去白边操作和尺寸筛选操作)可以筛选符合条件的待检测图片；利用数据回传策略，可以根据所需类别有效地回传算法检测正确的图片，获取原始违禁品图片用于标注的同时，能够再次审核出分类违禁品图片中算法误检的图片，将误检图片标注为负样本重新训练，能够提升算法的检测性能；利用automl系统预处理对回传的图片和本地上传的图片进行去重操作，可以删除相似性大的图片，减少无效的标注量，使得算法样本较为均衡；通过automl标注系统对预处理后的图片进行标注，区分正样本、负样本和异常样本，能够有效地区分数据集里面的违禁品图片，筛选符合要求的图片进行网络训练。
[0103]
通过违禁品检测模型训练方法，使得x光违禁品检测算法在automl平台上平稳运行，用户可以通过前端页面操作，能够有效筛选和标注数据的同时进行自动化训练，完成数据到模型的闭环。能够系统地管理违禁品图片数据集，有效地进行数据筛选和样本区分，通过自动化的训练可以使得违禁品检测模型的训练变得更为简便、准确，能够节省算法人力，降低项目成本。
[0104]
参阅图3，本技术实施例提供了一种违禁品检测方法，主要应用通过上述实施例所述的违禁品检测模型训练方法得到的违禁品检测模型，该方法包括步骤s901～s902，具体如下：
[0105]
s901，获取待检测的原始图片。
[0106]
其中，原始图片是指需要进行检测其中是否包含违禁品以及所包含的违禁品的种类的图片，可以是直接获取的图片，也可以是通过获取的视频中提取图片；视频包括但不局限于短视频、长视频等格式，短视频可以是长度小于10分钟的视频，长视频可以是长度大于10分钟的视频。如果原始图片是通过视频截取，则可以进行去白边操作以及去重操作，减少需要检测的图片数量，提高检测效率。
[0107]
s902，根据预设的违禁品检测模型对所述原始图片进行检测，得到违禁品检测数据。
[0108]
其中，违禁品检测数据包含是否包含违禁品以及包含的违禁品的类别，其具体表现形式可以是边界框，同时在边界框中标识其对应的类别置信度，便于快速确定其标注信息。
[0109]
为了更好实施本技术实施例提供的违禁品检测模型训练方法，在本技术实施例所提违禁品检测模型训练方法的基础之上，本技术实施例中还提供一种违禁品检测模型训练装置，如图4所示，所述违禁品检测模型训练装置400包括：
[0110]
图片获取模块410，用于获取原始违禁品图片和已检测的预设类别的分类违禁品图片；
[0111]
样本标注模块420，与所述图片获取模块410通讯连接，用于对所述原始违禁品图片进行标注得到标注图片；
[0112]
数据集获取模块430，与所述图片获取模块410和所述样本标注模块420通讯连接，用于根据所述标注图片和所述分类违禁品图片，确定样本数据集；
[0113]
模型训练模块440，与所述数据集获取模块430通讯连接，用于根据所述样本数据集对预设初始模型进行训练，得到违禁品检测模型。
[0114]
在本技术一些实施例中，图片获取模块410还用于接收安检设备发送的已检测的预设类别的第一分类违禁品图片，所述第一分类违禁品图片为所述安检设备对采集的待识别图片进行违禁品检测后、回传的包含有预设类别的违禁品的图片，所述分类违禁品图片包括第一分类违禁品图片。
[0115]
在本技术一些实施例中，图片获取模块410还用于获取待检测图片；对所述待检测图片进行检测，识别出包含违禁品的违禁品图片以及包含的违禁品的违禁品类别；根据所述违禁品类别，从所述违禁品图片中获取预设类别的第二分类违禁品图片，所述分类违禁品图片包括第二分类违禁品图片。
[0116]
在本技术一些实施例中，图片获取模块410还用于获取原始待检测图片；按照预设格式对所述原始待检测图片进行重命名；对重命名之后的原始待检测图片进行去白边操作，得到有效待检测图片；选取预设尺寸的所述有效待检测图片得到所述待检测图片。
[0117]
在本技术一些实施例中，图片获取模块410还用于对所述待检测图片进行检测，得到违禁品类别以及类别置信度；当所述类别置信度大于等于预设的置信度阈值时，确定所述类别置信度对应的待检测图片为包含违禁品的违禁品图片。
[0118]
在本技术一些实施例中，样本标注模块420还用于对所述原始违禁品图片进行标注，得到正常样本和异常样本；对所述正常样本进行标注，得到标注图片，所述标注图片包括正样本和负样本，所述正样本的图片包含违禁品，所述负样本的图片不包含违禁品。
[0119]
在本技术一些实施例中，样本标注模块420还用于基于所述分类违禁品图片，对所述原始违禁品图片进行预处理去重操作，得到预处理图片；对所述预处理图片进行标注得到标注图片。
[0120]
上述实施例中，通过预处理操作(去白边操作和尺寸筛选操作)可以筛选符合条件的待检测图片；利用数据回传策略，可以根据所需类别有效地回传算法检测正确的图片，获取原始违禁品图片用于标注的同时，能够再次审核出分类违禁品图片中算法误检的图片，将误检图片标注为负样本重新训练，能够提升算法的检测性能；利用automl系统预处理对回传的图片和本地上传的图片进行去重操作，可以删除相似性大的图片，减少无效的标注量，使得算法样本较为均衡；通过automl标注系统对预处理后的图片进行标注，区分正样本、负样本和异常样本，能够有效地区分数据集里面的违禁品图片，筛选符合要求的图片进行网络训练。
[0121]
通过违禁品检测模型训练方法，使得x光违禁品检测算法在automl平台上平稳运行，用户可以通过前端页面操作，能够有效筛选和标注数据的同时进行自动化训练，完成数据到模型的闭环。能够系统地管理违禁品图片数据集，有效地进行数据筛选和样本区分，通过自动化的训练可以使得违禁品检测模型的训练变得更为简便、准确，能够节省算法人力，降低项目成本。
[0122]
在本技术一些实施例中，违禁品检测模型训练装置400可以实现为一种计算机程序的形式，计算机程序可在如图5所示的计算机设备上运行。计算机设备的存储器中可存储
组成该违禁品检测模型训练装置400的各个程序模块，比如，图4所示的图片获取模块410、样本标注模块420、数据集获取模块430以及模型训练模块440。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本技术各个实施例的违禁品检测模型训练方法中的步骤。
[0123]
例如，图5所示的计算机设备可以通过如图4所示的违禁品检测模型训练装置400中的图片获取模块410执行步骤s201和步骤s202。计算机设备可通过样本标注模块420执行步骤s203。计算机设备可通过数据集获取模块430执行步骤s204。计算机设备可通过模型训练模块440执行步骤s205。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的计算机设备通过网络连接通信。该计算机程序被处理器执行时以实现一种违禁品检测模型训练方法。
[0124]
本领域技术人员可以理解，图5中示出的结构，仅仅是与本技术方案相关的部分结构的框图，并不构成对本技术方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。
[0125]
在本技术一些实施例中，提供了一种计算机设备，包括一个或多个处理器；存储器；以及一个或多个应用程序，其中所述一个或多个应用程序被存储于所述存储器中，并配置为由所述处理器执行上述违禁品检测模型训练方法的步骤。此处违禁品检测模型训练方法的步骤可以是上述各个实施例的违禁品检测模型训练方法中的步骤。
[0126]
在本技术一些实施例中，提供了一种计算机可读存储介质，存储有计算机程序，计算机程序被处理器进行加载，使得处理器执行上述违禁品检测模型训练方法的步骤。此处违禁品检测模型训练方法的步骤可以是上述各个实施例的违禁品检测模型训练方法中的步骤。
[0127]
本邻域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory，rom)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(random access memory，ram)或外部高速缓冲存储器。作为说明而非局限，ram可以是多种形式，如静态随机存取存储器(static random access memory，sram)或动态随机存取存储器(dynamic random access memory，dram)等。
[0128]
以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。
[0129]
以上对本技术实施例所提供的一种违禁品检测模型训练方法、检测方法、装置及计算机设备进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的
技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种虚拟图形填充方法和半导体器件版图与流程

违禁品检测模型训练方法、检测方法、装置及计算机设备与流程

相关文献

最热文献