一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

图像检测方法、目标检测模型的训练方法及装置与流程

2022-07-23 07:37:29 来源:中国专利 TAG:
1.本技术涉及人工智能
技术领域
:,尤其涉及一种图像检测方法、目标检测模型的训练方法及装置。
背景技术
::2.目标检测是计算机视觉领域的基本任务之一,不仅需要对目标对象进行分类,而且需要预测目标对象所在位置。随着深度学习技术的发展以及深度神经网络在目标检测领域的广泛应用,当前目标检测技术在计算机视觉领域已经取得了相当不错的效果,并且也广泛地应用于工业、农业、安防以及交通监控等各个领域,比如:行人识别、车辆识别、家畜计数、自动驾驶等各种应用场景。3.而在实际应用中,经常会存在待检测目标物体小而密集的密集场景,相较于一般的目标检测任务,密集场景下目标检测任务的难点在于图像中目标物体数量非常庞大,目标物体整体尺寸较小且目标物体往往紧紧贴在一起,存在彼此重叠的问题。例如,在养殖场家畜计数场景中,摄像头采集到的家畜图片中往往背景较为复杂,且家畜往往拥挤在一起,导致整个养殖场中家畜分布不均匀,再加上不同时间段摄像头的视角以及光照变化,都给该场景下的小目标检测增加了难度。4.由此可见,现有的目标检测技术其检测精度以及准确率并不能满足实际需求,且针对密集场景下的小目标的检测仍然是目前极具挑战性的任务。技术实现要素:5.本技术实施例提供一种图像检测方法、目标检测模型的训练及装置,用于解决采用现有目标检测模型训练方法训练得到的目标检测模型在针对密集场景下的小目标的图像检测时,存在的识别精度较低且准确率较差的问题。6.第一方面,本技术提供一种图像检测方法,包括:7.获取待检测的第一图像,所述第一图像包括多个目标检测对象;8.根据所述第一图像的尺寸对所述第一图像进行分割,得到多个待检测的第二图像;9.将所述第一图像和所述第二图像输入预先训练的目标检测模型对所述多个目标检测对象进行识别,输出包含检测框的第一检测结果以及包含检测框的第二检测结果,其中,所述检测框用于表征所述目标检测对象在所述待检测图像中的位置信息,所述检测框与所述目标检测对象一一对应;10.基于预设算法对所述第一检测结果和所述第二检测结果进行筛选,得到目标检测结果;11.根据所述目标检测结果中检测框的数量,确定所述目标检测对象的数量。12.可以看出,在本技术实施例中,在进行图像检测时,在获取到包含了多个目标检测对象的待检测第一图像后,首先可以根据第一图像的尺寸,对第一图像进行分割,得到多个待检测的第二图像;接下来,可以通过将该第一图像和第二图像共同输入预先训练的目标检测模型,对目标检测对象进行检测,得到由该目标检测模型输出的包含检测框的第一检测结果以及包含检测框的第二检测结果;最后,基于预设算法对第一检测结果和第二检测结果进行筛选,得到目标检测结果,并根据目标检测结果中检测框的数量,可以确定目标检测对象的数量。采用本发明实施例所提供的图像检测方法,由于会对待检测原始图像进行分割处理,经过分割处理后得到的各个分割图像中目标检测对象的密度,相比于该原始图像出现了降低;且相比于目标检测对象在原始图像画面中的所占比例,经分割处理后,在分割图像中目标检测对象在画面中的所占比例变大,因此在将该原始图像和分割图像一起输入目标检测模型,相当于在一定程度上降低了输入目标检测模型中待检测图像里尺寸小但是比较密集的目标图像的数量占比,进而可以提高目标检测模型对待检测图像中多个目标检测对象的识别效率。同时,由于最终的目标检测结果是基于预设算法对由原始图像以及分割图像对应的检测结果进行筛选得到的,从而可以保证得到的目标检测结果更为准确。13.第二方面,本技术提供一种目标检测模型的训练方法,包括:14.获取预设的第一训练数据集,所述第一训练数据集包括多个第一样本图像以及所述第一样本图像中目标检测对象的第一检测框,所述检测框用于表征所述目标检测对象在所述第一样本图像中的位置信息;15.根据每个第一样本图像的尺寸对所述第一样本图像进行分割,得到第二训练数据集,所述第二训练数据集包括:多个第二样本图像以及所述第二样本图像中目标检测对象的第二检测框;16.将所述第一训练数据集以及所述第二训练数据集输入初始识别模型中,输出所述第一样本图像的第一预测标记框和所述第二样本图像的第二预测检测框;17.根据所述第一预测检测框、所述第一检测框、所述第二预测检测框、所述第二检测框,构建目标损失函数;18.基于所述目标损失函数对所述初始识别模型进行迭代训练,得到所述目标检测模型。19.可以看出,在本技术实施例中,在进行目标检测模型的训练时,在获取到预设的第一训练数据集后,可以根据每个第一样本图像的尺寸对第一样本图像进行分割,得到第二训练数据集,并将第一训练数据集与经分割处理后的第二训练数据集作为训练样本输入初始识别模型中,通过对该初始识别模型进行迭代训练,得到目标检测模型。采用本发明实施例提供的目标检测模型训练方法,样本图像在经过分割处理后,各个分割图像中目标检测对象的密度,相比于原始样本图像出现了降低;且相比于目标检测对象在原始样本图像画面中的所占比例,经分割处理后,在分割图像中目标检测对象在画面中的所占比例变大,因而在对原始训练样本图像进行分割处理后,相当于将原始训练样本图像中的尺寸小且比较密集的目标物体,转换成了针对分割图像中的正常大小、正常密集度的目标检测物体,在训练过程中,模型针对训练样本中正常识别目标的识别效率与准确度都远高于针对尺寸小且比较密集的目标的训练样本,而在将该原始样本图像和分割图像一同作为训练样本输入该初始识别模型,相当于在一定程度上降低了训练样本集中尺寸小且比较密集的目标训练样本图像的比例,因而通过该训练方法,一方面即提高了目标检测模型的训练效率,另外一方面又提高了模型对图像中的尺寸小且比较密集的目标物体的识别准确率。20.第三方面,本技术提供一种图像检测装置,包括:21.图像获取模块,用于获取待检测的第一图像,所述第一图像包括多个目标检测对象;22.图像分割模块,用于根据所述第一图像的尺寸对所述第一图像进行分割,得到待检测的第二图像;23.检测模块,用于将所述第一图像和所述第二图像输入预先训练的目标检测模型对所述多个目标检测对象进行识别,输出包含检测框的第一检测结果以及包含检测框的第二检测结果,其中,所述检测框用于表征所述目标检测对象在所述待检测图像中的位置信息,所述检测框与所述目标检测对象一一对应;24.筛选模块,用于基于预设算法对所述第一检测结果和所述第二检测结果进行筛选,得到目标检测结果;25.计数模块,用于根据所述目标检测结果中检测框的数量,确定所述目标检测对象的数量。26.第四方面,本技术提供一种目标检测模型的训练装置,包括:27.训练数据获取模块,用于获取预设的第一训练数据集,所述第一训练数据集包括多个第一样本图像以及所述第一样本图像中目标检测对象的第一标记框,所述标记框用于表征所述目标检测对象在所述第一样本图像中的位置信息;28.样本图像分割模块,用于根据每个第一样本图像的尺寸对所述第一样本图像进行分割,得到第二训练数据集,所述第二训练数据集包括:多个第二样本图像以及所述第二样本图像中目标检测对象的第二标记框;29.训练模块,用于将所述第一训练数据集以及所述第二训练数据集输入初始识别模型中,输出所述第一样本图像的第一预测标记框和所述第二样本图像的第二预测标记框;30.损失函数构建模块,用于根据所述第一预测标记框、所述第一标记框、所述第二预测标记框、所述第二标记框,构建目标损失函数;31.迭代模块,用于基于所述目标损失函数对所述初始识别模型进行迭代训练,得到所述目标检测模型。32.第五方面,本技术提供一种电子设备,包括:33.处理器;34.用于存储所述处理器可执行指令的存储器;35.其中,所述处理器被配置为执行所述指令,以实现如第一方面或第二方面所述的方法。36.第六方面,本技术提供一种计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如第一方面或第二方面所述的方法。附图说明37.此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:38.图1为本说明书的一个实施例提供的一种图像检测方法的流程示意图;39.图2为本说明书的一个实施例提供的一种图像检测方法在具体应用场景中的流程示意图;40.图3为本说明书的一个实施例提供的一种目标检测模型的训练方法的流程示意图;41.图4为本说明书的一个实施例提供的图像重叠样式示意图;42.图5为本说明书的一个实施例提供的另外一种分块图像重叠样式示意图;43.图6为本说明书的一个实施例提供的一种初始识别模型的结构示意图;44.图7为本说明书的一个实施例提供的一种图像检测装置的结构示意图;45.图8为本说明书的一个实施例提供的一种目标检测模型的训练装置的结构示意图;46.图9为本说明书的一个实施例提供的一种电子设备的结构示意图。具体实施方式47.为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范围。48.本说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应理解这样使用的数据在适当情况下可以互换,以便本说明书实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,本说明书以及权利要求书中“和/或”表示所连接对象的至少其中之一,字符“/”一般表示前后关联对象是一种“或”的关系。49.如前所述,目前并未有针对密集检测场景下的小目标的目标检测模型训练方法,而采用目前常用的目标检测模型训练方法得到的目标检测模型,在面对密集检测场景下的小目标时,由于在一整张待检测图像中所包含的目标检测物体数量较多,目标检测物体之间相互堆叠,且目标检测检测物体较小,导致检测框重叠面积太大,进而导致目标检测模型无法准确识别出图像中的目标物体,从而造成采用现有目标检测模型训练方法训练得到的目标检测模型在针对密集检测场景下的小目标检测时,存在检测精度较低且准确率较差的问题。50.为了解决上述技术问题,本说明书实施例提供一种图像检测方法以及该图像检测方法中所使用的目标检测模型的训练方法,在进行图像检测时,在获取到包含了多个目标检测对象的待检测第一图像后,首先可以根据第一图像的尺寸,对第一图像进行分割,得到多个待检测的第二图像;接下来,可以通过将该第一图像和第二图像共同输入预先训练的目标检测模型,对目标检测对象进行检测,得到由该目标检测模型输出的包含检测框的第一检测结果以及包含检测框的第二检测结果;最后,基于预设算法对第一检测结果和第二检测结果进行筛选,得到目标检测结果,并根据目标检测结果中检测框的数量,可以确定目标检测对象的数量。采用本发明实施例所提供的图像检测方法,由于会对待检测原始图像进行分割处理,经过分割处理后得到的各个分割图像中目标检测对象的密度,相比于该原始图像出现了降低;且相比于目标检测对象在原始图像画面中的所占比例,经分割处理后,在分割图像中目标检测对象在画面中的所占比例变大,因此在将该原始图像和分割图像一通输入目标检测模型,相当于在一定程度上降低了输入图像中尺寸小且比较密集的目标图像的比例,进而可以提高目标检测模型对待检测图像中多个目标检测对象的识别效率。同时,由于最终的目标检测结果是基于预设算法对由原始图像以及分割图像对应的检测结果进行筛选得到的,从而可以保证得到的目标检测结果更为准确。51.应理解,本说明书实施例提供的图像检测方法以及目标检测模型的训练方法均可以由电子设备执行或安装在电子设备中的软件执行,具体可以由终端设备或服务端设备执行。其中,图像检测方法和目标检测模型的训练方法可以由同一电子设备执行,或者也可以由不同的电子设备执行。52.以下结合附图,详细说明本说明书各实施例提供的技术方案。53.请参考图1,为本说明书的一个实施例提供的一种图像检测方法的流程示意图,该方法可以包括:54.步骤11,获取待检测的第一图像;55.其中,该待检测的第一图像包括多个目标检测对象,该待检测的第一图像可以是通过图像采集设备(比如摄像头)采集到的,例如,假设需要针对畜牧业中的家畜计数场景训练目标检测模型,则可以通过安装在家畜养殖场内的摄像头,对家畜图像进行采集,以获取待检测的第一图像。56.这里需要说明的是,通过设置在养殖场内的摄像头采集到的一般为视频格式的数据,则在本方案中可以首先利用跨平台计算机视觉和机器学习软件库(opencv)对视频文件进行图像提取,比如可以按照每5帧提取一张图片的速率,从摄像头采集到的视频文件中提取图像,并将提取的图像保存作为待检测图片。57.另外这里还需要说明的是,图像检测过程不同于目标检测模型的训练过程,在模型训练过程中要求训练样本尽量越丰富越好,而在基于预先训练的目标检测模型进行图像检测时,输入目标检测模型的待检测图像越清晰,则得到的目标检测结果往往越准确,因而在进行图像检测时,如果没有特殊要求,则可以优先选取画面清晰的图片作为待检测的第一图像。58.步骤12,根据所述第一图像的尺寸对所述第一图像进行分割,得到多个待检测的第二图像;59.由于通过执行步骤11获取到的待检测第一图像均为大尺寸的全景图片,图片尺寸较大,而其中待检测的目标检测对象较小,且待检测的目标检测对象较为密集,如果直接将该第一图像不加处理直接输入目标检测模型,由于第一图像中目标检测对象所占比例较小且较为密集,因而很容易导致目标检测模型输出的检测结果准确率较差。60.为了解决上述问题,在本说明书实施例中,可以对通过执行步骤11得到的待检测第一图像进行分割处理,经过分割处理后得到的各个分割图像中目标检测对象的密度,相比于该原始图像出现了降低;且相比于目标检测对象在原始图像画面中的所占比例,经分割处理后,在分割图像中目标检测对象在画面中的所占比例变大,从而可以在一定程度上提高目标检测模型的识别效率以及识别准确率。61.在本技术实施例中,可以按照预设的图像分割规则,根据第一图像的尺寸,对第一图像进行分割处理,例如:可以根据第一图像的长边,对第一图像进行分割;或者也可以根据第一图像的面积,对第一图像进行分割,本说明书实施例对该第一图像的分割方式不做限定。可选的,可以参照步骤3201至步骤3203的图像分割方式对第一图像进行分割。62.步骤13,将所述第一图像和所述第二图像输入预先训练的目标检测模型对所述多个目标检测对象进行识别,输出包含检测框的第一检测结果以及包含检测框的第二检测结果;63.其中,检测框用于表征目标检测对象在待检测图像中的位置信息,检测框与目标检测对象一一对应。64.在一种可选的实现方式中,该预先训练的目标检测模型主要可以包括:骨干网络、特征提取网络以及预测输出网络这三层网络结构。65.其中,骨干网络用于对输入的所述第一图像和所述第二图像进行特征提取,得到所述第一图像和所述第二图像各自对应的特征向量;特征提取网络用于对输入的特征向量进行特征融合,得到融合后的特征向量;预测输出网络用于对输入的所述融合后的特征向量进行预测,得到包含标记框的第一检测结果以及包含标记框的第二检测结果。66.另外,该预先训练的目标检测模型是按照本说明书实施例所提供的目标检测模型的训练方法预先训练得到的,该目标检测模型的具体训练方法以及详细的模型结果,详见后文描述,此处不再赘述。67.步骤14,基于预设算法对第一检测结果和第二检测结果进行筛选,得到目标检测结果;68.这里需要说明的是,在使用目标检测模型进行图像检测的过程中,在同一目标检测对象的位置上会产生大量的候选检测框,这些候选检测框相互之间会有重叠,此时我们需要利用非极大值抑制(non-maximumsuppression,nms)算法根据检测框置信度的不同找到能够表征该目标检测对象位置信息的最佳目标检测框,以消除冗余的检测框。69.在现有技术中,标准的nms算法的流程如下:根据置信度得分,对各个候选检测框进行排序;选择置信度最高的候选检测框添加到最终输出列表中,并将其从检测框列表中删除;计算所有候选检测框的面积,计算置信度最高的候选检测框与其他候选检测框的交并集比(intersectionoverunion,iou),删除iou大于阈值的候选检测框,重复上述过程,直至检测框列表为空,将最终输出列表中的检测框作为最终输出的目标检测框。70.然而针对尺寸小且比较密集的目标的检测,由于待检测图像中各个目标检测对象紧紧挤在一起,且目标较小,检测框重叠的概率就会更大,导致使用标准的nms算法对候选检测框进行筛选时,会出现较多的误判,从而影响了最终检测结果的准确度。71.为了避免标准nms算法针对尺寸小且比较密集的目标的检测的不足,本技术实施例对nms算法进行了改进优化,针对目标检测对象周边其他目标检测对象的密集程度,采用不同的筛选策略来进行筛选,从而避免在尺寸小且比较密集的目标检测时,由于检测框重叠概率增加,而导致出现较多误判。72.在一种实施方式中,具体可以利用如下改进nms算法,对第一检测结果和第二检测结果进行筛选,得到目标检测结果,方法具体可以包括:根据距离每个检测框中心点的曼哈顿距离小于预设阈值的其他检测框的数量,确定所述检测框的密度;根据所述检测框的密度,对所述第一检测结果以及所述第二检测结果进行筛选,得到目标检测结果。73.在一种实施方式中,通过遍历第一检测结果和第二检测结果中所有检测框,根据距离每个检测框中心点曼哈顿距离小于预设距离阈值(比如,距离小于50)的其他检测框的数量,确定该检测框的密度。74.在确定了个预测检测框周边的密度后,可以按照如下子步骤,进行检测结果的筛选:75.子步骤1401,确定第一检测结果以及第二检测结果中每个目标检测对象对应的检测框集合;76.子步骤1402,根据通过执行子步骤1401得到的检测框集合中各检测框与所述检测框集合中其他检测框的第一曼哈顿距离,得到所述检测框集合对应的第一曼哈顿距离集合;77.子步骤1403,对通过执行子步骤1402得到的第一曼哈顿距离集合进行归一化处理,得到所述检测框集合对应的第二曼哈顿距离;78.子步骤1404,判断该检测框的密度是否大于预设密度阈值,当判断结果为是时,则执行子步骤1405;当判断结果为否时,则执行子步骤1406;79.子步骤1405,若该检测框的密度大于预设密度阈值,以及第二曼哈顿距离小于预设值,则根据检测框集合中目标检测框对应的置信度以及检测框集合对应的第二曼哈顿距,计算目标检测框的第三曼哈顿距离,得到检测框集合对应的第三曼哈顿距离集合,其中,所述目标检测框为所述检测框集合中的任一检测框;80.在本说明书实施例中,可以根据如下公式[1]来计算检测框的第三曼哈顿距离:[0081]wp=p/ci1.[0082]其中,wp表示检测框的第二曼哈顿距离,p表示第二曼哈顿距离,ci表示该检测框的置信度。[0083]在第三曼哈顿距离集合中筛选出所述第三曼哈顿距离最小的检测框,作为所述检测框集合对应目标检测对象的目标检测结果。[0084]子步骤1406,若所述检测框的密度小于预设密度阈值,则分别计算所述检测框集合中各预测检测框对应的交并集比,将所述交并集比最大的检测框作为所述检测框集合对应目标检测对象的目标检测结果。[0085]采用上述方法在对第一检测结果以及第二检测结果进行筛选时,由于可以根据不同检测框的密度,确定不同检测框对应的筛选方法,从而保证针对目标检测对象周围检测框密度较高的情况下,可以按照更加适合的方式进行筛选,从而避免对尺寸小且比较密集的目标的进行检测时,由于检测框重叠概率增加,而导致出现较多误判的问题。[0086]步骤15,通过对所述检测结果中检测框的数量进行统计,以确定所述待检测图片中目标物体的数量。[0087]当需要基于目标检测结果进行计数时,则可以通过对输出检测结果中检测框数量进行统计,以确定该待检测图片中目标物体的数量。[0088]本说明书实施例提供的图像检测方法,可以应用于任意具有图像检测需求的场景,例如可以包括但不限于行人识别、车辆识别、家畜计数、自动驾驶等场景。下面结合基于图像检测进行的家畜计数这一应用场景为例,对本说明书实施例提供的图像检测方法进行详细说明,具体处理流程详见图2所示,主要包括以下步骤。[0089]步骤21,通过安装在家畜养殖场内的摄像头,对鸡群图像进行采集,以获取待检测的鸡群图像;[0090]通过设置在养殖场内的摄像头采集到的一般为视频格式的数据,则在本方案中可以首先利用跨平台计算机视觉和机器学习软件库(opencv)对视频文件进行图像提取,比如可以按照每5帧提取一张图片的速率,从摄像头采集到的视频文件中提取鸡群图像,并将提取的鸡群图像保存作为用于鸡群计数的待检测图片。[0091]另外这里需要说明的是,为了保证基于待检测图片得到的鸡群计数结果尽可能准确,在一种可选的实现方式中,可以优先选择画面清晰,鸡群分布尽量均匀,以及画面中鸡舍区域采集完整的图像作为待检测的图像。[0092]步骤22,按照特定分割规则,对该鸡群图像进行分割处理,得到多个分割鸡群图像;[0093]比如,假设通过执行步骤21获得的鸡群图像尺寸为:“200×100”,则可以根据鸡群图像的长边,对鸡群图像进行分割,得到五个“40×100”的分割鸡群图像;或者也可以根据鸡群图像的宽度,对鸡群图像进行分割,得到四个“200×25”的分割鸡群图像;另外也还可以根据鸡群图像的面积,对鸡群图像进行分割。[0094]步骤23,将该原始鸡群图像和多个分割鸡群图像输入预先训练的目标检测模型,以通过该目标检测模型对原始鸡群图像以及分割鸡群图像中的目标检测对象—鸡进行识别,并输出包含检测框的检测结果;[0095]通过该预先训练好的目标检测模型,可以对输入的原始鸡群图像和多个分割鸡群图像进行目标检测,以确定每个输入图像中目标检测对象—鸡的位置,并通过检测框的形式,对原始鸡群图像和多个分割鸡群图像中每个鸡的位置进行标注。[0096]另外,这里需要说明的是,在使用目标检测模型进行图像检测的过程中,在同一目标检测对象的位置上会产生大量的候选检测框,这些候选检测框相互之间会有重叠,则在本方案中可以通过预设算法对检测结果中针对同一个鸡的所有候选检测框进行筛选,以得到表征每个目标检测对象位置的唯一最优检测框,并输出最终的目标检测结果,在最终目标检测结果中,检测框与鸡群图像中的每个目标检测对象—鸡都一一对应。[0097]步骤24,通过对检测结果中检测框的数量进行统计,以确定该鸡群图像中鸡的数量,进而完成了一次对养鸡场内鸡群数量的统计。[0098]采用本说明书实施例提供一种图像检测方法以及该图像检测方法中所使用的目标检测模型的训练方法,在进行图像检测时,在获取到包含了多个目标检测对象的待检测第一图像后,首先可以根据第一图像的尺寸,对第一图像进行分割,得到多个待检测的第二图像;接下来,可以通过将该第一图像和第二图像共同输入预先训练的目标检测模型,对目标检测对象进行识别,得到由该目标检测模型输出的包含检测框的第一检测结果以及包含检测框的第二检测结果;最后,基于预设算法对第一检测结果和第二检测结果进行筛选,得到目标检测结果,并根据目标检测结果中检测框的数量,可以确定目标检测对象的数量。采用本发明实施例所提供的图像检测方法,由于会对待检测原始图像进行分割处理,经过分割处理后得到的各个分割图像中目标检测对象的密度,相比于该原始图像出现了降低;且相比于目标检测对象在原始图像画面中的所占比例,经分割处理后,在分割图像中目标检测对象在画面中的所占比例变大,因此在将该原始图像和分割图像一通输入目标检测模型,相当于在一定程度上降低了输入图像中尺寸小且比较密集的目标图像的比例,进而可以提高目标检测模型对待检测图像中多个目标检测对象的识别效率。同时,由于最终的目标检测结果是基于预设算法对由原始图像以及分割图像对应的检测结果进行筛选得到的,从而可以保证得到的目标检测结果更为准确。[0099]与上述方法相对应地,本说明书实施例还提供一种目标检测模型的训练方法,用于解决采用现有目标检测模型训练方法训练得到的目标检测模型在针对对尺寸小且比较密集的目标进行检测时,存在的及检测精度较低且准确率较差的问题。[0100]请参考图3,为本技术的一个实施例提供的一种目标检测模型训练方法的流程示意图,该方法可以包括如下步骤:[0101]步骤31,获取预设的第一训练数据集;[0102]其中,该第一训练数据集包括多个第一样本图像以及该第一样本图像中目标检测对象的第一检测框,该些检测框用于表征目标检测对象在第一样本图像中的位置信息。[0103]在一种可选的实现方式中,第一训练数据集中的样本图像可以是通过图像采集设备(比如摄像头)采集到的,例如,假设需要针对畜牧业中的家畜计数场景训练目标检测模型,则可以通过安装在家畜养殖场内的摄像头,对家畜图像进行采集,以获取用于模型训练的样本图像。[0104]这里需要说明的是,通过设置在养殖场内的摄像头采集到的一般为视频格式的数据,则在本方案中可以首先利用跨平台计算机视觉和机器学习软件库(opencv)对视频文件进行图像提取,比如可以按照每5帧提取一张图片的速率,从摄像头采集到的视频文件中提取图像,并将提取的图像保存作为后续进行模型训练的样本图像。同时,为了避免获取到的大量样本图像对系统内存的大量占用,在本技术实施例中,可以将提取的图片保存为便携式网络图形(portablenetworkgraphics,png格式),利用png格式的高压缩比,在不损失图片数据的情况下,可以获得占用内存体积更小的图像,从而保证了在进行目标检测模型训练时,不会消耗过多的系统内存。[0105]另外,这里还需要说明的是,通过上述操作提取到的样本图像是未经标注的原始图像数据,在使用该些样本图像组成第一训练数据集之前,还需要对该些样本图像进行标注,在本技术实施例中,可以通过图像标注工具labelme,对样本图像进行标注,将样本图像中有目标检测对象(仍以上文所述的家畜技术场景为例,则该目标物体可以为样本图像中的家畜)的位置用检测框标注出来,并生成对象简谱(javascriptobjectnotation,json)格式的标注文件。这里需要说明的是,除了可以使用labelme工具对样本图像进行标注外,还可以使用其他图像标注工具对样本图像进行标注,本实施例对图像标注所使用的具体标注方式以及标注工具不进行限制。[0106]在目标检测问题中,针对小目标的识别性能,往往只有大目标检测性能的一半,这是因为在待检测图片中,小目标的面积太小了,导致包含目标的检测框较小,这就导致小目标被检测出来的概率较小,为了尽可能地强化模型针对小目标的识别能力,在本技术实施例中,在进行目标检测模型的训练时,可以对样本图像进行数据增强,以丰富针对尺寸小且比较密集的目标样本图像的数量,从而可以在一定程度上提高训练得到的目标检测模型识别出小目标的概率。同时,通过对样本图像进行数据增强的方式,还可以避免由于训练目标检测模型的样本图片固化而可能导致的模型训练效果不佳的问题。[0107]在一种可选的实现方式中,可以通过预设的图像增强策略,对该第一训练数据集中的样本图像进行数据增强,每个数据增强策略可以至少包含两个图像变换操作,且每个图像变换操作至少包含两个参数,这两个参数分别可以用来表示:该操作的执行概率以及具体的图像变换的具体数值。[0108]在一种可选的实现方式中,本说明书实施例所提供的图像变换操作可以包括但不仅限于以下三类:[0109]类型1,颜色操作:主要是通过对图像的颜色通道进行改变,以实现对图像的对比度、饱和度、色相、亮度以及色相饱和度等的调整。[0110]类型2,几何操作:主要是通过对图像进行几何改变,同时会改变检测框的位置的大小,比如旋转、平移以及翻转等。[0111]类型3,检测框操作:主要是通过对检测框内的像素进行改变。[0112]这里需要说明的是,除了上述三类图像变换操作外,本技术实施例还可以通过本领域技术人员已知的各种图像变换操作方式,实现对样本图像的数据增强,本技术实施例对数据增强中所采用的图像变换操作方式不作具体限定。[0113]比如,数据增强策略a中包含两个图像变换操作分别为:[0114]颜色操作a:改变图像亮度,且该颜色操作a中包含的两个参数分别为:概率50%,亮度-20%;颜色操作a中的这两个参数表示在执行该数据增强策略a时,有50%的概率执行颜色操作a,执行结果为将样本图像的亮度值降低20%。[0115]几何操作b:图像旋转,且该几何操作b中包含的两个参数分别为:概率50%,顺时针旋转90度;几何操作b中的这两个参数表示在执行该数据增强策略a时,有50%的概率执行几何操作b,执行结果为将样本图像顺时针旋转90度。[0116]步骤32,根据每个第一样本图像的尺寸对第一样本图像进行分割,得到第二训练数据集;[0117]其中,该第二训练数据集包括:多个第二样本图像以及第二样本图像中目标检测对象的第二检测框。[0118]由于通过执行步骤31获取到的样本图像均为大尺寸的全景图像,图像尺寸较大,而其中待检测的目标检测对象较小,且目标检测对象较为密集,如果直接将该些样本图像作为训练样本来训练目标检测模型,一方面由于目标检测对象在整个样本图像中所占比例较小,不易识别,极大地降低了目标检测模型的训练效率;另外一方面,由于目标检测对象在样本图像中分布较为密集,通过执行步骤21提前标注的检测框之间往往会存在遮挡重叠的问题,因而容易导致训练得到的目标检测模型对小目标检测准确率较低的问题。[0119]为了解决上述问题,在本技术实施例中,可以对通过执行步骤31得到的样本图像进行分割处理,经过分割处理后,大尺寸的原始训练样本图像被拆分成了尺寸较小的第二样本图像,相比于该原始样本图像,经过分割处理后得到的各个第二样本图像中目标检测对象的密度出现了降低;且相比于目标检测对象在原始样本图像画面中的所占比例,经分割处理后,在第二样本图像中目标检测对象在画面中的所占比例变大,从而可以在一定程度上提高模型训练过程中对尺寸小且比较密集的目标的识别效率以及识别准确率。[0120]这里需要说明的是,由于样本图像采集摄像头设置机位以及光线等原因,可能会导致通过执行步骤31采集到的样本图像中存在图像质量较差,样本图像中目标检测对象模糊或者不完整的问题,为了避免这些存在质量问题的样本图像对模型训练结果的影响,在本技术实施例中,在对样本图像进行分割处理前,可以根据预设图像过滤策略,对该些样本图像进行过滤,将筛选掉不需要进行分块处理的样本图像,以提高后续分块处理的效率。[0121]在一种可选的实现方式中,可以按照预设图像过滤策略,对第一训练数据集中的训练样本图像进行筛选过滤。例如,以家畜计数-鸡舍鸡群计数这一使用场景为例,在该使用场景下,研究人员发现:在夜晚抱团取暖或者集中进食时,鸡群会集中在鸡舍的边缘,导致鸡身形状出现挤压变形;或者因为摄像头角度的问题,图像边缘会出现目标物体采集不全,比如样图图片的边缘会出现只拍摄到半只鸡的情况。[0122]基于以上情况,针对家畜计数-鸡舍鸡群计数这一使用场景可以设置图像过滤策略为:[0123]1、鸡舍边缘的鸡群不进行分割处理;[0124]2、图像边缘出现未拍摄完全的目标物体(比如半只鸡)则不进行分割处理。[0125]则在执行分割处理之前,可以按照如上的图像过滤策略,对第一训练数据集中的样本图像进行筛选。[0126]在一种可选的实现方式中,可以按照如下子步骤,对第一训练数据集中的训练样本进行分割处理:[0127]子步骤3201,根据每个第一样本图像的尺寸以及所述第一样本图像中第一检测框的尺寸,确定图像边缘重叠率;[0128]其中,图像边缘重叠率具体可以包括图像左右边缘重叠率以及图像上下边缘重叠率,分别如图4以及图5所示。[0129]在一种可选的实现方式中,可以按照如下公式[2],来计算图像左右边缘重叠率:[0130]overlap_rate_x=(w/2-bbox_x)/(w/2)ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ[2][0131]其中,overlap_rate_x表示图像左右边缘重叠率,bbox_x表示边缘离样本图像中心点距离最近的检测框的横坐标,w表示样本图像的宽度。[0132]在一种可选的实现方式中,可以按照如下公式[3],来计算图像上下边缘重叠率:[0133]overlap_rate_y=(h/2-bbox_y)/(h/2)ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ[3][0134]其中,overlap_rate_y表示图像上下边缘重叠率,bbox_y表示边缘离样本图像中心点距离最近的检测框的纵坐标,h表示样本图像的高度。[0135]子步骤3202,根据通过执行子步骤3201确定的图像边缘重叠率,确定分割标准;[0136]在一种可选的实现方式中,可以根据图像边缘重叠率,分别确定分割宽度以及分割高度,作为分割标准。[0137]具体地,可以根据如下公式[4]来计算分割后第二样本图像的宽度:[0138]bw=(overlap_rate_x 1)×w/2ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ[4][0139]其中,bw表示分割得到的第二样本图像的宽度,w表示样本图像的宽度。可以根据如下公式[5]来计算分割后第二样本图像的高度:[0140]bh=(overlap_rate_y 1)×h/2ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ[5][0141]其中,bh表示分割得到的第二样本图像的高度,h表示样本图像的高度。[0142]子步骤3203,根据通过执行子步骤3202确定的分割标准,对所述第一样本图像进行分割,得到第二训练数据集。[0143]通过执行上述子步骤3201~子步骤3203,以完成对第一训练数据集中每个第一样本图像的分割处理,经过分割处理后,大尺寸的原始训练样本图像被拆分成了尺寸较小的第二样本图像,相比于该原始样本图像,经过分割处理后得到的各个第二样本图像中目标检测对象的密度出现了降低;且相比于目标检测对象在原始样本图像画面中的所占比例,经分割处理后,在第二样本图像中目标检测对象在画面中的所占比例变大,从而可以在一定程度上提高模型训练过程中对尺寸小且比较密集的目标的识别效率以及识别准确率。[0144]步骤33,将通过执行步骤31~步骤32获取到的第一训练数据集以及第二训练数据集输入初始识别模型中,输出所述第一样本图像的第一预测标记框和所述第二样本图像的第二预测检测框;[0145]其中,该初始识别模型可以是基于yolo系列模型架构预先搭建的,比如可以是基于yolov3、yolov4或者yolov5架构搭建的,本说明书实施例对初始模型是采用何种模型架构进行搭建的不做具体限定。[0146]下文以该初始识别模型是基于yolov5架构搭建的为例,对初始识别模型的训练过程进行详细介绍,可以理解的是基于yolov5架构搭建的初始识别模型仅为一种实例性的说明,yolov5是一种由深度神经网络(deepneuralnetworks,dnn)构成的具有学习能力的检测识别框架,具备至少一个隐藏的神经网络,与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。[0147]在一种可选的实现方式中,基于yolov5架构预先构建的初始识别模型的结构如图6所示,主要包括:骨干网络(backbone),特征融合网络(panet)以及预测输出网络(output)。[0148]其中,该骨干网络(backbone)为已在大型数据库上完成预训练,拥有预训练参数的卷积神经网络。该骨干网络(backbone)包括多个依次相连的csp瓶颈层(bottleneckcsp-csp),以及空间金字塔池化模块(spp)。[0149]在一种可选的实现方式中,该骨干网络用于对输入的第一样本图像和第二样本图像进行特征提取,得到第一样本图像和第二样本图像各自对应的特征向量。[0150]特征融合网络中包括按照特征金字塔网络(pathaggregationnetwork,panet)组织构建的多个跨阶段csp瓶颈层(bottleneckcsp),每个csp瓶颈层用于形成设定维度下的单维度特征提取结果输出至预测输出网络。[0151]该特征融合网络还包括:特征合并层(concat层),该特征合并层的输入端分别与各所述跨阶段csp瓶颈层的输出端相连,用于将各维度下的单维度特征提取结果进行特征拼接,得到组合维度特征提取结果输出至所述预测输出网络。[0152]在一种可选的实现方式中,特征融合网络用于对输入的特征向量进行特征融合,得到融合后的特征向量。[0153]该预测输出网络output,用于根据各单维度特征提取结果,以及组合维度特征提取结果,得到对目标检测对象的预测结果。在一种可选的实现方式中,该预测输出网络用于对输入的融合后的特征向量进行预测,输出第一样本图像的第一预测标记框和第二样本图像的第二预测检测框。[0154]步骤34,根据第一预测检测框、第一检测框、第二预测检测框、第二检测框,构建目标损失函数;[0155]其中,该目标损失函数用于计算训练数据集在该初始识别模型中的损失值,该损失值用于表征训练中的目标检测模型所输出的预测检测框与检测框之间的偏差。[0156]需要说明的是,在训练目标检测模型时所使用的损失函数可以采用任意适当形式的损失函数,具体可根据实际需要进行设置,本说明书实施例对此不作具体限定。可选地,在一种实施方式中,本说明书实施例所使用的损失函数可以包括交叉熵crossentropy损失函数和ciouloss损失函数。[0157]在一种可选的实现方式中,可以根据如下公式[6]来计算交叉熵crossentropy损失函数的损失值:[0158][0159]其中,c为根据交叉熵crossentropy损失函数计算出的损失值,n为训练样本数据集中所包含的训练样本总数,a为预测检测框,y为检测框,lna表示计算a的自然对数,ln(1-a)表示计算(1-a)的自然对数。[0160]在一种可选的实现方式中,可以根据如下公式[7]来计算ciouloss损失函数的损失值:[0161][0162]其中,lciou为根据ciouloss损失函数计算出的损失值,iou为预测检测框a和检测框b的交并集比,bgt为检测框中心点位置,b为预测检测框中心点位置,ρ2(b,bgt)为预测检测框a和检测框b中心点之间的欧几里得距离,c为预测检测框a和检测框b之间最小外接矩形测对角线的长度,α为权重,v为预测检测框a和检测框b之间长宽比的距离。[0163]在一种可选的实现方式中,可以按照如下公式[8],来确定上述公式[7]中的α:[0164][0165]在一种可选的实现方式中,交并集比iou的计算方法可以如下公式[9]所示:[0166][0167]在一种可选的实现方式中,v的计算方法可以如下公式[10]所示:[0168][0169]其中,wgt为检测框的宽,hgt为检测框的长,w为预测检测框的宽,h为预测检测框的长。[0170]步骤35,基于通过执行步骤34确定的目标损失函数对所述初始识别模型进行迭代训练,得到所述目标检测模型。[0171]在一种实施方式中,可以以目标检测模型的损失值下降为目标,从目标检测模型的最后一层网络层起,通过反向传播逐层调整目标检测模型中各网络层的网络参数,直至总损失值达到预设标准时,可以训练得到目标检测模型。[0172]具体地,可以从目标检测模型的最后一层网络层起,根据目标检测模型中各网络层的结构及不同网络层之间的连接关系及连接权重等,对目标检测模型的损失值向前求偏导,得到各网络层的损失值,其中,各网络层的损失值用于表征在各网络层引起的检测偏差,接着,以使目标检测模型的损失值下降为目标,依次基于各网络层的损失值对各网络层的网络参数进行更新,直至目标检测模型的损失值满足预设损失值阈值,最终使得该目标检测模型的输出结果与样本图像中的检测框无限接近,以完成目标检测模型的训练。[0173]采用本说明书实施例提供的目标检测模型训练方法,在进行目标检测模型的训练时,在获取到预设的第一训练数据集后,可以根据每个第一样本图像的尺寸对第一样本图像进行分割,得到第二训练数据集,并将第一训练数据集与经分割处理后的第二训练数据集作为训练样本输入初始识别模型中,通过对该初始识别模型进行迭代训练,得到目标检测模型。采用本发明实施例提供的目标检测模型训练方法,样本图像在经过分割处理后,各个分割图像中目标检测对象的密度,相比于原始样本图像出现了降低;且相比于目标检测对象在原始样本图像画面中的所占比例,经分割处理后,在分割图像中目标检测对象在画面中的所占比例变大,因而在对原始训练样本图像进行分割处理后,相当于将原始训练样本图像中的尺寸小且比较密集的目标物体,转换成了针对分割图像中的正常大小、正常密集度的目标检测物体,在训练过程中,模型针对训练样本中正常识别目标的识别效率与准确度都远高于针对尺寸小且比较密集的目标的训练样本,而在将该原始样本图像和分割图像一同作为训练样本输入该初始识别模型,相当于在一定程度上降低了训练样本集中尺寸小且比较密集的目标训练样本图像的比例,因而通过该训练方法,一方面即提高了目标检测模型的训练效率,另外一方面又提高了模型对尺寸小且比较密集的目标的识别准确率。[0174]此外,与上述图1所示的图像检测方法相对应地,本技术实施例还提供一种图像检测装置。图7是本技术实施例提供的一种图像检测装置的结构示意图,包括:图像获取模块701,图像分割模块702,检测模块703,筛选模块704以及计数模块705。[0175]其中,图像获取模块701,用于获取待检测的第一图像,所述第一图像包括多个目标检测对象;[0176]图像分割模块702,用于根据所述第一图像的尺寸对所述第一图像进行分割,得到待检测的第二图像;[0177]检测模块703,用于将所述第一图像和所述第二图像输入预先训练的目标检测模型对所述多个目标检测对象进行识别,输出包含检测框的第一检测结果以及包含检测框的第二检测结果,其中,所述检测框用于表征所述目标检测对象在所述待检测图像中的位置信息,所述检测框与所述目标检测对象一一对应;[0178]筛选模块704,用于基于预设算法对所述第一检测结果和所述第二检测结果进行筛选,得到目标检测结果;[0179]计数模块705,用于根据所述目标检测结果中检测框的数量,确定所述目标检测对象的数量。[0180]显然,本技术实施例的图像检测装置可以作为上述图1所示的图像检测方法的执行主体,因此能够实现图像检测方法在图1所实现的功能。由于原理相同,在此不再赘述。[0181]采用本技术实施例提供的图像检测装置,在进行图像检测时,在获取到包含了多个目标检测对象的待检测第一图像后,首先可以根据第一图像的尺寸,对第一图像进行分割,得到多个待检测的第二图像;接下来,可以通过将该第一图像和第二图像共同输入预先训练的目标检测模型,对目标检测对象进行识别,得到由该目标检测模型输出的包含检测框的第一检测结果以及包含检测框的第二检测结果;最后,基于预设算法对第一检测结果和第二检测结果进行筛选,得到目标检测结果,并根据目标检测结果中检测框的数量,可以确定目标检测对象的数量。采用本发明实施例所提供的图像检测方法,由于会对待检测原始图像进行分割处理,经过分割处理后得到的各个分割图像中目标检测对象的密度,相比于该原始图像出现了降低;且相比于目标检测对象在原始图像画面中的所占比例,经分割处理后,在分割图像中目标检测对象在画面中的所占比例变大,因此在将该原始图像和分割图像一通输入目标检测模型,相当于在一定程度上降低了输入图像中尺寸小且比较密集的目标图像的比例,进而可以提高目标检测模型对待检测图像中多个目标检测对象的识别效率。同时,由于最终的目标检测结果是基于预设算法对由原始图像以及分割图像对应的检测结果进行筛选得到的,从而可以保证得到的目标检测结果更为准确。[0182]可选地,目标检测模型包括:骨干网络、特征提取网络以及预测输出网络;[0183]所述将所述第一图像和所述第二图像输入预先训练的目标检测模型对所述目标检测对象进行识别,输出包含标记框的第一检测结果以及包含标记框的第二检测结果,包括:[0184]所述骨干网络用于对输入的所述第一图像和所述第二图像进行特征提取,得到所述第一图像和所述第二图像各自对应的特征向量;[0185]所述特征提取网络用于对输入的所述特征向量进行特征融合,得到融合后的特征向量;[0186]所述预测输出网络用于对输入的所述融合后的特征向量进行预测,得到包含标记框的第一检测结果以及包含标记框的第二检测结果。[0187]可选地,筛选模块704,具体用于:根据距离每个检测框中心点的曼哈顿距离小于预设阈值的其他检测框的数量,确定所述检测框的密度;[0188]根据所述检测框的密度,对所述第一检测结果以及所述第二检测结果进行筛选,得到目标检测结果。[0189]可选地,筛选模块704,具体用于:确定所述第一检测结果以及所述第二检测结果中每个目标检测对象对应的检测框集合;根据所述检测框集合中各检测框与所述检测框集合中其他检测框的第一曼哈顿距离,得到所述检测框集合对应的第一曼哈顿距离集合;对所述第一曼哈顿距离集合进行归一化处理,得到所述检测框集合对应的第二曼哈顿距离;根据所述检测框的密度以及所述检测框集合对应的第二曼哈顿距离,对所述第一检测结果以及所述第二检测结果进行筛选,得到目标检测结果。[0190]可选地,筛选模块704,具体用于:若所述检测框的密度大于预设密度阈值,以及所述第二曼哈顿距离小于预设值,则根据所述检测框集合中目标检测框对应的置信度以及所述检测框集合对应的第二曼哈顿距,计算所述目标检测框的第三曼哈顿距离,得到所述检测框集合对应的第三曼哈顿距离集合,其中,所述目标检测框为所述检测框集合中的任一检测框;在所述第三曼哈顿距离集合中筛选出所述第三曼哈顿距离最小的检测框,作为所述检测框集合对应目标检测对象的目标检测结果。[0191]可选地,筛选模块704,具体用于:若所述检测框的密度小于预设密度阈值,则分别计算所述检测框集合中各预测检测框对应的交并集比;将所述交并集比最大的检测框作为所述检测框集合对应目标检测对象的目标检测结果。[0192]此外,与上述图3所示的目标检测模型的训练方法相对应地,本技术实施例还提供一种目标检测模型的训练装置,用于解决采用现有目标检测模型训练方法训练得到的目标检测模型在针对尺寸小且比较密集的目标进行检测时,存在的及识别精度较低且准确率较差的问题。图8是本技术实施例提供的一种目标检测模型的训练装置的结构示意图,包括:训练数据获取模块801,样本图像分割模块802,训练模块803,损失函数构建模块804以及迭代模块805。[0193]其中,训练数据获取模块801,用于获取预设的第一训练数据集,所述第一训练数据集包括多个第一样本图像以及所述第一样本图像中目标检测对象的第一标记框,所述标记框用于表征所述目标检测对象在所述第一样本图像中的位置信息;[0194]样本图像分割模块802,用于根据每个第一样本图像的尺寸对所述第一样本图像进行分割,得到第二训练数据集,所述第二训练数据集包括:多个第二样本图像以及所述第二样本图像中目标检测对象的第二标记框;[0195]训练模块803,用于将所述第一训练数据集以及所述第二训练数据集输入初始识别模型中,输出所述第一样本图像的第一预测标记框和所述第二样本图像的第二预测标记框;[0196]损失函数构建模块804,用于根据所述第一预测标记框、所述第一标记框、所述第二预测标记框、所述第二标记框,构建目标损失函数;[0197]迭代模块805,用于基于所述目标损失函数对所述初始识别模型进行迭代训练,得到所述目标检测模型。[0198]显然,本技术实施例的目标检测模型的训练装置可以作为上述图3所示的目标检测模型的训练方法的执行主体,因此能够实现目标检测模型的训练方法在图3所实现的功能。由于原理相同,在此不再赘述。[0199]采用本技术实施例提供的目标检测模型的训练装置,在进行目标检测模型的训练时,在获取到预设的第一训练数据集后,可以根据每个第一样本图像的尺寸对第一样本图像进行分割,得到第二训练数据集,并将第一训练数据集与经分割处理后的第二训练数据集作为训练样本输入初始识别模型中,通过对该初始识别模型进行迭代训练,得到目标检测模型。采用本发明实施例提供的目标检测模型训练方法,样本图像在经过分割处理后,各个分割图像中目标检测对象的密度,相比于原始样本图像出现了降低;且相比于目标检测对象在原始样本图像画面中的所占比例,经分割处理后,在分割图像中目标检测对象在画面中的所占比例变大,因而在对原始训练样本图像进行分割处理后,相当于将原始训练样本图像中的尺寸小且比较密集的目标物体,转换成了针对分割图像中的正常大小、正常密集度的目标检测物体,在训练过程中,模型针对训练样本中正常识别目标的识别效率与准确度都远高于针对尺寸小且比较密集的目标的训练样本,而在将该原始样本图像和分割图像一同作为训练样本输入该初始识别模型,相当于在一定程度上降低了训练样本集中尺寸小且比较密集的目标训练样本图像的比例,因而通过该训练方法,一方面即提高了目标检测模型的训练效率,另外一方面又提高了模型对尺寸小且比较密集的目标的识别准确率。[0200]图9是本说明书的一个实施例电子设备的结构示意图。请参考图9,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(random-accessmemory,ram),也可能还包括非易失性存储器(non-volatilememory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。[0201]处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是isa(industrystandardarchitecture,工业标准体系结构)总线、pci(peripheralcomponentinterconnect,外设部件互连标准)总线或eisa(extendedindustrystandardarchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图9中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。[0202]存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。[0203]处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成图像检测装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:[0204]获取待检测的第一图像,所述第一图像包括多个目标检测对象;[0205]根据所述第一图像的尺寸对所述第一图像进行分割,得到多个待检测的第二图像;[0206]将所述第一图像和所述第二图像输入预先训练的目标检测模型对所述多个目标检测对象进行识别,输出包含检测框的第一检测结果以及包含检测框的第二检测结果,其中,所述检测框用于表征所述目标检测对象在所述待检测图像中的位置信息,所述检测框与所述目标检测对象一一对应;[0207]基于预设算法对所述第一检测结果和所述第二检测结果进行筛选,得到目标检测结果;[0208]根据所述目标检测结果中检测框的数量,确定所述目标检测对象的数量。[0209]或者,处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成目标检测模型的训练装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:[0210]获取预设的第一训练数据集,所述第一训练数据集包括多个第一样本图像以及所述第一样本图像中目标检测对象的第一检测框,所述检测框用于表征所述目标检测对象在所述第一样本图像中的位置信息;[0211]根据每个第一样本图像的尺寸对所述第一样本图像进行分割,得到第二训练数据集,所述第二训练数据集包括:多个第二样本图像以及所述第二样本图像中目标检测对象的第二检测框;[0212]将所述第一训练数据集以及所述第二训练数据集输入初始识别模型中,输出所述第一样本图像的第一预测标记框和所述第二样本图像的第二预测检测框;[0213]根据所述第一预测检测框、所述第一检测框、所述第二预测检测框、所述第二检测框,构建目标损失函数;[0214]基于所述目标损失函数对所述初始识别模型进行迭代训练,得到所述目标检测模型。[0215]上述如本说明书图1所示实施例揭示的图像检测装置执行的方法或者如说明书图3所示实施例揭示的目标检测模型训练装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(centralprocessingunit,cpu)、网络处理器(networkprocessor,np)等;还可以是数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。[0216]应理解,本说明书实施例的电子设备可以实现图像检测装置在图1所示实施例的功能或者实现目标检测模型的训练装置在图3所示实施例的功能。由于原理相同,本说明书实施例在此不再赘述。[0217]当然,除了软件实现方式之外,本说明书的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。[0218]本说明书实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图1所示实施例的方法,并具体用于执行以下操作:[0219]获取待检测的第一图像,所述第一图像包括多个目标检测对象;[0220]根据所述第一图像的尺寸对所述第一图像进行分割,得到多个待检测的第二图像;[0221]将所述第一图像和所述第二图像输入预先训练的目标检测模型对所述多个目标检测对象进行识别,输出包含检测框的第一检测结果以及包含检测框的第二检测结果,其中,所述检测框用于表征所述目标检测对象在所述待检测图像中的位置信息,所述检测框与所述目标检测对象一一对应;[0222]基于预设算法对所述第一检测结果和所述第二检测结果进行筛选,得到目标检测结果;[0223]根据所述目标检测结果中检测框的数量,确定所述目标检测对象的数量。[0224]本说明书实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图3所示实施例的方法,并具体用于执行以下操作:[0225]获取预设的第一训练数据集,所述第一训练数据集包括多个第一样本图像以及所述第一样本图像中目标检测对象的第一检测框,所述检测框用于表征所述目标检测对象在所述第一样本图像中的位置信息;[0226]根据每个第一样本图像的尺寸对所述第一样本图像进行分割,得到第二训练数据集,所述第二训练数据集包括:多个第二样本图像以及所述第二样本图像中目标检测对象的第二检测框;[0227]将所述第一训练数据集以及所述第二训练数据集输入初始识别模型中,输出所述第一样本图像的第一预测标记框和所述第二样本图像的第二预测检测框;[0228]根据所述第一预测检测框、所述第一检测框、所述第二预测检测框、所述第二检测框,构建目标损失函数;[0229]基于所述目标损失函数对所述初始识别模型进行迭代训练,得到所述目标检测模型。[0230]上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。[0231]总之,以上所述仅为本说明书的较佳实施例而已,并非用于限定本说明书的保护范围。凡在本说明书的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本说明书的保护范围之内。[0232]上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。[0233]计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。[0234]还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。[0235]本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。当前第1页12当前第1页12
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献