基于人工智能的目标检测样本优化方法及相关设备与流程

2022-08-27 23:52:05 来源：中国专利 TAG：

1.本技术涉及人工智能技术领域，尤其涉及一种基于人工智能的目标检测样本优化方法、装置、电子设备及存储介质。

背景技术：

2.目标检测任务一直是计算机视觉领域的前沿研究热点，同时也是众多顶层视觉任务的基础。其主要目的是识别并用方框标注图像或视频内容中的目标物体。近年来，基于深度学习技术的目标检测方法发展迅速，在自动驾驶、安防、监控等领域有着广泛应用。目前基于深度学习的目标检测方法一般需要大量人工标注的数据进行训练，模型训练完成后会被部署于实际的检测应用中。
3.然而，人工标注数据的方式具有一定的主观性，标注过程中往往会出现多种形式的标注错误，这些错误的标注数据会直接影响目标检测的训练效果，从而降低目标检测结果的准确性。

技术实现要素：

4.鉴于以上内容，有必要提出一种基于人工智能的目标检测样本优化方法、装置、电子设备及存储介质，以解决如何提高目标检测结果的准确性这一技术问题。其中，相关设备包括基于人工智能的目标检测样本优化装置、电子设备及存储介质。
5.本技术提供一种基于人工智能的目标检测样本优化方法，所述方法包括：
6.采集原始样本图像以构建原始样本图像集，并对所述原始样本图像集中的所有原始样本图像进行标注获得原始样本训练集；
7.基于所述原始样本训练集对所述原始样本图像集进行分类获得多种类别的样本分类图像集，并基于所述样本分类图像集构建像素点数据集；
8.计算所述像素点数据集中每一个像素点的局部近邻密度，所述局部近邻密度用以表征像素点在局部范围内与其他所有像素点之间的距离关系；
9.基于所述局部近邻密度计算每一个像素点的局部离群系数，并基于所述局部离群系数筛选所述像素点数据集获得有效样本训练集；
10.基于所述有效样本训练集训练预设的目标检测模型，并使用训练好的目标检测模型对实时获取的原始样本图像进行目标检测。
11.在一些实施例中，所述采集原始样本图像以构建原始样本图像集，并对所述原始样本图像集中的所有原始样本图像进行标注获得原始样本训练集，包括：
12.采集原始样本图像，并对所有的原始样本图像进行预处理后获得原始样本图像集；
13.依据预设方式对所述原始样本图像集中的原始样本图像出现的不同特征图像进行框选获得目标框；
14.对不同类别的目标框标注不同的标签值，将所有具有标签值的目标框作为原始样
本训练集。
15.在一些实施例中，所述基于所述原始样本训练集对所述原始样本图像集进行分类获得多种类别的样本分类图像集，并基于所述样本分类图像集构建像素点数据集，包括：
16.基于所述原始样本训练集中各目标框的标签值类别对所述原始样本图像集进行分类获得多种类别的样本分类图像集；
17.对所述样本分类图像集中所包括的特征图像进行相似变换；
18.获取相似变换后的每一种类别的样本分类图像集中所包括的特征图像的像素点的坐标，将所有具有相同坐标位置的像素点作为同一像素点，统计所有不存在重复的像素点的坐标以作为像素点数据集。
19.在一些实施例中，所述计算所述像素点数据集中每一个像素点的局部近邻密度，所述局部近邻密度用以表征像素点在局部范围内与其他所有像素点之间的距离关系，包括：
20.依据预设的近邻阈值划定目标像素点的局部范围，所述目标像素点为所述像素点数据集中的任意一个像素点；
21.在所述目标像素点的局部范围内分别计算所述目标像素点与其他各像素点的欧氏距离以获取所述目标像素点的局部近邻密度；
22.遍历所述像素点数据集中的所有像素点获得所述像素点数据集中每一个像素点的局部近邻密度。
23.在一些实施例中，所述局部近邻密度满足关系式：
[0024][0025]
其中，d
p
表示目标像素点p的局部近邻密度，n
p
为目标像素点p的局部范围内除p像素点以外的所有像素点的总数量，dis(p,o)表示目标像素点p的局部范围内的像素点o与目标像素点p之间的欧氏距离。
[0026]
在一些实施例中，所述基于所述局部近邻密度计算每一个像素点的局部离群系数，并基于所述局部离群系数筛选所述像素点数据集获得有效样本训练集，包括：
[0027]
基于所述目标像素点的局部范围内所有像素点的局部近邻密度计算所述目标像素点的局部离群系数，所述局部离群系数满足关系式：
[0028][0029]
其中，c
p
表示目标像素点p的局部离群系数，do表示目标像素点p的局部范围内的像素点o的局部近邻密度，d
p
表示目标像素点p的局部近邻密度，n
p
为目标像素点p的局部范围内除p像素点以外的所有像素点的总数量；
[0030]
遍历所述像素点数据集中的所有像素点获得所述像素点数据集中每一个像素点的局部离群系数；
[0031]
基于所述局部离群系数筛选所述像素点数据集获得有效样本训练集。
[0032]
在一些实施例中，所述基于所述局部离群系数筛选所述像素点数据集获得有效样本训练集包括：
[0033]
所有不大于1的局部离群系数不作任何处理，选取所有大于1的局部离群系数作为显著离群系数，并依据计算所有的显著离群系数的离群系数阈值；
[0034]
将所述样本分类图像集中所有小于所述离群系数阈值的显著离群系数对应的像素点进行舍弃；
[0035]
将经过像素点筛选后的所有样本分类图像集作为有效样本训练集。
[0036]
本技术实施例还提供一种基于人工智能的目标检测样本优化装置，所述装置包括：
[0037]
采集单元，用于采集原始样本图像以构建原始样本图像集，并对所述原始样本图像集中的所有原始样本图像进行标注获得原始样本训练集；
[0038]
构建单元，用于基于所述原始样本训练集对所述原始样本图像集进行分类获得多种类别的样本分类图像集，并基于所述样本分类图像集构建像素点数据集；
[0039]
计算单元，用于计算所述像素点数据集中每一个像素点的局部近邻密度，所述局部近邻密度用以表征像素点在局部范围内与其他所有像素点之间的距离关系；
[0040]
筛选单元，用于基于所述局部近邻密度计算每一个像素点的局部离群系数，并基于所述局部离群系数筛选所述像素点数据集获得有效样本训练集；
[0041]
检测单元，用于基于所述有效样本训练集训练预设的目标检测模型，并使用训练好的目标检测模型对实时获取的原始样本图像进行目标检测。
[0042]
本技术实施例还提供一种电子设备，所述电子设备包括：
[0043]
存储器，存储至少一个指令；
[0044]
处理器，执行所述存储器中存储的指令以实现所述的基于人工智能的目标检测样本优化方法。
[0045]
本技术实施例还提供一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一个指令，所述至少一个指令被电子设备中的处理器执行以实现所述的基于人工智能的目标检测样本优化方法。
[0046]
本技术通过构建像素点数据集来计算所述像素点数据集中每一个像素点的局部近邻密度，并基于所述局部近邻密度计算每一个像素点的局部离群系数对异常的像素点进行筛选以获得更为准确的训练数据，从而提高目标检测过程的准确性。
附图说明
[0047]
图1是本技术所涉及的基于人工智能的目标检测样本优化方法的较佳实施例的流程图。
[0048]
图2是本技术所涉及的基于人工智能的目标检测样本优化装置的较佳实施例的功能模块图。
[0049]
图3是本技术所涉及的基于人工智能的目标检测样本优化方法的较佳实施例的电子设备的结构示意图。
具体实施方式
[0050]
为了能够更清楚地理解本技术的目的、特征和优点，下面结合附图和具体实施例对本技术进行详细描述。需要说明的是，在不冲突的情况下，本技术的实施例及实施例中的
特征可以相互结合。在下面的描述中阐述了很多具体细节以便于充分理解本技术，所述描述的实施例仅是本技术一部分实施例，而不是全部的实施例。
[0051]
此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本技术的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。
[0052]
除非另有定义，本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同。本文中在本技术的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本技术。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
[0053]
本技术实施例提供一种基于人工智能的目标检测样本优化方法，可应用于一个或者多个电子设备中，电子设备是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(application specific integrated circuit，asic)、可编程门阵列(field－programmable gate array，fpga)、数字处理器(digital signal processor，dsp)、嵌入式设备等。
[0054]
电子设备可以是任何一种可与客户进行人机交互的电子产品，例如，个人计算机、平板电脑、智能手机、个人数字助理(personal digital assistant，pda)、游戏机、交互式网络电视(internet protocol television，iptv)、智能式穿戴式设备等。
[0055]
电子设备还可以包括网络设备和/或客户设备。其中，所述网络设备包括，但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(cloud computing)的由大量主机或网络服务器构成的云。
[0056]
电子设备所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络(virtual private network，vpn)等。
[0057]
如图1所示，是本技术基于人工智能的目标检测样本优化方法的较佳实施例的流程图。根据不同的需求，该流程图中步骤的顺序可以改变，某些步骤可以省略。
[0058]
s10，采集原始样本图像以构建原始样本图像集，并对所述原始样本图像集中的所有原始样本图像进行标注获得原始样本训练集。
[0059]
在一个可选的实施例中，所述采集原始样本图像以构建原始样本图像集，并对所述原始样本图像集中的所有原始样本图像进行标注获得原始样本训练集，包括：
[0060]
s101，采集原始样本图像，并对所有的原始样本图像进行预处理后获得原始样本图像集；
[0061]
s102，依据预设方式对所述原始样本图像集中的原始样本图像出现的不同特征图像进行框选获得目标框；
[0062]
s103，对不同类别的目标框标注不同的标签值，将所有具有标签值的目标框作为原始样本训练集。
[0063]
该可选的实施例中，可依据rgb相机采集大量的原始样本图像，并对所有的原始样本图像进行预处理，所述预处理包括对图像的大小进行拉伸操作，使预处理后的所有原始样本图像具有统一的图片尺寸。示例性的，可将所有的原始样本图像的高度先拉伸成32个像素，宽度按照高宽比进行拉伸，处理后所有原始样本图像的大小为32*100，高宽比例与原
图保持一致，不足的部分使用黑边进行填充，以使得原始样本图像上的形状信息得到完整保留。
[0064]
该可选的实施例中，可预先通过人为标注的方式对所述原始样本图像集中的原始样本图像中出现的不同特征图像进行框选和标注来获得目标框，比如，原始样本图像中出现了人、猫、狗等三个不同类别的特征图像，则对该三个不同的特征图像进行框选。其中，对不同的原始样本图像中出现的不同类别的特征图像可以按照自然数由小到大的顺序依次标注为不同的标签值，每种特征图像对应一种标签值。如原始样本图像集中共有人、猫、狗三类特征图像，分别对应标签值1、2、3，则对人、猫、狗三类特征图像分别进行框选得到目标框，且各目标框内像素对应的标签值可分别设置为1、2、3。其中，每张原始样本图像中只包括一种类别的特征图像，即每张原始样本图像中仅包括一种类别的目标框。
[0065]
该可选的实施例中，将所有具有目标框和标签值的原始样本图像作为原始样本训练集。
[0066]
如此，可以保证原始样本图像集中的图像具有相同尺寸，同时获取各特征图像的目标框和标签值，可以为后续检测过程提供准确的数据支撑。
[0067]
s11，基于所述原始样本训练集对所述原始样本图像集进行分类获得多种类别的样本分类图像集，并基于所述样本分类图像集构建像素点数据集。
[0068]
在一个可选的实施例中，所述基于所述原始样本训练集对所述原始样本图像集进行分类获得多种类别的样本分类图像集，并基于所述样本分类图像集构建像素点数据集，包括：
[0069]
s111，基于所述原始样本训练集中各目标框的标签值类别对所述原始样本图像集进行分类获得多种类别的样本分类图像集；
[0070]
s112，对所述样本分类图像集中所包括的特征图像进行相似变换；
[0071]
s113，获取相似变换后的每一种类别的样本分类图像集中所包括的特征图像的像素点的坐标，将所有具有相同坐标位置的像素点作为同一像素点，统计所有不存在重复的像素点的坐标以作为像素点数据集。
[0072]
该可选的实施例中，将所有目标框的标注类别按照标签值的类别进行划分，从而将所述原始样本图像集中的图像划分为多种类别的样本分类图像集，即每一类的样本分类图像集中只包括同一种标签类别的原始样本图像。
[0073]
该可选的实施例中，对于任意一种类别的样本分类图像集，由于每张原始样本图像不仅包括该类别的特征图像的像素点，还包括一些不含特征图像的像素点，因此需要仅针对各原始样本图像中所包括的特征图像的像素点进行统计。
[0074]
该可选的实施例中，在对各原始样本图像中所包括的特征图像的像素点进行统计之前，需要先对各原始样本图像中所包括的特征图像进行相似变换，从而使各原始样本图像中所包括的特征图像尽量相似。其中，图形的相似变换是指由一个图形到另一个图形，在改变的过程中保持形状不变、大小方向和位置可变的图形。
[0075]
该可选的实施例中，由于相同样本分类图像集中的各原始样本图像具有同一类别的特征图像，因此各原始样本图像中所包括的特征图像的像素点会存在大量重复，本方案中将所有具有相同坐标位置的像素点作为同一像素点，即最终统计获得的所有像素点的坐标各不相同，并将最终统计得到的所有不存在重复的像素点的坐标作为像素点数据集。
[0076]
示例性的，现有a、b、c共3张包括特征图像为人的原始样本图像，每张原始样本图像共有100个像素点，其中a图像中属于人的特征图像的像素点数量为50，b图像中属于人的特征图像的像素点数量为55，c图像中属于人的特征图像的像素点数量为60，因此需要仅针对各原始样本图像中所包括的特征图像的像素点进行统计，获得50、55、60。而a、b、c三张原始样本图像中所包括的特征图像有30个像素点具有相同的坐标，因此针对这30个具有相同坐标的像素点仅需要统计一次，即只作为一个像素点坐标，最终将a、b、c三张原始样本图像中所包括的特征图像的所有各不相同的坐标作为像素点数据集。
[0077]
如此，可以获取每一种类别的样本分类图像集中包括的所有特征图像所涵盖的全部像素坐标，为后续过程对像素点数据进行进一步筛选提供数据支撑。
[0078]
s12，计算所述像素点数据集中每一个像素点的局部近邻密度，所述局部近邻密度用以表征像素点在局部范围内与其他所有像素点之间的距离关系。
[0079]
在一个可选的实施例中，所述计算所述像素点数据集中每一个像素点的局部近邻密度，所述局部近邻密度用以表征像素点在局部范围内与其他所有像素点之间的距离关系，包括：
[0080]
s121，依据预设的近邻阈值划定目标像素点的局部范围，所述目标像素点为所述像素点数据集中的任意一个像素点；
[0081]
s122，在所述目标像素点的局部范围内分别计算所述目标像素点与其他各像素点的欧氏距离以获取所述目标像素点的局部近邻密度；
[0082]
s123，遍历所述像素点数据集中的所有像素点获得所述像素点数据集中每一个像素点的局部近邻密度。
[0083]
该可选的实施例中，可通过预设的近邻阈值划定目标像素点的局部范围，所述目标像素点为所述像素点数据集中的任意一个像素点，其中，预设的近邻阈值可以为5。示例性的，以像素点g为目标像素点，则可以以像素点g为圆心画圆，使画圆范围内正好包括除像素点g之外的5个像素点，并将该画圆范围作为目标像素点g的局部范围。
[0084]
该可选的实施例中，在所述目标像素点的局部范围内分别计算所述目标像素点与其他各像素点的欧氏距离以获取所述目标像素点的局部近邻密度，所述局部近邻密度满足关系式：
[0085][0086]
其中，d
p
表示目标像素点p的局部近邻密度，n
p
为目标像素点p的局部范围内除p像素点以外的所有像素点的总数量，dis(p,o)表示目标像素点p的局部范围内的像素点o与目标像素点p之间的欧氏距离。
[0087]
示例性的，目标像素点p的局部范围内共有除p像素点以外的5个像素点，其中每个像素点与目标像素点p之间的欧氏距离可以通过像素点之间的坐标运算得到，设分别为2、6、4、5、8，则即目标像素点p的局部近邻密度为0.2。
[0088]
该可选的实施例中，像素点p的局部近邻密度表征了像素点p的密度情况，像素点p与周围像素点的密集度越高，则局部近邻密度的值越大；像素点p与周围像素点的密集度越低，则局部近邻密度的值越小。
[0089]
该可选的实施例中，可根据所述局部近邻密度满足的关系式计算得到所述像素点数据集中每一个像素点的局部近邻密度。
[0090]
如此，通过计算所述像素点数据集中每一个像素点的局部近邻密度可以对所述像素点数据集中每一个像素点与其他像素点之间的局部聚集程度进行评估，便于后续过程据此确定哪些像素点存在异常，从而对像素点进行筛选。
[0091]
s13，基于所述局部近邻密度计算每一个像素点的局部离群系数，并基于所述局部离群系数筛选所述像素点数据集获得有效样本训练集。
[0092]
在一个可选的实施例中，所述基于所述局部近邻密度计算每一个像素点的局部离群系数，并基于所述局部离群系数筛选所述像素点数据集获得有效样本训练集，包括：
[0093]
s131，基于所述目标像素点的局部范围内所有像素点的局部近邻密度计算所述目标像素点的局部离群系数，所述局部离群系数满足关系式：
[0094][0095]
其中，c
p
表示目标像素点p的局部离群系数，do表示目标像素点p的局部范围内的像素点o的局部近邻密度，d
p
表示目标像素点p的局部近邻密度，n
p
为目标像素点p的局部范围内除p像素点以外的所有像素点的总数量；
[0096]
s132，遍历所述像素点数据集中的所有像素点获得所述像素点数据集中每一个像素点的局部离群系数；
[0097]
s133，基于所述局部离群系数筛选所述像素点数据集获得有效样本训练集。
[0098]
该可选的实施例中，可根据计算得到的所述目标像素点的局部范围内所有像素点的局部近邻密度来计算所述目标像素点的局部离群系数，所述局部离群系数满足关系式：
[0099][0100]
其中，c
p
表示目标像素点p的局部离群系数，do表示目标像素点p的局部范围内的像素点o的局部近邻密度。
[0101]
示例性的，设目标像素点p的局部范围内共有除p像素点以外的5个像素点，其中目标像素点p的局部近邻密度为0.2，目标像素点p的局部范围内每个像素点所对应的局部近邻密度为0.2、0.6、0.4、0.3、0.5，则
[0102]
该可选的实施例中，通过所述局部离群系数满足的关系式可以将目标像素点p的局部范围内所有像素点的平均局部近邻密度与目标像素点p的局部近邻密度进行比较从而得到目标像素点p的局部离群系数。其中，局部离群系数越大于1，表明目标像素点p的局部近邻密度越小于周围像素点的密度，目标像素点p越可能是远离其他特征图像的像素点的异常像素点；局部离群系数越小于1，则表明目标像素点p的局部近邻密度越大于周围像素点的密度，目标像素点p越可能是与特征图像的其他像素点相近的正常像素点。
[0103]
该可选的实施例中，所有不大于1的局部离群系数不作任何处理，选取所有大于1的局部离群系数作为显著离群系数，并依据最大类间方差法计算所有的显著离群系数的离群系数阈值。其中，最大类间方差法是一种自适应的确定二值化分割阈值的算法，可以通过
遍历的方式将所有的显著离群系数划分为两类，并计算划分的两个类别的显著离群系数之间的类间方差，并在类间方差最大时选取所对应的两个类别，并将能够将所有的显著离群系数划分为这两个类别的数值作为所述离群系数阈值。
[0104]
该可选的实施例中，将所述样本分类图像集中所有小于所述离群系数阈值的显著离群系数对应的像素点进行舍弃，并将经过像素点筛选后的所有样本分类图像集作为有效样本训练集。
[0105]
如此，可以将原始样本图像集中所包括的异常的像素点进行过滤，从而保证获得的有效样本训练集中各图像的像素点是正常的，防止异常像素点在目标检测过程中所造成的误差，从而提高目标检测结果的准确性。
[0106]
s14，基于所述有效样本训练集训练预设的目标检测模型，并使用训练好的目标检测模型对实时获取的原始样本图像进行目标检测。
[0107]
该可选的实施例中，所述预设的目标检测模型可以为r-cnn模型，全称region cnn，即区域卷积神经网络。其进行目标检测的主要思想就是生成可能存在目标的候选区域region proposal，然后通过cnn、分类器等手段判断候选区域中是否存在检测目标，并进行分类。r-cnn进行目标识别主要分为四个步骤：在有效样本训练集的每张图像中生成大约1000～2000个候选区域以进行识别；然后使用卷积神经网络提取每个候选区域的特征向量，再根据特征向量对各候选区域进行分类，最终使用边框回归bounding box regression对需要检测的目标框进行调整输出各特征图像的目标框，从而完成目标检测。
[0108]
该可选的实施例中，可按照标签类别依次将所述有效样本训练集中的图像输入预设的目标检测模型中进行训练，并将通过均方差损失函数计算的每一次目标检测模型输出的目标框和对应的标签值之间的均方差作为每一次训练过程中的总损失，通过在每次训练过程中使总损失持续减小来对目标检测的训练过程进行优化，直到最终总损失为0时说明训练结束，可使用训练好的目标检测模型对实时获取的原始样本图像进行目标检测。
[0109]
如此，可以使用滤除掉异常像素点的有效样本训练集中的图像来对依据神经网络构建的目标检测模型进行自适应训练，从而使训练好的目标检测模型更加准确可靠。
[0110]
请参见图2，图2是本技术基于人工智能的目标检测样本优化装置的较佳实施例的功能模块图。基于人工智能的目标检测样本优化装置11包括采集单元110、构建单元111、计算单元112、筛选单元113、检测单元114。本技术所称的模块/单元是指一种能够被处理器13所执行，并且能够完成固定功能的一系列计算机可读指令段，其存储在存储器12中。在本实施例中，关于各模块/单元的功能将在后续的实施例中详述。
[0111]
在一个可选的实施例中，采集单元110用于采集原始样本图像以构建原始样本图像集，并对所述原始样本图像集中的所有原始样本图像进行标注获得原始样本训练集。
[0112]
在一个可选的实施例中，所述采集原始样本图像以构建原始样本图像集，并对所述原始样本图像集中的所有原始样本图像进行标注获得原始样本训练集，包括：
[0113]
采集原始样本图像，并对所有的原始样本图像进行预处理后获得原始样本图像集；
[0114]
依据预设方式对所述原始样本图像集中的原始样本图像出现的不同特征图像进行框选获得目标框；
[0115]
对不同类别的目标框标注不同的标签值，将所有具有标签值的目标框作为原始样
本训练集。
[0116]
该可选的实施例中，可依据rgb相机采集大量的原始样本图像，并对所有的原始样本图像进行预处理，所述预处理包括对图像的大小进行拉伸操作，使预处理后的所有原始样本图像具有统一的图片尺寸。示例性的，可将所有的原始样本图像的高度先拉伸成32个像素，宽度按照高宽比进行拉伸，处理后所有原始样本图像的大小为32*100，高宽比例与原图保持一致，不足的部分使用黑边进行填充，以使得原始样本图像上的形状信息得到完整保留。
[0117]
该可选的实施例中，可预先通过人为标注的方式对所述原始样本图像集中的原始样本图像中出现的不同特征图像进行框选和标注来获得目标框，比如，原始样本图像中出现了人、猫、狗等三个不同类别的特征图像，则对该三个不同的特征图像进行框选。其中，对不同的原始样本图像中出现的不同类别的特征图像可以按照自然数由小到大的顺序依次标注为不同的标签值，每种特征图像对应一种标签值。如原始样本图像集中共有人、猫、狗三类特征图像，分别对应标签值1、2、3，则对人、猫、狗三类特征图像分别进行框选得到目标框，且各目标框内像素对应的标签值可分别设置为1、2、3。其中，每张原始样本图像中只包括一种类别的特征图像，即每张原始样本图像中仅包括一种类别的目标框。
[0118]
该可选的实施例中，将所有具有目标框和标签值的原始样本图像作为原始样本训练集。
[0119]
在一个可选的实施例中，构建单元111用于基于所述原始样本训练集对所述原始样本图像集进行分类获得多种类别的样本分类图像集，并基于所述样本分类图像集构建像素点数据集。
[0120]
在一个可选的实施例中，所述基于所述原始样本训练集对所述原始样本图像集进行分类获得多种类别的样本分类图像集，并基于所述样本分类图像集构建像素点数据集，包括：
[0121]
基于所述原始样本训练集中各目标框的标签值类别对所述原始样本图像集进行分类获得多种类别的样本分类图像集；
[0122]
对所述样本分类图像集中所包括的特征图像进行相似变换；
[0123]
获取相似变换后的每一种类别的样本分类图像集中所包括的特征图像的像素点的坐标，将所有具有相同坐标位置的像素点作为同一像素点，统计所有不存在重复的像素点的坐标以作为像素点数据集。
[0124]
该可选的实施例中，对于任意一种类别的样本分类图像集，由于每张原始样本图像不仅包括该类别的特征图像的像素点，还包括一些不含特征图像的像素点，因此需要仅针对各原始样本图像中所包括的特征图像的像素点进行统计。
[0125]
该可选的实施例中，在对各原始样本图像中所包括的特征图像的像素点进行统计之前，需要先对各原始样本图像中所包括的特征图像进行相似变换，从而使各原始样本图像中所包括的特征图像尽量相似。其中，图形的相似变换是指由一个图形到另一个图形，在改变的过程中保持形状不变、大小方向和位置可变的图形。
[0126]
该可选的实施例中，由于相同样本分类图像集中的各原始样本图像具有同一类别的特征图像，因此各原始样本图像中所包括的特征图像的像素点会存在大量重复，本方案中将所有具有相同坐标位置的像素点作为同一像素点，即最终统计获得的所有像素点的坐
标各不相同，并将最终统计得到的所有不存在重复的像素点的坐标作为像素点数据集。
[0127]
示例性的，现有a、b、c共3张包括特征图像为人的原始样本图像，每张原始样本图像共有100个像素点，其中a图像中属于人的特征图像的像素点数量为50，b图像中属于人的特征图像的像素点数量为55，c图像中属于人的特征图像的像素点数量为60，因此需要仅针对各原始样本图像中所包括的特征图像的像素点进行统计，获得50、55、60。而a、b、c三张原始样本图像中所包括的特征图像有30个像素点具有相同的坐标，因此针对这30个具有相同坐标的像素点仅需要统计一次，即只作为一个像素点坐标，最终将a、b、c三张原始样本图像中所包括的特征图像的所有各不相同的坐标作为像素点数据集。
[0128]
在一个可选的实施例中，计算单元112用于计算所述像素点数据集中每一个像素点的局部近邻密度，所述局部近邻密度用以表征像素点在局部范围内与其他所有像素点之间的距离关系。
[0129]
在一个可选的实施例中，所述计算所述像素点数据集中每一个像素点的局部近邻密度，所述局部近邻密度用以表征像素点在局部范围内与其他所有像素点之间的距离关系，包括：
[0130]
依据预设的近邻阈值划定目标像素点的局部范围，所述目标像素点为所述像素点数据集中的任意一个像素点；
[0131]
在所述目标像素点的局部范围内分别计算所述目标像素点与其他各像素点的欧氏距离以获取所述目标像素点的局部近邻密度；
[0132]
遍历所述像素点数据集中的所有像素点获得所述像素点数据集中每一个像素点的局部近邻密度。
[0133]
该可选的实施例中，可通过预设的近邻阈值划定目标像素点的局部范围，所述目标像素点为所述像素点数据集中的任意一个像素点，其中，预设的近邻阈值可以为5。示例性的，以像素点g为目标像素点，则可以以像素点g为圆心画圆，使画圆范围内正好包括除像素点g之外的5个像素点，并将该画圆范围作为目标像素点g的局部范围。
[0134]
该可选的实施例中，在所述目标像素点的局部范围内分别计算所述目标像素点与其他各像素点的欧氏距离以获取所述目标像素点的局部近邻密度，所述局部近邻密度满足关系式：
[0135][0136]
其中，d
p
表示目标像素点p的局部近邻密度，n
p
为目标像素点p的局部范围内除p像素点以外的所有像素点的总数量，dis(p,o)表示目标像素点p的局部范围内的像素点o与目标像素点p之间的欧氏距离。
[0137]
示例性的，目标像素点p的局部范围内共有除p像素点以外的5个像素点，其中每个像素点与目标像素点p之间的欧氏距离可以通过像素点之间的坐标运算得到，设分别为2、6、4、5、8，则即目标像素点p的局部近邻密度为0.2。
[0138]
该可选的实施例中，像素点p的局部近邻密度表征了像素点p的密度情况，像素点p与周围像素点的密集度越高，则局部近邻密度的值越大；像素点p与周围像素点的密集度越低，则局部近邻密度的值越小。
[0139]
该可选的实施例中，可根据所述局部近邻密度满足的关系式计算得到所述像素点数据集中每一个像素点的局部近邻密度。
[0140]
在一个可选的实施例中，筛选单元113用于基于所述局部近邻密度计算每一个像素点的局部离群系数，并基于所述局部离群系数筛选所述像素点数据集获得有效样本训练集。
[0141]
在一个可选的实施例中，所述基于所述局部近邻密度计算每一个像素点的局部离群系数，并基于所述局部离群系数筛选所述像素点数据集获得有效样本训练集，包括：
[0142]
基于所述目标像素点的局部范围内所有像素点的局部近邻密度计算所述目标像素点的局部离群系数，所述局部离群系数满足关系式：
[0143][0144]
其中，c
p
表示目标像素点p的局部离群系数，do表示目标像素点p的局部范围内的像素点o的局部近邻密度，d
p
表示目标像素点p的局部近邻密度，n
p
为目标像素点p的局部范围内除p像素点以外的所有像素点的总数量；
[0145]
遍历所述像素点数据集中的所有像素点获得所述像素点数据集中每一个像素点的局部离群系数；
[0146]
基于所述局部离群系数筛选所述像素点数据集获得有效样本训练集。
[0147]
该可选的实施例中，可根据计算得到的所述目标像素点的局部范围内所有像素点的局部近邻密度来计算所述目标像素点的局部离群系数，所述局部离群系数满足关系式：
[0148][0149]
其中，c
p
表示目标像素点p的局部离群系数，do表示目标像素点p的局部范围内的像素点o的局部近邻密度。
[0150]
示例性的，设目标像素点p的局部范围内共有除p像素点以外的5个像素点，其中目标像素点p的局部近邻密度为0.2，目标像素点p的局部范围内每个像素点所对应的局部近邻密度为0.2、0.6、0.4、0.3、0.5，则
[0151]
该可选的实施例中，通过所述局部离群系数满足的关系式可以将目标像素点p的局部范围内所有像素点的平均局部近邻密度与目标像素点p的局部近邻密度进行比较从而得到目标像素点p的局部离群系数。其中，局部离群系数越大于1，表明目标像素点p的局部近邻密度越小于周围像素点的密度，目标像素点p越可能是远离其他特征图像的像素点的异常像素点；局部离群系数越小于1，则表明目标像素点p的局部近邻密度越大于周围像素点的密度，目标像素点p越可能是与特征图像的其他像素点相近的正常像素点。
[0152]
该可选的实施例中，所有不大于1的局部离群系数不作任何处理，选取所有大于1的局部离群系数作为显著离群系数，并依据最大类间方差法计算所有的显著离群系数的离群系数阈值。其中，最大类间方差法是一种自适应的确定二值化分割阈值的算法，可以通过遍历的方式将所有的显著离群系数划分为两类，并计算划分的两个类别的显著离群系数之间的类间方差，并在类间方差最大时选取所对应的两个类别，并将能够将所有的显著离群
系数划分为这两个类别的数值作为所述离群系数阈值。
[0153]
该可选的实施例中，将所述样本分类图像集中所有小于所述离群系数阈值的显著离群系数对应的像素点进行舍弃，并将经过像素点筛选后的所有样本分类图像集作为有效样本训练集。
[0154]
在一个可选的实施例中，检测单元114用于基于所述有效样本训练集训练预设的目标检测模型，并使用训练好的目标检测模型对实时获取的原始样本图像进行目标检测。
[0155]
该可选的实施例中，所述预设的目标检测模型可以为r-cnn模型，全称region cnn，即区域卷积神经网络。其进行目标检测的主要思想就是生成可能存在目标的候选区域region proposal，然后通过cnn、分类器等手段判断候选区域中是否存在检测目标，并进行分类。r-cnn进行目标识别主要分为四个步骤：在有效样本训练集的每张图像中生成大约1000～2000个候选区域以进行识别；然后使用卷积神经网络提取每个候选区域的特征向量，再根据特征向量对各候选区域进行分类，最终使用边框回归bounding box regression对需要检测的目标框进行调整输出各特征图像的目标框，从而完成目标检测。
[0156]
该可选的实施例中，可按照标签类别依次将所述有效样本训练集中的图像输入预设的目标检测模型中进行训练，并将通过均方差损失函数计算的每一次目标检测模型输出的目标框和对应的标签值之间的均方差作为每一次训练过程中的总损失，通过在每次训练过程中使总损失持续减小来对目标检测的训练过程进行优化，直到最终总损失为0时说明训练结束，可使用训练好的目标检测模型对实时获取的原始样本图像进行目标检测。
[0157]
由以上技术方案可以看出，本技术能够通过构建像素点数据集来计算所述像素点数据集中每一个像素点的局部近邻密度，并基于所述局部近邻密度计算每一个像素点的局部离群系数对异常的像素点进行筛选以获得更为准确的训练数据，从而提高目标检测过程的准确性。
[0158]
请参见图3，是本技术实施例提供的一种电子设备的结构示意图。电子设备1包括存储器12和处理器13。存储器12用于存储计算机可读指令，处理器13用执行所述储器中存储的计算机可读指令以实现上述任一实施例所述的基于人工智能的目标检测样本优化方法。
[0159]
在一个可选的实施例中，电子设备1还包括总线、存储在所述存储器12中并可在所述处理器13上运行的计算机程序，例如基于人工智能的目标检测样本优化程序。
[0160]
图3仅示出了具有存储器12和处理器13的电子设备1，本领域技术人员可以理解的是，图3示出的结构并不构成对电子设备1的限定，可以包括比图示更少或者更多的部件，或者组合某些部件，或者不同的部件布置。
[0161]
结合图1，电子设备1中的所述存储器12存储多个计算机可读指令以实现一种基于人工智能的目标检测样本优化方法，所述处理器13可执行所述多个指令从而实现：
[0162]
采集原始样本图像以构建原始样本图像集，并对所述原始样本图像集中的所有原始样本图像进行标注获得原始样本训练集；
[0163]
基于所述原始样本训练集对所述原始样本图像集进行分类获得多种类别的样本分类图像集，并基于所述样本分类图像集构建像素点数据集；
[0164]
计算所述像素点数据集中每一个像素点的局部近邻密度，所述局部近邻密度用以表征像素点在局部范围内与其他所有像素点之间的距离关系；
[0165]
基于所述局部近邻密度计算每一个像素点的局部离群系数，并基于所述局部离群系数筛选所述像素点数据集获得有效样本训练集；
[0166]
基于所述有效样本训练集训练预设的目标检测模型，并使用训练好的目标检测模型对实时获取的原始样本图像进行目标检测。
[0167]
具体地，所述处理器13对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述，在此不赘述。
[0168]
本领域技术人员可以理解，所述示意图仅仅是电子设备1的示例，并不构成对电子设备1的限定，电子设备1可以是总线型结构，也可以是星形结构，电子设备1还可以包括比图示更多或更少的其他硬件或者软件，或者不同的部件布置，例如电子设备1还可以包括输入输出设备、网络接入设备等。
[0169]
需要说明的是，电子设备1仅为举例，其他现有的或今后可能出现的电子产品如可适应于本技术，也应包含在本技术的保护范围以内，并以引用方式包含于此。
[0170]
其中，存储器12至少包括一种类型的可读存储介质，所述可读存储介质可以是非易失性的，也可以是易失性的。所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如：sd或dx存储器等)、磁性存储器、磁盘、光盘等。存储器12在一些实施例中可以是电子设备1的内部存储单元，例如该电子设备1的移动硬盘。存储器12在另一些实施例中也可以是电子设备1的外部存储设备，例如电子设备1上配备的插接式移动硬盘、智能存储卡(smart media card，smc)、安全数字(secure digital，sd)卡、闪存卡(flash card)等。存储器12不仅可以用于存储安装于电子设备1的应用软件及各类数据，例如基于人工智能的目标检测样本优化程序的代码等，还可以用于暂时地存储已经输出或者将要输出的数据。
[0171]
处理器13在一些实施例中可以由集成电路组成，例如可以由单个封装的集成电路所组成，也可以是由多个相同功能或不同功能封装的集成电路所组成，包括一个或者多个中央处理器(central processing unit，cpu)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。处理器13是电子设备1的控制核心(control unit)，利用各种接口和线路连接整个电子设备1的各个部件，通过运行或执行存储在所述存储器12内的程序或者模块(例如执行基于人工智能的目标检测样本优化程序等)，以及调用存储在所述存储器12内的数据，以执行电子设备1的各种功能和处理数据。
[0172]
所述处理器13执行所述电子设备1的操作系统以及安装的各类应用程序。所述处理器13执行所述应用程序以实现上述各个基于人工智能的目标检测样本优化方法实施例中的步骤，例如图1所示的步骤。
[0173]
示例性的，所述计算机程序可以被分割成一个或多个模块/单元，所述一个或者多个模块/单元被存储在所述存储器12中，并由所述处理器13执行，以完成本技术。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段，该指令段用于描述所述计算机程序在电子设备1中的执行过程。例如，所述计算机程序可以被分割成采集单元110、构建单元111、计算单元112、筛选单元113、检测单元114。
[0174]
上述以软件功能模块的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机、计算机设备，或者网络设备等)或处理器(processor)执行本技术各个实施例所述的基于人工智能的目标检测样本优化方法的部分。
[0175]
电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本技术实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指示相关的硬件设备来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。
[0176]
其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom，read-only memory)、随机存储器及其他存储器等。
[0177]
进一步地，计算机可读存储介质可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序等；存储数据区可存储根据区块链节点的使用所创建的数据等。
[0178]
本技术所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
[0179]
总线可以是外设部件互连标准(peripheral component interconnect，简称pci)总线或扩展工业标准结构(extended industry standard architecture，简称eisa)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示，在图3中仅用一根箭头表示，但并不表示仅有一根总线或一种类型的总线。所述总线被设置为实现所述存储器12以及至少一个处理器13等之间的连接通信。
[0180]
本技术实施例还提供一种计算机可读存储介质(图未示)，计算机可读存储介质中存储有计算机可读指令，计算机可读指令被电子设备中的处理器执行以实现上述任一实施例所述的基于人工智能的目标检测样本优化方法。
[0181]
在本技术所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。
[0182]
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
[0183]
另外，在本技术各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。
[0184]
此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。说明书陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称，而并不表示任何特定的顺序。
[0185]
最后应说明的是，以上实施例仅用以说明本技术的技术方案而非限制，尽管参照
较佳实施例对本技术进行了详细说明，本领域的普通技术人员应当理解，可以对本技术的技术方案进行修改或等同替换，而不脱离本技术技术方案的精神和范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：信息处理方法、装置、电子设备及计算机可读存储介质与流程

基于人工智能的目标检测样本优化方法及相关设备与流程

相关文献

最热文献