一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

视频图像的目标检测方法、电子设备以及可读存储介质与流程

2022-06-25 07:12:05 来源:中国专利 TAG:


1.本发明涉及图像处理技术领域,具体涉及一种视频图像的目标检测方法、电子设备以及可读存储介质。


背景技术:

2.目标检测(object detection)的任务是找出图像中所有感兴趣的目标物体,并确定找出的目标物体的类别和位置,是计算机视觉领域的核心问题之一。目前,常用的目标检测算法包括:r-cnn(regions with cnn features)算法、fast r-cnn算法、faster rcnn算法、yolo算法(you only look once)。
3.然而,在对视频图像进行目标检测时,由于运动模糊、罕见角度,失焦,遮挡等问题,会对视频中连续多帧图像的目标检测精度造成影响。


技术实现要素:

4.本发明的目的是提供了一种视频图像的目标检测方法、电子设备以及可读存储介质,能够使得修正得到的分类得分向量更加准确,提升了视频图像的各帧图像的目标检测结果的精确度,即提升了视频图像目标检测的准确度。
5.为实现上述目的,本发明提供了一种视频图像的目标检测方法,包括:
6.分别对视频图像的每帧图像进行目标检测,得到各帧图像的目标检测结果,所述目标检测结果包括:检测对象对应的边界框与各所述检测对象的分类得分向量;对于相邻的两帧图像,若后一帧图像中存在与前一帧图像中的所述检测对象匹配的所述检测对象,将所述相邻的两帧图像之间匹配的两个所述检测对象加入同一个对象序列,其中匹配的两个所述检测对象的边界框相匹配;对于每个所述目标对象,基于所述目标对象所属的所述对象序列中包含的多个所述检测对象的分类得分向量与所述目标对象的分类得分向量,对所述目标对象的分类得分向量进行修正,所述目标对象为位于所述对象序列中的所述检测对象。
7.本发明还提供了一种电子设备,包括:至少一个处理芯片;以及,与所述至少一个处理芯片通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理芯片执行的指令,所述指令被所述至少一个处理芯片执行,以使所述至少一个处理芯片能够执行如上述的视频图像的目标检测方法。
8.本发明还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序运行时实现如视频图像的目标检测方法。
9.本发明实施例提供了一种视频图像的目标检测方法,在对对象序列中的目标对象的分类得分向量进行修正时,结合目标对象所属的对象序列中所有的检测对象的分类得分向量以及该目标对象自身的分类得分向量,由此能够使得修正得到的目标对象的分类得分向量更加准确,提升了视频图像的各帧图像的目标检测结果的精确度,即提升了视频图像目标检测的准确度。
10.在一个实施例中,所述对于每个所述目标对象,基于所述目标对象所属的所述对象序列中包含的多个所述检测对象的分类得分向量与所述目标对象的分类得分向量,对所述目标对象的分类得分向量进行修正,所述目标对象为位于所述对象序列中的所述检测对象,包括:对于每个所述目标对象,基于所述目标对象所属的所述对象序列所包含的多个所述检测对象各类别的分类得分的均值与所述目标对象各类别的分类得分,分别对所述目标对象的各类别的分类得分进行修正。
11.在一个实施例中,修正后的所述目标对象的当前类别的分类得分的计算公式为:score
new
=α*score
mean
β*score
old
;其中,score
new
为修正后的所述目标对象的当前类别的分类得分,score
mean
为所述目标对象所属的所述对象序列中包含的多个所述检测对象的当前类别的分类得分的平均值,score
old
为修正前的所述目标对象的当前类别的分类得分,α、β均为小于1的正数。
12.在一个实施例中,α为0.9,β为0.1。
13.在一个实施例中,对于相邻的两帧图像,若后一帧图像中存在与前一帧图像中的所述检测对象匹配的所述检测对象,将所述相邻的两帧图像之间匹配的两个所述检测对象加入同一个对象序列,包括:对于相邻的两帧图像,基于后一帧图像包含的各所述检测对象的边界框、前一帧图像包含的各所述检测对象的边界框以及所述相邻的两帧图像上各所述检测对象的分类置信度,得到所述相邻的两帧图像上的两个所述检测对象之间的链接分数;选取所述相邻的两帧图像上链接分数大于预设的分数阈值的两个所述检测对象作为匹配的两个所述检测对象,并将所述相邻的两帧图像之间匹配的两个所述检测对象加入同一个对象序列。
14.在一个实施例中,所述对于相邻的两帧图像,基于后一帧图像包含的各所述检测对象的边界框、前一帧图像包含的各所述检测对象的边界框以及所述相邻的两帧图像上各所述检测对象的分类置信度,得到所述相邻的两帧图像上的两个所述检测对象之间的链接分数,包括:获取第一检测对象对应的第一边界框与第二检测对象对应的第二边界框之间的交并比、所述第一边界框的中心点与所述第二边界框的中心点之间的距离,以及所述第一边界框与所述第二边宽之间的长度比值与宽度比值;所述第一检测对象为前一帧图像中的所述检测对象、所述第二检测对象为后一帧图像中的所述检测对象;基于所述第一检测对象与所述第二检测对象之间的所述交并比、所述距离、所述长度比值、所述宽度比值以及所述第一检测对象与所述第二检测对象的分类置信度,得到所述第一检测对象与所述第二检测对象之间的链接分数。
15.在一个实施例中,在所述对于每个所述目标对象,基于所述目标对象所属的所述对象序列中包含的多个所述检测对象的分类得分与所述目标对象的分类得分,对所述目标对象的分类得分进行修正,所述目标对象为位于所述对象序列中的所述检测对象之后,还包括:基于各帧图像中修正后每个所述检测对象的分类得分向量,选取分类得分向量中分类得分最大的类别作为各帧图像中每个检测对象的类别。
附图说明
16.图1是根据本发明第一实施例中的视频图像的目标检测方法的具体流程图;
17.图2是根据本发明第一实施例中的视频图像中相邻的三帧图像的示意图;
18.图3是根据本发明第二实施例中的视频图像的目标检测方法的具体流程图;
19.图4是根据本发明第三实施例中的视频图像的目标检测方法的具体流程图;
20.图5是根据本发明第三实施例中的相邻两帧图像中边界框之间的链接分数的示意图;
21.图6是图4中的视频图像的目标检测方法的子步骤3021的具体流程图。
具体实施方式
22.以下将结合附图对本发明的各实施例进行详细说明,以便更清楚理解本发明的目的、特点和优点。应理解的是,附图所示的实施例并不是对本发明范围的限制,而只是为了说明本发明技术方案的实质精神。
23.在下文的描述中,出于说明各种公开的实施例的目的阐述了某些具体细节以提供对各种公开实施例的透彻理解。但是,相关领域技术人员将认识到可在无这些具体细节中的一个或多个细节的情况来实践实施例。在其它情形下,与本技术相关联的熟知的装置、结构和技术可能并未详细地示出或描述从而避免不必要地混淆实施例的描述。
24.除非语境有其它需要,在整个说明书和权利要求中,词语“包括”和其变型,诸如“包含”和“具有”应被理解为开放的、包含的含义,即应解释为“包括,但不限于”。
25.在整个说明书中对“一个实施例”或“一实施例”的提及表示结合实施例所描述的特定特点、结构或特征包括于至少一个实施例中。因此,在整个说明书的各个位置“在一个实施例中”或“在一实施例”中的出现无需全都指相同实施例。另外,特定特点、结构或特征可在一个或多个实施例中以任何方式组合。
26.如该说明书和所附权利要求中所用的单数形式“一”和
“”
包括复数指代物,除非文中清楚地另外规定。应当指出的是术语“或”通常以其包括“或/和”的含义使用,除非文中清楚地另外规定。
27.在以下描述中,为了清楚展示本发明的结构及工作方式,将借助诸多方向性词语进行描述,但是应当将“前”、“后”、“左”、“右”、“外”、“内”、“向外”、“向内”、“上”、“下”等词语理解为方便用语,而不应当理解为限定性词语。
28.本发明第一实施方式涉及一种视频图像的目标检测方法,应用于电子设备,电子设备例如为手机、平板电脑、笔记本电脑、台式主机等。电子设备可执行本实施例中的视频图像的目标检测方法对视频图像进行目标识别,并对各帧图像的目标识别结果进行优化处理,以提升视频图像的目标检测精度。
29.本实施方式的视频图像的目标检测方法的具体流程如图1所示。
30.步骤101,分别对视频图像的每帧图像进行目标检测,得到各帧图像的目标检测结果,目标检测结果包括:检测对象对应的边界框与各检测对象的分类得分向量。
31.具体而言,对于当前需要进行目标检测的视频图像,采用预设的目标检测算法(例如为yolo-v3算法)按顺序依次对视频图像所包含的多帧图像分别进行目标检测,得到了各帧图像的目标检测结果。以视频图像中的任意一帧图像为例,假设所选取的目标检测算法能够检测20个目标类别,在对该帧图像进行目标检测后,得到该帧图像包含的各检测对象的边界框、各检测对象的置信度评分以及各检测对象的类别向量,类别向量表示了检测对象属于各目标类别的概率;对于每个检测对象来说,计算该检测对象的置信度评分与类别
向量的点积,能够得到该检测对象的分类得分向量,分类得分向量包括了该检测对象对应20个目标类别的分类得分。其中,检测对象所对应的边界框包括:该边界框的中心点坐标与该边界框的长度和宽度。
32.步骤102,对于相邻的两帧图像,若后一帧图像中存在与前一帧图像中的检测对象匹配的检测对象,将相邻的两帧图像之间匹配的两个检测对象加入同一个对象序列,其中匹配的两个检测对象的边界框相匹配。
33.具体而言,对于视频图像中除第一帧图像以外的其他帧图像,在完成了当前帧图像的目标检测后,基于相邻帧图像之间的边界框对比信息建立相邻帧图像的检测对象之间的连接关系,将当前帧图像所包含各检测对象与相邻的前一帧图像所包含各检测对象一一进行对比,判断当前帧图像与前一帧图像之间是否存在匹配的两个检测对象;若当前帧图像与前一帧图像之间存在匹配的两个检测对象,将匹配的两个检测对象加入同一个对象序列;若当前帧图像与前一帧图像之间存在匹配的多对检测对象,则将边界框匹配的各对检测对象分别加入不同的对象序列;其中,若分别来自相邻的两帧图像上的两个检测对象匹配,这两个检测对象的边界框是相匹配的。另外,匹配的两个检测对象的类别也是匹配的,即这两个检测对象属于同一个类别。
34.举例来说,请参考图2,在第t帧图像与第t 1帧图像经过目标检测后得到,第t帧图像中包含3个检测对象,3个检测对象的边界框分别为检测对象1的边界框box
t1
、检测对象2的边界框box
t2
以及检测对象3的边界框box
t3
;第t 1帧图像中包含3个检测对象,3个检测对象的边界框分别为检测对象4的边界框box
(t 1)1
、检测对象5的边界框box
(t 1)2
、检测对象6的边界框box
(t 1)3
;将第t帧图像包含的3个检测对象与第t 1帧图像包含的3个检测对象一一进行对比,可以得到在这相邻的两帧图像(第t帧图像与第t 1帧图像)之间,检测对象1与检测对象5匹配、检测对象2与检测对象4匹配、检测对象3与检测对象6匹配,检测对象1的边界框box
t1
与检测对象5的边界框box
(t 1)2
匹配、检测对象2的边界框box
t2
与检测对象4的边界框box
(t 1)1
匹配、检测对象3的边界框box
t3
与检测对象6的边界框box
(t 1)3
匹配;另外,上述匹配的两个检测对象的类别也是匹配的;基于此,将检测对象1与检测对象5加入对象序列1、将检测对象2与检测对象4加入对象序列2、检测对象3与检测对象6加入对象序列3。其中,t为大于或等于1的整数。
35.进一步的,在第t 2帧图像经过目标检测后得到,第t 2帧图像中包含2个检测对象,2个检测对象的边界框分别为检测对象7的边界框box
(t 2)1
与检测对象8的边界框box
(t 2)2
,将第t 1帧图像包含的3个检测对象与第t 2帧图像包含的2个检测对象一一进行对比,可以得到在这相邻的两帧图像(第t 1帧图像与第t 2帧图像)之间,检测对象4的与检测对象7匹配、检测对象5与检测对象8匹配;检测对象4的边界框box
(t 1)1
与检测对象7的边界框box
(t 2)1
匹配、检测对象5的边界框box
(t 1)2
与检测对象8的边界框box
(t 2)2
匹配;并且,上述匹配的两个检测对象的类别也是匹配的。基于此,将检测对象8加入对象序列1,将检测对象7加入对象序列2。另外,由于第t 2帧图像中未包含与检测对象6匹配的检测对象,此时对象序列3中不会再加入新的边界框,对象序列3为完整的对象序列。
36.需要说明的是,若某一个帧图像未包含检测对象,则将当前所有的对象序列作为完整的对象序列,并在下一帧图像之后开始建立新的对象序列。
37.综上,重复上述过程能够对视频图像所包含的所有帧的图像中的检测对象进行链
接,得到所有的完整的对象序列。
38.步骤103,对于每个目标对象,基于目标对象所属的对象序列中包含的多个检测对象的分类得分向量与目标对象的分类得分向量,对目标对象的分类得分向量进行修正,目标对象为位于对象序列中的检测对象。
39.具体而言,在经过步骤102得到完整的对象序列后,分别对各对象序列中包含的各检测对象的分类得分向量进行修正;以对象序列a中任意一个检测对象进行分类得分向量进行修正为例,将检测对象记为目标对象,在对目标对象的分类得分向量进行修正时,基于对象序列a中所包含的所有的检测对象的分类得分向量与目标对象的分类得分向量,更新目标对象的分类得分向量,从而得到了修正后的目标对象的分类得分向量。基于此,能够对对象序列a中所包含的所有的检测对象的分类得分向量一一进行修正。
40.在本实施例中,在对对象序列中的各检测对象的分类得分向量进行修正的同时,还可以对对象序列中各检测对象的边界框坐标进行修正,具体的,以对象序列中包含的各检测对象所属的图像帧的时间构建出噪声时间序列,然后再通过平滑处理的方式来去除或减少噪声,并将经过平滑处理后各检测对象的边界框坐标作为修正后各检测对象的边界框坐标。
41.在一个例子中,在步骤103之后,还包括:
42.步骤104,基于各帧图像中修正后每个检测对象的分类得分向量,选取分类得分向量中分类得分最大的类别作为各帧图像中每个检测对象的类别。
43.具体而言,在经过步骤101至步骤103中对各帧图像的目标检测结果的优化处理之后,对于每帧图像中的每个检测对象来说,修正后的该检测对象的分类得分向量包括了检测对象对应多个目标类别的分类得分,然后从中选取分类得分最高的目标类别作为该检测对象的类别;由此能够得到每帧图像中的各检测对象的类别。
44.本实施例提供了一种视频图像的目标检测方法,对于待处理的视频图像,分别对视频图像的每帧图像进行目标检测,得到各帧图像的目标检测结果,目标检测结果包括:检测对象对应的边界框与各检测对象的类别向量;然后对于相邻的两帧图像,将这两帧图像中的检测对象一一进行对比,若后一帧图像中存在与前一帧图像中的检测对象匹配的检测对象,将相邻的两帧图像之间匹配的两个检测对象加入同一个对象序列,其中匹配的两个检测对象的边界框相匹配;用目标对象表示位于对象序列中的检测对象,则对于每个目标对象,基于目标对象所属的对象序列中包含的多个检测对象的分类得分向量与目标对象的分类得分向量,对目标对象的分类得分向量进行修正;即在对目标对象的分类得分向量进行修正时,结合目标对象所属的对象序列中所有的检测对象的分类得分向量以及该目标对象自身的分类得分向量,由此能够使得修正得到的目标对象的分类得分向量更加准确,提升了视频图像的各帧图像的目标检测结果的精确度,即提升了视频图像目标检测的准确度。
45.本发明的第二实施例涉及一种视频图像的目标检测方法,本实施方式相对于第一实施方式而言:本实施例提供了对目标对象的分类得分向量进行修正的一种具体实现方式。
46.本实施例的视频图像的目标检测方法的具体流程如图3所示。
47.步骤201,分别对视频图像的每帧图像进行目标检测,得到各帧图像的目标检测结
果,目标检测结果包括:检测对象对应的边界框与各检测对象的分类得分向量。与第一实施例中的步骤101大致相同,在此不再赘述。
48.步骤202,对于相邻的两帧图像,若后一帧图像中存在与前一帧图像中的检测对象匹配的检测对象,将相邻的两帧图像之间匹配的两个检测对象加入同一个对象序列,其中匹配的两个检测对象的边界框相匹配。与第一实施例中的步骤102大致相同,在此不再赘述。
49.步骤203,对于每个目标对象,基于目标对象所属的对象序列所包含的多个检测对象各类别的分类得分的均值与目标对象各类别的分类得分,分别对目标对象的各类别的分类得分进行修正。
50.具体而言,对于每个目标对象来说,目标对象的分类得分向量包括了目标对象对应多个目标类别的分类得分,以对目标对象任一目标类别的分类得分进行修正为例,先计算目标对象所属的对象序列中所有的检测对象对应该目标类别得分的平均值,然后基于该平均值与目标对象对应该目标类别的分类得分,修正目标对象对应该目标类别的分类得分。
51.修正后的目标对象的当前类别的分类得分的计算公式为:
52.score
new
=α*score
mean
β*score
old
公式(1)
53.其中,其中,scorenew为修正后的目标对象的当前类别的分类得分,scoremean为目标对象所属的对象序列中包含的多个检测对象的当前类别的分类得分的平均值,scoreold为修正前的目标对象的当前类别的分类得分,α、β均为小于1的正数。其中,α、β的值可以基于目标检测所采用的目标检测网络来设置;在一个例子中,α为0.9,β为0.1,可以达到较好的修正效果。
54.以第一实施例中的对象序列1为例,对象序列1中包含检测对象1、检测对象5以及检测对象8,以score
b11
表示检测对象1对应当前类别的分类得分、score
b12
表示检测对象5对应当前类别的分类得分、score
b22
表示检测对象8对应当前类别的分类得分,在对检测对象1对应当前类别的分类得分score
b11
进行修正时,先计算score
mean
=(score
b11
score
b12
score
b22
)/3,然后结合上述公式(1)可得,修正后的检测对象1对应当前类别的分类得分score
newb11
=α*score
mean
β*score
b11
;对检测对象以及检测对象8对应当前类别的分类得分的修正过程与上述过程类似,在此不再赘述。
55.步骤204,基于各帧图像中修正后每个检测对象的分类得分向量,选取分类得分向量中分类得分最大的类别作为各帧图像中每个检测对象的类别。与第一实施例中的步骤104大致相同,在此不再赘述。
56.本发明的第三实施例涉及一种视频图像的目标检测方法,本实施方式相对于第一实施方式而言:本实施例提供了对于相邻的两帧图像,对于相邻的两帧图像,若后一帧图像中存在与前一帧图像中的检测对象匹配的检测对象,将相邻的两帧图像之间匹配的两个检测对象加入同一个对象序列的一种具体实现方式。
57.本实施例的视频图像的目标检测方法的具体流程如图4所示。
58.步骤301,分别对视频图像的每帧图像进行目标检测,得到各帧图像的目标检测结果,目标检测结果包括:检测对象对应的边界框与各检测对象的分类得分向量。与第一实施例中的步骤101大致相同,在此不再赘述。
59.步骤302,包括以下子步骤:
60.子步骤3021,对于相邻的两帧图像,基于后一帧图像包含的各检测对象的边界框、前一帧图像包含的各检测对象的边界框以及相邻的两帧图像上各检测对象的分类置信度,得到相邻的两帧图像上的两个检测对象之间的链接分数。
61.具体而言,以图2中的第t帧图像与第t 1帧图像为例,将第t帧图像所包含的3个检测对象分别与第t 1帧图像所包含的3个检测对象一一进行对比,得到这两帧图像(第t帧图像与第t 1帧图像)上的两个检测对象之间的链接分数。在第t帧图像与第t 1帧图像之间,能够得到9个链接分数,请参考图5,具体包括:检测对象1与检测对象4之间的链接分数ls
11
,检测对象1与检测对象5之间的链接分数ls
12
,检测对象1与检测对象6之间的链接分数ls
13
,检测对象2与检测对象4之间的链接分数ls
21
,检测对象2与检测对象5之间的链接分数ls
22
,检测对象2与检测对象6之间的链接分数ls
23
,检测对象3与检测对象4之间的链接分数ls
31
,检测对象3与检测对象5之间的链接分数ls
32
,检测对象3与检测对象6之间的链接分数ls
33

62.在一个例子中,请参考图6,子步骤3021,包括以下子步骤:
63.子步骤30211,获取第一检测对象对应的第一边界框与第二检测对象对应的第二边界框之间的交并比、第一边界框的中心点与第二边界框的中心点之间的距离,以及第一边界框与第二边宽之间的长度比值与宽度比值;第一检测对象为前一帧图像中的检测对象、第二检测对象为后一帧图像中的检测对象。
64.子步骤30212,基于第一检测对象与第二检测对象之间的交并比、距离、长度比值、宽度比值以及第一检测对象与第二检测对象的分类置信度,得到第一检测对象与第二检测对象之间的链接分数。
65.具体而言,选取前一帧图像中的一个检测对象记为第一检测对象、选取后一帧图像中的一个检测对象记为第二检测对象,第一检测对象对应的边界框记作第一边界框,第二检测对象对应的边界框记作第二边界框;在计算第一检测对象与第二检测对象之间的链接分数时,在目标检测的过程中已经获取的第一检测对象的第一边界框与第二检测对象的第二边界框,由此能够基于第一边界框的坐标信息与第二边界框的坐标信息,计算得到第一边界框与第二边界框之间的交并比(intersection over union,简称iou),同时也能够计算得到第一边界框的中心点与第二边界框的中心点之间的距离,以及第一边界框与第二边界框之间的长度比值与宽度比值。
66.随后将上述过程中计算得到的两个检测对象(第一检测对象与第二检测对象)之间的交并比、中心点距离、长度比值以及高度比值,以及第一检测对象与第二检测对象的分类置信度代入预设的链接分数计算模型中,便能够得到第一检测对象与第二检测对象之间的链接分数。由此,仅需计算两个检测对象的边界框之间的交并比、中心点距离、长度比值以及高度比值这些几何特征以及分类置信度的点积,便能够得到两个检测对象之间的链接分数,而无须计算两个检测对象的外貌特征,提升了计算速度和计算得到的链接分数的精度。
67.其中,链接分数计算模型可以通过逻辑回归训练得到,具体训练过程在此不再赘述,链接分数计算模型的为:lsa=(f
sem1
*f
sem2
)x(iou
12
,d
centers12
,ration
w12
,ration
h12
),其中,x表示逻辑回归得到的模型,lsa表示第一检测对象与第二检测对象之间的链接分数,fsem1表示第一检测对象的分类置信度,fsem2表示第二检测对象的分类置信度,iou
12
表示
第一检测对象与第二检测对象之间的交并比,d
centers12
表示第一边界框与第二边界框之间的中心点距离,ration
w12
表示第一边界框与第二边界框之间的长度比值,ration
h12
表示第一边界框与第二边界框之间的高度比值。
68.子步骤3022,选取相邻的两帧图像上链接分数大于预设的分数阈值的两个检测对象作为匹配的两个检测对象,并将相邻的两帧图像之间匹配的两个检测对象加入同一个对象序列。
69.具体而言,本实施例中可以采用贪心算法来选取匹配的检测对象,基于所得到的两帧图像上的两个检测对象之间的链接分数,先选取出最大的链接分数,若这个链接分数大于预设的分数阈值,则判定这个链接分数所对应的两个检测对象匹配,这两个检测对象加入同一个对象序列,然后将这两个检测对象所在的行列进行抑制;随后再从剩下的链接分数中选取最大的链接分数,若该链接分数大于预设的分数阈值,则重复上述过程;若该链接分数小于或等于预设的分数阈值,则直接结束。
70.接续上例,计算得到的9个链接分数中,链接分数ls
12
、链接分数ls
21
以及链接分数ls
23
大于预设的分数阈值,即检测对象1与检测对象5匹配、检测对象2与检测对象4匹配、检测对象3与检测对象6匹配,将检测对象1与检测对象5加入对象序列1、将检测对象2与检测对象4加入对象序列2、检测对象3与检测对象6加入对象序列3。
71.步骤303,对于每个目标对象,基于目标对象所属的对象序列中包含的多个检测对象的分类得分向量与目标对象的分类得分向量,对目标对象的分类得分向量进行修正,目标对象为位于对象序列中的检测对象。与第一实施例中的步骤103大致相同,在此不再赘述。
72.步骤304,基于各帧图像中修正后每个检测对象的分类得分向量,选取分类得分向量中分类得分最大的类别作为各帧图像中每个检测对象的类别。与第一实施例中的步骤104大致相同,在此不再赘述。
73.本发明的第四实施例涉及一种电子设备,电子设备例如为手机、平板电脑、笔记本电脑、台式主机等。边缘终端包括至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行第一至第三实施例中任一项的视频图像的目标检测方法。
74.其中,存储器和处理器采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器和存储器的各种电路连接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路连接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器。
75.处理器负责管理总线和通常的处理,还可以提供各种功能,包括定时,外围接口,电压调节、电源管理以及其他控制功能。而存储器可以被用于存储处理器在执行操作时所使用的数据。
76.本发明第五实施方式涉及一种计算机可读存储介质,存储有计算机程序。计算机程序被处理器执行时实现上述方法实施例。
77.以上已详细描述了本发明的较佳实施例,但应理解到,若需要,能修改实施例的方面来采用各种专利、申请和出版物的方面、特征和构思来提供另外的实施例。
78.考虑到上文的详细描述,能对实施例做出这些和其它变化。一般而言,在权利要求中,所用的术语不应被认为限制在说明书和权利要求中公开的具体实施例,而是应被理解为包括所有可能的实施例连同这些权利要求所享有的全部等同范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献