一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

图像识别方法和装置与流程

2022-11-14 13:43:08 来源:中国专利 TAG:


1.本技术涉及图像识别技术领域,具体涉及一种图像识别方法和装置。


背景技术:

2.目前,对于行人的属性识别可以广泛应用在行人再识别、智能化视频监控等领域,但是,在不同的应用场景中,可能会受到行人携带物的遮挡、以及光照强度等因素的影响,降低了对行人的识别准确性。
3.通常,会采用基于“特征提取 分类器”的框架设计行人识别系统。但是,对于行人属性特征的识别,通常是依赖设计者的先验知识或者经验为每个属性特征单独进行处理,无法准确对不同的行人进行识别,鲁棒性较差。同时,在该行人识别系统中,需要为每个属性特征都设计一个专门的分类器,增加了实现复杂度,提高了行人识别的成本。


技术实现要素:

4.为此,本技术提供一种图像识别方法和装置,解决如何降低行人识别成本,并提高行人识别准确性的问题。
5.为了实现上述目的,本技术第一方面提供一种图像识别方法,方法包括:获取待检测行人图像及其对应的多个局部区域图像;依据整体图像识别模型对待检测行人图像进行识别,获得整体识别结果;分别将多个局部区域图像输入至与局部区域图像对应的局部区域识别模型中进行识别,确定多个局部识别结果;依据整体识别结果和多个局部识别结果,确定待检测行人图像中的行人属性特征;其中,整体图像识别模型和局部区域识别模型均是基于训练样本图像对卷积神经网络进行训练获得的模型,卷积神经网络是基于通道注意力机制和自定义网络训练参数确定的网络。
6.在一些具体实现中,局部区域识别模型包括:头部识别模型、躯干区域识别模型和四肢区域识别模型中的至少一种;
7.多个局部区域图像包括:头部区域图像,躯干区域图像和四肢区域图像中的至少一种。
8.在一些具体实现中,分别将多个局部区域图像输入至与局部区域图像对应的局部区域识别模型中进行识别,确定多个局部识别结果,包括:
9.在确定局部区域识别模型包括头部识别模型的情况下,将头部区域图像输入至头部识别模型中进行识别,获得头部识别结果;
10.在确定局部区域识别模型包括躯干区域识别模型的情况下,将躯干区域图像输入至躯干区域识别模型中进行识别,获得躯干识别结果;
11.在确定局部区域识别模型包括四肢区域识别模型的情况下,将四肢区域图像输入至四肢区域识别模型中进行识别,获得四肢识别结果。
12.在一些具体实现中,依据整体图像识别模型对待检测行人图像进行识别,获得整体识别结果之前,还包括:
13.获取多个训练样本图像,训练样本图像包括:整体样本图像和多个局部样本图像;
14.依据多个整体样本图像对卷积神经网络进行训练,获得整体图像识别模型;
15.依据预设局部特征,从多个局部样本图像中筛选获得与预设局部特征相对应的待处理局部样本图像;
16.依据待处理局部样本图像对卷积神经网络进行训练,获得与局部区域图像对应的局部区域识别模型。
17.在一些具体实现中,依据待处理局部样本图像对卷积神经网络进行训练,获得与局部区域图像对应的局部区域识别模型,包括:
18.对待处理局部样本图像进行批量标准化处理,获得待处理局部样本图像对应的图像特征;
19.依据通道注意力机制,对待处理局部样本图像对应的图像特征进行相似度处理,获得与待处理局部样本图像对应的图像特征匹配的注意力特征;
20.将待处理局部样本图像对应的图像特征及其匹配的注意力特征进行加权融合,确定融合后的图像特征;
21.对融合的图像特征进行激活处理和最大值池化处理,获得与局部区域图像对应的局部区域识别模型。
22.在一些具体实现中,依据多个整体样本图像对卷积神经网络进行训练,获得整体图像识别模型之前,还包括:
23.依据预设局部特征,分别对多个局部样本图像进行标注,生成标注信息,其中,标注信息与局部样本图像中的局部特征相匹配;
24.依据预设局部特征,从多个局部样本图像中筛选获得与预设局部特征相对应的待处理局部样本图像,包括:
25.依据标注信息,对多个局部样本图像进行筛选,获得至少一个与标注信息对应的待处理局部样本图像;
26.其中,预设局部特征包括:头部区域特征、躯干区域特征和四肢区域特征中的至少一种。
27.在一些具体实现中,获取待检测行人图像及其对应的多个局部区域图像,包括:
28.获取待检测行人图像;
29.依据预设区域的数量,对待检测行人图像进行多个预设区域的裁剪,获得多个待处理图像;
30.依据预设尺寸,分别对多个待处理图像进行缩放处理,获得多个局部区域图像。
31.在一些具体实现中,行人属性特征,包括:行人的体态特征、行人的衣着特征和行人携带的物品特征中的至少一种。
32.在一些具体实现中,自定义网络训练参数,包括:卷积层的属性参数、激活层的属性参数、池化层的属性参数、全连接层的属性参数、卷积层的数量、激活层的数量、池化层的数量、通道注意力机制对应的处理层数中至少一种;
33.卷积层的属性参数包括:卷积层对应的卷积核的尺寸、卷积步长和卷积核的数量中的至少一种。
34.为了实现上述目的,本技术第二方面提供一种图像识别装置,其包括:获取模块,
被配置为获取待检测行人图像及其对应的多个局部区域图像;整体识别模块,被配置为依据整体图像识别模型对待检测行人图像进行识别,获得整体识别结果;局部识别模块,被配置为分别将多个局部区域图像输入至与局部区域图像对应的局部区域识别模型中进行识别,确定多个局部识别结果;属性特征确定模块,被配置为依据整体识别结果和多个局部识别结果,确定待检测行人图像中的行人属性特征;其中,整体图像识别模型和局部区域识别模型均是基于训练样本图像对卷积神经网络进行训练获得的模型。
35.本技术中的图像识别方法和装置,通过获取待检测行人图像及其对应的多个局部区域图像,能够明确待检测行人的图像,方便后续处理;依据整体图像识别模型对待检测行人图像进行识别,获得整体识别结果,初步获得对待检测行人的整体识别信息;分别将多个局部区域图像输入至与局部区域图像对应的局部区域识别模型中进行识别,确定多个局部识别结果,进一步明确对待检测行人的不同的局部区域的识别信息,提升对待检测行人的识别准确性;依据整体识别结果和多个局部识别结果,确定待检测行人图像中的行人属性特征,其中的整体图像识别模型和局部区域识别模型均是基于训练样本图像对卷积神经网络进行训练获得的模型,卷积神经网络是基于通道注意力机制和自定义网络训练参数确定的网络,能够降低系统的实现复杂度,降低对行人的识别成本,并提高对待检测行人的识别准确性。
附图说明
36.附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开的实施例一起用于解释本公开,并不构成对本公开的限制。通过参考附图对详细示例实施例进行描述,以上和其它特征和优点对本领域技术人员将变得更加显而易见,在附图中:
37.图1示出本技术一实施例提供的图像识别方法的流程示意图。
38.图2示出本技术实施例提供的整体图像识别模型和局部区域识别模型的获取方法的流程示意图。
39.图3示出本技术实施例提供的图像识别装置的组成方框图。
40.图4示出本技术实施例提供的图像识别装置对待检测行人的识别流程示意图。
41.图5示出本技术实施例中的自定义卷积神经网络的网络架构示意图。
42.图6示出能够实现根据本发明实施例的图像识别方法和装置的计算设备的示例性硬件架构的结构图。
具体实施方式
43.以下结合附图对本技术的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本技术,并不用于限制本技术。对于本领域技术人员来说,本技术可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本技术的示例来提供对本技术更好的理解。
44.为使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术实施方式作进一步地详细描述。
45.图1示出本技术一实施例提供的图像识别方法的流程示意图。该图像识别方法可应用于图像识别装置。如图1所示,该图像识别方法包括但不限于如下步骤。
46.步骤s101,获取待检测行人图像及其对应的多个局部区域图像。
47.步骤s102,依据整体图像识别模型对待检测行人图像进行识别,获得整体识别结果。
48.其中,整体图像识别模型是基于训练样本图像对卷积神经网络进行训练获得的模型,卷积神经网络是基于通道注意力机制和自定义网络训练参数确定的网络。
49.步骤s103,分别将多个局部区域图像输入至与局部区域图像对应的局部区域识别模型中进行识别,确定多个局部识别结果。
50.其中,局部区域识别模型均是基于训练样本图像对卷积神经网络进行训练获得的模型,卷积神经网络是基于通道注意力机制和自定义网络训练参数确定的网络。
51.步骤s104,依据整体识别结果和多个局部识别结果,确定待检测行人图像中的行人属性特征。
52.在本实施例中,通过获取待检测行人图像及其对应的多个局部区域图像,能够明确待检测行人的图像,方便后续处理;依据整体图像识别模型对待检测行人图像进行识别,获得整体识别结果,初步获得对待检测行人的整体识别信息;分别将多个局部区域图像输入至与局部区域图像对应的局部区域识别模型中进行识别,确定多个局部识别结果,进一步明确对待检测行人的不同的局部区域的识别信息,提升对待检测行人的识别准确性;依据整体识别结果和多个局部识别结果,确定待检测行人图像中的行人属性特征,其中的整体图像识别模型和局部区域识别模型均是基于训练样本图像对卷积神经网络进行训练获得的模型,卷积神经网络是基于通道注意力机制和自定义网络训练参数确定的网络,能够降低系统的实现复杂度,降低对行人的识别成本,并提高对待检测行人的识别准确性。
53.其中,自定义网络训练参数,包括:卷积层的属性参数、激活层的属性参数、池化层的属性参数、全连接层的属性参数、卷积层的数量、激活层的数量、池化层的数量、通道注意力机制对应的处理层数中至少一种;卷积层的属性参数包括:卷积层对应的卷积核的尺寸、卷积步长和卷积核的数量中的至少一种。
54.需要说明的是,通过上述不同的训练参数的设置,能够实现对卷积神经网络的自定义,从而使获得的整体图像识别模型和局部区域识别模型更能有效的对待测行人进行识别。
55.例如,利用通道注意力机制、人体姿态的估计算法等,将待检测行人图像,划分为不同的局部区域,例如,头部区域、上身区域、下身区域等,从而能够对待检测行人的不同的身体局部区域进行特征检测,以获得更细致的局部识别结果,使提取到的局部区域的属性特征表达能力更强,提升对待检测行人的属性特征的识别准确率。
56.在一些具体实现中,其中的局部区域识别模型包括:头部识别模型、躯干区域识别模型和四肢区域识别模型中的至少一种。多个局部区域图像包括:头部区域图像,躯干区域图像和四肢区域图像中的至少一种。
57.基于不同的划分区域,细化对待检测行人的检测范围,提升对待检测行人的检测准确性。
58.在一些具体实现中,步骤s103中的分别将多个局部区域图像输入至与局部区域图像对应的局部区域识别模型中进行识别,确定多个局部识别结果,可以采用如下方式实现:
59.在确定局部区域识别模型包括头部识别模型的情况下,将头部区域图像输入至头
部识别模型中进行识别,获得头部识别结果;在确定局部区域识别模型包括躯干区域识别模型的情况下,将躯干区域图像输入至躯干区域识别模型中进行识别,获得躯干识别结果;在确定局部区域识别模型包括四肢区域识别模型的情况下,将四肢区域图像输入至四肢区域识别模型中进行识别,获得四肢识别结果。
60.其中,躯干区域图像可以包括上身区域图像和下身区域图像,对应的,躯干区域识别模型也可以包括上身区域识别模型和下身区域识别模型。
61.针对不同的局部区域图像,对应有不同的识别模型,能够强化对不同的局部区域图像的特征识别力度,从而使获得的不同区域的识别结果更准确。
62.在一些具体实现中,行人属性特征,包括:行人的体态特征、行人的衣着特征和行人携带的物品特征中的至少一种。
63.例如,行人的体态特征可以包括行人的高矮胖瘦、行人的年龄范围、行人的性别、行人的发型等特征;行人携带的物品特征可以包括:行人是否佩戴眼镜、行人是否佩戴围巾、行人是否携带物品等特征;行人的衣着特征可以包括:行人穿着的服装(如,上衣、裤子、裙子等)的款式特征、鞋子的款式等特征。
64.以上对于行人属性特征仅是举例说明,可根据实际需要进行具体设定,其他未说明的行人属性特征也在本技术的保护范围之内,在此不再赘述。
65.通过不同维度的属性特征,能够准确衡量行人的特征,提升对待检测行人的识别准确性。
66.本技术实施例提供了另一种可能的实现方式,其中,步骤s101中的获取待检测行人图像及其对应的多个局部区域图像,包括:
67.获取待检测行人图像;依据预设区域的数量,对待检测行人图像进行多个预设区域的裁剪,获得多个待处理图像;依据预设尺寸,分别对多个待处理图像进行缩放处理,获得多个局部区域图像。
68.其中,预设区域的数量可以根据实际需要设置的数量,例如,3个预设区域或4个预设区域等。预设尺寸是基于待检测行人图像的尺寸预先设定的图像尺寸。
69.通过依据预设区域的数量,对待检测行人图像进行多个预设区域的裁剪,能够明确待检测行人图像与预设区域之间的对应关系,例如,对待检测行人图像中的头部图像进行裁剪,可以获得与预设头部区域对应的头部区域图像,以提升对待检测行人的头部区域图像的细节特征进行处理,提升对待检测行人的头部的识别准确性。
70.进一步地,依据预设尺寸,分别对多个待处理图像进行缩放处理,能够使获得的多个局部区域图像的尺寸统一,方便后续对不同的局部区域图像进行处理,提升图像处理的准确性。
71.在一些具体实现中,依据整体图像识别模型对待检测行人图像进行识别,获得整体识别结果之前,还需要获取整体图像识别模型和局部区域识别模型。
72.例如,图2示出本技术实施例提供的整体图像识别模型和局部区域识别模型的获取方法的流程示意图。
73.该整体图像识别模型和局部区域识别模型的获取方法可应用于图像识别装置。如图2所示,该整体图像识别模型和局部区域识别模型的获取方法包括但不限于如下步骤。
74.步骤s201,获取多个训练样本图像。
75.其中,训练样本图像包括:整体样本图像和多个局部样本图像。
76.步骤s202,依据多个整体样本图像对卷积神经网络进行训练,获得整体图像识别模型。
77.步骤s203,依据预设局部特征,从多个局部样本图像中筛选获得与预设局部特征相对应的待处理局部样本图像。
78.步骤s204,依据待处理局部样本图像对卷积神经网络进行训练,获得与局部区域图像对应的局部区域识别模型。
79.在本实施例中,通过依据多个整体样本图像对卷积神经网络进行训练,获得整体图像识别模型,能够方便对整体图像的特征进行识别;依据预设局部特征,从多个局部样本图像中筛选获得与预设局部特征相对应的待处理局部样本图像,可针对某个预设局部特征(例如,头部区域、躯干区域等)对卷积神经网络进行针对性的训练,获得与局部区域图像对应的局部区域识别模型(例如,头部区域识别模型、躯干区域识别模型等),从而使获得的局部区域识别模型更适合对局部区域图像进行识别,提升对待检测行人图像中的局部区域的识别准确性。
80.例如,在执行步骤s202中的依据多个整体样本图像对卷积神经网络进行训练,获得整体图像识别模型之前,还包括:依据预设局部特征,分别对多个局部样本图像进行标注,生成标注信息,其中,标注信息与局部样本图像中的局部特征相匹配。
81.步骤s203中的依据预设局部特征,从多个局部样本图像中筛选获得与预设局部特征相对应的待处理局部样本图像,可以采用如下方式实现:依据标注信息,对多个局部样本图像进行筛选,获得至少一个与标注信息对应的待处理局部样本图像;
82.其中,预设局部特征包括:头部区域特征、躯干区域特征和四肢区域特征中的至少一种。
83.通过对不同的局部样本图像进行标注,能够基于获得的标注信息,简单快捷的查找到与局部特征相匹配的局部样本图像,例如,标注信息是标注头部特征的信息,则在针对头部区域对多个局部样本图像进行检索时,只需查找到标注头部区域特征的标注信息,即可获得多个头部区域样本图像,加快对多个局部样本图像的筛选效率。
84.本技术实施例提供了另一种可能的实现方式,其中,步骤s204中的依据待处理局部样本图像对卷积神经网络进行训练,获得与局部区域图像对应的局部区域识别模型,可以采用如下方式实现:
85.对待处理局部样本图像进行批量标准化处理,获得待处理局部样本图像对应的图像特征;依据通道注意力机制,对待处理局部样本图像对应的图像特征进行相似度处理,获得与待处理局部样本图像对应的图像特征匹配的注意力特征;将待处理局部样本图像对应的图像特征及其匹配的注意力特征进行加权融合,确定融合后的图像特征;对融合的图像特征进行激活处理和最大值池化处理,获得与局部区域图像对应的局部区域识别模型。
86.其中,通道注意力机制可以包括基于颜色通道的注意力、基于空间维度的注意力等。通过不同维度的注意力机制,对待处理局部样本图像对应的图像特征进行相似度处理,能够明确与待处理局部样本图像对应的图像特征匹配的注意力特征,从而强化对颜色通道或空间维度的注意力特征,提升对待处理局部样本图像的处理准确性。
87.进一步地,可以根据实际需要,对与待处理局部样本图像对应的图像特征匹配的
注意力特征与不同的权重值进行相乘,获得权重乘积结果,并将该权重乘积结果与待处理局部样本图像对应的图像特征进行融合(例如,加权平均,或加权乘积等运算),从而使获得的融合后的图像特征更能体现不同维度的通道特征,强化通道特征信息,以便在对融合的图像特征进行激活处理和最大值池化处理后,获得与局部区域图像对应的局部区域识别模型可以基于实际需要,对不同维度的通道特征进行强化,提升局部区域识别模型的识别准确性。
88.图3示出本技术实施例提供的图像识别装置的组成方框图。如图3所示,该图像识别装置300包括但不限于如下模块:
89.获取模块301,被配置为获取待检测行人图像及其对应的多个局部区域图像。
90.整体识别模块302,被配置为依据整体图像识别模型对待检测行人图像进行识别,获得整体识别结果。
91.局部识别模块303,被配置为分别将多个局部区域图像输入至与局部区域图像对应的局部区域识别模型中进行识别,确定多个局部识别结果。
92.属性特征确定模块304,被配置为依据整体识别结果和多个局部识别结果,确定待检测行人图像中的行人属性特征。
93.其中,整体图像识别模型和局部区域识别模型均是基于训练样本图像对卷积神经网络进行训练获得的模型。
94.在一些具体实现中,局部区域识别模型包括:头部识别模型、躯干区域识别模型和四肢区域识别模型中的至少一种;多个局部区域图像包括:头部区域图像,躯干区域图像和四肢区域图像中的至少一种。
95.在一些具体实现中,局部识别模块303,具体用于在确定局部区域识别模型包括头部识别模型的情况下,将头部区域图像输入至头部识别模型中进行识别,获得头部识别结果;在确定局部区域识别模型包括躯干区域识别模型的情况下,将躯干区域图像输入至躯干区域识别模型中进行识别,获得躯干识别结果;在确定局部区域识别模型包括四肢区域识别模型的情况下,将四肢区域图像输入至四肢区域识别模型中进行识别,获得四肢识别结果。
96.在一些具体实现中,图像识别装置300,还包括:模型训练模块(图中未示出),用于获取多个训练样本图像,训练样本图像包括:整体样本图像和多个局部样本图像;依据多个整体样本图像对卷积神经网络进行训练,获得整体图像识别模型;依据预设局部特征,从多个局部样本图像中筛选获得与预设局部特征相对应的待处理局部样本图像;依据待处理局部样本图像对卷积神经网络进行训练,获得与局部区域图像对应的局部区域识别模型。
97.在一些具体实现中,依据待处理局部样本图像对卷积神经网络进行训练,获得与局部区域图像对应的局部区域识别模型,包括:
98.对待处理局部样本图像进行批量标准化处理,获得待处理局部样本图像对应的图像特征;依据通道注意力机制,对待处理局部样本图像对应的图像特征进行相似度处理,获得与待处理局部样本图像对应的图像特征匹配的注意力特征;将待处理局部样本图像对应的图像特征及其匹配的注意力特征进行加权融合,确定融合后的图像特征;对融合的图像特征进行激活处理和最大值池化处理,获得与局部区域图像对应的局部区域识别模型。
99.在一些具体实现中,图像识别装置300,还包括:
100.特征匹配模块(图中未示出),用于依据预设局部特征,分别对多个局部样本图像进行标注,生成标注信息,其中,标注信息与局部样本图像中的局部特征相匹配;
101.筛选模块(图中未示出),用于依据标注信息,对多个局部样本图像进行筛选,获得多个与标注信息对应的待处理局部样本图像;其中,预设局部特征包括:头部区域特征、躯干区域特征和四肢区域特征中的至少一种。
102.在一些具体实现中,获取模块301,具体用于获取待检测行人图像;依据预设区域的数量,对待检测行人图像进行多个预设区域的裁剪,获得多个待处理图像;依据预设尺寸,分别对多个待处理图像进行缩放处理,获得多个局部区域图像。
103.在一些具体实现中,行人属性特征,包括:行人的体态特征、行人的衣着特征和行人携带的物品特征中的至少一种。
104.在一些具体实现中,自定义网络训练参数,包括:卷积层的属性参数、激活层的属性参数、池化层的属性参数、全连接层的属性参数、卷积层的数量、激活层的数量、池化层的数量、通道注意力机制对应的处理层数中至少一种;卷积层的属性参数包括:卷积层对应的卷积核的尺寸、卷积步长和卷积核的数量中的至少一种。
105.在本实施方式中,通过使用获取模块获取待检测行人图像及其对应的多个局部区域图像,能够明确待检测行人的图像,方便后续处理;使用整体识别模块依据整体图像识别模型对待检测行人图像进行识别,获得整体识别结果,初步获得对待检测行人的整体识别信息;使用局部识别模块分别将多个局部区域图像输入至与局部区域图像对应的局部区域识别模型中进行识别,确定多个局部识别结果,进一步明确对待检测行人的不同的局部区域的识别信息,提升对待检测行人的识别准确性;使用属性特征确定模块依据整体识别结果和多个局部识别结果,确定待检测行人图像中的行人属性特征,其中的整体图像识别模型和局部区域识别模型均是基于训练样本图像对卷积神经网络进行训练获得的模型,卷积神经网络是基于通道注意力机制和自定义网络训练参数确定的网络,能够降低系统的实现复杂度,降低对行人的识别成本,并提高对待检测行人的识别准确性。
106.值得一提的是,本实施方式中所涉及到的各模块均为逻辑模块,在实际应用中,一个逻辑单元可以是一个物理单元,也可以是一个物理单元的一部分,还可以以多个物理单元的组合实现。此外,为了突出本技术的创新部分,本实施方式中并没有将与解决本技术所提出的技术问题关系不太密切的单元引入,但这并不表明本实施方式中不存在其它的单元。
107.图4示出本技术实施例提供的图像识别装置对待检测行人的识别流程示意图。如图4所示,该图像识别装置包括但不限于如下处理模块:身体局部块处理模块410、自定义卷积神经网络420和行人属性识别模型的训练模块430。
108.其中,行人属性识别模型的训练模块430包括:整体图像识别模型431、头部识别模型432、上身区域识别模型433、下身区域识别模型434和四肢区域识别模型435。
109.身体局部块处理模块410,用于对输入图像s1进行预处理操作,例如,将原始的输入图像进行等比例缩放,获得像素为640x640的图像;然后,采用自定义目标检测算法s2对缩放后的640x640的图像进行不同区域的划分,从而获得多个区域图像s3,例如,如图4所示的头部区域图像、上身区域图像、下身区域图像、以及脚部区域图像;保存上述不同区域的图像至存储空间。
110.需要说明的是,通过身体局部块处理模块410对多个输入图像进行处理,获得多个训练样本图像s4,以方便后续对不同的识别模型的训练。其中,训练样本图像s4包括:整体样本图像和多个局部样本图像。
111.自定义卷积神经网络420,用于获取多个训练样本图像s4;依据多个整体样本图像对卷积神经网络进行训练,获得整体图像识别模型431;其中的卷积神经网络是基于通道注意力机制和自定义网络训练参数确定的网络;依据预设局部特征,从多个局部样本图像中筛选获得与预设局部特征相对应的待处理局部样本图像;依据待处理局部样本图像对卷积神经网络进行训练,获得与局部区域图像对应的局部区域识别模型。
112.例如,依据头部区域图像对卷积神经网络进行训练,获得头部识别模型432;依据上身区域图像对卷积神经网络进行训练,获得上身区域识别模型433;依据下身区域图像对卷积神经网络进行训练,获得下身区域识别模型434;依据脚部区域图像对卷积神经网络进行训练,获得四肢区域识别模型435。
113.需要说明的是,由于行人的整体图像和行人身体的局部区域图像的大小存在着很大的差别。可以对输入图像s1、头部区域图像、上身区域图像、下身区域图像、以及脚部区域图像都进行图像的归一化处理,获得96x96的图像,以方便后续处理。
114.如图4所示,自定义卷积神经网络420中包括三个图标:卷积特征图、通道注意力模块和全连接层,上述三个图标对应不同的处理层中的不同步骤。
115.例如,图5示出本技术实施例中的自定义卷积神经网络的网络架构示意图。如图5所示,该自定义卷积神经网络可以包括多个具有不同功能的网络层级,例如,卷积层、用于对图像进行批量标准化的bn层、通道注意力模块、最大值池化层、激活层、过渡层和全连接层等。
116.其中,第一处理层可以包括:第一卷积层conv1、用于对图像进行批量标准化的bn 1层、第一通道注意力模块(senet1)、采用relu激活函数的激活层和最大值池化层(pool1)。
117.第二处理层可以包括:第二卷积层conv2、用于对图像进行批量标准化的bn 2层,以及采用relu激活函数的激活层。
118.第三处理层可以包括:第三卷积层conv3、用于对图像进行批量标准化的bn 3层、采用relu激活函数的激活层和最大值池化层(pool2)。
119.第四处理层可以包括:第四卷积层conv4、用于对图像进行批量标准化的bn 4层、第二通道注意力模块(senet2)和采用relu激活函数的激活层。
120.第五处理层可以包括:第五卷积层conv5、用于对图像进行批量标准化的bn 5层、第三通道注意力模块(senet3)、采用relu激活函数的激活层和最大值池化层(pool3)。第六处理层为过渡层;第七处理层为全连接层。
121.行人属性识别模型的训练模块430,用于将待检测行人的整体图像输入至整体图像识别模型431中进行识别,获得整体识别结果(如,待检测行人的性别、年龄、体态(如胖瘦等)等特征信息);并分别将头部区域图像输入至头部识别模型432中进行识别,获得头部识别结果(如,发型、是否佩戴眼镜、是否佩戴围巾等特征信息);将上身区域图像输入至上身区域识别模型433中进行识别,获得上身识别结果(如,上衣的款式、是否背包等特征信息);将下身区域图像输入至下身区域识别模型434中进行识别,获得下身识别结果(如,下衣的款式、携带物品等特征信息);将脚部区域图像输入至四肢区域识别模型435中进行识别,获
得四肢识别结果(如,鞋子的款式等特征信息)。
122.近一步地,行人属性识别模型的训练模块430,还可以用于基于上述获得的整体识别结果、头部识别结果、上身识别结果、下身识别结果和四肢识别结果,确定待检测行人图像中的行人属性特征。例如,该待测行人是否为某小区的户口,该待测行人是否为需要查找的人等,以细化对不同行人的区分和识别,从而提升对待测行人的识别准确性。
123.在本实施例中,通过将通道注意力模块融合至自定义卷积神经网络420中,能够获得更准确的多个不同局部区域图像对应的局部区域识别模块,准确对待测行人进行不同局部区域的识别,增强了对待测行人图像中的局部属性特征的表达能力;并结合整体图像识别模型431对待检测行人的整体图像的整体识别结果,加快对待测行人的识别效率,进一步提高对待测行人的识别准确性。
124.图6示出能够实现根据本发明实施例的图像识别方法和装置的计算设备的示例性硬件架构的结构图。
125.如图6所示,计算设备600包括输入设备601、输入接口602、中央处理器603、存储器604、输出接口605、以及输出设备606。其中,输入接口602、中央处理器603、存储器604、以及输出接口605通过总线607相互连接,输入设备601和输出设备606分别通过输入接口602和输出接口605与总线607连接,进而与计算设备600的其他组件连接。
126.具体地,输入设备601接收来自外部的输入信息,并通过输入接口602将输入信息传送到中央处理器603;中央处理器603基于存储器604中存储的计算机可执行指令对输入信息进行处理以生成输出信息,将输出信息临时或者永久地存储在存储器604中,然后通过输出接口605将输出信息传送到输出设备606;输出设备606将输出信息输出到计算设备600的外部供用户使用。
127.在一个实施例中,图6所示的计算设备可以被实现为一种电子设备,该电子设备可以包括:存储器,被配置为存储程序;处理器,被配置为运行存储器中存储的程序,以执行上述实施例描述的图像识别方法。
128.在一个实施例中,图6所示的计算设备可以被实现为一种图像识别系统,该系统可以包括:存储器,被配置为存储程序;处理器,被配置为运行存储器中存储的程序,以执行上述实施例描述的图像识别方法。
129.以上所述,仅为本技术的示例性实施例而已,并非用于限定本技术的保护范围。一般来说,本技术的多种实施例可以在硬件或专用电路、软件、逻辑或其任何组合中实现。例如,一些方面可以被实现在硬件中,而其它方面可以被实现在可以被控制器、微处理器或其它计算装置执行的固件或软件中,尽管本技术不限于此。
130.本技术的实施例可以通过移动装置的数据处理器执行计算机程序指令来实现,例如在处理器实体中,或者通过硬件,或者通过软件和硬件的组合。计算机程序指令可以是汇编指令、指令集架构(isa)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码。
131.本技术附图中的任何逻辑流程的框图可以表示程序步骤,或者可以表示相互连接的逻辑电路、模块和功能,或者可以表示程序步骤与逻辑电路、模块和功能的组合。计算机程序可以存储在存储器上。存储器可以具有任何适合于本地技术环境的类型并且可以使用任何适合的数据存储技术实现,例如但不限于只读存储器(rom)、随机访问存储器(ram)、光
存储器装置和系统(数码多功能光碟dvd或cd光盘)等。计算机可读介质可以包括非瞬时性存储介质。数据处理器可以是任何适合于本地技术环境的类型,例如但不限于通用计算机、专用计算机、微处理器、数字信号处理器(dsp)、专用集成电路(asic)、可编程逻辑器件(fgpa)以及基于多核处理器架构的处理器。
132.可以理解的是,以上实施方式仅仅是为了说明本技术的原理而采用的示例性实施方式,然而本技术并不局限于此。对于本领域内的普通技术人员而言,在不脱离本技术的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本技术的保护范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献