图像识别方法、装置、电子设备及存储介质与流程

2023-02-14 14:28:00 来源：中国专利 TAG：

1.本技术涉及图像识别技术领域，尤其涉及一种图像识别方法、装置、电子设备及存储介质。

背景技术：

2.随着时代的推进，人脸检测、人头检测在日常的生活中有了越来越广泛的运用，针对于这些日常生活运用，目前针对两种检测已经有了较多的检测算法。
3.但是，当前领域中，人脸检测和人头检测都是分别通过不同的两种算法来完成的，即当前技术中，两种检测是独立完成的。进而，如若要同时进行两种检测，则由于是两种独立算法，其训练成本、计算量、计算耗时及占用空间都比较大，用户体验相对较差。

技术实现要素：

4.有鉴于此，本技术提出一种图像识别方法、装置、电子设备及存储介质。以此仅通过一个检测算法完成人脸检测及人头检测，降低训练成本、计算量、计算耗时，提升用户体验。
5.基于上述目的，本技术提供了一种图像识别方法，包括：
6.获取图像数据，基于人头检测算法对所述图像数据进行人头检测，生成包含人头图像的人头位置框；
7.通过人脸检测算法对所述人头位置框进行检测确定所述人头位置框内的人脸位置，根据所述人脸位置生成人脸位置框，其中，所述人脸位置框为包含所述人脸位置对应区域的框型结构。
8.在一些实施方式中，所述基于人头检测算法对所述图像数据进行人头检测，生成包含人头图像的人头位置框，包括：
9.对所述图像数据进行分割得到至少一个待检区域；
10.在每个所述待检区域中生成多个候选框，基于人头检测算法对所述候选框进行人头检测，确定包含人头图像的所述候选框为所述人头位置框。
11.在一些实施方式中，所述在每个所述待检区域中生成多个候选框，包括：
12.确定所述待检区域的中心位置，以所述中心位置为所述候选框的中心点生成所述候选框。
13.在一些实施方式中，所述基于人头检测算法对所述候选框进行人头检测，确定包含人头图像的所述候选框为人头位置框，包括：
14.基于所述人头检测算法计算所述候选框为所述人头位置框的可能性得分及偏移信息，根据所述可能性得分对所述候选框进行筛选，根据所述偏移信息确定筛选后的所述候选框中偏移最小的所述候选框为所述人头位置框。
15.在一些实施方式中，所述确定所述候选框为人头位置框的可能性得分及偏移信息，包括：
16.基于训练好的人头识别深度神经网络，计算所述候选框为人头位置框的交并比，根据每个所述候选框的所述交并比得到每个所述候选框的所述可能性得分，并计算所述候选框的四角到人头位置的偏移量以生成所述偏移信息。
17.在一些实施方式中，所述人头识别深度神经网络，具体为：
18.以标注有人头位置框的训练图片为基础，对深度神经网络进行训练，输入所述训练图片及所述训练图片对应的训练框，输出识别后所述交并比不小于设定阈值的所述训练框，将训练后的所述深度神经网络作为所述人头识别深度神经网络。
19.在一些实施方式中，所述通过人脸检测算法对所述人头位置框进行检测确定所述人头位置框内的人脸位置，包括：
20.根据人脸关键点检测算法对所述人头位置框内的图像进行人脸关键点识别，确定所述人脸位置。
21.在一些实施方式中，所述根据所述人脸位置生成人脸位置框，包括：
22.根据所述人脸位置确定外接框体，确定所述外接框体的四角到所述人头位置框中心位置的偏移值，根据所述偏移值生成所述人脸位置框。
23.在一些实施方式中，所述获取图像数据之后，还包括：
24.对所述图像数据的尺寸进行归一化处理。
25.基于同一构思，本技术还提供了一种图像识别装置，包括：
26.人头确定模块，用于获取图像数据，基于人头检测算法对所述图像数据进行人头检测，生成包含人头图像的人头位置框；
27.人脸确定模块，用于通过人脸检测算法对所述人头位置框进行检测确定所述人头位置框内的人脸位置，根据所述人脸位置生成人脸位置框，其中，所述人脸位置框为包含所述人脸位置对应区域的框型结构。
28.基于同一构思，本技术还提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上任一项所述的方法。
29.基于同一构思，本技术还提供了一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令用于使所述计算机实现如上任一项所述的方法。
30.从上面所述可以看出，本技术提供的一种图像识别方法、装置、电子设备及存储介质，包括：获取图像数据，基于人头检测算法对所述图像数据进行人头检测，生成包含人头图像的人头位置框；通过人脸检测算法对所述人头位置框进行检测确定所述人头位置框内的人脸位置，根据所述人脸位置生成人脸位置框，其中，所述人脸位置框为包含所述人脸位置对应区域的框型结构。本技术通过将人头检测和人脸检测看成是一个单阶段检测算法，在完成人头检测之后，直接对人头检测出的人头位置框内的图像进行人脸检测进而快速输出人脸检测结果，以此来降低人脸检测的训练难度、计算量及计算耗时，并最终降低了任务的内存占用空间，提升了用户体验。
附图说明
31.为了更清楚地说明本技术实施例或相关技术中的技术方案，下面将对实施例或相
关技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
32.图1为本技术实施例提出的一种图像识别方法的流程示意图；
33.图2为本技术实施例提出的一种具体的人头人脸检测网络结构的结构示意图；
34.图3为本技术实施例提出的一种图像识别装置的结构示意图；
35.图4为本技术实施例提出的电子设备结构示意图。
具体实施方式
36.为使本说明书的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本说明书进一步详细说明。
37.需要说明的是，除非另外定义，本技术实施例使用的技术术语或者科学术语应当为本技术所属领域内具有一般技能的人士所理解的通常意义。本技术实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性，而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件、物件或者方法步骤涵盖出现在该词后面列举的元件、物件或者方法步骤及其等同，而不排除其他元件、物件或者方法步骤。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接，而是可以包括电性的连接，不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系，当被描述对象的绝对位置改变后，则该相对位置关系也可能相应地改变。
38.如背景技术部分所述，目前通常将人脸、人头检测视为两个独立的任务，利用两个独立的深度神经网络分别完成。目前的技术方案中没有特别针对人头检测的技术方案，通常是将人头检测视为特殊的人脸检测任务，通过标注人头数据送给网络训练来得到人头检测网络。可以看出当前方案有以下问题：1)训练难度大。由于检测网络参数配置相对复杂，而两个独立的检测任务又需要不同的参数调整，训练难度和时间都大大增加。2)计算量大，耗时高。假设一个检测网络的计算量为g，耗时为t，则两个检测网络任务的计算量为2g，耗时为2t。3)任务占用空间大，硬件成本高。假设一个检测网络任务的内存占用为m，则两个检测网络任务的计算量为2m，大大增加了硬件的成本。
39.结合上述实际情况，本技术实施例提出了一种图像识别方案，通过将人头检测和人脸检测看成是一个单阶段检测算法，在完成人头检测之后，直接对人头检测出的框体进行人脸检测以此来输出人脸检测结果，以此来降低人脸检测的训练难度、计算量及计算耗时，并以此降低了任务的内存占用空间，提升了用户体验。
40.如图1所示，为本技术提出的一种图像识别方法的流程示意图，具体包括：
41.步骤101，获取图像数据，基于人头检测算法对所述图像数据进行人头检测，生成包含人头图像的人头位置框。
42.在本步骤中，图像数据可以理解为图片数据或视频数据中的一帧数据等等，其获取的方式可以是通过网络进行获取，或者通过摄像头等图像捕捉设备捕捉得到。
43.之后利用人头检测算法对图像数据进行人头检测。其中，人头检测算法(head detector)其核心为通过深度神经网络，通过大量标注人头位置的训练图片进行训练，以训练后的模型对待检测的图像数据进行检测，即可输出待检测的图像数据中的人头位置，一
般可以将人头位置框选出来生成人头位置框，或是以其他颜色覆盖检测出的人头区域等等，以此来确定图像数据中的人头位置。常见的人头检测算法例如matlab算法、yolo-oflstm算法等等，利用这些算法可以对图像数据进行快速检测，确定出其中的人头位置，之后可以基于该人头位置，生成一个包含人头图像的人头位置框。
44.另外，在一些实施例中，在获取到图像数据之后还可以先进行图像大小的统一，以方便之后对图像进行统一处理。
45.步骤102，通过人脸检测算法对所述人头位置框进行检测确定所述人头位置框内的人脸位置，根据所述人脸位置生成人脸位置框，其中，所述人脸位置框为包含所述人脸位置对应区域的框型结构。
46.在本步骤中，根据步骤101确定出人头位置框后，一般的一个人头位置框中的会对应一个脸部图像，进而可以在人头位置框中对图像继续进行人脸识别，人脸识别的算法有很多种，例如人脸关键点检测算法、整幅人脸图像的识别算法等等。由于人头位置框已经对人头部特征进行了框定，进而利用人脸算法进行较少计算即可得到人头位置框内的人脸位置。确定了人脸位置之后，可以对人脸位置处进行框定，例如通过确定人脸位置的四个角，以此围成的区域即为人脸位置区域，或是确定人脸位置的外接矩形(或称为框型结构)，该外接矩形即为人脸位置区域等等。之后，由于人头位置框的位置信息或坐标信息已经确定，从而可以根据人头位置框的位置信息或坐标信息计算出人脸位置区域(即人脸位置框)的偏移量，计算方式例如：人脸位置框左上角的角坐标为(xt，yt)则它相对第k个人头位置框(即与该人脸位置框对应的人头位置框)的中心点坐标为(xk，yk)的偏移量为(xk-xt，yk-yt)。以此最终可得到一个人脸位置框，通过人脸位置框框定出人脸位置。
47.最后，在生成人头位置框及人脸位置框之后，可以对人头位置框及人脸位置框进行输出操作。其可以用以存储、展示、使用或再加工人头位置框及人脸位置框。根据不同的应用场景和实施需要，具体的对于人头位置框及人脸位置框的输出方式可以灵活选择。
48.例如，对于本实施例的方法在单一设备上执行的应用场景，可以将人头位置框及人脸位置框直接在当前设备的显示部件(显示器、投影仪等)上以显示的方式输出，使得当前设备的操作者能够从显示部件上直接看到人头位置框及人脸位置框的内容。
49.又如，对于本实施例的方法在多个设备组成的系统上执行的应用场景，可以将人头位置框及人脸位置框通过任意的数据通信方式(有线连接、nfc、蓝牙、wifi、蜂窝移动网络等)发送至系统内的其他作为接收方的预设设备上，即同步终端上，以使得同步终端可以对其进行后续处理。可选的，该同步终端可以是预设的服务器，服务器一般设置在云端，作为数据的处理和存储中心，其能够对人头位置框及人脸位置框进行存储和分发；其中，分发的接收方是终端设备，该些终端设备的持有者或操作者可以是图像提供用户、图像监管人员、图像存储人员等等。
50.再如，对于本实施例的方法在多个设备组成的系统上执行的应用场景时，可以将人头位置框及人脸位置框通过任意的数据通信方式直接发送至预设的终端设备，终端设备可以是前述段落列举中的一种或多种。
51.在具体实施例中，如图2所示，本实施例将人头检测算法与人脸检测算法进行结合，针对生成的深度神经网络，通过大量同时标注人头位置和人脸位置的训练图片进行训练，以通过训练完的该网络确定人头框位置和人脸框位置。在获取到原始图片(图像数据)
之后，可以先对原始图片进行预处理，其过程可以是先对原始图片的尺寸进行统一等方便后续神经网络快速计算的步骤。之后，利用人头检测网络对原始图片进行人头检测，其检测过程一般需要进行骨干网络、肩部网络、头部网络进行人体划分，之后利用人头检测网络输出的人头框得分及人头框预测，确定出人头框(人头位置框)的位置。之后再利用确定出的人头框，对人头框内的图像进行人脸关键点预测，从而在人头框中，确定出人脸框(人脸位置框)。最后，输出人头框位置(坐标)及人脸框位置(坐标)，当然在输出之前还可以进行诸如去重等后处理。在具体实施例中，根据图像数据可以生成一个二维坐标系，针对图像以“n*n”大小分割出m块区域，每块区域的中心点坐标为(xm，ym)，以(xm，ym)为中心点，生成不同的大小和长宽比的矩形，得到大量的候选框，利用训练完的网络会根据真实数据学到每个候选框是真实人头框的可能性得分和真实人头框和候选框的坐标偏移(即偏移信息)，即可得到预测的人头位置框坐标。之后在此基础上，添加人脸关键点检测算法的检测分支，即人头检测算法的深度学习网络结构不变，只在最后增加一个人脸检测分支，输入人头位置框，输出人头位置框中心相对人脸位置框四个角点的偏移，即假设人脸位置框左上角的角坐标为(xt，yt)则它相对第k个人头位置框的中心点坐标为(xk，yk)的偏移量为(xk-xt，yk-yt)。即可得到人脸框角点坐标。以此利用本实施例，大大减少了人脸检测任务的网络计算量和内存占用量。即检测网络的计算量为g，耗时为t，则有单阶段的的计算量为g≈g，耗时为t≈t，可推出g《《2g、t《《2t。因此采用该方法的人头人脸检测任务相比于前述的现有方案，大幅的提升了网络速度，降低了硬件成本。
52.从上面所述可以看出，本技术实施例的一种图像识别方法，包括：获取图像数据，基于人头检测算法对所述图像数据进行人头检测，生成包含人头图像的人头位置框；通过人脸检测算法对所述人头位置框进行检测确定所述人头位置框内的人脸位置，根据所述人脸位置生成人脸位置框，其中，所述人脸位置框为包含所述人脸位置对应区域的框型结构。本技术通过将人头检测和人脸检测看成是一个单阶段检测算法，在完成人头检测之后，直接对人头检测出的人头位置框内的图像进行人脸检测进而快速输出人脸检测结果，以此来降低人脸检测的训练难度、计算量及计算耗时，并最终降低了任务的内存占用空间，提升了用户体验。
53.需要说明的是，本技术实施例的方法可以由单个设备执行，例如一台计算机或服务器等。本技术实施例的方法也可以应用于分布式场景下，由多台设备相互配合来完成。在这种分布式场景的情况下，这多台设备中的一台设备可以只执行本技术实施例的方法中的某一个或多个步骤，这多台设备相互之间会进行交互以完成所述的方法。
54.需要说明的是，上述对本技术特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于上述实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。
55.在一个可选的示例性实施例中，所述基于人头检测算法对所述图像数据进行人头检测，生成包含人头图像的人头位置框，包括：对所述图像数据进行分割得到至少一个待检区域；在每个所述待检区域中生成多个候选框，基于人头检测算法对所述候选框进行人头检测，确定包含人头图像的所述候选框为所述人头位置框。
56.在本实施例中，为了减少每次计算的计算量，可以先对图像数据进行分割，其分割的方式可以是进行均分，例如以“n*n”大小进行分割，分割出m块正方形区域，当然也可以以一段距离为宽分割成多块长条形区域等等。另外可以根据具体的应用场景进行具体的分割。以此生成多个待检区域。
57.之后，针对一个待检区域，可以先在这个待检区域中生成多个候选框，这里的候选框一般可以为直角四边形，例如矩形、正方形，当然根据具体的应用场景，其还可以是圆形、椭圆形等等。之后这些候选框的大小、长宽比等属性可以任意设置，只要不超出待检区域的范围即可，候选框与候选框之间也可以重叠。以此方式可以得到大量的候选框。之后基于这些候选框即可进行人头位置框的确定，人头位置框即为框定出人头位置图像的框体或框型结构。在本实施例中，可以利用人头检测算法(head detector)对候选框进行人头检测。从而在众多候选框中选出最可能为人头位置框的候选框并确定其位置，最终确定这个或这些通过人头检测的候选框为人头位置框。
58.在一个可选的示例性实施例中，所述在每个所述待检区域中生成多个候选框，包括：确定所述待检区域的中心位置，以所述中心位置为所述候选框的中心点生成所述候选框。以此快速方便的生成多个候选框。
59.在本实施例中，可以以图像数据为基础建立一个二维坐标系，进而每个图像数据中的每个点都有一个坐标对应。之后确定每个待检区域的中心坐标，并以该中心坐标为每个候选框的中心点，以此生成多个候选框，以此可以快速生成多个候选框，同时这些候选框的位置坐标根据中心点坐标也较容易确定。
60.在一个可选的示例性实施例中，所述基于人头检测算法对所述候选框进行人头检测，确定包含人头图像的所述候选框为人头位置框，包括：基于所述人头检测算法计算所述候选框为所述人头位置框的可能性得分及偏移信息，根据所述可能性得分对所述候选框进行筛选，根据所述偏移信息确定筛选后的所述候选框中偏移最小的所述候选框为所述人头位置框。
61.在本实施例中，可以利用人头检测算法进行人头位置的检测，其核心为通过深度神经网络，通过大量标注人头位置的训练图片进行训练，即可输出当前候选框为人头位置框的可能性得分及坐标偏移。其中，可能性得分为当前候选框可能为人头位置框的得分，可能性得分根据候选框与人头位置的交并比得到，交并比越高可能性得分越高，以此可以选取可能性得分超过一定阈值的候选框为人头位置框的候选；偏移信息为当前候选框距离人头位置的偏移量，以矩形框为例，根据前述人头检测算法的神经网络技术可以画出一个人头位置的大概框体，从而当前候选框的四个角的坐标到这个框体对应角之间的差值即为偏移量。进而通过可能性得分可以确定出哪些候选框与人头位置更为接近，之后再确定出这些候选框的偏移量中偏移最小的候选框，将其最终确定为人头位置框。
62.在一些实施例中，在根据可能性得分得到一批候选框后，可以先对这些候选框之间的交并比进行计算，如若两个候选框之间的交并比过高，说明这两个候选框重叠区域较大，对应的可能是同一个人头，从而可以在这两个候选框中只保留一个，例如保留与人头区域交并比较大的一个。
63.在一个可选的示例性实施例中，所述确定所述候选框为人头位置框的可能性得分及偏移信息，包括：基于训练好的人头识别深度神经网络，计算所述候选框为人头位置框的
交并比，根据每个所述候选框的所述交并比得到每个所述候选框的所述可能性得分，并计算所述候选框的四角到人头位置的偏移量以生成所述偏移信息。
64.在本实施例中，一般的可以利用人头检测算法(head detector)进行检测，其核心为通过深度神经网络，通过大量标注人头位置的训练图片进行训练，即可输出当前候选框为人头位置框的可能性得分及坐标偏移，即训练好的人头识别深度神经网络。交并比(intersection-over-union，iou)，目标检测中使用的一个概念，是产生的候选框(candidate bound)与原标记框(ground truth bound)的交叠率，即它们的交集与并集的比值。最理想情况是完全重叠，即比值为1。其中，可能性得分可以根据候选框与人头位置的交并比得到，交并比越高可能性得分越高，以此可以选取可能性得分超过一定阈值的候选框为人头位置框的候选。之后，根据前述人头检测算法的神经网络技术可以画出一个人头位置的大概框体，从而当前候选框的四个角的坐标到这个框体对应角之间的差值即为偏移量，从而得到偏移信息。
65.在一个可选的示例性实施例中，所述人头识别深度神经网络，具体为：以标注有人头位置框的训练图片为基础，对深度神经网络进行训练，输入所述训练图片及所述训练图片对应的训练框，输出识别后所述交并比不小于设定阈值的所述训练框，将训练后的所述深度神经网络作为所述人头识别深度神经网络。
66.在本实施例中，人头识别深度神经网络可以为人头检测算法(head detector)。深度神经网络即深度学习网络，深度学习是学习样本数据的内在规律和表示层次，这些学习过程中获得的信息对诸如文字，图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力，能够识别文字、图像和声音等数据。最终，将训练后的深度神经网络作为人头识别深度神经网络。之后，训练框与候选框相类似，为针对训练图片的候选框，用于训练该神经网络。设定阈值可以根据具体应用场景进行具体设置。
67.在一个可选的示例性实施例中，所述通过人脸检测算法对所述人头位置框进行检测确定所述人头位置框内的人脸位置，包括：根据人脸关键点检测算法对所述人头位置框内的图像进行人脸关键点识别，确定所述人脸位置。
68.在本实施例中，人脸关键点检测算法，例如一种实用的人脸标志检测算法(practical facial landmark detector，pfld)，人脸关键点检测是诸如人脸识别、表情分析、三维人脸重建等其他人脸相关任务的基础。在人脸识别技术中是人脸检测的下一步任务。人脸关键点检测是指给定人脸图像，定位出人脸面部的关键点，包括眉毛、眼睛、鼻子、嘴、脸部轮廓区域的点。通过该算法可以快速确定人脸中的各个关键点，进而确定出对应的人脸位置。
69.在一个可选的示例性实施例中，所述根据所述人脸位置生成人脸位置框，包括：根据所述人脸位置确定外接框体，确定所述外接框体的四角到所述人头位置框中心位置的偏移值，根据所述偏移值生成所述人脸位置框。
70.在本实施例中，以图像数据为基础可以生成一个二维坐标系，从而为图像数据中的每一个点赋予一个坐标值。之后，假设确定出的外接框体的左上角的角坐标为(xt，yt)则它相对第k个人头位置框(即与该人脸位置框对应的人头位置框)的中心点坐标为(xk，yk)的偏移量为(xk-xt，yk-yt)。通过该偏移值及人头位置框即可确定出人脸位置框。
71.在一个可选的示例性实施例中，所述获取图像数据之后，还包括：对所述图像数据
的尺寸进行归一化处理。以此对图像数据的尺寸进行统一，从而方便对大量图像数据进行快速识别。
72.在本实施例中，由于获取到的图像数据本身格式、分辨率、数据大小等等都不尽相同，进而为了快速进行图像识别，可以在得到图像数据之后，对图像数据进行统一的归一化处理，即统一图像数据的格式、分辨率等等，使进行后续处理的图像数据的大小尽量一样，以此方便之后步骤的计算处理等过程。
73.基于同一构思，与上述任意实施例方法相对应的，本技术还提供了一种图像识别装置。
74.参考图3，所述图像识别装置，包括：
75.人头确定模块210，用于获取图像数据，基于人头检测算法对所述图像数据进行人头检测，生成包含人头图像的人头位置框。
76.人脸确定模块220，用于通过人脸检测算法对所述人头位置框进行检测确定所述人头位置框内的人脸位置，根据所述人脸位置生成人脸位置框，其中，所述人脸位置框为包含所述人脸位置对应区域的框型结构。
77.为了描述的方便，描述以上装置时以功能分为各种模块分别描述。当然，在实施本技术实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现。
78.上述实施例的装置用于实现前述实施例中相应的图像识别方法，并且具有相应的方法实施例的有益效果，在此不再赘述。
79.在一个可选的示例性实施例中，所述人头确定模块210，还用于：
80.对所述图像数据进行分割得到至少一个待检区域；
81.在每个所述待检区域中生成多个候选框，基于人头检测算法对所述候选框进行人头检测，确定包含人头图像的所述候选框为所述人头位置框。
82.在一个可选的示例性实施例中，所述人头确定模块210，还用于：
83.确定所述待检区域的中心位置，以所述中心位置为所述候选框的中心点生成所述候选框。
84.在一个可选的示例性实施例中，所述人头确定模块210，还用于：
85.基于所述人头检测算法计算所述候选框为所述人头位置框的可能性得分及偏移信息，根据所述可能性得分对所述候选框进行筛选，根据所述偏移信息确定筛选后的所述候选框中偏移最小的所述候选框为所述人头位置框。
86.在一个可选的示例性实施例中，所述人头确定模块210，还用于：
87.基于训练好的人头识别深度神经网络，计算所述候选框为人头位置框的交并比，根据每个所述候选框的所述交并比得到每个所述候选框的所述可能性得分，并计算所述候选框的四角到人头位置的偏移量以生成所述偏移信息。
88.在一个可选的示例性实施例中，所述人头识别深度神经网络，具体为：
89.以标注有人头位置框的训练图片为基础，对深度神经网络进行训练，输入所述训练图片及所述训练图片对应的训练框，输出识别后所述交并比不小于设定阈值的所述训练框，将训练后的所述深度神经网络作为所述人头识别深度神经网络。
90.在一个可选的示例性实施例中，所述人脸确定模块220，还用于：
91.根据人脸关键点检测算法对所述人头位置框内的图像进行人脸关键点识别，确定
所述人脸位置。
92.在一个可选的示例性实施例中，所述人脸确定模块220，还用于：
93.根据所述人脸位置确定外接框体，确定所述外接框体的四角到所述人头位置框中心位置的偏移值，根据所述偏移值生成所述人脸位置框。
94.在一个可选的示例性实施例中，所述人头确定模块210，还用于：
95.对所述图像数据的尺寸进行归一化处理。
96.基于同一构思，与上述任意实施例方法相对应的，本技术还提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上任意一实施例所述的图像识别方法。
97.图4示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图，该设备可以包括：处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
98.处理器1010可以采用通用的cpu(central processing unit，中央处理器)、微处理器、应用专用集成电路(application specific integrated circuit，asic)、或者一个或多个集成电路等方式实现，用于执行相关程序，以实现本说明书实施例所提供的技术方案。
99.存储器1020可以采用rom(read only memory，只读存储器)、ram(random access memory，随机存取存储器)、静态存储设备，动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序，在通过软件或者固件来实现本说明书实施例所提供的技术方案时，相关的程序代码保存在存储器1020中，并由处理器1010来调用执行。
100.输入/输出接口1030用于连接输入/输出模块，以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出)，也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等，输出设备可以包括显示器、扬声器、振动器、指示灯等。
101.通信接口1040用于连接通信模块(图中未示出)，以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如usb、网线等)实现通信，也可以通过无线方式(例如移动网络、wifi、蓝牙等)实现通信。
102.总线1050包括一通路，在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
103.需要说明的是，尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050，但是在具体实施过程中，该设备还可以包括实现正常运行所必需的其他组件。此外，本领域的技术人员可以理解的是，上述设备中也可以仅包含实现本说明书实施例方案所必需的组件，而不必包含图中所示的全部组件。
104.上述实施例的电子设备用于实现前述任一实施例中相应的图像识别方法，并且具有相应的方法实施例的有益效果，在此不再赘述。
105.基于同一构思，与上述任意实施例方法相对应的，本技术还提供了一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令用于使所述计算机执行如上任一实施例所述的图像识别方法。
106.本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。
107.上述实施例的存储介质存储的计算机指令用于使所述计算机执行如上任一实施例所述的图像识别方法，并且具有相应的方法实施例的有益效果，在此不再赘述。
108.所属领域的普通技术人员应当理解：以上任何实施例的讨论仅为示例性的，并非旨在暗示本技术的范围(包括权利要求)被限于这些例子；在本技术的思路下，以上实施例或者不同实施例中的技术特征之间也可以进行组合，步骤可以以任意顺序实现，并存在如上所述的本技术实施例的不同方面的许多其它变化，为了简明它们没有在细节中提供。
109.另外，为简化说明和讨论，并且为了不会使本技术实施例难以理解，在所提供的附图中可以示出或可以不示出与集成电路(ic)芯片和其它部件的公知的电源/接地连接。此外，可以以框图的形式示出装置，以便避免使本技术实施例难以理解，并且这也考虑了以下事实，即关于这些框图装置的实施方式的细节是高度取决于将要实施本技术实施例的平台的(即，这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如，电路)以描述本技术的示例性实施例的情况下，对本领域技术人员来说显而易见的是，可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本技术实施例。因此，这些描述应被认为是说明性的而不是限制性的。
110.尽管已经结合了本技术的具体实施例对本技术进行了描述，但是根据前面的描述，这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如，其它存储器架构(例如，动态ram(dram))可以使用所讨论的实施例。
111.本技术实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此，凡在本技术实施例的精神和原则之内，所做的任何省略、修改、等同替换、改进等，均应包含在本技术的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：数据中心需求响应优化方法、装置、设备及存储介质

图像识别方法、装置、电子设备及存储介质与流程

相关文献

最热文献