图像识别方法、装置、设备及可读存储介质与流程

2022-08-17 10:40:15 来源：中国专利 TAG：

1.本技术涉及图像识别技术领域，特别涉及图像识别方法、装置、设备及可读存储介质。

背景技术：

2.图像识别方法广泛应用于智慧交通等场景中。但是在严苛条件下，图像识别系统的识别能力会大大降低。
3.但是，相关技术都只针对某一个问题做了优化，场景适应性差，并且泛化效果普遍不佳、识别准确率不高。

技术实现要素：

4.本技术提出一种图像识别方法、装置、设备及可读存储介质，可以解决相关技术提供的问题。
5.第一方面，提供了一种图像识别方法，该方法首先获取待识别的目标对象出现的至少一个时空信息，再在图像库中获取与至少一个时空信息匹配的多张备选图像，其中，该图像库中包括多个对象被拍摄的图像；之后，将多张备选图像按图像中的对象特征进行聚类，根据聚类结果在多张备选图像中获得目标对象的图像。
6.通过获取目标对象出现的时空信息，在图像库中提取与该时空信息匹配的多张备选图像。由于获取的备选图像由目标对象出现的时空信息所确定，因此这些备选图像有较大可能是目标对象的图像。
7.进一步的，根据多张备选图像的聚类结果识别出目标对象的图像。通过聚类的方式可以进一步对备选图像进行筛选，从而得到最可能是目标对象的图像。例如，选择拥有对象特征 (每个对象特征对应一个图像)数量最多的类，把这个类中的对象特征所对应的图像认定为就是目标对象的图像。
8.以目标对象是对象为例，本实施例提供的方法能够提高图像识别的准确率。
9.在一种可能的实现方式中，所述获取待识别的目标对象出现的至少一个时空信息，包括：获取所述目标对象的通信标识信息，所述通信标识信息包括所述目标对象的通信号码、国际移动设备识别码和具有定位功能的设备识别码中的至少一种；根据所述通信标识信息对所述目标对象进行定位，根据定位结果获取所述目标对象出现的至少一个时空信息。
10.通过目标对象的通信标识信息对目标对象进行定位，定位方式更精确，并且获取到的时空信息更加能反映目标对象的运动路线，使得识别图像的准确率更高。
11.在一种可能的实现方式中，所述至少一个时空信息中的任一时空信息包括所述目标对象出现的位置信息和所述目标对象出现的时间点信息；所述在图像库中获取与所述至少一个时空信息匹配的多张备选图像，包括：对于所述至少一个时空信息中的任一时空信息，确定在所述任一时空信息中的位置信息对应的位置处布局的摄像机，所述摄像机用于
抓拍所述位置信息对应的位置处的图像；根据所述任一时空信息中的时间点信息，在所述图像库中提取所述摄像机在所述时间点信息对应的时间范围内抓拍的多张图像，将提取出的图像作为备选图像。
12.通过提取根据时空信息确定的摄像机在对应时间范围内抓拍的图像作为备选图像，使得备选图像的范围更为精确，缩小了图像的查找范围，确保了识别出的图像的准确性。
13.在一种可能的实现方式中，所述将所述多张备选图像按图像中的对象特征进行聚类，根据聚类结果在所述多张备选图像中获得所述目标对象的图像，包括：提取所述多张备选图像中的每一张备选图像的对象特征，得到由所述对象特征组成的对象特征集合；对所述对象特征集合进行聚类，得到多个对象特征的聚类结果，将所述聚类结果中满足条件的类对应的图像作为所述目标对象的图像。
14.在一种可能的实现方式中，所述聚类结果中满足条件的类为所述聚类结果中包含对象特征的数量最多的类。
15.通过聚类的方法由多张备选图像中识别目标对象的图像，无需根据目标对象的具体特征进行识别，能够提高场景的适应性，泛化效果更佳，提升了图像识别的准确率。
16.在一种可能的实现方式中，所述将所述多张备选图像按图像中的对象特征进行聚类，根据聚类结果在所述多张备选图像中获得所述目标对象的图像之后，所述方法还包括：响应于对象数据库中包括有所述目标对象的历史图像，提取所述历史图像的对象特征；将所述历史图像的对象特征与识别出的图像的对象特征进行比对；响应于所述历史图像的对象特征与识别出的图像的对象特征匹配，根据所述识别出的图像更新所述对象数据库中的所述目标对象的历史图像。
17.通过对对象数据库的更新，能够对于特定目标的寻找提供帮助，同时有助于提高后续图像识别的准确性与高效性。
18.第二方面，提供了一种图像识别装置，该装置包括：
19.第一获取模块，用于获取待识别的目标对象出现的至少一个时空信息；
20.第二获取模块，用于在图像库中获取与至少一个时空信息匹配的多张备选图像，其中，图像库中包括多张图像，该多张图像中的任一图像为一个或多个对象被拍摄的图像；
21.聚类模块，用于将所述多张备选图像按图像中的对象特征进行聚类，根据聚类结果在所述多张备选图像获得所述目标对象的图像。
22.在一种可能的实现方式中，所述第一获取模块，用于获取所述目标对象的通信标识信息，所述通信标识信息包括所述目标对象的通信号码、国际移动设备识别码和具有定位功能的设备识别码中的至少一种；根据所述通信标识信息对所述目标对象进行定位，根据定位结果获取所述目标对象出现的至少一个时空信息。
23.在一种可能的实现方式中，所述至少一个时空信息中的任一时空信息包括所述目标对象出现的位置信息和所述目标对象出现的时间点信息；
24.所述第二获取模块，用于对于所述至少一个时空信息中的任一时空信息，确定在所述任一时空信息中的位置信息对应的位置处布局的摄像机，所述摄像机用于抓拍所述位置信息对应的位置处的图像；根据所述任一时空信息中的时间点信息，在所述图像库中提取所述摄像机在所述时间点信息对应的时间范围内抓拍的多张图像，将提取出的图像作为
备选图像。
25.在一种可能的实现方式中，所述聚类模块，用于提取所述多张备选图像中的每一张备选图像的对象特征，得到由所述对象特征组成的对象特征集合；对所述对象特征集合进行聚类，得到多个对象特征的聚类结果，将所述聚类结果中满足条件的类对应的图像作为所述目标对象的图像。
26.在一种可能的实现方式中，所述聚类结果中满足条件的类为所述聚类结果中包含对象特征的数量最多的类。
27.在一种可能的实现方式中，所述装置还包括：
28.提取模块，用于响应于对象数据库中包括有所述目标对象的历史图像，提取所述历史图像的对象特征；
29.比对模块，用于将所述历史图像的对象特征与识别出的图像的对象特征进行比对；
30.更新模块，用于响应于所述历史图像的对象特征与识别出的图像的对象特征匹配，根据所述识别出的图像更新所述对象数据库中的所述目标对象的历史图像。
31.其中，第二方面或第二方面的任一种可能的实现方式所具备的技术效果可以参见第一方面或第一方面的任一种可能的实现方式所具备的技术效果，此处不再进行赘述。
32.第三方面，提供了一种图像识别设备，该设备包括：对外接口、存储器和处理器。其中，该对外接口、该存储器和该处理器通过内部连接通路互相通信，该存储器用于存储指令，该处理器用于执行该存储器存储的指令，对外接口用于接收目标对象出现的至少一个时空信息并且当该处理器执行该存储器存储的指令时，使得该处理器执行第一方面或第一方面的任一种可能的实施方式中的方法。
33.可选地，处理器为一个或多个，存储器为一个或多个。
34.可选地，存储器可以与处理器集成在一起，或者存储器与处理器分离设置。
35.在具体实现过程中，存储器可以为非瞬时性(non-transitory)存储器，例如只读存储器 (read only memory，rom)，其可以与处理器集成在同一块芯片上，也可以分别设置在不同的芯片上，本技术对存储器的类型以及存储器与处理器的设置方式不做限定。
36.第四方面，提供了一种图像识别设备，该图像识别设备包括：处理器，所述处理器与存储器耦合，所述存储器中存储有至少一条程序指令或代码，所述至少一条程序指令或代码由所述处理器加载并执行，以使所述图像识别设备实现第一方面任一所述的图像识别方法。
37.第五方面，提供了一种计算机程序(产品)，计算机程序(产品)包括：计算机程序代码，当计算机程序代码被计算机运行时，使得计算机执行上述各方面中的方法。
38.第六方面，提供了一种计算机可读存储介质，计算机可读存储介质存储程序或指令，当程序或指令在计算机上运行时，上述各方面中的方法被执行。
39.第七方面，提供了一种芯片，包括处理器，用于从存储器中调用并运行存储器中存储的指令，使得安装有芯片的通信设备执行上述各方面中的方法。
40.第八方面，提供另一种芯片(或者芯片的组合)，包括：输入接口、输出接口、处理器和存储器，输入接口、输出接口、处理器以及存储器之间通过内部连接通路相连，处理器用于执行存储器中的代码，当代码被执行时，处理器用于执行上述各方面中的方法。
附图说明
41.图1为本技术实施例提供的一种图像识别方法的实施环境的示意图；
42.图2为本技术实施例提供的一种图像识别方法的流程图；
43.图3为本技术实施例提供的一种图像识别方法的过程示意图；
44.图4为本技术实施例提供的一种图像识别装置的结构示意图；
45.图5为本技术实施例提供的一种图像识别装置的结构示意图；
46.图6为本技术实施例提供的一种图像识别设备的结构示意图。
具体实施方式
47.下面将结合附图对本技术实施方式作进一步地详细描述。
48.本技术实施例提供了一种图像识别方法，该方法可应用于图1所示的实施环境中。如图 1所示，该实施环境中包括摄像机10、终端20以及服务器30。其中，摄像机10包括球型、筒型等摄像机，用于不断地执行抓拍操作，得到多个目标对象的采集图像。可选地，摄像机 10得到采集图像之后，可以将该采集图像发送给终端20或服务器30进行存储。
49.终端20为具有图像识别功能的终端，比如，终端20可以是智能手机、平板电脑、电子书阅读器、智能眼镜、智能手表、智能电视、智能车载设备、膝上型便携计算机和台式计算机等。
50.服务器30可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network，cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。
51.可选地，该实施环境中包括多个摄像机10、一个或者多个终端20以及一个或者多个服务器30。本技术实施例对于摄像机10、终端20和服务器30的个数不做限制。
52.摄像机10、终端20与服务器30可以通过通信网络相连。可选地，通信网络是有线网络或无线网络。
53.可选地，无线网络或有线网络使用标准通信技术和/或协议。网络通常为因特网、但也可以是任何网络，包括但不限于局域网(local area network，lan)、城域网(metropolitan areanetwork，man)、广域网(wide area network，wan)、移动、有线或者无线网络、专用网络或者虚拟专用网络的任何组合。在一些实施例中，使用包括超文本标记语言(hypertextmark-uplanguage，html)、可扩展标记语言(extensible markup language，xml)等的技术和/或格式来代表通过网络交换的数据。此外，还可以使用定制和/或专用数据通信技术取代或者补充上述数据通信技术。本技术在此不做限制。
54.结合图1所示的实施环境，以终端执行该方法为例，对本技术实施例提供的图像识别方法进行说明。参见图2，该方法包括如下步骤201-步骤203。除了终端之外，该识别方法也可以由服务器执行。
55.步骤201，获取待识别的目标对象出现的至少一个时空信息。
56.示例性地，时空信息包括位置信息和时间信息。时间信息可以是时间点或者时间范围，以时间点为例，该位置信息和该时间点信息是一一对应的关系，也就是说，任一个位置信息都对应一个时间点信息，代表目标对象可能在该时间点出现在该位置。
57.例如，获取到待识别的目标对象的4个时空信息为：位置信息(路口a、路口b、路口 c、路口d)，时间点信息(1月1日10：00、1月1日11：00、1月1日12：00、1月1日 13：00)，代表目标对象在1月1日10：00时刻出现在路口a的位置，目标对象在1月1 日11：00时刻出现在路口b的位置，目标对象在1月1日12：00时刻出现在路口c的位置，目标对象在1月1日13：00时刻出现在路口d的位置。
58.在一种可能的实现方式中，获取待识别的目标对象出现的至少一个时空信息，包括但不限于如下步骤2011-步骤2012。
59.步骤2011，获取目标对象的通信标识信息。
60.在一种可能的实现方式中，获取的目标对象的通信标识信息包括但不限于：目标对象的通信号码、国际移动设备识别码(international mobile equipment identity，imei)和具有定位功能的设备识别码中的至少一种。其中，通信标识信息还可以是视频识别码(radio frequencyidentification，rf id)，进场通信识别码(near field communication identification，nfc id) 等。
61.步骤2012，根据通信标识信息对目标对象进行定位，根据定位结果获取目标对象出现的至少一个时空信息。
62.在本技术实施例中，不对根据通信标识信息对目标对象进行定位，根据定位结果获取目标对象出现的至少一个时空信息的方式进行限定，包括但不限于：根据目标对象的通信标识信息和基站定位技术，获取目标对象的定位结果，根据定位结果可推测出目标对象的运动路线，根据推测出的运动路线与城市监控设备的安装情况，获取目标对象的至少一个时空信息。
63.其中，基站定位又称移动位置服务，是指基于基站与目标对象手机之间通信时差来计算目标对象位置的一种通信服务。因此，根据基站定位服务就可获取目标对象在某一时间点的位置，即得到目标对象出现的时空信息。
64.示例性地，根据基站定位技术，得到的定位结果为目标对象在1月1日9：30时刻出现在x地点，在1月1日10：10时刻出现在y地点，根据从x地点到y地点所需路程时间即可恢复目标对象的运动路线，根据恢复的目标对象的运动路线推测出目标对象在1月1日10： 00时刻出现在a地点的位置，而根据城市监控设备的安装情况可知a地点位置是布局有摄像机的位置，也就是说，a地点位置安装的摄像机记录的在1月1日10：00时刻左右的时间段内的拍摄图像中包括有目标对象的图像。由此，获取到了目标对象的一个时空信息为：位置信息(a地点)，时间点信息(1月1日10：00)。
65.除上述根据目标对象的通信标识信息和基站定位技术，获取目标对象的定位结果的方式外，还可以采用其他定位技术，本技术实施例不对采用的定位技术进行限定。
66.步骤202，在图像库中获取与至少一个时空信息匹配的多张备选图像。
67.其中，图像库中包括多张图像，该多张图像中的任一图像为一个或多个对象被拍摄的图像。例如一共有100张图像，其中10张图像中有对象a，30张图像中有对象b，40张图像中有对象c，20张图像中有对象d。在本技术实施例中，以城市监控设备采集的图像为基础，建立图像库，图像库中每张图像包括采集设备信息与时间点信息，用于指示该张图像由哪个采集设备在什么时间进行采集的。城市监控系统设备实时的或周期性对周边的环境进行图像采集，使得图像库中包括多张图像，该多张图像中的任一图像为一个或多个对象被拍
摄的图像。
68.在一种可能的实现方式中，在图像库中获取与至少一个时空信息匹配的多张备选图像，包括但不限于如下步骤2021-步骤2022。
69.步骤2021，对于至少一个时空信息中的任一时空信息，确定在任一时空信息中的位置信息对应的位置处布局的摄像机。
70.在一种可能的实现方式中，对于至少一个时空信息中的任一时空信息均包括有目标对象出现的位置信息和目标对象出现的时间点信息，任一时空信息代表目标对象在该时间点出现在该位置。因此，根据任一时空信息中的位置信息确定该位置信息对应的位置处布局的摄像机，由于该摄像机用于抓拍该位置信息对应的位置处的图像，因此确定的该摄像机抓拍的图像中包括有目标对象的图像。
71.步骤2022，根据任一时空信息中的时间点信息，在图像库中提取摄像机在时间点信息对应的时间范围内抓拍的多张图像，将提取出的图像作为备选图像。
72.在一种可能的实现方式中，在上述获取与目标对象出现的时空信息匹配的多张备选图像的过程中，通过目标对象出现的时空信息可知，目标对象在对应时间点出现在对应位置，为了保证获取的多张备选图像中包括有目标对象的图像，不只是提取图像库中该摄像机在时间点信息对应的时间点的图像，而是提取图像库中该摄像机在时间点信息对应的时间范围内抓拍的多张图像作为备选图像。其中，时间点范围的大小可以根据需求进行设定，例如，时间点范围为时间点信息的前后各十分钟的范围，若时间点信息为12：00，那么时间点范围的11： 50到12：10的范围，此时，获取对应摄像机在11：50到12：10的时间范围内的所有抓拍的图像。
73.在本技术实施例中，根据目标对象出现的任一时空信息中的位置信息，确定可能抓拍到目标对象的图像的目标摄像机，即目标对象出现的位置处布局的摄像机，根据目标对象出现的任一时空信息中的时间点信息，提取目标摄像机在对应时间点范围内的所有图像作为备选图像。对于目标对象出现的至少一个时空信息中的任一时空信息，通过上述步骤即可获取任一时空信息对应的备选图像，每一时空信息对应的备选图像的集合即为提取的多张备选图像。由于根据目标对象的时空信息获取的备选图像，因此，该多张备选图像中包括有目标对象的图像。
74.步骤203，将多张备选图像按图像中的对象特征进行聚类，根据聚类结果在多张备选图像中获得目标对象的图像。
75.在一种可能的实现方式中，将多张备选图像按图像中的对象特征进行聚类，根据聚类结果在多张备选图像中获得目标对象的图像，包括但不限于如下步骤2031-步骤2032。
76.步骤2031，提取多张备选图像中的每一张备选图像的对象特征，得到由对象特征组成的对象特征集合。
77.示例性地，相同对象的图像使用同一个标签进行标记，那么可以把这些相同对象的图像聚到同一个类中。
78.此外，还可以使用对象特征进行举例。对象特征用于区分不同的对象，不同对象的对象特征不同，相同对象的对象特征相同。对象例如是车辆以及动物。对象特征通过提取图像中对象的特征获得。此外需要说明的是，在实际应用中，可能出现不同的对象拥有相同对象特征的情况，由于仅是少数情况，因此不影响本发明实施例的实施。
79.在本技术实施例中，对象特征是对目标对象进行抽象的结果，每张包括目标对象的图像对应一个对象特征。示例性地，本技术实施例提取任一图像的方向梯度直方图(histogram oforiented gradient，hog)特征作为任一图像的对象特征，提取任一图像的hog特征的过程为：首先将任一图像进行灰度化处理，灰度化处理就是将该任一图像看作是一个包括(x，y，z) 轴的三维图像；然后，采用gamma校正法(gamma源于显示器的响应曲线，即其亮度与输入电压的非线性关系)对该图像进行颜色空间的标准化处理，该标准化处理用以调节图像的对比度，由此降低图像局部的阴影和光照变化导致的影响，同时能够抑制图像噪声的干扰；再然后，获取图像中的每个像素的梯度，其中，每个像素的梯度包括每个像素的大小和方向，该梯度能够捕获图像的轮廓信息；接下来，将图像划分成多个小的细胞单元(cells)，例如每个cell包括6*6个像素，获取每个cell的梯度直方图作为每个cell的描述符(descriptor)，再将每几个cell组成一个块(block)，例如每个block包括3*3个cell，一个block内所有cell 的特征descriptor串联起来得到该block的hog特征descriptor；最后，将图像内的所有block 的hog特征descriptor串联起来得到该任一图像的hog特征descriptor。得到的hog特征 descriptor为一个向量，即可作为该任一图像的对象特征，将多张备选图像中每一张备选图像获取的代表对象特征的向量组合到一起，即为特征集合，特征集合中的每一特征向量用来作为步骤2032中进行聚类运算的对象。
80.需要说明的是，关于提取多张备选图像中每一张备选图像的对象特征的方式，本技术实施例不加以限定，除上述方式外，也可以通过主成分分析(principal component analysis，pca) 或线性判别分析(linear discriminant analysis，lda)等其他任何一种方式提取，只要提取的特征能够代表对象抽象的结果即可。
81.步骤2032，对对象特征集合进行聚类，得到多个对象特征的聚类结果，将聚类结果中满足条件的类对应的图像作为目标对象的图像。
82.在步骤2031中，将多张备选图像中的每一张备选图像对应抽象成一个特征，得到了具有对象属性的特征集合，该特征集合大多表现为由多个大小相同的特征向量组成。因此，将对多张备选图像的处理转变为对多个特征向量的处理，也就是说，聚类运算的处理对象由矩阵形式的图像转变为向量形式的特征。特征相较于备选图像具有更少的数据量，更小的数据维度，减小了数据处理的复杂度。此外，特征更少的数据量代表了备选图像更为主要的关键特征，在基于区别特征的聚类运算中增加了聚类结果的准确度。
83.在一种可能的实现方式中，聚类结果中满足条件的类为聚类结果中包含对象特征的数量最多的类。以对象特征为对象的特征为例，对特征集合进行聚类，得到多个特征的聚类结果，将聚类结果中满足条件的类对应的图像作为目标对象的图像，包括：对特征集合进行聚类，得到多个特征的聚类结果，将多个特征的聚类结果中包括特征的数量最多的类对应的图像作为目标对象的图像。
84.其中，聚类就是按照某个特定标准(如距离准则)把一个数据集分割成不同的类或簇，使得同一个类内的数据对象的相似性尽可能大，同时不在同一个类中的数据对象的差异性也尽可能地大。示例性地，对于提取的多张备选图像的特征进行聚类，聚类的结果就是将由多张备选图像提取的多个特征分为一定数量个类，一定数量由聚类算法的参数设置决定，不同的聚类算法可能得到类的数量不同。例如，一种聚类算法的结果将由多张备选图像提取的多个特征分为4个类，那么，每个类中包含的特征对应的备选图像为同一对象的图
像，每个不同类中的特征对应的备选图像为不同对象的图像，每个类里包括的特征数量不同。其中，包含特征数量最多的类对应的备选图像即是需要关注的目标对象的图像，同一类里包含的特征对应的备选图像为同一对象的图像，因此包含特征数量最多的类代表该类对应的对象在该多张备选图像中出现的次数最多，由于该特征是由多张备选图像提取的，该多张备选图像是根据目标对象出现的时空信息获取的，在多张备选图像中出现次数最多的同一对象的图像即为目标对象的图像。
85.在本技术实施例中，对特征集合进行聚类采用的聚类算法包括：层次聚类算法、k均值聚类算法(k-means clustering algorithm，k-means)、最大期望(expectation-maximization，em) 算法、k邻近算法(k nearest neighbor，knn)、具有噪声的基于密度的聚类方法(density-basedspatial clustering of applications with noise，dbscan)算法和谱聚类算法等。本技术实施例不对聚类算法的应用加以限定。
86.在一种可能的实现方式中，对对象特征集合进行聚类，得到多个对象特征的聚类结果，将聚类结果中满足条件的类对应的图像作为目标对象的图像之后，该方法还包括：响应于对象数据库中包括有目标对象的历史图像，提取历史图像的对象特征；将历史图像的对象特征与识别出的图像的对象特征进行比对；响应于历史图像的对象特征与识别出的图像的对象特征匹配，根据识别出的图像更新对象数据库中的目标对象的历史图像。
87.其中，对象数据库为包括多个对象的图像的数据库；特征匹配的条件是指历史图像的对象特征与识别出的图像的对象特征之间的相似度满足设定阈值，设定阈值可以根据经验进行预设，例如，相似度的区间为[0，1]，那么设定阈值为0.8，则历史图像的对象特征与识别出的图像的对象特征之间的相似度大于等于0.8即为特征匹配的条件。
[0088]
在本技术实施例中，提取对象数据库中包括的目标对象的历史图像的对象特征，将该历史图像的对象特征与识别出的图像的对象特征进行比对，若匹配可根据识别出的图像更新对象数据库中的目标对象的历史图像。上述过程能够在对象数据库中的目标对象的历史图像与识别出的目标对象的图像的对象特征匹配，但视觉效果显示对象数据库中的目标对象的历史图像与识别出的目标对象的图像相差较大时，比如为对象数据库中的目标对象的历史图像为许多年前的图像，又比如目标对象的图像特征发生了明显的变化，可使用识别出的目标对象的图像更新对象数据库中的目标对象的历史图像。
[0089]
在一种可能的实现方式中，响应于对象数据库中包括有目标对象的历史图像，提取历史图像的对象特征，将对象数据库中的目标对象的历史图像与根据聚类结果获得的目标对象的图像进行对象特征对比，可以对获得的目标对象的图像起到再次确定的作用。如果对象数据库中的目标对象的历史图像与获得的目标对象的图像的对象特征匹配，证明根据聚类结果识别出的目标对象的图像的确实为目标对象的图像；如果对象数据库中的目标对象的历史图像与根据聚类结果识别出的目标对象的图像的对象特征不匹配，可再次获取目标对象出现的更多的时空信息，由更过的时空信息通过上述方法再次根据聚类结果重新获得目标对象的图像，增加了图像识别的准确率。
[0090]
在一种可能的实现方式中，对对象特征集合进行聚类，得到多个对象特征的聚类结果，将聚类结果中满足条件的类对应的图像作为目标对象的图像之后，该方法还包括：响应于对象数据库中不包括有目标对象的历史图像，将获得的目标对象的图像补充到该对象数据库中。该方法能够补充对象数据库包括的对象的范围，进一步提升了后续图像识别的
准确性。
[0091]
在一种可能的实现方式中，本技术实施例提供的方法能够用于更新与补充对象数据库中的数据，有助于解决目标对象走失找回、查找目标对象等问题，能够提高后续的基于该对象数据库的图像识别的准确率。由于结合了目标对象的时空信息，所以在目标对象与对象数据库中的历史图像视觉相差较大，人眼或相关的图像识别方法不易分辨时，仍然能够准确的识别目标对象的图像。此外，同样由于结合了目标对象的时空信息，在目标对象进行了大面积的遮挡时，仍然可以根据聚类结果及时的获得目标对象的图像。
[0092]
本技术实施例提供的方法，通过获取目标对象出现的时空信息，在图像库中提取与该时空信息匹配的多张备选图像，根据多张备选图像的聚类结果识别出目标对象的图像。该方法能够适用于严苛条件下的图像识别，提高图像识别的准确率，对于特定目标的寻找提供帮助，同时，该方法还可用于更新和补充现有的图像数据库，有助于提高后续图像识别的准确性与高效性。
[0093]
请参考图3，其示出了本技术实施例提供的一种图像识别方法的示意图。如图所示，该方法包括如下步骤301-步骤303。
[0094]
步骤301，获取目标对象出现的多个时空信息。
[0095]
步骤302，在图像库中获取该多个时空信息匹配的多张备选图像。
[0096]
在一种可能的实现方式中，路口a位置布局有a摄像机，路口b位置布局有b摄像机，路口c位置布局有c摄像机，其中，a摄像机、b摄像机与c摄像机对周边的图像进行实时的采集，将采集的图像存储于图像库中，同存储采集的摄像机设备与采集时间信息。因此，根据多个时空信息，即可确定a摄像机、b摄像机与c摄像机为可能抓拍到目标对象的摄像机，获取a摄像机、b摄像机与c摄像机在对应时间范围内的所有图像作为多张备选图像。如图3所示，由a摄像机在5月3日12：00的时间段内获取了2张备选图像，由b摄像机在5月3日14：00的时间段内获取了2张备选图像，由c摄像机在5月3日15：00的时间段内获取了2张备选图像，共获取了6张备选图像。
[0097]
步骤303，对多张备选图像进行聚类，根据聚类结果识别目标对象的图像。
[0098]
在一种可能的实现方式中，将获取的6张备选图像首先进行特征提取，提取6张备选图像的对象特征，得到6个对象特征，然后对提取的6个对象特征进行聚类，得到该6个对象特征的聚类结果，将聚类结果根据类所包括的对象特征的数量由高到低的顺序进行排列，并展示每个类中的对象特征对应的备选图像，得到如图3所示的聚类结果。其中，第一类包括 3张备选图像，代表该第一类包含的对象特征的数量为3，第二类包括2张备选图像，代表该第二类包含的对象特征的数量为2，第三类包括1张备选图像，代表该第三类包含的对象特征的数量为1。由图3可以看出同一类中包含的图像为同一对象的图像，由于该6张备选图像是根据目标对象的时空信息获取的，通过聚类的方式可以进一步对备选图像进行筛选，从而得到最可能是目标对象的图像。例如，选择拥有对象特征(每个对象特征对应一个图像) 数量最多的类，把这个类中的对象特征所对应的图像认定为就是目标对象的图像。那么由于第一类包含的对象特征的数量最多(第一类共包括3个备选图像，也即3个对象特征)，因此包含对象特征的数量最多的类即第一类，将第一类对应的3张备选图像作为目标对象的图像。
[0099]
以上介绍了本技术提供的图像识别方法，与上述方法对应，本技术还提供图像识
别装置。该装置用于通过图4及图5所示的各个模块执行上述图2及图3中所示的图像识别方法。如图4所示，本技术提供的图像识别装置包括如下几个模块。
[0100]
第一获取模块41，用于获取待识别的目标对象出现的至少一个时空信息；
[0101]
第二获取模块42，用于在图像库中获取与至少一个时空信息匹配的多张备选图像，其中，图像库中包括多张图像，该多张图像中的任一图像为一个或多个对象被拍摄的图像；
[0102]
聚类模块43，用于将多张备选图像按图像中的对象特征进行聚类，根据聚类结果在多张备选图像中获得目标对象的图像。
[0103]
在一种可能的实现方式中，第一获取模块41，用于获取目标对象的通信标识信息，通信标识信息包括目标对象的通信号码、国际移动设备识别码和具有定位功能的设备识别码中的至少一种；
[0104]
根据通信标识信息对目标对象进行定位，根据定位结果获取目标对象出现的至少一个时空信息。
[0105]
在一种可能的实现方式中，至少一个时空信息中的任一时空信息包括目标对象出现的位置信息和目标对象出现的时间点信息；
[0106]
第二获取模块42，用于对于至少一个时空信息中的任一时空信息，确定在任一时空信息中的位置信息对应的位置处布局的摄像机，摄像机用于抓拍位置信息对应的位置处的图像；
[0107]
根据任一时空信息中的时间点信息，在图像库中提取摄像机在时间点信息对应的时间范围内抓拍的多张图像，将提取出的图像作为备选图像。
[0108]
在一种可能的实现方式中，聚类模块43，用于提取多张备选图像中的每一张备选图像的对象特征，得到由对象特征组成的对象特征集合；
[0109]
对对象特征集合进行聚类，得到多个对象特征的聚类结果，将聚类结果中满足条件的类对应的图像作为目标对象的图像。
[0110]
在一种可能的实现方式中，聚类结果中满足条件的类为聚类结果中包含对象特征的数量最多的类。
[0111]
在一种可能的实现方式中，请参考图5，该装置还包括：
[0112]
提取模块44，用于响应于对象数据库中包括有目标对象的历史图像，提取历史图像的对象特征；
[0113]
比对模块45，用于将历史图像的对象特征与识别出的图像的对象特征进行比对；
[0114]
更新模块46，用于响应于历史图像的对象特征与识别出的图像的对象特征匹配，根据识别出的图像更新对象数据库中的目标对象的历史图像。
[0115]
本技术实施例提供的装置，通过获取目标对象出现的时空信息，在图像库中提取与该时空信息匹配的多张备选图像，根据多张备选图像的聚类结果识别出目标对象的图像。该方法能够适用于目标特征有变化等严苛条件下的图像识别，提高图像识别的准确率，对于特定目标的寻找提供帮助，同时，该方法还可用于更新和补充现有的图像数据库，有助于提高后续图像识别的准确性与高效性。
[0116]
应理解的是，上述图4及图5提供的装置在实现其功能时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，
即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的装置与方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。
[0117]
本技术提供了一种图像识别设备，该设备包括：对外接口、存储器和处理器。其中，该对外接口、该存储器和该处理器通过内部连接通路互相通信，该存储器用于存储指令，该处理器用于执行该存储器存储的指令，对外接口用于接收目标对象出现的至少一个时空信息并且当该处理器执行该存储器存储的指令时，使得该处理器执行本技术所提供的任一种示例性的图像识别方法。
[0118]
参见图6，图6示出了本技术一示例性的图像识别设备600的结构示意图。图6所示的图像识别设备600用于执行上述图2及图3所示的图像识别方法所涉及的操作。该图像识别设备600例如是一台终端，或是一台服务器，或者是一个云计算服务中心等。
[0119]
如图6所示，图像识别设备600包括至少一个处理器601、存储器603以及至少一个通信接口604。
[0120]
处理器601例如是通用cpu、数字信号处理器(digital signal processor，dsp)、网络处理器(network processer，np)、gpu、神经网络处理器(neural-network processing units，npu)、数据处理单元(data processing unit，dpu)、微处理器或者一个或多个用于实现本技术方案的集成电路或专用集成电路(application-specific integrated circuit，asic)，可编程逻辑器件 (programmable logic device，pld)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。pld例如是复杂可编程逻辑器件(complex programmable logic device， cpld)、现场可编程逻辑门阵列(field-programmable gate array，fpga)、通用阵列逻辑(genericarray logic，gal)或其任意组合。其可以实现或执行结合本技术公开内容所描述的各种逻辑方框、模块和电路。处理器也可以是实现计算功能的组合，例如包括一个或多个微处理器组合，dsp和微处理器的组合等等。
[0121]
可选的，当图像识别设备600是计算机设备时，图像识别设备600还包括总线602。总线602用于在识别设备600的各组件之间传送信息。总线602可以是外设部件互连标准 (peripheral component interconnect，简称pci)总线或扩展工业标准结构(extended industrystandard architecture，简称eisa)总线等。总线602可以分为地址总线、数据总线、控制总线等。为便于表示，图6中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。
[0122]
存储器603例如是只读存储器(read-only memory，rom)或可存储静态信息和指令的其它类型的存储设备，又如是随机存取存储器(random access memory，ram)或者可存储信息和指令的其它类型的动态存储设备，又如是电可擦可编程只读存储器(electrically erasableprogrammable read-only memory，eeprom)、只读光盘(compact disc read-only memory， cd-rom)或其它光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其它磁存储设备，或者是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其它介质，但不限于此。存储器603 例如是独立存在，并通过总线602与处理器601相连接。存储器603也可以和处理器601集成在一起。
[0123]
通信接口604使用任何对外接口一类的装置，用于与其它设备或通信网络通信，通信网络可以为以太网、无线接入网(radio access network，ran)或无线局域网(wireless local areanetwork，wlan)等。通信接口604可以包括有线通信接口，还可以包括无线通信接口。具体的，通信接口604可以为以太(ethernet)接口，如：快速以太(fast ethernet，fe)接口、千兆以太(gigabit ethernet，ge)接口，异步传输模式(asynchronous transfer mode，atm) 接口，wlan接口，蜂窝网络通信接口或其组合。以太网接口可以是光接口，电接口或其组合。在本技术的一些实施方式中，通信接口604可以用于图像识别设备600与其他设备进行通信。
[0124]
在具体实现中，作为一些实施方式，处理器601可以包括一个或多个cpu，如图6中所示的cpu0和cpu1。这些处理器中的每一个可以是一个单核处理器，也可以是一个多核处理器。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令) 的处理核。
[0125]
在具体实现中，作为一些实施方式，图像识别设备600可以包括多个处理器，如图6中所示的处理器601和处理器605。这些处理器中的每一个可以是一个单核处理器，也可以是一个多核处理器。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(如计算机程序指令)的处理核。
[0126]
在一些实施方式中，存储器603用于存储执行本技术方案的程序代码610，处理器601 可以执行存储器603中存储的程序代码610。也即是，图像识别设备600可以通过处理器601 以及存储器603中的程序代码610，来实现方法实施例提供的图像识别方法。程序代码610 中可以包括一个或多个软件模块。可选地，处理器601自身也可以存储执行本技术方案的程序代码或指令。
[0127]
在具体实施过程中，本技术的图像识别设备600可对应于用于执行上述方法的设备，图像识别设备600中的处理器601读取存储器603中的指令，使图6所示的图像识别设备600 能够执行方法实施例中的全部或部分步骤。
[0128]
图像识别设备600还可以对应于上述图4及图5所示的装置，图4及图5所示的装置中的每个功能模块采用图像识别设备600的软件实现。换句话说，图4及图5所示的装置包括的功能模块为图像识别设备600的处理器601读取存储器603中存储的程序代码610后生成的。
[0129]
其中，图2及图3所示的图像识别方法的各步骤通过图像识别设备600的处理器中的硬件的集成逻辑电路或者软件形式的指令完成。结合本技术所公开的方法实施例的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法实施例的步骤，为避免重复，这里不再详细描述。
[0130]
应理解的是，上述处理器可以是中央处理器(central processing unit，cpu)，还可以是其他通用处理器、数字信号处理器(digital signal processing，dsp)、专用集成电路(applicationspecific integrated circuit，asic)、现场可编程门阵列(field-programmable gate array，fpga) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者是任何常规的处理器等。值得说明的
是，处理器可以是支持进阶精简指令集机器(advanced risc machines，arm)架构的处理器。
[0131]
进一步地，在一种可选的实施例中，上述存储器可以包括只读存储器和随机存取存储器，并向处理器提供指令和数据。存储器还可以包括非易失性随机存取存储器。例如，存储器还可以存储设备类型的信息。
[0132]
该存储器可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(read-only memory，rom)、可编程只读存储器(programmable rom，prom)、可擦除可编程只读存储器(erasable prom，eprom)、电可擦除可编程只读存储器(electrically eprom，eeprom)或闪存。易失性存储器可以是随机存取存储器(random access memory，ram)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的ram可用。例如，静态随机存取存储器(static ram，sram)、动态随机存取存储器(dynamic random access memory，dram)、同步动态随机存取存储器 (synchronous dram，sdram)、双倍数据速率同步动态随机存取存储器(double data datesdram，ddr sdram)、增强型同步动态随机存取存储器(enhanced sdram，esdram)、同步连接动态随机存取存储器(synchlink dram，sldram)和直接内存总线随机存取存储器(direct rambus ram，dr ram)。
[0133]
本技术实施例提供了一种计算机程序，当计算机程序被计算机执行时，可以使得处理器或计算机执行上述方法实施例中对应的各个步骤和/或流程。
[0134]
本技术实施例提供了一种计算机程序(产品)，计算机程序(产品)包括：计算机程序代码，当计算机程序代码被计算机运行时，使得计算机执行上述任一种示例性实施所提供的方法。
[0135]
本技术实施例提供了一种计算机可读存储介质，计算机可读存储介质存储程序或指令，当程序或指令在计算机上运行时，上述任一种示例性实施所提供的方法被执行。
[0136]
本技术实施例提供了一种芯片，包括处理器，用于从存储器中调用并运行存储器中存储的指令，使得安装有芯片的通信设备执行上述任一种示例性实施所提供的方法。
[0137]
本技术实施例提供另一种芯片(或者芯片的组合)，包括：输入接口、输出接口、处理器和存储器，输入接口、输出接口、处理器以及存储器之间通过内部连接通路相连，处理器用于执行存储器中的代码，当代码被执行时，处理器用于执行上述任一种示例性实施所提供的方法。
[0138]
在上述实施方式中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时，全部或部分地产生按照本技术的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质
(例如，dvd)、或者半导体介质(例如固态硬盘)等。
[0139]
在本技术的上下文中，计算机程序代码或者相关数据可以由任意适当载体承载，以使得设备、装置或者处理器能够执行上文描述的各种处理和操作。载体的示例包括计算机可读介质等等。
[0140]
为了描述的方便和简洁，上述描述的系统、设备和模块的具体工作过程，可以参见前述方法中的对应过程，在此不再赘述。
[0141]
在本技术所提供的几个实施方式中，应该理解到，所揭露的系统、设备和方法，可以通过其它的方式实现。例如，以上所描述的设备仅仅是示意性的，例如，该模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、设备或模块的间接耦合或通信连接，也可以是电的，机械的或其它的形式连接。
[0142]
该作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本技术方案的目的。
[0143]
另外，在本技术各个实施方式中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以是两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。
[0144]
本技术中术语“第一”、“第二”等字样用于对作用和功能基本相同的相同项或相似项进行区分，应理解，“第一”、“第二”、“第n”之间不具有逻辑或时序上的依赖关系，也不对数量和执行顺序进行限定。还应理解，尽管以下描述使用术语第一、第二等来描述各种元素，但这些元素不应受术语的限制。这些术语只是用于将一元素与另一元素区别分开。例如，在不脱离各种示例的范围的情况下，第一设备可以被称为第二设备，并且类似地，第二设备可以被称为第一设备。第一设备和第二设备都可以是通信，并且在某些情况下，可以是单独且不同的设备。
[0145]
还应理解，在本技术的各个实施方式中，各个过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本技术的实施过程构成任何限定。
[0146]
本技术中术语“至少一个”的含义是指一个或多个，本技术中术语“多个”的含义是指两个或两个以上。本文中术语“系统”和“网络”经常可互换使用。
[0147]
应理解，根据a确定b并不意味着仅仅根据a确定b，还可以根据a和其它信息确定b。
[0148]
还应理解，说明书通篇中提到的“一个实施方式”、“一实施方式”、“一种可能的实现方式”意味着与实施方式或实现方式有关的特定特征、结构或特性包括在本技术的至少一个实施方式中。因此，在整个说明书各处出现的“在一个实施方式中”或“在一实施方式中”、“一种可能的实现方式”未必一定指相同的实施方式。此外，这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施方式中。
[0149]
以上所述，以上实施方式仅用以说明本技术的技术方案，而非对其限制；尽管参照前述实施方式对本技术进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施方式所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；
而这些修改或者替换，并不使相应技术方案的本质脱离本技术各实施方式技术方案的范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：基于硬件信息的神经网络结构搜索方法及系统

图像识别方法、装置、设备及可读存储介质与流程

相关文献

最热文献