图像识别方法、装置以及电子设备与流程

2021-11-24 20:08:00 来源：中国专利 TAG：

1.本技术涉及图像识别技术领域，进一步涉及一种图像识别方法、装置以及电子设备。

背景技术：

2.目前，随着国民生活水平的不断提高，我国汽车保有量也在逐步增加，随着汽车数量的增多，城市停车位的数量有限，形成了“停车难”的问题，用户高峰时间出行大部分时间都花在了找车位。现有技术中，采用了地磁、视频桩等方式来对车辆停车进行管理，然而这种方式在设备安装之初会带来对道路或车位等的破坏，维护上的不便等问题。而在使用过程中，该方式只能对车位进行检测，并不能检测到车辆的行为信息，并且检测准确率较低，用户体验感较差。

技术实现要素：

3.本发明的一个优势在于提供一种图像识别方法、装置以及电子设备，其中所述方法能够识别出图像中是否存在目标，以及目标的行为信息，有利于提高用户体验感。
4.第一方面，本发明的一个优势在于提供一种图像识别方法，包括：
5.获取多个图像，每个所述图像中包含第一区域；
6.识别所述图像中是否存在目标；
7.若所述图像中存在所述目标，则从所述图像中获取到第二区域，所述第二区域用于表示所述目标所处的区域；
8.基于所述第一区域以及所述第二区域，输出识别结果，所述识别结果用于表示所述目标的行为信息。
9.其中一种可能的实现方式中，所述第一区域可以包括多个子区域，所述基于所述第一区域以及所述第二区域，输出识别结果，包括：
10.判断多个所述子区域与所述第二区域是否重叠，根据判断结果从多个所述子区域中选取到目标子区域；
11.基于所述目标子区域以及所述第二区域，输出识别结果。
12.其中一种可能的实现方式中，每个所述图像包括拍摄时刻，所述基于所述第一区域以及所述第二区域，输出识别结果，包括：
13.获得所述第二区域与所述第一区域的重叠度；
14.按照每个所述图像的拍摄时刻，获得多个所述重叠度的变化趋势；
15.基于所述重叠度以及多个所述重叠度的变化趋势，输出识别结果。
16.其中一种可能的实现方式中，所述识别结果包括第一结果、第二结果、第三结果以及第四结果，所述基于所述重叠度以及多个所述重叠度的变化趋势，输出识别结果，包括：
17.若所述重叠度大于或等于预设第一阈值，则输出所述第一结果；
18.若所述重叠度等于预设第二阈值，则输出所述第二结果；
19.若所述重叠度小于或等于预设第三阈值，且多个所述重叠度的变化趋势为减小，则输出所述第三结果；
20.若所述重叠度大于或等于预设第四阈值，且多个所述重叠度的变化趋势为增大，则输出所述第四结果。
21.其中一种可能的实现方式中，所述获取多个图像，包括：
22.对所述第一区域进行拍摄，得到视频；
23.每隔预设帧数或预设时长，从所述视频中选取得到一个或多个图像。
24.其中一种可能的实现方式中，所述图像中存在多个所述目标，所述从所述图像中获取到第二区域，包括：
25.从所述图像中获取到每个所述目标所处的区域以及每个所述目标的标识。
26.其中一种可能的实现方式中，所述识别所述图像中是否存在目标，包括：
27.将所述图像输入至预设神经网络识别模型中，根据输出结果确定是否存在目标。
28.其中一种可能的实现方式中，所述方法还包括：
29.若所述图像中不存在所述目标，则输出第五结果。
30.第二方面，本技术提供了一种图像识别装置，所述装置包括：
31.获取模块，用于获取多个图像，每个所述图像中包含第一区域；
32.识别模块，用于识别所述图像中是否存在目标；
33.处理模块，用于若所述图像中存在所述目标，则从所述图像中获取到第二区域，所述第二区域用于表示所述目标所处的区域；
34.输出模块，用于基于所述第一区域以及所述第二区域，输出识别结果，所述识别结果用于表示所述目标的行为信息。
35.第三方面，本发明的另一个优势在于提供一种电子设备，包括：
36.一个或多个处理器；存储器；以及一个或多个计算机程序，其中所述一个或多个计算机程序被存储在所述存储器中，所述一个或多个计算机程序包括指令，当所述指令被所述设备执行时，使得所述设备执行如第一方面所述的方法。
37.第四方面，本发明的另一个优势在于提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机程序，当其在计算机上运行时，使得计算机执行如第一方面所述的方法。
38.第五方面，本技术提供一种计算机程序，当所述计算机程序被计算机执行时，用于执行第一方面所述的方法。
39.在一种可能的设计中，第五方面中的程序可以全部或者部分存储在与处理器封装在一起的存储介质上，也可以部分或者全部存储在不与处理器封装在一起的存储器上。
附图说明
40.图1示出了本发明图像识别方法一个实施例的方法示意图。
41.图2示出了本发明图像识别方法一个实施例中的图像示意图。
42.图3示出了本发明图像识别方法一个实施例中输出识别结果的流程示意图。
43.图4示出了本发明图像识别装置一个实施例的结构示意图。
44.图5示出了本发明电子设备一个实施例的结构示意图。
具体实施方式
45.以下描述用于揭露本发明以使本领域技术人员能够实现本发明。以下描述中的优选实施例只作为举例，本领域技术人员可以想到其他显而易见的变型。在以下描述中界定的本发明的基本原理可以应用于其他实施方案、变形方案、改进方案、等同方案以及没有背离本发明的精神和范围的其他技术方案。
46.可以理解的是，术语“一”应理解为“至少一”或“一个或多个”，即在一个实施例中，一个元件的数量可以为一个，而在另外的实施例中，该元件的数量可以为多个，术语“一”不能理解为对数量的限制。
47.申请概述
48.现有技术中，采用了地磁、视频桩等方式来对车辆停车进行管理，然而这种方式在设备安装之初会带来对道路或车位等的破坏，维护上的不便等问题。而在使用过程中，该方式只能对车位进行检测，并不能检测到车辆的行为信息，并且检测准确率较低，用户体验感较差。
49.因此，本技术提供一种图像识别方法，所述方法可以包括：获取多个图像，每个所述图像中包含第一区域；识别所述图像中是否存在目标；若所述图像中存在所述目标，则从所述图像中获取到第二区域，所述第二区域用于表示所述目标所处的区域；基于所述第一区域以及所述第二区域，输出识别结果，所述识别结果用于表示所述目标的行为信息。由此可见，本技术提供的所述方法能够识别出图像中是否存在目标，以及目标的行为信息。例如，图像可以由摄像装置拍摄得到，第一区域可以包括可停车区域、禁止停车区域等，目标如车辆，识别结果可以用于表示车辆是否在第一区域内，以及车辆相对于第一区域的行为信息，如车辆进入第一区域内，或车辆离开第一区域等，从而实现对车辆停车进行管理，避免对道路或车位等进行破坏等，有利于提高用户体验感。
50.应用于电子设备的示例性图像识别方法
51.参考图1，依本发明一实施例的一种图像识别方法，如图1所示，所述方法可以包括：
52.s101、获取多个图像，每个所述图像中包含第一区域。
53.在本实施例中，第一区域可以包括可停车区域、禁止停车区域等，可停车区域如路边停车区域、小区停车区域、停车场、地下车库等允许停车的区域，禁止停车区域如路边禁止停车区域或小区禁止停车区域等。
54.如图2所示，摄像装置可以对第一区域进行拍摄，得到多个图像。摄像装置需保持在固定位置，使得拍摄得到的图像中的第一区域保持在同一位置。
55.也就是说，第一区域可以为图像中的预设区域，即第一区域定义为图像中的预设区域或范围等。
56.在其他一些可选实施例中，可以对图像进行识别，得到第一区域，例如，在第一区域边缘设置特殊标记，如颜色或物体标记等，在摄像装置拍摄到图像后，根据图像中的特殊标记，识别到第一区域。
57.其中一种可能的实现方式中，步骤s101可以包括：
58.s201、对所述第一区域进行拍摄，得到视频(或视频流等)；
59.s202、每隔预设帧数或预设时长，从所述视频中选取得到一个或多个图像。
60.也就是说，摄像装置可以对第一区域拍摄得到视频，该视频中包含多帧图像。
61.一般情况下，摄像装置拍摄多帧图像的时间间隔较短(如在一定时长内的拍摄帧数较高)，而车辆进入第一区域内或车辆离开第一区域内的时长远大于该时间间隔。因此，为了减少运算量，提高处理性能，则每隔预设帧数或预设时长(可以根据车辆进入第一区域内或车辆离开第一区域内时长预先设定)，从视频中的多帧图像中选取到一个或多个图像，并按照拍摄时刻组成图像列队(如queue结构等)，该图像列队中包含选取到的多个图像，然后根据该图像列队中存有的多个图像，执行步骤s102至步骤s104。
62.优选地，步骤s202中，可以采用跳帧法(如每间隔预设帧数从多帧图像中选取到一帧图像)，从视频中选取得到多个图像。
63.具体地，步骤s202可以包括：
64.s2021、创建一个临时计数变量；
65.s2022、从视频中选取一帧图像；
66.s2023、对临时计数变量与预设帧数取余后，若余数为1，则将该帧图像存入图像列队中，若预数不为1，则按照拍摄帧数顺序，从视频中选取下一帧图像，临时计数变量自增(如临时计数变量增加1等)，并重复执行步骤s2023。
67.可选地，步骤s202中，按照拍摄时间顺序，从视频拍摄时长中，每隔预设时长，选取一帧图像并存入图像列队中。
68.值得一提的是，为进一步减少运算量，提高处理性能，在步骤s101之后，所述方法还可以包括：降低图像的分辨率，例如，将图像的分辨率降低到预设分辨率范围内，预设分辨率范围如1080p及以下等。
69.s102、识别所述图像中是否存在目标。
70.也就是说，若车辆驶入摄像装置的拍摄范围内，则摄像装置拍摄到的图像中存在该车辆。
71.优选地，步骤s102中可以包括：
72.将所述图像输入至预设神经网络识别模型中，根据输出结果确定是否存在目标。
73.预设神经网络识别模型可以根据多个训练图像(优选为车辆进入第一区域内的图像或车辆离开第一区域内的图像等)输入卷积神经网络模型中进行训练得到。例如，多个训练图像可以按预设比例分为训练集以及测试集，每个训练图像设置有对应的标记(如存在目标以及不存在目标等)，将训练集输入卷积神经网络模型中进行训练，结合卷积神经网络模型的参数调整以及测试集的验证结果，使得训练效果达到最佳，得到预设神经网络识别模型。进一步地，神经网络识别模型可以加载到gpu(图像处理器)中。
74.在传统的图像识别方法中，一般在图像二值化、最大类间方差法提取目标后，通过光流法、帧差法对目标建模，构建相邻上下帧图像之间的时序关系，以识别图像中是否存在目标。但是传统图像识别方法对于环境的鲁棒性却不是很高，受环境噪声影响较大，往往需要对单一环境进行专门的阈值设置，甚至是代码修改，因此在不同环境下的识别精度会有大幅下降，适用性较小。而本技术中采用神经网络识别模型对图像进行识别，对于环境的鲁棒性较高，受环境噪声影响较小，在不同环境下的识别精度不会出现大幅下降，适用性较高。
75.在步骤s102中，将摄像装置实际拍摄到的图像输入到预设神经网络识别模型中
后，输出结果为存在目标或不存在目标。
76.若输出结果为图像中存在目标，则执行步骤s103至步骤s104。
77.s103、若所述图像中存在所述目标，则从所述图像中获取到第二区域，所述第二区域用于表示所述目标所处的区域。
78.第二区域可以包括目标的轮廓(或目标被遮挡后的轮廓)或目标所在的位置(如坐标)等，如车辆的轮廓以及车辆的位置等。需要指出的是，由于摄像装置的拍摄角度的限制，车辆的部分可能会被其他车辆或障碍物等遮挡，因此，第二区域还可以表示目标未被遮挡的区域或者目标的部分区域(如目标在图像中的显示区域)等。
79.其中一种可能的实现方式中，所述图像中存在多个目标，步骤s103可以包括：
80.从所述图像中获取到每个所述目标所处的区域以及每个所述目标的标识。
81.也就是说，当多个车辆进入摄像装置的拍摄范围内，摄像装置拍摄得到的图像中存在多个车辆。每个目标的标识可以包括车辆的编号、型号或车牌号等标识。每个目标所处的区域可以根据该目标的标识进行标注，便于后续根据每个目标所处的区域以及对应的目标标识，识别该目标的行为信息。
82.优选地，步骤s103中，可以采用图像语义分割算法对图像中目标的标识以及目标的轮廓(或目标被遮挡后的轮廓)进行提取，得到每个目标对应的第二区域以及每个目标的标识等。该图像语义分割算法可以包括但不限于mask
‑
rcnn、yolact、solo系列、deeplab系列等算法等中一种或多种。
83.s104、基于所述第一区域以及所述第二区域，输出识别结果，所述识别结果用于表示所述目标的行为信息。
84.优选地，识别结果可以包含目标的行为信息以及目标的状态信息等。目标的行为信息可以包括车辆处于第一区域内，车辆不在第一区域内，车辆进入第一区域内，或者车辆离开第一区域等，目标的状态信息可以包括车辆为过路车、已停车、车辆疑似进入第一区域内或车辆疑似离开第一区域内等，从而实现对车辆停车进行管理，避免对道路或车位等进行破坏等，有利于提高用户体验感。
85.例如，若第一区域为允许停车区域，且识别结果为车辆不在第一区域内，则表示该第一区域未停有车辆。进一步地，识别结果可以包括第一区域的位置信息(或第一区域内停车位的位置信息等)，所述方法还可以包括：将该第一区域的位置信息发送至用户终端(如待停车的车辆终端等)，使得待停车车辆可以按照该第一区域的位置进行导航并停至该第一区域内，缩短寻找停车位时长。
86.若第一区域为禁止停车区域，且识别结果为车辆处于第一区域内，则表示该第一区域内停有车辆，进一步地，所述方法还可以包括：发出提示信息，如提示该区域为禁止停车区域等，如通过声音警报装置发出警报等，以提示车主，或者，上传该车辆的停车相关信息至云端或违停追诉系统等，如车牌号、停车图像以及停车时长等信息，便于后续追诉处理，起到违停抓怕的效果。
87.其中一种可能的实现方式中，第一区域中可以包含多个子区域，步骤s104可以包括：
88.s301、判断多个所述子区域与所述第二区域是否重叠，根据判断结果从多个所述子区域中选取到目标子区域；
89.s302、基于所述目标子区域以及所述第二区域，输出识别结果。
90.优选地，子区域可以包括停车位，每个子区域可以配置有对应的编号或位置等(如停车位编号等)，多个子区域互不重叠。
91.在步骤s301中，若某个子区域与第二区域的重叠(如交集不为0)，则选取该子区域为目标子区域，即目标子区域用于表示停有车辆的停车位。若所有子区域与第二区域不重叠(如交集均为0)，则表示所有停车位内均未停有车辆。
92.在步骤s302中，识别结果可以包括车辆进入停车位，车辆处于停车位，以及车辆离开停车位等。
93.其中一种可能的实现方式中，步骤s104可以包括：
94.s401、获得所述第二区域与所述第一区域的重叠度；
95.s402、按照每个所述图像的拍摄时刻，获得多个所述重叠度的变化趋势；
96.s403、基于所述重叠度以及多个所述重叠度的变化趋势，输出识别结果。
97.步骤s401中，第一区域(或第一区域中的目标子区域)与第二区域的重叠度可以用于表示车辆与第一区域(或目标子区域)的重叠程度。若重叠度为0，则表示车辆不在第一区域内，若重叠度不为0，则表示车辆全部或部分处于第一区域内等。随着图像拍摄时刻的变化，图像中第二区域与第一区域的重叠度可能会发生变化。
98.优选地，第一区域与第二区域的重叠度iou可以由公式：
99.计算得到；
100.其中，iou为重叠度，a为第一区域，b为第二区域。
101.步骤s402中，按照图像的拍摄时刻，若多个重叠度的变化趋势为减小，则表示车辆离开第一区域，若多个重叠度的变化趋势为增大，则表示车辆进入第一区域内。
102.需要指出的是，若图像中存在多个目标，则利用跟踪器(如基于卡尔曼滤波或匈牙利算法的跟踪算法等)，跟踪多个图像中由同一目标标识标注的第二区域分别与第一区域的重叠度，然后根据由同一目标标识标注的第二区域分别与第一区域的重叠度，获得到与该目标对应的多个重叠度的变化趋势。
103.其中一种可能的实现方式中，如图3所示，所述识别结果包括第一结果、第二结果、第三结果以及第四结果，步骤s403可以包括：
104.s501、若所述重叠度大于或等于预设第一阈值m1，则输出所述第一结果；
105.s502、若所述重叠度等于预设第二阈值m2，则输出所述第二结果；
106.s503、若所述重叠度小于或等于预设第三阈值m3，且所述重叠度的变化趋势为减小，则输出所述第三结果；
107.s504、若所述重叠度大于或等于预设第四阈值m4，且所述重叠度的变化趋势为增大，则输出所述第四结果。
108.也就是说，在步骤s501中，第一阈值m1可以根据车辆全部处于第一区域内的重叠程度预先设定。第一结果可以包括车辆的标识(如车牌号等)，车辆处于第一区域内，以及车辆处于第一区域内的时刻以及时长等(根据图像拍摄时刻得到)，或者车辆处于第一区域内的停车位编号以及该停车位处于占用状态等。进一步地，若车辆处于第一区域内，且车辆的位置未发生变化(如多个第二区域未发生变化等)，则输出的第一结果还可以包括车辆状态
为已停车以及停车时长等。进一步地，若车辆处于第一区域内，且车辆逐渐离开第一区域(如多个第二区域的位置变化逐渐增大)，则输出的第二结果还可以包括车辆疑似离开第一区域内等。
109.步骤s502中，预设第二阈值m2为0，第二结果为车辆的标识(如车牌号等)，车辆不处于第一区域内，车辆不处于第一区域内的时刻以及时长等(根据图片拍摄时刻得到)，如车辆为过路车等。进一步地，若车辆未处于第一区域内，且车辆的位置发生变化，则输出的第二结果还可以包括车辆状态为过路车等。更进一步地，若车辆未处于第一区域内，且车辆逐渐靠近第一区域(如多个第二区域的位置变化逐渐减小且与第一区域的间距逐渐减小)，则输出的第二结果还可以包括车辆疑似进入第一区域内等。更进一步地，若车辆未处于第一区域内，且车辆的位置未发生变化(如多个第二区域的位置不变)，则输出的第二结果还可以包括车辆未在第一区域内发生停车行为，如在道路中发生停车行为等。进一步地，所述方法还可以包括：发出提示信息，如提示该车辆未将车辆停至第一区域内，如通过声音警报装置发出警报等，以提示车主，或者，上传该车辆的停车相关信息至云端或违停追诉系统等，如车牌号、停车图像以及停车时长等信息，便于后续追诉处理，起到违停抓怕的效果。
110.步骤s503中，预设第三阈值可以根据车辆离开第一区域的重叠度预先设定。第三结果可以包括车辆的标识(如车牌号等)，车辆离开第一区域，车辆离开第一区域的时刻以及时长等(根据图像拍摄时刻得到)，或者车辆离开第一区域内的停车位编号以及该停车位处于空闲状态等。
111.步骤s504中，预设第四阈值可以根据车辆进入第一区域的重叠度预先设定。第四结果可以包括车辆的标识(如车牌号等)，车辆进入第一区域内，车辆进入第一区域内的时刻以及时长等(根据图像拍摄时刻得到)，或者车辆进入第一区域内的停车位编号以及该停车位处于占用状态等。
112.其中一种可能的实现方式中，所述方法还可以包括：
113.若所述图像中不存在所述目标，则输出第五结果。
114.也就是说，第五结果为第一区域内未停有车辆。进一步地，若第一区域为允许停车区域，且识别结果为第二结果、第三结果或第五结果，所述方法还可以包括：将该第一区域的位置信息发送至用户终端(如待停车的车辆终端等)，使得待停车车辆可以按照该第一区域的位置进行导航并停至该第一区域内，缩短寻找停车位时长。
115.可以理解的是，本技术提供的方法得到的识别结果可以上传至云端或者电子设备等，如在图像的右下角绘制时间信息，并将多个图像进行合成，如按照图像合成规则以2*2的方阵将车辆的图像的3张全景以及1张车辆近景图(或特写图，放大图等)合成为一张图像并上传至云端等。可以理解的是，本技术图像识别方法还可以应用于其他车辆停车管理的场景中，实现智慧城市建设，在此不受限制。
116.可以理解的是，上述实施例中的部分或全部步骤骤或操作仅是示例，本技术实施例还可以执行其它操作或者各种操作的变形。此外，各个步骤可以按照上述实施例呈现的不同的顺序来执行，并且有可能并非要执行上述实施例中的全部操作。
117.示例性图像识别装置
118.如图4所示，本技术一个实施例提供了一种图像识别装置100，所述装置100包括：
119.获取模块10，用于获取多个图像，每个所述图像中包含第一区域；
120.识别模块20，用于识别所述图像中是否存在目标；
121.处理模块30，用于若所述图像中存在所述目标，则从所述图像中获取到第二区域，所述第二区域用于表示所述目标所处的区域；
122.输出模块40，用于基于所述第一区域以及所述第二区域，输出识别结果，所述识别结果用于表示所述目标的行为信息。
123.其中一种可能的实现方式中，所述第一区域可以包括多个子区域，输出模块40还用于：
124.判断多个所述子区域与所述第二区域是否重叠，根据判断结果从多个所述子区域中选取到目标子区域；
125.基于所述目标子区域以及所述第二区域，输出识别结果。
126.其中一种可能的实现方式中，每个所述图像包括拍摄时刻，输出模块40还用于：
127.获得所述第二区域与所述第一区域的重叠度；
128.按照每个所述图像的拍摄时刻，获得所述重叠度的变化趋势；
129.基于所述重叠度以及所述重叠度的变化趋势，输出识别结果。
130.其中一种可能的实现方式中，所述识别结果包括第一结果、第二结果、第三结果以及第四结果，输出模块40还用于：
131.若所述重叠度大于或等于预设第一阈值，则输出所述第一结果；
132.若所述重叠度等于预设第二阈值，则输出所述第二结果；
133.若所述重叠度小于或等于预设第三阈值，且所述重叠度的变化趋势为减小，则输出所述第三结果；
134.若所述重叠度大于或等于预设第四阈值，且所述重叠度的变化趋势为增大，则输出所述第四结果。
135.其中一种可能的实现方式中，获取模块10还用于：
136.对所述第一区域进行拍摄，得到视频；
137.每隔预设帧数或预设时长，从所述视频中选取得到一个或多个图像。
138.其中一种可能的实现方式中，所述图像中存在多个所述目标，处理模块30还用于：
139.从所述图像中获取到每个所述目标所处的区域以及每个所述目标的标识。
140.其中一种可能的实现方式中，识别模块20还用于：
141.将所述图像输入至预设神经网络识别模型中，根据输出结果确定是否存在目标。
142.其中一种可能的实现方式中，输出模块40还用于：
143.若所述图像中不存在所述目标，则输出第五结果。
144.可以理解的是，图4所示实施例提供的图像识别装置可用于执行本技术图1所示方法实施例的技术方案，其实现原理和技术效果可以进一步参考方法实施例中的相关描述。
145.应理解以上图4所示的图像识别装置的各个模块的划分仅仅是一种逻辑功能的划分，实际实现时可以全部或部分集成到一个物理实体上，也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现；也可以全部以硬件的形式实现；还可以部分模块以软件通过处理元件调用的形式实现，部分模块通过硬件的形式实现。例如，处理模块可以为单独设立的处理元件，也可以集成在电子设备的某一个芯片中实现。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起，也可以独立实现。在实现过程中，
上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
146.例如，以上这些模块可以是被配置成实施以上方法的一个或多个集成电路，例如：一个或多个特定集成电路(application specificintegrated circuit；以下简称：asic)，或，一个或多个微处理器(digital singnal processor；以下简称：dsp)，或，一个或者多个现场可编程门阵列(field programmable gate array；以下简称：fpga)等。再如，这些模块可以集成在一起，以片上系统(system
‑
on
‑
a
‑
chip；以下简称：soc)的形式实现。
147.示例性电子设备
148.图5为本技术电子设备一个实施例的结构示意图，如图5所示，上述电子设备可以包括：一个或多个处理器；存储器；以及一个或多个计算机程序。
149.其中，上述电子设备可以为电脑，服务器，移动终端(手机)，收银设备，计算机，智慧屏，无人机，智能网联车(intelligent connected vehicle；以下简称：icv)，智能(汽)车(smart/intelligent car)或车载设备等设备。
150.其中上述一个或多个计算机程序被存储在上述存储器中，上述一个或多个计算机程序包括指令，当上述指令被上述设备执行时，使得上述设备执行以下步骤：
151.获取多个图像，每个所述图像中包含第一区域；
152.识别所述图像中是否存在目标；
153.若所述图像中存在所述目标，则从所述图像中获取到第二区域，所述第二区域用于表示所述目标所处的区域；
154.基于所述第一区域以及所述第二区域，输出识别结果，所述识别结果用于表示所述目标的行为信息。
155.其中一种可能的实现方式中，所述第一区域可以包括多个子区域，当上述指令被上述设备执行时，使得上述设备执行所述基于所述第一区域以及所述第二区域，输出识别结果，包括：
156.判断多个所述子区域与所述第二区域是否重叠，根据判断结果从多个所述子区域中选取到目标子区域；
157.基于所述目标子区域以及所述第二区域，输出识别结果。
158.其中一种可能的实现方式中，每个所述图像包括拍摄时刻，当上述指令被上述设备执行时，使得上述设备执行所述基于所述第一区域以及所述第二区域，输出识别结果，包括：
159.获得所述第二区域与所述第一区域的重叠度；
160.按照每个所述图像的拍摄时刻，获得所述重叠度的变化趋势；
161.基于所述重叠度以及所述重叠度的变化趋势，输出识别结果。
162.其中一种可能的实现方式中，所述识别结果包括第一结果、第二结果、第三结果以及第四结果，当上述指令被上述设备执行时，使得上述设备执行所述基于所述重叠度以及所述重叠度的变化趋势，输出识别结果，包括：
163.若所述重叠度大于或等于预设第一阈值，则输出所述第一结果；
164.若所述重叠度等于预设第二阈值，则输出所述第二结果；
165.若所述重叠度小于或等于预设第三阈值，且所述重叠度的变化趋势为减小，则输
出所述第三结果；
166.若所述重叠度大于或等于预设第四阈值，且所述重叠度的变化趋势为增大，则输出所述第四结果。
167.其中一种可能的实现方式中，当上述指令被上述设备执行时，使得上述设备执行所述获取多个图像，包括：
168.对所述第一区域进行拍摄，得到视频；
169.每隔预设帧数或预设时长，从所述视频中选取得到一个或多个图像。
170.其中一种可能的实现方式中，所述图像中存在多个所述目标，当上述指令被上述设备执行时，使得上述设备执行所述从所述图像中获取到第二区域，包括：
171.从所述图像中获取到每个所述目标所处的区域以及每个所述目标的标识。
172.其中一种可能的实现方式中，当上述指令被上述设备执行时，使得上述设备执行所述识别所述图像中是否存在目标，包括：
173.将所述图像输入至预设神经网络识别模型中，根据输出结果确定是否存在目标。
174.其中一种可能的实现方式中，当上述指令被上述设备执行时，使得上述设备还执行：
175.若所述图像中不存在所述目标，则输出第五结果。
176.图5所示的电子设备可以是终端设备或服务器也可以是内置于上述终端设备或服务器的电路设备。该设备可以用于执行本技术图1所示实施例提供的图像识别方法中的功能/步骤。
177.如图5所示，电子设备900包括处理器910和存储器920。其中，处理器910和存储器920之间可以通过内部连接通路互相通信，传递控制和/或数据信号，该存储器920用于存储计算机程序，该处理器910用于从该存储器920中调用并运行该计算机程序。
178.上述存储器920可以是只读存储器(read
‑
only memory，rom)、可存储静态信息和指令的其它类型的静态存储设备、随机存取存储器(random access memory，ram)或可存储信息和指令的其它类型的动态存储设备，也可以是电可擦可编程只读存储器(electrically erasable programmable read
‑
only memory，eeprom)、只读光盘(compact disc read
‑
only memory，cd
‑
rom)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其它磁存储设备，或者还可以是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其它介质等。
179.上述处理器910可以和存储器920可以合成一个处理装置，更常见的是彼此独立的部件，处理器910用于执行存储器920中存储的程序代码来实现上述功能。具体实现时，该存储器920也可以集成在处理器910中，或者，独立于处理器910。
180.应理解，图5所示的电子设备900能够实现本技术图1所示实施例提供的方法的各个过程。电子设备900中的各个模块的操作和/或功能，分别为了实现上述方法实施例中的相应流程。具体可参见本技术图1所示方法实施例中的描述，为避免重复，此处适当省略详细描述。
181.除此之外，为了使得电子设备900的功能更加完善，该电子设备900还可以包括摄像头930、电源940、输入单元950等中的一个或多个。
182.可选地，电源950用于给电子设备中的各种器件或电路提供电源。
183.应理解，图5所示的电子设备900中的处理器910可以是片上系统soc，该处理器910中可以包括中央处理器(central processing unit；以下简称：cpu)，还可以进一步包括其他类型的处理器，例如：图像处理器(graphics processing unit；以下简称：gpu)等。
184.总之，处理器910内部的各部分处理器或处理单元可以共同配合实现之前的方法流程，且各部分处理器或处理单元相应的软件程序可存储在存储器920中。
185.本技术还提供一种电子设备，所述设备包括存储介质和中央处理器，所述存储介质可以是非易失性存储介质，所述存储介质中存储有计算机可执行程序，所述中央处理器与所述非易失性存储介质连接，并执行所述计算机可执行程序以实现本技术图1所示实施例提供的方法。
186.以上各实施例中，涉及的处理器可以例如包括cpu、dsp、微控制器或数字信号处理器，还可包括gpu、嵌入式神经网络处理器(neural
‑
network process units；以下简称：npu)和图像信号处理器(image signal processing；以下简称：isp)，该处理器还可包括必要的硬件加速器或逻辑处理硬件电路，如asic，或一个或多个用于控制本技术技术方案程序执行的集成电路等。此外，处理器可以具有操作一个或多个软件程序的功能，软件程序可以存储在存储介质中。
187.本技术实施例还提供一种计算机可读存储介质，该计算机可读存储介质中存储有计算机程序，当其在计算机上运行时，使得计算机执行本技术图1所示实施例提供的方法。
188.本技术实施例还提供一种计算机程序产品，该计算机程序产品包括计算机程序，当其在计算机上运行时，使得计算机执行本技术图1所示实施例提供的方法。
189.本领域普通技术人员可以意识到，本文中公开的实施例中描述的各单元及算法步骤，能够以电子硬件、计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本技术的范围。
190.所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。
191.在本技术所提供的几个实施例中，任一功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(read
‑
only memory；以下简称：rom)、随机存取存储器(random access memory；以下简称：ram)、磁碟或者光盘等各种可以存储程序代码的介质。
192.以上所述，仅为本技术的具体实施方式，任何熟悉本技术领域的技术人员在本技术揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本技术的保护范围之内。本技术的保护范围应以所述权利要求的保护范围为准。
193.本领域的技术人员应理解，上述描述及附图中所示的本发明的实施例只作为举例而并不限制本发明。本发明的优势已经完整并适用地实现。本发明的功能及结构原理已在
实施例中展示和说明，在没有背离所述原理下，本发明的实施方式可以有任何变形或修改。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种气压式提笔检测结构及具有该结构的电子装置的制作方法

图像识别方法、装置以及电子设备与流程

相关文献

最热文献