位姿确定方法、装置、电子设备和可读存储介质与流程

2021-12-14 23:13:00 来源：中国专利 TAG：

1.本技术涉及信息处理领域，具体而言，涉及一种位姿确定方法、装置、电子设备和可读存储介质。

背景技术：

2.随着智能系统的不断发展，对监控视频的自动化处理要求也越来越高。在监控视频或者拍摄图像中确定目标对象的姿态时，由于图像数据在采集过程中丢失了三维世界中的深度信息，使得目标对象的姿态参数难以恢复。
3.相关技术中，常常可以通过以下两种方式估计目标对象的姿态参数。其一是先通过目标对象的三维模型渲染出其在不同姿态下的图像，然后将渲染出的图像作为卷积神经网络的输入，将不同姿态所对应的姿态参数作为卷积神经网络的期望输出，训练卷积神经网络。当卷积神经网络收敛之后，可以用于位姿估计。这样，在进行目标姿态估计时，可以将待处理图像作为网络输入，输出即为对应的姿态参数。这种基于图像识别的方法由于不存在严格的投影关系方程，因此很难得到目标姿态参数的准确估计值，而且泛化性很差。其二是利用深度学习方法预测目标对象的二维关键点，并结合目标对象的三维模型和相机标定信息，利用三维模型的模型点和图像中目标对象的二维关键点之间的投影关系估计位姿。该方法可以帮助提升估计结果的准确性和鲁棒性，但是该方法需要预先生成目标对象的三维模型以及准确的模型匹配算法，给估计过程带来了较大难度。

技术实现要素：

4.本技术实施例的目的在于提供一种位姿确定方法、装置、电子设备和可读存储介质，用以同时得到目标模型以及目标位姿，从而解决了在目标对象的姿态估计过程中，目标对象的目标模型无法预先生成以及目标对象与目标模型之间匹配困难的问题。
5.第一方面，本技术实施例提供了一种位姿确定方法，该方法包括：获取待处理图像集；所述待处理图像集中包括目标对象对应的多个目标图像；针对每一个所述目标图像，基于该目标图像的目标关键点信息，确定所述目标对象的初始位姿信息；确定所述目标对象的初始模型；基于所述初始模型以及所述多个目标图像各自对应的所述初始位姿信息，确定所述目标对象的目标模型和所述目标对象的目标位姿。这样，可以同时确定出目标模型和目标位姿，使得不用预先生成对象模型以及无需设计目标对象与对象模型之间的匹配算法，优化了位姿估计过程的处理步骤。
6.可选地，所述位姿确定方法还包括：获取与所述目标对象相匹配的先验信息；所述先验信息用于表征所述目标对象的结构信息和/或尺寸信息；所述基于所述初始模型以及所述多个目标图像各自对应的所述初始位姿信息，确定所述目标对象的目标模型和所述目标对象的目标位姿，包括：基于所述先验信息、所述初始模型以及所述多个目标图像各自对应的所述初始位姿信息，确定所述目标对象的目标模型和所述目标对象的目标位姿。这样，可以通过添加先验信息约束目标对象的结构和/或尺寸，提高优化精度，使得到的目标模
型、目标位姿更加准确。
7.可选地，所述基于所述先验信息、所述初始模型以及所述多个目标图像各自对应的所述初始位姿信息，确定所述目标对象的目标模型和所述目标对象的目标位姿，包括：基于所述先验信息、所述初始模型以及多个所述初始位姿信息，计算最小误差值；其中，所述最小误差值通过对象规格误差值和重投影误差值进行表征；所述对象规格误差值表征得到的对象模型所对应的结构信息和/或尺寸信息与所述先验信息之间的误差；所述重投影误差值表征得到的对象模型在对应的目标图像中的投影点与对应关键点之间的重投影误差；将得到所述最小误差值时优化得到的对象模型确定为所述目标模型，以及将得到所述最小误差值时优化得到的位姿确定为所述目标位姿。这里，提供了一种可以同时确定目标模型和目标位姿的实施方式。
8.可选地，所述最小误差值基于以下步骤得到：在检测到误差值小于误差阈值时，将该误差值确定为所述最小误差值；或者在迭代次数达到迭代上限时，将多个误差值中最小的误差值确定为所述最小误差值；其中，达到迭代上限时所对应的迭代次数阈值与所述待处理图像集中包括所述目标图像的数量匹配。这里，提供了确定出最小误差值的两种实施方式，在实际应用过程中可以择一使用。
9.可选地，所述基于所述先验信息、所述初始模型以及多个所述初始位姿信息，计算最小误差值，包括：针对每一次迭代计算，基于所述先验信息以及当次优化得到的所述目标对象的当次模型，计算当次对象规格误差值；以及基于所述当次模型以及当次对应的初始位姿信息，计算当次重投影误差值；以及基于所述当次对象规格误差值和所述当次重投影误差值，确定所述最小误差值。这样，可以基于对象规格误差值以及重投影误差值，确定出最小误差值，以使得确定出的目标模型与目标对象更加贴近，确定出的目标位姿与目标对象在目标图像拍摄时刻的实际位姿更加贴近。
10.可选地，所述基于所述当次对象规格误差值和所述当次重投影误差值，确定所述最小误差值，包括：将所述当次对象规格误差值与所述当次重投影误差值所对应的乘积或和，确定为当次迭代计算得到的误差值；以及基于所述当次迭代计算得到的误差值以及历史迭代计算得到的误差值，确定所述最小误差值。这里，提供了一种可以确定最小误差值的方式。
11.可选地，所述目标关键点信息包括目标关键点的位置信息；以及所述针对每一个所述目标图像，基于该目标图像的目标关键点信息，确定所述目标对象的初始位姿信息，包括：基于所述目标关键点的位置信息以及相机标定信息，确定该目标关键点在世界坐标系下的初始位置信息；所述世界坐标系包括以所述目标对象的运动平面作为坐标面的坐标系；确定与所述初始位置信息匹配的初始偏航角信息；基于所述初始位置信息和所述初始偏航角信息，确定所述目标对象的初始位姿信息。以利于确定出更加准确的目标位姿信息。
12.可选地，所述确定与所述初始位置信息匹配的初始偏航角信息，包括：在目标角度范围内，选取多个角度与所述初始位置信息进行匹配，确定所述目标关键点对应的模型关键点在各个角度下分别对应的重投影误差值；将最小的重投影误差值对应的角度信息确定为所述初始偏航角信息。以使得初始偏航角信息更加接近于目标偏航角信息。
13.可选地，所述初始模型预先基于如下步骤确定：针对对象模型库中的每一个对象模型，确定表征该对象模型的模型关键点在目标图像中的投影点；以及确定所述投影点与
所述目标图像的对应关键点之间的重投影误差值；将最小的重投影误差值所对应的对象模型确定为所述初始模型。这样，可以使得初始模型能够更加贴近于目标模型，加快确定目标模型的速率。
14.可选地，所述待处理图像集包括从所述目标对象的运动路径中确定的多个目标图像。这样，通过能够表征目标对象运动轨迹的多个目标图像，可以得到较为接近的初始位姿信息。
15.第二方面，本技术实施例提供了一种位姿确定装置，该装置包括：获取模块，用于获取待处理图像集；所述待处理图像集中包括目标对象对应的多个目标图像；第一确定模块，用于针对每一个所述目标图像，基于该目标图像的目标关键点信息，确定所述目标对象的初始位姿信息；第二确定模块，用于确定所述目标对象的初始模型；第三确定模块，用于基于所述初始模型以及所述多个目标图像各自对应的所述初始位姿信息，确定所述目标对象的目标模型和所述目标对象的目标位姿。
16.第三方面，本技术实施例提供一种电子设备，包括处理器以及存储器，所述存储器存储有计算机可读取指令，当所述计算机可读取指令由所述处理器执行时，运行如上述第一方面提供的所述方法中的步骤。
17.第四方面，本技术实施例提供一种可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时运行如上述第一方面提供的所述方法中的步骤。
18.本技术的其他特征和优点将在随后的说明书阐述，并且，部分地从说明书中变得显而易见，或者通过实施本技术实施例了解。本技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
19.为了更清楚地说明本技术实施例的技术方案，下面将对本技术实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本技术的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。
20.图1为本技术实施例提供的一种位姿确定方法的流程图；
21.图2为本技术实施例提供的另一种位姿确定方法的流程图；
22.图3为本技术实施例提供的一种位姿确定装置的结构框图；
23.图4为本技术实施例提供的一种用于执行位姿确定方法的电子设备的结构示意图。
具体实施方式
24.下面将结合本技术实施例中附图，对本技术实施例中的技术方案进行清楚、完整地描述。
25.近年来，基于人工智能的计算机视觉、深度学习、机器学习、图像处理、图像识别等技术研究取得了重要进展。人工智能(artificial intelligence，ai)是研究、开发用于模拟、延伸人的智能的理论、方法、技术及应用系统的新兴科学技术。人工智能学科是一门综合性学科，涉及芯片、大数据、云计算、物联网、分布式存储、深度学习、机器学习、神经网络
等诸多技术种类。计算机视觉作为人工智能的一个重要分支，具体是让机器识别世界，计算机视觉技术通常包括人脸识别、活体检测、指纹识别与防伪验证、生物特征识别、人脸检测、行人检测、目标检测、行人识别、图像处理、图像识别、图像语义理解、图像检索、文字识别、视频处理、视频内容识别、行为识别、三维重建、虚拟现实、增强现实、同步定位与地图构建(slam)、计算摄影、机器人导航与定位等技术。随着人工智能技术的研究和进步，该项技术在众多领域展开了应用，例如安防、城市管理、交通管理、楼宇管理、园区管理、人脸通行、人脸考勤、物流管理、仓储管理、机器人、智能营销、计算摄影、手机影像、云服务、智能家居、穿戴设备、无人驾驶、自动驾驶、智能医疗、人脸支付、人脸解锁、指纹解锁、人证核验、智慧屏、智能电视、摄像机、移动互联网、网络直播、美颜、美妆、医疗美容、智能测温等领域。
26.相关技术中，存在在目标对象的姿态估计过程中对象模型无法预先生成以及目标对象与目标模型之间匹配困难的问题。为了解决上述问题，本技术提供一种位姿确定方法、装置、电子设备和可读存储介质。通过首先获取与目标模型存在差别的初始模型，然后基于该初始模型与多个目标图像中分别示出的目标对象的初始位姿信息，同时确定出目标对象的目标模型和目标位姿，以使得不用预先生成目标模型以及无需设计目标对象与目标模型之间的匹配算法，从而解决了上述问题。在实际应用时，本技术可以应用于诸如车辆、无人机等对应的位姿估计过程。示例性地，本技术以应用于车辆的位姿估计过程为例阐述该位姿确定方法。也即，上述目标对象可以包括目标车辆。而保证目标车辆的目标位姿的准确性是必要的。例如在智能交通监控领域中，可以通过确定出的目标位姿进行诸如统计车流量、判断驾驶员是否违规驾驶等情况。
27.以上现有技术中的方案所存在的缺陷，均是发明人在经过实践并仔细研究后得出的结果，因此，上述问题的发现过程以及下文中本发明实施例针对上述问题所提出的解决方案，都应该是发明人在本发明过程中对本发明做出的贡献。
28.请参考图1，其示出了本技术实施例提供的第一种位姿确定方法的流程图。如图1所示，该位姿确定方法包括以下步骤101至步骤104。
29.步骤101，获取待处理图像集；所述待处理图像集中包括目标对象对应的多个目标图像；
30.上述目标图像例如可以包括目标货车、目标面包车、目标轿车等目标对象所对应的图像。
31.进一步的，可以在获取了目标对象的多个图像之后，对这些图像进行整理，以得到上述待处理图像集。在一些应用场景中，上述目标图像可以通过网络资源获得，也可以通过在实地利用相机拍摄得到，还可以通过预先录制的录像获取。这里，在通过录像获取时，可以将截取的包括目标对象的图像视为目标图像。
32.在一些可选的实现方式中，所述待处理图像集可以包括从目标对象的运动路径中确定的多个目标图像。
33.在一些应用场景中，可以在目标对象的运动路径中拍摄多个图像，拍摄的图像可以视为目标图像。这样，拍摄得到的多个目标图像可以用于表征目标对象的运动轨迹。通过能够表征目标对象运动轨迹的多个目标图像，可以得到较为接近的初始位姿信息。
34.步骤102，针对每一个所述目标图像，基于该目标图像的目标关键点信息，确定所述目标对象的初始位姿信息；
35.获取到上述待处理图像集之后，可以针对待处理图像集中的每个目标图像的目标关键点信息确定出目标对象的初始位姿信息。
36.上述目标关键点信息可以视为目标图像中能够用于表征目标对象的位置的关键点的信息。关键点例如可以包括车辆前车标、车辆左视镜、车辆右视镜等在目标车辆图像中对应的点。在一些应用场景中，可以在上述的诸如车辆前车标、车辆左视镜、车辆右视镜等关键点中选择一个或多个作为目标关键点，目标关键点对应的图像坐标信息可以视为上述目标关键点信息。这里的图像坐标信息例如可以为(u，v)。这里的坐标参数“u”、“v”可以为在图像坐标系下的任意值。
37.上述初始位姿信息可以视为能够粗糙表征目标对象在实际应用场景中的位置信息和姿态信息。该初始位姿信息例如可以通过目标对象在世界坐标系下的坐标信息(x，y，θ)表征。进一步的，上述坐标参数“x”、“y”、“θ”可以为在该世界坐标系下对应的任意值。其中，“θ”可以视为目标对象的姿态信息。
38.步骤103，确定所述目标对象的初始模型；
39.上述初始模型例如可以是预先确定的与目标对象相类似的模型。该模型可以与目标模型对应的尺寸相差较大，继而无需预先生成目标模型。例如，目标对象为轿车，初始模型例如可以为面包车模型。在一些应用场景中，可以预先准备车辆模型库，该车辆模型库例如可以实际应用中的各种车型为参照设计。
40.在一些可选的实现方式中，所述初始模型预先基于如下步骤确定：
41.步骤a，针对对象模型库中的每一个对象模型，确定表征该对象模型的模型关键点在目标图像中的投影点；
42.上述对象模型库例如可以为上述车辆模型库。相应的，上述模型关键点例如可以包括车辆模型的车标、左视镜等实质上能够表征对象模型的关键点。
43.例如，针对车辆模型库中的每一个车辆模型，可以确定表征该车辆模型的前车标关键点在目标车辆图像中的投影点。
44.进一步的，上述投影点例如可以通过投影公式得到。例如，已知目标车辆模型信息(x
w
，y
w
，z
w
)以及其位姿信息(x，y，θ)，可以利用投影公式计算出投影点对应的图像坐标为(u，v)。在这些应用场景中，上述u、v可以表征在其所属坐标系下的任意数字，上述x
w
、y
w
、z
w
可以分别表征目标车辆模型的长度信息、宽度信息以及高度l信息。上述x，y可以为在其所属坐标系下的任意值，上述θ可以为(0，2π)内的任意值。上述投影公式例如可以包括：其中，λ为尺度因子，k为相机的内参数，p为相机的外参数。
45.步骤b，确定所述投影点与所述目标图像的对应关键点之间的重投影误差值；
46.确定了上述投影点之后，可以计算该投影点与该投影点在目标图像中的对应关键点之间的重投影误差值。例如，确定了利用车辆前车标作为车辆模型关键点a之后，可以基于上述投影公式得到该模型关键点a在目标图像中的投影点a＇。然后可以确定投影点a＇与其对应关键点a之间的重投影误差值。在一些应用场景中，例如可以通过最小二乘法计算上
述重投影误差值。这里，利用最小二乘法计算该重投影误差值的方式为现有技术，此处不赘述。
47.步骤c，将最小的重投影误差值所对应的对象模型确定为所述初始模型。
48.确定了各个对象模型分别对应的重投影误差值之后，可以比较各个重投影误差值的大小，继而可以确定出最小的重投影误差值。
49.确定了最小的重投影误差值之后，可以将该最小的重投影误差值对应的对象模型确定为上述初始模型。例如，确定了车辆模型a对应的重投影误差值最小时，可以将车辆模型a确定为初始模型。
50.通过上述步骤a至步骤c，可以通过计算的重投影误差值确定出初始模型。使得初始模型能够更加贴近于目标模型，加快确定目标模型的速率。
51.步骤104，基于所述初始模型以及所述多个目标图像各自对应的所述初始位姿信息，确定所述目标对象的目标模型和所述目标对象的目标位姿。
52.确定了初始模型以及多个初始位姿信息之后，例如可以基于不同的初始位姿信息利用最小二乘法不断迭代优化，以得到上述目标模型和目标位姿。在一些应用场景中，上述目标模型例如可以应用于测量车辆的长度信息、高度信息和/或宽度信息等。
53.通过上述步骤101至步骤104，可以同时确定出目标模型和目标位姿，使得不用预先生成对象模型以及无需设计目标对象与对象模型之间的匹配算法，优化了位姿估计过程的处理步骤。
54.请参考图2，其示出了本技术实施例提供的另一种图像处理方法的流程图。如图2所示，该图像处理方法包括以下步骤201至步骤205。
55.步骤201，获取待处理图像集；所述待处理图像集中包括目标对象对应的多个目标图像；
56.上述步骤201的实现过程以及取得的技术效果可以与图1所示实施例的步骤101相同或相似，此处不赘述。
57.步骤202，针对每一个所述目标图像，基于该目标图像的目标关键点信息，确定所述目标对象的初始位姿信息；
58.上述步骤202的实现过程以及取得的技术效果可以与图1所示实施例的步骤102相同或相似，此处不赘述。
59.步骤203，确定所述目标对象的初始模型；
60.上述步骤203的实现过程以及取得的技术效果可以与图1所示实施例的步骤103相同或相似，此处不赘述。
61.步骤204，获取与所述目标对象相匹配的先验信息；所述先验信息用于表征所述目标对象的结构信息和/或尺寸信息；
62.在一些应用场景中，可以获取目标对象的先验信息。上述先验信息例如可以包括目标对象的诸如长度信息、宽度信息、高度信息等尺寸信息，以及车牌与前车标之间的共面信息、左视镜与右视镜之间的对称信息等结构信息。
63.步骤205，基于所述先验信息、所述初始模型以及所述多个目标图像各自对应的所述初始位姿信息，确定所述目标对象的目标模型和所述目标对象的目标位姿。
64.获取到先验信息、初始模型以及多个初始位姿信息之后，可以同时确定出目标模
型和目标位姿。
65.实践中，在获取目标图像时，常常存在缺乏目标对象在各个角度的图像信息，继而使得图像中的一些关键点由于获取视角的不同导致优化精度有限的问题。通过上述步骤201至步骤205，可以通过添加先验信息约束目标对象的结构和/或尺寸，提高优化精度，使得到的目标模型、目标位姿更加准确。
66.在一些可选的实现方式中，可以通过以下子步骤同时确定出目标模型和目标位姿：
67.子步骤2051，基于所述先验信息、所述初始模型以及多个所述初始位姿信息，计算最小误差值；其中，所述最小误差值通过对象规格误差值和重投影误差值进行表征；所述对象规格误差值表征得到的对象模型所对应的结构信息和/或尺寸信息与所述先验信息之间的误差；所述重投影误差值表征得到的对象模型在对应的目标图像中的投影点与对应关键点之间的重投影误差；
68.在一些应用场景中，可以基于多个初始位姿信息进行迭代计算，得到最小误差值。例如可以利用非线性最小二乘法计算最小误差值。在这些应用场景中，最小误差值可以通过对象规格误差值和重投影误差值进行表征。例如，可以通过将对象规格误差值与重投影误差值相乘得到的最小乘积作为最小误差值；也可以将对象规格误差值与重投影误差值相加得到的最小和作为最小误差值。这里，对象规格误差值与重投影误差值相加得到的和，可以是两者的代数和，也可以是两者的加权和，具体可以实际情况进行选择，此处不限定。上述加权和，例如可以包括为两者分配不同的权重值实现。
69.在一些可选的实现方式中，上述子步骤2051可以包括以下步骤：
70.步骤一，针对每一次迭代计算，基于所述先验信息以及当次优化得到的所述目标对象的当次模型，计算当次对象规格误差值；
71.在一些应用场景中，针对每一次迭代计算，可以基于先验信息以及当前得到的目标对象的当次模型，确定当次对象规格误差值。上述当次对象规格误差值例如可以视为表征当次得到的目标模型与先验信息之间的误差。例如，目标车辆的先验信息为：高度为3米、宽度为2米、长度为5米，此时，若得到的对象模型表征目标车辆：高度为3米、宽度为1.8米、长度为5米，可以计算当次对象规格误差值为：高度误差为0米、宽度误差为0.2米、长度误差为0米。
72.步骤二，基于所述当次模型以及当次对应的初始位姿信息，计算当次重投影误差值；
73.在一些应用场景中，针对每一次迭代计算，可以基于当前得到的对象模型以及当次对应的初始位姿信息，确定当次对应的重投影误差值。例如，可以确定当次对应的初始位姿信息所对应的目标图像，然后可以确定能够表征当前得到的对象模型的模型关键点对应的投影点，以及计算该投影点与目标图像的对应关键点之间的重投影误差值。这里，可以参照上述实施例中步骤b的相关部分，此处不赘述。
74.步骤三，基于所述当次对象规格误差值和所述当次重投影误差值，确定所述最小误差值。
75.确定了当次对象规格误差值和当次重投影误差值之后，可以确定上述最小误差值。例如，可以为当次规格误差值以及当前重投影误差值分配不同的权重，确定上述最小误
差值。
76.相关技术中，存在重投影误差值较小，但是得到的位姿却与实际位姿差别较大的情况。因此，本实施例通过上述子步骤一至子步骤三引入了对象规格误差值，继而可以基于对象规格误差值以及重投影误差值，确定出最小误差值，以使得确定出的目标模型与目标对象更加贴近，确定出的目标位姿与目标对象在目标图像拍摄时刻的实际位姿更加贴近。
77.在一些可选的实现方式中，上述步骤三可以包括：首先，将所述当次对象规格误差值与所述当次重投影误差值所对应的乘积或和，确定为当次迭代计算得到的误差值；
78.也就是说，在一些应用场景中，可以将当次规格误差值与当次重投影误差值进行累加，得到两者之和，继而可以得到当前迭代时所对应的误差值。在另一些应用场景中，也可以将当次规格误差值与当次重投影误差值相乘，得到两者之积，继而可以得到当前迭代时所对应的误差值。
79.然后，基于所述当次迭代计算得到的误差值以及历史迭代计算得到的误差值，确定所述最小误差值。
80.每一次迭代计算可以对应有误差值，在得到当次迭代对应的误差值之后，可以将该误差值与历史迭代计算得到的误差值进行比较，确定出当前对应的最小误差值。
81.子步骤2052，将得到所述最小误差值时优化得到的对象模型确定为所述目标模型，以及将得到所述最小误差值时优化得到的位姿确定为所述目标位姿。
82.得到最小误差之后，可以将得到最小误差值时所对应的对象模型确定为目标模型，并可以将此时对应的位姿确定为目标位姿。
83.在一些可选的实现方式中，所述最小误差值基于以下步骤得到：在检测到误差值小于误差阈值时，将该误差值确定为所述最小误差值；或者在迭代次数达到迭代上限时，将多个误差值中最小的误差值确定为所述最小误差值；其中，达到迭代上限时所对应的迭代次数阈值与所述待处理图像集中包括所述目标图像的数量匹配。
84.在一些应用场景中，可以在检测到误差值小于误差阈值时停止迭代计算。进一步，可以将此时优化得到的对象模型确定为目标模型，并可以将此时对应得到的位姿信息确定为目标位姿信息。这样，可以使得在当前的目标模型与目标对象基本吻合，目标位姿与目标对象的实际位姿基本吻合的同时，减小迭代计算的计算量。在这些应用场景中，上述误差阈值例如可以包括0.08、0.1等实质上可以使误差值所对应的对象模型视为目标模型的数值。
85.在另一些应用场景中，也可以在达到最大迭代次数时停止迭代计算。例如，每一个目标图像所对应的初始位姿信息均被使用，本次迭代计算过程无法再继续时，可以视为达到最大迭代次数。此时得到的对象模型可以被确定为目标模型，并可以将当前得到的位姿信息确定为目标位姿。
86.在一些可选的实现方式中，所述目标关键点信息包括目标关键点的位置信息；以及上述图1所示实施例中步骤102或者图2所示实施例中步骤202可以包括以下子步骤：
87.子步骤1，基于所述目标关键点的位置信息以及相机标定信息，确定该目标关键点在世界坐标系下的初始位置信息；所述世界坐标系包括以所述目标对象的运动平面作为坐标面的坐标系；
88.上述相机标定信息可以包括相机的内参矩阵和外参矩阵，以对拍摄的图像进行矫正，得到畸变较小的目标图像。
89.上述世界坐标系可以包括以目标对象的运动平面作为坐标面的坐标系。例如，可以将目标车辆的运动路面作为横纵坐标面的路面坐标系视为世界坐标系。
90.通过目标关键点的位置信息以及相机标定信息，可以确定该目标关键点在世界坐标系下的初始位置信息。例如，将车辆前车标作为目标关键点时，可以基于目标关键点的图像坐标(u，v)以及相机标定信息，利用投影公式确定出该目标关键点在世界坐标系下的初始位置信息(x，y，z)。当世界坐标系为上述路面坐标系时，该初始位置信息可以为(x，y，0)。
91.子步骤2，确定与所述初始位置信息匹配的初始偏航角信息；
92.确定了目标关键点在世界坐标系下的初始位置信息之后，可以继续确定与该初始位置信息相匹配的初始偏航角信息。
93.在一些可选的实现方式中，上述初始偏航角信息可以基于如下步骤确定：首先，在目标角度范围内，选取多个角度与所述初始位置信息进行匹配，确定所述目标关键点对应的模型关键点在各个角度下分别对应的重投影误差值；
94.上述目标角度范围例如可以包括(0，2π)。
95.在一些应用场景中，可以在目标角度范围内选取多个角度分别与初始位置信息进行匹配。例如，可以等间隔选取90
°
、180
°
、270
°
、360
°
等分别与初始位置信息匹配。进一步的，在选取了90
°
作为与初始位置信息进行匹配的角度之后，上述模型关键点的位姿信息可以为(x，y，90
°
)，此时可以计算该模型关键点对应的投影点与目标关键点之间的重投影误差。相类似地，可以分别计算多个模型关键点在各自角度下分别对应的重投影误差。
96.然后，将最小的重投影误差值对应的角度信息确定为所述初始偏航角信息。
97.确定了多个重投影误差值之后，可以将最小的重投影误差值所对应的角度信息确定为初始偏航角信息，以使得初始偏航角信息更加接近于目标偏航角信息。例如，确定了位姿信息为(x，y，90
°
)的模型关键点所对应的重投影误差值最小时，可以将90
°
确定为初始偏航角信息。
98.子步骤3，基于所述初始位置信息和所述初始偏航角信息，确定所述目标对象的初始位姿信息。
99.确定了初始位置信息以及初始偏航角信息之后，可以确定目标对象的初始位姿信息。例如，确定了初始位置信息(x，y，0)以及初始偏航角信息90
°
时，可以确定出初始位姿信息(x，y，90
°
)。
100.通过上述子步骤1至子步骤3，可以粗糙确定出目标对象的初始位姿信息，利于确定出更加准确的目标位姿信息。
101.请参考图3，其示出了本技术实施例提供的一种位姿确定装置的结构框图，该位姿确定装置可以是电子设备上的模块、程序段或代码。应理解，该装置与上述图1方法实施例对应，能够执行图1方法实施例涉及的各个步骤，该装置具体的功能可以参见上文中的描述，为避免重复，此处适当省略详细描述。
102.可选地，上述位姿确定装置包括获取模块301，第一确定模块302、第二确定模块303和第三确定模块304。其中，获取模块301，用于获取待处理图像集；所述待处理图像集中包括目标对象对应的多个目标图像；第一确定模块302，用于针对每一个所述目标图像，基于该目标图像的目标关键点信息，确定所述目标对象的初始位姿信息；第二确定模块303，用于确定所述目标对象的初始模型；第三确定模块304，用于基于所述初始模型以及所述多
个目标图像各自对应的所述初始位姿信息，确定所述目标对象的目标模型和所述目标对象的目标位姿。
103.可选地，所述位姿确定装置还包括信息获取模块，上述信息获取模块用于：获取与所述目标对象相匹配的先验信息；所述先验信息用于表征所述目标对象的结构信息和/或尺寸信息；所述第三确定模块304进一步用于：基于所述先验信息、所述初始模型以及所述多个目标图像各自对应的所述初始位姿信息，确定所述目标对象的目标模型和所述目标对象的目标位姿。
104.可选地，所述第三确定模块304进一步用于：基于所述先验信息、所述初始模型以及多个所述初始位姿信息，计算最小误差值；其中，所述最小误差值通过对象规格误差值和重投影误差值进行表征；所述对象规格误差值表征得到的对象模型所对应的结构信息和/或尺寸信息与所述先验信息之间的误差；所述重投影误差值表征得到的对象模型在对应的目标图像中的投影点与对应关键点之间的重投影误差；将得到所述最小误差值时优化得到的对象模型确定为所述目标模型，以及将得到所述最小误差值时优化得到的位姿确定为所述目标位姿。
105.可选地，所述最小误差值基于以下步骤得到：在检测到误差值小于误差阈值时，将该误差值确定为所述最小误差值；或者在迭代次数达到迭代上限时，将多个误差值中最小的误差值确定为所述最小误差值；其中，达到迭代上限时所对应的迭代次数阈值与所述待处理图像集中包括所述目标图像的数量匹配。
106.可选地，所述第三确定模块304进一步用于：针对每一次迭代计算，基于所述先验信息以及当次优化得到的所述目标对象的当次模型，计算当次对象规格误差值；以及基于所述当次模型以及当次对应的初始位姿信息，计算当次重投影误差值；以及基于所述当次对象规格误差值和所述当次重投影误差值，确定所述最小误差值。
107.可选地，所述第三确定模块304进一步用于：将所述当次对象规格误差值与所述当次重投影误差值所对应的乘积或和，确定为当次迭代计算得到的误差值；以及基于所述当次迭代计算得到的误差值以及历史迭代计算得到的误差值，确定所述最小误差值。
108.可选地，所述第一确定模块302进一步用于：基于所述目标关键点的位置信息以及相机标定信息，确定该目标关键点在世界坐标系下的初始位置信息；所述世界坐标系包括以所述目标对象的运动平面作为坐标面的坐标系；确定与所述初始位置信息匹配的初始偏航角信息；基于所述初始位置信息和所述初始偏航角信息，确定所述目标对象的初始位姿信息。
109.可选地，所述第一确定模块302进一步用于：在目标角度范围内，选取多个角度与所述初始位置信息进行匹配，确定所述目标关键点对应的模型关键点在各个角度下分别对应的重投影误差值；将最小的重投影误差值对应的角度信息确定为所述初始偏航角信息。
110.可选地，所述初始模型预先基于如下步骤确定：针对对象模型库中的每一个对象模型，确定表征该对象模型的模型关键点在目标图像中的投影点；以及确定所述投影点与所述目标图像的对应关键点之间的重投影误差值；将最小的重投影误差值所对应的对象模型确定为所述初始模型。
111.可选地，所述待处理图像集包括从所述目标对象的运动路径中确定的多个目标图像。
112.需要说明的是，本领域技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统和装置的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再重复描述。
113.请参照图4，图4为本技术实施例提供的一种用于执行位姿确定方法的电子设备的结构示意图，所述电子设备可以包括：至少一个处理器401，例如cpu，至少一个通信接口402，至少一个存储器403和至少一个通信总线404。其中，通信总线404用于实现这些组件直接的连接通信。其中，本技术实施例中设备的通信接口402用于与其他节点设备进行信令或数据的通信。存储器403可以是高速ram存储器，也可以是非易失性的存储器(non
‑
volatile memory)，例如至少一个磁盘存储器。存储器403可选的还可以是至少一个位于远离前述处理器的存储装置。存储器403中存储有计算机可读取指令，当所述计算机可读取指令由所述处理器401执行时，电子设备例如可以执行上述图1所示方法过程。
114.可以理解，图4所示的结构仅为示意，所述电子设备还可包括比图4中所示更多或者更少的组件，或者具有与图4所示不同的配置。图4中所示的各组件可以采用硬件、软件或其组合实现。
115.本技术实施例提供一种可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时，执行如图1所示方法实施例中电子设备所执行的方法过程。
116.本实施例公开一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，计算机能够执行上述各方法实施例所提供的方法，例如，该方法可以包括：获取待处理图像集；所述待处理图像集中包括目标对象对应的多个目标图像；针对每一个所述目标图像，基于该目标图像的目标关键点信息，确定所述目标对象的初始位姿信息；确定所述目标对象的初始模型；基于所述初始模型以及所述多个目标图像各自对应的所述初始位姿信息，确定所述目标对象的目标模型和所述目标对象的目标位姿。
117.在本技术所提供的实施例中，应该理解到，所揭露装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。
118.另外，作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
119.再者，在本技术各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。
120.在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
121.以上所述仅为本技术的实施例而已，并不用于限制本技术的保护范围，对于本领
域的技术人员来说，本技术可以有各种更改和变化。凡在本技术的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本技术的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：物体姿态的检测方法、装置、计算机设备和存储介质与流程

位姿确定方法、装置、电子设备和可读存储介质与流程

相关文献

最热文献