一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于可微分投影的高精度多视角点云重建方法及装置

2022-07-30 18:34:32 来源:中国专利 TAG:


1.本技术涉及计算机视觉及计算摄像学技术领域,特别涉及一种基于可微分投影的高精度多视角点云重建方法及装置。


背景技术:

2.三维点云是立体视觉领域的重要表现形式,在地理测绘、电影制作、增强现实、虚拟现实等领域具有重要应用价值。对于三维物体的精确建模与表示是该领域的核心问题。三维点云通过建模物体的空间结构对物体的三维信息进行精确描述,是三维物体在数字计算机中的常见表达形式。其能够精确的描述物体在空间中每一个点的位置,其中,每一个点由一个三位组(x,y,z)精确定义,一系列点构成一个物体的点云,描述对应物体的精确三维坐标。
3.因其结构简单、处理高效等特点,点云成为工业领域主流的立体数据表现形式。然而,在工业领域中,受限于设备精度与制造成本,直接采集高精度点云并不容易。相反,二维视图易于获取,且成本低廉。因此,基于多张视图的点云重建成为工业界关注的核心问题。
4.相关技术中,通常存在精度低、速度慢等问题,使用神经网络能够较好的满足工业场景对于速度的需求。然而,相关技术基于倒角距离的度量方式无法精确度量重建点云与真实点云之间的误差,限制了高精度点云的重建,亟需改善。
5.申请内容
6.本技术提供一种基于可微分投影的高精度多视角点云重建方法及装置,以解决相关技术中基于倒角距离的度量方式无法精确度量重建点云与真实点云之间的误差,导致无法满足高精度多视角的三维点云重建需求的问题。
7.本技术第一方面实施例提供一种基于可微分投影的高精度多视角点云重建方法,包括以下步骤:获取多张rgb(red-green-blue,红绿蓝颜色系统)图像;根据所述多张rgb图像中每张rgb图像的纹理信息和/或结构信息提取所述每张rgb图像的图像特征;基于所述每张rgb图像的图像特征生成同一物体的统一特征表达,并恢复对应物体原有的三维结构,得到粗点云的重建点云;对于所述重建点云和真实点云,使用可微分投影技术渲染多个不同视角下的重建点云投影与真实点云投影,以对输入的至少一张rgb图像恢复满足预设条件的高精度多视角重建点云。
8.可选地,在本技术的一个实施例中,所述基于所述每张rgb图像的图像特征生成同一物体的统一特征表达,包括:利用预设池化算法对基于所述每张rgb图像的图像特征得到的多视图特征进行池化处理,得到所述统一特征表达。
9.可选地,在本技术的一个实施例中,所述使用可微分投影技术渲染多个不同视角下的重建点云投影与真实点云投影,以对输入的至少一张视图恢复满足预设条件的高精度多视角重建点云,包括:基于所述重建点云投影与所述真实点云投影,使用均方误差作为损失函数计算在不同视角下的误差,并对算法进行整体训练,得到收敛后的算法;利用所述收敛后的算法恢复所述至少一张视图的高精度多视角重建点云。
10.可选地,在本技术的一个实施例中,所述误差的计算公式为:
[0011][0012]
其中,表示视角i下重建点云投影坐标(x1,y1)的值,表示视角i下真实点云投影坐标(x1,y1)的值,n表示共计算n个视角,xwyh表示投影图像的宽度与长度。
[0013]
可选地,在本技术的一个实施例中,所述使用可微分投影技术渲染多个不同视角下的重建点云投影与真实点云投,包括:将不具有空间体积的点云膨胀为具有空间体积的体素;将所述体素投影至对应的空间表面。
[0014]
本技术第二方面实施例提供一种基于可微分投影的高精度多视角点云重建装置,包括:图像获取模块,用于获取多张rgb图像;特征提取模块,用于根据所述多张rgb图像中每张rgb图像的纹理信息和/或结构信息提取所述每张rgb图像的图像特征;重建模块,用于基于所述每张rgb图像的图像特征生成同一物体的统一特征表达,并恢复对应物体原有的三维结构,得到粗点云的重建点云;恢复模块,用于对于所述重建点云和真实点云,使用可微分投影技术渲染多个不同视角下的重建点云投影与真实点云投影,以对输入的至少一张rgb图像恢复满足预设条件的高精度多视角重建点云。
[0015]
可选地,在本技术的一个实施例中,所述重建模块,进一步用于,利用预设池化算法对基于所述每张rgb图像的图像特征得到的多视图特征进行池化处理,得到所述统一特征表达。
[0016]
可选地,在本技术的一个实施例中,所述恢复模块,包括:计算单元,用于基于所述重建点云投影与所述真实点云投影,使用均方误差作为损失函数计算在不同视角下的误差,并对算法进行整体训练,得到收敛后的算法;恢复单元,用于利用所述收敛后的算法恢复所述至少一张视图的高精度多视角重建点云。
[0017]
可选地,在本技术的一个实施例中,所述误差的计算公式为:
[0018][0019]
其中,表示视角i下重建点云投影坐标(x1,y1)的值,表示视角i下真实点云投影坐标(x1,y1)的值,n表示共计算n个视角,xwyh表示投影图像的宽度与长度。
[0020]
可选地,在本技术的一个实施例中,所述恢复模块,包括:膨胀单元,用于将不具有空间体积的点云膨胀为具有空间体积的体素;投影单元,用于将所述体素投影至对应的空间表面。
[0021]
本技术第三方面实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如上述实施例所述的基于可微分投影的高精度多视角点云重建方法。
[0022]
本技术第四方面实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行如上述实施例所述的基于可微分投影的高精度多视角点云重建方法。
[0023]
本技术实施例可以基于rgb图像特征生成的同一物体的统一特征表达,获得粗点云的重建点云,并使用可微分投影技术渲染多个不同视角下的重建点云投影与真实点云投影,恢复高精度多视角重建点云,进而实现对三维点云的高精度多视角重建,并为下游领域
提供技术基础。由此,解决了相关技术中基于倒角距离的度量方式无法精确度量重建点云与真实点云之间的误差,导致无法满足高精度多视角的三维点云重建需求的问题。
[0024]
本技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本技术的实践了解到。
附图说明
[0025]
本技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0026]
图1为根据本技术实施例提供的一种基于可微分投影的高精度多视角点云重建方法的流程图;
[0027]
图2为根据本技术一个实施例的基于可微分投影的高精度多视角点云重建方法的利用神经网络构建的多张视图之间的映射关系图;
[0028]
图3为根据本技术一个实施例的基于可微分投影的高精度多视角点云重建方法的利用多层感知机建立多视图统一特征与重建点云之间的映射关系图;
[0029]
图4为根据本技术一个实施例的基于可微分投影的高精度多视角点云重建方法的将体素投影至对应的空间表面的效果图;
[0030]
图5为根据本技术一个实施例的基于可微分投影的高精度多视角点云重建方法的流程图;
[0031]
图6为根据本技术实施例提供的一种基于可微分投影的高精度多视角点云重建装置的结构示意图;
[0032]
图7为根据本技术实施例提供的电子设备的结构示意图。
具体实施方式
[0033]
下面详细描述本技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本技术,而不能理解为对本技术的限制。
[0034]
下面参考附图描述本技术实施例的基于可微分投影的高精度多视角点云重建方法及装置。针对上述背景技术中心提到的相关技术中基于倒角距离的度量方式无法精确度量重建点云与真实点云之间的误差,导致无法满足高精度多视角的三维点云重建需求的问题,本技术提供了一种基于可微分投影的高精度多视角点云重建方法,在该方法中,可以基于rgb图像特征生成的同一物体的统一特征表达,获得粗点云的重建点云,并使用可微分投影技术渲染多个不同视角下的重建点云投影与真实点云投影,恢复高精度多视角重建点云,进而实现对三维点云的高精度多视角重建,并为下游领域提供技术基础。由此,解决了相关技术中基于倒角距离的度量方式无法精确度量重建点云与真实点云之间的误差,导致无法满足高精度多视角的三维点云重建需求的问题。
[0035]
具体而言,图1为本技术实施例所提供的一种基于可微分投影的高精度多视角点云重建方法的流程示意图。
[0036]
如图1所示,该基于可微分投影的高精度多视角点云重建方法包括以下步骤:
[0037]
在步骤s101中,获取多张rgb图像。
[0038]
在实际执行过程中,本技术实施例可以使用传统rgb相机直接获取rgb图像,无需使用直接获取高精度三维点云的设备,可以实现降低成本的目的。
[0039]
在步骤s102中,根据多张rgb图像中每张rgb图像的纹理信息和/或结构信息提取每张rgb图像的图像特征。
[0040]
作为一种可能实现的方式,本技术实施例可以使用多个权重共享的卷积神经网络提取每一张rgb图像的图像特征,且每一张rgb图像的图像特征能够反映对应图像的纹理信息和/或结构信息,进而为高质量点云重建提供保障。
[0041]
具体地,利用神经网络构建多张rgb图像之间的映射关系的具体结构如图2所示,输入为多张视图,其中,视图即为即步骤s101中获取的rgb图像,本技术实施例可以对多张视图进行标号,如:视图1、视图2

视图n。
[0042]
在编码阶段,本技术实施例可以使用一系列二维卷积构建图像编码器,提取每一张输入视图的图像特征,将每一张图像编码为2
×2×
512隐空间向量,得到隐空间向量1、隐空间向量2

隐空间向量n。本技术实施例针对点云重建问题,利用浅而宽的卷积神经网络提取图像的结构特征,有利于点云形状的恢复。
[0043]
在步骤s103中,基于每张rgb图像的图像特征生成同一物体的统一特征表达,并恢复对应物体原有的三维结构,得到粗点云的重建点云。
[0044]
在一些实施例中,可以基于每张rgb图像的图像特征,生成同一物体的统一特征表达,并基于多张rgb图像的统一特征表达,使用多层感知机恢复对应物体原有的三维结构,实现粗点云的重建。
[0045]
可选地,在本技术的一个实施例中,基于每张rgb图像的图像特征生成同一物体的统一特征表达,包括:利用预设池化算法对基于每张rgb图像的图像特征得到的多视图特征进行池化处理,得到统一特征表达。
[0046]
在实际执行过程中,本技术实施例可以基于均值池化、最大值池化、最小值池化或其他池化算法,对多视图特征进行池化处理,得到同一物体多张rgb图像的统一特征表达。
[0047]
具体地,如图3所示,利用多层感知机建立多视图统一特征与重建点云之间的映射关系的具体结构如图所示,本技术实施例可以使用多视图池化输出的统一特征表示,其结构为1
×1×
2048,并基于统一特征表示,使用一系列感知机构建多层感知机作为点云解码器,将统一特征表示向量解码为重建点云,其中,n的数量可以由用户自行设计,以满足不同重建点云点数的需求。
[0048]
在步骤s104中,对于重建点云和真实点云,使用可微分投影技术渲染多个不同视角下的重建点云投影与真实点云投影,以对输入的至少一张rgb图像恢复满足预设条件的高精度多视角重建点云。
[0049]
举例而言,本技术实施例对于重建点云与真实点云,可以使用可微分投影技术,渲染多个不同视角下的重建点云投影与真实点云投影,进而对输入的至少一张rgb图像恢复满足预设条件的高精度多视角重建点云。本技术实施例通过可微分投影技术渲染多个不同视角下的重建点云投影与真实点云投影,实现对三维点云的高精度多视角重建,不仅能提高重建精度,还能降低成本,为下游技术奠定技术基础。
[0050]
可选地,在本技术的一个实施例中,使用可微分投影技术渲染多个不同视角下的重建点云投影与真实点云投影,以对输入的至少一张视图恢复满足预设条件的高精度多视
角重建点云,包括:基于重建点云投影与真实点云投影,使用均方误差作为损失函数计算在不同视角下的误差,并对算法进行整体训练,得到收敛后的算法;利用收敛后的算法恢复至少一张视图的高精度多视角重建点云。
[0051]
作为一种可能实现的方式,本技术实施例可以针对重建点云投影与真实点云投影,使用均方误差作为损失函数计算两者在不同视角下的误差,对算法进行整体训练,并基于训练收敛的算法,将输入的至少一张rgb图像,恢复输出高质量的重建点云。本技术实施例通过可基于训练收敛的算法,实现对三维点云的高精度多视角重建,不仅能提高重建精度,还能降低成本,为下游技术奠定技术基础。
[0052]
可选地,在本技术的一个实施例中,误差的计算公式为:
[0053][0054]
其中,表示视角i下重建点云投影坐标(x1,y1)的值,表示视角i下真实点云投影坐标(x1,y1)的值,n表示共计算n个视角,xwyh表示投影图像的宽度与长度。
[0055]
具体地,本技术实施例可以使用均方误差计算不同视角下投影间的误差,其不同视角下投影间的均方误差定义为:
[0056][0057]
其中,表示视角i下重建点云投影坐标(x1,y1)的值,表示视角i下真实点云投影坐标(x1,y1)的值,n表示共计算n个视角,xwyh表示投影图像的宽度与长度。
[0058]
可选地,在本技术的一个实施例中,使用可微分投影技术渲染多个不同视角下的重建点云投影与真实点云投,包括:将不具有空间体积的点云膨胀为具有空间体积的体素;将体素投影至对应的空间表面。
[0059]
可以理解的是,可微分投影过程是将不具有空间体积的点云膨胀为具有空间体积体素,并将体素投影至对应的空间表面,其具体效果如图4所示。
[0060]
下面结合图2至图5所示,对本技术的一个具体实施例的基于可微分投影的高精度多视角点云重建方法进行详细阐述。
[0061]
如图5所示,本技术实施例包括以下步骤:
[0062]
步骤s501:rgb图像获取。在实际执行过程中,本技术实施例可以使用传统rgb相机直接获取rgb图像,无需使用直接获取高精度三维点云的设备,可以实现降低成本的目的。
[0063]
步骤s502:rgb图像特征编码。本技术实施例可以使用多个权重共享的卷积神经网络提取每一张rgb图像的图像特征,其特征能够反映对应图像的纹理或结构信息。
[0064]
具体地,利用神经网络构建多张rgb图像之间的映射关系的具体结构如图2所示,输入为多张视图,其中,视图即为步骤s501中获取的rgb图像,本技术实施例可以对多张视图进行标号,如:视图1、视图2

视图n。
[0065]
在编码阶段,本技术实施例可以使用一系列二维卷积构建图像编码器,提取每一张输入视图的图像特征,将每一张图像编码为2
×2×
512隐空间向量,得到隐空间向量1、隐空间向量2

隐空间向量n。本技术实施例针对点云重建问题,利用浅而宽的卷积神经网络提取图像的结构特征,有利于点云形状的恢复。
[0066]
步骤s503:rgb图像特征池化。在实际执行过程中,本技术实施例可以基于均值池
化、最大值池化、最小值池化或其他池化算法,对多视图特征进行池化处理,得到同一物体多张rgb图像的统一特征表达。
[0067]
步骤s504:点云重建。在一些实施例中,可以基于每张rgb图像的图像特征,生成同一物体的统一特征表达,并基于多张rgb图像的统一特征表达,使用多层感知机恢复对应物体原有的三维结构,实现粗点云的重建。
[0068]
具体地,利用多层感知机建立多视图统一特征与重建点云之间的映射关系的具体结构如图3所示,本技术实施例可以使用多视图池化输出的统一特征表示,其结构为1
×1×
2048,并基于统一特征表示,使用一系列感知机构建多层感知机作为点云解码器,将统一特征表示向量解码为重建点云,其中,n的数量可以由用户自行设计,以满足不同重建点云点数的需求。
[0069]
步骤s505:多角度可微分投影。举例而言,本技术实施例对于重建点云与真实点云,可以使用可微分投影技术,渲染多个不同视角下的重建点云投影与真实点云投影,进而对输入的至少一张rgb图像恢复满足预设条件的高精度多视角重建点云。本技术实施例通过可微分投影技术渲染多个不同视角下的重建点云投影与真实点云投影,实现对三维点云的高精度多视角重建,不仅能提高重建精度,还能降低成本,为下游技术奠定技术基础。
[0070]
其中,可微分投影过程是将不具有空间体积的点云膨胀为具有空间体积体素,并将体素投影至对应的空间表面,其具体效果如图4所示。
[0071]
步骤s506:投影误差计算与训练。具体地,本技术实施例可以使用均方误差计算不同视角下投影间的误差,其不同视角下投影间的均方误差定义为:
[0072][0073]
其中,表示视角i下重建点云投影坐标(x1,y1)的值,表示视角i下真实点云投影坐标(x1,y1)的值,n表示共计算n个视角,xwyh表示投影图像的宽度与长度。
[0074]
步骤s507:高精度点云重建。本技术实施例可以记录训练收敛的算法,将输入的rgb图像恢复输出高质量的重建点云,实现对三维点云的高精度多视角重建,并为下游领域提供技术基础。
[0075]
根据本技术实施例提出的基于可微分投影的高精度多视角点云重建方法,可以基于rgb图像特征生成的同一物体的统一特征表达,获得粗点云的重建点云,并使用可微分投影技术渲染多个不同视角下的重建点云投影与真实点云投影,恢复高精度多视角重建点云,进而实现对三维点云的高精度多视角重建,并为下游领域提供技术基础。由此,解决了相关技术中基于倒角距离的度量方式无法精确度量重建点云与真实点云之间的误差,导致无法满足高精度多视角的三维点云重建需求的问题。
[0076]
其次参照附图描述根据本技术实施例提出的基于可微分投影的高精度多视角点云重建装置。
[0077]
图6是本技术实施例的基于可微分投影的高精度多视角点云重建装置的方框示意图。
[0078]
如图6所示,该基于可微分投影的高精度多视角点云重建装置10包括:图像获取模块100、特征提取模块200、重建模块300和恢复模块400。
[0079]
具体地,图像获取模块100,用于获取多张rgb图像。
volatile memory),例如至少一个磁盘存储器。
[0102]
如果存储器701、处理器702和通信接口703独立实现,则通信接口703、存储器701和处理器702可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(industry standard architecture,简称为isa)总线、外部设备互连(peripheral component,简称为pci)总线或扩展工业标准体系结构(extended industry standard architecture,简称为eisa)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
[0103]
可选地,在具体实现上,如果存储器701、处理器702及通信接口703,集成在一块芯片上实现,则存储器701、处理器702及通信接口703可以通过内部接口完成相互间的通信。
[0104]
处理器702可能是一个中央处理器(central processing unit,简称为cpu),或者是特定集成电路(application specific integrated circuit,简称为asic),或者是被配置成实施本技术实施例的一个或多个集成电路。
[0105]
本实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上的基于可微分投影的高精度多视角点云重建方法。
[0106]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本技术的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或n个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0107]
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本技术的描述中,“n个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
[0108]
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更n个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本技术的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本技术的实施例所属技术领域的技术人员所理解。
[0109]
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或n个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram),只读存储器(rom),可擦除可编辑只读存储器(eprom或闪速存储器),光纤装置,以及便携式光盘只读存储器
(cdrom)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
[0110]
应当理解,本技术的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,n个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
[0111]
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
[0112]
此外,在本技术各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
[0113]
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本技术的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本技术的限制,本领域的普通技术人员在本技术的范围内可以对上述实施例进行变化、修改、替换和变型。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献