一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

物体图像轮廓基元提取方法和装置与流程

2022-02-21 06:56:41 来源:中国专利 TAG:


1.本发明涉及计算机技术领域,尤其涉及一种物体图像轮廓基元提取方法和装置。


背景技术:

2.近年来,随着人工智能技术的发展,机器视觉的智能化程度得到了显著提高。在智能机器人与工业自动化等应用领域,任务的多样性和快速更新需求,对机器视觉系统进一步提出了柔性化的迫切需求。柔性化是指同一个机器视觉系统可以通过快捷的配置,灵活适用于不同的新任务和新物体。通过单样本学习和卷积神经网络,实现从新物体的图像中提取物体上的关键轮廓特征,为位姿测量和尺寸测量等机器视觉任务提供必要的图像特征,从而使机器视觉系统具有柔性化,是实现多功能机器人和柔性智能制造的重要手段,具有全面实用化的前景。
3.目前很多机器视觉系统是针对特定任务所开发的专用系统,仅能用于特定的物体类型和功能需求,其灵活性较差,当物体类型或功能需求改变后,往往需要专家进行重新编程开发调试或模型训练,无法实现快捷的功能切换。比如现有公开文献cn106504262a。
4.图像模板匹配方法具有一定的柔性,允许通过重新配置模板图像,使视觉系统适用于新型物体。但是模板匹配仅能用于物体的整体定位,定位精度有限,无法感知物体的精确轮廓。


技术实现要素:

5.本发明提供一种物体图像轮廓基元提取方法和装置,用以解决现有技术中系统的功能单一、柔性化程度低、开发调试时间长、通用性受限的的缺陷,实现支撑物体图像及其轮廓基元标注图的引导下,对新型物体上的关键线段和圆弧进行自动精确提取,从而使机器视觉系统的图像特征提取环节具有更强的灵活性和通用性。
6.第一方面,本发明提供一种物体图像轮廓基元提取方法,包括:获取特定物体的第一图像作为支撑图像;获取所述支撑图像的二值化的轮廓基元标注图;获取所述特定物体的第二图像作为查询图像;将所述查询图像、所述支撑图像和所述二值化的轮廓基元标注图输入轮廓基元提取模型,得到所述查询图像的关键轮廓基元。
7.进一步,根据本发明提供的一种物体图像轮廓基元提取方法,其中,所述轮廓基元提取模型是通过下述方法训练得到:步骤一:将第k特定物体的支撑图像和第k特定物体的查询图像输入当前的轮廓基元提取模型中进行下述处理:根据所述第k特定物体的支撑图像获取原型描述向量;根据所述第k特定物体的查询图像获取融合前的多尺度查询特征图和融合后的多尺度查询特征图;
根据所述原型描述向量和所述融合后的多尺度查询特征图得到图像间相似度图以及图像间相似性度量损失;根据所述融合前的多尺度查询特征图和所述图像间相似度图得到三通道几何特征图;根据所述三通道几何特征图得到归一化尺度图、方向向量图和对应的几何参数回归损失;根据所述融合前的多尺度查询特征图、所述三通道几何特征图和所述图像间相似度图得到级联特征图;根据所述图像间相似度图和所述级联特征图确定图像内相似度图,以及对应的图像内相似性度量损失;根据所述图像间相似度图和所述图像内相似度图确定查询图像的轮廓基元图以及对应的轮廓基元提取损失;根据所述图像间相似性度量损失、所述几何参数损失、所述图像内相似性度量损失和所述轮廓基元提取损失确定总体损失;根据梯度反向传播算法确定所述总体损失的最小值,将所述总体损失最小时对应的第k轮廓基元提取模型的参数予以确定;步骤二:判断所述k是否等于预设定值,若不等于,则执行步骤三;若等于,则执行步骤四;步骤三:将所述对应的第k轮廓基元提取模型作为步骤一中的当前的轮廓基元提取模型,将第k 1特定物体的支撑图像和第k 1特定物体的查询图像分别替换步骤一中的第k特定物体的支撑图像和第k特定物体的查询图像后输入所述当前的轮廓基元提取模型执行步骤一;步骤四:将所述对应的第k轮廓基元提取模型的参数予以固定,并将所述第k轮廓基元提取模型作为训练结束的轮廓基元提取模型。
8.进一步,根据本发明提供的一种物体图像轮廓基元提取方法,其中,在所述根据第k特定物体的支撑图像获取原型描述向量之前,还包括:获取用于训练的图像数据集,随机选择所述图像数据集中的任一个特定物体的两张图像分别作为第k特定物体的支撑图像和第k特定物体的查询图像。
9.进一步,根据本发明提供的一种物体图像轮廓基元提取方法,其中,所述根据第k特定物体的支撑图像获取原型描述向量,具体包括:获取所述第k特定物体的支撑图像的第一二值化的轮廓基元标注图;根据所述第k特定物体的支撑图像获取融合后的多尺度支撑特征图;根据所述第一二值化的轮廓基元标注图和所述融合后的多尺度支撑特征图获取原型描述向量。
10.进一步,根据本发明提供的一种物体图像轮廓基元提取方法,其中,根据所述三通道几何特征图得到归一化尺度图、方向向量图,具体包括:将所述三通道几何特征图划分为一通道几何特征图和二通道几何特征图;对所述一通道几何特征图进行sigmoid激活函数处理得到归一化尺度图;对所述二通道几何特征图进行l2归一化函数处理得到方向向量图。
11.进一步,根据本发明提供的一种物体图像轮廓基元提取方法,其中,所述根据所述图像间相似度图和所述级联特征图确定图像内相似度图,具体包括:获取所述图像间相似度图中最大值像素的坐标;获取所述级联特征图在所述坐标处的特征向量;根据所述特征向量与所述级联特征图进行逐像素相似性度量,得到图像内相似度图。
12.进一步,根据本发明提供的一种物体图像轮廓基元提取方法,其中,所述根据所述图像内相似度图确定查询图像的轮廓基元图,具体包括:获取所述图像间相似度图中像素最大值;对所述图像内相似度图进行截断处理,得到对应的截断结果;根据所述像素最大值、所述截断结果和所述图像内相似度图确定查询图像的轮廓基元图。
13.第二方面,本发明提供一种物体图像轮廓基元提取装置,包括:支撑图像获取模块,用于获取特定物体的第一图像作为支撑图像;标注模块,用于根据所述支撑图像得到二值化的轮廓基元标注图;查询图像获取模块,用于获取所述特定物体的第二图像作为查询图像;关键轮廓基元获取模块,用于将所述查询图像、所述支撑图像和所述二值化的轮廓基元标注图输入轮廓基元提取模型,得到所述查询图像的关键轮廓基元。
14.第三方面,本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述物体图像轮廓基元提取方法的步骤。
15.第四方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述物体图像轮廓基元提取方法的步骤。
16.本发明提供的物体图像轮廓基元提取方法和装置,通过获取特定物体的第一图像作为支撑图像,和第二图像作为查询图像,进而获取支撑图像的二值化的轮廓基元标注图,然后根据获取的查询图像、所述支撑图像和所述二值化的轮廓基元标注图输入轮廓基元提取模型,得到所述查询图像的关键轮廓基元。本发明通过在支撑物体图像及其轮廓基元标注图的引导下,对新型物体上的关键线段和圆弧进行自动精确提取,从而使机器视觉系统的图像特征提取环节具有更强的灵活性和通用性。
附图说明
17.为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
18.图1是本发明提供的物体图像轮廓基元提取方法的流程示意图;图2是本发明提供的物体图像轮廓基元提取装置的结构示意图;图3是本发明提供的电子设备的结构示意图。
具体实施方式
19.为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
20.下面结合图1描述本发明的一种物体图像轮廓基元提取方法,包括:步骤100:获取特定物体的第一图像作为支撑图像;具体地,拍摄机器视觉任务中某物体的图像作为支撑图像,其中拍摄的装置可以是手机、电脑等等具有摄像功能的装备,本发明中特定的是指预先设置好的对象,或者研究的对象,而不是任意对象,下文中的特定物体中的特定也是如此。
21.步骤200:获取所述支撑图像的二值化的轮廓基元标注图;具体地,利用标注软件对支撑图像中物体上的指定的关键轮廓基元进行标注,然后将标准文件转化为二值化图像,得到二值化的轮廓基元标注图。
22.步骤300:获取所述特定物体的第二图像作为查询图像;具体地,获取与支撑图像所包含的特定物体相同的物体的第二图像作为查询图像。
23.步骤400:将所述查询图像、所述支撑图像和所述二值化的轮廓基元标注图输入轮廓基元提取模型,得到所述查询图像的关键轮廓基元。
24.具体地,将查询图像、支撑图像以及二值化的轮廓基元标注图输入到轮廓基元提取模型中,使得在支撑物体图像及其轮廓基元标注图的引导下,实现对查询图像的上的关键轮廓基元的自动提取。
25.本发明提供的物体图像轮廓基元提取装置,通过获取特定物体的第一图像作为支撑图像,和第二图像作为查询图像,进而获取支撑图像的二值化的轮廓基元标注图,然后根据获取的查询图像、所述支撑图像和所述二值化的轮廓基元标注图输入轮廓基元提取模型,得到所述查询图像的关键轮廓基元。本发明通过在支撑物体图像及其轮廓基元标注图的引导下,对新型物体上的关键线段和圆弧进行自动精确提取,从而使机器视觉系统的图像特征提取环节具有更强的灵活性和通用性。
26.另外,本发明还可以对获取的关键轮廓基元执行轮廓细化与外点剔除算法,获得单像素宽度的轮廓基元图,并进行基于最小二乘法的直线拟合或椭圆拟合,得到指定轮廓基元在图像中的精确几何参数方程。
27.进一步,根据本发明提供的一种物体图像轮廓基元提取方法,其中,所述轮廓基元提取模型是通过下述方法训练得到:步骤一:将第k特定物体的支撑图像和第k特定物体的查询图像输入当前的轮廓基元提取模型中进行下述处理:根据所述第k特定物体的支撑图像获取原型描述向量;根据所述第k特定物体的查询图像获取融合前的多尺度查询特征图和融合后的多尺度查询特征图;根据所述原型描述向量和所述融合后的多尺度查询特征图得到图像间相似度图以及图像间相似性度量损失;
根据所述融合前的多尺度查询特征图和所述图像间相似度图得到三通道几何特征图;根据所述三通道几何特征图得到归一化尺度图、方向向量图和对应的几何参数回归损失;根据所述融合前的多尺度查询特征图、所述三通道几何特征图和所述图像间相似度图得到级联特征图;根据所述图像间相似度图和所述级联特征图确定图像内相似度图,以及对应的图像内相似性度量损失;根据所述图像间相似度图和所述图像内相似度图确定查询图像的轮廓基元图以及对应的轮廓基元提取损失;根据所述图像间相似性度量损失、所述几何参数损失、所述图像内相似性度量损失和所述轮廓基元提取损失确定总体损失;根据梯度反向传播算法确定所述总体损失的最小值,将所述总体损失最小时对应的第k轮廓基元提取模型的参数予以确定;步骤二:判断所述k是否等于预设定值,若不等于,则执行步骤三;若等于,则执行步骤四;步骤三:将所述对应的第k轮廓基元提取模型作为步骤一中的当前的轮廓基元提取模型,将第k 1特定物体的支撑图像和第k 1特定物体的查询图像分别替换步骤一中的第k特定物体的支撑图像和第k特定物体的查询图像后输入所述当前的轮廓基元提取模型执行步骤一;步骤四:将所述对应的第k轮廓基元提取模型的参数予以固定,并将所述第k轮廓基元提取模型作为训练结束的轮廓基元提取模型。
28.具体地,本发明实施例中根据第k特定物体的支撑图像i s获取原型描述向量。再根据第k特定物体的查询图像i q得到融合前和融合后的多尺度查询特征图hq0和hq。
29.将上述的原型描述向量p与多尺度查询特征图hq进行逐像素的相似性度量计算,得到图像间相似度图sinter,即(1)其中,为sigmoid函数,和 分别是缩放系数和偏置,默认取值为, 是余弦距离度量函数,输出范围是[0,1]。其中,图像间相似性度量损失为:(2)其中,(i=1,2,

,ncpi)是得到的图像间相似度图sinter中所有真值轮廓基元像素的相似度值,ncpi是真值轮廓基元像素的数量。 (i=1,2,

,nbg)是得到的图像间相似度图sinter中所有真值背景像素的相似度值,nbg是真值背景像素的数量。
为指示函数。为期望间隔,取值范围为(0,1),默认取值为0.2。
[0030]
根据得到的融合前的多尺度特征图hq0与得到的图像相间相似度图sinter进行级联,然后通过三个3*3卷积层组成的回归网络,输出三通道的几何特征图g0q,继而根据所述三通道的几何特征图g0q归一化尺度图gscale和方向向量图gangle。同时,得到对应的几何参数回归损失:(3)其中,和(i=1,2,

,ncpi)分别是归一化尺度图gscale和方向向量图gangle上真值轮廓基元像素的方向向量和尺度,和分别是预测值和对应的真值。
[0031]
用两个1*1卷积层将得到的hq0降维到64维,然后得到的三通道的几何特征图g0q、归一化二维坐标图x和步骤s132中得到的图像间相似度图sinter进行级联,然后利用四个3*3卷积层将级联特征图融合为级联特征图。其中归一化二维坐标图是与具有相同长度和宽度的二通道图,其每一个像素对应的向量为该像素的实际二维坐标除以该图的对角线长度。
[0032]
进一步,从图像间相似度图选取最大值像素的坐标,然后从级联特征图取出坐标处的特征向量,并将与整个级联特征图进行逐像素相似性度量,得到图像内相似度图sintra(4)其中,是余弦距离度量函数,输出范围是[0,1]。
[0033]
同时,得到图像内相似性度量损失为: (5)其中, (i=1,2,

,ncpi)是得到的级联特征图中所有真值轮廓基元像素的特征集合, (i=1,2,

,nbg)是得到的级联特征图中所有真值背景像素的特征集合。为余弦距离度量函数,取值范围是[0,1]。是期望类间最小间隔,默认取值为0.3, 是期望类内最大间隔,默认取值为0.1。
[0034]
获取图像间相似度图sinter中的最大值s max,,并对图像内相似度图进行截断操作,然后与sinter一起输入函数o,函数o由三个3*3卷积层以及sigmoid函数构成,输出第k特定物体的查询图像的轮廓基元图cq,(6)
最后将cq进行2倍上采样,使其尺寸与输入第k特定物体的查询图像相同。cq上像素的值表示了该像素属于查询图像中指定轮廓基元的置信度,取值范围是[0,1]。得到的对应的轮廓基元提取损失:(7)其中,cqgt是查询图像中轮廓基元的真值图。
[0035]
最后,总的训练损失函数为以上四个损失项之和,即l total =linter l intra l geo lcpi。模型训练采用梯度反向传播算法,通过最小化总损失函数l total来优化神经网络的权重,完成训练后保存网络权重。
[0036]
收集大量的物体图像,并对图像中的关键轮廓基元进行人工标注。可直接收集含有同一物体的成对图像,或通过随机变换将单张图像生成为成对图像,然后将成对图像随机分为支撑图像和查询图像,总共得到1807对支撑图像和查询图像,其中人工轮廓基元标注包括4844个线段和622个圆弧,这些成对的支撑图像和查询图像用于上述训练步骤所构建的卷积神经网络。将经过多次重复训练等到的最终的轮廓基元提取。
[0037]
进一步,根据本发明提供的一种物体图像轮廓基元提取方法,其中,在所述根据第k特定物体的支撑图像获取原型描述向量之前,还包括:获取用于训练的图像数据集,随机选择所述图像数据集中的任一个特定物体的两张图像分别作为第k特定物体的支撑图像和第k特定物体的查询图像。
[0038]
具体地,本发明实施例中第k特定物体的支撑图像与第k特定物体的查询图像是针对同一特定的图像拍摄的两张图像。
[0039]
进一步,根据本发明提供的一种物体图像轮廓基元提取方法,其中,所述根据第k特定物体的支撑图像获取原型描述向量,具体包括:获取所述第k特定物体的支撑图像的第一二值化的轮廓基元标注图;根据所述第k特定物体的支撑图像获取融合后的多尺度支撑特征图;根据所述第一二值化的轮廓基元标注图和所述融合后的多尺度支撑特征图获取原型描述向量。
[0040]
具体地,首先将320*320尺寸的第k特定物体的支撑图像s输入深度卷积骨干网络,得到该网络不同深度的四个输出特征图,这四个特征图的尺寸分别为输入图像尺寸的1/2、1/4、1/8和1/16。前三个特征图分别通过1*1卷积层和批归一化层的处理,分别得到特征图hm1、hm2和hm3。第四个特征图被并行地输入1*1卷积层、膨胀系数为2的3*3卷积层和膨胀系数为4的3*3卷积层进行处理,处理后的三个特征图进行逐元素相加,然后通过一个1*1卷积层和批归一化层得到特征图hm 4。然后将特征图{hm,i} (i=2,3,4)分别基于双线性插值上采样2、4和8倍,与hm1进行通道级联得到融合前的多尺度特征图h0,进一步将h0通过两个3*3卷积处理后得到融合后的多尺度特征图hs,其维度为160*160*128。
[0041]
然后利用二值化轮廓基元标注图cs,对多尺度支撑特征图进行有掩模平均池化,得到的128维向量作为关键轮廓基元的原型描述向量p,即
ꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
其中,n是多尺度支撑特征图的像素总数,下标i=1,2,...,n是像素的索引,函数为指示函数。
[0042]
进一步,根据本发明提供的一种物体图像轮廓基元提取方法,其中,根据所述三通道几何特征图得到归一化尺度图、方向向量图,具体包括:将所述三通道几何特征图划分为一通道几何特征图和二通道几何特征图;对所述一通道几何特征图进行sigmoid激活函数处理得到归一化尺度图;对所述二通道几何特征图进行l2归一化函数处理得到方向向量图。
[0043]
具体地,对gq0进行2倍双线性插值上采样,其维度变为320*320*3,前两个通道和最后一个通道分别经过sigmoid激活函数与l2归一化函数,从而分别得到轮廓基元的归一化尺度图gscale和方向向量图gangle。对于线段型轮廓基元,归一化尺度图gscale上的像素表示了线段长度与图像对角线长度的比值,方向向量图gangle上的像素表示了线段法向的方向向量;对于圆弧型轮廓基元,归一化尺度图gscale上的像素表示了圆弧上像素到圆弧中心距离与图像对角线长度的比值,方向向量图gangle上的像素表示了圆弧在像素位置法向的方向向量。
[0044]
进一步,根据本发明提供的一种物体图像轮廓基元提取方法,其中,所述根据所述图像间相似度图和所述级联特征图确定图像内相似度图,具体包括:获取所述图像间相似度图中最大值像素的坐标;获取所述级联特征图在所述坐标处的特征向量;根据所述特征向量与所述级联特征图进行逐像素相似性度量,得到图像内相似度图。
[0045]
具体地,从图像间相似度图选取最大值像素的坐标,然后从级联特征图取出坐标处的特征向量,并将与整个级联特征图进行逐像素相似性度量,得到图像内相似度图进行逐像素相似性度量,得到图像内相似度图(4)其中,是余弦距离度量函数,输出范围是[0,1]。
[0046]
进一步,根据本发明提供的一种物体图像轮廓基元提取方法,其中,所述根据所述图像内相似度图确定查询图像的轮廓基元图,具体包括:获取所述图像间相似度图中像素最大值;对所述图像内相似度图进行截断处理,得到对应的截断结果;根据所述像素最大值、所述截断结果和所述图像内相似度图确定查询图像的轮廓基元图。
[0047]
具体地,获取图像间相似度图中的最大值,并对图像内相似度图进行截断操作,然后与一起输入函数o,函数o由三个3*3卷积层以及sigmoid函数构成,输出第k特定物体的查询图像的轮廓基元图cq,(6)结合图2所示,本发明提供一种物体图像轮廓基元提取装置,包括:
支撑图像获取模块21,用于获取特定物体的第一图像作为支撑图像;标注模块22,用于根据所述支撑图像得到二值化的轮廓基元标注图;查询图像获取模块23,用于获取所述特定物体的第二图像作为查询图像;关键轮廓基元获取模块24,用于将所述查询图像、所述支撑图像和所述二值化的轮廓基元标注图输入轮廓基元提取模型,得到所述查询图像的关键轮廓基元。
[0048]
由于本发明实施例提供的装置,可以用于执行上述实施例所述的方法,其工作原理和有益效果类似,故此处不再详述,具体内容可参见上述实施例的介绍。
[0049]
本发明提供的物体图像轮廓基元提取装置,通过获取特定物体的第一图像作为支撑图像,和第二图像作为查询图像,进而获取支撑图像的二值化的轮廓基元标注图,然后根据获取的查询图像、所述支撑图像和所述二值化的轮廓基元标注图输入轮廓基元提取模型,得到所述查询图像的关键轮廓基元。本发明通过在支撑物体图像及其轮廓基元标注图的引导下,对新型物体上的关键线段和圆弧进行自动精确提取,从而使机器视觉系统的图像特征提取环节具有更强的灵活性和通用性。
[0050]
进一步,根据本发明提供的一种物体图像轮廓基元提取装置,其中,所述关键轮廓基元获取模块24,用于:步骤一:将第k特定物体的支撑图像和第k特定物体的查询图像输入当前的轮廓基元提取模型中进行下述处理:根据所述第k特定物体的支撑图像获取原型描述向量;根据所述第k特定物体的查询图像获取融合前的多尺度查询特征图和融合后的多尺度查询特征图;根据所述原型描述向量和所述融合后的多尺度查询特征图得到图像间相似度图以及图像间相似性度量损失;根据所述融合前的多尺度查询特征图和所述图像间相似度图得到三通道几何特征图;根据所述三通道几何特征图得到归一化尺度图、方向向量图和对应的几何参数回归损失;根据所述融合前的多尺度查询特征图、所述三通道几何特征图和所述图像间相似度图得到级联特征图;根据所述图像间相似度图和所述级联特征图确定图像内相似度图,以及对应的图像内相似性度量损失;根据所述图像间相似度图和所述图像内相似度图确定查询图像的轮廓基元图以及对应的轮廓基元提取损失;根据所述图像间相似性度量损失、所述几何参数损失、所述图像内相似性度量损失和所述轮廓基元提取损失确定总体损失;根据梯度反向传播算法确定所述总体损失的最小值,将所述总体损失最小时对应的第k轮廓基元提取模型的参数予以确定;步骤二:判断所述k是否等于预设定值,若不等于,则执行步骤三;若等于,则执行步骤四;步骤三:将所述对应的第k轮廓基元提取模型作为步骤一中的当前的轮廓基元提
取模型,将第k 1特定物体的支撑图像和第k 1特定物体的查询图像分别替换步骤一中的第k特定物体的支撑图像和第k特定物体的查询图像后输入所述当前的轮廓基元提取模型执行步骤一;步骤四:将所述对应的第k轮廓基元提取模型的参数予以固定,并将所述第k轮廓基元提取模型作为训练结束的轮廓基元提取模型。
[0051]
进一步,根据本发明提供的一种物体图像轮廓基元提取方法,其中,在所述根据第k特定物体的支撑图像获取原型描述向量之前,还包括:获取用于训练的图像数据集,随机选择所述图像数据集中的任一个特定物体的两张图像分别作为第k特定物体的支撑图像和第k特定物体的查询图像。
[0052]
进一步,根据本发明提供的一种物体图像轮廓基元提取装置,其中,所述关键轮廓基元获取模块24,用于:获取所述第k特定物体的支撑图像的第一二值化的轮廓基元标注图;根据所述第k特定物体的支撑图像获取融合后的多尺度支撑特征图;根据所述第一二值化的轮廓基元标注图和所述融合后的多尺度支撑特征图获取原型描述向量。
[0053]
进一步,根据本发明提供的一种物体图像轮廓基元提取装置,其中,所述关键轮廓基元获取模块24,用于:将所述三通道几何特征图划分为一通道几何特征图和二通道几何特征图;对所述一通道几何特征图进行l2归一化处理得到归一尺度图;对所述二通道几何特征图进行sigmoid激活函数处理得到方向向量图。
[0054]
进一步,根据本发明提供的一种物体图像轮廓基元提取装置,其中,所述关键轮廓基元获取模块24,用于:获取所述图像间相似度图中最大值像素的坐标;获取所述级联特征图在所述坐标处的特征向量;根据所述特征向量与所述级联特征图进行逐像素相似性度量,得到图像内相似度图。
[0055]
进一步,根据本发明提供的一种物体图像轮廓基元提取装置,其中,所述关键轮廓基元获取模块24,用于:获取所述图像间相似度图中像素最大值;对所述图像内相似度图进行截断处理,得到对应的截断结果;根据所述像素最大值、所述截断结果和所述图像内相似度图确定查询图像的轮廓基元图。
[0056]
图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)310、通信接口(communications interface)320、存储器(memory)330和通信总线340,其中,处理器310,通信接口320,存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储器330中的逻辑指令,以执行一种物体图像轮廓基元提取方法,该方法包括:获取特定物体的第一图像作为支撑图像;获取所述支撑图像的二值化的轮廓基元标注图;获取所述特定物体的第二图像作为查询图像;将所述查询图像、所述支撑图像和所述二值化的轮廓基元标注图输入轮廓基元提取模型,得到所述查询图像的关键轮廓基
元。
[0057]
此外,上述的存储器330中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0058]
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的一种物体图像轮廓基元提取方法,该方法包括:获取特定物体的第一图像作为支撑图像;获取所述支撑图像的二值化的轮廓基元标注图;获取所述特定物体的第二图像作为查询图像;将所述查询图像、所述支撑图像和所述二值化的轮廓基元标注图输入轮廓基元提取模型,得到所述查询图像的关键轮廓基元。
[0059]
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的一种物体图像轮廓基元提取方法,该方法包括:获取特定物体的第一图像作为支撑图像;获取所述支撑图像的二值化的轮廓基元标注图;获取所述特定物体的第二图像作为查询图像;将所述查询图像、所述支撑图像和所述二值化的轮廓基元标注图输入轮廓基元提取模型,得到所述查询图像的关键轮廓基元。
[0060]
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0061]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0062]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献