一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

深度预测模型的训练方法及装置、介质和电子设备与流程

2021-11-05 20:46:00 来源:中国专利 TAG:


1.本公开涉及图像处理技术领域,具体涉及一种深度预测模型的训练方法、深度预测模型的训练装置、计算机可读介质和电子设备。


背景技术:

2.在相关技术中,构建对图像进行深度预测的深度学习模型通常有两种方法:一是基于双目图像对卷积神经网络进行训练,二是基于单目图像进行网络训练。其中,第一种需要通过相对位置固定的两个视角相机同时对场景进行图像采集得到双目图像,在对网络训练和基于网络进行预测时,均需要输入成对的两帧图像;第二种方法只需要一个视角的相机对场景进行图像采集,在对网络训练和基于网络进行预测时,只需输入单张图像即可。
3.针对单目深度预测模型,通常可以采用以下方法对模型进行优化:一是通过纯监督的方法,即单帧标注的方式对单目深度预测模型进行优化;二是基于双目图像之间,图像特征的空间一致性做约束对单目深度预测模型进行优化。
4.然而,基于上述优化方式得到的单目深度预测模型进行深度预测,可能会出现对场景中包含的对象边缘的预测不准确的问题。


技术实现要素:

5.本公开的目的在于提供一种深度预测模型的训练方法、深度预测模型的训练装置、计算机可读介质和电子设备,进而至少在一定程度上提高对象边缘的深度预测结果的准确性。
6.根据本公开的第一方面,提供一种深度预测模型的训练方法,包括:获取样本图像对应的对象掩膜图像,并将样本图像输入待训练模型得到深度预测图像;根据对象掩膜图像和深度预测图像计算样本图像对应的目标损失函数;基于目标损失函数对待训练模型进行权重更新,以获取深度预测模型。
7.根据本公开的第二方面,提供一种深度预测模型的训练装置,包括:图像获取模块,用于获取样本图像对应的对象掩膜图像,并将样本图像输入待训练模型得到深度预测图像;损失计算模块,用于根据对象掩膜图像和深度预测图像计算样本图像对应的目标损失函数;权重更新模块,用于基于目标损失函数对待训练模型进行权重更新,以获取深度预测模型。
8.根据本公开的第三方面,提供一种计算机可读介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述的方法。
9.根据本公开的第四方面,提供一种电子设备,其特征在于,包括:处理器;以及存储器,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现上述的方法。
10.本公开的一种实施例所提供的深度预测模型的训练方法,通过获取样本图像对应的对象掩膜图像,并将样本图像输入待训练模型得到深度预测图像,然后根据对象掩膜图
像和深度预测图像共同计算样本图像对应的目标损失函数,进而根据目标损失函数对待训练模型进行权重更新,以获取深度预测模型。本公开利用对象掩膜图像可以有效优化对象边缘的深度预测,使得对象边缘处的深度预测结果更加准确。
11.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
12.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
13.图1示出了可以应用本公开实施例的一种示例性系统架构的示意图;
14.图2示出了可以应用本公开实施例的一种电子设备的示意图;
15.图3示意性示出本公开示例性实施例中一种深度预测模型的训练方法的流程图;
16.图4示出一种包含人像的人像场景对应的样本图像;
17.图5示出了图4所示的样本图像对应的对象掩膜图像;
18.图6示意性示出本公开示例性实施例中一种待训练模型的结构示意图;
19.图7示意性示出本公开示例性实施例中一种计算目标损失函数的方法的流程图;
20.图8示意性示出本公开示例性实施例中另一种深度预测模型的训练方法的流程图;
21.图9示出了对图4所示的样本图像进行图像分割得到的对象分割图像;
22.图10示出了基于本公开的深度预测模型的训练方法得到的深度预测模型对图4所示的样本图像进行处理后得到的深度预测图像;
23.图11示出了基于传统训练方法得到的深度预测模型对图4所示的样本图像进行处理后得到的深度预测图像;
24.图12示意性示出本公开示例性实施例中深度预测模型的训练装置的组成示意图。
具体实施方式
25.现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
26.此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
27.图1示出了可以应用本公开实施例的一种深度预测模型的训练方法及装置的示例性应用环境的系统架构的示意图。
28.如图1所示,系统架构100可以包括终端设备101、102、103中的一个或多个,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。终端设备101、102、103可以是各种具有图像处理功能的电子设备,包括但不限于台式计算机、便携式计算机、智能手机和平板电脑等等。应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。
29.本公开实施例所提供的深度预测模型的训练方法一般由服务器105执行,相应地,深度预测模型的训练装置一般设置于服务器105中。但本领域技术人员容易理解的是,本公开实施例所提供的深度预测模型的训练方法也可以由终端设备101、102、103中执行,相应的,深度预测模型的训练装置也可以设置于终端设备101、102、103中,本示例性实施例中对此不做特殊限定。举例而言,在一种示例性实施例中,可以是用户通过终端设备101、102、103包括的摄像模组采集样本图像,然后将样本图像发送至服务器105,服务器105通过本公开实施例所提供深度预测模型的训练方法对待训练模型进行训练,得到深度预测模型。
30.本公开的示例性实施方式提供一种用于实现深度预测模型的训练方法的电子设备,其可以是图1中的终端设备101、102、103或服务器105。该电子设备至少包括处理器和存储器,存储器用于存储处理器的可执行指令,处理器配置为经由执行可执行指令来执行深度预测模型的训练方法。
31.下面以图2中的移动终端200为例,对电子设备的构造进行示例性说明。本领域技术人员应当理解,除了特别用于移动目的的部件之外,图2中的构造也能够应用于固定类型的设备。在另一些实施方式中,移动终端200可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件、软件或软件和硬件的组合实现。各部件间的接口连接关系只是示意性示出,并不构成对移动终端200的结构限定。在另一些实施方式中,移动终端200也可以采用与图2不同的接口连接方式,或多种接口连接方式的组合。
32.如图2所示,移动终端200具体可以包括:处理器210、内部存储器221、外部存储器接口222、通用串行总线(universal serial bus,usb)接口230、充电管理模块240、电源管理模块241、电池242、天线1、天线2、移动通信模块250、无线通信模块260、音频模块270、扬声器271、受话器272、麦克风273、耳机接口274、传感器模块280、显示屏290、摄像模组291、指示器292、马达293、按键294以及用户标识模块(subscriber identification module,sim)卡接口295等。其中传感器模块280可以包括深度传感器2801、压力传感器2802、陀螺仪传感器2803等。
33.处理器210可以包括一个或多个处理单元,例如:处理器210可以包括应用处理器(application processor,ap)、调制解调处理器、图形处理器(graphics processing unit,gpu)、图像信号处理器(image signal processor,isp)、控制器、视频编解码器、数字信号处理器(digital signal processor,dsp)、基带处理器和/或神经网络处理器(neural

network processing unit,npu)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
34.npu为神经网络(neural

network,nn)计算处理器,通过借鉴生物神经网络结构,
例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过npu可以实现移动终端200的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。在一示例性实施例中,可以基于npu进行深度预测模型的训练方法,例如,可以基于npu对样本图像进行预测得到深度预测图像。
35.处理器210中设置有存储器。存储器可以存储用于实现六个模块化功能的指令:检测指令、连接指令、信息管理指令、分析指令、数据传输指令和通知指令,并由处理器210来控制执行。
36.充电管理模块240用于从充电器接收充电输入。电源管理模块241用于连接电池242、充电管理模块240与处理器210。电源管理模块241接收电池242和/或充电管理模块240的输入,为处理器210、内部存储器221、显示屏290、摄像模组291和无线通信模块260等供电。
37.移动终端200的无线通信功能可以通过天线1、天线2、移动通信模块250、无线通信模块260、调制解调处理器以及基带处理器等实现。其中,天线1和天线2用于发射和接收电磁波信号;移动通信模块250可以提供应用在移动终端200上的包括2g/3g/4g/5g等无线通信的解决方案;调制解调处理器可以包括调制器和解调器;无线通信模块260可以提供应用在移动终端200上的包括无线局域网(wireless local area networks,wlan)(如无线保真(wireless fidelity,wi

fi)网络)、蓝牙(bluetooth,bt)等无线通信的解决方案。在一些实施例中,移动终端200的天线1和移动通信模块250耦合,天线2和无线通信模块260耦合,使得移动终端200可以通过无线通信技术与网络以及其他设备通信。
38.移动终端200通过gpu、显示屏290及应用处理器等实现显示功能。gpu为图像处理的微处理器,连接显示屏290和应用处理器。gpu用于执行数学和几何计算,用于图形渲染。处理器210可包括一个或多个gpu,其执行程序指令以生成或改变显示信息。在一示例性实施例中,可以通过gpu、显示屏290及应用处理器等实现对样本图像的增强处理,以获取增强后的样本图像。
39.移动终端200可以通过isp、摄像模组291、视频编解码器、gpu、显示屏290及应用处理器等实现拍摄功能。其中,isp用于处理摄像模组291反馈的数据;摄像模组291用于捕获静态图像或视频;数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号;视频编解码器用于对数字视频压缩或解压缩,移动终端200还可以支持一种或多种视频编解码器。在一示例性实施例中,可以通过isp、摄像模组291、视频编解码器、gpu、显示屏290及应用处理器等进行图像拍摄,得到样本图像。
40.深度传感器2801用于获取景物的深度信息。在一些实施例中,深度传感器可以设置于摄像模组291,进而基于设置有深度传感器的摄像模组采集目标场景对应的深度数据,以生成当前图像对应的深度标注图像。
41.压力传感器2802用于感受压力信号,可以将压力信号转换成电信号。陀螺仪传感器2803可以用于确定移动终端200的运动姿态。此外,还可以根据实际需要在传感器模块280中设置其他功能的传感器,例如气压传感器、磁传感器、加速度传感器、距离传感器、接近光传感器、指纹传感器、温度传感器、触摸传感器、环境光传感器、骨传导传感器等。
42.针对相关优化方式得到的单目深度预测模型,在对一些存在纹理简单或者光照不均匀等问题的包含特定对象的图像进行处理时,由于深度预测模型在训练时所采用的损失
函数通常是以单一的深度标注图像作为参考的,而深度标注图像所反映的信息主要是场景的层次关系,这种层次关系的特性使得训练后的深度预测模型中的特征层也更偏向于场景中的层次特性,会使得图像中的一些局部纹理、颜色等特征丢失,进而导致深度预测结果中,颜色、纹理相对一致的地方不够平滑,边缘深度预测不够准确等问题。
43.基于上述一个或多个问题,本示例实施方式提供了一种深度预测模型的训练方法。该深度预测模型的训练方法可以应用于上述服务器105,也可以应用于上述终端设备101、102、103中的一个或多个,本示例性实施例中对此不做特殊限定。参考图3所示,该深度预测模型的训练方法可以包括以下步骤s310至s330:
44.在步骤s310中,获取样本图像对应的对象掩膜图像,并将样本图像输入待训练模型得到深度预测图像。
45.其中,样本图像对应的对象掩膜图像可以包括用于表示对象在样本图像所在区域的掩膜图像。例如,针对图4所示的,包含人体的样本图像,若对象为人体,则可以得到如图5所示的对象掩膜图像。待训练模型可以包括bts、midas等单目深度预测网络,也可以包括其它结构的单目深度预测网络,本公开对此不做特殊限定。需要说明的是,在将样本图像输入至待训练模型时,可以分批次进行批量输入。
46.举例而言,参照图6所示,在融合场景中的分层特征实现对不同区域的深度预测的待训练模型中,可以包括编码分支和解码分支。
47.此外,由于不同的待训练模型所支持的图像格式不同,因此,在将样本图像输入待训练模型之前,可以对样本图像进行格式转换。例如,待训练模型支持分辨率为480
×
640的图像,可以在将样本图像输入待训练模型之前,先对样本图像进行缩放,得到分辨率为480
×
640的样本图像,然后将得到的样本图像输入至待训练模型中。
48.在一示例性实施例中,为了便于待训练模型进行训练时可以快速收敛,在将样本图像输入至待训练模型之前,还可以先对样本图像进行归一化。例如,可以将所有像素点对应的像素值减去127.5,然后除以127.5,将所有像素点对应的像素值,归一至[

1,1]的范围内。
[0049]
在一示例性实施例中,为了增加样本图像的多样性,在将样本图像输入至待训练模型之前,还可以先对样本图像进行图像增强,以获取增强后的样本图像。其中,图像增强可以包括对样本图像进行几何变换、颜色变换等增强处理。例如,可以对样本图像进行随机逆时针旋转90度的增强处理。
[0050]
在步骤s320中,根据对象掩膜图像和深度预测图像计算样本图像对应的目标损失函数。
[0051]
在一示例性实施例中,在得到对象掩膜图像和深度预测图像后,可以利用对象掩膜图像包含的对象边缘信息和深度预测图像来计算目标损失函数,进而根据目标损失函数优化待训练模型在对象边缘处深度预测结果的准确性。
[0052]
在一示例性实施例中,在根据对象掩膜图像和深度预测图像计算样本图像对应的目标损失函数时,参照图7所示,可以包括以下步骤s710至s730:
[0053]
在步骤s710中,基于深度预测图像计算样本图像对应的第一损失函数。
[0054]
其中,第一损失函数是指基于深度预测图像以及深度标注图像等包含深度信息的数据计算得到的损失函数,第一损失函数可以包括根据样本图像对应的深度特性确定的所
有种类的损失函数。例如,第一损失函数可以包括基于样本图像对应的深度预测图像和深度标注图像计算的深度损失函数;再如,第一损失函数还可以包括基于样本图像对应的深度预测图像本身确定的平滑损失函数。此外,第一损失函数还可以包括其它根据样本图像自身的深度特性(预测的深度数据或标注的深度数据等)确定的损失函数,本公开对此不做特殊限定。
[0055]
在一示例性实施例中,在第一损失函数包括深度损失函数时,可以基于待训练模型对样本图像进行预测得到的深度预测图像和提前对样本图像进行深度标注得到的深度标注图像计算该深度损失函数。具体的,快可以针对每一像素,分别计算深度预测图像和深度标注图像对应的深度值之间的对数差,然后基于对数差计算样本图像对应的深度损失函数。其中,深度预测图像和深度标注图像在每一像素处对应的深度值的对数差g
i
可以基于以下公式(1)计算:
[0056][0057]
其中,d
i
表示第i个像素点的深度预测值,表示第i个像素点的标注深度值。
[0058]
在一示例性实施例中,在基于对数差计算样本图像对应的深度损失函数时,深度损失函数l
d
可以基于以下公式(2)进行计算:
[0059][0060]
其中,g
i
表示第i个像素点对应的深度值的对数差,t表示当前图像上的像素个数;α和λ为提前设置的参数。举例而言,α可以取10,λ可以取0.5。
[0061]
在一示例性实施例中,第一损失函数还可以包括平滑损失函数。此时,可以直接基于深度预测图像计算样本图像对应的第一损失函数。具体的,可以在深度预测图像的基础上,计算每一像素在深度预测图像上的第一横向偏导数和第一纵向偏导数,然后基于每一像素对应的第一横向偏导数和第一纵向偏导数计算样本图像对应的平滑损失函数。
[0062]
在一示例性实施例中,在基于每一像素对应的第一横向偏导数和第一纵向偏导数计算样本图像对应的平滑损失函数时,平滑损失函数l
smooth
可以基于以下公式(3)进行计算:
[0063][0064]
其中,d
i,j
表示深度预测图像中,坐标为(i,j)的像素对应的深度预测值;δ
x
d
i,j
表示深度预测图像中,坐标为(i,j)的像素对应的横向偏导数;δ
y
d
i,j
表示深度预测图像中,坐标为(i,j)的像素对应的纵向偏导数。
[0065]
在步骤s720中,基于深度预测图像和对象掩膜图像计算样本图像对应的第二损失函数。
[0066]
其中,第二损失函数包括基于深度预测图像以及深度标注图像等包含深度信息的数据,以及对象掩膜图像共同计算的损失函数,该第二损失函数可以包括根据样本图像本身的深度特性和对象掩膜图像包含的数据确定的各种类型的损失函数。
[0067]
在一示例性实施例中,第二损失函数可以包括边缘损失函数,此时,可以直接基于深度预测图像和对象掩膜图像计算样本图像对应的第二损失函数。具体的,可以先计算每
一像素在深度预测图像上的第一横向偏导数和第一纵向偏导数,然后再计算每一像素在对象掩膜图像上的第二横向偏导数和第二纵向偏导数,之后根据得到的第一横向偏导数、第一纵向偏导数、第二横向偏导数和第二纵向偏导数计算边缘损失函数。
[0068]
在一示例性实施例中,在根据第一横向偏导数、第一纵向偏导数、第二横向偏导数和第二纵向偏导数计算边缘损失函数时,边缘损失函数可以基于以下公式(4)进行计算:
[0069][0070]
其中,d
i,j
表示深度预测图像中,坐标为(i,j)的像素对应的深度预测值;δ
x
d
i,j
表示深度预测图像中,坐标为(i,j)的像素对应的第一横向偏导数;δ
y
d
i,j
表示深度预测图像中,坐标为(i,j)的像素对应的第一纵向偏导数;seg
i,j
表示对象掩膜图像中,坐标为(i,j)的像素对应的像素值;δ
x
seg
i,j
表示对象掩膜图像中,坐标为(i,j)的像素对应的第二横向偏导数;δ
y
seg
i,j
表示对象掩膜图像中,坐标为(i,j)的像素对应的第二纵向偏导数;n为像素个数。
[0071]
在步骤s730中,根据第一损失函数和第二损失函数计算样本图像对应的目标损失函数。
[0072]
在一示例性实施例中,在得到第一损失函数和第二损失函数后,可以基于第一损失函数和第二损失函数共同计算样本图像对应的目标损失函数。需要说明的是,在需求不同的前提下,计算目标损失函数时,可以基于不同损失函数对需求的影响,对不同损失函数设置不同的权重。此外,针对绝对损失函数或相对损失函数设置权重时,可以针对不同种类的损失函数设置不同的权重,也可以设置相同的权重。例如,在计算目标损失函数l时,可以计算绝对损失函数和相对损失函数的加权和。例如,可以通过以下公式(5)进行计算:
[0073]
l=α
e
*l
e
α
d
*l
d
α
smoom
*l
smooth
ꢀꢀꢀꢀꢀꢀꢀꢀ
公式(5)其中,对第一损失函数中的深度损失函数l
d
和平滑损失函数l
smooth
采用了不同的权重α
d
和α
smooth
;针对第二损失函数采用了权重α
e

[0074]
在步骤s330中,基于目标损失函数对待训练模型进行权重更新,以获取深度预测模型。
[0075]
在一示例性实施例中,在得到目标损失函数后,可以基于目标损失函数对待训练模型进行权重更新,以获取深度预测模型。具体的,参照图8所示,包括以下步骤:步骤s801,分批次读取样本图像;步骤s803,对样本图像进行归一化得到归一化后的样本图像;步骤s805,获取样本图像对应的对象掩膜图像;步骤s807,将归一化后的样本图像输入至待训练模型中进行处理,得到样本图像对应的深度预测图像;步骤s809,基于样本图像对应的深度预测图像和样本图像对应的对象掩膜图像计算目标损失函数;步骤s811,基于目标计算梯度更新待训练模型的权重,经过多次epoch之后,目标损失函数收敛至一定的范围,进而得到深度预测模型。
[0076]
此外,在获取样本图像对应的对象掩膜图像时,可以先对样本图像进行图像分割,得到的对象分割图像,然后基于预设阈值对对象分割图像中的不同区域赋予不同的值,得到对象掩膜图像。举例而言,在对象为人像时,针对如图4所示的样本图像,可以采用人像分割模型对样本图像进行处理得到分割图像,如图9所示。在分割图像中,各像素值在0

255范围内,此时可以根据预设阈值127.5对图像进行赋值。具体的,可以对像素值小于等于127.5
的像素重新赋值为0,对像素值大于127.5的像素重新赋值为255,得到的二值图像即为对象掩膜图像,如图5所示。
[0077]
需要说明的是,除了上述方法,还可以采用人工标注等方法,获取样本图像对应的对象掩膜,本公开对此不做特殊限定。
[0078]
综上,本示例性实施方式中,利用人像分割边缘或者区域平滑信息可以有效优化人像边缘或者区域的深度预测,使得深度预测在颜色、纹理相对一致的地方更加平滑,而在边缘处深度预测会更精准。此外,在虚化功能中这种优化方法可以有效减少虚化力度不准确或者不平缓的问题。
[0079]
举例而言,针对如图4的样本图像以及如图5所示的对象掩膜图像,根据本公开的深度预测模型的训练方法得到的深度预测模型进行处理可以得到如图10所示的深度预测图像1;根据传统的基于单张图像的深度标注图像作为参考得到的深度预测模型进行处理可以得到如图11所示的深度预测图像2。对深度预测图像1和深度预测图像2进行对比,可以深度预测在颜色、纹理相对一致的地方更加平滑,而在边缘处深度预测会更精准,且虚化力度不准确或者不平缓的问题得到了改善。
[0080]
需要注意的是,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
[0081]
进一步的,参考图12所示,本示例的实施方式中还提供一种深度预测模型的训练装置1200,包括图像获取模块1210、损失计算模块1220和权重更新模块1230。其中:
[0082]
图像获取模块1210可以用于获取样本图像对应的对象掩膜图像,并将样本图像输入待训练模型得到深度预测图像。
[0083]
损失计算模块1220可以用于根据对象掩膜图像和深度预测图像计算样本图像对应的目标损失函数。
[0084]
权重更新模块1230可以用于基于目标损失函数对待训练模型进行权重更新,以获取深度预测模型。
[0085]
在一示例性实施例中,损失计算模块1220可以用于基于深度预测图像计算样本图像对应的第一损失函数;基于深度预测图像和对象掩膜图像计算样本图像对应的第二损失函数;根据第一损失函数和第二损失函数计算样本图像对应的目标损失函数。
[0086]
在一示例性实施例中,第一损失函数包括深度损失函数,损失计算模块1220可以用于针对每一像素,计算深度预测图像的深度值与样本图像对应的深度标注图像的深度值之间的对数差;基于对数差计算样本图像对应的深度损失函数。
[0087]
在一示例性实施例中,第一损失函数还包括平滑损失函数,损失计算模块1220可以用于计算每一像素在深度预测图像上的第一横向偏导数和第一纵向偏导数;基于每一像素对应的第一横向偏导数和第一纵向偏导数计算样本图像对应的平滑损失函数。
[0088]
在一示例性实施例中,第二损失函数包括边缘损失函数,损失计算模块1220可以用于计算每一像素在深度预测图像上的第一横向偏导数和第一纵向偏导数;计算每一像素在对象掩膜图像上的第二横向偏导数和第二纵向偏导数;根据第一横向偏导数、第一纵向偏导数、第二横向偏导数和第二纵向偏导数计算边缘损失函数。
[0089]
在一示例性实施例中,图像获取模块1210可以用于对样本图像进行图像分割,以
获取对象分割图像;基于预设阈值对对象分割图像进行赋值,以获取对象掩膜图像。
[0090]
在一示例性实施例中,图像获取模块1210可以用于对样本图像进行图像增强,以获取增强后的样本图像。
[0091]
上述装置中各模块的具体细节在方法部分实施方式中已经详细说明,未披露的细节内容可以参见方法部分的实施方式内容,因而不再赘述。
[0092]
所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
[0093]
本公开的示例性实施方式还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤,例如可以执行图3、图7和图8中任意一个或多个步骤。
[0094]
需要说明的是,本公开所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd

rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
[0095]
在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。
[0096]
此外,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如java、c 等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
[0097]
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施例。本技术旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者
适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
[0098]
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献