一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

模型的构建方法、图像语义分割方法、装置、设备及介质与流程

2022-04-30 09:46:32 来源:中国专利 TAG:


1.本发明实施例涉及图像分割技术领域,尤其涉及一种模型的构建方法、图像语义分割方法、装置、设备及介质。


背景技术:

2.超分辨率是计算机视觉中的常用技术。在图像语义分割任务中,像素重组(pixel shuffle)是常见的超分辨率操作。pixel shuffle要求其前一层输出的通道数量较大。在深度学习模型中,一般用卷积层来提升通道数量,同时得到通道和特征图(feature map)的具体取值。现有技术针对上述pixel shuffle的速度优化的方法主要有以下3种:1、降低卷积层的输出通道数;2、使用尺寸小的特征图;3、先用上采样操作提升特征图大小,再使用pixel shuffle操作。然而降低卷积层的输出通道数以及使用小尺寸的特征图改变了pixel shuffle前序操作(卷积操作)的数据大小,使得pixelshuffle生成的图分辨率小于预期的大小。先用上采样操作提升特征图大小,再使用pixel shuffle操作需要更多的基于规则的后处理来得到所要求的图像分辨率,比直接使用pixel shuffle操作效果差。
3.由此可见,在相关技术的实现过程中,至少存在以下技术问题:在提高像素重组速度时无法同时兼顾输出图像大小和输出图像效果。


技术实现要素:

4.本发明实施例提供了一种模型的构建方法、图像语义分割方法、装置、设备及介质,以实现不影响像素重组模块输出的图像大小的前提下,保证图像效果。
5.第一方面,本发明实施例提供了一种图像语义分割模型的构建方法,包括:
6.获取待构建模型的基础模型结构,基础模型结构包括骨干神经网络、卷积层、特征拼接层和分割网络,分割网络包括像素重组模块;
7.根据像素重组模块的输出特征数据的数据通道数量确定卷积层通道数量以及补全通道数量;
8.根据补全通道数量从骨干神经网络中选取中间层作为特征补全层,将特征补全层和卷积层分别与特征拼接模块相连接,将特征拼接模块与分割网络相连接,得到图像语义分割模型。
9.可选的,根据像素重组模块的特征数据的数据通道数量确定卷积层通道数量以及补全通道数量,包括:
10.将小于数据通道数量的任意正整数作为卷积层通道数量;
11.将数据通道数量与卷积层通道数量的差值作为补全通道数量。
12.可选的,根据补全通道数量从骨干神经网络中选取中间层作为特征补全层,包括:
13.选取骨干神经网络中的至少一个中间层作为特征补全层,其中,至少一个中间层的总通道数量与补全通道数量相等。
14.可选的,特征补全层的输出特征图的分辨率与像素重组模块的输出特征图的分辨
率相同。
15.可选的,方法还包括:
16.获取训练样本数据;
17.基于训练样本数据对图像语义分割模型进行迭代训练,在满足训练结束条件的情况下,得到训练后的图像语义分割模型。
18.第二方面,本发明实施例还提供了一种图像语义分割方法,其特征在于,包括:
19.获取待语义分割图像;
20.将待分割图像输入至预先训练的图像语义分割模型中,获得图像语义分割模型的语义分割结果,其中,图像语义分割模型基于本发明实施例第一方面所提供的图像语义分割模型的构建方法构建的图像语义分割模型训练得到。
21.第三方面,本发明实施例还提供了一种图像语义分割模型的构建装置,包括:
22.基础结构获取模块,用于获取待构建模型的基础模型结构,基础模型结构包括骨干神经网络、卷积层、特征拼接层和分割网络,分割网络包括像素重组模块;
23.通道数量确定模块,用于根据像素重组模块的输出特征数据的数据通道数量确定卷积层通道数量以及补全通道数量;
24.语义分割模型构建模块,用于根据补全通道数量从骨干神经网络中选取中间层作为特征补全层,将特征补全层和卷积层分别与特征拼接模块相连接,将特征拼接模块与分割网络相连接,得到图像语义分割模型。
25.第四方面,本发明实施例还提供了一种图像语义分割装置,包括:
26.待语义分割图像获取模块,用于获取待语义分割图像;
27.图像语义分割模块,用于将待分割图像输入至预先训练的图像语义分割模型中,获得图像语义分割模型的语义分割结果,其中,图像语义分割模型基于本发明实施例第一方面所提供的图像语义分割模型的构建方法构建的图像语义分割模型训练得到。
28.第五方面,本发明实施例还提供了一种计算机设备,设备包括:
29.一个或多个处理器;
30.存储装置,用于存储一个或多个程序;
31.当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如本发明任意实施例所提供的图像语义分割模型的构建方法,和/或,实现如本发明任意实施例所提供的图像语义分割方法。
32.第六方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所提供的图像语义分割模型的构建方法,和/或,实现如本发明任意实施例所提供的图像语义分割方法。
33.本发明实施例提供的图像语义分割模型的构建方法,通过获取待构建模型的基础模型结构,基础模型结构包括骨干神经网络、卷积层、特征拼接层和分割网络,分割网络包括像素重组模块;根据像素重组模块的输出特征数据的数据通道数量确定卷积层通道数量以及补全通道数量;根据补全通道数量从骨干神经网络中选取中间层作为特征补全层,将特征补全层和卷积层分别与特征拼接模块相连接,将特征拼接模块与分割网络相连接,得到图像语义分割模型。实现了在网络模型的训练之前,构建的图像语义分割模型在减少卷积层通道数的前提下满足像素重组特征的需求,充分复用神经网络模型中间数据结果减小
计算量,达到提升速度的目的。
附图说明
34.图1是本发明实施例所提供的一种图像语义分割模型的构建方法的流程示意图;
35.图2是本发明实施例所提供的一种图像语义分割方法的流程示意图;
36.图3是本发明实施例所提供的一种图像语义分割模型的构建装置的结构示意图;
37.图4是本发明实施例所提供的一种图像语义分割装置的结构示意图;
38.图5是本发明实施例所提供的一种计算机设备的结构示意图。
具体实施方式
39.下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
40.图1是本发明实施例所提供的一种图像语义分割模型的构建方法的流程示意图。本实施例可适用于构建图像语义分割模型时的情形。该方法可以由图像语义分割模型的构建装置执行,该图像语义分割模型的构建装置可以采用软件和/或硬件的方式实现,例如,该图像语义分割模型的构建装置可配置于计算机设备中。如图1所示,该方法包括:
41.s110、获取待构建模型的基础模型结构,基础模型结构包括骨干神经网络、卷积层、特征拼接层和分割网络,分割网络包括像素重组模块。
42.在本实施例中,待构建模型为图像语义分割模型。一般来说,图像语义分割模型的基础模型结构包括骨干神经网络、卷积层和分割网络,分割网络包括像素重组模块。
43.为了解决现有技术中减少计算量时导致的成像大小不规范或成像效果差的技术问题。本实施例中在卷积层和分割网络之间添加了特征拼接层。为减少计算量,可以减少卷积层的通道数量,同时为了保证图像的效果,需要利用中间层的输出特征将卷积层的输出特征补全,使得像素重组模块的输入图像特征的通道数量满足像素重组模块所需的通道数量。可以理解的是,特征拼接层用于将卷积层和其他层输出的特征进行拼接,使得拼接的特征满足像素重组模块的数据需求。
44.其中,骨干神经网络可以根据实际需求选择。示例性的,骨干神经网络可以为残差神经网络、卷积神经网络(如resnet18、resnet50、resnet101、inception、mobilenet)等,在此不做限定。分割网络可以根据实际需求选择。示例性的,分割网络可以为bisenet v1、bisenet v2、pspnet等网络,其中分割网络的最后一层均为像素重组模块pixel shuffle。
45.s120、根据像素重组模块的输出特征数据的数据通道数量确定卷积层通道数量以及补全通道数量。
46.可选的,可以根据像素重组模块的输出特征的数据通道数量设置卷积层通道数量和需要补全的通道数量。其中,可以先根据像素重组模块的输出特征的数据通道数量和可承载计算量确定卷积层通道数量,然后根据像素重组模块的输出特征的数据通道数量和卷积层通道数量确定补全通道数量。
47.一个实施方式中,根据像素重组模块的特征数据的数据通道数量确定卷积层通道数量以及补全通道数量,包括:将小于数据通道数量的任意正整数作为卷积层通道数量;将
数据通道数量与卷积层通道数量的差值作为补全通道数量。可选的,可以将小于数据通道数量的任意正整数设置为卷积层通道数量,为了能够补全卷积层缺失的通道数量,将数据通道数量与卷积层通道数量的差值作为补全通道数量。示例性的,假设像素重组模块的特征数据大小为c_out
×
h_out
×
w_out,特征数据的数据通道数量为c_out,则可以选取小于c_out任意正整数作为卷积层通道数量,假设卷积层通道数量为c_conv,则补全通道数量为c_out-c_conv。
48.s130、根据补全通道数量从骨干神经网络中选取中间层作为特征补全层,将特征补全层和卷积层分别与特征拼接模块相连接,将特征拼接模块与分割网络相连接,得到图像语义分割模型。
49.在本实施例中,确定卷积层通道数量后,即可确定卷积层的结构。卷积层的其他参数,如卷积核大小等可以根据实际需求设置。
50.确定补全通道数量后,从骨干神经网络的中间层中选取通道数为补全通道数量的中间层作为特征补全层,将卷积层和特征补全层均与特征拼接模块相连接,将特征拼接模块和像素重组模块相连接,即可得到图像语义分割模型。
51.需要说明的是,本实施例中可以从骨干神经网络中选取一个中间层作为特征补全层,也可以从骨干神经网络中选取多个中间层作为特征补全层,只要特征补全层的总通道数量与补全通道数量相等即可。也就是说,根据补全通道数量从骨干神经网络中选取中间层作为特征补全层,包括:选取骨干神经网络中的至少一个中间层作为特征补全层,其中,至少一个中间层的总通道数量与补全通道数量相等。示例性的,假设从骨干神经网络中选取了一个中间层a作为特征补全层,则中间层a的通道数量与补全通道数量相等。假设从骨干神经网络中选取了中间层b、中间层c和中间层d作为特征补全层,则中间层b的通道数量、中间层c的通道数量和中间层d的通道数量的和与补全通道数量相等。
52.一般来说,获取多个层输出的特征进行处理能够避免单层输出特征的局限性。基于此,优选从骨干神经网络中选取至少两个中间层作为特征补全层,且至少两个中间层的总通道数量与补全通道数量相等。
53.在上述方案的基础上,在减少计算量的同时为保证图像效果,需要补全的特征大小与像素重组模块的特征大小相同。基于此,本实施例提供的图像语义分割模型的构建方法还包括:特征补全层的输出特征图的分辨率与像素重组模块的输出特征图的分辨率相同。也就是说,假设像素重组模块的特征数据大小为c_out
×
h_out
×
w_out,特征数据的数据通道数量为c_out,特征图分辨率为h_out
×
w_out;则需要选取特征图分辨率为h_out
×
w_out,且总通道数量等于补全通道数量的至少一个中间层作为特征补全层。假设补全通道数量为cbq,选取中间层c1和中间层c2作为特征补全层,则中间层c1的输出特征大小为c1
×
h_out
×
w_out,中间层c2的输出特征大小为c2
×
h_out
×
w_out,且c1 c2=cbq。
54.确定卷积层通道数量以及补全特征层,且将各层连接之后,即可得到构建好的图像语义分割模型。
55.本发明实施例提供的图像语义分割模型的构建方法,通过获取待构建模型的基础模型结构,基础模型结构包括骨干神经网络、卷积层、特征拼接层和分割网络,分割网络包括像素重组模块;根据像素重组模块的输出特征数据的数据通道数量确定卷积层通道数量以及补全通道数量;根据补全通道数量从骨干神经网络中选取中间层作为特征补全层,将
特征补全层和卷积层分别与特征拼接模块相连接,将特征拼接模块与分割网络相连接,得到图像语义分割模型。实现了在网络模型的训练之前,构建的图像语义分割模型在减少卷积层通道数的前提下满足像素重组特征的需求,充分复用神经网络模型中间数据结果减小计算量,达到提升速度的目的。
56.在上述方案的基础上,方法还包括:获取训练样本数据;基于训练样本数据对图像语义分割模型进行迭代训练,在满足训练结束条件的情况下,得到训练后的图像语义分割模型。
57.其中,训练样本数据可以是基于图像语义分割模型的应用场景确定,示例性的,图像语义分割模型的应用场景为自动驾驶场景,则样本数据可以为驾驶场景中的图像样本数据。
58.一个实施例中,训练样本数据可以包括训练数据和训练数据对应的监督数据,相应的,基于训练数据和对应的监督数据对网络模型进行监督训练。基于样本数据对网络模型进行有监督的迭代训练,直到满足训练结束条件,该训练结束条件可以是如下中的任一项:网络模型的训练次数满足预设次数、网络模型的训练过程达到收敛状态、网络模型的训练精度达到预设精度阈值。
59.一个实施例中,样本数据可以包括设置有监督数据的第一样本数据和未设置有监督数据的第二训练数据,相应的,基于第一样本数据和第二样本数据对网络模型进行半监督训练,简化对样本数据中监督数据的确定过程。具体的,将上述样本数据划分为多组训练数据,将每一组样本数据多次输入至网络模型中,得到多个预测结果,基于网络模型的预测一致性原则,对网络模型进行迭代训练,直到满足训练结束条件,得到训练后的图像语义分割模型。
60.基于本实施例提供的图像语义分割模型的构建方法构建的图像语义分割模型计算量小,加快了模型训练速度。
61.图2是本发明实施例所提供的一种图像语义分割方法的流程示意图。本实施例可适用于对图像进行语义分割时的情形。该方法可以由图像语义分割装置执行,该图像语义分割装置可以采用软件和/或硬件的方式实现,例如,该图像语义分割装置可配置于计算机设备中。如图2所示,该方法包括:
62.s210、获取待语义分割图像。
63.在本实施例中,待语义分割图像可以根据应用场景确定。示例性的,假设应用场景为自动驾驶场景,则待语义分割图像可以为自动驾驶车辆所拍摄的图像。
64.s220、将待分割图像输入至预先训练的图像语义分割模型中,获得图像语义分割模型的语义分割结果。
65.其中,图像语义分割模型基于本发明任意实施例所提供的图像语义分割模型的构建方法构建的图像语义分割模型训练得到。采用本发明实施例提供的图像语义分割模型构建方法构建的图像语义分割模型对待分割图像进行处理,提高了待分割图像的处理速度,且保证了图像处理质量。
66.以自动驾驶场景为例,本发明实施例提供的图像语义分割模型可以设置在自动驾驶车辆前端感知系统的“感知”模块中,在整个自动驾驶软件系统中,通过图像语义分割模型对待语义分割图像上的物体语义进行理解,让自动驾驶软件系统有了“眼睛”,看到前方
的车辆,障碍物,建筑,隔离围栏,行人等等物体目标,从而给到“导航规划”模块进行车辆行驶轨迹的规划,进行合理的避障和加速减速等规划。提高待分割图像的处理速度,能够提高导航中路径规划的速度,使得自动驾驶过程中及时调整车辆运行状况,使得车辆运行更加可控。
67.本发明实施例提供的图像语义分割方法通过获取待语义分割图像;将待分割图像输入至预先训练的图像语义分割模型中,获得图像语义分割模型的语义分割结果,其中,图像语义分割模型基于本发明任意实施例所提供的图像语义分割模型的构建方法构建的图像语义分割模型训练得到。通过减少图像语义分割模型中卷积层通道的数量,加快了基于图像语义分割模型进行图像语义分割的速度,通过特征补全层进行特征补全,保证了图像语义分割的准确度。
68.图3是本发明实施例所提供的一种图像语义分割模型的构建装置的结构示意图。该图像语义分割模型的构建装置可以采用软件和/或硬件的方式实现,例如该图像语义分割模型的构建装置可以配置于计算机设备中。本实施例中,与上述各实施例相同或相应的术语的解释在此不再赘述。如图3所示,该装置包括基础结构获取模块310、通道数量确定模块320和语义分割模型构建模块330,其中:
69.基础结构获取模块310,用于获取待构建模型的基础模型结构,基础模型结构包括骨干神经网络、卷积层、特征拼接层和分割网络,分割网络包括像素重组模块;
70.通道数量确定模块320,用于根据像素重组模块的输出特征数据的数据通道数量确定卷积层通道数量以及补全通道数量;
71.语义分割模型构建模块330,用于根据补全通道数量从骨干神经网络中选取中间层作为特征补全层,将特征补全层和卷积层分别与特征拼接模块相连接,将特征拼接模块与分割网络相连接,得到图像语义分割模型。
72.本发明实施例通过基础结构获取模块获取待构建模型的基础模型结构,基础模型结构包括骨干神经网络、卷积层、特征拼接层和分割网络,分割网络包括像素重组模块;通道数量确定模块根据像素重组模块的输出特征数据的数据通道数量确定卷积层通道数量以及补全通道数量;语义分割模型构建模块根据补全通道数量从骨干神经网络中选取中间层作为特征补全层,将特征补全层和卷积层分别与特征拼接模块相连接,将特征拼接模块与分割网络相连接,得到图像语义分割模型。实现了在网络模型的训练之前,构建的图像语义分割模型在减少卷积层通道数的前提下满足像素重组特征的需求,充分复用神经网络模型中间数据结果减小计算量,达到提升速度的目的。
73.可选的,在上述方案的基础上,通道数量确定模块320具体用于:
74.将小于数据通道数量的任意正整数作为卷积层通道数量;
75.将数据通道数量与卷积层通道数量的差值作为补全通道数量。
76.可选的,在上述方案的基础上,语义分割模型构建模块330具体用于:
77.选取骨干神经网络中的至少一个中间层作为特征补全层,其中,至少一个中间层的总通道数量与补全通道数量相等。
78.可选的,在上述方案的基础上,特征补全层的输出特征图的分辨率与像素重组模块的输出特征图的分辨率相同。
79.可选的,在上述方案的基础上,装置还包括模型训练模块,用于:
80.获取训练样本数据;
81.基于训练样本数据对图像语义分割模型进行迭代训练,在满足训练结束条件的情况下,得到训练后的图像语义分割模型。
82.本发明实施例所提供的图像语义分割模型的构建装置可执行本发明任意实施例所提供的图像语义分割模型的构建方法,具备执行方法相应的功能模块和有益效果。
83.图4是本发明实施例所提供的一种图像语义分割装置的结构示意图。该图像语义分割装置可以采用软件和/或硬件的方式实现,例如该图像语义分割装置可以配置于计算机设备中。本实施例中,与上述各实施例相同或相应的术语的解释在此不再赘述。如图4所示,该装置包括待语义分割图像获取模块410和图像语义分割模块420,其中:
84.待语义分割图像获取模块410,用于获取待语义分割图像;
85.图像语义分割模块420,用于将待分割图像输入至预先训练的图像语义分割模型中,获得图像语义分割模型的语义分割结果,其中,图像语义分割模型基于本发明任意实施例所提供的图像语义分割模型的构建方法构建的图像语义分割模型训练得到。
86.本发明实施例通过待语义分割图像获取模块获取待语义分割图像;图像语义分割模块将待分割图像输入至预先训练的图像语义分割模型中,获得图像语义分割模型的语义分割结果,其中,图像语义分割模型基于本发明任意实施例所提供的图像语义分割模型的构建方法构建的图像语义分割模型训练得到。通过减少图像语义分割模型中卷积层通道的数量,加快了基于图像语义分割模型进行图像语义分割的速度,通过特征补全层进行特征补全,保证了图像语义分割的准确度。
87.本发明实施例所提供的图像语义分割装置可执行本发明任意实施例所提供的图像语义分割方法,具备执行方法相应的功能模块和有益效果。
88.图5是本发明实施例所提供的一种计算机设备的结构示意图。图5示出了适于用来实现本发明实施方式的示例性计算机设备512的框图。图5显示的计算机设备512仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
89.如图5所示,计算机设备512以通用计算设备的形式表现。计算机设备512的组件可以包括但不限于:一个或者多个处理器516,系统存储器528,连接不同系统组件(包括系统存储器528和处理器516)的总线518。
90.总线518表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器516或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(isa)总线,微通道体系结构(mac)总线,增强型isa总线、视频电子标准协会(vesa)局域总线以及外围组件互连(pci)总线。
91.计算机设备512典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备512访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
92.系统存储器528可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(ram)550和/或高速缓存存储器552。计算机设备512可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储装置554可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,
可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如cd-rom,dvd-rom或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线518相连。存储器528可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
93.具有一组(至少一个)程序模块542的程序/实用工具540,可以存储在例如存储器528中,这样的程序模块542包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块542通常执行本发明所描述的实施例中的功能和/或方法。
94.计算机设备512也可以与一个或多个外部设备514(例如键盘、指向设备、显示器524等)通信,还可与一个或者多个使得用户能与该计算机设备512交互的设备通信,和/或与使得该计算机设备512能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口522进行。并且,计算机设备512还可以通过网络适配器520与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器520通过总线518与计算机设备512的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备512使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
95.处理器516通过运行存储在系统存储器528中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的图像语义分割模型的构建方法,该方法包括:
96.获取待构建模型的基础模型结构,基础模型结构包括骨干神经网络、卷积层、特征拼接层和分割网络,分割网络包括像素重组模块;
97.根据像素重组模块的输出特征数据的数据通道数量确定卷积层通道数量以及补全通道数量;
98.根据补全通道数量从骨干神经网络中选取中间层作为特征补全层,将特征补全层和卷积层分别与特征拼接模块相连接,将特征拼接模块与分割网络相连接,得到图像语义分割模型;
99.和/或,实现本发明实施例所提供的图像语义分割方法,该方法包括:
100.获取待语义分割图像;
101.将待分割图像输入至预先训练的图像语义分割模型中,获得图像语义分割模型的语义分割结果,其中,图像语义分割模型基于本发明任意实施例所提供的图像语义分割模型的构建方法构建的图像语义分割模型训练得到。
102.当然,本领域技术人员可以理解,处理器还可以实现本发明任意实施例所提供的图像语义分割模型的构建方法,和/或,图像语义分割方法的技术方案。
103.本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明实施例所提供的图像语义分割模型的构建方法,该方法包括:
104.获取待构建模型的基础模型结构,基础模型结构包括骨干神经网络、卷积层、特征拼接层和分割网络,分割网络包括像素重组模块;
105.根据像素重组模块的输出特征数据的数据通道数量确定卷积层通道数量以及补全通道数量;
106.根据补全通道数量从骨干神经网络中选取中间层作为特征补全层,将特征补全层和卷积层分别与特征拼接模块相连接,将特征拼接模块与分割网络相连接,得到图像语义分割模型;
107.和/或,实现本发明实施例所提供的图像语义分割方法,该方法包括:
108.获取待语义分割图像;
109.将待分割图像输入至预先训练的图像语义分割模型中,获得图像语义分割模型的语义分割结果,其中,图像语义分割模型基于本发明任意实施例所提供的图像语义分割模型的构建方法构建的图像语义分割模型训练得到。
110.当然,本发明实施例所提供的一种计算机可读存储介质,其上存储的计算机程序不限于如上的方法操作,还可以执行本发明任意实施例所提供的图像语义分割模型的构建方法,和/或,图像语义分割方法的相关操作。
111.本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
112.计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
113.计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、rf等等,或者上述的任意合适的组合。
114.可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c ,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
115.注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新
调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献