用于训练图像分割模型和图像分割的方法、装置与流程

2022-04-27 02:43:27 来源：中国专利 TAG：

1.本公开涉及人工智能技术领域，特别涉及图像处理和深度学习技术，尤其涉及用于训练图像分割模型和图像分割的方法、装置。

背景技术：

2.随着互联网技术的发展，语义分割技术也取得了越来越广泛的应用。语义分割是一种典型的计算机视觉问题，其涉及将一些原始数据(例如，平面图像)作为输入并将它们转换为具有突出显示的感兴趣区域的掩模。
3.现有的语义分割学习算法，通常采用交叉熵损失、dice损失等进行训练，导致在分割结果的对象实例完整性上存在一定缺陷，不能满足图像分割完整性的需求。

技术实现要素：

4.提供了一种用于训练图像分割模型和图像分割的方法、装置、电子设备以及存储介质。
5.根据第一方面，提供了一种用于训练图像分割模型的方法，该方法包括：将预先获取的训练样本的样本图像输入至预先获取的初始图像分割模型，得到与输入的样本图像对应的图像分割结果预测图，其中，训练样本包括包含前景的样本图像和对应的样本图像分割结果图，样本图像分割结果图中包括与前景相匹配的至少一个连通域，图像分割结果预测图中包括目标数目个连通域；基于样本图像分割结果图中包括的至少一个连通域与图像分割结果预测图中包括的目标数目个连通域的匹配，利用预设的语义连通损失函数生成语义连通性损失值；基于语义连通性损失值和利用预设的分割损失函数确定的分割损失值，生成总损失值；根据总损失值，调整初始图像分割模型的参数。
6.根据第二方面，提供了一种图像分割的方法，该方法包括：获取包含前景的待分割图像；将待分割图像输入至预先训练的图像分割模型，生成待分割图像对应的图像分割结果图，其中，图像分割模型基于训练样本的样本图像分割结果图中包括的至少一个连通域与经过图像分割模型所得到的图像分割结果预测图中包括的目标数目个连通域的匹配而确定的损失值训练得到。
7.根据第三方面，提供了一种用于训练图像分割模型的装置，该装置包括：分割单元，被配置成将预先获取的训练样本的样本图像输入至预先获取的初始图像分割模型，得到与输入的样本图像对应的图像分割结果预测图，其中，训练样本包括包含前景的样本图像和对应的样本图像分割结果图，样本图像分割结果图中包括与前景相匹配的至少一个连通域，图像分割结果预测图中包括目标数目个连通域；第一损失生成单元，被配置成基于样本图像分割结果图中包括的至少一个连通域与图像分割结果预测图中包括的目标数目个连通域的匹配，利用预设的语义连通损失函数生成语义连通性损失值；第二损失生成单元，被配置成基于语义连通性损失值和利用预设的分割损失函数确定的分割损失值，生成总损失值；调整单元，被配置成根据总损失值，调整初始图像分割模型的参数。
8.根据第四方面，提供了一种图像分割的装置，该装置包括：获取单元，被配置成获取包含前景的待分割图像；图像分割单元，被配置成将待分割图像输入至预先训练的图像分割模型，生成待分割图像对应的图像分割结果图，其中，图像分割模型基于训练样本的样本图像分割结果图中包括的至少一个连通域与经过图像分割模型所得到的图像分割结果预测图中包括的目标数目个连通域的匹配而确定的损失值训练得到。
9.根据第五方面，提供了一种电子设备，该电子设备包括：至少一个处理器；以及与上述至少一个处理器通信连接的存储器；其中，存储器存储有可被上述至少一个处理器执行的指令，上述指令被至少一个处理器执行，以使上述至少一个处理器能够执行如第一方面或第二方面中任一实现方式所描述的方法。
10.根据第四方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，该计算机指令用于使计算机能够执行如第一方面中任一实现方式所描述的方法。
11.根据本公开的技术实现了通过引入训练样本中与包含前景的样本图像对应的样本图像分割结果图中包括的至少一个连通域与图像分割结果预测图中包括的目标数目个连通域的匹配，将图像分割结果预测图中前景的完整性转换为与样本图像分割结果图相比较后的语义连通性损失值，将上述语义连通性损失值作为总损失的一部分用以指导模型的训练，从而提升了模型训练的效果，尤其减少了训练后的模型将前景割裂为多个子部分的情况，提高了图像分割的完整性。
12.应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
13.附图用于更好地理解本方案，不构成对本公开的限定。其中：
14.图1a、1b是根据本公开第一实施例的示意图；
15.图2是根据本公开第二实施例的示意图；
16.图3是可以实现本公开实施例的用于训练图像分割模型的方法的一个应用场景的示意图；
17.图4是根据本公开实施例的用于训练图像分割模型的装置的示意图；
18.图5是根据本公开实施例的图像分割的装置的示意图；
19.图6是用来实现本公开实施例的用于训练图像分割模型的方法的电子设备的框图。
具体实施方式
20.以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。
21.图1a是示出了根据本公开第一实施例的示意图100。该用于训练图像分割模型的方法包括以下步骤：
22.s101，将预先获取的训练样本的样本图像输入至预先获取的初始图像分割模型，
得到与输入的样本图像对应的图像分割结果预测图。
23.在本实施例中，用于训练图像分割模型的方法的执行主体可以通过各种方式将预先获取的训练样本的样本图像输入至预先获取的初始图像分割模型，得到与输入的样本图像对应的图像分割结果预测图。
24.在本实施例中，上述执行主体可以预先获取训练样本集合。其中，上述训练样本集合中的训练样本可以包括包含前景的样本图像和对应的样本图像分割结果图。上述样本图像分割结果图可以用于区分样本图像的前景和背景。上述样本图像分割结果图中的像素值可以用于表示该像素值所属的类别，例如0代表背景，1代表前景。上述样本图像分割结果图中可以包括与前景相匹配的至少一个连通域。上述前景通常可以用于指示图像分割所针对的对象，例如人像，卡通人像，特定物像(例如马的图像、狗的图像、建筑物的图像等)。通常，上述连通域的数目不大于上述前景的数目。作为示例，当样本图像中包含两个非重叠的人像时，对应的样本图像分割结果图中可以包括2个连通域。作为又一示例，当样本图像中包含两个相互重叠的人像时，对应的样本图像分割结果图中可以包括1个连通域。
25.在本实施例中，上述执行主体可以预先获取初始图像分割模型。其中，上述初始图像分割模型可以包括各种能够用于图像分割的深度学习模型，例如卷积神经网络(convolutional neural networks,cnn)、transformer网络等。上述执行主体可以将上述预先获取的训练样本的样本图像输入至上述预先获取的初始图像分割模型，从而得到与输入的样本图像对应的图像分割结果预测图。其中，上述图像分割结果预测图中的像素可以用于预测输入上述初始图像分割模型的图像中该像素属于前景或背景的可能性。上述图像分割结果预测图中可以包括目标数目个连通域。
26.s102，基于样本图像分割结果图中包括的至少一个连通域与图像分割结果预测图中包括的目标数目个连通域的匹配，利用预设的语义连通损失函数生成语义连通性损失值。
27.在本实施例中，上述执行主体可以通过各种方式对上述步骤s101中的样本图像分割结果图中包括的至少一个连通域与图像分割结果预测图中包括的目标数目个连通域进行匹配。而后，根据匹配结果，上述执行主体可以利用预设的语义连通损失函数生成语义连通性损失值。
28.作为示例，参见图1b，如图1b中的图(i)所示，上述样本图像分割结果图(如图中g所示)和图像分割结果预测图(如图中p所示)中分别包括4个和5个连通域。继续参见图(ii)，上述执行主体可以将上述样本图像分割结果图和图像分割结果预测图中的每个连通域作为一个连通分量。并且上述执行主体可以对上述各个连通域进行标记(例如p1、p2、p3、p4、p5和g1、g2、g3、g4)，以区分各个不同的连通域。而后，参见图(iii)，上述执行主体可以将上述样本图像分割结果图和上述图像分割结果预测图进行匹配，生成匹配结果。可见，彼此相交的连通域有3对(即p2和g2、p5和g3、p4和g4，上述样本图像分割结果图中有1个独立的连通域(即g1)。上述图像分割结果预测图中有2个独立的连通域(即p1和p2)。
29.而后，上述执行主体可以利用预设的语义连通损失函数生成语义连通性损失值。其中，上述预设的语义连通损失函数通常用于表示样本图像分割结果图中包括的至少一个连通域与图像分割结果预测图中包括的目标数目个连通域的匹配程度。通常，上述匹配程度越高，上述预设的语义连通损失函数对应的语义连通性损失值越低。同理，上述匹配程度
越低，上述预设的语义连通损失函数对应的语义连通性损失值越高。
30.在本实施例中，上述预设的语义连通损失函数可以包括各种形式，例如样本图像分割结果图中独立的连通域的个数，图像分割结果预测图中独立的连通域的个数，1-彼此相交的连通域的对数/样本图像分割结果图中连通域的个数，1-彼此相交的连通域的对数/图像分割结果预测图中连通域的个数等等。
31.s103，基于语义连通性损失值和利用预设的分割损失函数确定的分割损失值，生成总损失值。
32.在本实施例中，基于步骤s102所生成的语义连通性损失值和利用预设的分割损失函数确定的分割损失值，上述执行主体可以通过各种方式生成总损失值。其中，上述预设的分割损失函数可以采用各种用于度量分割损失的函数，例如交叉熵损失、lovasz损失、dice损失、rmi(region mutual information，区域互信息)损失。
33.在本实施例中，上述执行主体可以通过各种方式对上述步骤s102所生成的语义连通性损失值和上述分割损失值进行融合，例如加权平均，从而生成总损失值。
34.s104，根据总损失值，调整初始图像分割模型的参数。
35.在本实施例中，根据上述步骤s103所生成的总损失值，上述执行主体可以通过各种方式调整上述步骤s101中预先获取的初始图像分割模型的参数。作为示例，上述执行主体可以利用各种机器学习方式(例如采用小批量梯度下降和反向传播方式)对上述初始图像分割模型的参数进行调整。
36.本公开的上述实施例提供的方法，通过引入训练样本中与包含前景的样本图像对应的样本图像分割结果图中包括的至少一个连通域与上述图像分割结果预测图中包括的目标数目个连通域的匹配，将图像分割结果预测图中前景的完整性转换为与样本图像分割结果图相比较后的语义连通性损失值，将上述语义连通性损失值作为总损失的一部分用以指导模型的训练，从而提升了模型训练的效果，尤其减少了训练后的模型将前景图像割裂为多个子部分的情况，提高了图像分割的完整性。
37.在本实施例的一些可选的实现方式中，基于样本图像分割结果图中包括的至少一个连通域与图像分割结果预测图中包括的目标数目个连通域的匹配，上述执行主体可以按照如下步骤利用预设的语义连通损失函数生成语义连通性损失值：
38.s1021，对于样本图像分割结果图中包括的至少一个连通域中的连通域，基于该连通域与图像分割结果预测图中包括的目标数目个连通域的匹配，生成该连通域对应的连通值。
39.在这些实现方式中，对于样本图像分割结果图中包括的至少一个连通域中的连通域，上述执行主体可以将该连通域与图像分割结果预测图中包括的目标数目个连通域进行匹配。基于上述匹配结果，上述执行主体可以通过各种方式生成该连通域对应的连通值。从而，上述执行主体可以生成与上述样本图像分割结果图中包括的连通域的数目一致的连通值。其中，上述连通值可以用于表征样本图像分割结果图中包括的连通域与图像分割结果预测图中包括的连通域之间的匹配程度。通常，上述匹配程度越高，上述连通值越高。同理，上述匹配程度越低，上述连通值越低。作为示例，上述连通值可以通过样本图像分割结果图中包括的连通域与图像分割结果预测图中包括的连通域之间的交并比来计算。
40.在这些实现方式中，作为示例，当上述样本图像分割结果图中包括的连通域(例如
连通域g1)与图像分割结果预测图中包括的1个连通域(例如连通域p1)相交时，上述执行主体可以利用连通域g1与连通域p1的交集与并集之间的比值来生成连通域g1的连通值。作为又一示例，当上述样本图像分割结果图中包括的连通域(例如连通域g1)与图像分割结果预测图中包括的3个连通域(例如连通域p1、p2、p3)相交时，上述执行主体可以将连通域g1与连通域p1、与连通域p2、与连通域p3的交集与并集之间的比值这三者的平均值确定为所生成的连通域g1的连通值。
41.在这些实现方式中，作为示例，当上述样本图像分割结果图中包括的连通域(例如连通域g1)不与图像分割结果预测图中包括的任意一个连通域相交时，上述执行主体可以确定该连通域g1的连通值为0。
42.s1022，根据所生成的与至少一个连通域分别对应的连通值，生成语义连通性损失值。
43.在这些实现方式中，根据上述步骤s1021所生成的与至少一个连通域分别对应的连通值，上述执行主体可以通过各种方法生成语义连通性损失值。其中，上述语义连通性损失值通常与上述连通值负相关。
44.在这些实现方式中，上述执行主体可以对上述步骤s1021所生成的各连通值求平均，得到平均值。而后，上述执行主体可以将预设值与上述平均值之差确定为上述语义连通性损失值。作为示例，当上述连通值基于前述交并比的方式生成时，上述平均值的范围为[0,1]。上述预设值可以为1，从而上述语义连通性损失值的范围也为[0,1]。
[0045]
基于上述可选的实现方式，本方案可以根据样本图像分割结果图中包括的连通域与图像分割结果预测图中包括的各个连通域进行匹配，生成样本图像分割结果图中包括的各连通域分别对应的连通值，再根据所生成的各连通值生成语义连通性损失值。从而丰富了语义连通性损失值的生成方式，提升了连通值生成方式的健壮性(robustness)。而且，针对样本图像分割结果图中包括的各个连通域分别生成连通值，可以更为准确地反映图像分割结果预测图与样本图像分割结果图在连通域维度上一一对应的完整性差异。
[0046]
在本实施例的一些可选的实现方式中，上述步骤s1021中基于样本图像分割结果图中包括的至少一个连通域与图像分割结果预测图中包括的目标数目个连通域的匹配，上述执行主体可以按照以下步骤利用预设的语义连通损失函数生成语义连通性损失值：
[0047]
第一步，确定样本图像分割结果图中包括的至少一个连通域是否与图像分割结果预测图中包括的目标数目个连通域均不相交。
[0048]
在这些实现方式中，上述执行主体可以通过各种方式确定样本图像分割结果图中包括的至少一个连通域是否与上述图像分割结果预测图中包括的目标数目个连通域均不相交。作为示例，上述执行主体可以遍历上述样本图像分割结果图和上述图像分割结果预测图中包括的所有连通域，以确定样本图像分割结果图中包括的至少一个连通域是否与图像分割结果预测图中包括的目标数目个连通域均不相交。
[0049]
第二步，响应于确定样本图像分割结果图中包括的至少一个连通域与图像分割结果预测图中包括的目标数目个连通域均不相交，利用预设的非平凡的损失函数作为语义连通性损失函数生成语义连通性损失值。
[0050]
在这些实现方式中，响应于确定上述第一步所确定的样本图像分割结果图中包括的至少一个连通域与图像分割结果预测图中包括的目标数目个连通域均不相交，上述执行
主体可以利用预设的非平凡的损失函数作为语义连通性损失函数生成语义连通性损失值。其中，上述预设的非平凡的损失函数通常具有连续可微、可导的特点。
[0051]
基于上述可选的实现方式，本方案可以针对在确定样本图像分割结果图中包括的至少一个连通域与图像分割结果预测图中包括的目标数目个连通域均不相交的情况下设置预设的非平凡的损失函数，从而避免了模型冷启动情况下由于参数的随机初始化等造成零梯度而导致的权重无法更新的问题。
[0052]
可选地，基于上述第二步所描述的方式，上述预设的非平凡的损失函数包括：上述样本图像分割结果图中包括的至少一个连通域与上述图像分割结果预测图中包括的目标数目个连通域的并集与上述图像分割结果预测图的面积的比值。
[0053]
在这些实现方式中，上述预设的非平凡的损失函数可以表示为：
[0054][0055]
其中，上述g可以用于表示包括至少一个连通域的样本图像分割结果图。上述p可以用于表示包括目标数目个连通域的图像分割结果预测图。上述i可以用于表示图像(通常上述图像分割结果预测图与上述样本图像分割结果图的尺寸一致)。
[0056]
基于上述可选的实现方式，本方案提供了一种非平凡的损失函数，从而避免了模型冷启动情况下由于参数的随机初始化等造成零梯度而导致的权重无法更新的问题。
[0057]
在本实施例的一些可选的实现方式中，基于样本图像分割结果图中包括的至少一个连通域与图像分割结果预测图中包括的目标数目个连通域的匹配，上述执行主体还可以继续按照如下步骤利用预设的语义连通损失函数生成语义连通性损失值：
[0058]
s1023，响应于确定样本图像分割结果图中包括的至少一个连通域与图像分割结果预测图中包括的目标数目个连通域存在相交的连通域，对于样本图像分割结果图中包括的至少一个连通域中的连通域，基于该连通域与图像分割结果预测图中相交的连通域的交并比，生成该连通域对应的连通值。
[0059]
在这些实现方式中，响应于确定上述第一步所确定的样本图像分割结果图中包括的至少一个连通域与图像分割结果预测图中包括的目标数目个连通域存在相交的连通域，对于样本图像分割结果图中包括的至少一个连通域中的连通域，上述执行主体可以基于该连通域与图像分割结果预测图中相交的连通域的交并比，通过各种方式生成该连通域对应的连通值。
[0060]
在这些实现方式中，上述执行主体可以采用与前述步骤s1021中基于交并比确定连通值的方式一致的方式，生成与上述样本图像分割结果图中包括的连通域的数目一致的连通值。此处不再赘述。
[0061]
s1024，将所生成的至少一个连通域分别对应的连通值的平均值确定为连通总值。
[0062]
在这些实现方式中，上述执行主体可以将步骤s1023所生成的至少一个连通域分别对应的连通值的平均值确定为连通总值。作为示例，上述执行主体可以首先将上述步骤s1023所生成的各连通值相加。而后，上述执行主体再将上述相加后的结果除以目标值，得到上述连通总值。其中，上述目标值通常可以根据上述样本图像分割结果图和图像分割结果预测图中的成对连通域和孤立连通域的数目而确定。例如，上述目标值可以是匹配成对连通域的对数与孤立连通域的数目之和。
[0063]
可选地，上述目标值可以是匹配成对连通域的对数与图像分割结果预测图中的孤立连通域的数目之和。从而可以避免上述样本图像分割结果图中本身包含的孤立连通域的数目的影响，更准确地衡量上述图像分割结果预测图对应的连通性。
[0064]
s1025，利用与连通总值负相关的语义连通损失函数根据连通总值生成语义连通性损失值。
[0065]
在这些实现方式中，上述执行主体可以利用与上述连通总值负相关的语义连通损失函数根据连通总值生成语义连通性损失值。作为示例，上述执行主体可以将预设值与上述平均值之差确定为上述语义连通性损失值。其中，上述预设值例如可以为1，从而上述语义连通性损失值的范围可以为[0，1]。
[0066]
基于上述可选的实现方式，本方案可以在模型正常训练(例如除了冷启动环节)的过程中，通过更加细致的语义连通性损失值确定方式为模型的参数调节方向提供指引，从而提高模型的训练效果。
[0067]
在本实施例的一些可选的实现方式中，上述前景可以包括人像。上述执行主体还可以继续执行以下步骤：
[0068]
s105，将调整后的初始图像分割模型重新确定为预先获取的初始图像分割模型；以及将属于同一训练样本集合的其他训练样本重新确定为预先获取的训练样本。
[0069]
在这些实现方式中，上述执行主体将经过上述步骤s104调整后的初始图像分割模型重新确定为预先获取的初始图像分割模型；以及将属于同一训练样本集合的其他训练样本重新确定为预先获取的训练样本。
[0070]
s106，继续执行用于训练图像分割模型的方法；以及在满足训练停止条件时将所训练的初始图像分割模型确定为图像分割模型。
[0071]
在这些实现方式中，上述执行主体可以利用上述步骤s105所重新确定的初始图像分割模型和训练样本，重新继续执行上述步骤s101至步骤s104。上述执行主体还可以在满足训练停止条件时将所训练的初始图像分割模型确定为图像分割模型。
[0072]
在这些实现方式中，上述训练停止条件可以预先设定，例如训练迭代次数达到预设次数，训练时长达到预设时长，总损失值收敛等，此处不作限定。
[0073]
基于上述可选的实现方式，本方案可以利用机器学习方式对上述初始图像分割模型不断训练，从而生成满足要求的图像分割模型。
[0074]
继续参见图2，图2是根据本公开第二实施例的示意图200。该图像分割的方法包括以下步骤：
[0075]
s201，获取包含前景的待分割图像。
[0076]
在本实施例中，图像分割的方法的执行主体可以通过有线或无线连接的方式从本地或通信连接的电子设备获取包含前景的待分割图像。其中，上述待分割图像中可以包括至少一个前景。上述至少一个前景可以是相互不重叠的前景，也可以是存在部分重叠的前景，在此不做限定。可选地，上述前景可以是人像。
[0077]
s202，将待分割图像输入至预先训练的图像分割模型，生成待分割图像对应的图像分割结果图。
[0078]
在本实施例中，上述执行主体可以通过各种方式将上述步骤s201所获取的待分割图像输入至预先训练的图像分割模型，生成待分割图像对应的图像分割结果图。其中，上述
图像分割模型可以用于表征图像分割结果图与待分割图像之间的对应关系。上述图像分割结果图可以用于指示将上述待分割图像的前景和背景进行分离后的结果。上述图像分割结果图中的像素值可以用于表示该像素值所属的类别，例如0代表背景，1代表前景。
[0079]
在本实施例中，上述图像分割模型可以基于训练样本的样本图像分割结果图中包括的至少一个连通域与经过上述图像分割模型所得到的图像分割结果预测图中包括的目标数目个连通域的匹配而确定的损失值训练得到。其中，上述训练样本可以包括包含前景的样本图像和对应的样本图像分割结果图。上述样本图像分割结果图中可以包括与前景相匹配的至少一个连通域。上述图像分割结果预测图中可以包括目标数目个连通域。上述损失值可以用于表征上述图像分割结果预测图和样本图像分割结果图在连通域维度上的匹配程度。
[0080]
在本实施例的一些可选的实现方式中，上述图像分割模型可以通过前述实施例中所描述的用于训练图像分割模型的方法训练得到。
[0081]
从图2中可以看出，本实施例中的图像分割的方法的流程200体现了利用基于训练样本的样本图像分割结果图中包括的至少一个连通域与经过上述图像分割模型所得到的图像分割结果预测图中包括的目标数目个连通域的匹配而确定的损失值训练得到的图像分割模型进行图像分割的步骤。由此，本实施例描述的方案可以减少将前景割裂为多个子部分的情况，提高了图像分割的完整性。
[0082]
继续参见图3，图3是根据本公开的实施例的用于训练图像分割模型的方法的应用场景的一个示意图。在图3的应用场景中，用于训练图像分割模型的服务器(图中未示出)可以预先获取训练样本301和初始图像分割模型302。其中，上述训练样本301可以包括样本图像3011和对应的样本图像分割结果图3012。上述样本图像分割结果图中包括与人像匹配的两个连通域，分别为30121和30122。服务器将样本图像3011输入至上述初始图像分割模型302，得到与样本图像3011对应的图像分割结果预测图303。上述图像分割结果预测图303中包括2个连通域，分别为3031和3032。基于样本图像分割结果图3012中包括的连通域30121、30122与图像分割结果预测图303中包括的连通域3031、3032的匹配，生成语义连通性损失值304。之后，基于语义连通性损失值304和利用预设的分割损失函数确定的分割损失值，服务器可以生成总损失值305。根据总损失值305，服务器可以调整初始图像分割模型302的参数。
[0083]
目前，现有技术之一通常是仅采用交叉熵损失、dice损失等进行训练，导致在分割结果的对象实例完整性上存在一定缺陷，不能满足图像分割完整性的需求。而本公开的上述实施例提供的方法，通过引入训练样本中与包含前景的样本图像对应的样本图像分割结果图中包括的至少一个连通域与上述图像分割结果预测图中包括的目标数目个连通域的匹配，将图像分割结果预测图中前景的完整性转换为与样本图像分割结果图相比较后的语义连通性损失值，将上述语义连通性损失值作为总损失的一部分用以指导模型的训练，从而提升了模型训练的效果，提高了图像分割的完整性。
[0084]
进一步参考图4，作为对上述各图所示方法的实现，本公开提供了用于训练图像分割模型的装置的一个实施例，该装置实施例与图1a所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。
[0085]
如图4所示，本实施例提供的用于训练图像分割模型的装置400包括分割单元401、
第一损失生成单元402、第二损失生成单元403和调整单元404。其中，分割单元401，被配置成将预先获取的训练样本的样本图像输入至预先获取的初始图像分割模型，得到与输入的样本图像对应的图像分割结果预测图，其中，训练样本包括包含前景的样本图像和对应的样本图像分割结果图，样本图像分割结果图中包括与前景相匹配的至少一个连通域，图像分割结果预测图中包括目标数目个连通域；第一损失生成单元402，被配置成基于样本图像分割结果图中包括的至少一个连通域与图像分割结果预测图中包括的目标数目个连通域的匹配，利用预设的语义连通损失函数生成语义连通性损失值；第二损失生成单元403，被配置成基于语义连通性损失值和利用预设的分割损失函数确定的分割损失值，生成总损失值；调整单元404，被配置成根据总损失值，调整初始图像分割模型的参数。
[0086]
在本实施例中，用于训练图像分割模型的装置400中：分割单元401、第一损失生成单元402、第二损失生成单元403和调整单元404的具体处理及其所带来的技术效果可分别参考图1a对应实施例中的步骤s101、s102、s103和s104的相关说明，在此不再赘述。
[0087]
在本实施例的一些可选的实现方式中，上述第一损失生成单元403可以包括：第一生成模块(图中未示出)，被配置成对于样本图像分割结果图中包括的至少一个连通域中的连通域，基于该连通域与图像分割结果预测图中包括的目标数目个连通域的匹配，生成该连通域对应的连通值；第二生成模块(图中未示出)，被配置成根据所生成的与至少一个连通域分别对应的连通值，生成语义连通性损失值。
[0088]
在本实施例的一些可选的实现方式中，上述第一损失生成单元403可以包括：第一确定模块(图中未示出)，被配置成确定样本图像分割结果图中包括的至少一个连通域是否与图像分割结果预测图中包括的目标数目个连通域均不相交；第三生成模块(图中未示出)，被配置成响应于确定样本图像分割结果图中包括的至少一个连通域与图像分割结果预测图中包括的目标数目个连通域均不相交，利用预设的非平凡的损失函数作为语义连通性损失函数生成语义连通性损失值。
[0089]
在本实施例的一些可选的实现方式中，上述预设的非平凡的损失函数包括：上述样本图像分割结果图中包括的至少一个连通域与图像分割结果预测图中包括的目标数目个连通域的并集与图像分割结果预测图的面积的比值。
[0090]
在本实施例的一些可选的实现方式中，上述第一损失生成单元403还可以包括：第四生成模块(图中未示出)，被配置成响应于确定样本图像分割结果图中包括的至少一个连通域与图像分割结果预测图中包括的目标数目个连通域存在相交的连通域，对于样本图像分割结果图中包括的至少一个连通域中的连通域，基于该连通域与图像分割结果预测图中相交的连通域的交并比，生成该连通域对应的连通值；第二确定模块(图中未示出)，被配置成将所生成的至少一个连通域分别对应的连通值的平均值确定为连通总值；第五生成模块(图中未示出)，被配置成利用与连通总值负相关的语义连通损失函数根据连通总值生成语义连通性损失值。
[0091]
在本实施例的一些可选的实现方式中，上述前景可以包括人像。上述用于训练图像分割模型的装置还可以包括：更新单元(图中未示出)，被配置成将调整后的初始图像分割模型重新确定为预先获取的初始图像分割模型；以及将属于同一训练样本集合的其他训练样本重新确定为预先获取的训练样本；训练单元(图中未示出)，被配置成继续执行用于训练图像分割模型的方法；以及在满足训练停止条件时将所训练的初始图像分割模型确定
为图像分割模型。
[0092]
本公开的上述实施例提供的装置，通过引入分割单元401预先获取的训练样本中与包含前景的样本图像对应的样本图像分割结果图中包括的至少一个连通域与图像分割结果预测图中包括的目标数目个连通域的匹配，第一损失生成单元402将图像分割结果预测图中前景的完整性转换为与样本图像分割结果图相比较后的语义连通性损失值，第二损失生成单元403将上述语义连通性损失值作为总损失的一部分用以指导模型的训练，从而提升了模型训练的效果，尤其减少了训练后的模型将前景割裂为多个子部分的情况，提高了图像分割的完整性。
[0093]
进一步参考图5，作为对上述各图所示方法的实现，本公开提供了图像分割的装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。
[0094]
如图5所示，本实施例提供的图像分割的装置500包括获取单元501、图像分割单元502。其中，获取单元501，被配置成获取包含前景的待分割图像；图像分割单元502，被配置成将待分割图像输入至预先训练的图像分割模型，生成待分割图像对应的图像分割结果图，其中，图像分割模型基于训练样本的样本图像分割结果图中包括的至少一个连通域与经过图像分割模型所得到的图像分割结果预测图中包括的目标数目个连通域的匹配而确定的损失值训练得到。
[0095]
在本实施例中，图像分割的装置500中：获取单元501、图像分割单元502的具体处理及其所带来的技术效果可分别参考图2对应实施例中的步骤s201、s202的相关说明，在此不再赘述。
[0096]
在本实施例的一些可选的实现方式中，上述图像分割模型通过前述实施例所描述的用于训练图像分割模型的方法训练得到。
[0097]
本公开的上述实施例提供的装置，通过图像分割单元502利用基于训练样本的样本图像分割结果图中包括的至少一个连通域与经过上述图像分割模型所得到的图像分割结果预测图中包括的目标数目个连通域的匹配而确定的损失值训练得到的图像分割模型对获取单元501获取的包含前景的待分割图像进行图像分割，从而可以减少将前景割裂为多个子部分的情况，提高了图像分割的完整性。
[0098]
本公开的技术方案中，所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理，均符合相关法律法规的规定，且不违背公序良俗。
[0099]
根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
[0100]
图6示出了可以用来实施本公开的实施例的示例电子设备600的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。
[0101]
如图6所示，设备600包括计算单元601，其可以根据存储在只读存储器(rom)602中的计算机程序或者从存储单元608加载到随机访问存储器(ram)603中的计算机程序，来执
行各种适当的动作和处理。在ram603中，还可存储设备600操作所需的各种程序和数据。计算单元601、rom 602以及ram 603通过总线604彼此相连。输入/输出(i/o)接口605也连接至总线604。
[0102]
设备600中的多个部件连接至i/o接口605，包括：输入单元606，例如键盘、鼠标等；输出单元607，例如各种类型的显示器、扬声器等；存储单元608，例如磁盘、光盘等；以及通信单元609，例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0103]
计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理，例如用于训练图像分割模型或图像分割的方法。例如，在一些实施例中，用于训练图像分割模型或图像分割的方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元608。在一些实施例中，计算机程序的部分或者全部可以经由rom 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到ram 603并由计算单元601执行时，可以执行上文描述的用于训练图像分割模型或图像分割的方法的一个或多个步骤。备选地，在其他实施例中，计算单元601可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行用于训练图像分割模型或图像分割的方法。
[0104]
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
[0105]
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0106]
在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0107]
为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，crt(阴极射线管)或者lcd(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0108]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(lan)、广域网(wan)和互联网。
[0109]
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，也可以为分布式系统的服务器，或者是结合了区块链的服务器。
[0110]
应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。
[0111]
上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：城市货车管控区域通行路线静态等级划分系统的制作方法

用于训练图像分割模型和图像分割的方法、装置与流程

相关文献

最热文献