一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

地毯识别方法、装置、智能设备及存储介质与流程

2021-11-05 20:00:00 来源:中国专利 TAG:


1.本发明涉及图像处理技术领域,尤其涉及一种地毯识别方法、装置、智能设备及存储介质。


背景技术:

2.智能设备在工作过程中,会遇到各种不同的运动场景,需要通过预置的检测算法对运动路径上的路况进行识别,以便更好的执行清洁任务或行走任务。
3.现有的检测算法主要针对一些形状、颜色、纹理相对确定的物体时具有较好的结果,但在对地毯进行识别时,由于运动过程中地毯的形状多变,且本身颜色、纹理种类很多,很难对地毯进行准确检测。


技术实现要素:

4.本发明提供了一种地毯识别方法、装置、智能设备及存储介质,用于将语义分割图像中的干扰区域进行消除,避免将不可能为地毯区域的干扰区域误判为地毯区域,提高了对地毯的识别准确度,并提高了识别速率。
5.本发明实施例的第一方面提供一种地毯识别方法,包括:获取目标区域的初始扫描图像;调用预置的语义分割模型对所述初始扫描图像进行语义分割,得到语义分割图像;将所述语义分割图像中的干扰区域进行消除,得到至少一个目标包络框,所述目标包络框用于指示所述语义分割图像中的地毯区域;将所述至少一个目标包络框叠加到所述语义分割图像中的对应位置,生成目标图像。
6.在一种可行的实施方式中,所述将所述语义分割图像中的干扰区域进行消除,得到至少一个目标包络框,包括:对所述语义分割图像进行边缘检测操作,得到边缘图像,所述边缘图像包含多个初始区域;消除所述多个初始区域中的干扰区域,得到连通区域图像,所述连通区域图像包括至少一个连通区域,所述干扰区域为所述边缘图像中区域面积小于第一阈值的初始区域;基于所述连通区域图像生成至少一个目标包络框。
7.在一种可行的实施方式中,所述消除所述多个初始区域中的干扰区域,得到连通区域图像,包括:调用指定尺寸的矩形内核对所述多个初始区域进行平滑处理,得到目标图像,所述目标图像包括多个候选区域;计算所述目标图像中每个候选区域的区域面积;将区域面积小于第一阈值的候选区域确定为干扰区域并进行腐蚀操作;将区域面积大于或等于所述第一阈值的候选区域确定为连通区域,得到连通区域图像。
8.在一种可行的实施方式中,所述调用指定尺寸的矩形内核对所述多个初始区域进行平滑处理,得到目标图像,包括:调用指定尺寸的矩形内核对所述多个初始区域进行开操作,得到目标图像。
9.在一种可行的实施方式中,所述调用指定尺寸的矩形内核对所述多个初始区域进行平滑处理,得到目标图像,包括:调用指定尺寸的矩形内核对所述多个初始区域进行开操作,得到开操作图像,所述开操作图像包括多个开操作后的区域;调用所述矩形内核对所述
开操作图像中各个区域进行闭操作,得到目标图像。
10.在一种可行的实施方式中,所述调用指定尺寸的矩形内核对所述多个初始区域进行平滑处理,得到目标图像,包括:调用指定尺寸的矩形内核对所述多个初始区域进行闭操作,得到闭操作图像,所述闭操作图像包括多个闭操作后的区域;调用所述矩形内核对所述闭操作图像中各个区域进行开操作,得到目标图像。
11.在一种可行的实施方式中,在所述获取目标区域的初始扫描图像之前,所述地毯识别方法还包括:构建地毯图像数据集,所述地毯图像数据集包括多个畸变校正后的地毯图像,所述地毯图像数据集包括地毯训练集和地毯验证集;基于所述地毯训练集对初始训练模型进行训练,得到目标模型,所述初始训练模型包括一个初始化模块和多个瓶颈模块,所述初始化模块用于初始化训练环境,所述瓶颈模块用于进行卷积或采样;基于所述地毯验证集对所述目标模型进行验证;当所述目标模型通过验证时,将通过验证的目标模型确定为语义分割模型,所述语义分割模型用于对输入的图像进行语义分割。
12.本发明实施例的第二方面提供了一种地毯识别装置,包括:图像获取模块,用于获取目标区域的初始扫描图像;图像分割模块,用于调用预置的语义分割模型对所述初始扫描图像进行语义分割,得到语义分割图像;干扰消除模块,用于将所述语义分割图像中的干扰区域进行消除,得到至少一个目标包络框,所述目标包络框用于指示所述语义分割图像中的地毯区域;图像叠加模块,用于将所述至少一个目标包络框叠加到所述语义分割图像中的对应位置,生成目标图像。
13.在一种可行的实施方式中,干扰消除模块包括:边缘检测单元,用于对所述语义分割图像进行边缘检测操作,得到边缘图像,所述边缘图像包含多个初始区域;消除单元,用于消除所述多个初始区域中的干扰区域,得到连通区域图像,所述连通区域图像包括至少一个连通区域,所述干扰区域为所述边缘图像中区域面积小于第一阈值的初始区域;生成单元,用于基于所述连通区域图像生成至少一个目标包络框。
14.在一种可行的实施方式中,所述消除单元包括:平滑处理子单元,用于调用指定尺寸的矩形内核对所述多个初始区域进行平滑处理,得到目标图像,所述目标图像包括多个候选区域;计算子单元,用于计算所述目标图像中每个候选区域的区域面积;腐蚀子单元,用于将区域面积小于第一阈值的候选区域确定为干扰区域并进行腐蚀操作;确定子单元,用于将区域面积大于或等于所述第一阈值的候选区域确定为连通区域,得到连通区域图像。
15.在一种可行的实施方式中,所述平滑处理子单元具体用于:调用指定尺寸的矩形内核对所述多个初始区域进行开操作,得到目标图像。
16.在一种可行的实施方式中,所述平滑处理子单元具体用于:调用指定尺寸的矩形内核对所述多个初始区域进行开操作,得到开操作图像,所述开操作图像包括多个开操作后的区域;调用所述矩形内核对所述开操作图像中各个区域进行闭操作,得到目标图像。
17.在一种可行的实施方式中,所述平滑处理子单元具体用于:调用指定尺寸的矩形内核对所述多个初始区域进行闭操作,得到闭操作图像,所述闭操作图像包括多个闭操作后的区域;调用所述矩形内核对所述闭操作图像中各个区域进行开操作,得到目标图像。
18.在一种可行的实施方式中,所述地毯识别装置还包括:模型生成模块,用于生成语义分割模型,所述语义分割模型用于对输入的图像进行语义分割。
19.在一种可行的实施方式中,所述模型生成模块具体用于:构建地毯图像数据集,所述地毯图像数据集包括多个畸变校正后的地毯图像,所述地毯图像数据集包括地毯训练集和地毯验证集;基于所述地毯训练集对初始训练模型进行训练,得到目标模型,所述初始训练模型包括一个初始化模块和多个瓶颈模块,所述初始化模块用于初始化训练环境,所述瓶颈模块用于进行卷积或采样;基于所述地毯验证集对所述目标模型进行验证;当所述目标模型通过验证时,将通过验证的目标模型确定为语义分割模型。
20.本发明实施例的第三方面提供了一种智能设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述智能设备执行上述的地毯识别方法。
21.本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的地毯识别方法。
22.本发明实施例提供的技术方案中,获取目标区域的初始扫描图像;调用预置的语义分割模型对初始扫描图像进行语义分割,得到语义分割图像;将语义分割图像中的干扰区域进行消除,得到至少一个目标包络框,目标包络框用于指示语义分割图像中的地毯区域;将至少一个目标包络框叠加到语义分割图像中的对应位置,生成目标图像。本发明实施例,提供的语义分割模型能够划分具体区域,具有帧率较高,模型精度高的特点,更适用于智能设备的嵌入式平台,提高了对地毯的识别速率;同时对得到的语义分割图像中干扰区域进行消除,避免将不可能为地毯区域的干扰区域误判为地毯区域,提高了对地毯的识别准确度。
附图说明
23.图1为本发明实施例中地毯识别方法的一个实施例示意图;
24.图2为本发明实施例中地毯识别方法的另一个实施例示意图;
25.图3为本发明实施例中地毯识别方法的另一个实施例示意图;
26.图4为本发明实施例中地毯识别装置的一个实施例示意图;
27.图5为本发明实施例中智能设备的一个实施例示意图。
具体实施方式
28.本发明提供了一种地毯识别方法、装置、智能设备及存储介质,用于将语义分割图像中的干扰区域进行消除,避免将不可能为地毯区域的干扰区域误判为地毯区域,提高了对地毯的识别准确度,并提高了识别速率。
29.可以理解的是,本发明可以应用在智能设备上,作为示例而非限定的是,智能设备可为移动机器人,本技术以移动机器人为例进行说明。其中,该移动机器人可以是扫地机器人、扫拖一体式机器人、擦地机器人或洗地机器人等的任意一种。
30.请参阅图1,本发明实施例提供的地毯识别方法的流程图,具体包括:
31.101、获取目标区域的初始扫描图像。
32.作为示例而非限定的是,移动机器人通过内置的摄像头获取目标区域的初始扫描图像,该目标区域包含有地毯区域。
33.需要说明的是,本技术实施例所涉及的地毯是指用棉、毛、丝、麻、椰棕或化学纤维
等原料加工而成的地面覆盖物,地毯的颜色种类、纹理种类都很多,特别是毛毯,本身形状多变,不同的方向呈现出的纹理和颜色存在差异,地毯还包括其他纹理统一,颜色统一的化纤地毯和塑料地毯,本实施例对地毯的具体种类和颜色等不做限定。
34.作为示例而非限定的是,目标区域为待清洁的区域,或者,目标区域为待移动机器人行走的区域。
35.102、调用预置的语义分割模型对初始扫描图像进行语义分割,得到语义分割图像。
36.作为示例而非限定的是,移动机器人调用预置的语义分割模型对初始扫描图像进行语义分割,得到语义分割图像。语义分割模型为嵌入式模型,可以为led net网络模型、linknet网络模型或enet网络模型,本实施例中以enet网络模型为例进行说明,enet网络模型的优势是在模型大小很小的同时,可以达到很高的识别准确率(99%)和帧率,即使是在嵌入式平台上也可以有很快的运行速度,实现地毯区域的实时识别。具体的,预置的enet网络模型包括初始化模块,编码器和解码器。在enet网络模型的第一层只包括一个初始化模块,该初始化模块包含输入通道、并行的卷积层和池化层、输出通道,其中,卷积层对输入通道中的输入图像做3
×
3、步长为2的卷积,池化层对输入通道中的输入图像做最大值池化,该操作由非重叠的2
×
2窗实现,这个卷积有13个滤波器,最后将卷积层的结果与池化层的结果,通过函数合并至输出通道,可以看出,enet网络在初始阶段就显著减少存储空间。
37.在enet网络模型的第二层、第三层和第四层构成编码器,第二层包括5个瓶颈模块(bottleneck 1.x),第三层包括9个瓶颈模块(bottleneck 2.x),第四层包括8个瓶颈模块(bottleneck 2.x,省略了(bottleneck 2.0)),其中,第二层中的首个瓶颈模块(bottleneck1.0)采用下采样,第三层中的首个瓶颈模块(bottleneck2.0)也采用下采样。编码器中的瓶颈模块主要包括非下采样类型和下采样类型2种,非下采样类型的瓶颈模块包括有一个主分支(即并行的左路)和一个与之分离的卷积扩展分支(并行的右路),通过两路之后按元素级加法合并,卷积扩展分支每个块由三个卷积层组成:第一层为减少维数的1
×
1卷积,第二层为主卷积层,第三层为1
×
1的展开层。下采样类型的瓶颈模块同样包括有一个主分支(即并行的左路)和一个与之分离的卷积扩展分支(并行的右路),通过两路之后按元素级加法合并,而该下采样类型的瓶颈模块的主分支还包括了最大池化层和填补层,该卷积扩展分支每个块由三个卷积层组成:第一层为减少维数的2
×
2卷积,两维度的步长均设定为2,第二层为主卷积层,主卷积层有三种可能,可能为:3
×
3的普通卷积或空洞卷积(dilated convolution)或全卷积(full convolution),有时也用不对称卷积(asymmetric convolution)来代替,即5
×
1和1
×
5卷积;第三层为1
×
1的展开层。此外,并且在最后一个1x1的卷积之后添加一个正则化regularizer,使用了spatial dropout,在bottleneck 2.0之前p=0.01,之后p=0.1,其中,p是指在训练过程中,将一部分神经网络单元暂时从网络中丢弃的概率,即spatial dropout的概率阈值。这里采用dropout.在所有卷积之间加入批量标准化bn层和参数校正线性单元prelu。
38.在enet网络模型的第五层和第六层构成解码器,第五层包括3个瓶颈模块,第六层包括2个瓶颈模块,其中,第五层中的首个瓶颈模块(bottleneck4.0)采用上采样,第六层中的首个瓶颈模块(bottleneck5.0)也采用上采样。需要说明的是,在解码器中的瓶颈模块包括非上采样类型和上采样类型2种。其中,非上采样类型的瓶颈模块包括有一个主分支(即
并行的左路)和一个与之分离的卷积扩展分支(并行的右路),通过两路之后按元素级加法合并,卷积扩展分支每个块由三个卷积层组成:第一层为减少维数的1
×
1卷积,第二层为主卷积层,第三层为1
×
1的展开层。而上采样类型的瓶颈模块同样包括有一个主分支(即并行的左路)和一个与之分离的卷积扩展分支(并行的右路),通过两路之后按元素级加法合并,而该上采样类型的瓶颈模块的主分支还包括了反最大池化层和空间卷积层,该卷积扩展分支每个块由三个卷积层组成:第一层为减少维数的2
×
2卷积,两维度的步长均设定为2,第二层为主卷积层,主卷积层有三种可能,具体为:3
×
3的普通卷积或空洞卷积(dilated convolution)或全卷积(full convolution),有时也用不对称卷积(asymmetric convolution)来代替,即5
×
1和1
×
5卷积;第三层为1
×
1的展开层。此外,在所有卷积之间加入批量标准化bn层和参数校正线性单元prelu。需要说明的是,因为第一层是在输入图的3个通道上进行的操作,而最终的输出具有c个特征图,通道数量不匹配,第六层中的上采样类型的瓶颈模块中不包括池化索引。
39.本技术实施例中,编码器的结构大于解码器,在不明显影响分割精度的情况下尽可能的缩小了网络的体积,提高了运行效率,提高了识别速率。
40.可以理解的是,第一层在本实施例中主要是提取特征,压缩输入图像的大小,除去了输入图像(即初始扫描图像)中的视觉冗余信息。其中,c取决于分割对象类别的数量,本技术中采用二分类,只包含毛毯区域和背景区域的特征图。本技术实施例中的空洞卷积延伸了感受野,有效的提升了识别精度。在整个网络中都没有添加bias,在cudnn中,卷积过程和添加偏置的过程是分别计算的,因为网络中包含prelu激活函数和bn层,所以不添加bias对最后的准确率没有什么影响,同时也减少了参数量和计算时间。
41.103、将语义分割图像中的干扰区域进行消除,得到至少一个目标包络框,目标包络框用于指示语义分割图像中的地毯区域。
42.其中,干扰区域是指面积较小,不可能为地毯的区域。例如,干扰区域可以是语义分割图像中的小缝隙、小缺口,或者是所占比例较小的一块区域,比如,一块抹布相对于地毯的面积较小,一块正常大小的抹布在语义分割图像中所占的比例小于一块正常大小的地毯在语义分割图像中所占的比例。目标包络框用于标识地毯区域在语义分割图像中的实际范围大小,本实施例中以矩形框作为包络框的形状。
43.104、将至少一个目标包络框叠加到语义分割图像中的对应位置,生成目标图像。
44.作为示例而非限定的是,移动机器人确定至少一个目标包络框的各个坐标,本实施例为矩形包络框,因此,按照每个目标包络框的四个顶点坐标在语义分割图像中进行相应的标记,并采用同一颜色的连接线段将属于同一目标包络框的四个顶点坐标进行连接,即将目标包络框的所有坐标都叠加到语义分割图像中,其中,不同的目标包络框之间的连接线段对应的颜色可以相同,也可以不同。移动机器人再将完成线段连接后的语义分割图像作为目标图像。
45.需要说明的是,目标图像是在原始的语义分割图像的基础上进行处理,并增加目标包络框的图形标识,最终输出的图像。
46.本发明实施例提供的语义分割模型能够划分具体区域,具有帧率较高,模型精度高的特点,更适用于智能设备的嵌入式平台,提高了对地毯的识别速率;同时对得到的语义分割图像中干扰区域进行消除,避免将不可能为地毯区域的干扰区域误判为地毯区域,提
高了对地毯的识别准确度。
47.请参阅图2,本发明实施例提供的地毯识别方法的另一个流程图,具体包括:
48.201、获取目标区域的初始扫描图像。
49.202、调用预置的语义分割模型对初始扫描图像进行语义分割,得到语义分割图像。
50.步骤201

202与步骤101

102类似,具体此处不再赘述。
51.203、对语义分割图像进行边缘检测操作,得到边缘图像,边缘图像包含多个初始区域。
52.作为示例而非限定的是,移动机器人对语义分割图像进行边缘检测操作,得到边缘图像,边缘图像包含多个初始区域。具体的,移动机器人调用预置的高斯滤波器对语义分割图像进行平滑处理,得到平滑图像;移动机器人采用sobel算子计算平滑图像中每个像素点的梯度强度g和方向θ,其中,移动机器人将当前像素的梯度强度与沿正负梯度方向上的两个像素进行比较,若当前像素的梯度强度与另外两个像素相比最大,则移动机器人将该像素点保留为边缘点,否则删除该像素点;移动机器人通过双阈值法对边缘点进行筛选,得到筛选后的边缘点;移动机器人通过抑制孤立的弱边缘对筛选后的边缘点进行完善,得到多个初始区域构成的边缘图像。
53.需要说明的是,sobel算子是两个3*3的矩阵,分别为sx和sy。sx用于计算图像x方向像素梯度矩阵gx,sy用于计算图像y方向像素梯度矩阵gy。
54.双阈值法的具体筛选过程如下:如果边缘像素的梯度值大于第一阈值,则将其标记为强边缘像素;如果边缘像素的梯度值小于第一阈值且大于第二阈值,则将其标记为弱边缘像素;如果边缘像素的梯度值小于第二阈值,则进行抑制,第一阈值和第二阈值的大小取决于给定输入图像的内容,具体此处不做限定。
55.204、消除多个初始区域中的干扰区域,得到连通区域图像,连通区域图像包括至少一个连通区域,干扰区域为边缘图像中区域面积小于第一阈值的初始区域。
56.作为示例而非限定的是,移动机器人调用指定尺寸的矩形内核对多个初始区域进行平滑处理,得到目标图像,目标图像包括多个候选区域;移动机器人计算目标图像中每个候选区域的区域面积;移动机器人将区域面积小于第一阈值的候选区域确定为干扰区域并进行腐蚀操作;移动机器人将区域面积大于或等于第一阈值的候选区域确定为连通区域,得到连通区域图像,连通区域图像包括至少一个连通区域。
57.可以理解的是,矩形内核可根据实际需求进行设置,以提高平滑处理的效果,具体此处不做限定。
58.205、基于连通区域图像生成至少一个目标包络框,目标包络框用于指示语义分割图像中的地毯区域。
59.移动机器人基于连通区域图像,通过预置的提取算法生成至少一个目标包络框,该目标包络框可为矩形,目标包络框用于指示语义分割图像中的地毯区域,本实施例中将地毯所在区域称为地毯区域,将其他非地毯区域称为背景区域。
60.206、将至少一个目标包络框叠加到语义分割图像中的对应位置,生成目标图像。
61.步骤206与步骤104类似,具体此处不再赘述。
62.本发明实施例,提供的语义分割模型能够划分具体区域,具有帧率较高,模型精度高的特点,更适用于移动机器人的嵌入式平台,提高了对地毯的识别速率;并提供了三种具体实现方式筛选掉面积较小的干扰区域,避免将不可能为地毯区域的干扰区域误判为地毯区域,提高了对地毯的识别准确度。
63.请参阅图3,本发明实施例提供的地毯识别方法的另一个流程图,具体包括:
64.301、生成语义分割模型,语义分割模型用于对输入的图像进行语义分割。
65.具体的,构建地毯图像数据集,地毯图像数据集包括多个畸变校正后的地毯图像,地毯图像数据集包括地毯训练集和地毯验证集;基于地毯训练集对初始训练模型进行训练,得到目标模型,初始训练模型包括一个初始化模块和多个瓶颈模块,初始化模块用于初始化训练环境,瓶颈模块用于进行卷积或采样;基于地毯验证集对目标模型进行验证;当目标模型通过验证时,将通过验证的目标模型确定为语义分割模型,该语义分割模型用于对输入的图像进行语义分割。
66.需要说明的是,地毯图像数据集在划分为地毯训练集和地毯验证集之前,还可以对地毯图像数据集进行预处理,具体包括:移动机器人获取原始图像数据集,原始图像数据集包括多个畸变校正后的原始图像;移动机器人对原始图像数据集进行二分类标注,得到标注后的图像数据集,标注后的图像数据集包括多个标注后的图像,每个标注后的图像包括地毯区域和/或背景区域;移动机器人对标注后的图像数据集进行增强,得到地毯图像数据集,所述地毯图像数据集为增强后的图像数据集。
67.例如,选用634张图像在labelhub上标注,将每个图像标注毛毯区域或背景区域,毛毯区域置为1,背景区域置为0。为了获得更多数据,对标注好的数据集进行数据增强,对图片进行水平和垂直翻转,得到双倍的数据(1268张图像)。
68.其中,移动机器人基于地毯训练集对初始训练模型进行训练,得到目标模型具体包括:1、定义损失计算函数,这里采用叉熵损失函数;2、定义优化策略,用于在训练中更新学习率;按批量大小从地毯训练集中取出每张图片输入enet网络进行训练,一直到训练达到设定的周期(epoch)值,其中,1个epoch等于使用训练集中的全部样本训练一次,保存训练好的模型,同时每隔50个epoch,通过地毯验证集进行一次验证,在得到的enet模型参数上用验证集计算均交并比值miou,若miou大于或等于50%则确定训练好的模型通过验证。
69.可以理解的是,在训练中每个epoch后运用交叉熵损失函数可计算损失,取平均后可得到训练损失随着epoch增加的变化关系,当训练到100个epoch后模型参数可信且不再有太大变化。在每隔50个周期后用验证集计算iou的值,可以得到iou随epoch变化的曲线,在100个epoch后,iou达到了97.49%,也可确认此时训练准确率已经足够,可以停止训练。
70.302、获取目标区域的初始扫描图像。
71.303、调用预置的语义分割模型对初始扫描图像进行语义分割,得到语义分割图像。
72.304、对语义分割图像进行边缘检测操作,得到边缘图像,边缘图像包含多个初始区域。
73.步骤302至304与步骤201至203类似,具体此处不再赘述。
74.305、消除多个初始区域中的干扰区域,得到连通区域图像,连通区域图像包括至少一个连通区域,干扰区域为边缘图像中区域面积小于第一阈值的初始区域。
75.具体的,调用指定尺寸的矩形内核对多个初始区域进行平滑处理,得到目标图像,目标图像包括多个候选区域;计算目标图像中每个候选区域的区域面积;将区域面积小于第一阈值的候选区域确定为干扰区域并进行腐蚀操作;将区域面积大于或等于第一阈值的候选区域确定为连通区域,得到连通区域图像,连通区域图像包括至少一个连通区域。
76.其中,候选区域包括经过语义分割且平滑处理后得到的划分区域,每个划分区域代表一个类别的像素集合。
77.其中,调用指定尺寸的矩形内核对多个初始区域进行平滑处理,得到目标图像,目标图像包括多个候选区域可以包括:
78.调用指定尺寸的矩形内核对多个初始区域进行开操作,得到目标图像。这里只进行开操作,消除了边缘图像中存在的干扰特征,提高了图像识别速度。
79.其中,调用指定尺寸的矩形内核对多个初始区域进行平滑处理,得到目标图像,目标图像包括多个候选区域还可以包括:
80.调用指定尺寸的矩形内核对多个初始区域进行开操作,得到开操作图像,开操作图像包括多个开操作后的区域;调用矩形内核对开操作图像中各个区域进行闭操作,得到目标图像。
81.可以理解的是,这里先进行开操作,断开了边缘图像中较窄的狭颈并消除了细的突出物,然后对消除后的图像再进行闭操作,填补了消除后的图像中存在的小孔洞及轮廓线中的裂痕,先开操作后闭操作,消除了边缘图像中存在的干扰特征,并避免将同一个地毯区域识别为多个不同的区域,提高了识别效率。
82.其中,调用指定尺寸的矩形内核对多个初始区域进行平滑处理,得到目标图像,目标图像包括多个候选区域还可以包括:
83.调用指定尺寸的矩形内核对多个初始区域进行闭操作,得到闭操作图像,闭操作图像包括多个闭操作后的区域;调用矩形内核对闭操作图像中各个区域进行开操作,得到目标图像。
84.可以理解的是,这里先进行闭操作,填补了边缘图像中存在的小孔洞及轮廓线中的裂痕,然后对填补后的图像再进行开操作,断开了填补后的图像中较窄的狭颈并消除了细的突出物,先闭操作后开操作,增强了边缘图像中地毯区域的特征,避免部分毛毯区域的特征被腐蚀掉,提高了识别准确度。
85.306、基于连通区域图像生成至少一个目标包络框,目标包络框用于指示语义分割图像中的地毯区域。
86.307、将至少一个目标包络框叠加到语义分割图像中的对应位置,生成目标图像。
87.步骤306至307与步骤205至206类似,具体此处不再赘述。
88.本发明实施例,提供的语义分割模型的构建过程,该语义分割模型能够划分具体区域,具有帧率较高,模型精度高的特点,更适用于智能设备的嵌入式平台,提高了对地毯的识别速率;并提供了三种具体实现方式筛选掉面积较小的干扰区域,避免将不可能为地毯区域的干扰区域误判为地毯区域,提高了对地毯的识别准确度。
89.上面对本发明实施例中地毯识别方法进行了描述,下面对本发明实施例中地毯识别装置进行描述,请参阅图4,本发明实施例中地毯识别装置的一个实施例包括:
90.图像获取模块401,用于获取目标区域的初始扫描图像;
91.图像分割模块402,用于调用预置的语义分割模型对所述初始扫描图像进行语义分割,得到语义分割图像;
92.干扰消除模块403,用于将所述语义分割图像中的干扰区域进行消除,得到至少一个目标包络框,所述目标包络框用于指示所述语义分割图像中的地毯区域;
93.图像叠加模块404,用于将所述至少一个目标包络框叠加到所述语义分割图像中的对应位置,生成目标图像。
94.可选的,干扰消除模块403包括:
95.边缘检测单元4031,用于对所述语义分割图像进行边缘检测操作,得到边缘图像,所述边缘图像包含多个初始区域;
96.消除单元4032,用于消除所述多个初始区域中的干扰区域,得到连通区域图像,所述连通区域图像包括至少一个连通区域,所述干扰区域为所述边缘图像中区域面积小于第一阈值的初始区域;
97.生成单元4033,用于基于所述连通区域图像生成至少一个目标包络框。
98.可选的,消除单元4032包括:
99.平滑处理子单元40321,用于调用指定尺寸的矩形内核对所述多个初始区域进行平滑处理,得到目标图像,所述目标图像包括多个候选区域;
100.计算子单元40322,用于计算所述目标图像中每个候选区域的区域面积;腐蚀子单元,用于将区域面积小于第一阈值的候选区域确定为干扰区域并进行腐蚀操作;
101.确定子单元40323,用于将区域面积大于或等于所述第一阈值的候选区域确定为连通区域,得到连通区域图像。
102.可选的,平滑处理子单元40321具体用于:
103.调用指定尺寸的矩形内核对所述多个初始区域进行开操作,得到目标图像。
104.可选的,平滑处理子单元40321具体用于:
105.调用指定尺寸的矩形内核对所述多个初始区域进行开操作,得到开操作图像,所述开操作图像包括多个开操作后的区域;调用所述矩形内核对所述开操作图像中各个区域进行闭操作,得到目标图像。
106.可选的,平滑处理子单元40321具体用于:
107.调用指定尺寸的矩形内核对所述多个初始区域进行闭操作,得到闭操作图像,所述闭操作图像包括多个闭操作后的区域;调用所述矩形内核对所述闭操作图像中各个区域进行开操作,得到目标图像。
108.可选的,所述地毯识别装置还包括:
109.模型生成模块405,用于生成语义分割模型,所述语义分割模型用于对输入的图像进行语义分割。
110.可选的,模型生成模块405具体用于:
111.构建地毯图像数据集,所述地毯图像数据集包括多个畸变校正后的地毯图像,所述地毯图像数据集包括地毯训练集和地毯验证集;基于所述地毯训练集对初始训练模型进行训练,得到目标模型,所述初始训练模型包括一个初始化模块和多个瓶颈模块,所述初始化模块用于初始化训练环境,所述瓶颈模块用于进行卷积或采样;基于所述地毯验证集对所述目标模型进行验证;当所述目标模型通过验证时,将通过验证的目标模型确定为语义
分割模型。
112.本发明实施例,提供的语义分割模型能够划分具体区域,具有帧率较高,模型精度高的特点,更适用于智能设备的嵌入式平台,提高了对地毯的识别速率;同时对得到的语义分割图像中干扰区域进行消除,避免将不可能为地毯区域的干扰区域误判为地毯区域,提高了对地毯的识别准确度。
113.图5是本发明实施例提供的一种智能设备的结构示意图,该智能设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,cpu)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质1530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对智能设备500中的一系列指令操作。更进一步地,处理器510可以设置为与存储介质530通信,在智能设备500上执行存储介质530中的一系列指令操作。
114.作为示例而非限定的是,智能设备500可为移动机器人。
115.本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述地毯识别方法的步骤。
116.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
117.所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read

only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
118.以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献