一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

液体喷洒控制方法、装置、自动喷洒设备及存储介质与流程

2022-08-03 00:00:51 来源:中国专利 TAG:


1.本技术属于人工智能技术领域,尤其涉及一种液体喷洒控制方法、装置、自动喷洒设备及存储介质。


背景技术:

2.近年来,传染性强、传播范围广的病毒仍在全球肆虐,严重影响了人类的生命安全、社会正常秩序和经济稳定发展。人员密集且流动性大的公共场所通常是进行消毒的重要目标,若环境消杀不彻底,则将造成巨大的社会危害。
3.目前,采用人工喷雾消杀方式往往会耗费大量的时间和人力成本,且对执行喷雾的工作人员的身体健康可能造成一定程度的损害;采用机器人进行消杀的方式,通常先对待喷洒区域进行建模,而后对机器人的行进路径进行规划。若在行进路径上检测到障碍物,则控制机器人停止移动,并关闭机器人上的喷雾器。否则,控制机器人对待喷洒区域进行喷雾消杀。
4.然而,对于非行人类别的障碍物通常也是需要进行消杀的。因此,现有机器人在进行喷洒时,没有对障碍物进行识别和区分,在识别到障碍物时即停止喷洒,导致待喷洒区域消杀不彻底。


技术实现要素:

5.本技术实施例提供了一种液体喷洒控制方法、装置、自动喷洒设备及存储介质,可以解决在对待喷洒区域进行消杀时,未对障碍物进行识别和区分,导致待喷洒区域消杀不彻底的问题。
6.第一方面,本技术实施例提供了一种液体喷洒控制方法,该方法包括:
7.通过设置于自动喷洒设备上的图像传感器采集待喷洒区域的目标图像;目标图像中包括目标对象;
8.采用目标识别模型对目标对象进行目标识别,得到目标对象的目标类别;目标识别模型是基于预设训练集对预设的初始模型进行训练得到的,预设训练集包括多条训练数据,每条训练数据至少包括含有训练对象的训练图像、训练对象在训练图像中的中心点以及所占区域;
9.若目标类别为预设类别,则控制自动喷洒设备停止对待喷洒区域进行喷洒;预设类别至少包括生命体;
10.若目标类别为非预设类别,则控制自动喷洒设备继续对待喷洒区域进行喷洒。
11.第二方面,本技术实施例提供了一种液体喷洒控制装置,该装置包括:
12.采集模块,用于通过设置于自动喷洒设备上的图像传感器采集待喷洒区域的目标图像;目标图像中包括目标对象;
13.识别模块,用于采用目标识别模型对目标对象进行目标识别,得到目标对象的目标类别;目标识别模型是基于预设训练集对预设的初始模型进行训练得到的,预设训练集
包括多条训练数据,每条训练数据至少包括含有训练对象的训练图像、训练对象在训练图像中的中心点以及所占区域;
14.喷洒模块,用于若目标类别为预设类别,则控制自动喷洒设备停止对待喷洒区域进行喷洒;预设类别至少包括生命体;
15.停止模块,用于若目标类别为非预设类别,则控制自动喷洒设备继续对待喷洒区域停止喷洒。
16.第三方面,本技术实施例提供了一种自动喷洒设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上述第一方面的方法。
17.第四方面,本技术实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现如上述第一方面的方法。
18.第五方面,本技术实施例提供了一种计算机程序产品,当计算机程序产品在自动喷洒设备上运行时,使得自动喷洒设备执行上述第一方面的方法。
19.本技术实施例与现有技术相比存在的有益效果是:通过自动喷洒设备中的图像传感器分别采集待喷洒区域的目标图像,而后使用预训练到的目标识别模型对目标图像进行识别,确定目标图像中目标对象的目标类别。其中,目标识别模型是基于预设训练集对预设的初始模型进行训练得到,且预设训练集中的每条训练数据均包括含有训练对象的训练图像以及训练对象在所述训练图像中的中心点以及所占区域。以此,训练后的目标识别模型可以准确的从目标图像中获取目标对象的所占区域,而后对所占区域进行分类,提高对目标对象进行类别预测的准确率。之后,在目标类别为预设类别中的行人类别时,控制自动喷洒设备对待喷洒区域停止喷洒,以在对待喷洒区域进行消杀时,避免对行人造成一定程度的损害;否则,在目标类别为非预设类别时,自动喷洒设备对待喷洒区域进行喷洒,以对待喷洒区域进行彻底的消杀。
附图说明
20.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
21.图1是本技术一实施例提供的一种液体喷洒控制方法的实现流程图;
22.图2是本技术一实施例提供的一种液体喷洒控制方法中生成训练数据的实现方式示意图;
23.图3是本技术一实施例提供的一种液体喷洒控制方法中标签特征图的结构示意图;
24.图4是本技术一实施例提供的一种液体喷洒控制方法中生成目标识别模型的实现方式示意图;
25.图5为本技术实施例提供的一种液体喷洒控制方法中初始模型的网络结构框图;
26.图6为现有技术中神经网络模型的网络结构框图;
27.图7是本技术一实施例提供的一种液体喷洒控制装置的结构示意图;
28.图8是本技术一实施例提供的一种自动喷洒设备的结构示意图。
具体实施方式
29.以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本技术的描述。
30.应当理解,当在本技术说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
31.另外,在本技术说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
32.本技术实施例提供的液体喷洒控制方法可以应用于自动喷洒设备中。其中,自动喷洒设备包括但不限于携带有喷洒装置的无人车、喷洒机器人等设备。本技术实施例对自动喷洒设备的具体类型不作任何限制。
33.其中,上述液体包括但不限于水、消毒液等液体。以消毒液为例,近年来,传染性强、传播范围广的病毒仍在全球肆虐,严重影响了人类的生命安全、社会正常秩序和经济稳定发展。人员密集且流动性大的公共场所通常是进行疫情防控的重要目标,若环境消杀不彻底,则将造成巨大的社会危害。目前,采用人工喷雾消杀方式往往会耗费大量的时间和人力成本,且对执行喷雾的工作人员的身体健康可能造成一定程度的损害。由此,提出了一种对消毒液进行喷洒的液体喷洒控制方法。
34.请参阅图1,图1示出了本技术实施例提供的一种液体喷洒控制方法的实现流程图,该方法包括如下步骤:
35.s101、自动喷洒设备通过设置于自动喷洒设备上的图像传感器采集待喷洒区域的目标图像;目标图像中包括目标对象。
36.在一实施例中,上述图像传感器包括但不限于:激光雷达、毫米波雷达或相机等可以采集图像的传感器。其中,上述图像传感器的数量可以为多个,可以分别分布在自动喷洒设备不同的方向上,以从多个方向采集待喷洒区域的目标图像。在本实施例中,对自动喷洒设备上图像传感器的类别、数量以及设置位置不作任何限制。
37.其中,待喷洒区域为自动喷洒设备需要喷洒液体的区域。在喷洒前,自动喷洒设备需要执行上述方法以判断是否需要对待喷洒区域进行喷洒。
38.其中,目标图像即为对待喷洒区域进行图像采集后生成的图像。其中,目标对象包括但不限于行人、动物、植物等对象。
39.s102、自动喷洒设备采用目标识别模型对目标对象进行目标识别,得到目标对象的目标类别;目标识别模型是基于预设训练集对预设的初始模型进行训练得到的,预设训练集包括多条训练数据,每条训练数据至少包括含有训练对象的训练图像、训练对象在训练图像中的中心点以及所占区域。
40.在一实施例中,上述目标识别模型是基于预设训练集对预设初始模型进行训练得到。其中,预设训练集通常包括多条训练数据,每条训练数据至少包括含有训练对象的训练
图像、训练对象在训练图像中的中心点以及所占区域。
41.需要说明的是,在本实施例中,上述识别模型具体为以centernet为框架的模型。其中,centernet是以训练对象在训练图像中的中心点(也可以认为是训练对象在所占区域的中心)为基础,对训练对象的位置进行检测;将目标对象的识别问题转换为一个标准的关键点估计(中心点的预测)问题。即只取训练对象在训练图像的中心点作为锚点(anchor),只回归该中心点在训练图像的位置、宽度和高度。
42.因此,在训练时,训练数据中需至少包括含有训练对象的训练图像、训练对象在训练图像中的中心点以及所占区域。其中,所占区域为训练对象在训练图像中的区域。通常,初始模型可以根据所占区域的宽度和高度对训练对象进行处理,并根据处理后的训练对象进行模型训练。
43.其中,上述训练数据通常还包括训练对象的真实类别。在训练过程中,初始模型需要对训练图像进行识别处理,以预测出训练对象在训练图像中的所占区域;之后,基于所占区域预测训练对象的预测类别;而后,根据预测类别和真实类别计算预测损失,迭代更新初始模型中的部分模型参数,得到目标识别模型。
44.需要说明的是,因初始模型是基于预设训练集对预设初始模型进行训练得到,因此,在对训练图像进行处理时,初始模型可以不关心从训练图像中预测出的训练对象的预测所占区域,与真实的所占区域的交并比。也即,不需要采用基于锚点(anchor based)算法人工设置阈值的方式,对训练对象进行前景背景的分类。
45.通常,由于每一类训练对象只有一个正样本,因此,在训练过程中也不再需要对处理过程中产生的特征图进行非极大值抑制处理,只需从特征图中提取峰值最高的像素点进行后续处理即可。
46.另外,基于centernet框架的初始模型,其最终输出的特征图的维度更大,通常为输入至初始模型中训练图像的1/4。然而,基于锚点的方法所使用的模型,最终输出的特征图的维度大小通常是输入至模型中训练图像的1/16。因此,基于描点的方法使用的模型,需要多个不同长度和宽度的anchor。然而,基于centernet框架的初始模型无需使用多个不同长度和宽度的anchor,大大减少了anchor部分的计算量。
47.s103、若目标类别为预设类别,则自动喷洒设备停止对待喷洒区域进行喷洒;预设类别至少包括生命体。
48.s104、若目标类别为非预设类别,则自动喷洒设备继续对待喷洒区域进行喷洒。
49.在一实施例中,上述生命体包括但不限于行人类别、动物类别等具有生命的类别。其中,上述预设类别主要以行人类别为例,在确定目标对象为行人类别时,则停止对待喷洒区域进行喷洒;若为非行人类别,则对待喷洒区域进行喷洒。
50.需要补充的是,通常自动喷洒设备在采集待喷洒区域的目标图像时,通常会采集一个范围更广的原始图像。即该原始图像将包含待喷洒区域对应的目标图像,以及其他未处于待喷洒区域的边界图像。基于此,在实际处理过程中,自动喷洒设备可以是对整个原始图像进行处理,确定原始图像中目标对象的类别。之后,在目标对象为预设类别时,自动喷洒设备还需进一步的根据多个方向上分别设置的图像传感器,分别确定目标对象相对于自动喷洒设备的位置。之后,将多个位置进行融合,得到目标对象相对于自动喷洒设备的准确位置。若判定目标对象的准确位置处于待喷洒区域内,则停止喷洒。或者,自动喷洒设备还
可以发出提示,以警醒目标对象与自动喷洒设备保持一定距离,或离开待喷洒区域,以使自动喷洒设备可以正常执行喷洒任务。若判定目标对象的准确位置未处于待喷洒区域内,则继续喷洒。
51.在另一实施例中,采用自动喷洒设备进行液体喷洒时,通常需要先对待喷洒区域进行建模,并将建立的模型存储在自动喷洒设备中。因此,在获取到原始图像时,自动喷洒设备还可以根据预先存储的该待喷洒区域的模型,对原始图像进行相似度计算处理,从原始图像中确定待喷洒区域的目标图像。最后,对目标图像执行上述s101-s104处理。
52.在一实施例中,上述非预设类别可以包括但不限于:树木类别、车辆类别等非生命体,而该类别也属于需要被进行消毒的对象。
53.在本实施例中,通过自动喷洒设备中的图像传感器分别采集待喷洒区域的目标图像,而后使用预训练到的目标识别模型对目标图像进行识别,确定目标图像中目标对象的目标类别。其中,目标识别模型是基于预设训练集对预设的初始模型进行训练得到,且预设训练集中的每条训练数据均包括含有训练对象的训练图像以及训练对象在所述训练图像中的中心点以及所占区域。以此,训练后的目标识别模型可以准确的从目标图像中获取目标对象的所占区域,而后对所占区域进行分类,提高对目标对象进行类别预测的准确率。之后,在目标类别为预设类别中的行人类别时,控制自动喷洒设备对待喷洒区域停止喷洒,以在对待喷洒区域进行消杀时,避免对行人造成一定程度的损害;否则,在目标类别为非预设类别时,自动喷洒设备对待喷洒区域进行喷洒,以对待喷洒区域进行彻底的消杀。
54.在其他实施例中,在液体喷洒控制方法中,自动喷洒设备还能够根据对外界或自身的识别结果进行喷洒控制。其中,识别结果包括但不限于待喷洒区域对应的消毒需求;外界的风速以及风向;自动喷洒设备的移动速度以及液体的剩余量等。
55.示例性的,在车速大于预设车速时,提高液体的喷洒速度;在车速低于或等于预设车速时,降低液体的喷洒速度;在逆风时,调整液体的喷洒方向;在风速高于预设风速时,降低液体的喷洒速度;在风速低于或等于预设风速时,提高液体的喷洒速度;以及,在液体剩余量低于预设剩余量时,降低液体的喷洒速度,并进行预警。例如,可以通过自动喷洒设备的警示灯进行示警或语音提示。
56.在一实施例中,上述是通过目标识别模型对目标对象进行识别,得到目标对象的目标类别。然而,现有在训练目标识别模型时,通常是人为标记训练对象在训练图像中的所占区域以及真实类别,之后,输入至初始模型中进行训练。然而,该方式在迭代初始模型的网络参数时,仅根据真实类别和预测类别计算损失值,而后根据损失值进行迭代。但是,在初始模型实际进行类别预测时,初始模型还需先从训练图像中检测训练对象在训练图像中的中心点以及所占区域,而后进行类别预测。因此,预测类别还将受到初始模型检测到的中心点和所占区域的影响。若检测到的中心点和所占区域与训练对象在训练图像中的实际中心点和所占区域具有差别,则将导致初始模型基于有差别的中心点和所占区域进行预测时,其预测类别的准确率低。
57.基于此,参照图2,为了提高预测类别的准确率,在训练目标识别模型时,自动喷洒设备还需通过如下s201-s204生成训练数据。详述如下,
58.s201、自动喷洒设备获取含有训练对象的训练图像。
59.在一实施例中,上述训练图像可以预先存储在自动喷洒设备的指定存储路径中,
或者自动喷洒设备从网络上进行爬取得到,对此不作限定。其中,训练图像通常具有多个,每个训练图像中至少包括一种预设类别的训练对象。也即一张训练图像可以包括多个预设类别分别对应的训练对象;也可以同时包括一种预设类别对应的多个不同训练对象,对此不作限定。
60.s202、自动喷洒设备根据训练图像的图像大小以及初始模型输出的训练特征图的维度大小,计算中心点在训练特征图的特征图位置,以及计算中心点在训练特征图的高斯核半径。
61.在一实施例中,训练图像的图像大小为输入至初始模型时的大小。通常初始模型接收的图像大小是固定的,因此,在训练图像的原始图像大小与初始模型接收的图像大小不一致时,还需对训练图像的原始图像大小进行处理。
62.具体的,自动喷洒设备需要根据初始模型接收的图像大小对原始图像大小进行仿射变换处理。例如,若初始模型接收的图像大小为512*512尺寸,而原始图像大小为1280*720尺寸,则自动喷洒设备可以等比例的缩放原始图像大小至512*288尺寸。之后,因等比例缩放后的288尺寸不足512尺寸,因此,自动喷洒设备还需对该缩放图像进行像素点填充,并将填充的每个像素点均用像素值0进行填充,以形成512*512尺寸的训练图像。
63.在一实施例中,上述训练特征图为初始模型对训练图像进行模型处理后输出的特征图。通常,初始模型需要将该训练特征图进行处理,以得到训练对象的预测类别。
64.在一实施例中,计算中心点在训练特征图的特征图位置时,自动喷洒设备可以预先根据训练对象在训练图像中的所占区域,找出训练对象的中心点;之后,确定该中心点在训练图像中的位置。之后,根据训练图像的图像大小与训练特征图的维度大小,计算训练图像被初始模型处理时的缩放倍数。之后,将中心点在训练图像中的位置对应缩放相等的缩放倍数,即可得到特征图位置。
65.例如,缩放倍数为s,中心点在训练图像中的位置为(x,y),则缩放后的中心点在训练特征图的位置即为(x/s,y/s)。其中,若x/s,y/s的值不为整数,则可以向下取整,参与后续处理。
66.在一实施例中,上述高斯核半径用于在训练特征图上,以中心点为圆心,以高斯核半径为为训练特征图中的每个像素点填充高斯函数计算值。具体的,中心点处为最大值,沿着半径向外按高斯函数递减。
67.其中,对于每个训练对象的高斯核半径的计算,其可以根据训练对象在训练图像中的所占区域进行计算。具体的,自动喷洒设备可以加载每个训练对象分别在各自训练图像中的所占区域的宽度和长度;之后,计算所有所占区域的宽度和长度的平均值;之后,针对任一训练对象的高斯核半径,根据该训练对象对应的所占区域的宽度和长度,分别计算与宽度和长度的平均值之间的标准差。将宽度对应的标准差和高度对应的标准差均作为该训练对象的高斯核半径。
68.s203、自动喷洒设备基于高斯核半径对训练特征图进行处理,得到训练图像的标签特征图。
69.通常的,现有技术中是根据训练对象实际的所占区域与初始模型预测的所占区域进行计算。例如,实际的所占区域与预测所占区域通常会有重叠,因此,可以根据预测所占区域的两个对角点,确定对角点与实际的所占区域的内切圆半径或外切圆半径,作为高斯
核半径。
70.然而,通过该方式计算出高斯核半径后,在训练特征图上通常是以中心点为圆形,以高斯核半径画出圆形的高斯分布,以生成标签特征图。但是,在训练对象为行人时,行人在训练图像中的所占区域通常为长方形。因此,圆形的标签特征图不能完整的覆盖行人信息。或,即使完整的覆盖了行人信息,但是其圆形的标签特征图中也将包含较多的噪音信息。
71.基于此,在本实施例中,在计算出宽度对应的标准差和高度对应的标准差后,即可得到宽度上的高斯核半径以及高度上的高斯核半径。之后,自动喷洒设备可以根据宽度上的高斯核半径以及高度上的高斯核半径,在训练特征图上画出椭圆形高斯分布,减少包含的噪音信息,以提高算法准确率。
72.其中,需要说明的是,上述s202已说明高斯核半径用于在训练特征图上,以中心点为圆心,以高斯核半径为训练特征图中的每个像素点填充高斯函数计算值。因此,可以认为,上述每个像素点填充的高斯函数计算值可以用于表示该像素点属于中心点的概率值。而圆心处的像素点为中心点,因此,其高斯函数计算值即为1,且宽度上的高斯核半径以及高度上的高斯核半径即为训练对象在标签特征图上的大小。以此,初始模型可以根据该标签特征图进行中心点位置预测的模型训练。
73.需要补充的是,因此时高斯核半径具有两个,在基于高斯核半径确定训练特征图中每个像素点的概率值时,其计算公式可以为:
[0074][0075]
其中,x,y分别为像素点相对于中心点处的坐标;f为坐标(x,y)处的概率值。
[0076]
通常,中心点很难准确的被某一个像素点的位置定义,中心点附近的像素点所表征的图像信息,通常也与中心点表征的图像信息相似。若直接将中心点附近的像素点标注为负样本(也即概率值为0),则可能给初始模型的训练带来干扰。基于此,在本实施例中,通过高斯核半径对训练特征图进行处理,合理的赋予中心点附近的像素点的概率值,以使初始模型可以更好的进行收敛。以此,通过高斯核半径产生的标签特征图,可以在初始模型的训练时,增加一个方向性的引导。即距离中心点越近,概率值越大,使初始模型网络能够有方向性的快速确定中心点,提高初始模型的收敛效率。
[0077]
其中,生成的标签特征图中,每个像素点的概率值可以如图3所示。其中,图3中水平方向上的坐标轴用于表示像素点的坐标,数值方向上的表示该像素点的概率值。其中,坐标(0,0)为中心点,其对应的概率值最大,即为1。另外,图3所示的标签特征图仅为本实施例中的一种示例。
[0078]
s204、自动喷洒设备根据训练图像以及标签特征图,生成训练数据。
[0079]
在一实施例中,因目标识别模型用于对目标对象进行分类,因此,在该训练数据中,通常还应当包括该标签特征图对应的标签类别。也即该标签特征图还需同时包含训练对象的真实类别,以此生成训练数据。
[0080]
之后,训练过程中,初始模型对训练图像进行处理,输出训练对象在训练图像中的预测中心点的位置、预测所占区域大小以及预测类别;之后,分别与标签特征图所表示的实际中心点的位置、实际所占区域大小以及真实类别,对模型进行迭代,得到目标识别模型。
[0081]
其中,因上述实际中心点的位置、所占区域大小以及真实类别均映射成初始模型的输出格式,其与初始模型对训练图像进行处理后的输出格式相同。因此,初始模型可以快速的根据标签特征图进行损失函数计算,提高模型的迭代效率。
[0082]
其中,需要说明的是,若一张训练图像中,具有多个相同类别的训练对象,则可以采用一个标签特征图进行表示。即,在训练特征图中,分别确定每个训练对象对应的中心点的位置,之后,分别以中心点的位置,以及每个训练对象对应的高斯核半径,对训练特征图进行处理,得到一张标签特征图。
[0083]
但需要补充的是,在一张训练图像中,若只具有一个训练对象,则可以采用上述s202-s204的方式,生成标签特征图。
[0084]
然而,若一张训练图像中具有多个训练对象,且至少具有两个训练对象重叠时,对于任一训练对象,还是需要先基于s203-s204的方式,生成每个训练对象分别对应的标签特征图。但此时,基于上述s202计算出来的中心点在训练特征图的特征图位置中可能具有重叠。也即多个训练对象分别对应的特征图位置相同。因此,在采用上述s203-s204方式生成重叠的每个训练对象的标签特征图中,可能具有多个重叠像素点,且每个重叠像素点通常具有多个概率值。
[0085]
但是,标签特征图中每个像素点均只需一个概率值即可。基于此,在本实施例中,对于任一重叠像素点,将重叠像素点中概率值的最大值确定为该重叠像素点最终的概率值,以此根据至少两个训练对象对应的标签特征图中各个像素点最终的概率值,生成标签特征图。
[0086]
需要说明的是,此时该标签特征图可以同时表征两个训练对象的图像信息。也即,训练对象在训练图像中的所占区域更改为同时包括两个训练对象的所占区域。或者,自动喷洒设备可以确定重叠像素点对应的训练图像中,未被遮挡的训练对象。之后,将此时的标签特征图作为未被遮挡的训练对象的标签特征图。同时,将被遮挡的训练对象对应的所占区域复制至训练图像中的其余位置,该其余位置处需不属于其他训练对象的所占区域。之后,重新生成被遮挡的训练对象的标签特征图。以此,解决了在具有多个相同类别的训练对象的中心点重合时,只能生成一个训练对象的标签特征图进行模型处理的问题。
[0087]
在其他实施例中,若一张训练图像中,具有多个不同类别的训练对象,则需要采用多个标签特征图进行表示。即,每个标签特征图仅用于表示同一类别的训练对象的图像信息。
[0088]
在一实施例中,为了准确的对目标对象进行分类,需要准确的从目标图像中确定目标对象的所占区域。因此,为了使目标识别模型可以准确的从目标图像中确定目标对象的所占区域,在训练初始模型时,初始模型中可以包括三个输出分支,用于输出三种特征图。具体的为:训练对象的中心点的预测标签特征图、表征中心点预测偏移量的预测偏移量特征图以及表征训练对象的预测所占区域大小特征图。其中,上述三种特征图为初始模型对输入的训练图像进行处理后生成,并且分别对应与训练图像中训练对象的标签特征图、训练对象的中心点的偏移量特征图,以及训练对象的所占区域大小特征图进行损失函数计算,以分别迭代更新初始模型中三个输出分支的模型参数。
[0089]
具体的,参照图4,自动喷洒设备可以通过如下步骤s401-s403迭代初始模型。详述如下:
[0090]
s401、自动喷洒设备获取初始模型对训练图像进行处理后,分别输出的表征训练对象的中心点的预测标签特征图、表征中心点预测偏移量的预测偏移量特征图以及表征训练对象的预测所占区域大小特征图。
[0091]
其中,标签特征图已在上述进行解释,对此不再进行说明。其中,对于预测偏移量特征图以及预测所占区域大小特征图可以通过如下方式进行生成。
[0092]
示例性的,结合上述s202中的示例:缩放倍数为s,中心点在训练图像中的位置(x,y),则缩放后的中心点在训练特征图的位置即为(x/s,y/s)。其中,若x/s,y/s的值不为整数,则可以向下取整,参与后续处理。基于此,对于中心点的偏移量,其可以将x/s的值减去x/s向下取整后的数值,作为中心点在横轴上的偏移量,以及将y/s的值减去y/s向下取整后的数值,作为中心点在纵轴上的偏移量。最后,将上述两个偏移量作为中心点的偏移量特征图。同样的,若需要其他像素点的偏移量特征图,也可以如上述方式得到。
[0093]
与偏移量特征图类似,在获取训练对象的所占区域大小特征图时,自动喷洒设备可以先确定训练对象在训练图像中所占区域。之后,将所占区域的长度和宽度分别缩放s倍,将缩放后的数值作为所占区域大小特征图。
[0094]
其中,上述标签特征图可以为:n*label*128*128表示,上述偏移量特征图可以为:n*2*128*128;上述所占区域大小特征图可以为:n*2*128*128。其中,n为训练图像中包含的训练对象的类别数量,上述已说明每个类别生成一个标签特征图;label为训练对象的真实类别;128*128表示输入的特征图的维度;2表示该特征图同时包括长度和宽度上的特征信息。
[0095]
s402、自动喷洒设备采用第一损失函数对预测标签特征图和标签特征图进行处理,得到中心点的位置预测损失;采用第二损失函数对偏移量特征图和预测偏移量特征图进行处理,得到偏移量预测损失;以及,采用第二损失函数对所占区域大小特征图和预测所占区域大小特征图进行处理,得到所占区域大小预测损失。
[0096]
s403、自动喷洒设备根据位置预测损失、偏移量预测损失以及所占区域大小预测损失迭代更新初始模型得到目标识别模型。
[0097]
在一实施例中,上述第一损失函数具体可以为均衡交叉熵损失函数(focal loss);第二损失函数具体可以为平滑平均绝对误差损失函数(smooth l1 loss)。其中,针对第二损失函数,现有技术中,通常采用l1 loss对上述偏移量特征图、预测偏移量特征图、所占区域大小特征图以及预测所占区域大小特征图进行处理。但是,该l1 loss在0点处的导数不唯一,将影响初始模型的收敛。然而,在本实施例中,采用smooth l1计算损失时,smooth l1可以在0点附近使用平方函数进行处理,使其在0点处更加平滑,以提高初始模型的收敛效率。
[0098]
其中,focal loss的具体计算公式可以为:
[0099]fcentral point
(p
t
)=-α
t
(1-p
t
)
γ
log(p
t
);
[0100]
其中,f
central point
(p
t
)为第t个中心点的位置预测损失;p
t
为预测第t个中心点所在的像素点属于中心点的预测概率值,其中,p
t
为∈[0,1];α
t
为预设的平衡参数;γ为调节因子。其中,调节因子可以调节正样本与负样本之间的不平衡程度。
[0101]
其中,smooth l1的具体计算公式可以为:
[0102][0103]
其中,
[0104]
k=f(ki)-li;
[0105]
其中,f(ki)为第i个像素点的预测值,以及li为第i个像素点的实际值。其中,l1(k)为计算出的预测损失。具体的,在计算偏移量预测损失时,其ki为预测偏移量特征图中第i个像素点的预测偏移量,li为偏移量特征图中第i个像素点的实际偏移量;在计算所占区域大小预测损失时,其ki为预测所占区域大小特征图中第i个像素点的预测所占区域大小,li为所占区域大小特征图中第i个像素点的实际所占区域大小。因每个特征图中通常包括多个像素点,因此,可以分别计算每个像素点的l1(k)值。最后,对每个像素点的l1(k)值进行求和,得到最终的偏移量预测损失以及所占区域大小预测损失。
[0106]
可以理解的是,对于生成的目标识别模型,在对目标图像进行处理时,其可以输出中心点在目标图像中的预测位置,以及中心点的预测偏移量,和预测所占区域大小。之后,根据预测偏移量对预测位置进行处理,准确输出中心点在目标图像中的位置,并根据该位置和所占区域大小,在目标图像中确定目标对象。以此,可以提高目标识别模型对中心点进行定位的准确率。
[0107]
具体的,参照图5和图6,图5为本技术实施例中初始模型的网络结构框图;图6为现有技术中神经网络模型的网络结构框图。其中,参照图6,上述初始模型具体包括轻量化网络、像素上采样网络、第一输出网络、第二输出网络、第三输出网络和第四输出网络。
[0108]
其中,轻量化网络具体为图5中的mobilenetv2网络,其包括依次包括一个1*32*256*256的卷积层(conv),以及多个瓶颈层(bottleneck)组成。其中,每个bottleneck分别输出不同维度的图像或特征图。其中,每层网络中均包括1*a*b*c的信息。该信息中1表示一张特征图;a表示通道数,例如,初始输入的训练图像为3通道的图像;a*b表示输入的图像或特征图的维度大小。
[0109]
具体的,bottleneck通常由两个1*1的卷积层和一个3*3的卷积层组成:3*3的卷积层位于两个1*1的卷积层之间。其中,两个1*1卷积层分别负责减少然后增加增加特征图的维度,让3*3卷积层成为输入/输出维数更小的瓶颈。具体的,在经过3*3的卷积层处理之前,用1*1卷积层降低该特征图的通道数,从而降低参数量。在经过3*3的卷积层处理之后,再使用1*1的卷积层恢复特征图的通道数。从图6中可知,现有技术是采用resnet18网络作为轻量化网络,其内部采用一个1*64*256*256的卷积层(conv),以及多个分解层(resblock)组成。每个分解层中,分解层对应的通道数远远多于瓶颈层中对应的通道数。也即与resnet18网络相比,本实施例中采用的bottleneck既减少了参数量,还可以优化计算量。
[0110]
另外,在本实施例中,上述像素上采样网络由多个上采样层组成,每个上采样层均包括图5中的像素调整层(pixelshuffle) 卷积(conv)层。现有技术中,上采样网络通常由多个反卷积层组成,具体为图6中的convtranspose。然而,使用多个反卷积层对特征图进行处理时,将在一定程度上丢失训练对象的特征信息。而使用像素上采样网络对特征图进行处理时,可以在提高分辨率的同时,保持特征信息不丢失,且不会出现网格效应。
[0111]
在一实施例中,训练图像在经过上述轻量化网络和像素上采样网络处理后输出的
特征图即为复用特征图。其中,该复用特征图需要分别被第一输出网络、第三输出网络和第四输出网络进行处理。
[0112]
其中,图5中初始模型中对复用特征图进行处理的第三输出网络和第四输出网络,与图6中对复用特征图进行处理的网络结构相似,对此不做详细说明。
[0113]
需要说明的是,在输出预测标签特征图时,初始模型先使用第一输出网络对复用特征图进行处理,得到初始预测标签特征图。之后,在使用第二输出网络对复用特征图进行再次处理,得到最终的预测标签特征图。从图6可知,现有技术中,模型在输出预测标签特征图时,仅采用一个第一输出网络进行处理。
[0114]
其中,第二输出网络具体包括归一化层和最大池化层,用于对初始预测标签特征图进行归一化处理和池化处理。具体的,对于初始预测标签特征图中每个像素点的概率值进行归一化处理后,采用3*3的最大池化层确定每个像素点分别与领域像素点中概率值的最大值。即每九个像素点中只有一个最大值。之后,对于该初始预测标签特征图上的所有最大值,根据数值大小从大到小依次选取k个最大值进行保留,即得到预测标签特征图。此时,初始模型可以直接将k个最大值分别对应的像素点确定为中心点。其中,进行归一化和最大池化处理的目的在于:可以更好地保留训练对象在训练图像中的纹理特征。
[0115]
需要说明的是,在上述s403中,根据位置预测损失、偏移量预测损失以及所占区域大小预测损失迭代更新初始模型时,仅迭代上述轻量化网络、像素上采样网络、第一输出网络、第二输出网络、第三输出网络和第四输出网络的模型参数。上述初始模型中还应当包括分类层,用于根据上述各个特征图进行类别预测。其中,分类层的模型参数应当根据训练对象的真实类别与预测类别计算的训练损失进行迭代。
[0116]
请参阅图7,图7是本技术实施例提供的一种液体喷洒控制装置的结构框图。本实施例中液体喷洒控制装置包括的各模块用于执行图1、图2和图4对应的实施例中的各步骤。具体请参阅图1、图2和图4以及图1、图2和图4所对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图7,液体喷洒控制装置700可以包括:采集模块710、识别模块720、喷洒模块730以及停止模块740,其中:
[0117]
采集模块710,用于通过设置于自动喷洒设备上的图像传感器采集待喷洒区域的目标图像;目标图像中包括目标对象。
[0118]
识别模块720,用于采用目标识别模型对目标对象进行目标识别,得到目标对象的目标类别;目标识别模型是基于预设训练集对预设的初始模型进行训练得到的,预设训练集包括多条训练数据,每条训练数据至少包括含有训练对象的训练图像、训练对象在训练图像中的中心点以及所占区域。
[0119]
喷洒模块730,用于若目标类别为预设类别,则控制自动喷洒设备停止对待喷洒区域进行喷洒;预设类别至少包括生命体。
[0120]
停止模块740,用于若目标类别为非预设类别,则控制自动喷洒设备继续对待喷洒区域停止喷洒。
[0121]
在一实施例中,液体喷洒控制装置700还包括如下模块生成训练数据:
[0122]
训练图像获取模块,用于获取含有训练对象的训练图像;
[0123]
计算模块,用于根据训练图像的图像大小以及初始模型输出的训练特征图的维度大小,计算中心点在训练特征图的特征图位置,以及计算中心点在训练特征图的高斯核半
径;
[0124]
标签特征图生成模块,用于基于高斯核半径对训练特征图进行处理,得到训练图像的标签特征图;
[0125]
训练数据生成模块,用于根据训练图像以及标签特征图,生成训练数据。
[0126]
在一实施例中,计算模块还用于:
[0127]
根据图像大小和维度大小,计算训练图像被初始模型处理时的缩放倍数;根据缩放倍数和中心点在训练图像中的位置,计算中心点在训练特征图的特征图位置。
[0128]
在一实施例中,训练图像中包括一个训练对象,标签特征图生成模块还用于:
[0129]
以特征图位置为中心,基于高斯核半径确定训练特征图中每个像素点的概率值,并根据训练特征图中各个像素点的概率值得到标签特征图;概率值用于表示标签特征图中每个像素点属于中心点的概率。
[0130]
在一实施例中,训练图像中包括多个训练对象;标签特征图生成模块还用于:
[0131]
分别获取每个训练对象的中心点在训练特征图的特征图位置;以特征图位置为中心,基于高斯核半径确定训练特征图中每个像素点的概率值,并根据训练特征图中各个像素点的概率值得到标签特征图;概率值用于表示标签特征图中每个像素点属于中心点的概率;若有至少两个训练对象对应的特征图位置具有重叠,则针对至少两个训练对象对应的标签特征图中具有重叠的任一重叠像素点,将重叠像素点中概率值的最大值确定为重叠像素点最终的概率值;根据至少两个训练对象对应的标签特征图中各个像素点最终的概率值,得到最终的标签特征图。
[0132]
在一实施例中,训练数据还包括中心点的偏移量特征图以及训练对象的所占区域大小特征图;液体喷洒控制装置700还包括如下模块训练初始模型:
[0133]
特征图输出模块,用于获取初始模型对训练图像进行处理后,分别输出的表征训练对象的中心点的预测标签特征图、表征中心点预测偏移量的预测偏移量特征图以及表征训练对象的预测所占区域大小特征图。
[0134]
损失计算模块,用于采用第一损失函数对预测标签特征图和标签特征图进行处理,得到中心点的位置预测损失;采用第二损失函数对偏移量特征图和预测偏移量特征图进行处理,得到偏移量预测损失;以及,采用第二损失函数对所占区域大小特征图和预测所占区域大小特征图进行处理,得到所占区域大小预测损失。
[0135]
迭代模块,用于根据位置预测损失、偏移量预测损失以及所占区域大小预测损失迭代更新初始模型得到目标识别模型。
[0136]
在一实施例中,初始模型包括轻量化网络、像素上采样网络、第一输出网络、第二输出网络、第三输出网络和第四输出网络;
[0137]
轻量化网络和像素上采样网络依次用于对训练图像进行处理,得到复用特征图;第一输出网络用于对复用特征图进行处理,得到初始预测标签特征图;第二输出网络依次包括归一化层和最大池化层,用于对初始预测标签特征图进行归一化处理和池化处理,得到最终的预测标签特征图;第三输出网络用于对复用特征图进行处理,得到预测偏移量特征图;第四输出网络用于对复用特征图进行处理,得到预测所占区域大小特征图。
[0138]
当理解的是,图7示出的液体喷洒控制装置的结构框图中,各模块用于执行图1、图2和图4对应的实施例中的各步骤,而对于图1、图2和图4对应的实施例中的各步骤已在上述
实施例中进行详细解释,具体请参阅图1、图2和图4以及图1、图2和图4所对应的实施例中的相关描述,此处不再赘述。
[0139]
图8是本技术一实施例提供的一种自动喷洒设备的结构框图。如图8所示,该实施例的自动喷洒设备800包括:处理器810、存储器820以及存储在存储器820中并可在处理器810运行的计算机程序830,例如液体喷洒控制方法的程序。处理器810执行计算机程序830时实现上述各个液体喷洒控制方法各实施例中的步骤,例如图1所示的s101至s104。或者,处理器810执行计算机程序830时实现上述图7对应的实施例中各模块的功能,例如,图7所示的模块710至740的功能,具体请参阅图7对应的实施例中的相关描述。
[0140]
示例性的,计算机程序830可以被分割成一个或多个模块,一个或者多个模块被存储在存储器820中,并由处理器810执行,以实现本技术实施例提供的液体喷洒控制方法。一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序830在自动喷洒设备800中的执行过程。例如,计算机程序830可以实现本技术实施例提供的液体喷洒控制方法。
[0141]
自动喷洒设备800可包括,但不仅限于,处理器810、存储器820。本领域技术人员可以理解,图8仅仅是自动喷洒设备800的示例,并不构成对自动喷洒设备800的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如自动喷洒设备还可以包括输入输出设备、网络接入设备、总线等。
[0142]
所称处理器810可以是中央处理单元,还可以是其他通用处理器、数字信号处理器、专用集成电路、现成可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0143]
存储器820可以是自动喷洒设备800的内部存储单元,例如自动喷洒设备800的硬盘或内存。存储器820也可以是自动喷洒设备800的外部存储设备,例如自动喷洒设备800上配备的插接式硬盘,智能存储卡,闪存卡等。进一步地,存储器820还可以既包括自动喷洒设备800的内部存储单元也包括外部存储设备。
[0144]
本技术实施例提供了一种计算机可读存储介质,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上述各个实施例中的液体喷洒控制方法。
[0145]
本技术实施例提供了一种计算机程序产品,当计算机程序产品在自动喷洒设备上运行时,使得自动喷洒设备执行上述各个实施例中的液体喷洒控制方法。
[0146]
以上实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围,均应包含在本技术的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献