一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

图像分类方法、分类模型的训练方法、装置及电子设备与流程

2022-03-23 07:27:06 来源:中国专利 TAG:


1.本技术涉及图像处理技术领域,具体而言,涉及一种图像分类方法、分类模型的训练方法、装置及电子设备。


背景技术:

2.目前,对于红火蚁的监测、防控工作,仍然以人工为主,比如:需要人工逐一对红火蚁的足迹和巢穴进行勘察后再相应进行灭杀。为了快速监测红火蚁发生情况,有必要采用自动监测装置,即采用人工智能中的图像识别方法自动识别红火蚁发生情况,但目前深度学习在病虫害领域的推广应用并不顺利,主要原因是该领域的应用大多是细分领域、定制化的,目前主流的深度学习网络都难以直接用于到实际的项目中,企业需要不断测试、改进网络结构参数才可以应用到项目中,但该方式十分耗费时间和人力成本。


技术实现要素:

3.本技术实施例的目的在于提供一种图像分类方法、分类模型的训练方法、装置及电子设备,以改善“现有技术中的深度学习网络难以直接用于识别红火蚁图像及红火蚁蚁巢图像”的问题。
4.本发明是这样实现的:第一方面,本技术实施例提供一种图像分类方法,所述方法包括:获取待识别图像,所述待识别图像中包括待识别对象;将所述待识别图像输入预设的第一神经网络,获取所述待识别对象为红火蚁的第一概率;将所述待识别图像输入预设的第二神经网络,获取所述待识别对象为红火蚁蚁巢的第二概率;根据所述第一概率、所述第二概率和预设概率值之间的大小关系,确定所述待识别对象的类别;其中,所述第一神经网络为根据预设个数的训练图样进行均值聚类得到的属于红火蚁类别的训练图样对应的隶属概率,以及该训练图样对应的图像特征进行训练后得到的神经网络;所述第二神经网络为根据预设个数的训练图样进行均值聚类得到的属于红火蚁蚁巢类别的训练图样对应的隶属概率,以及该训练图样对应的图像特征进行训练后得到的神经网络。
5.在本技术实施例中,第一神经网络为根据预设个数的训练图样进行均值聚类得到的属于红火蚁类别的训练图样对应的隶属概率,以及该训练图样对应的图像特征进行训练后得到的神经网络;第二神经网络为根据预设个数的训练图样进行均值聚类得到的属于红火蚁蚁巢类别的训练图样对应的隶属概率,以及该训练图样对应的图像特征进行训练后得到的神经网络。因此,将待识别图像分别输入第一神经网络和第二神经网络后,第一神经网络和第二神经网络能对该待识别图像直接进行识别,从而能分别得到待识别对象为红火蚁的第一概率以及为红火蚁蚁巢的第二概率。并且,通过第一概率、第二概率和预设概率值之间的大小关系,确定待识别对象的类别(即待识别对象为红火蚁,或红火蚁蚁巢,或其他类别),能实现对多个对象的识别。此外,相较于企业需要对现有的深度学习网络不断进行测试和改进网络结构参数后,才能应用到监测红火蚁发生情况的项目中,上述方式可直接应
用于该项目中,从而降低了企业的人力成本和时间成本。
6.结合上述第一方面提供的技术方案,在一些可能的实现方式中,所述根据所述第一概率、所述第二概率和预设概率值之间的大小关系,确定所述待识别对象的类别,包括:若所述第一概率和所述第二概率均大于所述预设概率值,且所述第一概率大于所述第二概率,则确定所述待识别对象为所述红火蚁;若所述第一概率和所述第二概率均大于所述预设概率值,且所述第一概率小于所述第二概率,则确定所述待识别对象为所述红火蚁蚁巢。
7.在本技术实施例中,当第一概率和第二概率均大于预设概率值时,表示待识别图像上既存在红火蚁图像,又存在红火蚁蚁巢图像,即该待识别图像上存在多个对象。因此,通过第一概率和第二概率之间的大小关系,可快速且准确的确定出待识别图像中待识别对象的类别。
8.结合上述第一方面提供的技术方案,在一些可能的实现方式中,所述方法还包括:若所述第一概率和所述第二概率均小于所述预设概率值,则调用预设的识别模型对所述待识别图像进行识别,获取所述待识别对象的类别。
9.在本技术实施例中,在第一概率和第二概率小于预设概率值时,则表示待识别对象为红火蚁和红火蚁蚁巢的概率较低,可能是其他类型的对象。此时,可调用预设的识别模型对待识别图像进一步识别,从而在待识别图像中待识别对象为红火蚁或红火蚁蚁巢的可能性较低时,通过识别模型再次确定待识别图像的类别,提高了对对象识别的广度。
10.结合上述第一方面提供的技术方案,在一些可能的实现方式中,所述方法还包括:获取所述预设个数的训练图样及各所述训练图样对应的图像特征,所述训练图样包括红火蚁图样和红火蚁蚁巢图样;对所述训练图样进行均值聚类,获取每个所述训练图样对应的分类标签向量和隶属概率;根据所述分类标签向量对各所述训练图样进行分类,以判断该训练图样为红火蚁图样或红火蚁蚁巢图样;利用第一训练集对初始第一神经网络进行训练,得到所述第一神经网络;其中,所述第一训练集包括判断为红火蚁图样对应的图像特征,以及判断为红火蚁图样对应的隶属概率。
11.在本技术实施例中,通过上述方式,能快速得到每个训练图样的分类标签向量,避免通过人工的方式对各训练图样进行分类和标记,从而能根据各分类标签向量判断出各训练图样为红火蚁图样或红火蚁蚁巢图样,进而能快速得到第一训练集。此外,通过提高获取第一训练集的效率,从而提高了获取第一神经网络的效率。
12.结合上述第一方面提供的技术方案,在一些可能的实现方式中,所述方法还包括:利用第二训练集对初始第二神经网络进行训练,得到所述第二神经网络;其中,所述第二训练集包括判断为红火蚁蚁巢图样对应的图像特征,以及判断为红火蚁蚁巢图样对应的隶属概率。
13.在本技术实施例中,通过上述方式,能快速获取到第二训练集,从而提高了获取第二神经网络的效率。
14.结合上述第一方面提供的技术方案,在一些可能的实现方式中,所述获取所述预设个数的训练图样,包括:获取所述预设个数的收集图像,所述收集图像包括红火蚁图像和红火蚁蚁巢图像;对每个所述收集图像依次进行低帽变换和二值化处理,得到所述预设个数的二值化图像;对每个所述二值化图像进行分割,得到所述训练图样。
15.在本技术实施例中,通过将获取到的收集图像进行低帽变换,能将暗目标从亮背
景中凸显出来,即从各收集图像的背景中将红火蚁或红火蚁蚁巢凸显出来,从而有助于后续获取训练图样。此外,对完成低帽变换后的收集图像进行二值化处理,并对经过二值化处理后的图像进行分割,能快速且准确的得到训练图样。
16.结合上述第一方面提供的技术方案,在一些可能的实现方式中,所述对所述训练图样进行均值聚类,获取每个所述训练图样对应的分类标签向量和隶属概率,包括:s301:将所述训练图样聚类到两个类中,得到各所述训练图样对应的分类标签向量,所述两个类为所述红火蚁和所述红火蚁蚁巢;s302:采用拉格朗日乘子法求解预设的代价函数,得到聚类中心点的方程和隶属概率矩阵的方程,其中,所述隶属概率矩阵表征每个所述训练图样聚类到对应的类中的概率,且所述隶属概率矩阵包括各所述训练图样对应的隶属概率;s303:更新初始化隶属概率矩阵和聚类中心点,根据更新后的隶属概率矩阵值与上一次更新后的隶属概率矩阵值计算误差值,重复步骤s303,直到所述误差值小于预设的误差阈值,得到各所述训练图样对应的隶属概率。
17.结合上述第一方面提供的技术方案,在一些可能的实现方式中,所述图像特征包括各所述训练图样对应图像的面积、周长、长度、宽度和平均灰度值。
18.在本技术实施例中,因图像特征包括训练图样对应图像的面积、周长、长度、宽度和平均灰度值,使得在使用第一神经网络和第二神经网络对待识别图像进行处理时,能从上述五个维度对待识别图像中待识别对象的特征进行提取,从而能提高识别的准确率,即提高了第一神经网络和第二神经网络输出的第一概率和第二概率的准确率。
19.第二方面,本技术实施例提供一种分类模型的训练方法,分类模型包括第一神经网络、第二神经网络和分类层,所述方法包括:获取预设个数的训练图样及各所述训练图样对应的图像特征,所述训练图样包括第一对象图样和第二对象图样;对所述训练图样进行均值聚类,获取每个所述训练图样对应的分类标签向量和隶属概率;根据所述分类标签向量对各所述训练图样进行分类,以判断该训练图样为第一对象图样或第二对象图样;利用第一训练集对初始第一神经网络进行训练,得到所述第一神经网络;其中,所述第一训练集包括判断为第一对象图样对应的图像特征,以及判断为第一对象图样对应的隶属概率;利用第二训练集对初始第二神经网络进行训练,得到所述第二神经网络;其中,所述第二训练集包括判断为第二对象图样对应的图像特征,以及判断为第二对象图样对应的隶属概率;其中,所述分类层用于根据所述第一神经网络输出的第一概率、所述第二神经网络输出的第二概率和预设概率值之间的大小关系,确定待识别图像中待识别对象的类别。
20.在本技术实施例中,通过上述方式,能够训练出直接对待识别图像进行识别的第一神经网络和第二神经网络,即第一神经网络能直接识别出待识别图像中待识别对象为第一对象的概率,第二神经网络能直接输出待识别图像中待识别对象为第二对象的概率。并且,分类层能根据第一概率、第二概率和预设概率值之间的大小关系,快速且准确的确定出待识别对象的类别(即待识别对象为红火蚁,或红火蚁蚁巢,或其他类别),且能实现对多个对象的识别。
21.结合上述第二方面提供的技术方案,在一些可能的实现方式中,所述获取预设个数的训练图样,包括:获取所述预设个数的收集图像,所述收集图像包括第一对象图像和第二对象图像;对每个所述收集图像依次进行低帽变换和二值化处理,得到所述预设个数的二值化图像;对每个所述二值化图像进行分割,得到所述训练图样。
22.在本技术实施例中,通过将获取到的收集图像进行低帽变换,能将暗目标从亮背景中凸显出来,即从各收集图像的背景中将第一对象或第二对象凸显出来,从而有助于后续获取训练图样。此外,对完成低帽变换后的收集图像进行二值化处理,并对经过二值化处理后的图像进行分割,能快速且准确的得到训练图样。
23.结合上述第二方面提供的技术方案,在一些可能的实现方式中,所述对每个所述收集图像进行低帽变换,包括:对每个所述收集图像均进行灰度化处理,得到所述灰度化处理后的各所述收集图像;对所述灰度化处理后的各所述收集图像均使用预设半径值的圆形模板进行膨胀处理,得到所述膨胀处理后的各所述收集图像;对所述膨胀处理后的各所述收集图像均使用预设半径值的圆形模板进行腐蚀处理,得到所述腐蚀处理后的各所述收集图像;将所述腐蚀处理后的各所述收集图像减去与其对应的各所述收集图像,得到对各所述收集图像进行低帽变换后的图像。
24.结合上述第二方面提供的技术方案,在一些可能的实现方式中,所述对所述训练图样进行均值聚类,获取每个所述训练图样对应的分类标签向量和隶属概率,包括:s401:将所述训练图样聚类到两个类中,得到各所述训练图样对应的分类标签向量,所述两个类为第一对象和第二对象;s402:采用拉格朗日乘子法求解预设的代价函数,得到聚类中心点的方程和隶属概率矩阵的方程,其中,所述隶属概率矩阵表征每个所述训练图样聚类到对应的类中的概率,且所述隶属概率矩阵包括各所述训练图样对应的隶属概率;s403:更新初始化隶属概率矩阵和聚类中心点,根据更新后的隶属概率矩阵值与上一次更新后的隶属概率矩阵值计算误差值,重复步骤s403,直到所述误差值小于预设的误差阈值,得到各所述训练图样对应的隶属概率。
25.结合上述第二方面提供的技术方案,在一些可能的实现方式中,所述第一神经网络包括输入层、隐藏层和输出层,所述利用第一训练集对初始第一神经网络进行训练,得到所述第一神经网络,包括:s501:将所述判断为第一对象图样对应的图像特征输入所述输入层;s502:根据该图像特征、所述输入层和所述隐藏层的各连接权值及所述隐藏层阈值,计算隐藏层的输出;s503:根据所述隐藏层的输出、所述隐藏层和所述输出层的各连接权值及所述输出层的阈值,计算所述输出层的输出,得到所述输出层输出的概率值;s504:根据所述概率值与该第一对象图样对应的隶属概率计算损失值,并根据所述损失值调整所述第一神经网络的各参数值;重复步骤s502-s504,直至所述损失值处于预设范围或者满足预设迭代次数,获得最终的各参数值,其中,所述各参数值包括所述输入层和所述隐藏层的各连接权值、所述隐藏层和所述输出层的各连接权值、所述隐藏层阈值和所述输出层的阈值。
26.结合上述第二方面提供的技术方案,在一些可能的实现方式中,所述第二神经网络包括输入层、隐藏层和输出层;所述利用第二训练集对初始第二神经网络进行训练,得到所述第二神经网络,包括:s601:将所述判断为第二对象图样对应的图像特征输入所述输出层;s602:根据该图像特征、所述输入层和所述隐藏层的各连接权值及所述隐藏层阈值,计算隐藏层的输出;s603:根据所述隐藏层的输出、所述隐藏层和所述输出层的各连接权值及所述输出层的阈值,计算所述输出层的输出,得到所述输出层输出的概率值;s604:根据所述概率值与该第二对象图样对应的隶属概率计算损失值,并根据所述损失值调整所述第二神经网络的各参数值;重复步骤s602-s604,直至所述损失值处于预设范围或者满足预设迭代次数,获得最终的各参数值,其中,所述各参数值包括所述输入层和所述隐藏层的各连接
权值、所述隐藏层和所述输出层的各连接权值、所述隐藏层阈值和所述输出层的阈值。
27.结合上述第二方面提供的技术方案,在一些可能的实现方式中,所述第一对象为红火蚁,所述第二对象为红火蚁蚁巢。
28.在本技术实施例中,将第一对象设置为红火蚁,第二对象设置为红火蚁蚁巢,能使训练后的分类模型能直接对待识别图像中待识别对象进行识别,从而能分别得到待识别对象为红火蚁的第一概率以及为红火蚁蚁巢的第二概率。并且,分类层根据第一概率、第二概率和预设概率值之间的大小关系,能快速确定待识别对象的类别(即待识别对象为红火蚁,或红火蚁蚁巢,或其他类别),且能实现对多个对象的识别。
29.结合上述第二方面提供的技术方案,在一些可能的实现方式中,所述图像特征包括各所述训练图样对应图像的面积、周长、长度、宽度和平均灰度值。
30.第三方面,本技术实施例提供一种图像分类装置,所述装置包括:第一获取模块,用于获取待识别图像,所述待识别图像中包括待识别对象;第一处理模块,用于将所述待识别图像输入预设的第一神经网络,获取所述待识别对象为红火蚁的第一概率;将所述待识别图像输入预设的第二神经网络,获取所述待识别对象为红火蚁蚁巢的第二概率;分类模块,用于根据所述第一概率、所述第二概率和预设概率值之间的大小关系,确定所述待识别对象的类别;其中,所述第一神经网络为根据预设个数的训练图样进行均值聚类得到的属于红火蚁类别的训练图样对应的隶属概率,以及该训练图样对应的图像特征进行训练后得到的神经网络;所述第二神经网络为根据预设个数的训练图样进行均值聚类得到的属于红火蚁蚁巢类别的训练图样对应的隶属概率,以及该训练图样对应的图像特征进行训练后得到的神经网络。
31.第四方面,本技术实施例中提供一种分类模型的训练装置,其特征在于,分类模型包括第一神经网络、第二神经网络和分类层,所述装置包括:第二获取模块,用于获取预设个数的训练图样及各所述训练图样对应的图像特征,所述训练图样包括第一对象图样和第二对象图样;第二处理模块,用于对所述训练图样进行均值聚类,获取每个所述训练图样对应的分类标签向量和隶属概率; 根据所述分类标签向量对各所述训练图样进行分类,以判断该训练图样为第一对象图样或第二对象图样;训练模块,用于利用第一训练集对初始第一神经网络进行训练,得到所述第一神经网络;其中,所述第一训练集包括判断为红火蚁图样对应的图像特征,以及判断为红火蚁图样对应的隶属概率;利用第二训练集对初始第二神经网络进行训练,得到所述第二神经网络;其中,所述第二训练集包括判断为红火蚁蚁巢图样对应的图像特征,以及判断为红火蚁蚁巢图样对应的隶属概率;所述分类层用于根据所述第一神经网络输出的第一概率、所述第二神经网络输出的第二概率和预设概率值之间的大小关系,确定待识别图像中待识别对象的类别。
32.第五方面,本技术实施例提供一种电子设备,包括:处理器和存储器,所述处理器和所述存储器连接;所述存储器用于存储程序;所述处理器用于调用存储在所述存储器中的程序,执行如上述第一方面实施例和/或结合上述第一方面实施例的一些可能的实现方式提供的方法,或执行如上述第二方面实施例和/或结合上述第二方面实施例的一些可能的实现方式提供的方法。
33.第六方面,本技术实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器运行时执行如上述第一方面实施例和/或结合上述第一方面实
施例的一些可能的实现方式提供的方法,或执行如上述第二方面实施例和/或结合上述第二方面实施例的一些可能的实现方式提供的方法。
附图说明
34.为了更清楚地说明本技术实施例的技术方案,下面将对本技术实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
35.图1为本技术实施例提供的一种分类模型的训练方法的步骤流程图。
36.图2为本技术实施例提供的一种神经网络的示意图。
37.图3为本技术实施例提供的一种图像分类方法的步骤流程图。
38.图4为本技术实施例提供的一种图像分类装置的模块框图。
39.图5为本技术实施例提供的一种分类模型的训练装置的模块框图。
40.图6为本技术实施例提供的一种电子设备的模块框图。
具体实施方式
41.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行描述。
42.鉴于现有技术中的深度学习网络难以直接用于识别红火蚁图像及红火蚁蚁巢图像,本技术发明人经过研究探索,提出以下实施例以改善上述问题。
43.本技术实施例提供了一种分类模型的训练方法,该分类模型包括第一神经网络、第二神经网络和分类层,其中,上述第一神经网络和第二神经网络分别用于对待识别图像进行识别,且分别得到待识别图像中待识别对象为第一对象和第二对象的概率,上述分类层用于根据第一神经网络输出的第一概率、第二神经网络输出的第二概率和预设概率值之间的大小关系,确定待识别图像中待识别对象的类别。以下结合图1对一种分类模型的训练方法的具体流程及步骤进行说明。
44.需要说明的是,本技术实施例提供的分类模型的训练方法不以图1及以下所示的顺序为限制。
45.步骤s101:获取预设个数的训练图样及各训练图样对应的图像特征,训练图样包括第一对象图样和第二对象图样。
46.其中,第一对象和第二对象可为具有关联的两对象,比如:红火蚁和红火蚁蚁巢、蜜蜂和蜂巢等;第一对象和第二对象还可为不具有关联的两对象,比如:大象和松树,花朵与房屋,飞机与水杯等,此处不做限定。上述图像特征可包括各训练图样对应图像的面积、周长、长度、宽度和平均灰度值。
47.具体的,获取预设个数的训练图样可包括:获取预设个数的收集图像,收集图像包括第一对象图像和第二对象图像;对每个收集图像依次进行低帽变换和二值化处理,得到预设个数的二值化图像;对每个二值化图像进行分割,得到训练图样。
48.其中,上述预设个数可根据实际情况进行选择,比如:选择1000张第一对象图像和第二对象图像,即第一对象图像和第二对象图像的总和为1000张,其中,第一对象图像和第二对象图像可均为500张,也可根据实际情况对第一对象图像和第二对象图像的个数进行
设置(即第一对象图像和第二对象图样的个数可以不相等)。需要说明的是,选择的第一对象图像和第二对象图像的个数越多,则越有利于后续对分类模型的训练,但计算量也相应的增大,所以收集图像的数量可以根据实际需要进行设置。上述收集图像可以为经过图像归一化处理后的图像,该归一化处理可采用本领域中常用的技术手段。
49.此外,上述低帽变换是指闭运算之后的图像与原始图像之差,其目的是将各收集图像中的暗目标从亮背景中凸显出来,其数学表达式为:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)在公式(1)中,为闭运算,为原图,为结构元素,为进行低帽运算后的图像。
50.具体的,上述对每个收集图像进行低帽变换可包括:对每个收集图像均进行灰度化处理,得到灰度化处理后的各收集图像;对灰度化处理后的各收集图像均使用预设半径值的圆形模板(即上述结构元素)进行膨胀处理,得到膨胀处理后的各收集图像;对膨胀处理后的各收集图像均使用预设半径值的圆形模板进行腐蚀处理,得到腐蚀处理后的各收集图像;将腐蚀处理后的各收集图像减去与其对应的各收集图像,得到对各收集图像进行低帽变换后的图像。需要说明的是,上述闭运算指的是对每个收集图像依次进行膨胀处理、腐蚀处理的过程。此外,上述预设半径值为上述结构元素的尺寸,其通常为比较小的值,比如:该预设半径值可为5像素。
51.在获取到预设个数的训练图样及各训练图样对应的图像特征后,本方法可以继续执行步骤s102。
52.步骤s102:对训练图样进行均值聚类,获取每个训练图样对应的分类标签向量和隶属概率。
53.具体的,步骤s102可具体包括:s401:将训练图样聚类到两个类中,得到各训练图样对应的分类标签向量,两个类为第一对象和第二对象;s402:采用拉格朗日乘子法求解预设的代价函数,得到聚类中心点的方程和隶属概率矩阵的方程,其中,隶属概率矩阵表征每个训练图样聚类到对应的类中的概率,且隶属概率矩阵包括各训练图样对应的隶属概率;s403:更新初始化隶属概率矩阵和聚类中心点,根据更新后的隶属概率矩阵值与上一次更新后的隶属概率矩阵值计算误差值,重复步骤s403,直到误差值小于预设的误差阈值,得到各训练图样对应的隶属概率。其中,上述分类标签向量为训练图样聚类到对应的类对应的类别。
54.以下结合各公式对上述获取分类标签向量和隶属概率的过程进行说明。在将训练图样聚类到两个类后,能构建出一个隶属概率矩阵。其中,随机初始化隶属概率矩阵为:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)在公式(2)中,,,为输入的训练样本数量,为类别,为类别总数量,。
55.上述代价函数为:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)在公式(3)中,表示第个聚类的中心点(即分类标签向量),且,为模糊系数,且,为输入的训练样本数量(即该为上述),为聚类中心数,表示第个样本,表示样本对聚类中心点的隶属概率(即属于的概率)。表示数据相似性(距离)的度量,常见的是欧几里得范数(即欧氏范数,l2范数,欧氏距离)。
56.采用拉格朗日乘子法求解预设的代价函数,得到聚类中心点的方程和隶属概率矩阵的方程为:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)需要说明的是,根据更新后的隶属概率矩阵值与上一次更新后的隶属概率矩阵值计算误差值的式子为:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)其中,为迭代次数,为预设的误差阈值,且为常数值。
57.在获得到每个训练图样对应的分类标签向量和隶属概率后,本方法可以继续执行步骤s103。
58.步骤s103:根据分类标签向量对各训练图样进行分类,以判断该训练图样为第一对象图样或第二对象图样。
59.在步骤s102中,获取到了每个训练图样对应的分类标签,因此,可以根据每个训练图样对应的分类标签,判断每个训练图样的类别,即判断该训练图样为第一对象图样或第二对象图样。
60.在判断出各训练图样的所属类别后,本方法可以继续执行步骤s104。
61.步骤s104:利用第一训练集对初始第一神经网络进行训练,得到第一神经网。
62.其中,第一训练集包括判断为第一对象图样对应的图像特征,以及判断为第一对象图样对应的隶属概率。
63.如图2所示,图2为本技术实施例提供的一种神经网络的示意图,其中,图中的各圆
圈表示各节点,为各输入数据,为各输出数据。具体的,第一神经网络包括输入层、隐藏层和输出层,步骤s104可具体包括:s501:将判断为第一对象图样对应的图像特征输入输入层;s502:根据该图像特征、输入层和隐藏层的各连接权值及隐藏层阈值,计算隐藏层的输出;s503:根据隐藏层的输出、隐藏层和输出层的各连接权值及输出层的阈值,计算输出层的输出,得到输出层输出的概率值;s504:根据概率值与该第一对象图样对应的隶属概率计算损失值,并根据损失值调整第一神经网络的各参数值;重复步骤s502-s504,直至损失值处于预设范围或者满足预设迭代次数,获得最终的各参数值,其中,各参数值包括输入层和隐藏层的各连接权值、隐藏层和输出层的各连接权值、隐藏层阈值和输出层的阈值。
64.需要说明的是,第一神经网络的输入层节点数由输入特征的维度(即图像特征的个数)决定。因此,当图像特征包括各训练图样对应图像的面积、周长、长度、宽度和平均灰度值时,输入层可包括5个节点,该5个节点用于选取各训练图样对应的图像的各个特征。
65.第一神经网络的输出层节点数由第一神经网络所要区分的类别数决定,因第一神经网络的输出层用于输出一个概率值,则输出层可包括1个节点。
66.第一神经网络的隐藏层节点数可用经验公式进行确定,具体公式如下:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)其中,为隐藏层节点数,为输入层节点数,为输出层节点数,为1-10之间的调节常数。因此,当输入层节点数为5,输出层节点数为1时,可取3-12中任意整数,比如:可为10,即隐藏层节点数为10个。
67.在设定好第一神经网络的输入层节点数、输出层节点数和隐藏层节点数后,可计算隐藏层的输出,即根据训练图样的图像特征、输入层和隐藏层的各连接权值及隐藏层阈值,计算隐藏层的输出,具体的计算公式如下:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)其中,,为隐藏的激活函数,其具体公式如下:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(9)在计算出隐藏层的输出后,根据隐藏层的输出、隐藏层和输出层的各连接权值及输出层阈值,可计算输出层的输出(即输出层输出的概率值),其计算公式如下:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(10)其中,。
68.根据输出层的输出与该第一对象图样对应的隶属概率可计算损失值,其计算公式为:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(11)根据损失值可调整第一神经网络的输入层和隐藏层的各连接权值和隐藏层和输出层的各连接权值,具体的调整公式为:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(12)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(13)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(14)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(15)其中,为学习率,,,。
69.根据损失值可调整第一神经网络的隐藏层阈值和输出层阈值,具体的调整公式为:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(16)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(17)重复上述步骤,直至损失值处于预设范围或者满足预设迭代次数,获得最终的各参数值。
70.步骤s105:利用第二训练集对初始第二神经网络进行训练,得到第二神经网络。
71.其中,第二训练集包括判断为第二对象图样对应的图像特征,以及判断为第二对象图样对应的隶属概率。
72.具体的,第二神经网络包括输入层、隐藏层和输出层,步骤s105可具体包括:s601:将判断为第二对象图样对应的图像特征输入输出层;s602:根据该图像特征、输入层和隐藏层的各连接权值及隐藏层阈值,计算隐藏层的输出;s603:根据隐藏层的输出、隐藏层和输出层的各连接权值及输出层的阈值,计算输出层的输出,得到输出层输出的概率值;s604:根据概率值与该第二对象图样对应的隶属概率计算损失值,并根据损失值调整第二神经网络的各参数值;重复步骤s602-s604,直至损失值处于预设范围或者满足预设迭代次数,获得最终的各参数值,其中,各参数值包括输入层和隐藏层的各连接权值、隐藏层和输出层的各连接权值、隐藏层阈值和输出层的阈值。
73.需要说明的是,第二神经网络的具体训练过程和结构可参考步骤s104中第一神经网络的具体训练过程和结构,避免赘述,此处不再进行说明。
74.还需要说明的是,在判断出各训练图样的所属类别后,可同时对第一神经网络和第二神经网络进行训练(即同时执行步骤s104和步骤s105);也可先训练第一神经网络,再训练第二神经网络(即先执行步骤s104,再执行步骤s105);还可先训练第二神经网络,再训练第一神经网络(即先执行步骤s105,再执行步骤s104),此处不做限定。
75.综上,通过上述步骤s101-步骤s105,能够训练出直接对待识别图像进行识别的第一神经网络和第二神经网络,即第一神经网络能直接识别出待识别图像中待识别对象为第一对象的概率,第二神经网络能直接输出待识别图像中待识别对象为第二对象的概率。并
且,分类层能根据第一概率、第二概率和预设概率值之间的大小关系,快速且准确的确定出待识别对象的类型,且能实现对多个对象的识别。
76.此外,第一对象和第二对象可根据实际情况设置为不同类别的对象,使得分类模型的训练方法可应用到多种场景中,比如:可应用于红火蚁和红火蚁蚁巢的场景中,即训练图样为红火蚁图样和红火蚁蚁巢图样,相应的,收集图像包括红火蚁图像和红火蚁蚁巢图像。
77.在根据上述训练方法训练好分类模型后,该分类模型可用于对图像进行分类,比如:当训练图样为红火蚁图样和红火蚁蚁巢图样时,训练好的分类模型可用于对待识别图像中待识别对象进行识别,判断该待识别对象是否为红火蚁,或红火蚁蚁巢,或其他类别。
78.本技术实施例还提供了一种图像分类方法,该图像分类方法用于识别待识别图像中待识别对象的所属类别,即可判定该待识别对象是否为红火蚁,或红火蚁蚁巢,或其他类别。需要说明的是,该图像分类方法是由上述分类模型执行对应的操作完成的。以下结合图3对一种图像分类方法的具体流程及步骤进行描述。
79.需要说明的是,本技术实施例提供的图像分类方法不以图3及以下所示的顺序为限制。
80.步骤s201:获取待识别图像,待识别图像中包括待识别对象。
81.其中,待识别图像为进行过图像归一化处理后的图像,该归一化处理可采用本领域中常用的技术手段。
82.在获取到待识别图像后,本方法可以继续执行步骤s202,或步骤s203,或同时执行步骤s202或步骤s203。
83.步骤s202:将待识别图像输入预设的第一神经网络,获取待识别对象为红火蚁的第一概率。
84.其中,第一神经网络为根据预设个数的训练图样进行均值聚类得到的属于红火蚁类别的训练图样对应的隶属概率,以及该训练图样对应的图像特征进行训练后得到的神经网络。该第一神经网络对应的具体训练过程可参考前述步骤s101-步骤s104,避免赘述,此处不再说明。
85.步骤s203:将待识别图像输入预设的第二神经网络,获取待识别对象为红火蚁蚁巢的第二概率。
86.其中,第二神经网络为根据预设个数的训练图样进行均值聚类得到的属于红火蚁蚁巢类别的训练图样对应的隶属概率,以及该训练图样对应的图像特征进行训练后得到的神经网络。该第二神经网络对应的具体训练过程可参考前述步骤s101-步骤s103及步骤s105,避免赘述,此处不再说明。
87.需要说明的是,可同时将待识别图像输入预设的第一神经网络和第二神经网络,得到待识别对象分别为红火蚁和红火蚁蚁巢的概率(即同时执行步骤s202和步骤s203);也可先将待识别图像输入预设的第一神经网络,然后再将待识别图像输入预设的第二神经网络(即先执行步骤s202,再执行步骤s203);还可先将待识别图像输入预设的第二神经网络,然后再将待识别图像输入预设的第一神经网络(即先执行步骤s203,再执行步骤s202),此处不做限定。
88.步骤s204:根据第一概率、第二概率和预设概率值之间的大小关系,确定待识别对
象的类别。
89.其中,预设概率值可根据实际情况进行选择,比如:预设概率值可为0.5,或0.6,或0.7。需要说明的是,预设概率值设置的越大,则能提高判断待识别图像中待识别对象是否为红火蚁或红火蚁蚁巢的准确性。
90.具体的,若第一概率和第二概率均大于预设概率值,且第一概率大于第二概率,则确定待识别对象为红火蚁;若第一概率和第二概率均大于预设概率值,且第一概率小于第二概率,则确定待识别对象为红火蚁蚁巢。例如:当第一概率为0.6,第二概率为0.7,预设概率值为0.5时,待识别图像中待识别对象为红火蚁蚁巢;或者,当第一概率为0.8,第二概率为0.7,预设概率值为0.5时,待识别图像中待识别对象为红火蚁。
91.在本技术实施例中,当第一概率和第二概率均大于预设概率值时,表示待识别图像上既存在红火蚁图像,又存在红火蚁蚁巢图像,即该待识别图像上存在多个对象。因此,可通过第一概率和第二概率之间的大小关系,快速且准确的确定出待识别图像中待识别对象的类别。
92.进一步,若第一概率大于预设概率值,且第二概率小于预设概率值,则确定待识别对象为第一对象;若第一概率小于预设概率值,且第二概率值大于预设概率值,则确定待识别对象为第二对象。例如:当第一概率为0.6,第二概率为0.2,预设概率值为0.5时,待识别图像中待识别对象为红火蚁;或者当第一概率为0.4,第二概率为0.7,预设概率值为0.5时,待识别图像中待识别对象为红火蚁蚁巢。
93.在本技术实施例中,通过上述方式,能根据第一概率、第二概率和预设概率值之间的大小关系,快速且准确的判断出待识别图像的类别。
94.可选的,若第一概率和第二概率均小于预设概率值,则调用预设的识别模型对待识别图像进行识别,获取待识别对象的类别。
95.其中,上述识别模型可为现有的识别模型,例如:resnet50_vd_animals。其中,resnet50_vd_animals为本领域技术人员熟知的识别模型,此处不再进行说明。当使用resnet50_vd_animals对待识别图像进行识别时,可识别出该待识别图像中待识别对象为对应的其他动物类别或非动物类别。需要说明的是,还可根据实际情况选择其他识别模型,此处不进行限定。
96.在本技术实施例中,在第一概率和第二概率小于预设概率值时,可调用预设的识别模型对待识别图像进一步识别,从而在待识别图像中待识别对象为红火蚁或红火蚁蚁巢的可能性较低时,通过识别模型再次确定待识别图像的类别。
97.请参阅图4,基于同一发明构思,本技术实施例还提供一种图像分类装置,该装置100包括:第一获取模块101、第一处理模块102和分类模块103。
98.第一获取模块101,用于获取待识别图像,待识别图像中包括待识别对象。
99.第一处理模块102,用于将待识别图像输入预设的第一神经网络,获取待识别对象为红火蚁的第一概率;将待识别图像输入预设的第二神经网络,获取待识别对象为红火蚁蚁巢的第二概率。
100.分类模块103,用于根据第一概率、第二概率和预设概率值之间的大小关系,确定待识别对象的类别;其中,第一神经网络为根据预设个数的训练图样进行均值聚类得到的属于红火蚁类别的训练图样对应的隶属概率,以及该训练图样对应的图像特征进行训练后
得到的神经网络;第二神经网络为根据预设个数的训练图样进行均值聚类得到的属于红火蚁蚁巢类别的训练图样对应的隶属概率,以及该训练图样对应的图像特征进行训练后得到的神经网络。
101.可选的,分类模块103具体用于若第一概率和第二概率均大于预设概率值,且第一概率大于第二概率,则确定待识别对象为红火蚁;若第一概率和第二概率均大于预设概率值,且第一概率小于第二概率,则确定待识别对象为红火蚁蚁巢。
102.可选的,分类模块103还用于若第一概率和第二概率均小于预设概率值,则调用预设的识别模型对待识别图像进行识别,获取待识别对象的类别。
103.可选的,图像分类装置100还包括构建模块104,该构建模块104用于获取预设个数的训练图样及各训练图样对应的图像特征,训练图样包括红火蚁图样和红火蚁蚁巢图样;对训练图样进行均值聚类,获取每个训练图样对应的分类标签向量和隶属概率;根据分类标签向量对各训练图样进行分类,以判断该训练图样为红火蚁图样或红火蚁蚁巢图样;利用第一训练集对初始第一神经网络进行训练,得到第一神经网络;其中,第一训练集包括判断为红火蚁图样对应的图像特征,以及判断为红火蚁图样对应的隶属概率。
104.可选的,构建模块104还用于利用第二训练集对初始第二神经网络进行训练,得到第二神经网络;其中,第二训练集包括判断为红火蚁蚁巢图样对应的图像特征,以及判断为红火蚁蚁巢图样对应的隶属概率。
105.可选的,构建模块104具体用于获取预设个数的收集图像,收集图像包括红火蚁图像和红火蚁蚁巢图像;对每个收集图像依次进行低帽变换和二值化处理,得到预设个数的二值化图像;对每个二值化图像进行分割,得到训练图样。
106.可选的,构建模块104具体用于s301:将训练图样聚类到两个类中,得到各训练图样对应的分类标签向量,两个类为红火蚁和红火蚁蚁巢;s302:采用拉格朗日乘子法求解预设的代价函数,得到聚类中心点的方程和隶属概率矩阵的方程,其中,隶属概率矩阵表征每个训练图样聚类到对应的类中的概率,且隶属概率矩阵包括各训练图样对应的隶属概率;s303:更新初始化隶属概率矩阵和聚类中心点,根据更新后的隶属概率矩阵值与上一次更新后的隶属概率矩阵值计算误差值,重复步骤s303,直到误差值小于预设的误差阈值,得到各训练图样对应的隶属概率。
107.请参阅图5,基于同一发明构思,本技术实施例还提供一种分类模型的训练装置200,该装置200包括:第二获取模块201、第二处理模块202和训练模块203。
108.第二获取模块201,用于获取预设个数的训练图样及各训练图样对应的图像特征,训练图样包括第一对象图样和第二对象图样。
109.第二处理模块202,用于对训练图样进行均值聚类,获取每个训练图样对应的分类标签向量和隶属概率;根据分类标签向量对各训练图样进行分类,以判断该训练图样为第一对象图样或第二对象图样;训练模块203,用于利用第一训练集对初始第一神经网络进行训练,得到第一神经网络;其中,第一训练集包括判断为第一对象图样对应的图像特征,以及判断为第一对象图样对应的隶属概率;利用第二训练集对初始第二神经网络进行训练,得到第二神经网络;其中,第二训练集包括判断为第二对象图样对应的图像特征,以及判断为第二对象图样对应的隶属概率;其中,分类层用于根据第一神经网络输出的第一概率、第二神经网络输出的第
二概率和预设概率值之间的大小关系,确定待识别图像中待识别对象的类别。
110.可选的,第二获取模块201具体用于获取预设个数的收集图像,收集图像包括第一对象图像和第二对象图像;对每个收集图像依次进行低帽变换和二值化处理,得到预设个数的二值化图像;对每个二值化图像进行分割,得到训练图样。
111.可选的,第二获取模块201具体用于对每个收集图像均进行灰度化处理,得到灰度化处理后的各收集图像;对灰度化处理后的各收集图像均使用预设半径值的圆形模板进行膨胀处理,得到膨胀处理后的各收集图像;对膨胀处理后的各收集图像均使用预设半径值的圆形模板进行腐蚀处理,得到腐蚀处理后的各收集图像;将腐蚀处理后的各收集图像减去与其对应的各收集图像,得到对各收集图像进行低帽变换后的图像。
112.可选的,第二处理模块202用于s401:将训练图样聚类到两个类中,得到各训练图样对应的分类标签向量,两个类为第一对象和第二对象;s402:采用拉格朗日乘子法求解预设的代价函数,得到聚类中心点的方程和隶属概率矩阵的方程,其中,隶属概率矩阵表征每个训练图样聚类到对应的类中的概率,且隶属概率矩阵包括各训练图样对应的隶属概率;s403:更新初始化隶属概率矩阵和聚类中心点,根据更新后的隶属概率矩阵值与上一次更新后的隶属概率矩阵值计算误差值,重复步骤s403,直到误差值小于预设的误差阈值,得到各训练图样对应的隶属概率。
113.可选的,第一神经网络包括输入层、隐藏层和输出层,训练模块203具体用于s501:将判断为第一对象图样对应的图像特征输入输入层;s502:根据该图像特征、输入层和隐藏层的各连接权值及隐藏层阈值,计算隐藏层的输出;s503:根据隐藏层的输出、隐藏层和输出层的各连接权值及输出层的阈值,计算输出层的输出,得到输出层输出的概率值;s504:根据概率值与该第一对象图样对应的隶属概率计算损失值,并根据损失值调整第一神经网络的各参数值;重复步骤s502-s504,直至损失值处于预设范围或者满足预设迭代次数,获得最终的各参数值,其中,各参数值包括输入层和隐藏层的各连接权值、隐藏层和输出层的各连接权值、隐藏层阈值和输出层的阈值。
114.可选的,第二神经网络包括输入层、隐藏层和输出层,训练模块203具体用于s601:将判断为第二对象图样对应的图像特征输入输出层;s602:根据该图像特征、输入层和隐藏层的各连接权值及隐藏层阈值,计算隐藏层的输出;s603:根据隐藏层的输出、隐藏层和输出层的各连接权值及输出层的阈值,计算输出层的输出,得到输出层输出的概率值;s604:根据概率值与该第二对象图样对应的隶属概率计算损失值,并根据损失值调整第二神经网络的各参数值;重复步骤s602-s604,直至损失值处于预设范围或者满足预设迭代次数,获得最终的各参数值,其中,各参数值包括输入层和隐藏层的各连接权值、隐藏层和输出层的各连接权值、隐藏层阈值和输出层的阈值。
115.请参阅图6,基于同一发明构思,本技术实施例提供的一种电子设备300的示意性结构框图,该电子设备300可用于实施上述的一种图像分类方法,或用于实施上述的一种分类模型的训练方法。本技术实施例中,电子设备300可以是,但不限于个人计算机(personal computer,pc)、智能手机、平板电脑、个人数字助理(personal digital assistant,pda)、移动上网设备(mobile internet device,mid)等。在结构上,电子设备300可以包括处理器310和存储器320。
116.处理器310与存储器320直接或间接地电性连接,以实现数据的传输或交互,例如,
这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。其中,处理器310可以是一种集成电路芯片,具有信号处理能力。处理器310也可以是通用处理器,例如,可以是中央处理器(central processing unit,cpu)、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit ,asic)、分立门或晶体管逻辑器件、分立硬件组件,可以实现或者执行本技术实施例中的公开的各方法、步骤及逻辑框图。此外,通用处理器可以是微处理器或者任何常规处理器等。
117.存储器320可以是,但不限于,随机存取存储器(random access memory,ram)、只读存储器(read only memory,rom)、可编程只读存储器(programmable read-only memory,prom)、可擦可编程序只读存储器(erasable programmable read-only memory,eprom),以及电可擦编程只读存储器(electric erasable programmable read-only memory,eeprom)。存储器320用于存储程序,处理器310在接收到执行指令后,执行该程序。
118.应当理解,图6所示的结构仅为示意,本技术实施例提供的电子设备300还可以具有比图6更少或更多的组件,或是具有与图6所示不同的配置。此外,图6所示的各组件可以通过软件、硬件或其组合实现。
119.需要说明的是,由于所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
120.基于同一发明构思,本技术实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序在被运行时执行上述实施例中提供的方法。
121.该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solid state disk (ssd))等。
122.在本技术所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
123.另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
124.再者,在本技术各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
125.在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
126.以上所述仅为本技术的实施例而已,并不用于限制本技术的保护范围,对于本领
域的技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献