用于图像识别模型的训练方法及其装置、图像识别方法与流程

2023-02-10 17:25:29 来源：中国专利 TAG：

1.本公开涉及图像识别技术领域，特别涉及一种用于图像识别模型的训练方法及其装置、图像识别方法。

背景技术：

2.在图像识别领域的模型训练阶段，会存在数据不平衡问题，这是指数据集中的各个类别的样本数目极不平衡。这是一个较难解决的问题，并且广泛分布于现实中的数据收集中。目前，解决数据不平衡的方案主要分为两种，一种方案是从数据层面解决该问题，另一种方案是从损失函数层面解决该问题。
3.在数据层面，通常通过对数据进行欠采样、过采样或者数据增强的方式来对数据进行扩充，以期能够缓解模型对少样本类别的学习问题。欠采样和过采样是通过改变样本被采样的概率，使少样本类别的样本能够被多次训练来改善少样本识别率较差的问题。数据增强是通过对少样本类别的样本添加噪声来对少样本类别的数据进行扩充，噪声的添加分为多种，比如：旋转、翻转等。这些对数据的操作确实可以在一定程度上缓解样本不平衡问题，但是这些简单的操作可能会造成信息丢失或者导致模型在少样本类别上过拟合。
4.在损失函数层面，通常通过改进损失函数来着重惩罚少样本类别的损失。对少样本类别的损失着重加权，可以在一定程度上缓解少样本类别的识别问题。但是，加权的参数往往需要根据经验或者模型训练来获得，在不同的任务上往往需要进行大量实验进行参数搜索，而且同一套参数无法泛化到所有任务。

技术实现要素：

5.提供该发明内容部分以便以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。
6.根据本公开的一些实施例，提供了一种用于图像识别模型的训练方法，包括：获得多个类别的图像样本；将每个类别的图像样本输入到图像识别模型的特征提取层中，以提取每个图像样本的特征向量；根据每个类别的所述每个图像样本的特征向量，计算与所述每个类别对应的实际分布函数的统计特征信息；根据与所述每个类别对应的实际分布函数的统计特征信息，建立与所述每个类别对应的增广分布函数；基于与所述每个类别对应的增广分布函数获得所述每个类别的增广样本特征；以及将所述图像样本的特征向量和所述增广样本特征输入到所述图像识别模型的分类层中进行监督学习。
7.根据本公开的另一些实施例，提供了一种图像识别方法，包括：向图像识别模型输入待识别图像，其中，所述图像识别模型通过如前所述的训练方法进行训练；以及利用所述图像识别模型对所述待识别图像进行识别并输出图像识别结果。
8.根据本公开的另一些实施例，提供了一种用于图像识别模型的训练装置，包括：第一获取单元，用于获得多个类别的图像样本；特征提取单元，用于将每个类别的图像样本输
入到图像识别模型的特征提取层中，以提取每个图像样本的特征向量；计算单元，用于根据每个类别的所述每个图像样本的特征向量，计算与所述每个类别对应的实际分布函数的统计特征信息；增广分布函数建立单元，用于根据与所述每个类别对应的实际分布函数的统计特征信息，建立与所述每个类别对应的增广分布函数；第二获取单元，基于所述每个类别对应的增广分布函数获得所述每个类别的增广样本特征；以及监督学习单元，用于将所述图像样本的特征向量和所述增广样本特征输入到所述图像识别模型的分类层中进行监督学习。
9.根据本公开的另一些实施例，提供了一种图像识别装置，包括：输入单元，用于向图像识别模型输入待识别图像，其中，所述图像识别模型通过如前所述的训练方法进行训练；以及识别单元，用于利用所述图像识别模型对所述待识别图像进行识别并输出图像识别结果。
10.根据本公开的另一些实施例，提供了一种电子设备，包括：存储器；以及耦接至所述存储器的处理器，所述处理器被配置为基于存储在所述存储器的指令执行本公开中所述的任一实施例的方法。
11.根据本公开的另一些实施例，提供了一种计算机可读存储介质，其上存储有计算机程序指令，该计算机程序指令被处理器执行时实现本公开中所述的任一实施例的方法。
12.通过以下参照附图对本公开的示例性实施例的详细描述，本公开的其它特征、方面及其优点将会变得清楚。
附图说明
13.下面参照附图说明本公开的优选实施例。此处所说明的附图用来提供对本公开的进一步理解，各附图连同下面的具体描述一起包含在本说明书中并形成说明书的一部分，用于解释本公开。应当理解的是，下面描述中的附图仅仅涉及本公开的一些实施例，而非对本公开构成限制。在附图中：
14.图1是示出根据本公开一些实施例的用于图像识别模型的训练方法的流程图；
15.图2是示出根据本公开一些实施例的图像识别方法的流程图；
16.图3是示出根据本公开一些实施例的用于图像识别模型的训练装置的结构示意图；
17.图4是示出根据本公开一些实施例的图像识别装置的结构示意图；
18.图5是示出根据本公开一些实施例的电子设备的结构示意图；
19.图6是示出根据本公开另一些实施例的电子设备的结构示意图；
20.图7是示出根据本公开一些实施例的图像识别模型的结构示意图。
21.应当明白，为了便于描述，附图中所示出的各个部分的尺寸并不一定是按照实际的比例关系绘制的。在各附图中使用了相同或相似的附图标记来表示相同或者相似的部件。因此，一旦某一项在一个附图中被定义，则在随后的附图中可能不再对其进行进一步讨论。
具体实施方式
22.下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完
整地描述，但是显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。以下对实施例的描述实际上也仅仅是说明性的，决不作为对本公开及其应用或使用的任何限制。应当理解的是，本公开可以通过各种形式来实现，而且不应该被解释为限于这里阐述的实施例。
23.应当理解，本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行，和/或并行执行。此外，方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值应被解释为仅仅是示例性的，不限制本公开的范围。
24.本公开中使用的术语“包括”及其变型意指至少包括后面的元件/特征、但不排除其他元件/特征的开放性术语，即“包括但不限于”。此外，本公开使用的术语“包含”及其变型意指至少包含后面的元件/特征、但不排除其他元件/特征的开放性术语，即“包含但不限于”。因此，包括与包含是同义的。术语“基于”意指“至少部分地基于”。
25.整个说明书中所称“一个实施例”、“一些实施例”或“实施例”意味着与实施例结合描述的特定的特征、结构或特性被包括在本发明的至少一个实施例中。例如，术语“一个实施例”表示“至少一个实施例”；术语“另一实施例”表示“至少一个另外的实施例”；术语“一些实施例”表示“至少一些实施例”。而且，短语“在一个实施例中”、“在一些实施例中”或“在实施例中”在整个说明书中各个地方的出现不一定全都指的是同一个实施例，但是也可以指同一个实施例。
26.需要注意，本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分，并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。除非另有指定，否则“第一”、“第二”等概念并非意图暗示如此描述的对象必须按时间上、空间上、排名上的给定顺序或任何其他方式的给定顺序。
27.需要注意，本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的，本领域技术人员应当理解，除非在上下文另有明确指出，否则应该理解为“一个或多个”。
28.本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的，而并不是用于对这些消息或信息的范围进行限制。
29.下面结合附图对本公开的实施例进行详细说明，但是本公开并不限于这些具体的实施例。下面这些具体实施例可以相互结合，对于相同或者相似的概念或过程可能在某些实施例不再赘述。此外，在一个或多个实施例中，特定的特征、结构或特性可以由本领域的普通技术人员从本公开将清楚的任何合适的方式组合。
30.应理解，本公开对于如何获得待应用/待处理的图像也不做限制。在本公开的一个实施例中，可以从存储装置，例如内部存储器或者外部存储装置获取，在本公开的另一个实施例中，可以调动摄影组件来拍摄。需要说明的是，所获取的图像可以是一张采集到的图像，也可以是采集到的视频中的一帧图像，并不特别局限于此。
31.在本公开的上下文中，图像可指的是多种图像中的任一种，诸如彩色图像、灰度图像等。应指出，在本说明书的上下文中，图像的类型未被具体限制。此外，图像可以是任何适当的图像，例如由摄像装置获得的原始图像，或者已对原始图像进行过特定处理的图像，例如初步过滤、去混叠、颜色调整、对比度调整、规范化等等。应指出，预处理操作还可以包括本领域已知的其它类型的预处理操作，这里将不再详细描述。
32.本公开解决的技术问题之一是提升少样本类别的样本数量，从而提高模型训练的准确率。
33.鉴于此，本公开提供了根据本公开一些实施例的用于图像识别模型的训练方法。下面结合附图详细描述该用于图像识别模型的训练方法。
34.图1是示出根据本公开一些实施例的用于图像识别模型的训练方法的流程图。该训练方法包括步骤s102至s112。图7是示出根据本公开一些实施例的图像识别模型的结构示意图。下面结合图1和图7详细描述该训练方法。
35.如图1所示，在步骤s102，获得多个类别的图像样本。
36.在一些实施例中，该步骤s102包括：对在同一属性下的多个类别的图像样本进行采样，以获得每个类别的至少部分的图像样本。例如，在该多个类别中采集得到的每个类别的图像样本的数量基本相等。即，对各个类别进行类均衡采样。
37.需要说明的是，这里的“基本相等”包括但不限于绝对的相等，而是可以稍微不相等。例如，第一类别具有200个图像样本，第二类别具有2000个图像样本，从第一类别的200个图像样本中采集150个样本，从第二类别的2000个图像样本中采集200个样本，则可以认为从第一类别采集的样本数量与从第二类别采集的样本数量基本相等。也就是说，在一些实施例中，采集得到的不同类别的图像样本的数量可以存着一定的差异，只要该差异在预定的范围内即可，或者说，只要该差异在可以接受的范围内即可。当然，本领域技术人员能够理解，这里关于样本数量的举例仅是示例性的，并不作为对本公开的样本数量的限制。
38.在一些实施例中，对在同一属性下的多个类别的图像样本进行采样的步骤包括：如果上述多个类别中的第一类别所具有的图像样本的实际数量小于对该第一类别采集的图像样本的计划数量，则对该第一类别的至少部分图像样本进行重复采样。
39.例如，多个类别中的第一类别具有200个图像样本，当计划从第一类别中采集300个图像样本时，由于第一类别所具有的图像样本的实际数量小于对该第一类别采集的图像样本的计划数量，则可以在全部采集完这200个图像样本后，对这200个图像样本中的部分图像样本(例如这200个图像样本中的100个图像样本)进行重复采样，从而满足300个图像样本的计划数量。
40.在一些实施例中，对在同一属性下的多个类别的图像样本进行采样的步骤包括：如果多个类别中的第二类别所具有的图像样本的实际数量等于对该第二类别采集的图像样本的计划数量，则采集该第二类别的全部图像样本。
41.例如，多个类别中的第二类别具有300个图像样本，当计划从第二类别中采集300个图像样本时，由于第二类别所具有的图像样本的实际数量正好等于对该第二类别采集的图像样本的计划数量，则采集该第二类别的全部图像样本。
42.在一些实施例中，对在同一属性下的多个类别的图像样本进行采样的步骤包括：如果多个类别中的第三类别所具有的图像样本的实际数量大于对该第三类别采集的图像样本的计划数量，则采集该第三类别的部分图像样本。
43.例如，多个类别中的第三类别具有2000个图像样本，当计划从第三类别中采集300个图像样本时，由于第三类别所具有的图像样本的实际数量大于对该第三类别采集的图像样本的计划数量，则采集该第三类别的部分图像样本。例如，可以从第三类别的2000个图像样本中随机采集300个图像样本。
44.在一些实施例中，上述图像识别模型用于人脸识别领域。在这样的情况下，上述属性表示人脸的某个部位。例如，上述属性包括眼睛、眉毛、鼻子等。上述类别为人脸的该某个部位的外形类别。例如，眼睛可以分别大、中、小等三个类别，眉毛可以分为粗、中、细等三个类别、鼻子分为高、中、低等三个类别，等等。图像样本包括人脸的该某个部位的图像样本。例如，图像样本可以包括眼睛的图像样本、眉毛的图像样本或鼻子的图像样本，等等。
45.在步骤s104，将每个类别的图像样本输入到图像识别模型的特征提取层(如图7所示的特征提取层702)中，以提取每个图像样本的特征向量。
46.即，在该步骤中，将通过步骤s102获得的每个类别的图像样本输入到图像识别模型中，通过图像识别模型的特征提取层提取出每个图像样本的特征向量。例如，图像识别模型为卷积神经网络。
47.在步骤s106中，根据每个类别的每个图像样本的特征向量，计算与该每个类别对应的实际分布函数的统计特征信息。
48.这里，对于通过步骤s102采集得到的每个类别的图像样本，这些图像样本的特征向量可以符合某种实际分布函数。例如，该实际分布函数为高斯分布函数。通过采用已知的计算方法，可以得到该实际分布函数的统计特征信息。
49.在一些实施例中，该统计特征信息包括第一统计特征信息和第二统计特征信息。例如，第一统计特征信息为实际分布函数的均值，第二统计特征信息为实际分布函数的方差或标准差。
50.例如，在实际分布函数为高斯分布函数的情况下，可以计算得到与每个类别对应的高斯分布函数的均值或方差(也可以是标准差)。例如，某个属性包括n个类别，n为正整数，则可以计算得到与每个类别i(1≤i≤n，且i为正整数)对应的均值μi和方差(或者标准差σi)。
51.在本公开的实施例中，某个类别i的均值是表征该类别i的本质信息，该类别的方差(或标准差)表示该类别内样本的多样性，并不代表类别信息，这种多样性是可以迁移的。
52.单一属性分类任务的各个类别是同质的。例如，眼睛的大、中、小都是代表眼睛大小的类别，可以认为单一属性下各个类别的分布是相似的，关注的重点都是眼睛的大小。
53.在步骤s108中，根据与每个类别对应的实际分布函数的统计特征信息，建立与该每个类别对应的增广分布函数。例如，该增广分布函数的函数类型与该实际分布函数的函数类型相同。例如，实际分布函数和增广分布函数均为高斯分布函数。
54.在一些实施例中，步骤s108包括：计算与多个类别对应的实际分布函数的第二统计特征信息的平均值；以及以第二统计特征信息的平均值和每个类别的第一统计特征信息作为统计特征参数，建立与该每个类别对应的增广分布函数。
55.例如，第二统计特征信息为方差，可以计算与n个类别对应的高斯分布函数的方差的平均值(该方差的平均值可以近似代表这一属性的多样性，可以称为类别平均方差)；然后以该方差的平均值作为某个类别i的新方差，以及以该类别i的均值μi作为均值，建立与该类别i对应的新的高斯分布函数，作为该类别i的增广分布函数。
56.又例如，第二统计特征信息为标准差，可以计算与n个类别对应的高斯分布函数的
标准差的平均值然后以该标准差的平均值作为某个类别i的新标准差，以及以该类别i的均值μi作为均值，建立与该类别i对应的新的高斯分布函数，作为该类别i的增广分布函数。
57.在步骤s110中，基于与每个类别对应的增广分布函数获得该每个类别的增广样本特征。
58.在一些实施例中，该步骤s110包括：对每个类别对应的增广分布函数进行采样，获得对应的每个类别的增广样本特征。这里，该增广样本特征即为增广样本特征向量。
59.在一些实施例中，采集得到的每个类别的图像样本的数目与该每个类别的增广样本特征的数目相等。例如，在执行步骤s102的过程中，从每个类别中采集了300个图像样本，则在执行步骤s110的过程中，从每个类别的增广分布函数中也采集300个样本。这样，在后续训练的过程中，在提升少样本类别的多样性和泛化能力的同时，基本不会影响多样本类别的识别。
60.经过上面的步骤，通过增广操作获取了增广样本特征，如图7所示。
61.在步骤s112中，将图像样本的特征向量和增广样本特征输入到图像识别模型的分类层(如图7所示的分类层704)中进行监督学习。
62.在一些实施例中，步骤s112包括：将图像样本的特征向量和增广样本特征输入到图像识别模型的分类层704中以输出与图像样本和增广样本对应的图像识别结果；根据图像识别结果与图像样本和增广样本的标注值的差异计算损失函数值；以及根据损失函数值调整图像识别模型的参数。
63.可以重复执行上述步骤以满足训练结束条件。例如，该训练结束条件可以是训练次数阈值或损失函数值小于函数阈值。即，当训练次数达到训练次数阈值时结束训练，或者当经过循环调整，使得损失函数值小于函数阈值时结束训练。
64.至此，提供了根据本公开一些实施例的用于图像识别模型的训练方法。该训练方法包括：获得多个类别的图像样本；将每个类别的图像样本输入到图像识别模型的特征提取层中，以提取每个图像样本的特征向量；根据每个类别的每个图像样本的特征向量，计算与每个类别对应的实际分布函数的统计特征信息；根据与每个类别对应的实际分布函数的统计特征信息，建立与该每个类别对应的增广分布函数；基于每个类别对应的增广分布函数获得每个类别的增广样本特征；以及将图像样本的特征向量和增广样本特征输入到图像识别模型的分类层中进行监督学习。该训练方法能够提升少样本类别的样本数量，缓解样本不均衡问题，从而提高模型训练的准确率。
65.上述方法在特征层面利用多样本类别的分布先验对少样本类别数据进行数据增广，从而优化少样本类别的识别准确率。对于单一人脸属性的识别任务而言，数据的不平衡是经常存在的问题，在数据收集过程中几乎无法收集数据多样性强并且类别平衡的数据集。在某些极端的情况下，甚至会造成数据严重不平衡，导致训练过程中模型偏差严重，几乎无法使用。对于这些少样本类别，本公开的上述方法为这些少样本类别添加增广样本来提升少样本的识别准确率，增强少样本的泛化能力。对于多样本类别，由于自身样本的多样性，因此，上述方法的数据增广方式在提升少样本类别的多样性和泛化能力的同时，基本不会影响多样本类别的识别，这样减少对多样本类别识别准确率的损害。
66.图2是示出根据本公开一些实施例的图像识别方法的流程图。如图2所示，该图像识别方法包括步骤s202至s204。
67.在步骤s202，向图像识别模型输入待识别图像。该图像识别模型通过如前所述的训练方法进行训练。
68.在步骤s204，利用图像识别模型对待识别图像进行识别并输出图像识别结果。
69.至此，提供了根据本公开一些实施例的图像识别方法。由于该图像识别方法中采用的图像识别模型已经通过如前所述的训练方法进行训练，因此在利用该图像识别模型对待识别图像进行识别的过程中，可以提高图像识别的准确率。
70.图3是示出根据本公开一些实施例的用于图像识别模型的训练装置的结构示意图。如图3所示，该训练装置包括第一获取单元302、特征提取单元304、计算单元306、增广分布函数建立单元308、第二获取单元310和监督学习单元312。
71.第一获取单元302用于获得多个类别的图像样本。例如，第一获取单元302用于对在同一属性下的多个类别的图像样本进行采样，以获得每个类别的至少部分的图像样本。
72.例如，在多个类别中采集得到的每个类别的图像样本的数量基本相等。
73.在一些实施例中，第一获取单元302用于如果所述多个类别中的第一类别所具有的图像样本的实际数量小于对该第一类别采集的图像样本的计划数量，则对该第一类别的至少部分图像样本进行重复采样。
74.在另一些实施例中，第一获取单元302还用于如果所述多个类别中的第二类别所具有的图像样本的实际数量等于对该第二类别采集的图像样本的计划数量，则采集该第二类别的全部图像样本。
75.在另一些实施例中，第一获取单元302还用于如果所述多个类别中的第三类别所具有的图像样本的实际数量大于对该第三类别采集的图像样本的计划数量，则采集该第三类别的部分图像样本。
76.特征提取单元304用于将每个类别的图像样本输入到图像识别模型的特征提取层中，以提取每个图像样本的特征向量。
77.计算单元306用于根据每个类别的每个图像样本的特征向量，计算与该每个类别对应的实际分布函数的统计特征信息。
78.在一些实施例中，统计特征信息包括第一统计特征信息和第二统计特征信息。例如，第一统计特征信息为实际分布函数的均值，第二统计特征信息为实际分布函数的方差或标准差。
79.增广分布函数建立单元308用于根据与每个类别对应的实际分布函数的统计特征信息，建立与该每个类别对应的增广分布函数。例如，增广分布函数的函数类型与实际分布函数的函数类型相同。例如，实际分布函数和增广分布函数均为高斯分布函数。
80.在一些实施例中，增广分布函数建立单元308用于计算与多个类别对应的实际分布函数的第二统计特征信息的平均值，以及以第二统计特征信息的平均值和每个类别的第一统计特征信息作为统计特征参数，建立与每个类别对应的增广分布函数。
81.第二获取单元310用于基于每个类别对应的增广分布函数获得每个类别的增广样本特征。例如，第二获取单元310用于对每个类别对应的增广分布函数进行采样，获得对应的每个类别的增广样本特征。
82.在一些实施例中，第一获取单元302采集得到的每个类别的图像样本的数目与第二获取单元310获得的每个类别的增广样本特征的数目相等。
83.监督学习单元312用于将图像样本的特征向量和增广样本特征输入到图像识别模型的分类层中进行监督学习。
84.在一些实施例中，监督学习单元312用于将图像样本的特征向量和增广样本特征输入到图像识别模型的分类层中以输出与图像样本和增广样本对应的图像识别结果，根据图像识别结果与图像样本和增广样本的标注值的差异计算损失函数值，以及根据损失函数值调整图像识别模型的参数。
85.至此，提供了根据本公开一些实施例的用于图像识别模型的训练装置。该训练装置能够提升少样本类别的样本数量，缓解样本不均衡问题，从而提高模型训练的准确率。
86.图4是示出根据本公开一些实施例的图像识别装置的结构示意图。如图4所示，该图像识别装置包括输入单元402和识别单元404。
87.输入单元402用于向图像识别模型输入待识别图像。该图像识别模型通过如前所述的训练方法进行训练。
88.识别单元404用于利用图像识别模型对待识别图像进行识别并输出图像识别结果。
89.至此，提供了根据本公开一些实施例的图像识别装置。由于该图像识别装置中采用的图像识别模型已经通过如前所述的训练方法进行训练，因此在利用该图像识别模型对待识别图像进行识别的过程中，可以提高图像识别的准确率。
90.应注意，上述各个单元仅是根据其所实现的具体功能划分的逻辑模块，而不是用于限制具体的实现方式，例如可以以软件、硬件或者软硬件结合的方式来实现。在实际实现时，上述各个单元可被实现为独立的物理实体，或者也可由单个实体(例如，处理器(cpu或dsp等)、集成电路等)来实现。此外，上述各个单元所实现的操作/功能可由处理电路本身来实现。
91.此外，尽管未示出，该设备也可以包括存储器，其可以存储由设备、设备所包含的各个单元在操作中产生的各种信息、用于操作的程序和数据、将由通信单元发送的数据等。存储器可以是易失性存储器和/或非易失性存储器。例如，存储器可以包括但不限于随机存储存储器(ram)、动态随机存储存储器(dram)、静态随机存取存储器(sram)、只读存储器(rom)、闪存存储器。当然，存储器可也位于该设备之外。可选地，尽管未示出，但是该设备也可以包括通信单元，其可用于与其它装置进行通信。在一个示例中，通信单元可以被按照本领域已知的适当方式来实现，例如包括天线阵列和/或射频链路等通信部件，各种类型的接口、通信单元等等。这里将不再详细描述。此外，设备还可以包括未示出的其它部件，诸如射频链路、基带处理单元、网络接口、处理器、控制器等。这里将不再详细描述。
92.本公开的一些实施例还提供一种电子设备。图5示出本公开的电子设备的一些实施例的框图。例如，在一些实施例中，电子设备5可以为各种类型的设备，例如可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、pda(个人数字助理)、pad(平板电脑)、pmp(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字tv、台式计算机等等的固定终端。例如，电子设备5可以包括显示面板，以用于显示根据本公开的方案中所利用的数据和/或执行结果。例如，显示面板可以为各种形状，例如矩形面板、
椭圆形面板或多边形面板等。另外，显示面板不仅可以为平面面板，也可以为曲面面板，甚至球面面板。
93.如图5所示，该实施例的电子设备5包括：存储器51以及耦接至该存储器51的处理器52。应当注意，图5所示的电子设备5的组件只是示例性的，而非限制性的，根据实际应用需要，该电子设备5还可以具有其他组件。处理器52可以控制电子设备5中的其它组件以执行期望的功能。
94.在一些实施例中，存储器51用于存储一个或多个计算机可读指令。处理器52用于运行计算机可读指令时，计算机可读指令被处理器52运行时实现根据上述任一实施例所述的方法。关于该方法的各个步骤的具体实现以及相关解释内容可以参见上述的实施例，重复之处在此不作赘述。
95.例如，处理器52和存储器51之间可以直接或间接地互相通信。例如，处理器52和存储器51可以通过网络进行通信。网络可以包括无线网络、有线网络、和/或无线网络和有线网络的任意组合。处理器52和存储器51之间也可以通过系统总线实现相互通信，本公开对此不作限制。
96.例如，处理器52可以体现为各种适当的处理器、处理装置等，诸如中央处理器(cpu)、图形处理器(graphics processing unit，gpu)、网络处理器(np)等；还可以是数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。中央处理元(cpu)可以为x86或arm架构等。例如，存储器51可以包括各种形式的计算机可读存储介质的任意组合，例如易失性存储器和/或非易失性存储器。存储器51例如可以包括系统存储器，系统存储器例如存储有操作系统、应用程序、引导装载程序(boot loader)、数据库以及其他程序等。在存储介质中还可以存储各种应用程序和各种数据等。
97.另外，根据本公开的一些实施例，根据本公开的各种操作/处理在通过软件和/或固件实现的情况下，可从存储介质或网络向具有专用硬件结构的计算机系统，例如图6所示的计算机系统600安装构成该软件的程序，该计算机系统在安装有各种程序时，能够执行各种功能，包括诸如前文所述的功能等等。图6是示出根据本公开的实施例的中可采用的计算机系统的示例结构的框图。
98.在图6中，中央处理单元(cpu)601根据只读存储器(rom)602中存储的程序或从存储部分608加载到随机存取存储器(ram)603的程序执行各种处理。在ram 603中，也根据需要存储当cpu 601执行各种处理等时所需的数据。中央处理单元仅仅是示例性的，其也可以是其它类型的处理器，诸如前文所述的各种处理器。rom 602、ram 603和存储部分608可以是各种形式的计算机可读存储介质，如下文所述。需要注意的是，虽然图6中分别示出了rom 602、ram 603和存储装置608，但是它们中的一个或多个可以合并或者位于相同或不同的存储器或存储模块中。
99.cpu 601、rom 602和ram 603经由总线604彼此连接。输入/输出接口605也连接到总线604。
100.下述部件连接到输入/输出接口605：输入部分606，诸如触摸屏、触摸板、键盘、鼠标、图像传感器、麦克风、加速度计、陀螺仪等；输出部分607，包括显示器，比如阴极射线管(crt)、液晶显示器(lcd)，扬声器，振动器等；存储部分608，包括硬盘，磁带等；和通信部分
609，包括网络接口卡比如lan卡、调制解调器等。通信部分609允许经由网络比如因特网执行通信处理。容易理解的是，虽然图6中示出电子设备600中的各个装置或模块是通过总线604来通信的，但它们也可以通过网络或其它方式进行通信，其中，网络可以包括无线网络、有线网络、和/或无线网络和有线网络的任意组合。
101.根据需要，驱动器610也连接到输入/输出接口605。可拆卸介质611比如磁盘、光盘、磁光盘、半导体存储器等等根据需要被安装在驱动器610上，使得从中读出的计算机程序根据需要被安装到存储部分608中。
102.在通过软件实现上述系列处理的情况下，可以从网络比如因特网或存储介质比如可拆卸介质611安装构成软件的程序。
103.根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分609从网络上被下载和安装，或者从存储部分608被安装，或者从rom 602被安装。在该计算机程序被cpu 601执行时，执行本公开实施例的方法中限定的上述功能。
104.需要说明的是，在本公开的上下文中，计算机可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是，但不限于：电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中，计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：电线、光缆、rf(射频)等等，或者上述的任意合适的组合。
105.上述计算机可读介质可以是上述电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。
106.在一些实施例中，还提供了一种计算机程序，包括：指令，指令当由处理器执行时使处理器执行上述任一个实施例的方法。例如，指令可以体现为计算机程序代码。
107.在本公开的实施例中，可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码，上述程序设计语言包括但不限于面向对象的程序设计语言，诸如java、smalltalk、c ，还包括常规的过程式程序设计语言，诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作
为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络(包括局域网(lan)或广域网(wan))连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
108.附图中的流程图和框图，图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。
109.描述于本公开实施例中所涉及到的模块、部件或单元可以通过软件的方式实现，也可以通过硬件的方式来实现。其中，模块、部件或单元的名称在某种情况下并不构成对该模块、部件或单元本身的限定。
110.本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如，非限制性地，可以使用的示例性的硬件逻辑部件包括：现场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、片上系统(soc)、复杂可编程逻辑设备(cpld)等等。
111.根据本公开的一些实施例，提供了一种用于图像识别模型的训练方法，包括：获得多个类别的图像样本；将每个类别的图像样本输入到图像识别模型的特征提取层中，以提取每个图像样本的特征向量；根据每个类别的所述每个图像样本的特征向量，计算与所述每个类别对应的实际分布函数的统计特征信息；根据与所述每个类别对应的实际分布函数的统计特征信息，建立与所述每个类别对应的增广分布函数；基于与所述每个类别对应的增广分布函数获得所述每个类别的增广样本特征；以及将所述图像样本的特征向量和所述增广样本特征输入到所述图像识别模型的分类层中进行监督学习。
112.在一些实施例中，所述统计特征信息包括第一统计特征信息和第二统计特征信息；建立与每个类别对应的增广分布函数的步骤包括：计算与所述多个类别对应的实际分布函数的第二统计特征信息的平均值；以及以所述第二统计特征信息的平均值和每个类别的第一统计特征信息作为统计特征参数，建立与所述每个类别对应的增广分布函数。
113.在一些实施例中，所述第一统计特征信息为所述实际分布函数的均值，第二统计特征信息为所述实际分布函数的方差或标准差。
114.在一些实施例中，获得多个类别的图像样本的步骤包括：对在同一属性下的多个类别的图像样本进行采样，以获得每个类别的至少部分的图像样本。
115.在一些实施例中，在所述多个类别中采集得到的每个类别的图像样本的数量基本相等。
116.在一些实施例中，对在同一属性下的多个类别的图像样本进行采样的步骤包括：如果所述多个类别中的第一类别所具有的图像样本的实际数量小于对该第一类别采集的图像样本的计划数量，则对该第一类别的至少部分图像样本进行重复采样。
117.在一些实施例中，对在同一属性下的多个类别的图像样本进行采样的步骤包括：如果所述多个类别中的第二类别所具有的图像样本的实际数量等于对该第二类别采集的图像样本的计划数量，则采集该第二类别的全部图像样本。
118.在一些实施例中，对在同一属性下的多个类别的图像样本进行采样的步骤包括：如果所述多个类别中的第三类别所具有的图像样本的实际数量大于对该第三类别采集的图像样本的计划数量，则采集该第三类别的部分图像样本。
119.在一些实施例中，基于与所述每个类别对应的增广分布函数获得所述每个类别的增广样本特征的步骤包括：对每个类别对应的增广分布函数进行采样，获得对应的每个类别的增广样本特征。
120.在一些实施例中，采集得到的每个类别的图像样本的数目与所述每个类别的增广样本特征的数目相等。
121.在一些实施例中，所述实际分布函数和所述增广分布函数均为高斯分布函数。
122.在一些实施例中，所述属性表示人脸的某个部位；所述类别为所述人脸的该某个部位的外形类别；所述图像样本包括所述人脸的该某个部位的图像样本。
123.在一些实施例中，所述增广分布函数的函数类型与所述实际分布函数的函数类型相同。
124.在一些实施例中，所述图像识别模型为卷积神经网络。
125.根据本公开的另一些实施例，提供了一种图像识别方法，包括：向图像识别模型输入待识别图像，其中，所述图像识别模型通过如前所述的训练方法进行训练；以及利用所述图像识别模型对所述待识别图像进行识别并输出图像识别结果。
126.根据本公开的另一些实施例，提供了一种用于图像识别模型的训练装置，包括：第一获取单元，用于获得多个类别的图像样本；特征提取单元，用于将每个类别的图像样本输入到图像识别模型的特征提取层中，以提取每个图像样本的特征向量；计算单元，用于根据每个类别的所述每个图像样本的特征向量，计算与所述每个类别对应的实际分布函数的统计特征信息；增广分布函数建立单元，用于根据与所述每个类别对应的实际分布函数的统计特征信息，建立与所述每个类别对应的增广分布函数；第二获取单元，基于所述每个类别对应的增广分布函数获得所述每个类别的增广样本特征；以及监督学习单元，用于将所述图像样本的特征向量和所述增广样本特征输入到所述图像识别模型的分类层中进行监督学习。
127.根据本公开的另一些实施例，提供了一种图像识别装置，包括：输入单元，用于向图像识别模型输入待识别图像，其中，所述图像识别模型通过如前所述的训练方法进行训练；以及识别单元，用于利用所述图像识别模型对所述待识别图像进行识别并输出图像识别结果。
128.根据本公开的另一些实施例，提供了一种电子设备，包括：存储器；以及耦接至所述存储器的处理器，所述处理器被配置为基于存储在所述存储器的指令执行如前所述的方法。
129.根据本公开的另一些实施例，提供了一种计算机可读存储介质，其上存储有计算机程序指令，该计算机程序指令被处理器执行时实现如前所述的方法。
130.根据本公开的又一些实施例，提供计算机程序，包括：指令，指令当由处理器执行
时使处理器执行本公开中所述的任一实施例的方法。
131.根据本公开的一些实施例，提供一种计算机程序产品，包括指令，所述指令当由处理器执行时实现本公开中所述的任一实施例的方法。
132.以上描述仅为本公开的一些实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本公开中所涉及的公开范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述公开构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
133.在本文提供的描述中，阐述了许多特定细节。然而，理解的是，可以在没有这些特定细节的情况下实施本发明的实施例。在其他情况下，为了不模糊该描述的理解，没有对众所周知的方法、结构和技术进行详细展示。
134.此外，虽然采用特定次序描绘了各操作，但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下，多任务和并行处理可能是有利的。同样地，虽然在上面论述中包含了若干具体实现细节，但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地，在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
135.虽然已经通过示例对本公开的一些特定实施例进行了详细说明，但是本领域的技术人员应该理解，以上示例仅是为了进行说明，而不是为了限制本公开的范围。本领域的技术人员应该理解，可在不脱离本公开的范围和精神的情况下，对以上实施例进行修改。本公开的范围由所附权利要求来限定。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：用于对象属性分类模型训练的方法、设备和存储介质与流程

用于图像识别模型的训练方法及其装置、图像识别方法与流程

相关文献

最热文献