影像数据分类方法、计算机装置及可读存储介质与流程

2022-03-04 22:14:23 来源：中国专利 TAG：

1.本发明涉及一种影像处理技术领域，尤其涉及一种影像数据分类方法、计算机装置及可读存储介质。

背景技术：

2.机器学习领域通常需要收集大量影像作为训练样本，以根据影像的特征点进行学习。每个影像需要预先标记好特征点。当前，每个影像的特征点是由人工标记。一旦标记错误则影响机器学习的结果。

技术实现要素：

3.鉴于以上内容，有必要提供一种影像数据分类方法、计算机装置及可读存储介质，可根据多个标记者的标记结果对影像数据分类。
4.所述影像数据分类方法包括：将影像数据分配给n个标记者；收集所述n个标记者分别对所述影像数据所作的标记，由此获得所述影像数据所对应的n个标记；从所述n个标记中确定目标标记，并计算该目标标记的相同率；根据所述目标标记的相同率确定所述影像数据的质量，其中，当所述相同率大于第一预设值时，确定该影像数据的质量为第一级别；当所述相同率小于或等于所述第一预设值，但是大于第二预设值时，将所述影像数据重新分配给所述n个标记者进行标记；及当所述相同率小于或等于所述第二预设值时，确定该影像数据的质量为第二级别。
5.优选地，该影像数据分类方法还包括：当将所述影像数据重新分配给所述n个标记者进行标记时，将所述影像数据重新分配的次数加1，由此获得该影像数据重新分配的总次数；及当该影像数据重新分配的总次数达到预设值，且基于当前所述n个标记者分别对该影像数据所作的标记，所计算得到的目标标记的相同率仍然小于或等于所述第一预设值，但是大于所述第二预设值时，确定该影像数据的质量为所述第二级别。
6.优选地，所述收集所述n个标记者分别对所述影像数据所作的标记，由此获得所述影像数据所对应的n个标记包括：针对分配给任意一个标记者的影像数据，提示该任意一个标记者在该影像数据中圈出指定对象，所述任意一个标记者为所述n个标记者中的其中一个标记者；接收该任意一个标记者对所述影像数据的处理，获得经过该任意一个标记者处理的所述影像数据，其中，所述任意一个标记者对所述影像数据的处理包括在该影像数据中圈出所述指定对象；根据该任意一个标记者对所述影像数据的处理识别所述指定对象在所述影像数据中所占的影像区域；获取所述指定对象所占的影像区域的图像特征；将所获取的图像特征作为该任意一个标记者对所述影像数据所作的标记；及根据获取所述任意一个标记者对所述影像数据所作的标记的方法，获取所述n个标记者中除该任意一个标记者之外的其他n-1个标记者分别对所述影像数据所作的标记。
7.优选地，所述收集所述n个标记者分别对所述影像数据所作的标记，由此获得所述影像数据所对应的n个标记包括：针对分配给任意一个标记者的影像数据，生成一个输入界
面，提示该任意一个标记者在该输入界面为该影像数据设定一个标记，所述任意一个标记者为所述n个标记者中的其中一个标记者；从所述输入界面获取该任意一个标记者为该影像数据所设定的标记，由此获得该任意一个标记者对所述影像数据所作的标记；及根据获取所述任意一个标记者对所述影像数据所作的标记的方法，获取所述n个标记者中除该任意一个标记者之外的其他n-1个标记者分别对所述影像数据所作的标记。
8.优选地，所述收集所述n个标记者分别对所述影像数据所作的标记，由此获得所述影像数据所对应的n个标记包括：针对分配给任意一个标记者的影像数据，为所述影像数据设定多个选项，其中，所述多个选项分别对应不同的标记，所述任意一个标记者为所述n个标记者中的其中一个标记者；提示该任意一个标记者根据所述影像数据从所述多个选项中作出选择；将该任意一个标记者所选择的选项所对应的标记作为该任意一个标记者对所述影像数据所作的标记；及根据获取所述任意一个标记者对所述影像数据所作的标记的方法，获取所述n个标记者中除该任意一个标记者之外的其他n-1个标记者分别对所述影像数据所作的标记。
9.优选地，该影像数据分类方法还包括：获取质量为所述第一级别的多张影像数据；及将所述多张影像数据作为训练样本，利用该训练样本对神经网络进行训练，获得影像识别模型。
10.优选地，所述从所述n个标记中确定目标标记，并计算该目标标记的相同率包括：从所述n个标记中识别相同的标记，将相同的标记分类到同一个群组，由此获得多个群组；统计所述多个群组中的每个群组所包括的标记的总数；从所述多个群组中确定目标组，该目标组为所述多个群组中与最大总数值对应的群组，将所述目标组所对应的每个标记作为所述目标标记；及根据所述目标组所包括的所述目标标记的总数与所述n的值计算所述目标标记的相同率c，其中,c＝(m/n)*100％，其中,m代表所述目标组所包括的所述目标标记的总数。
11.所述计算机可读存储介质存储有至少一个指令，所述至少一个指令被处理器执行时实现所述的影像数据分类方法。
12.所述计算机装置包括存储器和至少一个处理器，所述存储器中存储有至少一个指令，所述至少一个指令被所述至少一个处理器执行时实现所述的影像数据分类方法。
13.相较于现有技术，所述影像数据分类方法、计算机装置及可读存储介质，可根据多个标记者的标记结果对影像数据分类。
附图说明
14.图1是本发明较佳实施例的计算机装置的架构图。
15.图2是本发明较佳实施例的影像数据分类系统的功能模块图。
16.图3是本发明较佳实施例的影像数据分类方法的流程图。
17.主要元件符号说明
18.计算机装置3存储器31处理器32影像数据分类系统30
分配模块301执行模块302
19.如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
20.为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施例对本发明进行详细描述。需要说明的是，在不冲突的情况下，本发明的实施例及实施例中的特征可以相互组合。
21.在下面的描述中阐述了很多具体细节以便于充分理解本发明，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
22.除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本发明。
23.参阅图1所示，为本发明较佳实施例提供的计算机装置的架构图。
24.本实施例中，计算机装置3包括，但不限于，互相之间电气连接的存储器31、至少一个处理器32。
25.本领域技术人员应该了解，图1示出的计算机装置3的结构并不构成本发明实施例的限定，所述计算机装置3还可以包括比图1更多或更少的其他硬件或者软件，或者不同的部件布置，例如，所述计算机装置3还可以包括显示屏。
26.需要说明的是，所述计算机装置3仅为举例，其他现有的或今后可能出现的计算机装置如可适应于本发明，也应包含在本发明的保护范围以内，并以引用方式包含于此。
27.在一些实施例中，所述存储器31可以用于存储计算机程序的程序代码和各种数据。例如，所述存储器31可以用于存储安装在所述计算机装置3中的影像数据分类系统30，并在计算机装置3的运行过程中实现高速、自动地完成程序或数据的存取。所述存储器31可以是包括只读存储器(read-only memory，rom)、可编程只读存储器(programmable read-only memory，prom)、可擦除可编程只读存储器(erasable programmable read-only memory，eprom)、一次可编程只读存储器(one-time programmable read-only memory，otprom)、电子擦除式可复写只读存储器(electrically-erasable programmable read-only memory，eeprom)、只读光盘(compact disc read-only memory，cd-rom)或其他光盘存储器、磁盘存储器、磁带存储器、或者任何其他能够用于携带或存储数据的非易失性的计算机可读的存储介质。
28.在一些实施例中，所述至少一个处理器32可以由集成电路组成。例如，可以由单个封装的集成电路所组成，也可以是由多个相同功能或不同功能封装的集成电路所组成，包括一个或者多个中央处理器(central processing unit，cpu)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述至少一个处理器32是所述计算机装置3的控制核心(control unit)，利用各种接口和线路连接整个计算机装置3的各个部件，通过执行存储在所述存储器31内的程序或者模块或者指令，以及调用存储在所述存储器31内的数据，以执行计算机装置3的各种功能和处理数据，例如，对影像数据进行分类的功能(具体细节
参后面对图3的介绍)。
29.在本实施例中，影像数据分类系统30可以包括一个或多个模块，所述一个或多个模块存储在所述存储器31中，并由至少一个或多个处理器(本实施例为处理器32)执行，以实现对影像数据进行分类的功能(具体细节参后面对图3的介绍)。
30.在本实施例中，所述影像数据分类系统30根据其所执行的功能，可以被划分为多个模块。参阅图2所示，所述多个模块包括分配模块301、执行模块302。本发明所称的模块是指一种能够被至少一个处理器(例如处理器32)所执行并且能够完成固定功能的一系列计算机可读的指令段，其存储在存储器(例如计算机装置3的存储器31)中。在本实施例中，关于各模块的功能将在后续结合图3详述。
31.本实施例中，以软件功能模块的形式实现的集成的单元，可以存储在一个非易失性可读取存储介质中。上述软件功能模块包括一个或多个计算机可读指令，所述计算机装置3或一个处理器(processor)通过执行所述一个或多个计算机可读指令实现本发明各个实施例的方法的部分，例如图3所示的对影像数据进行分类的方法。
32.在进一步的实施例中，结合图2，所述至少一个处理器32可执行所述计算机装置3的操作装置以及安装的各类应用程序(如所述的影像数据分类系统30)、程序代码等。
33.在进一步的实施例中，所述存储器31中存储有计算机程序的程序代码，且所述至少一个处理器32可调用所述存储器31中存储的程序代码以执行相关的功能。例如，图2中所述影像数据分类系统30的各个模块是存储在所述存储器31中的程序代码，并由所述至少一个处理器32所执行，从而实现所述各个模块的功能以达到对影像数据进行分类的目的(详见下文中对图3的描述)。
34.在本发明的一个实施例中，所述存储器31存储一个或多个计算机可读指令，所述一个或多个计算机可读指令被所述至少一个处理器32所执行以实现对影像数据进行分类的目的。具体地，所述至少一个处理器32对上述计算机可读指令的具体实现方法详见下文中对图3的描述。
35.图3是本发明较佳实施例提供的影像数据分类方法的流程图。
36.在本实施例中，所述影像数据分类方法可以应用于计算机装置3中，对于需要进行影像数据分类的计算机装置3，可以直接在该计算机装置3上集成本发明的方法所提供的用于影像数据分类的功能，或者以软件开发工具包(software development kit，sdk)的形式运行在所述计算机装置3上。
37.如图3所示，所述影像数据分类方法具体包括以下步骤，根据不同的需求，该流程图中步骤的顺序可以改变，某些步骤可以省略。
38.步骤s1、分配模块301将影像数据分配给n个标记者。
39.本实施例中，所述影像数据可以为一张图片或者一段视频。
40.本实施例中，所述分配模块301可以将所述影像数据随机分配给n个标记者。n可自由设定，但必须大于等3。
41.本实施例中，所述n个标记者可以分别利用各自的终端设备例如手机、电脑等设备接收所分配的所述影像数据。所述终端设备可与所述计算机装置3有线或者无线连接。由此所述n个标记者可以利用各自的终端设备接收到所述影像数据。
42.步骤s2、执行模块302收集所述n个标记者分别对所述影像数据所作的标记，由此
获得所述影像数据所对应的n个标记。
43.在第一实施例中，所述收集所述n个标记者分别对所述影像数据所作的标记，由此获得所述影像数据所对应的n个标记包括(a1)-(a6)：
44.(a1)针对分配给任意一个标记者的影像数据，提示该任意一个标记者在该影像数据中圈出指定对象，所述任意一个标记者为所述n个标记者中的其中一个标记者。
45.例如，所述影像数据为一张含有对象为狗以及狼的影像p1，执行模块302可以控制该任意一个标记者所使用的终端设备显示一个提示，提示该任意一个标记者在该影像p1中圈出狗。
46.在一个实施例中，为便于后面对标记者圈出的指定对象所占的图像区域进行识别，还可以进一步提示用户利用指定的图像处理工具例如矩形选择工具或者圆形选择工具在该影像数据中圈出指定对象。
47.(a2)接收该任意一个标记者对所述影像数据的处理，获得经过该任意一个标记者处理的所述影像数据，其中，所述任意一个标记者对所述影像数据的处理包括在该影像数据中圈出所述指定对象。
48.(a3)根据该任意一个标记者对所述影像数据的处理识别所述指定对象在所述影像数据中所占的影像区域。
49.例如，假设所述任意一个标记者利用图像处理工具例如矩形选择工具在所述影像p1中圈出了狗所在区域，那么所述执行模块302可以利用图像识别算法从所述影像p1中识别出矩形所占的影像区域。
50.(a4)获取所述指定对象所占据的影像区域的图像特征。
51.本实施例中，所述图像特征包括，但不限于，颜色特征、纹理特征、形状特征。
52.(a5)将所获取的图像特征作为该任意一个标记者对所述影像数据所作的标记。
53.(a6)根据获取所述任意一个标记者对所述影像数据所作的标记的方法，获取所述n个标记者中除该任意一个标记者之外的其他n-1个标记者分别对所述影像数据所作的标记。
54.在第二实施例中，所述收集所述n个标记者分别对所述影像数据所作的标记，由此获得所述影像数据所对应的n个标记包括(b1)-(b3)：
55.(b1)针对分配给任意一个标记者的影像数据，生成一个输入界面，提示该任意一个标记者在该输入界面为该影像数据设定一个标记，所述任意一个标记者为所述n个标记者中的其中一个标记者。
56.例如，所述影像数据为一张含有对象为橘子的影像p2，执行模块302可以控制该任意一个标记者所使用的终端设备显示一个输入界面，供标记者输入该影像p2的对象。
57.(b2)从所述输入界面获取该任意一个标记者为该影像数据所设定的标记，由此获得该任意一个标记者对所述影像数据所作的标记。
58.(b3)根据获取所述任意一个标记者对所述影像数据所作的标记的方法，获取所述n个标记者中除该任意一个标记者之外的其他n-1个标记者分别对所述影像数据所作的标记。
59.在第三实施例中，所述收集所述n个标记者分别对所述影像数据所作的标记，由此获得所述影像数据所对应的n个标记包括(c1)-(c4)：
60.(c1)针对分配给任意一个标记者的影像数据，为所述影像数据设定多个选项，其中，所述多个选项分别对应不同的标记，所述任意一个标记者为所述n个标记者中的其中一个标记者。
61.例如，所述影像数据为一张含有对象为人的头像的影像p2，执行模块302可以控制该任意一个标记者所使用的终端设备显示一个用户界面，在该用户界面上显示多个选项，每个选项对应的标记为一种心情。例如，该多个选项所对应的标记分别为高兴、悲伤、生气、惊讶。
62.(c2)提示该任意一个标记者根据所述影像数据从所述多个选项中作出选择。
63.(c3)将该任意一个标记者所选择的选项所对应的标记作为该任意一个标记者对所述影像数据所作的标记。
64.(c4)根据获取所述任意一个标记者对所述影像数据所作的标记的方法，获取所述n个标记者中除该任意一个标记者之外的其他n-1个标记者分别对所述影像数据所作的标记。
65.步骤s3、执行模块302从所述n个标记中确定目标标记，并计算该目标标记的相同率。
66.在一个实施例中，所述从所述n个标记中确定目标标记，并计算该目标标记的相同率包括(d1)-(d4)：
67.(d1)从所述n个标记中识别相同的标记，将相同的标记分类到同一个群组，由此获得多个群组。
68.需要说明的是，在所述第一实施例中，所述从所述n个标记中识别相同的标记包括：基于所述n个标记中的任意两个标记中的每个标记所对应的图像特征计算该任意两个标记者之间的相似度。当该任意两个标记者之间的相似度大于预设值(例如95％)时，所述执行模块302确定该任意两个标记者为相同的标记。反之，当该任意两个标记者之间的相似度小于或者等于所述预设值时，所述执行模块302确定该任意两个标记者为不同的标记。
69.在所述第二和第三实施例中，所述从所述n个标记中识别相同的标记包括：利用文字匹配算法识别所述n个标记中的相同标记。
70.(d2)统计所述多个群组中的每个群组所包括的标记的总数。
71.(d3)从所述多个群组中确定目标组，该目标组为所述多个群组中与最大总数值对应的群组，将所述目标组所对应的每个标记作为所述目标标记。
72.(d4)根据所述目标组所包括的所述目标标记的总数与所述n的值计算所述目标标记的相同率c，其中,c＝(m/n)*100％，其中,m代表所述目标组所包括的所述目标标记的总数。
73.步骤s4、执行模块302根据所述目标标记的相同率确定所述影像数据的质量，其中，当所述相同率大于第一预设值(例如51％)时，确定该影像数据的质量为第一级别(也可以成为“高质量影像数据”)；当所述相同率小于或等于所述第一预设值，但是大于第二预设值(例如34％)时，将所述影像数据重新分配给所述n个标记者进行标记；及当所述相同率小于或等于所述第二预设值时，确定该影像数据的质量为第二级别(也可以成为“低质量影像数据”)。
74.举例而言，在所述第一实施例中，假设将所述影像p1发给了100个标记者进行标
记，要求该100个标记者对影像p1中的狗进行标记。获得100个标记，其中，该100个标记中包括46个标记为狗、16个标记为狼、38个标记包括了狼和狗。执行模块302在上述步骤s3中，从上述100个标记中确定目标标记为狗，并计算该目标标记的相同率46％。假设所述第一预设值为51％，所述第二预设值为34％，则所述执行模块302将影像p1重新分配给所述100个标记者进行标记，以及及根据该100个标记者重新对影像p1所作的标记再次确定目标标记以及重新计算所述目标标记的相同率，以及根据该重新计算获得的所述目标标记的相同率来为该影像p1分类。
75.在一个实施例中，当将所述影像数据重新分配给所述n个标记者进行标记时，所述执行模块302还将所述影像数据重新分配的次数加1，由此获得该影像数据重新分配的总次数。当该影像数据重新分配的总次数达到预设值(例如2次或3次)，且基于当前所述n个标记者分别对该影像数据所作的标记，所计算得到的目标标记的相同率仍然小于或等于所述第一预设值，但是大于所述第二预设值时，所述执行模块302确定该影像数据的质量为所述第二级别。
76.需要说明的是，如果对影像数据的质量有更高的要求，也可以根据用户的输入调整所述第一预设值和所述第二预设值的大小。例如可以将所述第一预设值调整设置67％，以及将所述第二预设值调整设置51％。
77.本实施例中，可以基于所述步骤s1-s4对所收集的每张图像数据的质量进行验证，并将所有归类到所述第一级别的图像数据作为训练样本，基于该训练样本应用于机器学习，从而使得机器学习后的算法之辨识结果更符合一般大众的认同结果。
78.例如，所收集的每张图像数据为包括指定对象例如狗或猫的图像。基于所述步骤s1-s4对所收集的每张图像数据的质量进行验证后，所述执行模块302可以获取质量为所述第一级别的多张影像数据；及将所述多张影像数据作为训练样本，利用该训练样本对神经网络进行训练，获得影像识别模型。该影像识别模型用于识别所述指定对象。
79.在本发明所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。
80.所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
81.另外，在本发明各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。
82.对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。第一，第二等词语用来表示
名称，而并不表示任何特定的顺序。
83.最后所应说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照以上较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或等同替换，而不脱离本发明技术方案的精神和范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

影像数据分类方法、计算机装置及可读存储介质与流程

相关文献

最热文献