一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

确定图像的方法、装置、设备及存储介质与流程

2021-11-26 23:23:00 来源:中国专利 TAG:


1.本技术实施例涉及人工智能技术领域,特别涉及一种确定图像的方法、装置、设备及存储介质。


背景技术:

2.随着人工智能技术的发展,神经网络模型的应用范围越来越广。例如,检测模型能够对图像中的对象进行检测,以得到图像中的对象的位置信息以及类别信息等。检测模型通常利用具有对象标注信息的图像训练得到,图像具有的对象标注信息通过对图像中的对象进行标注得到,对图像中的对象进行标注需要耗费较大的人工成本。
3.因此,需要从不具有对象标注信息的候选图像中确定出全面且可靠的目标图像进行标注,以有效减少训练检测模型所需的人工成本。


技术实现要素:

4.本技术实施例提供了一种确定图像的方法、装置、设备及存储介质,可用于提高确定出的目标图像的全面性和可靠性。所述技术方案如下:
5.一方面,本技术实施例提供了一种确定图像的方法,所述方法包括:
6.获取候选图像,所述候选图像不具有对象标注信息;
7.对所述候选图像进行对象检测,得到第一对象检测结果;
8.基于所述第一对象检测结果,获取所述候选图像在至少两个衡量维度下分别对应的目标衡量指标,所述候选图像在任一衡量维度下对应的目标衡量指标用于衡量所述候选图像在所述任一衡量维度下具有的标注价值;
9.基于所述候选图像在所述至少两个衡量维度下分别对应的目标衡量指标,从所述候选图像中确定目标图像,所述目标图像用于进行标注,以得到对象标注信息。
10.另一方面,提供了一种确定图像的装置,所述装置包括:
11.第一获取单元,用于获取候选图像,所述候选图像不具有对象标注信息;
12.检测单元,用于对所述候选图像进行对象检测,得到第一对象检测结果;
13.第二获取单元,用于基于所述第一对象检测结果,获取所述候选图像在至少两个衡量维度下分别对应的目标衡量指标,所述候选图像在任一衡量维度下对应的目标衡量指标用于衡量所述候选图像在所述任一衡量维度下具有的标注价值;
14.确定单元,用于基于所述候选图像在所述至少两个衡量维度下分别对应的目标衡量指标,从所述候选图像中确定目标图像,所述目标图像用于进行标注,以得到对象标注信息。
15.在一种可能实现方式中,所述第二获取单元,用于对所述候选图像进行数据增强处理,得到所述候选图像对应的增强图像;对所述增强图像进行对象检测,得到第二对象检测结果;基于所述第一对象检测结果和所述第二对象检测结果,获取所述候选图像在所述至少两个衡量维度下分别对应的目标衡量指标。
16.在一种可能实现方式中,所述第一对象检测结果包括各个第一对象分别对应的子检测结果,所述第二对象检测结果包括各个第二对象分别对应的子检测结果,所述各个第一对象通过对所述候选图像进行对象检测得到,所述各个第二对象通过对所述增强图像进行对象检测得到;所述第二获取单元,还用于基于所述各个第一对象分别对应的子检测结果,确定所述候选图像在所述至少两个衡量维度下分别对应的第一衡量指标;基于所述各个第二对象分别对应的子检测结果,确定所述候选图像在所述至少两个衡量维度下分别对应的第二衡量指标;基于所述第一衡量指标以及所述第二衡量指标,确定所述候选图像在所述至少两个衡量维度下分别对应的目标衡量指标。
17.在一种可能实现方式中,所述第二获取单元,还用于基于任一第一对象对应的子检测结果,确定所述任一第一对象对应的子衡量指标,所述任一第一对象对应的子衡量指标用于指示所述任一第一对象的检测不确定度;基于所述各个第一对象分别对应的子衡量指标,确定所述候选图像在所述至少两个衡量维度下分别对应的第一衡量指标。
18.在一种可能实现方式中,所述第二获取单元,还用于确定所述各个第一对象分别对应的子衡量指标的总和;将所述总和作为所述候选图像在所述至少两个衡量维度中的第一衡量维度下对应的第一衡量指标。
19.在一种可能实现方式中,所述第二获取单元,还用于确定所述各个第一对象分别对应的子衡量指标的平均值;将所述平均值作为所述候选图像在所述至少两个衡量维度中的第二衡量维度下对应的第一衡量指标。
20.在一种可能实现方式中,所述第二获取单元,还用于在所述各个第一对象分别对应的子衡量指标中确定最大子衡量指标;将所述最大子衡量指标作为所述候选图像在所述至少两个衡量维度中的第三衡量维度下对应的第一衡量指标。
21.在一种可能实现方式中,所述第二获取单元,还用于获取所述候选图像在任一衡量维度下对应的第一衡量指标与第一权重的第一乘积,以及所述候选图像在所述任一衡量维度下对应的第二衡量指标与第二权重的第二乘积;将所述第一乘积与所述第二乘积的和作为所述候选图像在所述任一衡量维度下对应的目标衡量指标。
22.在一种可能实现方式中,所述确定单元,用于基于所述候选图像在任一衡量维度下对应的目标衡量指标,从所述候选图像中确定所述任一衡量维度对应的选取图像,所述任一衡量维度对应的选取图像为在所述任一衡量维度下对应的目标衡量指标满足所述任一衡量维度对应的选取条件的候选图像;将所述至少两个衡量维度分别对应的选取图像中的全部图像作为所述目标图像。
23.在一种可能实现方式中,所述检测单元,用于调用第一检测模型对所述候选图像进行对象检测,得到所述第一对象检测结果。
24.在一种可能实现方式中,所述第一检测模型基于训练图像集训练得到,所述训练图像集中的图像具有对象标注信息;所述装置还包括:
25.训练单元,用于利用具有对象标注信息的目标图像对所述训练图像集进行更新,得到更新后的训练图像集,所述目标图像具有的对象标注信息通过对所述目标图像中的对象进行标注得到;基于所述更新后的训练图像集对所述第一检测模型进行训练,得到用于对图像进行对象检测的第二检测模型。
26.另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存
储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行,以使所述计算机设备实现上述任一所述的确定图像的方法。
27.另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行,以使计算机实现上述任一所述的确定图像的方法。
28.另一方面,还提供了一种计算机程序产品或计算机程序,所述计算机程序产品或计算机程序包括计算机指令,所述计算机指令存储在计算机可读存储介质中。计算机设备的处理器从所述计算机可读存储介质读取所述计算机指令,处理器执行所述计算机指令,使得所述计算机设备执行上述任一所述的确定图像的方法。
29.本技术实施例提供的技术方案至少带来如下有益效果:
30.在本技术实施例中,目标图像是根据候选图像在至少两个衡量维度下分别对应的目标衡量指标确定出的,在此种方式下,目标图像的确定过程关注了候选图像在至少两个衡量维度下分别对应的目标衡量指标,考虑的衡量维度较全面,有利于确定出较为全面的需要进行标注的目标图像,确定出的目标图像的全面性和可靠性较高。
附图说明
31.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
32.图1是本技术实施例提供的一种确定图像的方法的实施环境的示意图;
33.图2是本技术实施例提供的一种确定图像的方法的流程图;
34.图3是本技术实施例提供的一种具有对象标注信息的图像的示意图;
35.图4是本技术实施例提供的一种基于第一对象检测结果,获取候选图像在至少两个衡量维度下分别对应的目标衡量指标的过程的流程图;
36.图5是本技术实施例提供的一种候选图像以及候选图像对应的增强图像的示意图;
37.图6是本技术实施例提供的一种训练病变细胞检测模型的过程的示意图;
38.图7是本技术实施例提供的一种具有病变细胞标注信息的宫颈脱落细胞涂片图像的示意图;
39.图8是本技术实施例提供的一种候选宫颈脱落细胞涂片图像以及候选宫颈脱落细胞涂片图像对应的增强宫颈脱落细胞涂片图像的示意图;
40.图9是本技术实施例提供的一种确定图像的装置的示意图;
41.图10是本技术实施例提供的一种确定图像的装置的示意图;
42.图11是本技术实施例提供的一种服务器的结构示意图;
43.图12是本技术实施例提供的一种终端的结构示意图。
具体实施方式
44.为使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术实施方
式作进一步地详细描述。
45.需要说明的是,本技术的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本技术的一些方面相一致的装置和方法的例子。
46.在示例性实施例中,本技术实施例提供的确定图像的方法能够应用于人工智能技术领域。接下来对人工智能技术进行介绍。
47.人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
48.人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。本技术实施例提供的确定图像的方法涉及计算机视觉技术和机器学习技术。
49.计算机视觉(computer vision,cv)技术是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括获取虚拟图像、图像处理、图像识别、图像语义理解、图像检索、ocr(optical character recognition,光学字符识别)、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3d(three dimensional,三维)技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
50.机器学习(machine learning,ml)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
51.随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如,常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
52.图1示出了本技术实施例提供的确定图像的方法的实施环境的示意图。该实施环
境可以包括:终端11和服务器12。
53.本技术实施例提供的确定图像的方法可以由终端11执行,也可以由服务器12执行,还可以由终端11和服务器12共同执行,本技术实施例对此不加以限定。对于本技术实施例提供的确定图像的方法由终端11和服务器12共同执行的情况,服务器12承担主要计算工作,终端11承担次要计算工作;或者,服务器12承担次要计算工作,终端11承担主要计算工作;或者,服务器12和终端11二者之间采用分布式计算架构进行协同计算。
54.在一种可能实现方式中,终端11可以是任何一种可与用户通过键盘、触摸板、触摸屏、遥控器、语音交互或手写设备等一种或多种方式进行人机交互的电子产品,例如pc(personal computer,个人计算机)、手机、智能手机、pda(personal digital assistant,个人数字助手)、可穿戴设备、ppc(pocket pc,掌上电脑)、平板电脑、智能车机、智能电视、智能音箱等。服务器12可以是一台服务器,也可以是由多台服务器组成的服务器集群,或者是一个云计算服务中心。终端11与服务器12通过有线或无线网络建立通信连接。
55.本领域技术人员应能理解上述终端11和服务器12仅为举例,其他现有的或今后可能出现的终端或服务器如可适用于本技术,也应包含在本技术保护范围以内,并在此以引用方式包含于此。
56.基于上述图1所示的实施环境,本技术实施例提供一种确定图像的方法,以该方法应用于计算机设备为例,该计算机设备可以为服务器,也可以为终端,本技术实施例对此不加以限定。如图2所示,本技术实施例提供的确定图像的方法包括如下步骤201至步骤204。
57.在步骤201中,获取候选图像,候选图像不具有对象标注信息。
58.候选图像是指不具有对象标注信息的图像,本技术实施例中,需要从候选图像中选取一些标注价值大的目标图像进行标注,以使目标图像具有对象标注信息。对象标注信息是指对图像中的对象进行标注得到的信息,能够明确指示出图像中的对象所在的位置以及图像中的对象的类别等。图像中的对象是指图像中需要关注的对象。一个图像中需要关注的对象的数量可能为一个,也可能为多个,本技术实施例对此不加以限定。
59.示例性地,对象标注信息包括但不限于用于指示图像中的对象所在的位置的位置信息以及用于指示图像中的对象的类别的类别信息。示例性地,利用矩形框指示图像中的对象所在的位置,则位置信息包括矩形框的定位点坐标以及矩形框的尺寸。示例性地,矩形框的定位点坐标为矩形框的左上角坐标、矩形框的中心点坐标或者矩形框的右下角坐标等,矩形框的尺寸包括矩形框的长度和矩形框的宽度。例如,位置信息利用数组(x,y,h,w)表示,其中,x表示矩形框的定位点横坐标,y表示矩形框的定位点纵坐标,h表示矩形框的长度,w表示矩形框的宽度。
60.示例性地,用于指示图像中的对象的类别的类别信息为图像中的对象的类别对应的文字,或者为图像中的对象的类别对应的标识等,本技术实施例对此不加以限定。示例性地,具有对象标注信息的图像如图3所示。图3所示的图像中的对象为狗,在图3中,利用矩形框301指示图像中的对象所在的位置,利用文字“狗”指示图像中的对象的类别。示例性地,若类别“狗”对应的标识为1,则在图3中还可以利用标识1指示图像中的对象的类别。
61.本技术实施例对候选图像的类型不加以限定,不同类型的候选图像中包括的对象可能不同。示例性地,候选图像的类型为病理图像,则候选图像中包括的对象为病变细胞。示例性地,候选图像的类型为街道图像,则候选图像中包括的对象为车辆和行人。
62.示例性地,获取候选图像的方式包括但不限于:从未标注图像库中提取候选图像;获取与计算机设备具有通信连接的图像采集装置采集的候选图像;获取用户上传的候选图像。示例性地,未标注图像库中的图像以及用户上传的图像均是图像采集装置采集的图像,采集不同类型的候选图像所利用的图像采集装置可能不同,例如,若候选图像的类型为病理图像,则采集候选图像所利用的图像采集装置包括但不限于显微镜、数字扫描仪等;若候选图像的类型为街道图像,则采集候选图像所利用的图像采集装置包括但不限于行车记录仪、监控摄像头等。
63.示例性地,本技术实施例中获取的候选图像的数量为多个,多个候选图像的类型相同,以保证候选图像之间具有可比性。类型相同的不同候选图像中包括的对象的数量可能相同,也可能不同。
64.在步骤202中,对候选图像进行对象检测,得到第一对象检测结果。
65.第一对象检测结果是对候选图像进行对象检测后得到的结果,第一对象检测结果为预测得到的用于指示候选图像中包括的对象的情况的结果。需要说明的是,第一对象检测结果指示的候选图像中包括的对象的情况可能与候选图像中真实包括的对象的情况相同,也可能不同,这与对候选图像进行对象检测的检测效果有关,本技术实施例对此不加以限定。
66.第一对象检测结果用于指示候选图像中包括的对象的情况,本技术实施例对第一对象检测结果的形式不加以限定,示例性地,第一对象检测结果包括各个第一对象分别对应的子检测结果,各个第一对象通过对候选图像进行对象检测得到,也就是说,第一对象是指从候选图像中检测出的对象,本技术实施例对第一对象的数量不加以限定,这跟实际情况有关。任一第一对象对应的子检测结果用于指示该任一第一对象在候选图像中所处的位置以及该任一第一对象的类别。示例性地,任一第一对象对应的子检测结果包括该任一第一对象对应的位置信息和该任一第一对象对应的类别信息。
67.示例性地,任一第一对象所处的位置利用矩形框表示,也即该任一第一对象对应的位置信息包括用于定位该任一第一对象所处的矩形框的定位点坐标以及用于指示该任一第一对象所处的矩形框的尺寸的长度和宽度。示例性地,任一第一对象对应的类别信息包括该任一第一对象属于各个候选类别的概率,一个候选类别对应一个概率,不同的候选类别对应的概率可能相同,也可能不同。示例性地,任一第一对象属于各个候选类别的概率之和为1;或者任一第一对象属于每个候选类别的概率均为一个二分类概率,任一第一对象属于各个候选类别的概率之和可能不为1。
68.示例性地,利用d
i
={c
j
,p
j
}表示对各个候选图像中的第i(i为不小1的整数)个候选图像进行对象检测得到的第一对象检测结果,其中,c
j
表示第一对象检测结果中包括的第j(j为不小1的整数)个第一对象对应的位置信息,p
j
表示第一对象检测结果中包括的第j个第一对象对应的类别信息,该类别信息包括第j个第一对象属于各个候选类别的概率,例如,利用p
jk
表示第j对象属于第k(k为不小1的整数)个候选类别的概率。
69.候选类别根据候选图像的类型预先设置,或者根据实际的应用场景灵活调整,本技术实施例对此不加以限定。示例性地,对于候选图像的类型为街道图像的情况,候选类别包括但不限于汽车、行人、自行车、公交车等。对于候选图像的类型为病理图像的情况,候选类别包括但不限于病变类别、正常类别、微生物类别等。示例性地,病变类别以及微生物类
别还可以根据病理图像的具体情况进一步细分,本技术实施例对此不加以限定。
70.示例性地,对于病理图像为宫颈脱落细胞涂片图像的情况,病变类别还可以细分为ascus(atypical squamous cells of undetermined significance,不能明确意义的非典型鳞状细胞)、lsil(low squamous intraepithelial lesion,低度鳞状上皮内病变)、hsil(high squamous intraepithelial lesion,高度鳞状上皮内病变)、asch(atypical squamous cell

cannot exclude hisl,倾向于高度病变的非典型鳞状细胞)、scc(squamous cell carcinoma,鳞状细胞癌)、adc(adeno carcinoma,腺癌)、agc(atypical glandular cells,非典型腺上皮细胞)等。微生物类别还可以细分为:滴虫,念珠菌,疱疹病毒,放线菌,菌落变化等,示例性地,微生物类别用于提示细菌性病变。病变类别以及微生物类别可以更多或者更少,本技术实施例对此不加以限定。
71.在示例性实施例中,对候选图像进行对象检测,得到第一对象检测结果的方式为:调用第一检测模型对候选图像进行对象检测,得到第一对象检测结果。第一检测模型用于对输入的图像进行对象检测,以检测出输入的图像中包括的对象的情况。需要说明的是,第一检测模型能够检测出哪些类型的对象与输入的候选图像的类型以及训练得到第一检测模型所利用的图像具有的对象标注信息有关,本技术实施例对此不加以限定。例如,若训练得到第一检测模型所利用的图像为病理图像,病理图像具有的对象标注信息包括对病理图像中的病变类别和微生物类别的细胞进行标注的得到的信息,则第一检测模型能够检测出输入的候选图像中存在的属于病变类别和微生物类别或者可能属于病变类别和微生物类别的对象。
72.本技术实施例对第一检测模型的模型结构不加以限定,只要能够对候选图像进行对象检测,以输出用于指示候选图像中的对象的情况的对象检测结果即可。示例性地,第一检测模型的模型结构为faster r

cnn(faster region convolutional neural networks,基于区域的更快速的卷积神经网络)模型、ssd(single shot multibox detector,单轮多盒检测器)模型或者yolo(一种物体检测方法)模型等。对候选图像进行对象检测,得到第一对象检测结果的过程为第一检测模型的内容处理过程,不同模型结构的第一检测模型的内部处理过程可能不同。以第一检测模型的模型结构为faster r

cnn模型为例进行说明。
73.当第一检测模型的模型结构为faster r

cnn模型时,第一检测模型包括特征提取层、rpn(region proposal networks,区域建议网络)层、池化层以及全连接层。特征提取层用于提取候选图像的图像特征,该图像特征被共享用于后续的rpn层和池化层,示例性地,特征提取层的结构为残差网络(residual network,resnet),如,resnet50。rpn层用于根据图像特征生成候选区域。池化层用于根据图像特征和候选区域,获取候选区域特征,然后将候选区域特征输入后续的全连接层。全连接层根据候选区域特征输出包括检测出的各个对象的位置信息和类别信息的对象检测结果。
74.示例性地,第一检测模型基于训练图像集训练得到,训练图像集中的图像具有对象标注信息。此种情况下,利用本技术实施例提供的方法确定目标图像的目的是:对目标图像中的对象进行标注,使目标图像具有对象标注信息,然后利用具有对象标注信息的目标图像对训练图像集进行更新,进而利用更新后的训练图像集重新训练第一检测模型,从而提高第一检测模型的对象检测效果。此种过程可视为基于主动学习方法训练检测模型的过程。主动学习是指:通过一定的算法来挑选最有用的未标注样本,交由专家进行标注,然后
将人工标注的样本加入到训练集,重新训练模型而不断提升模型效果,这一个往复的过程。主动学习主要是为了减少数据标注量,用最小的数据获取比较好的模型。
75.在基于训练图像集训练得到第一检测模型的过程中,训练图像集中的图像具有的对象标注信息用于提供监督信息。基于训练图像集训练得到第一检测模型的具体方式与第一检测模型的模型结构有关,本技术实施例对此不加以限定。
76.在步骤203中,基于第一对象检测结果,获取候选图像在至少两个衡量维度下分别对应的目标衡量指标,候选图像在任一衡量维度下对应的目标衡量指标用于衡量候选图像在任一衡量维度下具有的标注价值。
77.在本技术实施例中,基于第一对象检测结果,获取候选图像在至少两个衡量维度下分别对应的目标衡量指标,也就是说,对于每个候选图像而言,该候选图像均对应有与衡量维度数量相同的目标衡量指标,综合考虑了多个衡量维度,有利于保证后续确定出的目标图像的全面性。
78.需要说明的是,候选图像的数量为多个,需要获取每个候选图像在至少两个衡量维度下分别对应的目标衡量指标,获取不同候选图像在至少两个衡量维度下分别对应的目标衡量指标的原理相同,本技术实施例以获取一个候选图像在至少两个衡量维度下分别对应的目标衡量指标为例进行说明。
79.不同的衡量维度用于从不同的角度衡量候选图像的标注价值,本技术实施例对考虑的衡量维度的具体数量以及类型不加以限定,可以根据经验设置,或者根据应用场景灵活调整。示例性地,衡量维度的数量为两个;或者,衡量维度的数量为三个;或者,衡量维度的数量为四个等。
80.候选图像在任一衡量维度下对应的目标衡量指标用于衡量该候选图像在该任一衡量维度下具有的标注价值。一个候选图像在任一衡量维度下具有的标注价值越大,说明在该任一衡量维度下对该一个候选图像进行标注带来的收益越大,也即说明在考虑该任一衡量维度时越应该将该一个候选图像作为需要进行标注的目标图像。示例性地,候选图像在任一衡量维度下对应的目标衡量指标越大,说明该候选图像在该任一衡量维度下具有的标注价值越大;或者,候选图像在任一衡量维度下对应的目标衡量指标越小,说明该候选图像在该任一衡量维度下具有的标注价值越大,本技术实施例对此不加以限定。
81.在一种可能实现方式中,基于第一对象检测结果,获取候选图像在至少两个衡量维度下分别对应的目标衡量指标的实现方式包括但不限于以下两种:
82.实现方式一:获取第二对象检测结果;基于第一对象检测结果和第二对象检测结果,获取候选图像在至少两个衡量维度下分别对应的目标衡量指标。
83.第二对象检测结果是指对候选图像对应的增强图像进行对象检测后得到的结果。候选图像对应的增强图像是指对候选图像进行数据增强处理后得到的图像。在此种情况下,参见图4,基于第一对象检测结果,获取候选图像在至少两个衡量维度下分别对应的目标衡量指标的过程包括以下步骤401至步骤403。
84.步骤401:对候选图像进行数据增强处理,得到候选图像对应的增强图像。
85.候选图像对应的增强图像用于对候选图像进行增强,通过综合考虑候选图像以及候选图像对应的增强图像来获取候选图像在至少两个衡量维度下分别对应的目标衡量指标,能够有效减少误差。示例性地,对于调用第一检测模型进行对象检测的情况,能够有效
减少第一检测模型本身的不确定性带来的误差。在一些实施例中,第一检测模型本身的不确定性带来的误差还可以称为第一检测模型本身的不确定性带来的噪音。
86.在一种可能实现方式中,对候选图像进行数据增强处理,得到候选图像对应的增强图像的过程为:对候选图像执行至少一种数据增强操作,得到候选图像对应的增强图像。对候选图像执行一种数据增强操作,会得到候选图像对应的一个增强图像。也就是说,候选图像对应的增强图像的数量与对候选图像执行的数据增强操作的数量相同。本技术实施例对至少一种数据增强操作不加以限定,可以根据经验设置,也可以根据实际的应用场景灵活调整。
87.示例性地,至少一种数据增强操作包括水平翻转、垂直翻转、缩小至原尺寸的第一倍数、放大至原尺寸的第二倍数中的一种或多种。第一倍数为小于1倍的倍数,第二倍数为大于1的倍数。第一倍数以及第二倍数均根据经验设置,或者根据实际的应用场景灵活调整,例如,第一倍数为0.8倍、0.5倍或者0.9倍等,第二倍数为1.2倍、1.5倍或者2倍等。
88.示例性地,候选图像以及候选图像对应的增强图像如图5所示。在图5中,候选图像501对应的增强图像的数量为4个,增强图像502通过将候选图像501水平翻转得到,增强图像503通过将候选图像501垂直翻转得到,增强图像504通过将候选图像501缩小至原尺寸的0.8倍得到,增强图像505通过将候选图像501放大至原尺寸的1.2倍得到。
89.步骤402:对增强图像进行对象检测,得到第二对象检测结果。
90.在得到候选图像对应的增强图像之后,对增强图像进行对象检测,得到第二对象检测结果。需要说明的是,候选图像对应的增强图像的数量可能为一个,也可能为多个。对于候选图像对应的增强图像的数量为多个的情况,对各个增强图像分别进行对象检测,得到各个增强图像分别对应的一个第二对象检测结果。也就是说,对每个增强图像进行对象检测均得到一个第二对象检测结果,第二对象检测结果的数量与增强图像的数量相同。
91.对每个增强图像进行对象检测,得到一个第二对象检测结果的过程参考步骤202中的对候选图像进行对象检测,得到第一对象检测结果的过程,此处不再赘述。
92.第二对象检测结果用于指示增强图像中包括的对象的情况,第二对象检测结果的形式与第一对象检测结果的形式相同。示例性地,第二对象检测结果包括各个第二对象分别对应的子检测结果,各个第二对象通过对增强图像进行对象检测得到,也就是说,第二对象是指从增强图像中检测出的对象,本技术实施例对第二对象的数量不加以限定,这跟实际情况有关。
93.任一第二对象对应的子检测结果用于指示该任一第二对象在增强图像中所处的位置以及该任一第二对象的类别。示例性地,任一第二对象对应的子检测结果包括该任一第二对象对应的位置信息和该任一第二对象对应的类别信息。示例性地,任一第二对象所处的位置利用矩形框表示,也即该任一第二对象对应的位置信息包括用于定位该任一第二对象所处的矩形框的定位点坐标以及用于指示该任一第二对象所处的矩形框的尺寸的长度和宽度。示例性地,任一第二对象对应的类别信息包括该任一第二对象属于各个候选类别的概率。
94.对于增强图像的数量为多个的情况,对每个增强图像进行对象检测,均得到一个第二对象检测结果,不同的第二对象检测结果中涉及的第二对象可能相同,也可能不同,本技术实施例对此不加以限定。
95.步骤403:基于第一对象检测结果和第二对象检测结果,获取候选图像在至少两个衡量维度下分别对应的目标衡量指标。
96.第一对象检测结果是通过对候选图像进行对象检测得到的结果,第二对象检测结果是通过对候选图像对应的增强图像进行对象检测得到的结果,基于第一对象检测结果和第二对象检测结果获取候选图像在至少两个衡量维度下分别对应的目标衡量指标的过程中不仅考虑了候选图像本身,还考虑了候选图像对应的增强图像,有利于减少仅仅考虑候选图像带来的误差。
97.需要说明的是,第一对象检测结果的数量为一个,第二对象检测结果的数量与候选图像对应的增强图像的数量相同。基于第一对象检测结果和第二对象检测结果,获取候选图像在至少两个衡量维度下分别对应的目标衡量指标是指:基于第一对象检测结果和全部的第二对象检测结果,获取候选图像在至少两个衡量维度下分别对应的目标衡量指标。若候选图像对应的增强图像数量为一个,则第二对象检测结果的数量为一个,需要基于第一对象检测结果和该一个第二对象检测结果,获取候选图像在至少两个衡量维度下分别对应的目标衡量指标。若候选图像对应的增强图像的数量为多个,则第二对象检测结果的数量为多个,需要基于第一对象检测结果和多个第二对象检测结果,获取候选图像在至少两个衡量维度下分别对应的目标衡量指标。
98.在一种可能实现方式中,第一对象检测结果包括各个第一对象分别对应的子检测结果,第二对象检测结果包括各个第二对象分别对应的子检测结果。此种情况下,步骤403的实现过程包括以下步骤4031至步骤4033。
99.步骤4031:基于各个第一对象分别对应的子检测结果,确定候选图像在至少两个衡量维度下分别对应的第一衡量指标。
100.候选图像在至少两个衡量维度下分别对应的第一衡量指标是通过考虑第一对象检测结果中包括的各个第一对象分别对应的子检测结果得到的,第一对象检测结果是通过对候选图像进行对象检测得到的,因此,候选图像在任一衡量维度下对应的第一衡量指标能够指示在考虑候选图像的情况下,候选图像在该任一衡量维度下具有的标注价值。
101.在一种可能实现方式中,基于各个第一对象分别对应的子检测结果,确定候选图像在至少两个衡量维度下分别对应的第一衡量指标的过程为:基于任一第一对象对应的子检测结果,确定任一第一对象对应的子衡量指标;基于各个第一对象分别对应的子衡量指标,确定候选图像在至少两个衡量维度下分别对应的第一衡量指标。
102.其中,任一第一对象对应的子衡量指标用于指示任一第一对象的检测不确定度。若检测出的某一第一对象的检测不确定度越大,则说明为该第一对象进行标注的价值越大。在一种可能实现方式中,任一第一对象对应的子检测结果包括用于指示该任一第一对象属于各个候选类别的概率,基于任一第一对象对应的子检测结果,确定任一第一对象对应的子衡量指标的方式为:基于该任一第一对象属于各个候选类别的概率,确定该任一第一对象对应的信息熵,将计算得到的信息熵作为该任一第一对象对应的子衡量指标。
103.示例性地,任一第一对象对应的信息熵用于衡量任一第一对象对应的子检测结果的信息含量,信息熵越大说明信息含量越大,也即说明该任一第一对象的检测不确定度越大。示例性地,基于任一第一对象属于各个候选类别的概率,确定该任一第一对象对应的信息熵的过程基于公式1实现:
104.h
j
=sum(

p
jk
*logp
jk
)
ꢀꢀ
(公式1)
105.其中,h
j
表示各个第一对象中的第j(j为不小于1的整数)个第一对象对应的信息熵;p
jk
表示第j个第一对象属于各个候选类别中的第k(k为不小于1的整数)个候选类别的概率;sum表示求和运算;logp
jk
表示p
jk
的对数,示例性地,对数中的底数为自然常数e。
106.根据获取任一第一对象对应的子衡量指标的方式,能够获取各个第一对象分别对应的子衡量指标,然后根据各个第一对象分别对应的子衡量指标,确定候选图像在至少两个衡量维度下分别对应的第一衡量指标。候选图像在每个衡量维度下对应的第一衡量指标均基于各个第一对象分别对应的子衡量指标确定。不同的衡量维度关注不同方面的信息,在关注的信息不同的情况下,对各个第一对象分别对应的子衡量指标进行处理的方式也不同。
107.示例性地,至少两个衡量维度包括第一衡量维度、第二衡量维度和第三衡量维度中的至少两个。第一衡量维度关注子衡量指标的总和方面的信息,第二衡量维度关注子衡量指标的平均值方面的信息,第三衡量维度关注子衡量指标中的最大子衡量指标方面的信息。
108.若至少两个衡量维度包括第一衡量维度,则从关注子衡量指标的总和的信息的角度出发,确定各个第一对象分别对应的子衡量指标的总和;将总和作为候选图像在至少两个衡量维度中的第一衡量维度下对应的第一衡量指标。若至少两个衡量维度包括第二衡量维度,则从关注子衡量指标的平均值的信息角度出发,确定各个第一对象分别对应的子衡量指标的平均值;将平均值作为候选图像在至少两个衡量维度中的第二衡量维度下对应的第一衡量指标。若至少两个衡量维度包括第三衡量维度,则从关注子衡量指标中的最大子衡量指标的角度出发,在各个第一对象分别对应的子衡量指标中确定最大子衡量指标;将最大子衡量指标作为候选图像在至少两个衡量维度中的第三衡量维度下对应的第一衡量指标。
109.需要说明的是,以上第一衡量维度、第二衡量维度以及第三衡量维度仅为举例,至少两个衡量维度还可能涉及关注更多方面的信息的衡量维度,本技术实施例对此不加以限定。每个衡量维度均关注子衡量指标对应的一个方面的信息,从某一衡量维度关注的信息的角度出发对各个第一对象分别对应的子衡量指标进行处理,即可得到候选图像在该衡量维度下对应的第一衡量指标。
110.候选图像在每个衡量维度下均对应有一个第一衡量指标,对于不同的候选图像而言,衡量维度均相同,以保证不同的候选图像之间的可比性。每个候选图像均在各个衡量维度下均对应有一个第一衡量指标。
111.步骤4032:基于各个第二对象分别对应的子检测结果,确定候选图像在至少两个衡量维度下分别对应的第二衡量指标。
112.候选图像在至少两个衡量维度下分别对应的第二衡量指标是通过考虑第二对象检测结果中包括的各个第二对象分别对应的子检测结果得到的,第二对象检测结果是通过对候选图像对应的增强图像进行对象检测得到的,因此,候选图像在任一衡量维度下对应的第二衡量指标能够指示在考虑候选图像对应的增强图像的情况下,候选图像在该任一衡量维度下具有的标注价值。
113.在一种可能实现方式中,基于各个第二对象分别对应的子检测结果,确定候选图
像在至少两个衡量维度下分别对应的第二衡量指标的过程为:基于任一第二对象对应的子检测结果,确定任一第二对象对应的子衡量指标,任一第二对象对应的子衡量指标用于指示任一第二对象的检测不确定度;基于各个第二对象分别对应的子衡量指标,确定候选图像在至少两个衡量维度下分别对应的第二衡量指标。该过程的实现方式参见步骤4031中基于各个第一对象分别对应的子检测结果,确定候选图像在至少两个衡量维度下分别对应的第一衡量指标的实现方式,此处不再赘述。
114.在步骤4032中以增强图像的数量为一个为例进行说明,若增强图像的数量为多个,根据对每个增强图像进行对象检测得到的一个第二对象检测结果均执行一次步骤4032,然后再执行步骤4033。每执行一次步骤4032,得到候选图像在至少两个衡量维度下分别对应的一个第二衡量指标。也就是说,若增强图像的数量为m(m个不小于1的整数)个,则候选图像在每个衡量维度下对应m个第二衡量指标。
115.步骤4033:基于第一衡量指标以及第二衡量指标,确定候选图像在至少两个衡量维度下分别对应的目标衡量指标。
116.步骤4033中的第一衡量指标是指步骤4031中得到的候选图像在至少两个衡量维度下分别对应的第一衡量指标,步骤4033中的第二衡量指标是指步骤4032中得到的候选图像在至少两个衡量维度下分别对应的第二衡量指标。候选图像在至少两个衡量维度下分别对应的第一衡量指标是在考虑候选图像的基础上得到的,候选图像在至少两个衡量维度下分别对应的第二衡量指标是在考虑候选图像对应的增强图像的基础上得到的。基于候选图像在至少两个衡量维度下分别对应的第一衡量指标以及候选图像在至少两个衡量维度下分别对应的第二衡量指标,确定出的候选图像在至少两个衡量维度下分别对应的目标衡量指标综合考虑了候选图像和候选图像对应的增强图像,可靠性较高。
117.候选图像在任一衡量维度下对应的目标衡量指标基于候选图像在该任一衡量维度下对的第一衡量指标以及候选图像在该任一衡量维度下对应的全部的第二衡量指标得到的。需要说明的是,对于候选图像对应的增强图像的数量为多个的情况,候选图像在每个衡量维度下均对应多个第二衡量指标,此种情况下,候选图像在任一衡量维度下对应的目标衡量指标基于候选图像在该任一衡量维度下对的第一衡量指标以及候选图像在该任一衡量维度下对应的多个第二衡量指标得到的。
118.在一种可能实现方式中,确定候选图像在任一衡量维度下对应的目标衡量指标的方式为:获取候选图像在任一衡量维度下对应的第一衡量指标与第一权重的第一乘积,以及候选图像在该任一衡量维度下对应的第二衡量指标与第二权重的第二乘积;将第一乘积和第二乘积的和作为候选图像在该任一衡量维度下对应的目标衡量指标。
119.第一权重是指在该任一衡量维度下为第一衡量指标赋予的权重,第二权重是指在该任一衡量维度下为第二衡量指标赋予的权重。任一衡量维度发生改变的情况下,第一权重以及第二权重可能发生改变,也可能不发生改变,本技术实施例对此不加以限定。需要说明的是,本技术实施例以候选图像在任一衡量维度下对应的第二衡量指标的数量为一个为例进行说明,对于候选图像在任一衡量维度下对应的第二衡量指标的数量为多个的情况,为候选图像在该任一衡量维度下对应的每个第二衡量指标均赋予一个第二权重,将候选图像在该任一衡量维度下对应的每个第二衡量指标均与对应的第二权重进行相乘,得到一个第二乘积。然后将第一乘积与全部的第二乘积的和作为候选图像在该任一衡量维度下对应
的目标衡量指标。
120.示例性地,将第一权重以及各个第二权重均设置为参考数量的倒数,参考数量为一个候选图像对应的各个增强图像的数量与数值1的和。此种情况下,确定候选图像在任一衡量维度下对应的目标衡量指标的过程可视为计算候选图像在该任一衡量维度下对应的第一衡量指标以及候选图像在该任一衡量维度下对应的各个第二衡量指标之间的平均衡量指标的过程。
121.上述介绍的基于候选图像在任一衡量维度下对应的第一衡量指标以及候选图像在任一衡量维度下对应的第二衡量指标,确定候选图像在任一衡量维度下对应的目标衡量指标的方式仅为示例性举例,本技术实施例并不局限于此。
122.实现方式二:直接基于第一对象检测结果,获取候选图像在至少两个衡量维度下分别对应的目标衡量指标。
123.第一对象检测结果是对候选图像进行对象检测后得到的结果,在此种实现方式二下,直接通过考虑候选图像本身来确定候选图像在至少两个衡量维度下分别对应的目标衡量指标,确定候选图像在至少两个衡量维度下分别对应的目标衡量指标的效率较高。
124.在一种可能实现方式中,第一对象检测结果包括各个第一对象分别对应的子检测结果;直接基于第一对象检测结果,获取候选图像在至少两个衡量维度下分别对应的目标衡量指标的方式为:基于各个第一对象分别对应的子检测结果,确定候选图像在至少两个衡量维度下分别对应的第一衡量指标,将候选图像在至少两个衡量维度下分别对应的第一衡量指标直接作为候选图像在至少两个衡量维度下分别对应的目标衡量指标。
125.基于各个第一对象分别对应的子检测结果,确定候选图像在至少两个衡量维度下分别对应的第一衡量指标的实现方式参见步骤4031,此处不再赘述。在得到候选图像在某一衡量维度下对应的第一衡量指标后,直接将候选图像在该衡量维度下对应的第一衡量指标作为候选图像在该衡量维度下对应的目标衡量指标,基于此种方式,即可得到候选图像在至少两个衡量维度下分别对应的目标衡量指标。
126.步骤202和步骤203以一个候选图像为例介绍了确定候选图像在至少两个衡量维度下分别对应的目标衡量指标的实现过程,为从候选图像中挑选出需要进行标注的目标图像,候选图像的数量为多个。针对每个候选图像均能够根据步骤202和步骤203的方式确定出该候选图像在至少两个衡量维度下分别对应的目标衡量指标。在得到全部的候选图像在至少两个衡量维度下分别对应的目标衡量指标后,执行步骤204,以进一步确定出目标图像。
127.在步骤204中,基于候选图像在至少两个衡量维度下分别对应的目标衡量指标,从候选图像中确定目标图像,目标图像用于进行标注,以得到对象标注信息。
128.目标图像是指从候选图像中确定出的需要进行标注,以得到对象标注信息的图像。也就是说,目标图像是指基于候选图像在至少两个衡量维度下分别对应的目标衡量指标,从候选图像中挑选出的需要进行标注的图像。由于候选图像在任一衡量维度下对应的目标衡量指标用于衡量候选图像在任一衡量维度下具有的标注价值,所以根据候选图像在至少两个衡量维度下分别对应的目标衡量指标,能够较为全面地确定出标注价值大的图像,提高确定出的目标图像的全面性和可靠性。需要说明的是,步骤204中确定目标图像所依据的是全部的候选图像在至少两个衡量维度下分别对应的目标衡量指标。
129.在一种可能实现方式中,基于候选图像在至少两个衡量维度下分别对应的目标衡量指标,从候选图像中确定目标图像的过程为:基于候选图像在任一衡量维度下对应的目标衡量指标,从候选图像中确定任一衡量维度对应的选取图像,任一衡量维度对应的选取图像为在任一衡量维度下对应的目标衡量指标满足任一衡量维度对应的选取条件的候选图像;将至少两个衡量维度分别对应的选取图像中的全部图像作为目标图像。
130.任一衡量维度对应的选取图像是指在该任一衡量维度下,从候选图像中选取的需要进行标注的图像。任一衡量维度对应的选取条件用于对候选图像在该任一衡量维度下对应的目标衡量指标进行限制,以选取出该衡量维度下具有的标注价值较大的图像。任一衡量维度对应的选取条件根据经验设置,或者根据应用场景灵活调整,本技术实施例对此不加以限定。
131.示例性地,对于候选图像在该任一衡量维下对应的目标衡量指标越大说明候选图像在该任一衡量维度下具有的标注价值越大的情况,某一候选图像在该任一衡量维度下对应的目标衡量指标满足该任一衡量维度对应的选取条件是指该候选图像在该任一候选维度下对应的目标指标为全部的候选图像在该任一衡量维度下分别对应的目标衡量指标中的前k(k为不小于1的整数)大的目标衡量指标。k的取值根据经验设置,或者根据候选图像的数量灵活调整,本技术实施例对此不加以限定。此种情况下,任一衡量维度对应的选取图像的数量为k个。
132.示例性地,k的取值根据候选图像的数量与参考百分比的乘积确定,若候选图像的数量与参考百分比的乘积为整数,则k的取值即为候选图像的数量与参考百分比的乘积;若候选图像的数量与参考百分比的乘积不为整数,则k的取值为将候选图像的数量与参考百分比的乘积向下取整得到的数值。参考百分比根据经验设置,例如,参考百分比为2%,此种情况下,若候选图像的数量与参考百分比的乘积为整数,则任一衡量维度对应的选取图像为全部的候选图像中在该任一衡量维度下对应的目标衡量指标为top2%(前2%)的候选图像。
133.在示例性实施例中,在得到各个候选图像在任一衡量维度下分别对应的目标衡量指标后,对各个候选图像在任一衡量维度下分别对应的目标衡量指标进行降序排列,以便于根据排序结果快速确定出该任一衡量维度对应的选取图像。
134.需要说明的是,对于不同的衡量维度对应的选取条件而言,k的取值可以相同,也可以不同,本技术实施例对此不加以限定。k的取值决定了衡量维度对应的选取图像的数量,也就是说,不同的衡量维度对应的选取图像的数量可能相同,也可能不同。
135.需要说明的是,以上所述的任一衡量维度对应的选取条件仅为示例性举例,本技术实施例并不局限于此。示例性地,对于候选图像在该任一衡量维下对应的目标衡量指标越小说明候选图像在该任一衡量维度下具有的标注价值越大的情况,某一候选图像在该任一衡量维度下对应的目标衡量指标满足该任一衡量维度对应的选取条件是指该候选图像在该任一候选维度下对应的目标指标为全部的候选图像在该任一衡量维度下分别对应的目标衡量指标中的前n(n为不小于1的整数)小的目标衡量指标。
136.根据确定任一衡量维度对应的选取图像的方式,能够确定至少两个衡量维度分别对应的选取图像。然后将至少两个衡量维度分别对应的选取图像中的全部图像作为目标图像。示例性地,由于每个衡量维度对应的选取图像均是从候选图像中选取出的,所以不同衡
量维度对应的选取图像中可能存在相同的图像,对于不同衡量维度对应的选取图像中可能存在相同的图像情况,最终确定出的目标图像的数量可能少于至少两个衡量维度分别对应的选取图像的数量的总和。示例性地,若每个衡量维度对应的选取图像的数均为全部的候选图像的数量的2%,衡量维度的数量为三个,则最终确定出的目标图像的数量可能小于全部的候选图像的数量的6%。
137.每个衡量维度对应的选取图像均为在该衡量维度下具有的标注价值较大的候选图像,通过将各个衡量维度分别对应的选取图像中的全部图像作为目标图像,能够保证目标图像的全面性,确定出的目标图像的全面性和可靠性较高,有助于更快地找到标注价值较大的图像,提升效率。
138.在确定出目标图像之后,将目标图像交由标注人员进行标注,以使目标图像具有对象标注信息。目标图像具有的对象标注信息能够较为准确地指示出目标图像中包括的对象的情况。在示例性实施例中,将同一目标图像交由多个标注人员进行标注,综合多个标注人员对目标图像中的对象的标注结果得到目标图像具有的对象标注信息,以提高目标图像具有的对象标注信息的准确性。
139.在示例性实施例中,对候选图像进行对象检测,得到第一对象检测结果以及对增强图像进行对象检测,得到第二对象检测结果的过程均通过调用第一检测模型实现,第一检测模型基于训练图像集训练得到的情况,在使目标图像具有对象标注信息之后,还包括:利用具有对象标注信息的目标图像对训练图像集进行更新,得到更新后的训练图像集;基于更新后的训练图像集对第一检测模型进行训练,得到用于对图像进行对象检测的第二检测模型。
140.其中,训练图像集中的图像具有对象标注信息,目标图像具有的对象标注信息通过对目标图像中的对象进行标注得到。也就是说,本技术实施例提供的确定图像的方法能够应用于训练检测模型的过程中。根据训练检测模型所依据的图像的类型不同,具体的应用场景有所不同。示例性地,训练检测模型所依据的图像的类型为街道图像,则具体的应用场景为训练街道元素检测模型的应用场景。示例性地,训练检测模型所依据的图像为病理图像,则具体的应用场景为训练病变细胞检测模型的应用场景。
141.示例性地,利用具有对象标注信息的目标图像对训练图像集进行更新的方式为:将具有对象标注信息的目标图像添加到训练图像集中。
142.在得到更新后的训练图像集后,基于更新后的训练图像集对第一检测模型进行训练,得到用于对图像进行对象检测的第二检测模型。需要说明的是,利用第二检测模型进行对象检测的图像是指输入第二检测模型的图像,也就是说,第二检测模型用于对输入该第二检测模型的图像进行对象检测,以得到用于指示输入的图像中的对象的情况的对象检测结果。相比于更新前的训练图像集,更新后的训练图像集中包括的具有对象标注信息的图像的数量更多,基于更新后的训练图像集对第一检测模型进行训练的过程相当于基于更新后的训练图像集对第一检测模型进行微调的过程,将微调之后的第一检测模型作为第二检测模型,第二检测模型比第一检测模型具有更好地对象检测效果。基于更新后的训练图像集对第一检测模型进行训练的过程为监督训练过程,具体的训练方式与第一检测模型的模型结构有关,本技术实施例对此不加以限定。
143.在一种可能实现方式中,在得到第二检测模型之后,利用验证图像集测试第二检
测模型的对象检测效果,若第二检测模型的对象检测效果达到预期效果,则将第二检测模型作为最终得到的目标检测模型。若第二检测模型的对象检测效果未达到预期效果,则再次确定需要进行标注的目标图像,以利用再次确定出的目标图像对训练图像集再次进行更新,基于再次更新后的训练图像集对第二检测模型进行训练,得到第三检测模型,以此类推,直至得到对象检测效果达到预期效果的检测模型,将对象检测效果达到预期效果的检测模型作为最终得到的目标检测模型。
144.目标检测模型为训练得到的具有较好的对象检测效果的模型,在得到目标检测模型之后,利用目标检测模型执行对象检测任务。示例性地,利用目标检测模型执行对象检测任务的过程为:调用目标检测模型对待检测图像进行对象检测,得到用于指示待检测图像中的对象的情况的对象检测结果。
145.基于本技术实施例提供的方法确定出的目标图像为较为全面的标注价值大的图像,所以利用目标图像对检测模型进行微调的效果更佳明显,有利于减少得到对象检测效果达到预期效果的检测模型所需的具有对象标注信息的图像的数量,大大减少人工标注成本。
146.在本技术实施例中,在对不具有对象标注信息的候选图像的标注价值进行衡量时,采用候选图像在至少两个衡量维度下分别对应的目标衡量指标来衡量,能够保证确定出更加全面的需要进行标注的图像,能够更快地找到最有标注价值的图像进行标注,提升效率。此外,本技术实施例考虑了模型本身的不确定性因素,在对候选图像进行衡量之前,先对候选图像进行数据增强处理,得到候选图像对应的增强图像,然后将候选图像和增强图像分别送入检测模型中进行对象检测,候选图像在某一衡量维度下对应的目标衡量指标是通过综合考虑候选图像以及候选图像对应的增强图像得到的,有利于减少模型本身的不确定性带来的噪音,减少在主动学习过程由于模型本身带来的偏差。
147.在本技术实施例中,目标图像是根据候选图像在至少两个衡量维度下分别对应的目标衡量指标确定出的,在此种方式下,目标图像的确定过程关注了候选图像在至少两个衡量维度下分别对应的目标衡量指标,考虑的衡量维度较全面,有利于确定出较为全面的需要进行标注的目标图像,确定出的目标图像的全面性和可靠性较高。
148.在示例性实施例中,本技术实施例提供的确定图像的方法能够应用于训练病变细胞检测模型的应用场景中,病变细胞检测模型用于对病理图像进行病变细胞检测。本技术实施例以病理图像为宫颈脱落细胞涂片图像为例进行说明。宫颈脱落细胞涂片图像为对宫颈脱落细胞涂片进行图像采集得到的图像。利用病变细胞检测模型对宫颈脱落细胞涂片图像进行病变细胞检测,能够检测出宫颈脱落细胞涂片图像中的病变细胞所处的位置以及病变细胞的类别。在此种情况下,候选图像是指候选宫颈脱落细胞涂片图像,候选图像中的对象为病变细胞,检测模型是指病变细胞检测模型。
149.对宫颈脱落细胞涂片图像进行病变细胞检测为筛查宫颈癌的有效手段。宫颈癌病因明确,由人类乳头瘤病毒(human papilloma virus,hpv)感染所致,通过筛查、早期诊断和早期治疗,能够有效地减少发病率和死亡率。目前有效的筛查方案包括高危型hpv检测、宫颈细胞学筛查和两者联合筛查等模式。宫颈细胞学筛查是基于宫颈脱落细胞涂片进行病理诊断。利用病变细胞检测模型进行病变细胞检测是一种基于人工智能的宫颈脱落细胞涂片图像辅助诊断方法,可以辅助基层病理医生用于宫颈细胞学诊断。
150.参见图6,在本技术实施例提供的确定图像的方法下,训练病变细胞检测模型的过程包括以下步骤601至步骤609。
151.步骤601,从已标注宫颈脱落细胞涂片图像库中获取训练图像集。
152.已标注宫颈脱落细胞涂片图像库中包括具有病变细胞标注信息的宫颈脱落细胞涂片图像,病变细胞标注信息包括用于指示宫颈脱落细胞涂片图像中的病变细胞所在的位置的位置信息以及用于指示宫颈脱落细胞涂片图像中的病变细胞的类别的类别信息。示例性地,病变细胞所在的位置利用矩形框进行标注,位置信息包括矩形框的定位点坐标和矩形框的尺寸。类别信息用于明确指示出病变细胞所属的类别。
153.病变细胞所属的类别为候选病变类别中的任一种类别。示例性地,宫颈脱落细胞涂片图像中存在的病变细胞对应的候选病变类别包括ascus、lsil、hsil、asch、scc、adc、agc、滴虫,念珠菌,疱疹病毒,放线菌,菌落变化等。
154.例如,具有病变细胞标注信息的宫颈脱落细胞涂片图像如图7所示。在图7中,利用矩形框701指示宫颈脱落细胞涂片图像中的病变细胞所在的位置,利用标识“lsil”指示宫颈脱落细胞涂片图像中的病变细胞的类别。
155.训练图像集可以是指已标注宫颈脱落细胞涂片图像库中的全部图像构成的图像集,也可以是指已标注宫颈脱落细胞涂片图像库中的部分图像构成的图像集,本技术实施例对此不加以限定。
156.步骤602,基于训练图像集训练得到病变细胞检测模型。
157.步骤603,利用验证图像集对病变细胞检测模型的病变细胞检测效果进行测试,若病变细胞检测模型的病变细胞检测效果达到预期效果,则执行步骤609;若病变细胞检测模型的病变细胞检测效果未达到预期效果,则执行步骤604。
158.病变细胞检测模型的病变细胞检测效果用于指示病变细胞检测模型从验证图像集中检测出的病变细胞的准确性。将病变细胞检测模型对验证图像集进行病变细胞检测得到的病变细胞检测结果与验证图像集具有的病变细胞标注信息进行比对,即可确定病变细胞检测模型的病变细胞检测效果。预期效果根据经验设置,或者根据应用场景灵活调整,本技术实施例对此不加以限定。
159.步骤604,从未标注宫颈脱落细胞涂片图像库中选取候选宫颈脱落细胞涂片图像。
160.示例性地,可以将未标注宫颈脱落细胞涂片图像库中的全部图像均作为候选宫颈脱落细胞涂片图像,也可以将未标注宫颈脱落细胞涂片图像库中的部分图像作为候选宫颈脱落细胞涂片图像,本技术实施例对此不加以限定。
161.步骤605,调用病变细胞检测模型对候选宫颈脱落细胞涂片图像进行病变细胞检测,得到第一病变细胞检测结果。
162.该步骤605的实现方式参见步骤202,此处不再赘述。
163.步骤606,基于第一病变细胞检测结果,获取候选宫颈脱落细胞涂片图像在至少两个衡量维度下分别对应的目标衡量指标。
164.该步骤606的实现方式参见步骤203,此处不再赘述。
165.示例性地,对于基于第一病变细胞检测结果,获取候选宫颈脱落细胞涂片图像在至少两个衡量维度下分别对应的目标衡量指标的过程是指基于第一病变细胞检测结果和第二病变细胞检测结果,获取候选宫颈脱落细胞涂片图像在至少两个衡量维度下分别对应
的目标衡量指标的情况,需要对候选宫颈脱落细胞涂片图像进行数据增强处理,得到候选宫颈脱落细胞涂片图像对应的增强宫颈脱落细胞涂片图像。
166.示例性地,候选宫颈脱落细胞涂片图像以及候选宫颈脱落细胞涂片图像对应的增强宫颈脱落细胞涂片图像如图8所示。在图8中,候选宫颈脱落细胞涂片图像801对应的增强宫颈脱落细胞涂片图像为4个,增强宫颈脱落细胞涂片图像802通过将候选宫颈脱落细胞涂片图像801水平翻转得到,增强宫颈脱落细胞涂片图像803通过将候选宫颈脱落细胞涂片图像801垂直翻转得到,增强宫颈脱落细胞涂片图像804通过将候选宫颈脱落细胞涂片图像801缩小至原尺寸的0.8倍得到,增强宫颈脱落细胞涂片图像805通过将候选宫颈脱落细胞涂片图像801放大至原尺寸的1.2倍得到。
167.步骤607,基于候选宫颈脱落细胞涂片图像在至少两个衡量维度下分别对应的目标衡量指标,确定目标宫颈脱落细胞涂片图像,对目标宫颈脱落细胞涂片图像进行人工标注。
168.该步骤607的实现方式参见步骤204,此处不再赘述。
169.步骤608,利用具有病变细胞标注信息的目标宫颈脱落细胞涂片图像对已标注宫颈脱落细胞涂片图像库进行更新,然后返回执行步骤601。
170.步骤609,完成模型训练过程,得到训练好的病变细胞检测模型。
171.基于本技术实施例提供的确定图像的方法训练病变细胞检测模型的方法可视为一种主动学习方法。在此种主动学习过程中,先基于具有病变细胞标注信息的训练图像集训练病变细胞检测模型,然后基于训练得到的病变细胞检测模型处理不具有病变细胞标注信息的图像,然后根据确定图像的方法选择标注价值大的一批图像进行人工标注,在确定需要进行标注的图像的过程中,采用数据增强以及多种不同的衡量维度进行衡量,将标注好的具有病变细胞标注信息的图像加入训练图像集中对病变细胞检测模型进行微调,得到新的病变细胞检测模型;重复上述过程,直到得到在验证图像集上的病变细胞检测效果达到预期效果的训练好的病变细胞检测模型。基于此种主动学习方法能够有效减少病变细胞检测模型训练所需的标注量,大大减少人工标注成本。
172.训练好的病变细胞检测模型能够应用在宫颈脱落细胞涂片的病理辅助诊断中,训练好的病变细胞检测模型能够自动检测宫颈脱落细胞涂片图像中的病变细胞所处的位置以及自动确定宫颈脱落细胞涂片图像中的病变细胞的类别,从而辅助病理医生进行诊断。具体地,病理医生通过图像采集设备(如相机和扫描仪)获取宫颈脱落细胞涂片图像,然后通过调用训练好的病变细胞检测模型检测宫颈脱落细胞涂片图像中的病变细胞所处的位置和病变细胞的类别,然后将检测得到的结果通过显示设备呈现给病理医生,用于辅助诊断。
173.在示例性实施例中,本技术实施例提供的确定图像的方法能够应用于训练街道元素检测模型的应用场景中,街道元素检测模型用于对街道图像进行街道元素检测。街道图像为对街道进行图像采集得到的图像。利用街道元素检测模型对街道图像进行街道元素检测,能够检测出街道图像中的街道元素所处的位置以及街道元素的类别。在此种情况下,候选图像是指候选街道图像,候选图像中的对象为街道元素(如,车辆、行人等),检测模型是指街道元素检测模型。
174.在本技术实施例提供的确定图像的方法下,训练街道元素检测模型的过程为:1、
从已标注街道图像库中获取训练图像集;2、基于训练图像集训练得到街道元素检测模型;3、利用验证图像集对街道元素检测模型的街道元素检测效果进行测试,若街道元素检测模型的街道元素检测效果达到预期效果,则执行步骤9,若街道元素检测模型的街道元素检测效果未达到预期效果,则执行步骤4;4、从未标注街道图像库中选取候选街道图像;5、调用街道元素检测模型对候选街道图像进行街道元素检测,得到第一街道元素检测结果;6、基于第一街道元素检测结果,获取候选街道图像在至少两个衡量维度下分别对应的目标衡量指标;7、基于候选街道图像在至少两个衡量维度下分别对应的目标衡量指标,确定目标街道图像,对目标街道图像进行人工标注;8、利用具有街道元素标注信息的目标街道图像对已标注街道图像库进行更新,然后返回执行步骤1;9、完成模型训练过程,得到训练好的街道元素检测模型。在此种主动学习过程中,能够有效减少街道元素检测模型训练所需的标注量,大大减少人工标注成本。
175.参见图9,本技术实施例提供了一种确定图像的装置,该装置包括:
176.第一获取单元901,用于获取候选图像,候选图像不具有对象标注信息;
177.检测单元902,用于对候选图像进行对象检测,得到第一对象检测结果;
178.第二获取单元903,用于基于第一对象检测结果,获取候选图像在至少两个衡量维度下分别对应的目标衡量指标,候选图像在任一衡量维度下对应的目标衡量指标用于衡量候选图像在任一衡量维度下具有的标注价值;
179.确定单元904,用于基于候选图像在至少两个衡量维度下分别对应的目标衡量指标,从候选图像中确定目标图像,目标图像用于进行标注,以得到对象标注信息。
180.在一种可能实现方式中,第二获取单元903,用于对候选图像进行数据增强处理,得到候选图像对应的增强图像;对增强图像进行对象检测,得到第二对象检测结果;基于第一对象检测结果和第二对象检测结果,获取候选图像在至少两个衡量维度下分别对应的目标衡量指标。
181.在一种可能实现方式中,第一对象检测结果包括各个第一对象分别对应的子检测结果,第二对象检测结果包括各个第二对象分别对应的子检测结果,各个第一对象通过对候选图像进行对象检测得到,各个第二对象通过对增强图像进行对象检测得到;第二获取单元903,还用于基于各个第一对象分别对应的子检测结果,确定候选图像在至少两个衡量维度下分别对应的第一衡量指标;基于各个第二对象分别对应的子检测结果,确定候选图像在至少两个衡量维度下分别对应的第二衡量指标;基于第一衡量指标以及第二衡量指标,确定候选图像在至少两个衡量维度下分别对应的目标衡量指标。
182.在一种可能实现方式中,第二获取单元903,还用于基于任一第一对象对应的子检测结果,确定任一第一对象对应的子衡量指标,任一第一对象对应的子衡量指标用于指示任一第一对象的检测不确定度;基于各个第一对象分别对应的子衡量指标,确定候选图像在至少两个衡量维度下分别对应的第一衡量指标。
183.在一种可能实现方式中,第二获取单元903,还用于确定各个第一对象分别对应的子衡量指标的总和;将总和作为候选图像在至少两个衡量维度中的第一衡量维度下对应的第一衡量指标。
184.在一种可能实现方式中,第二获取单元903,还用于确定各个第一对象分别对应的子衡量指标的平均值;将平均值作为候选图像在至少两个衡量维度中的第二衡量维度下对
应的第一衡量指标。
185.在一种可能实现方式中,第二获取单元903,还用于在各个第一对象分别对应的子衡量指标中确定最大子衡量指标;将最大子衡量指标作为候选图像在至少两个衡量维度中的第三衡量维度下对应的第一衡量指标。
186.在一种可能实现方式中,第二获取单元903,还用于获取候选图像在任一衡量维度下对应的第一衡量指标与第一权重的第一乘积,以及候选图像在任一衡量维度下对应的第二衡量指标与第二权重的第二乘积;将第一乘积与第二乘积的和作为候选图像在任一衡量维度下对应的目标衡量指标。
187.在一种可能实现方式中,确定单元904,用于基于候选图像在任一衡量维度下对应的目标衡量指标,从候选图像中确定任一衡量维度对应的选取图像,任一衡量维度对应的选取图像为在任一衡量维度下对应的目标衡量指标满足任一衡量维度对应的选取条件的候选图像;将至少两个衡量维度分别对应的选取图像中的全部图像作为目标图像。
188.在一种可能实现方式中,检测单元902,用于调用第一检测模型对候选图像进行对象检测,得到第一对象检测结果。
189.在一种可能实现方式中,第一检测模型基于训练图像集训练得到,训练图像集中的图像具有对象标注信息;参见图10,该装置还包括:
190.训练单元905,用于利用具有对象标注信息的目标图像对训练图像集进行更新,得到更新后的训练图像集,目标图像具有的对象标注信息通过对目标图像中的对象进行标注得到;基于更新后的训练图像集对第一检测模型进行训练,得到用于对图像进行对象检测的第二检测模型。
191.在本技术实施例中,目标图像是根据候选图像在至少两个衡量维度下分别对应的目标衡量指标确定出的,在此种方式下,目标图像的确定过程关注了候选图像在至少两个衡量维度下分别对应的目标衡量指标,考虑的衡量维度较全面,有利于确定出较为全面的需要进行标注的目标图像,确定出的目标图像的全面性和可靠性较高。
192.需要说明的是,上述实施例提供的装置在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
193.在示例性实施例中,还提供了一种计算机设备,该计算机设备包括处理器和存储器,该存储器中存储有至少一条计算机程序。该至少一条计算机程序由一个或者一个以上处理器加载并执行,以使该计算机设备实现上述任一种确定图像的方法。示例性地,该计算机设备可以为服务器,也可以为终端,接下来,对服务器和终端的结构分别进行介绍。
194.图11是本技术实施例提供的一种服务器的结构示意图,该服务器可因配置或性能不同而产生比较大的差异,可以包括一个或多个处理器(central processing units,cpu)1101和一个或多个存储器1102,其中,该一个或多个存储器1102中存储有至少一条计算机程序,该至少一条计算机程序由该一个或多个处理器1101加载并执行,以使该服务器实现上述各个方法实施例提供的确定图像的方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实
现设备功能的部件,在此不做赘述。
195.图12是本技术实施例提供的一种终端的结构示意图。该终端可以是:智能手机、平板电脑、笔记本电脑或台式电脑。终端还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
196.通常,终端包括有:处理器1201和存储器1202。
197.处理器1201可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1201可以采用dsp(digital signal processing,数字信号处理)、fpga(field

programmable gate array,现场可编程门阵列)、pla(programmable logic array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1201也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称cpu(central processing unit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1201可以集成有gpu(graphics processing unit,图像处理器),gpu用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1201还可以包括ai(artificial intelligence,人工智能)处理器,该ai处理器用于处理有关机器学习的计算操作。
198.存储器1202可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1202还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1202中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器1201所执行,以使该终端实现本技术中方法实施例提供的确定图像的方法。
199.在一些实施例中,终端还可选包括有:外围设备接口1203和至少一个外围设备。处理器1201、存储器1202和外围设备接口1203之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1203相连。具体地,外围设备包括:射频电路1204、显示屏1205、摄像头组件1206、音频电路1207、定位组件1208和电源1209中的至少一种。
200.外围设备接口1203可被用于将i/o(input/output,输入/输出)相关的至少一个外围设备连接到处理器1201和存储器1202。射频电路1204用于接收和发射rf(radio frequency,射频)信号,也称电磁信号。射频电路1204通过电磁信号与通信网络以及其他通信设备进行通信。显示屏1205用于显示ui(user interface,用户界面)。该ui可以包括图形、文本、图标、视频及其它们的任意组合。摄像头组件1206用于采集图像或视频。
201.音频电路1207可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器1201进行处理,或者输入至射频电路1204以实现语音通信。扬声器则用于将来自处理器1201或射频电路1204的电信号转换为声波。定位组件1208用于定位终端的当前地理位置,以实现导航或lbs(location based service,基于位置的服务)。电源1209用于为终端中的各个组件进行供电。电源1209可以是交流电、直流电、一次性电池或可充电电池。
202.在一些实施例中,终端还包括有一个或多个传感器1210。该一个或多个传感器1210包括但不限于:加速度传感器1211、陀螺仪传感器1212、压力传感器1213、指纹传感器1214、光学传感器1215以及接近传感器1216。
203.加速度传感器1211可以检测以终端建立的坐标系的三个坐标轴上的加速度大小。陀螺仪传感器1212可以检测终端的机体方向及转动角度,陀螺仪传感器1212可以与加速度传感器1211协同采集用户对终端的3d动作。压力传感器1213可以设置在终端的侧边框和/或显示屏1205的下层。当压力传感器1213设置在终端的侧边框时,可以检测用户对终端的握持信号,由处理器1201根据压力传感器1213采集的握持信号进行左右手识别或快捷操作。当压力传感器1213设置在显示屏1205的下层时,由处理器1201根据用户对显示屏1205的压力操作,实现对ui界面上的可操作性控件进行控制。
204.指纹传感器1214用于采集用户的指纹,由处理器1201根据指纹传感器1214采集到的指纹识别用户的身份,或者,由指纹传感器1214根据采集到的指纹识别用户的身份。光学传感器1215用于采集环境光强度。接近传感器1216,也称距离传感器,通常设置在终端的前面板。接近传感器1216用于采集用户与终端的正面之间的距离。
205.本领域技术人员可以理解,图12中示出的结构并不构成对终端的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
206.在示例性实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条计算机程序,该至少一条计算机程序由计算机设备的处理器加载并执行,以使计算机实现上述任一种确定图像的方法。
207.在一种可能实现方式中,上述计算机可读存储介质可以是只读存储器(read

only memory,rom)、随机存取存储器(random access memory,ram)、只读光盘(compact disc read

only memory,cd

rom)、磁带、软盘和光数据存储设备等。
208.在示例性实施例中,还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述任一种确定图像的方法。
209.应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
210.以上所述仅为本技术的示例性实施例,并不用以限制本技术,凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献