一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

图像标注、获取图像标注模型的方法、装置及设备与流程

2022-07-22 23:14:10 来源:中国专利 TAG:


1.本技术实施例涉及图像处理技术领域,特别涉及一种图像标注、获取图像标注模型的方法、装置及设备。


背景技术:

2.随着图像处理技术的发展,越来越多应用场景需要对图像中的目标对象进行标注。例如,在道路监控场景下,标注出图像中的车辆(目标对象),以便于监督车辆在道路中的行车规范。
3.在相关技术中,在进行图像标注时,从图像上抠取矩形区域,再预测该矩形区域内形状不统一的目标对象的位置,以从图像标注出目标对象。
4.上述图像标注方法由于只能从图像上抠取矩形区域,对于形状不统一的目标对象,矩形区域会引入很多不必要的背景,图像标注的计算量大,效率低。


技术实现要素:

5.本技术实施例提供了一种图像标注、获取图像标注模型的方法、装置及设备,可用于解决相关技术中的问题。所述技术方案如下:
6.一方面,本技术实施例提供了一种图像标注的方法,所述方法包括:
7.获取第一图像,所述第一图像中存在至少一个待标注的目标对象;
8.获取所述第一图像的多个尺寸的特征图,所述多个尺寸的特征图中的各个尺寸的特征图包括多个第一特征向量;
9.从所述多个尺寸的特征图的第一特征向量中选择满足筛选条件的第一特征向量,得到至少一个目标对象对应的第一特征向量;
10.获取所述至少一个目标对象对应的第一特征向量之间的相关性数据,基于所述相关性数据标注所述至少一个目标对象中的各个目标对象。
11.在一种可能的实现方式中,所述从所述多个尺寸的特征图的第一特征向量中选择满足筛选条件的第一特征向量,包括:
12.获取所述各个尺寸的特征图的关联评分,所述关联评分用于反应特征图中的多个第一特征向量与所述至少一个目标对象的关联度;
13.基于所述各个尺寸的特征图的关联评分从所述多个尺寸的特征图的第一特征向量中选择满足所述筛选条件的第一特征向量。
14.在一种可能的实现方式中,所述基于所述各个尺寸的特征图的关联评分从所述多个尺寸的特征图的第一特征向量中选择满足所述筛选条件的第一特征向量,包括:
15.基于所述多个尺寸的特征图的第一特征向量的数量确定第一数量,将所述多个尺寸的特征图的第一特征向量按照关联度顺序排列,选择排列在所述第一数量之前的第一特征向量作为满足所述筛选条件的第一特征向量。
16.在一种可能的实现方式中,所述基于所述相关性数据标注所述至少一个目标对象
中的各个目标对象,包括:
17.基于所述相关性数据预测所述目标对象对应各个类别的概率;
18.基于所述目标对象对应各个类别的概率标注所述目标对象的类别。
19.在一种可能的实现方式中,所述基于所述相关性数据标注所述至少一个目标对象中的各个目标对象,包括:
20.映射所述相关性数据得到所述目标对象的四维向量,基于所述四维向量标注所述目标对象的位置。
21.在一种可能的实现方式中,所述方法还包括:
22.获取所述第一图像对应的图像标注模型,所述图像标注模型包括特征提取模块、筛选模块与自注意力模块;
23.所述获取所述第一图像的多个尺寸的特征图,包括:
24.调用所述特征提取模块获取所述第一图像的多个尺寸的特征图;
25.所述从所述多个尺寸的特征图的第一特征向量中选择满足筛选条件的第一特征向量,包括:
26.调用所述筛选模块从所述多个尺寸的特征图的第一特征向量中选择满足所述筛选条件的第一特征向量;
27.所述获取所述至少一个目标对象对应的第一特征向量之间的相关性数据,基于所述相关性数据标注所述至少一个目标对象中的各个目标对象,包括:
28.调用所述自注意力模块获取所述至少一个目标对象对应的第一特征向量之间的相关性数据,基于所述相关性数据标注所述至少一个目标对象中的各个目标对象。
29.在一种可能的实现方式中,所述特征提取模块包括多层特征提取子模块,不同层的特征提取子模块输出的特征图的尺寸不同,上一层特征提取子模块输出的特征图为下一层特征提取子模块络的输入。
30.另一方面,本技术实施例提供了一种获取图像标注模型的方法,所述方法包括:
31.获取用于训练的第二图像,所述第二图像中存在至少一个训练对象;
32.获取初始图像标注模型,所述初始图像标注模型包括初始特征提取模块,初始筛选模块与初始自注意力模块;
33.调用所述初始特征提取模块获取所述第二图像的多个尺寸的样本特征图,所述多个尺寸的样本特征图中的各个尺寸的样本特征图包括多个第二特征向量;
34.调用所述初始筛选模块从所述多个尺寸的样本特征图的第二特征向量中选择满足初始筛选条件的第二特征向量,得到至少一个训练对象对应的第二特征向量;
35.调用所述初始自注意力模块获取所述至少一个训练对象对应的第二特征向量之间的相关性样本数据,基于所述相关性样本数据标注所述至少一个训练对象中的各个训练对象,得到标注结果;
36.获取所述至少一个训练对象中的各个训练对象的标注信息,基于所述标注结果与所述标注信息更新所述初始图像标注模型,得到图像标注模型。
37.另一方面,提供了一种图像标注的装置,所述装置包括:
38.获取模块,用于获取第一图像,所述第一图像中存在至少一个待标注的目标对象;
39.所述获取模块,还用于获取所述第一图像的多个尺寸的特征图,所述多个尺寸的
特征图中的各个尺寸的特征图包括多个第一特征向量;
40.选择模块,用于从所述多个尺寸的特征图的第一特征向量中选择满足筛选条件的第一特征向量,得到至少一个目标对象对应的第一特征向量;
41.标注模块,用于获取所述至少一个目标对象对应的第一特征向量之间的相关性数据,基于所述相关性数据标注所述至少一个目标对象中的各个目标对象。
42.在一种可能的实现方式中,所述选择模块,用于获取所述各个尺寸的特征图的关联评分,所述关联评分用于反应特征图中的多个第一特征向量与所述至少一个目标对象的关联度;基于所述各个尺寸的特征图的关联评分从所述多个尺寸的特征图的第一特征向量中选择满足所述筛选条件的第一特征向量。
43.在一种可能的实现方式中,所述选择模块,用于基于所述多个尺寸的特征图的第一特征向量的数量确定第一数量,将所述多个尺寸的特征图的第一特征向量按照关联度顺序排列,选择排列在所述第一数量之前的第一特征向量作为满足所述筛选条件的第一特征向量。
44.在一种可能的实现方式中,所述标注模块,用于基于所述相关性数据预测所述目标对象对应各个类别的概率;基于所述目标对象对应各个类别的概率标注所述目标对象的类别。
45.在一种可能的实现方式中,所述标注模块,用于映射所述相关性数据得到所述目标对象的四维向量,基于所述四维向量标注所述目标对象的位置。
46.在一种可能的实现方式中,所述获取模块,还用于获取所述第一图像对应的图像标注模型,所述图像标注模型包括特征提取模块、筛选模块与自注意力模块;调用所述特征提取模块获取所述第一图像的多个尺寸的特征图;所述选择模块,还用于调用所述筛选模块从所述多个尺寸的特征图的第一特征向量中选择满足所述筛选条件的第一特征向量;所述标注模块,还用于调用所述自注意力模块获取所述至少一个目标对象对应的第一特征向量之间的相关性数据,基于所述相关性数据标注所述至少一个目标对象中的各个目标对象。
47.在一种可能的实现方式中,所述特征提取模块包括多层特征提取子模块,不同层的特征提取子模块输出的特征图的尺寸不同,上一层特征提取子模块输出的特征图为下一层特征提取子模块络的输入。
48.另一方面,提供了一种获取图像标注模型的装置,所述装置包括:
49.获取模块,用于获取用于训练的第二图像,所述第二图像中存在至少一个训练对象;
50.所述获取模块,还用于获取初始图像标注模型,所述初始图像标注模型包括初始特征提取模块,初始筛选模块与初始自注意力模块;
51.所述获取模块,还用于调用所述初始特征提取模块获取所述第二图像的多个尺寸的样本特征图,所述多个尺寸的样本特征图中的各个尺寸的样本特征图包括多个第二特征向量;
52.选择模块,用于调用所述初始筛选模块从所述多个尺寸的样本特征图的第二特征向量中选择满足初始筛选条件的第二特征向量,得到至少一个训练对象对应的第二特征向量;
53.标注模块,用于调用所述初始自注意力模块获取所述至少一个训练对象对应的第二特征向量之间的相关性样本数据,基于所述相关性样本数据标注所述至少一个训练对象中的各个训练对象,得到标注结果;
54.更新模块,用于获取所述至少一个训练对象中的各个训练对象的标注信息,基于所述标注结果与所述标注信息更新所述初始图像标注模型,得到图像标注模型。
55.另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行,以使所述计算机设备实现上述任一所述的图像标注的方法,或者实现上述任一所述的获取图像标注模型的方法。
56.另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行,以使计算机实现上述任一所述的图像标注的方法,或者实现上述任一所述的获取图像标注模型的方法。
57.另一方面,还提供了一种计算机程序产品或计算机程序,所述计算机程序产品或计算机程序包括计算机指令,所述计算机指令存储在计算机可读存储介质中。计算机设备的处理器从所述计算机可读存储介质读取所述计算机指令,处理器执行所述计算机指令,使得所述计算机设备执行上述任一所述的图像标注的方法,或者实现上述任一所述的获取图像标注模型的方法。
58.本技术实施例提供的技术方案至少带来如下有益效果:
59.在图像标注时通过选择满足筛选条件的第一特征向量,作为目标对象对应的第一特征向量,有效控制了后续在标注目标对象时的计算量,提高了标注效率。此外,在基于第一特征向量标注目标对象时,会考虑到各个第一特征向量之间的相关性数据,基于各个第一特征向量之间的相关性数据标注目标对象,提高了标注的准确率。
60.在获取图像标注模型过程中,通过筛选第二特征向量,有效控制了初始自注意力模块标注训练对象时的计算量,提高了训练效率。
附图说明
61.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
62.图1是本技术实施例提供的一种实施环境的示意图;
63.图2是本技术实施例提供的一种图像标注的方法流程图;
64.图3是本技术实施例提供的一种采用图像标注模型进行图像标注的过程示意图;
65.图4是本技术实施例提供的一种获取图像标注模型的方法流程图;
66.图5是本技术实施例提供的一种图像标注结果的界面示意图;
67.图6是本技术实施例提供的一种图像标注的装置的结构示意图;
68.图7是本技术实施例提供的一种获取图像标注模型的装置的结构示意图;
69.图8是本技术实施例提供的一种服务器的结构示意图;
70.图9是本技术实施例提供的一种网络设备的结构示意图。
具体实施方式
71.为使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术实施方式作进一步地详细描述。
72.本技术实施例提供了一种图像标注、获取图像标注模型的方法,请参考图1,其示出了本技术实施例提供的方法实施环境的示意图。该实施环境可以包括:终端11和服务器12。
73.其中,终端11和服务器12可以独立实现本技术实施例提供的图像标注、获取图像标注模型的方法。终端11和服务器12还可以通过交互实现本技术实施例提供的图像标注、获取图像标注模型的方法。例如,终端11获取第一图像,将获取到的第一图像发送至服务器12,服务器12可应用本技术实施例提供的方法标注第一图像中的目标对象。或者,终端11获取第二图像,将获取到的第二图像发送至服务器12,服务器12可应用本技术实施例提供的方法获取图像标注模型,将该图像标注模型发送给终端11,终端11获取第一图像,基于图像标注模型标注第一图像中的目标对象。
74.可选地,终端11可以是任何一种可与用户通过键盘、触摸板、触摸屏、遥控器、语音交互或手写设备等一种或多种方式进行人机交互的电子产品,例如pc(personal computer,个人计算机)、手机、智能手机、pda(personal digital assistant,个人数字助手)、可穿戴设备、ppc(pocket pc,掌上电脑)、平板电脑、智能车机、智能电视、智能音箱等。服务器12可以是一台服务器,也可以是由多台服务器组成的服务器集群,或者是一个云计算服务中心。终端11与服务器12通过有线或无线网络建立通信连接。
75.本领域技术人员应能理解上述终端11和服务器12仅为举例,其他现有的或今后可能出现的终端或服务器如可适用于本技术,也应包含在本技术保护范围以内,并在此以引用方式包含于此。
76.基于上述图1所示的实施环境,本技术实施例提供一种图像标注的方法如图2所示,该图像标注的方法可由终端或服务器执行,以该方法应用于终端为例,该方法包括步骤201-步骤204。
77.在步骤201中,获取第一图像,第一图像中存在至少一个待标注的目标对象。
78.本技术实施例不对终端获取第一图像的方式进行限定,可通过包括但不限于如下三种方式获取。
79.获取方式一、基于图像采集装置获取第一图像。
80.可选地,图像采集装置可以设置在任意地方,可以设置在终端上,也可以设置在终端外。例如,图像采集装置是设置在道路两旁,用于拍摄来往车辆的摄像头。示例性地,当图像采集装置设置在终端外时,终端与图像采集装置进行通信连接,基于通信连接获取图像,得到第一图像。其中,终端与图像采集装置的通信连接可以是直接通过有线或无线网络实现,也可以基于其他网络设备实现。以图像采集装置为设置在道路两旁的摄像头为例,摄像头在拍摄图像后,将拍摄得到的图像上传至道路管理中心的服务器(其他网络设备),道路管理中心的服务器将图像存储在存储空间。终端基于与道路管理中心的服务器的通信连接访问存储空间,将访问存储空间获取得到的图像作为第一图像。当图像采集装置设置在终端上时,终端可基于图像采集装置拍摄图像,将拍摄得到的图像作为第一图像。
81.此外,图像采集装置采集的图像可以是静态图像,此时终端可将采集到的图像作
为第一图像,或者对静态图像进行裁切操作,将裁切后的静态图像作为第一图像。当然,图像采集装置采集的图像也可以是非静态图像,例如视频。此时终端可从非静态图像中截取图像,将截取得到的图像作为第一图像。
82.获取方式二、从图像数据库中获取第一图像。
83.可选地,图像数据库用于提供图像以满足业务需求。业务需求可以是训练算法的需求,也可以是统计分析的需求,还可以是其他需求。终端通过访问图像数据库,获取存储在图像数据库中的图像,作为第一图像。其中,图像数据库中的图像可以是基于图像采集装置获取,也可以基于其他方式获取,本技术实施例对此不进行限定。
84.获取方式三、终端访问存储空间获取第一图像。
85.可选地,终端的存储空间内存储有至少一张图像,终端从存储在存储空间内的至少一张图像中选择一张图像作为第一图像。关于存储空间内的图像,可以是基于上述两种获取方式获取后存储在存储空间内,也可以基于其他方式获取后存储在存储空间内,本技术实施例对此不进行限定。
86.需要说明的是,无论终端基于何种方式获取第一图像,第一图像中存在至少一个待标注的目标对象。在一种可能的实现方式中,图像标注的目的是标注出第一图像中的小目标,此时,目标对象是指分辨率小于目标阈值的对象,也即该小目标为该目标对象。示例性地,目标阈值为基于经验设置的任意值,例如,设置目标阈值为30
×
30。第一图像中分辨率小于30
×
30的属于待标注的目标对象。本技术实施例不对第一图像中的目标对象的类别进行限定,目标对象的类别可以是车辆,可以是行人,也可以是广告牌,还可以是其他类型。一张图像中存在的目标对象的类别的数量可以为一个也可以为多个。例如,确定第一图像中的车辆与行人属于待标注的目标对象。
87.在步骤202中,获取第一图像的多个尺寸的特征图,多个尺寸的特征图中的各个尺寸的特征图包括多个第一特征向量。
88.在一种可能的实现方式中,在获取第一图像的多个尺寸的特征图前,还会对第一图像执行预处理操作,以提升第一图像的质量,进而提高第一图像的标注结果的精确度。示例性地,预处理可以为对第一图像进行角度矫正,预处理还可以为对第一图像进行去噪。
89.本技术实施例不对获取多个尺寸的特征图的过程进行限定。可选地,对第一图像进行多尺度放缩,得到不同尺寸的图像,在不同尺寸的图像上提取第一特征向量,得到多个尺寸的包括第一特征向量的特征图。由于不同尺寸的特征图所包括的特征信息不同,例如,尺寸小的特征图的空间信息高于尺寸大的特征图,尺寸大的特征图的语义信息高于尺寸小的特征图,通过获取不同尺寸的特征图,得到更为丰富的特征信息。
90.示例性地,针对终端在标注第一图像前获取第一图像对应的图像标注模型,图像标注模型包括特征提取模块、筛选模块与自注意力模块的情况,终端调用特征提取模块获取第一图像的多个尺寸的特征图。其中,第一图像对应的图像标注模型是指用于提取第一图像中存在的目标对象的图像标注模型。以第一图像中存在的目标对象为车辆与行人为例,第一图像对应的图像标注模型也即是用于标注第一图像中的行人与车辆的模型。
91.在一种可能的实现方式中,特征提取模块包括多层特征提取子模块,不同层的特征提取子模块输出的特征图的尺寸不同,上一层特征提取子模块输出的特征图为下一层特征提取子模块的输入。
92.可选地,特征提取模块为fpn(feature pyramid networks,特征金字塔网络),此时,特征提取子模块也即是fpn中的每一层网络。图3为本技术实施例提供的一种采用图像标注模型进行图像标注的过程示意图,如图3所示,图像标注模型包括特征提取模块301、筛选模块302以及自注意力模块303。在将第一图像输入至特征提取模块后,通过特征提取模块对第一图像依次执行了四次下采样操作。将前一次下采样的输出作为后一次下采样的输入。通过下采样缩小第一图像的尺寸,基于缩小后的第一图像提取该尺寸下的第一特征向量。执行四次下采样操作得到第4层特征图(304)后,再对第4层特征图依次执行三次上采样操作(放大特征图的尺寸)。
93.需要注意的是,在对第4层特征图执行三次上采样操作时,会将其与其对应的尺寸相同的特征图横向连接,从而将各层特征图的特征信息进行融合,得到表达力更强的不同尺寸的特征图。其中,横向连接可以是通过像素间的加法实现。表达力更强也即是特征图中包括的特征信息更丰富。关于特征图与其对应的尺寸相同的特征图,以第一次上采样为例(305),此时特征图对应的尺寸相同的特征图也即是下采样操作得到的第3层特征图(306)。
94.参见图3,在通过上述上采样操作得到四个尺寸不同的特征图时,还会执行两次下采样操作,得到尺寸更小的特征图,使得检测单元格覆盖的区域更广,进而检测第一图像中分辨率更大的目标对象。也即是,通过特征提取模块得到六个尺寸的特征图。可选地,特征提取模块由resnet(residual network,残差网络)组成,不同的特征提取子模块具有不同数量的残差模块,从而获取不同尺寸的特征图。
95.需要说明的是,上述举例旨在说明获取不同尺寸的特征图的过程,而非对不同尺寸的特征图的获取过程进行限定。终端可以选择通过网络模型获取第一图像的不同尺寸的特征图,也可以选择其他方式。网络模型可以是上述实施例示出的特征提取模块,也可以是一个其他模型,还可以是由多个模型组成。
96.此外,针对上采样与下采样的操作顺序,终端可以选择如图3所示的先执行4次下采样操作,再在执行上采样操作的同时,执行2次下采样操作。终端还可以选择直接执行6次下采样操作,再对6次下采样操作得到的特征图执行5次上采样操作。当然,获取的不同尺寸的特征图的数量,可以是上述举例的6张,还可以是其他数量,本技术实施例对此均不进行限定。
97.在步骤203中,从多个尺寸的特征图的第一特征向量中选择满足筛选条件的第一特征向量,得到至少一个目标对象对应的第一特征向量。
98.在一种可能的实现方式中,从多个尺寸的特征图的第一特征向量中选择满足筛选条件的第一特征向量的方式,包括但不限于:获取各个尺寸的特征图的关联评分,关联评分用于反应特征图中的多个第一特征向量与至少一个目标对象的关联度;基于各个尺寸的特征图的关联评分从多个尺寸的特征图的第一特征向量中选择满足筛选条件的第一特征向量。
99.可选地,选择满足筛选条件的第一特征向量的过程,包括:基于多个尺寸的特征图的第一特征向量的数量确定第一数量,将多个尺寸的特征图的第一特征向量按照关联度顺序排列,选择排列在第一数量之前的第一特征向量作为满足筛选条件的第一特征向量。例如,特征融合不同尺寸的特征图,得到一张目标特征图;基于目标特征图中的第一特征向量的数量确定第一数量。可选地,基于目标特征图中的第一特征向量的数量根据经验确定第
一数量。以顺序排列按照关联度从大到小排列为例,目标特征图中包括10000个第一特征向量,根据经验设置目标对象对应的第一特征向量的第一数量为2000。此时,选择排列前2000的第一特征向量。当然,第一数量的确定方式,还可以是基于经验设置筛选比例,基于目标特征图中的第一特征向量的数量与筛选比例确定。以顺序排列按照关联度从大到小排列为例,基于经验设置筛选比例为1/5,目标特征图中包括10000个第一特征向量,此时第一数量为2000,选择排列前2000的第一特征向量。
100.需要说明的是,除了上述举例说明的基于多个尺寸的特征图的第一特征向量的数量确定第一数量,进而确定筛选条件。筛选条件还可以基于经验设置。例如,基于经验设置关联阈值,选择目标特征图中关联度高于关联阈值的第一特征向量作为目标对象对应的第一特征向量。
101.在一种可能的实现方式中,针对图3示出的图像标注模型,可以调用筛选模块从多个尺寸的特征图的第一特征向量中选择满足筛选条件的第一特征向量。可选地,筛选模块由多层卷积网络构成,通过将不同尺寸的特征图输入到其对应的筛选模块,得到不同尺寸的特征图的score map(得分图)。其中,得分图用于指示该点为目标对象的概率,也即是得分图为用于反应第一特征向量与目标对象的关联度的关联评分。通过特征融合多张score map,挑选出top(最高)k(第一数量)的第一特征向量作为目标对象对应的第一特征向量。当然。筛选模块还可以是其他网络结构,本技术实施例对此不进行限定。
102.在步骤204中,获取至少一个目标对象对应的第一特征向量之间的相关性数据,基于相关性数据标注至少一个目标对象中的各个目标对象。
103.在一种可能的实现方式中,通过交互至少一个目标对象对应的第一特征向量,获取至少一个目标对象对应的第一特征向量之间的相关性,得到相关性数据。关于交互至少一个目标对象对应的第一特征向量,可选地,对目标对象对应的第一特征向量的空间位置进行编码,得到由目标对象对应的第一特征向量组成的第一矩阵;基于第一矩阵获取包括至少一个目标对象对应的第一特征向量之间的相关性的第二矩阵,也即是相关性数据。通过获取相关性数据,在后续基于第一特征向量标注目标对象时,还可以基于多个第一特征向量之间的相关性数据辅助判断,进而提高标注结果的精确度。
104.本技术实施例不对基于相关性数据标注至少一个目标对象中的各个目标对象的方式进行限定,可通过包括但不限于如下两种方式。
105.标注方式一、基于相关性数据预测目标对象对应各个类别的概率;基于目标对象对应各个类别的概率标注目标对象的类别。
106.以上述实施例示出的相关性数据为第二矩阵为例,利用线性层映射第二矩阵得到用于分类的得分向量,其中得分向量可以预测目标对象对应各个类别的概率,基于得分向量确定目标对象的类别,从而标注出目标对象的类别。
107.标注方式二、映射相关性数据得到目标对象的四维向量,基于四维向量标注目标对象的位置。
108.以上述实施例示出的相关性数据为第二矩阵为例,利用线性层映射第二矩阵得到四维向量。可选地,四维向量是指用于标注目标对象的边界框坐标。
109.需要说明的是,上述举例旨在说明目标对象的标注过程,而非对目标对象的标注过程进行限定。由于映射相关性数据可以得到目标对象对应各个类别的概率和目标对象的
四维向量,也即是,基于相关性数据可以标注目标对象的位置和类别。因此,终端可以选择标注目标对象的位置和类别的其中一种,也可以同时标注目标对象的位置和类别,本技术实施例对此不进行限定。
110.在一种可能的实现方式中,参见图3示出的图像标注模型,此时标注目标对象的过程,包括:调用自注意力模块获取至少一个目标对象对应的第一特征向量之间的相关性数据,基于相关性数据标注至少一个目标对象中的各个目标对象。可选地,以相关性数据为第二矩阵为例,基于自注意力模块的标注过程为:对目标对象对应的第一特征向量的空间位置进行编码,得到由目标对象对应的第一特征向量组成的第一矩阵;向自注意力模块输入第一矩阵,基于自注意力模块输出包括至少一个目标对象对应的第一特征向量之间的相关性的第二矩阵;映射第二矩阵,基于映射结果标注目标对象。
111.示例性地,基于自注意力模块标注目标对象时,使用了多头注意方式。通过多头注意,允许自注意力模块关注不同的第一特征向量,从而在得到第一特征向量之间的相关性数据时,可以考虑到之前已经注意到的第一特征向量之间的相关性,充分利用不同的第一特征向量之间的相关性。关于第一图像对应的图像标注模型的获取过程可参见图4示出的实施例,在此暂不多加赘述。
112.可选地,终端在标注第一图像中的目标对象后,还会显示标注后的第一图像(307)。如图3所示,307中的矩形框为基于四维向量确定的边界框,通过边界框标注出目标对象的位置。此外,针对标注目标对象的类别的情况,终端可以在目标对象上显示类别,在一种可能的实现方式中,类别包括category(类别)与score(分数)。通过计算分数,查找分数与类别的对应关系,确定类别。示例性地,当score在0.7-0.9区间内,category为4,4用于指示小型轿车。例如,category:4;score:0.78。其中,类别可以标注在边界框内,也可以标注在边界框外。类别可以标注在边界框内的左上角,还可以标注在其他位置,本技术实施例对此不进行限定。关于score与category的对应关系,category与类别的对应关系均可以在图像标注模型的训练过程中确定。
113.在一种可能的实现方式中,当第一图像中不包括目标对象,或是第一图像中包括的目标对象的类别与图像标注模型所能标注的对象类别不同时,输出的第一图像上无边界框和类别标注,也即是标注前的第一图像与标注后的第一图像相同。
114.需要说明的是,基于图像标注模型标注图像的过程,可以如图3所示,向图像标注模型输入第一图像(308),通过特征提取模块、筛选模块与自注意力模块,输出标注后的第一图像(307)。也可以是通过多个独立的模型依次执行上述步骤,完成图像的标注,本技术实施例对此不进行限定。
115.综上所述,本技术实施例提供的图像标注方法,通过选择满足筛选条件的第一特征向量,作为目标对象对应的第一特征向量,有效控制了后续在标注目标对象时的计算量,提高了标注效率。此外,在基于第一特征向量标注目标对象时,会考虑到各个第一特征向量之间的相关性数据,基于各个第一特征向量之间的相关性数据辅助标注目标对象,提高了标注的准确率。通过获取不同的第一特征向量之间的相关性数据来实现目标对象对应的第一特征向量之间的强交互,减少对于冗余背景上的计算,进而提升标注目标对象的速度。
116.基于上述图1所示的实施环境,本技术实施例提供一种获取图像标注模型的方法,如图4所示,以该方法应用于终端为例,该方法包括步骤401-步骤406。
117.在步骤401中,获取用于训练的第二图像,第二图像中存在至少一个训练对象。
118.示例性地,第二图像的获取过程与上述图2步骤201示出的实施例中的第一图像的获取过程类似,在此不再多加赘述。需要说明的是,由于第二图像中的训练对象的类别与图像标注模型的作用相关,因此,在获取第二图像时还要考虑标注需求,基于标注需求获取第二图像。其中,标注需求是指利用图像标注模型标注的对象的类别,在获取第二图像时,保证第二图像中的训练对象的类别与需要利用图像标注模型标注的对象的类别一致。例如,当图像标注模型的作用为标注第一图像中的目标对象时,此时第二图像中的训练对象的类别与目标对象的类别一致。
119.在步骤402中,获取初始图像标注模型,初始图像标注模型包括初始特征提取模块,初始筛选模块与初始自注意力模块。
120.本技术实施例不对获取的初始图像标注模型的网络架构进行限定,可以是由残差网络构成初始特征提取模块,由卷积神经网络构成初始筛选模块以及初始自注意力模块,也可以是其他具有相同功能的网络组成。
121.在步骤403中,调用初始特征提取模块获取第二图像的多个尺寸的样本特征图,多个尺寸的样本特征图中的各个尺寸的样本特征图包括多个第二特征向量。
122.示例性地,调用初始特征提取模块获取多个尺寸的样本特征图的过程与上述图2步骤202示出的实施例中调用特征提取模块获取多个尺寸的特征图的过程类似,在此不再多加赘述。
123.在步骤404中,调用初始筛选模块从多个尺寸的样本特征图的第二特征向量中选择满足初始筛选条件的第二特征向量,得到至少一个训练对象对应的第二特征向量。
124.示例性地,初始筛选条件的确定过程与上述图2步骤203示出的实施例中筛选条件的确定过程类似。调用初始筛选模块选择满足初始筛选条件的第二特征向量的过程与上述图2步骤203示出的实施例中调用筛选模块选择满足筛选条件的第一特征向量的过程类似,在此均不再多加赘述。
125.在步骤405中,调用初始自注意力模块获取至少一个训练对象对应的第二特征向量之间的相关性样本数据,基于相关性样本数据标注至少一个训练对象中的各个训练对象,得到标注结果。
126.示例性地,调用初始自注意力模块标注各个训练对象的过程与上述图2步骤204示出的实施例中调用自注意力模块标注各个目标对象的过程类似,在此不再多加赘述。
127.在步骤406中,获取至少一个训练对象中的各个训练对象的标注信息,基于标注结果与标注信息更新初始图像标注模型,得到图像标注模型。
128.本技术实施例不对获取标注信息的方式进行限定,可以是人工标注各个训练对象,得到标注信息。也可以是通过访问图像数据库,获取图像数据库中用于训练图像标注算法的图像以及图像的标注信息,也即是在获取第二图像中,同时获取第二图像中的各个训练对象的标注信息。还可以是利用运行时间长,但标注精确度满足训练要求的网络结构复杂的参考模型,通过参考模型获取第二图像的标注信息。示例性地,参考模型可以是resnext(一种分类模型),也可以是swin transformer(一种目标检测模型)。标注信息包括位置信息和类别信息中的至少一种。
129.可选地,基于标注信息与标注结果计算初始图像标注模型在标注第二图像时的标
注损失,基于标注损失实现监督学习,更新初始图像标注模型中各模块的参数,得到图像标注模型。关于标注损失,可以基于损失函数计算得到,示例性地,损失函数为交叉熵损失函数。
130.需要说明的是,除了上述举例说明的基于标注损失更新初始图像标注模型中各模块的参数,得到图像标注模型。还可以单独训练初始图像标注模型中的各个模块,得到图像标注模型。可选地,在训练初始筛选模块时,获取包含训练对象的目标mask(掩膜),基于初始筛选模块输出的score map与mask之间的筛选损失,实现监督学习,更新初始筛选模块的参数,得到筛选模块。关于获取mask的过程与上述实施例示出的获取标注信息的过程类似,筛选损失的获取过程与上述实施例示出的标注损失的获取过程类似,在此均不再多加赘述。
131.当然,在训练各个模块时,终端可以选择单独训练,也可以选择依次训练。依次训练例如是,训练初始特征提取模块,基于训练得到的特征提取模块输出训练图像的多个尺寸的样本特征图,基于样本特征图训练初始筛选模块,基于训练得到的筛选模块输出筛选后的第二特征向量,基于筛选后的第二特征向量训练初始自注意力模块,得到自注意力模块。
132.综上所述,本技术实施例提供的获取图像标注模型的方法,通过筛选第二特征向量,有效控制了初始自注意力模块标注训练对象时的计算量,提高了训练效率。训练得到的图像标注模型设计了更简化的网络流程来实现图像的标注,基于训练得到的图像标注模型标注时速度快,精确度高。
133.在一种可能的实现方式中,图4示出的实施例获取的图像标注模型,可以应用于标注车辆与行人的任务中。图像标注结果参见图5,其中,501为标注前的第一图像,502为标注后的第一图像。
134.上述方法在标注车辆与行人的任务中能有效提升性能,优化效果如表1所示:
135.表1
[0136][0137]
从表1可以看出,以ap、ap50、ap75、ar1、ar10、ar100、ar500和fps的角度,将本技术
方案与querydet进行对此。其中,正负样本的划分基于iou(intersection over union,重叠度)实现,将iou大于iou阈值的样本作为正样本,也即是预测正确的样本。iou用于表示模型预测的输出框与真实标记框(标注信息)之间的重叠度。上述表1中ap一栏的数据是多类预测的时候每一类的precision取平均值。ap50中的50是指iou阈值为0.5,ap75中的75是指iou阈值为0.75。ar一栏的数据是所有目标对象中,模型预测正确的目标比例。ar1中的1是指每次标注图像最多只能输出1个输出框,ar10中的10是指每次标注图像最多只能输出10个输出框,ar100中的100是指每次标注图像最多只能输出100个输出框,ar500中的500是指每次标注图像最多只能输出500个输出框。fps一栏的数据是每秒内可以标注的图像数量,以评价图像标注的速度。
[0138]
基于表1的数值可知,本技术实施例提供的技术方案所训练得到的图像标注模型在标注车辆与行人的任务中有更好的表现。
[0139]
参见图6,本技术实施例提供了一种图像标注的装置,该装置包括:获取模块601、选择模块602和标注模块603。
[0140]
获取模块601,用于获取第一图像,第一图像中存在至少一个待标注的目标对象;
[0141]
获取模块601,还用于获取第一图像的多个尺寸的特征图,多个尺寸的特征图中的各个尺寸的特征图包括多个第一特征向量;
[0142]
选择模块602,用于从多个尺寸的特征图的第一特征向量中选择满足筛选条件的第一特征向量,得到至少一个目标对象对应的第一特征向量;
[0143]
标注模块603,用于获取至少一个目标对象对应的第一特征向量之间的相关性数据,基于相关性数据标注至少一个目标对象中的各个目标对象。
[0144]
可选地,选择模块602,用于获取各个尺寸的特征图的关联评分,关联评分用于反应特征图中的多个第一特征向量与至少一个目标对象的关联度;基于各个尺寸的特征图的关联评分从多个尺寸的特征图的第一特征向量中选择满足筛选条件的第一特征向量。
[0145]
可选地,选择模块602,用于基于多个尺寸的特征图的第一特征向量的数量确定第一数量,将多个尺寸的特征图的第一特征向量按照关联度顺序排列,选择排列在第一数量之前的第一特征向量作为满足筛选条件的第一特征向量。
[0146]
可选地,标注模块603,用于基于相关性数据预测目标对象对应各个类别的概率;基于目标对象对应各个类别的概率标注目标对象的类别。
[0147]
可选地,标注模块603,用于映射相关性数据得到目标对象的四维向量,基于四维向量标注目标对象的位置。
[0148]
可选地,获取模块601,还用于获取第一图像对应的图像标注模型,图像标注模型包括特征提取模块、筛选模块与自注意力模块;调用特征提取模块获取第一图像的多个尺寸的特征图;选择模块602,还用于调用筛选模块从多个尺寸的特征图的第一特征向量中选择满足筛选条件的第一特征向量;标注模块603,还用于调用自注意力模块获取至少一个目标对象对应的第一特征向量之间的相关性数据,基于相关性数据标注至少一个目标对象中的各个目标对象。
[0149]
可选地,特征提取模块包括多层特征提取子模块,不同层的特征提取子模块输出的特征图的尺寸不同,上一层特征提取子模块输出的特征图为下一层特征提取子模块络的输入。
[0150]
上述装置在图像标注时通过选择满足筛选条件的第一特征向量,作为目标对象对应的第一特征向量,有效控制了后续在标注目标对象时的计算量,提高了标注效率。此外,在基于第一特征向量标注目标对象时,会考虑到各个第一特征向量之间的相关性数据,基于各个第一特征向量之间的相关性数据辅助标注目标对象,提高了标注的准确率。
[0151]
参见图7,本技术实施例提供了一种获取图像标注模型的装置,该装置包括:获取模块701、选择模块702、标注模块703和更新模块704。
[0152]
获取模块701,用于获取用于训练的第二图像,第二图像中存在至少一个训练对象;
[0153]
获取模块701,还用于获取初始图像标注模型,初始图像标注模型包括初始特征提取模块,初始筛选模块与初始自注意力模块;
[0154]
获取模块701,还用于调用初始特征提取模块获取第二图像的多个尺寸的样本特征图,多个尺寸的样本特征图中的各个尺寸的样本特征图包括多个第二特征向量;
[0155]
选择模块702,用于调用初始筛选模块从多个尺寸的样本特征图的第二特征向量中选择满足初始筛选条件的第二特征向量,得到至少一个训练对象对应的第二特征向量;
[0156]
标注模块703,用于调用初始自注意力模块获取至少一个训练对象对应的第二特征向量之间的相关性样本数据,基于相关性样本数据标注至少一个训练对象中的各个训练对象,得到标注结果;
[0157]
更新模块704,用于获取至少一个训练对象中的各个训练对象的标注信息,基于标注结果与标注信息更新初始图像标注模型,得到图像标注模型。
[0158]
上述装置在获取图像标注模型过程中,通过筛选第二特征向量,有效控制了初始自注意力模块标注训练对象时的计算量,提高了训练效率。
[0159]
需要说明的是,上述实施例提供的装置在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
[0160]
图8是本技术实施例提供的一种服务器的结构示意图,该服务器可因配置或性能不同而产生比较大的差异,可以包括一个或多个处理器(central processing units,cpu)801和一个或多个存储器802,其中,该一个或多个存储器802中存储有至少一条计算机程序,该至少一条计算机程序由该一个或多个处理器801加载并执行,以使该服务器实现上述图2所示的方法实施例提供的图像标注的方法,或者实现上述图4所述的方法实施例提供的获取图像标注模型的方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
[0161]
图9是本技术实施例提供的一种网络设备结构示意图。该设备可以为终端,例如可以是:智能手机、平板电脑、mp3(moving picture experts group audio layer iii,动态影像专家压缩标准音频层面3)播放器、mp4(moving picture experts group audio layer iv,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
[0162]
通常,终端包括有:处理器901和存储器902。
[0163]
处理器901可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器901可以采用dsp(digital signal processing,数字信号处理)、fpga(field-programmable gate array,现场可编程门阵列)、pla(programmable logic array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器901也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称cpu(central processing unit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器901可以集成有gpu(graphics processing unit,图像处理器),gpu用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器901还可以包括ai(artificial intelligence,人工智能)处理器,该ai处理器用于处理有关机器学习的计算操作。
[0164]
存储器902可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器902还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器902中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器901所执行,以使该终端实现上述图2所示的方法实施例提供的图像标注的方法,或者实现上述图4所述的方法实施例提供的获取图像标注模型的方法。
[0165]
在一些实施例中,终端还可选包括有:外围设备接口903和至少一个外围设备。处理器901、存储器902和外围设备接口903之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口903相连。具体地,外围设备包括:射频电路904、显示屏905、摄像头组件906、音频电路907、定位组件908和电源909中的至少一种。
[0166]
外围设备接口903可被用于将i/o(input/output,输入/输出)相关的至少一个外围设备连接到处理器901和存储器902。在一些实施例中,处理器901、存储器902和外围设备接口903被集成在同一芯片或电路板上;在一些其他实施例中,处理器901、存储器902和外围设备接口903中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
[0167]
射频电路904用于接收和发射rf(radio frequency,射频)信号,也称电磁信号。射频电路904通过电磁信号与通信网络以及其他通信设备进行通信。射频电路904将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路904包括:天线系统、rf收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路904可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2g、3g、4g及5g)、无线局域网和/或wifi(wireless fidelity,无线保真)网络。在一些实施例中,射频电路904还可以包括nfc(near field communication,近距离无线通信)有关的电路,本技术对此不加以限定。
[0168]
显示屏905用于显示ui(user interface,用户界面)。该ui可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏905是触摸显示屏时,显示屏905还具有采集在显示屏905的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器901进行处理。此时,显示屏905还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或
软键盘。在一些实施例中,显示屏905可以为一个,设置在终端的前面板;在另一些实施例中,显示屏905可以为至少两个,分别设置在终端的不同表面或呈折叠设计;在另一些实施例中,显示屏905可以是柔性显示屏,设置在终端的弯曲表面上或折叠面上。甚至,显示屏905还可以设置成非矩形的不规则图形,也即异形屏。显示屏905可以采用lcd(liquid crystal display,液晶显示屏)、oled(organic light-emitting diode,有机发光二极管)等材质制备。
[0169]
摄像头组件906用于采集图像或视频。可选地,摄像头组件906包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及vr(virtual reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件906还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
[0170]
音频电路907可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器901进行处理,或者输入至射频电路904以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器901或射频电路904的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路907还可以包括耳机插孔。
[0171]
定位组件908用于定位终端的当前地理位置,以实现导航或lbs(location based service,基于位置的服务)。定位组件908可以是基于美国的gps(global positioning system,全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。
[0172]
电源909用于为终端中的各个组件进行供电。电源909可以是交流电、直流电、一次性电池或可充电电池。当电源909包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
[0173]
在一些实施例中,终端还包括有一个或多个传感器910。该一个或多个传感器910包括但不限于:加速度传感器911、陀螺仪传感器912、压力传感器913、指纹传感器914、光学传感器915以及接近传感器916。
[0174]
加速度传感器911可以检测以终端建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器911可以用于检测重力加速度在三个坐标轴上的分量。处理器901可以根据加速度传感器911采集的重力加速度信号,控制显示屏905以横向视图或纵向视图进行用户界面的显示。加速度传感器911还可以用于游戏或者用户的运动数据的采集。
[0175]
陀螺仪传感器912可以检测终端的机体方向及转动角度,陀螺仪传感器912可以与加速度传感器911协同采集用户对终端的3d动作。处理器901根据陀螺仪传感器912采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变ui)、拍摄时的图像稳
定、游戏控制以及惯性导航。
[0176]
压力传感器913可以设置在终端的侧边框和/或显示屏905的下层。当压力传感器913设置在终端的侧边框时,可以检测用户对终端的握持信号,由处理器901根据压力传感器913采集的握持信号进行左右手识别或快捷操作。当压力传感器913设置在显示屏905的下层时,由处理器901根据用户对显示屏905的压力操作,实现对ui界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
[0177]
指纹传感器914用于采集用户的指纹,由处理器901根据指纹传感器914采集到的指纹识别用户的身份,或者,由指纹传感器914根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器901授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器914可以被设置在终端的正面、背面或侧面。当终端上设置有物理按键或厂商logo(商标)时,指纹传感器914可以与物理按键或厂商logo集成在一起。
[0178]
光学传感器915用于采集环境光强度。在一个实施例中,处理器901可以根据光学传感器915采集的环境光强度,控制显示屏905的显示亮度。具体地,当环境光强度较高时,调高显示屏905的显示亮度;当环境光强度较低时,调低显示屏905的显示亮度。在另一个实施例中,处理器901还可以根据光学传感器915采集的环境光强度,动态调整摄像头组件906的拍摄参数。
[0179]
接近传感器916,也称距离传感器,通常设置在终端的前面板。接近传感器916用于采集用户与终端的正面之间的距离。在一个实施例中,当接近传感器916检测到用户与终端的正面之间的距离逐渐变小时,由处理器901控制显示屏905从亮屏状态切换为息屏状态;当接近传感器916检测到用户与终端的正面之间的距离逐渐变大时,由处理器901控制显示屏905从息屏状态切换为亮屏状态。
[0180]
本领域技术人员可以理解,图9中示出的结构并不构成对网络设备的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
[0181]
在示例性实施例中,还提供了一种计算机设备,该计算机设备包括处理器和存储器,该存储器中存储有至少一条计算机程序。该至少一条计算机程序由一个或者一个以上处理器加载并执行,以使该计算机设备实现上述任一种图像标注的方法,或者实现上述任一种的获取图像标注模型的方法。
[0182]
在示例性实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条计算机程序,该至少一条计算机程序由计算机设备的处理器加载并执行,以使计算机实现上述任一种图像标注的方法,或者实现上述任一种的获取图像标注模型的方法。
[0183]
在一种可能实现方式中,上述计算机可读存储介质可以是只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、只读光盘(compact disc read-only memory,cd-rom)、磁带、软盘和光数据存储设备等。
[0184]
在示例性实施例中,还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述任一种图像标注的方法,或者执行上述任一种的获取图像标注模型
的方法。
[0185]
需要说明的是,本技术所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号,均为经用户授权或者经过各方充分授权的,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如,本技术中涉及到的第一图像和第二图像都是在充分授权的情况下获取的。
[0186]
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
[0187]
以上所述仅为本技术的示例性实施例,并不用以限制本技术,凡在本技术的原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献