一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

图像数据处理方法、存储介质、处理器及系统与流程

2022-06-08 09:10:18 来源:中国专利 TAG:


1.本技术涉及图像识别领域,具体而言,涉及一种图像数据处理方法、存储介质、处理器及系统。


背景技术:

2.在算法开发过程中,一般假设测试数据和训练数据是独立同分布的,但在实际应用(如:遥感图像地物分类等)时,由于图像中数据类别繁多,且依据实际需求的不同通常会产生新类别的数据,因此在模型部署后其处理的数据往往不能被完全掌控,也即模型接收到的数据的分布可能不同于训练阶段的训练数据,而这种新类别的数据即为ood(out-of-distribution)样本或称为异常样本。
3.为了实现对带有ood样本的图像的识别,现有的相关技术会依据实际需求而额外收集特定图像并标注特定图像中的所有区域,然后进行模型训练。这种方法由于无法有效的从图像中多个区域中筛选出有效区域,从而提高了区域标注成本,进而降低了图像识别效率。
4.针对上述的问题,目前尚未提出有效的解决方案。


技术实现要素:

5.本技术实施例提供了一种图像数据处理方法、存储介质、处理器及系统,以至少解决现有技术中由于无法有效的从图像中多个区域中筛选出有效区域所导致的区域标注成本高的技术问题。
6.根据本技术实施例的一个方面,提供了一种图像数据处理方法,包括:获取待识别图像,其中,待识别图像中包含有至少一个区域,每个区域中存在至少一个对象;对待识别图像的图像数据进行处理,得到至少一个区域所对应的分布数据;根据至少一个区域所对应的分布数据确定至少一个区域的区域类型是否为第一区域类型,其中,第一区域类型所对应的区域中的对象未存储在预设存储区域中。
7.进一步地,图像数据处理方法还包括:基于预设的机器学习模型对待识别图像的图像数据进行计算,得到至少一个区域所对应的均值和方差值,其中,分布数据至少包括均值和方差值,均值表征了至少一个区域的特征信息,方差值的大小表征至少一个区域为第一区域类型的概率。
8.进一步地,图像数据处理方法还包括:在至少一个区域中存在方差值大于预设阈值的第一目标区域时,识别第一目标区域的区域类型为第一区域类型;在至少一个区域中存在方差值小于或等于预设阈值的第二目标区域时,识别第二目标区域的区域类型为第二区域类型,其中,第二区域类型所对应的区域中的对象存储在预设存储区域中。
9.进一步地,图像数据处理方法还包括:在识别第一目标区域的区域类型为第一区域类型之后,获取第一目标区域所对应的第一均值以及第二区域类型所对应区域的第二均值;比对第一均值与第二均值,从预设存储区域存储的区域数据中确定与第一目标区域相
似度最高的目标区域;确定目标区域所对应的区域类型为第一目标区域所对应的初始标注类型。
10.进一步地,图像数据处理方法还包括:在确定目标区域所对应的区域类型为第一目标区域所对应的初始标注类型之后,响应更新指令,对第一目标区域的初始标注类型进行标注,得到标注区域;基于标注区域对预设数据集中的数据进行更新,其中,预设数据集用于对机器学习模型进行优化训练。
11.进一步地,图像数据处理方法还包括:在识别第一目标区域的区域类型为第一区域类型之后,响应删除指令,从至少一个区域中删除第一区域类型所对应的区域。
12.进一步地,图像数据处理方法还包括:在根据至少一个区域所对应的分布数据确定至少一个区域的区域类型是否为第一区域类型之前,从预设的历史记录中获取第一区域类型所对应的区域的第一分布信息以及第二区域类型所对应的区域的第二分布信息;基于第一分布信息以及第二分布信息确定预设阈值。
13.进一步地,图像数据处理方法还包括:在基于预设的机器学习模型对待识别图像的图像数据进行计算,得到至少一个区域所对应的均值和方差值之后,对至少一个区域所对应的方差值进行重采样处理,得到缩放系数;对至少一个区域所对应的均值进行分类计算,得到至少一个区域所对应的分数值;计算缩放系数与分数值之间的比值,得到目标分数值;基于目标分数值计算机器学习模型对应的损失函数值;在损失函数值满足预设条件时,对机器学习模型的网络参数进行优化处理。
14.根据本技术实施例的另一方面,还提供了一种图像数据处理方法,包括:读取待识别图像,其中,待识别图像中包含有至少一个区域,每个区域中存在至少一个对象;响应图像识别指令,显示至少一个区域所对应的分布数据以及至少一个区域所对应的识别结果,其中,至少一个区域所对应的分布数据是通过对待识别图像的图像数据进行处理得到的,识别结果是根据至少一个区域所对应的分布数据对至少一个区域进行识别所得到的,识别结果表征至少一个区域的区域类型是否为第一区域类型,第一区域类型所对应的区域中的对象未存储在预设存储区域中。
15.根据本技术实施例的另一方面,还提供了一种图像数据处理方法,包括:云服务器接收终端设备发送的包含至少一个区域的待识别图像,其中,每个区域中存在至少一个对象;云服务器对待识别图像的图像数据进行处理,得到至少一个区域所对应的分布数据;云服务器根据至少一个区域所对应的分布数据确定至少一个区域的区域类型是否为第一区域类型,得到识别结果,其中,第一区域类型所对应的区域中的对象未存储在预设存储区域中;云服务器将识别结果返回至终端设备上。
16.进一步地,图像数据处理方法还包括:在云服务器将识别结果返回至终端设备上之后,云服务器获取终端设备对至少一个区域中的第一区域类型的区域进行标注的标注结果,并基于标注后的第一区域类型的区域对预设数据集进行更新,以对机器学习模型进行优化训练。
17.根据本技术实施例的另一方面,还提供了一种图像数据处理方法,包括:获取待识别的遥感图像,其中,遥感图像中包含有至少一个遥感对象;对遥感图像的图像像素进行处理,得到至少一个遥感对象所对应的分布数据;根据至少一个遥感对象所对应的分布数据确定至少一个遥感对象的对象类型是否为第一对象类型,其中,第一对象类型所对应的对
象未存储在预设存储区域中。
18.进一步地,至少一个遥感对象至少包括如下之一:遥感地物对象、建筑物对象、遥感水体对象。
19.根据本技术实施例的另一方面,还提供了一种图像数据处理方法,包括:获取待识别图像,其中,待识别图像中包含有至少一个物品;对待识别图像的图像像素进行处理,得到至少一个物品所对应的分布数据;根据至少一个物品所对应的分布数据识别至少一个物品所对应的物品类型;基于物品类型确定至少一个物品是否为违规物品。
20.根据本技术实施例的另一方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述的图像数据处理方法。
21.根据本技术实施例的另一方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述的图像数据处理方法。
22.根据本技术实施例的另一方面,还提供了一种识别图像的系统,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:获取待识别图像,其中,待识别图像中包含有至少一个区域,每个区域中存在至少一个对象;对待识别图像的图像数据进行处理,得到至少一个区域所对应的分布数据;根据至少一个区域所对应的分布数据确定至少一个区域的区域类型是否为第一区域类型,其中,第一区域类型所对应的区域中的对象未存储在预设存储区域中。
23.在本发明实施例中,采用基于图像中各区域的分布数据确定该区域是否为有效区域的方式,通过获取待识别图像,然后对待识别图像的图像数据进行处理,得到至少一个区域所对应的分布数据,从而根据至少一个区域所对应的分布数据确定至少一个区域的区域类型是否为第一区域类型。其中,待识别图像中包含有至少一个区域,每个区域中存在至少一个对象,第一区域类型所对应的区域中的对象未存储在预设存储区域中。
24.在上述过程中,获取各区域对应的分布数据,并根据各区域对应的分布数据确定该区域的区域类型,实现了对图像中有效区域的有效筛选,从而便于用户在有效区域中确定需要标注的区域,避免了相关系统对待识别图像中无效区域的标注,从而降低区域标注成本。此外,在本技术中,通过基于各区域对应的分布数据确定该区域的区域类型,避免了对分类概率统计分析、人为设定阈值,减小了数据统计性质导致的随机性,也避免了利用额外的分类器对原始模型的特征进行分类,减小了额外计算开销,从而提高对区域的区域类型判断的准确性,并降低计算成本。
25.由此可见,本技术所提供的方案达到了基于图像中各区域的分布数据确定该区域是否为有效区域的目的,从而实现了降低区域标注成本的技术效果,进而解决了现有技术中由于无法有效的从图像中多个区域中筛选出有效区域所导致的区域标注成本高的技术问题。
附图说明
26.此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
27.图1是根据本技术实施例的一种可选的计算机终端(或移动设备)的硬件结构框图;
28.图2是根据本技术实施例的一种可选的图像数据处理方法的示意图;
29.图3是根据本技术实施例的一种可选的图像数据处理方法的流程图;
30.图4是根据本技术实施例的一种可选的图像数据处理方法的流程图;
31.图5是根据本技术实施例的一种可选的图像数据处理方法的示意图;
32.图6是根据本技术实施例的一种可选的人机交互操作的示意图;
33.图7是根据本技术实施例的一种可选的图像数据处理方法的示意图;
34.图8是根据本技术实施例的一种可选的图像数据处理方法的示意图;
35.图9是根据本技术实施例的一种可选的图像数据处理方法的示意图;
36.图10是根据本技术实施例的一种可选的计算机终端的结构框图。
具体实施方式
37.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分的实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范围。
38.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
39.首先,在对本技术实施例进行描述的过程中出现的部分名词或术语适用于如下解释:
40.地物分类:对遥感影像中的每个像素单位按地物类型进行分类,通常分类类型可以包括耕地、林地、草地、建筑物、道路、构筑物、人工堆掘地、裸地和水域等九大类别,是一种语义分割任务。
41.不确定性量化:对遥感图像进行不确定性估计,在测试和实际使用过程中,若输入样本的不确定性低,判定为id(in-distribution)样本;若输入样本不确定性高,则判定为ood(out-of-distribution)样本。
42.实施例1
43.根据本技术实施例,还提供了一种图像数据处理方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
44.本技术实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现图像数据处理方法的计算机终端(或移动设备)的硬件结构框图。如图1所示,计算机终端10(或移动设备10)可以包括一个或多个(图中采用
102a、102b,
……
,102n来示出)处理器(处理器可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置106。除此以外,还可以包括:显示器、输入/输出接口(i/o接口)、通用串行总线(usb)端口(可以作为bus总线的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
45.应当注意到的是上述一个或多个处理器和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端10(或移动设备)中的其他元件中的任意一个内。如本技术实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
46.存储器104可用于存储应用软件的软件程序以及模块,如本技术实施例中的图像数据处理方法对应的程序指令/数据存储装置,处理器通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的图像数据处理方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
47.传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(network interface controller,nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(radio frequency,rf)模块,其用于通过无线方式与互联网进行通讯。
48.显示器可以例如触摸屏式的液晶显示器(lcd),该液晶显示器可使得用户能够与计算机终端10(或移动设备)的用户界面进行交互。
49.此处需要说明的是,在一些可选实施例中,上述图1所示的计算机设备(或移动设备)可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是,图1仅为特定具体实例的一个实例,并且旨在示出可存在于上述计算机设备(或移动设备)中的部件的类型。
50.在上述运行环境下,本技术提供了如图2所示的图像数据处理方法。图2是根据本技术实施例的一种可选的图像数据处理方法的示意图。
51.步骤s202,获取待识别图像,其中,待识别图像中包含有至少一个区域,每个区域中存在至少一个对象。
52.可选的,本技术可应用于遥感图像地物分类、电商物品分类、交通安全物品分类等场景中。其中,地物分类是一种基础的遥感能力,它是一种语义分割任务,可以对遥感图像(即待识别图像)每个像素进行分类,以获取其基本类别,如目前基本类别有耕地、林地、草地、建筑物、道路、构筑物、人工堆掘地、裸地和水域等九大类别,这些基本类别包括在机器学习模型的训练样本中。在实际应用过程中,机器学习模型常常因为需要对特定类别进行
分类、不同卫星成像差异大、成像质量差等问题需要分析图像中新场景区域的数据,这些新场景区域不同于机器学习模型训练阶段的训练样本,因此可以称为ood样本或异常样本。具体地,新场景是时常存在的,如果对新的场景产出分类质量较低的地物分类结果会影响用户体验,例如,相较于前述的常规地物分类应用的九大类别,内蒙古地区较为特别的是广阔草地上存在的蒙古包,这类样本通常针对于特定的需求,在一般训练集中很少见,如果直接应用机器学习模型便容易将遥感图像中的蒙古包错误分类,影响用户体验。因此,在图像识别过程中,可以筛选出图像中具有不确定性的新场景区域(即ood样本),以使用户可以选择是否进行新场景数据的积累,从不确定性的新场景区域中筛选出期望区域,进而对期望区域进行标注作为样本以优化模型,提高模型对新场景的分类准确度,并提升算法优化效率。
53.具体地,可以通过电子设备、应用系统、服务器等装置获取待识别图像,在本实施例中,通过图像识别系统获取待识别图像。其中,待识别图像可以为地物分类遥感图像,待识别图像中的每个区域可以为待识别图像中的一个像素单位,也可以由待识别图像中的多个像素单位组成,每个区域中存在一个对象,或属于同一类别的多个对象。例如,在本实施例中,待识别图像可以为内蒙古地区的遥感图像,该图像中的每个像素确定为一个区域,区域中存在的对象可以是草、树木、房屋、蒙古包、水流等对象中的任一,每个区域中可以存在一棵树(即一个对象)或多棵树(即属于同一类别的多个对象)。
54.需要说明的是,通过获取待识别图像,以用于实现后续对第一区域类型的确定。
55.步骤s204,对待识别图像的图像数据进行处理,得到至少一个区域所对应的分布数据。
56.在步骤s204中,图像识别系统可以基于含不确定性量化的机器学习模型对待识别图像进行处理,以得到每个区域对应的分布数据。其中,机器学习模型至少包括不同应用场景下的网络分类模型或其它具有分类功能的模型,还可以包括特征生成模型、特征识别模型等模型,不确定性量化表征对图像进行不确定性估计,分布数据可以用于表征区域的所属类别以及不确定性,不确定性用于表征至少一个区域为第一区域类型(也即新场景区域(ood样本))的概率。
57.可选的,分布数据依据应用场景的不同可以是二项分布、几何分布、超几何分布、泊松分布、指数分布、高斯分布、均匀分布以及卡方分布等分布类型中的任意一种,优选的,分布数据为高斯分布数据。分布数据至少包括均值和方差值,其中,均值可以表征至少一个区域的特征信息,方差值的大小可以表征至少一个区域为第一区域类型的概率。
58.需要说明的是,图像识别系统也可以基于概率统计检测或基于分类器检测的方法获取用于判断至少一个区域的区域类型的数据,其中,概率统计检测是将机器学习模型输出的概率进行统计分析,将id(in-distribution)样本(也即非异常样本)和ood样本差距尽量最大化,以在后续阶段选取一定的阈值来判断样本属于id样本还是ood样本;分类器检测则是利用额外的分类器对原始模型的特征进行分类。但是,在前述的两种方法中,概率统计检测虽然方法简单直接,不用修改机器学习模型,只需对分类概率进行统计,但其缺点是需要对所有样本进行分类然后统计分析,处理过程较为复杂,且阈值的选定对结果影响很大,受人为因素和数据统计分布特性影响大,通用性低。而分类器检测需要专门的ood训练样本,且需要额外的较大的计算开销。因此,通过获取至少一个区域对应的分布数据,一方面,便于实现后续对区域的区域类型的确定,另一方面,避免了对分类概率统计分析、人为设定
阈值,减小了数据统计性质导致的随机性,也避免了利用额外的分类器对原始模型的特征进行分类,减小了额外计算开销,从而便于提高后续对区域的区域类型判断的准确性,并降低计算成本。
59.步骤s206,根据至少一个区域所对应的分布数据确定至少一个区域的区域类型是否为第一区域类型,其中,第一区域类型所对应的区域中的对象未存储在预设存储区域中。
60.在步骤s206中,图像识别系统可以将各区域的分布数据中的数值与预设阈值相比较,以确定至少一个区域的区域类型是否为第一区域类型;也可以基于各区域的分布数据中的数值分布情况,依照区域为第一区域类型的概率程度由大至小进行排序,基于历史的ood样本出现率x%将排序结果中排在前x%的区域确定为第一区域类型。其中,第一区域类型所对应的区域中的对象未存储在预设存储区域中,也即未被包含在训练样本中,当确定某一区域的区域类型为第一区域类型时,表征该区域为图像中的新场景区域,也即ood样本。
61.进一步地,在确定了至少一个区域的区域类型是否为第一区域类型之后,图像识别系统可以将对应的结果以及筛选出的ood样本输出给用户,以告知用户在待识别图像中存在ood样本,并由用户决策是否进行新场景数据的积累,进一步地筛选出期望区域,从而由图像识别系统对期望区域进行标注并将标注后的期望区域作为样本对预设数据集中的数据进行更新,以基于预设数据集对机器学习模型进行优化训练,加快模型迁移和特定场景应用优化的周期。
62.需要说明的是,ood样本中至少包括能用于提高识别新场景的相关模型的分类准确度的区域(例如:对于内蒙古地区的遥感图像而言,带有蒙古包的区域为能用于提高相关模型分类准确度的区域),还可能包括一些区域内对象成像质量差的区域或不同卫星成像的区域,因此ood样本可以被认为是为有效区域。而对于不是第一区域类型的区域而言,由于这些区域通常为常规地物分类类型,并不能提高用于识别新场景的相关模型的分类准确度(例如:对于内蒙古地区的遥感图像而言,带有建筑物的区域并不能用于提高相关模型分类准确度),因此这些区域可以被认为是为无效区域。而在现有技术中,当需要实现对新场景的图像进行识别时,相关系统对于图像中的所有区域(包括前述的有效区域和无效区域)均进行标注,从而提高了区域标注成本。因此,通过根据至少一个区域所对应的分布数据确定至少一个区域的区域类型,实现了对待识别图像中有效样本的有效筛选,从而便于用户在有效区域中确定需要标注的区域,避免了对待识别图像中无效区域的标注,从而降低区域标注成本。
63.基于上述步骤s202至步骤s206所限定的方案,可以获知,在本发明实施例中,采用基于图像中各区域的分布数据确定该区域是否为有效区域的方式,通过获取待识别图像,然后对待识别图像的图像数据进行处理,得到至少一个区域所对应的分布数据,从而根据至少一个区域所对应的分布数据确定至少一个区域的区域类型是否为第一区域类型。其中,待识别图像中包含有至少一个区域,每个区域中存在至少一个对象,第一区域类型所对应的区域中的对象未存储在预设存储区域中。
64.容易注意到的是,在上述过程中,获取各区域对应的分布数据,并根据各区域对应的分布数据确定该区域的区域类型,实现了对图像中有效区域的有效筛选,从而便于用户在有效区域中确定需要标注的区域,避免了相关系统对待识别图像中无效区域的标注,从
而降低区域标注成本。此外,在本技术中,通过基于各区域对应的分布数据确定该区域的区域类型,避免了对分类概率统计分析、人为设定阈值,减小了数据统计性质导致的随机性,也避免了利用额外的分类器对原始模型的特征进行分类,减小了额外计算开销,从而提高对区域的区域类型判断的准确性,并降低计算成本。
65.由此可见,本技术所提供的方案达到了基于图像中各区域的分布数据确定该区域是否为有效区域的目的,从而实现了降低区域标注成本的技术效果,进而解决了现有技术中由于无法有效的从图像中多个区域中筛选出有效区域所导致的区域标注成本高的技术问题。
66.在一种可选的实施例中,在对待识别图像的图像数据进行处理,得到至少一个区域所对应的分布数据,图像识别系统基于预设的机器学习模型对待识别图像的图像数据进行计算,得到至少一个区域所对应的均值和方差值,其中,分布数据至少包括均值和方差值,均值表征了至少一个区域的特征信息,方差值的大小表征至少一个区域为第一区域类型的概率。
67.其中,图像识别系统可以基于预设的机器学习模型对待识别图像的图像数据进行计算,以得到分布类型为二项分布、几何分布、超几何分布、泊松分布、指数分布、高斯分布、均匀分布以及卡方分布等类型中任一种类型的分布数据,优选的,在本实施例中,图像识别系统可以基于预设的机器学习模型对待识别图像的图像数据进行高斯计算,得到高斯分布数据。该分布数据中的均值用于图像识别系统确定该区域所属的类别(如:耕地、林地、草地、建筑物、道路、构筑物、人工堆掘地、裸地和水域等),方差值用于图像识别系统确定该区域是否为ood样本(即前述的第一区域类型),方差值越大时,表征该区域的不确定性越高,即该区域为ood样本的概率越高。
68.需要说明的是,通过对待识别图像的图像数据进行计算得到至少一个区域所对应的均值和方差值,一方面,实现了对区域所属类别的确定,另一方面,实现对区域的区域类型的确定。
69.在一种可选的实施例中,在根据至少一个区域所对应的分布数据确定至少一个区域的区域类型是否为第一区域类型的过程中,图像识别系统可以在至少一个区域中存在方差值大于预设阈值的第一目标区域时,识别第一目标区域的区域类型为第一区域类型,在至少一个区域中存在方差值小于或等于预设阈值的第二目标区域时,识别第二目标区域的区域类型为第二区域类型,其中,第二区域类型所对应的区域中的对象存储在预设存储区域中。
70.可选的,预设阈值可以为1,也可以由用户根据具体的应用需求和区分精度要求,设定其它数值的阈值。在本实施例中,若预设阈值为1,则当该区域的方差值大于1时,图像识别系统确定该区域为第一区域类型,当该区域的方差值小于1时,图像区域系统确定该区域为第二区域类型。其中,第二区域类型存储在预设存储区域中,也即被包含在训练样本中。
71.以输入的待识别图像为内蒙古地区的遥感图像为例,该图像中的多个区域分别所包含的对象可以是草地、道路、裸地、水域、蒙古包等对象中的任一。由于前述的草地、道路、裸地、水域属于常规的地物分类类型,即通常包含在机器学习模型训练阶段的训练样本中,因此,存在有这些对象的区域的方差值通常接近于1并小于1,不确定性较低,图像识别系统
将其区域类型确定为第二区域类型;而蒙古包这种针对特殊需求而产生的对象,通常不包含在机器学习模型训练阶段的训练样本中,因此,存在有蒙古包的区域的方差值通常大于1,不确定性相对较高,图像识别系统可以将其区域类型确定为第一区域类型,从而实现对图像中有效区域的有效筛选。
72.需要说明的是,通过设定预设阈值,并将区域所对应的分布数据和预设阈值进行对比来确定该区域的区域类型,实现了对有效区域和无效区域的有效划分。
73.在一种可选的实施例中,在识别第一目标区域的区域类型为第一区域类型之后,图像识别系统可以获取第一目标区域所对应的第一均值以及第二区域类型所对应区域的第二均值,然后比对第一均值与第二均值,从预设存储区域存储的区域数据中确定与第一目标区域相似度最高的目标区域,从而确定目标区域所对应的区域类型为第一目标区域所对应的初始标注类型。
74.可选的,当图像识别系统基于机器学习模型确定了图像中各区域的区域类型后,图像识别系统获取第一目标区域所对应的第一均值和第二区域类型所对应区域的第二均值,其中,基于区域中对象的不同,每个区域所对应的第二均值也有所不同。对于任一第一目标区域,图像识别系统可以确定其均值最接近的第二均值,从而基于该第二均值从预设存储区域存储的区域数据中确定与第一目标区域相似度最高的目标区域,并将目标区域所对应的区域类型确定为第一目标区域所对应的初始标注类型。
75.例如,对于成像质量差的区域,图像识别系统在识别过程中,可能将其识别为第一目标区域,若该区域中存在模糊不清的房子,则图像识别系统计算得到的该区域的第一均值一般与同一图像中存在构筑物的区域的第二均值相近,因此,图像识别系统可以基于该第二均值在存储区域存储的区域数据中确定与该第一目标区域相似度最高的目标区域,若该目标区域的区域类型为构筑物,则确定前述第一目标区域的初始标注类型同样为构筑物。可选的,对于存在新场景(如:蒙古包)的区域,图像识别系统同样可以确定其所对应的初始标注类型。
76.需要说明的是,通过确定第一目标区域所对应的初始标注类型,以便于用户后续确定该第一目标区域是否为期望区域。
77.在一种可选的的实施例中,在确定目标区域所对应的区域类型为第一目标区域所对应的初始标注类型之后,图像识别系统可以响应更新指令,对第一目标区域的初始标注类型进行标注,得到标注区域,从而基于标注区域对预设数据集中的数据进行更新,其中,预设数据集用于对机器学习模型进行优化训练。
78.可选的,当用户获取到图像识别系统所输出的每个第一目标区域所对应的初始标注类型时,用户可以基于自身对该第一目标区域的识别,确定初始标注类型是否正确,并向图像识别系统输入更新指令,以基于初始标注类型或新的类型对第一目标区域进行标注,从而得到标注区域,并将标注区域作为新样本保存至预设数据集中,以基于更新后的预设数据集对机器学习模型进行优化训练,使得机器学习模型可以更好的适用于对新场景进行分类。
79.具体地,当用户获取到初始标注类型均为构筑物的两区域时,若其中一区域中存在的对象为模糊不清的房子,另一区域中存在的对象为蒙古包,则用户可以向图像识别系统中输入更新指令,对存在的对象为模糊不清的房子的区域标注与初始标注类型相同的类
型,对存在的对象为蒙古包的区域更改标注为蒙古包,并至少将标注蒙古包的标注区域作为新样本保存至预设数据集中,以使网络模型能够更好的对内蒙古地区的遥感图像进行识别与分类。
80.需要说明的是,通过对第一目标区域进行的标注得到标注区域,并基于标注区域对预设数据集中的数据进行更新,使得机器学习模型可以更好的适用于对新场景进行分类,从而提高了机器学习模型的识别效率和准确度。
81.在一种可选的实施例中,在识别第一目标区域的区域类型为第一区域类型之后,图像识别系统可以响应删除指令,从至少一个区域中删除第一区域类型所对应的区域。
82.可选的,在图像识别系统识别第一目标区域的区域类型为第一区域类型之后,图像识别系统可以输出该区域的分类结果,还可以输出第一目标区域的不确定性分值,即方差值。需要说明的是,当图像识别系统未识别出第一目标区域时,图像识别系统仅输出该区域的分类结果。
83.进一步地,用户可以基于需求确定是否在图像的至少一个区域中舍弃与第一目标区域所对应的区域,其中,所舍弃的区域可以是与第一目标区域所对应的全部区域,也可以是与第一目标区域所对应的部分区域。当用户确定需要舍弃至少一个区域时,用户可以向图像识别系统发送删除指令,并由图像识别系统响应该删除指令,以从至少一个区域中删除用户所指定的区域,或是同时还删除与该指定的区域的均值相同的其它区域。
84.具体地,当用户确定第一目标区域所对应的区域为非期待区域时,如前述的存在的对象为模糊不清的房子的区域,将其作为样本并不能优化模型对于内蒙古地区的遥感图像的分类效果,则用户可以向图像识别系统发送删除指令,由图像识别系统在至少一个区域中删除该存在的对象为模糊不清的房子的区域,或是同时还删除与该区域的均值相同的其它区域,以实现对无效区域的删除。
85.需要说明的是,通过响应删除指令,从至少一个区域中删除第一区域类型所对应的区域,可以更好地实现对有效区域的筛选,从而提高本技术工作效率。
86.在一种可选的实施例中,在根据至少一个区域所对应的分布数据确定至少一个区域的区域类型是否为第一区域类型之前,图像识别系统可以从预设的历史记录中获取第一区域类型所对应的区域的第一分布信息以及第二区域类型所对应的区域的第二分布信息,从而基于第一分布信息以及第二分布信息确定预设阈值。
87.可选的,图像识别系统可以从预设存储区域或其它存储装置中获取历史记录,并从历史记录中获取第一分布信息和第二分布信息。其中,第一分布信息可以包括第一区域类型所对应的区域的方差值的数值分布情况,第二分布信息可以包括第二区域类型所对应的区域的方差值的数值分布情况,图像识别系统可以确定一预设阈值,以使得该预设阈值能够对第一分布信息中的数值和第二分布信息中的数值进行划分。例如,当第一分布信息中的数值分布在(2,4)区间,第一分布信息中的数值分布在(5,6)区间时,则图像识别系统可以在(4,5)区间中选取任一数值作为预设阈值。
88.需要说明的是,通过基于历史记录确定预设阈值,使得确定的预设阈值更加合理,从而能够提高本技术对有效区域的筛选的准确性。
89.在一种可选的实施例中,在基于预设的机器学习模型对待识别图像的图像数据进行计算,得到至少一个区域所对应的均值和方差值之后,图像识别系统可以对至少一个区
域所对应的方差值进行重采样处理,得到缩放系数,然后对至少一个区域所对应的均值进行分类计算,得到至少一个区域所对应的分数值,接着计算缩放系数与分数值之间的比值,得到目标分数值,并基于目标分数值计算机器学习模型对应的损失函数值,从而在损失函数值满足预设条件时,对机器学习模型的网络参数进行优化处理。
90.可选的,图像识别系统可以获取机器学习模型输出的各区域的均值和方差值,然后利用标准正态分布∈~n(0,1)对至少一个区域所对应的方差值进行重采样处理,得到缩放因子(即缩放系数):
91.t=v
·

92.其中,t表示缩放因子,v表示方差值,∈表示标准正态分布。之后,图像识别系统可以基于分类函数对至少一个区域所对应的均值进行分类计算,得到至少一个区域所对应的分数值,并基于如下公式得到目标分数值:
93.s

(k)=s(k)/t
94.其中,s

(k)表示目标分数值,s(k)表示至少一个区域所对应的分数值,t表示缩放因子。从而目标分数值计算机器学习模型对应的损失函数值loss,并在损失函数值满足预设条件时,对机器学习模型的网络参数进行优化处理。
95.需要说明的是,通过基于至少一个区域所对应的均值和方差值对机器学习模型的网络参数进行优化处理,实现了对机器学习模型的训练,进而实现了对机器学习模型分类准确度的提高。
96.在一种可选的实施例中,对本技术的一种应用场景进行说明。如图3所示,图像识别系统先将地物分类遥感图像样本输入至机器学习模型,以对该机器学习模型进行训练。具体地,机器学习模型对该地物分类遥感图像样本进行计算,得到地物分类遥感图像中的各区域的均值和方差,其中,均值表征了至少一个区域的特征信息(即图3中的特征向量),方差值的大小表征至少一个区域为第一区域类型的概率(即图3中的不确定性)。然后图像识别系统基于方差值计算缩放因子,基于均值计算各区域的分数值,并基于缩放因子和分数值计算机器学习模型对应的损失函数值,从而基于损失函数值优化网络模型参数,实现对机器学习模型的训练。
97.进一步地,在得到了训练好的机器学习模型后,图像识别系统可以将待识别的地物分类遥感图像输入至训练好的机器学习模型中,以使得训练好的机器学习模型对待识别的地物分类遥感图像进行计算,得到该图像中各区域的均值和方差值。之后,图像识别系统可以基于方差值确定至少一个区域的区域类型是否为第一区域类型,也即确定该区域是否为ood样本,对于不是ood样本的区域,图像识别系统对该区域不再进行下一步处理,对于是ood样本的区域,图像识别系统将其输出给用户,以供用户对其进行舍弃或进一步标注,其中,进行进一步标注的区域用于作为新样本优化特定应用场景下的数据集。
98.更进一步地,如图4所示,在图像识别系统获取到机器学习模型输出待识别图像的各区域的均值(即地物分类结果)和方差值(不确定性判断结果)之后,在方差值(即不确定性分值)小于预设阈值时,图像识别系统判定该区域为确定性结果(即该区域的区域类型为第二区域类型,该区域为id样本),输出对该区域的地物分类结果;在方差值(即不确定性分值)大于预设阈值时,图像识别系统判定该区域为不确定性结果(即该区域的区域类型为第一区域类型,该区域为ood样本),输出对该区域的地物分类结果及其方差值,以告知用户该
结果为不确定性结果。之后,用户可以基于自己的需求确定是否收集该ood样本,当用户确定不收集该ood样本时,用户可以输入删除指令,以使图像识别系统删除该区域(即舍弃结果),当用户确定收集该ood样本时,用户可以输入更新指令,以使图像识别系统对该区域进行标注,并积累该ood样本更新预设数据集中的数据,进而用于对机器学习模型进行优化训练。
99.需要说明的是,本技术基于机器学习模型对待识别图像的图像数据进行计算,得到待识别图像中各区域的均值(即特征信息)和方差值(即不确定性),通过量化不确定性的大小判别ood样本,避免了采用ood训练样本对模型进行预先训练,从而实现对有效区域有效且快速的筛选了。进一步地,本技术通过对用户进行告知,由用户判断选择是否进行ood数据的积累,可以直接快速选出期望区域,从而避免了对图像中所有区域进行标注,极大程度地降低了标注成本,进而可以加快特定场景下样本的收集、标注和模型训练,缩短算法优化周期。
100.由此可见,本技术所提供的方案达到了基于图像中各区域的分布数据确定该区域是否为有效区域的目的,从而实现了降低区域标注成本的技术效果,进而解决了现有技术中由于无法有效的从图像中多个区域中筛选出有效区域所导致的区域标注成本高的技术问题。
101.需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本技术并不受所描述的动作顺序的限制,因为依据本技术,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本技术所必须的。
102.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本技术各个实施例的方法。
103.实施例2
104.本技术的实施例还提供了一种图像数据处理方法。可选的,图5是根据本技术实施例的一种可选的图像数据处理方法的示意图,如图5所示,该方法包括:
105.步骤s302:读取待识别图像,其中,待识别图像中包含有至少一个区域,每个区域中存在至少一个对象;
106.步骤s304:响应图像识别指令,显示至少一个区域所对应的分布数据以及至少一个区域所对应的识别结果,其中,至少一个区域所对应的分布数据是通过对待识别图像的图像数据进行处理得到的,识别结果是根据至少一个区域所对应的分布数据对至少一个区域进行识别所得到的,识别结果表征至少一个区域的区域类型是否为第一区域类型,第一区域类型所对应的区域中的对象未存储在预设存储区域中。
107.具体地,在实际应用中,如图6所示,用户可以向图像识别系统中输入待识别的图像,并由图像识别系统对待识别图像进行读取。之后,用户向图像识别系统输入图像识别指
令以启动图像识别工作,图像识别系统基于用户输入的图像识别指令将待识别图像输入至预设的机器学习模型中,通过机器学习模型对待识别图像的图像数据进行计算,从而获取至少一个区域所对应的分布数据,其中,分布数据至少包括均值和方差值,均值表征了至少一个区域的特征信息,方差值的大小表征至少一个区域为第一区域类型的概率。
108.进一步地,图像识别系统将分布数据中的方差值与预设阈值进行比较,以基于比较结果确定至少一个区域的区域类型是否为第一区域类型,即确定至少一个区域是否为odd样本,从而确定对应的识别结果,识别结果中至少包括方差值(也即不确定性分值)。当图像识别系统确定了分布数据和识别结果之后,图像识别系统可以将分布数据和识别结果显示在对应的显示装置中,以供用户查看图像中各区域的地物分类结果以及各区域是否为odd样本。其中,当图像识别系统未识别出ood样本时,图像识别模块仅输出分布数据。
109.之后,用户可以基于自己的需求确定是否收集该ood样本,当用户确定不收集该ood样本时,用户可以向图像识别系统输入删除指令,以使图像识别系统删除该区域(即舍弃结果),当用户确定收集该ood样本时,用户可以向图像识别系统输入更新指令,以使图像识别系统对该区域进行标注,并积累该ood样本更新预设数据集中的数据,进而用于对机器学习模型进行优化训练。
110.需要说明的是,本技术通过读取待识别图像,并显示待识别图像中至少一个区域所对应的分布数据以及至少一个区域所对应的识别结果,实现了对用户的告知,进而便于用户判断选择是否进行ood数据的积累,并直接快速选出期望区域,从而避免了对图像中所有区域进行标注,极大程度地降低了标注成本,进而可以加快特定场景下样本的收集、标注和模型训练,缩短算法优化周期。
111.实施例3
112.本技术的实施例还提供了一种图像数据处理方法,可选的,图7是根据本技术实施例的一种可选的图像数据处理方法的示意图,如图7所示,该方法包括:
113.步骤s402,云服务器接收终端设备发送的包含至少一个区域的待识别图像,其中,每个区域中存在至少一个对象;
114.步骤s404,云服务器对待识别图像的图像数据进行处理,得到至少一个区域所对应的分布数据,其中,分布数据的大小表征了至少一个区域为第一区域类型的概率,第一区域类型中的对象为未存储在预设存储区域中的对象;
115.步骤s406,云服务器根据至少一个区域所对应的分布数据确定至少一个区域的区域类型是否为第一区域类型,得到识别结果,其中,第一区域类型所对应的区域中的对象未存储在预设存储区域中;
116.步骤s408,云服务器将识别结果返回至终端设备上。
117.具体地,在实际应用中,前述的终端设备可以是手机、平板、电脑、便携式穿戴设备或其它设备。当需要对图像进行识别时,用户可以将终端设备存储器内的待识别图像,或是终端设备从互联网中获取的待识别图像发送给云服务器,其中,终端设备可以基于wifi、数据接口等方式与云服务器间进行数据传输。当云服务器接收到待识别图像后,云服务器可以基于机器学习模型对待识别图像的图像数据进行处理,以获取待识别图像中至少一个区域的分布数据,其中,分布数据至少包括方差值,方差值的大小表征至少一个区域为第一区域类型的概率,分布数据还可以包括均值,均值表征了至少一个区域的特征信息。之后,云
服务器可以将分布数据中的方差值与预设阈值进行比较,以基于比较结果确定至少一个区域的区域类型是否为第一区域类型,即确定至少一个区域是否为odd样本,从而确定对应的识别结果。
118.进一步地,当云服务器确定了识别结果之后,云服务器可以将识别结果返回至终端设备上,以供用户实时获取。
119.在一种可选的实施例中,在云服务器将识别结果返回至终端设备上之后,云服务器获取终端设备对至少一个区域中的第一区域类型的区域进行标注的标注结果,并基于标注后的第一区域类型的区域对预设数据集进行更新,以对机器学习模型进行优化训练。
120.具体地,当用户基于终端设备获取到云服务器输出的识别结果后,用户可以基于自己的需求确定是否收集该ood样本,当用户确定不收集该ood样本时,用户可以基于终端设备向云服务器发送删除指令,以使云服务器删除该区域(即舍弃结果),当用户确定收集该ood样本时,用户可以基于终端设备向云服务器输入更新指令,以使获取终端设备对至少一个区域中的第一区域类型的区域进行标注的标注结果,并基于标注结果对该区域进行标注。之后云服务器基于标注后的第一区域类型的区域更新预设数据集中的数据,进而用于对机器学习模型进行优化训练。
121.需要说明的是,本技术基于云服务器接收终端设备发送的待识别图像,并将至少一个区域所对应的识别结果返回至终端设备上,实现了对用户的告知,进而便于用户判断选择是否进行ood数据的积累,并直接快速选出期望区域,从而避免了对图像中所有区域进行标注,极大程度地降低了标注成本,进而可以加快特定场景下样本的收集、标注和模型训练,缩短算法优化周期。此外,在本技术中,基于云服务器确定对待识别图像的识别结果,并将识别结果发送至终端设备中,可以便于用户实时获取,进而提高用户的使用体验。
122.实施例3
123.本技术的实施例还提供了一种图像数据处理方法,可选的,图8是根据本技术实施例的一种可选的图像数据处理方法的示意图,如图8所示,该方法包括:
124.步骤s502,获取待识别的遥感图像,其中,遥感图像中包含有至少一个遥感对象。
125.在步骤s502中,待识别图像可以为各个地区的遥感图像,例如,高原地区的遥感图像、盆地地区的遥感图像、沙漠地区的遥感图像或是内蒙古地区的遥感图像、海南地区的遥感图像等。其中,遥感图像中的遥感对象可以是人、建筑物、植物、动物、水流等。
126.步骤s504,对遥感图像的图像像素进行处理,得到至少一个遥感对象所对应的分布数据。
127.在步骤s504中,图像识别系统可以基于机器学习模型对遥感图像中的每个图像像素分别进行处理,也可以对遥感图像中的每个像素集合分别进行处理,其中,每个像素集合由多个图像像素组成,且每个像素或每个像素集合中均存在一个对象或属于同一类别的多个对象,从而可以得到至少一个遥感对象对应的分布数据。例如,在本实施例中,待识别图像可以为沙漠地区的遥感图像,该遥感图像中的每个像素或每个像素集合中存在的对象具体可以是草、树木、房屋、仙人掌、骆驼、水流等对象中的任一,每个像素或每个像素集合中可以存在一棵仙人掌(即一个对象)或多棵仙人掌(即属于同一类别的多个对象)。
128.需要说明的是,通过获取至少一个遥感对象所对应的分布数据,以便于后续对各遥感对象的对象类型进行准确判断。
129.步骤s506,根据至少一个遥感对象所对应的分布数据确定至少一个遥感对象的对象类型是否为第一对象类型,其中,第一对象类型所对应的对象未存储在预设存储区域中。
130.在步骤s506中,图像识别系统可以将各遥感对象的分布数据中的数值与预设阈值相比较,以确定至少一个遥感对象的对象类型是否为第一对象类型,当确定该遥感对象的对象为第一类型时,说明该对象相较于历史训练样本或已知数据中的对象为新对象。例如:针对于沙漠地区的遥感图像,在对该遥感图像中的各对象的对象类型进行判断时,由于仙人掌、骆驼为沙漠地区所特有的对象,在一般训练集中很少见,因此仙人掌以及骆驼所对应的分布数据中的方差值相对于基础对象(如:草、树木、房屋)所对应的分布数据中的方差值会更高,从而基于合适的预设阈值,可以有效将仙人掌和骆驼从至少一个遥感对象中筛选出。
131.进一步地,在确定了对象类型为第一对象类型的遥感对象(如前述的仙人掌、骆驼)后,用户可以对期望的遥感对象进行标注,并将其作为新的样本加入到预设数据集中,以对机器学习模型进行优化训练,使得下一次向机器学习模型输入对应地区的遥感图像(如前述的沙漠地区的遥感图像)时,机器学习模型可以有效对该遥感地区中的各个对象进行分类,从而提高分类效果。
132.需要说明的是,通过根据至少一个遥感对象所对应的分布数据确定至少一个遥感对象的对象类型是否为第一对象类型,实现了对待识别的遥感图像中有效遥感对象的有效筛选,从而便于用户在有效遥感对象中确定需要标注的遥感对象,避免了对待识别的遥感图像中无效遥感对象的标注,从而降低区域标注成本。
133.基于上述步骤s502至步骤s506所限定的方案,可以获知,在本实施例中,采用基于遥感图像中各遥感对象的分布数据确定该遥感对象是否为有效遥感对象的方式,通过获取待识别的遥感图像,然后对遥感图像的图像像素进行处理,得到至少一个遥感对象所对应的分布数据,从而根据至少一个遥感对象所对应的分布数据确定至少一个遥感对象的对象类型是否为第一对象类型,其中,遥感图像中包含有至少一个遥感对象,第一对象类型所对应的对象未存储在预设存储区域中。
134.容易注意到的是,在上述过程中,获取各遥感对象对应的分布数据,并根据各遥感对象对应的分布数据确定该遥感对象的对象类型,实现了对遥感图像中有效遥感对象的有效筛选,从而便于用户在有效遥感对象中确定需要标注的遥感对象,避免了相关系统对待识别的遥感图像中无效遥感对象的标注,从而降低遥感对象标注成本。此外,在本技术中,通过基于各遥感对象对应的分布数据确定该遥感对象的对象类型,避免了对分类概率统计分析、人为设定阈值,减小了数据统计性质导致的随机性,也避免了利用额外的分类器对原始模型的特征进行分类,减小了额外计算开销,从而提高对遥感对象的对象类型判断的准确性,并降低计算成本。
135.由此可见,本技术所提供的方案达到了基于图像中各遥感对象的分布数据确定该遥感对象是否为有效遥感对象的目的,从而实现了降低遥感对象标注成本的技术效果,进而解决了现有技术中由于无法有效的从图像中多个遥感对象中筛选出有效遥感对象所导致的遥感对象标注成本高的技术问题。
136.在一种可选的实施例中,至少一个遥感对象至少包括如下之一:遥感地物对象、建筑物对象、遥感水体对象。
137.可选的,遥感地物对象可以包括耕地、林地、草地、建筑物、道路、构筑物、人工堆掘地、裸地和水域等对象,还可以包括动物等对象,建筑物对象可以对各种建筑对象进行进一步地划分,如包括商业楼、居民楼、游乐场建筑等,遥感水体对象可以包括湖泊、海域、河流等对象。
138.实施例4
139.本技术的实施例还提供了一种图像数据处理方法,可选的,图9是根据本技术实施例的一种可选的图像数据处理方法的示意图,如图9所示,该方法包括:
140.步骤602,获取待识别图像,其中,待识别图像中包含有至少一个物品。
141.在步骤s602中,待识别图像可以是电商场景下或是交通安全场景下所获取的图像,待识别图像中包括有至少一个物品。其中,在电商场景下,待识别图像可以是所要销售的物品的图像;在交通安全场景下,待识别图像可以是用户所要运输的物品的图像,该图像可以是基于拍照生成,也可以是基于扫描生成。
142.步骤s604,对待识别图像的图像像素进行处理,得到至少一个物品所对应的分布数据。
143.在步骤s604中,图像识别系统可以基于机器学习模型对待识别图像的每个图像像素分别进行处理,也可以对待识别图像中的每个像素集合分别进行处理,其中,每个像素或每个像素集合中均存在一个对象或属于同一类别的多个对象,从而可以得到至少一个物品对应的分布数据。具体地,无论是在电商场景下还是交通安全场景下,该待识别图像中的每个像素或每个像素集合中存在的对象具体可以是电器、生活用品、服装、电子设备、违规物品等对象中的任一,每个像素或每个像素集合中可以存在一件衣服(即一个对象)或多件衣服(即属于同一类别的多个对象)。
144.需要说明的是,通过获取至少一个物品所对应的分布数据,以便于后续对各物品的物品类型进行准确判断。
145.步骤s606,根据至少一个物品所对应的分布数据识别至少一个物品所对应的物品类型。
146.在步骤s606中,分布数据至少包括均值和方差值,均值表征了至少一个物品的特征信息,方差值的大小表征了至少一个物品为异常物品的概率。在实际应用中,可以基于待识别图像中的物品的方差值确定该物品的物品类型为第一物品类型还是第二物品类型,其中,第一物品类型对应的物品未存储在预设存储区域中,第二物品类型对应的物品存储在预设存储区域中。由此实现对物品类型的有效判断。
147.步骤s608,基于物品类型确定至少一个物品是否为违规物品。
148.可选的,对于已知的物品(包括违规物品和非违规),可以将其加入到预设存储区域中,并在物品的物品类型为第二物品类型的情况下,由图像识别系统基于待识别图像中的物品的均值确定该物品的具体物品类型(例如:服装、首饰、违规物品等)。对于未知或是数据尚不完善的违规物品,由于其不在预设存储区域中,因此,当确定物品的物品类型为第一物品类型时,说明其是违规物品的概率较高,并可进一步地推送给监管人员,以供监管人员确认。由此,使得图像识别系统对于传统违规物品和新型违规物品均能有效识别,从而提高了本技术的识别效率。
149.进一步地,在确定了物品类型为第一对象类型的物品中存在违规物品后,监管人
员可以对违规物品进行标注,并将其作为新的样本加入到预设数据集中,以对机器学习模型进行优化训练,使得下一次向机器学习模型输入待识别图像时,机器学习模型可以有效对该图像中各个物品进行分类,从而提高分类效果,使得相关系统能够有效识别出违规物品。
150.基于上述步骤s602至步骤s608所限定的方案,可以获知,在本实施例中,采用根据各物品的分布数据识别至少一个物品所对应的物品类型,从而确定各物品是否为违规物品的方式,通过获取待识别图像,并对待识别图像的图像像素进行处理,得到至少一个物品所对应的分布数据,然后根据至少一个物品所对应的分布数据识别至少一个物品所对应的物品类型,从而基于物品类型确定至少一个物品是否为违规物品。其中,待识别图像中包含有至少一个物品。
151.容易注意到的是,在上述过程中,获取各物品对应的分布数据,根据物品对应的分布数据确定该物品的物品类型,并基于物品类型确定该物品是否为违规物品,实现了对待识别图像中有效物品的有效筛选。从而便于用户在有效物品中确定需要标注的物品,避免了相关系统对待识别图像中无效物品的标注,从而降低物品标注成本。
152.由此可见,本技术所提供的方案达到了根据各物品的分布数据识别至少一个物品所对应的物品类型,从而确定各物品是否为违规物品的目的,从而实现了降低物品标注成本的技术效果,进而解决了现有技术中由于无法有效的从图像中多个物品中筛选出有效物品所导致的物品标注成本高的技术问题。
153.实施例5
154.本技术的实施例可以提供一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。
155.可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。
156.在本实施例中,上述计算机终端可以执行图像数据处理方法中以下步骤的程序代码:获取待识别图像,其中,待识别图像中包含有至少一个区域,每个区域中存在至少一个对象;对待识别图像的图像数据进行处理,得到至少一个区域所对应的分布数据;根据至少一个区域所对应的分布数据确定至少一个区域的区域类型是否为第一区域类型,其中,第一区域类型所对应的区域中的对象未存储在预设存储区域中。
157.可选地,图10是根据本技术实施例的一种可选的计算机终端的结构框图。如图10所示,该计算机终端10可以包括:一个或多个(图中仅示出一个)处理器802、存储器804以及存储控制器。
158.其中,存储器可用于存储软件程序以及模块,如本技术实施例中的图像数据处理方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的图像数据处理方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
159.处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取待识别图像,其中,待识别图像中包含有至少一个区域,每个区域中存在至少一个对象;对待识别图像的图像数据进行处理,得到至少一个区域所对应的分布数据;根据至少一个区域所对应的分布数据确定至少一个区域的区域类型是否为第一区域类型,其中,第一区域类型所对应的区域中的对象未存储在预设存储区域中。
160.可选的,上述处理器还可以执行如下步骤的程序代码:基于预设的机器学习模型对待识别图像的图像数据进行计算,得到至少一个区域所对应的均值和方差值,其中,分布数据至少包括均值和方差值,均值表征了至少一个区域的特征信息,方差值的大小表征至少一个区域为第一区域类型的概率。
161.可选的,上述处理器还可以执行如下步骤的程序代码:在至少一个区域中存在方差值大于预设阈值的第一目标区域时,识别第一目标区域的区域类型为第一区域类型;在至少一个区域中存在方差值小于或等于预设阈值的第二目标区域时,识别第二目标区域的区域类型为第二区域类型,其中,第二区域类型所对应的区域中的对象存储在预设存储区域中。
162.可选的,上述处理器还可以执行如下步骤的程序代码:在识别第一目标区域的区域类型为第一区域类型之后,获取第一目标区域所对应的第一均值以及第二区域类型所对应区域的第二均值;比对第一均值与第二均值,从预设存储区域存储的区域数据中确定与第一目标区域相似度最高的目标区域;确定目标区域所对应的区域类型为第一目标区域所对应的初始标注类型。
163.可选的,上述处理器还可以执行如下步骤的程序代码:在确定目标区域所对应的区域类型为第一目标区域所对应的初始标注类型之后,响应更新指令,对第一目标区域的初始标注类型进行标注,得到标注区域;基于标注区域对预设数据集中的数据进行更新,其中,预设数据集用于对机器学习模型进行优化训练。
164.可选的,上述处理器还可以执行如下步骤的程序代码:在识别第一目标区域的区域类型为第一区域类型之后,响应删除指令,从至少一个区域中删除第一区域类型所对应的区域。
165.可选的,上述处理器还可以执行如下步骤的程序代码:在根据至少一个区域所对应的分布数据确定至少一个区域的区域类型是否为第一区域类型之前,从预设的历史记录中获取第一区域类型所对应的区域的第一分布信息以及第二区域类型所对应的区域的第二分布信息;基于第一分布信息以及第二分布信息确定预设阈值。
166.可选的,上述处理器还可以执行如下步骤的程序代码:在基于预设的机器学习模型对待识别图像的图像数据进行计算,得到至少一个区域所对应的均值和方差值之后,对至少一个区域所对应的方差值进行重采样处理,得到缩放系数;对至少一个区域所对应的均值进行分类计算,得到至少一个区域所对应的分数值;计算缩放系数与分数值之间的比值,得到目标分数值;基于目标分数值计算机器学习模型对应的损失函数值;在损失函数值满足预设条件时,对机器学习模型的网络参数进行优化处理。
167.可选的,上述处理器还可以执行如下步骤的程序代码:读取待识别图像,其中,待识别图像中包含有至少一个区域,每个区域中存在至少一个对象;响应图像识别指令,显示至少一个区域所对应的分布数据以及至少一个区域所对应的识别结果,其中,至少一个区
域所对应的分布数据是通过对待识别图像的图像数据进行处理得到的,识别结果是根据至少一个区域所对应的分布数据对至少一个区域进行识别所得到的,识别结果表征至少一个区域的区域类型是否为第一区域类型,第一区域类型所对应的区域中的对象未存储在预设存储区域中。
168.可选的,上述处理器还可以执行如下步骤的程序代码:云服务器接收终端设备发送的包含至少一个区域的待识别图像,其中,每个区域中存在至少一个对象;云服务器对待识别图像的图像数据进行处理,得到至少一个区域所对应的分布数据;云服务器根据至少一个区域所对应的分布数据确定至少一个区域的区域类型是否为第一区域类型,得到识别结果,其中,第一区域类型所对应的区域中的对象未存储在预设存储区域中;云服务器将识别结果返回至终端设备上。
169.可选的,上述处理器还可以执行如下步骤的程序代码:在云服务器将识别结果返回至终端设备上之后,云服务器获取终端设备对至少一个区域中的第一区域类型的区域进行标注的标注结果,并基于标注后的第一区域类型的区域对预设数据集进行更新,以对机器学习模型进行优化训练。
170.可选的,上述处理器还可以执行如下步骤的程序代码:获取待识别的遥感图像,其中,遥感图像中包含有至少一个遥感对象;对遥感图像的图像像素进行处理,得到至少一个遥感对象所对应的分布数据;根据至少一个遥感对象所对应的分布数据确定至少一个遥感对象的对象类型是否为第一对象类型,其中,第一对象类型所对应的对象未存储在预设存储区域中。
171.可选的,上述处理器还可以执行如下步骤的程序代码:至少一个遥感对象至少包括如下之一:遥感地物对象、建筑物对象、遥感水体对象。
172.可选的,上述处理器还可以执行如下步骤的程序代码:获取待识别图像,其中,待识别图像中包含有至少一个物品;对待识别图像的图像像素进行处理,得到至少一个物品所对应的分布数据;根据至少一个物品所对应的分布数据识别至少一个物品所对应的物品类型;基于物品类型确定至少一个物品是否为违规物品。
173.本领域普通技术人员可以理解,图10所示的结构仅为示意,计算机终端也可以是智能手机(如android手机、ios手机等)、平板电脑、掌声电脑以及移动互联网设备(mobile internet devices,mid)、pad等终端设备。图10其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图10中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图10所示不同的配置。
174.本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(read-only memory,rom)、随机存取器(random access memory,ram)、磁盘或光盘等。
175.实施例6
176.本技术的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例一所提供的图像数据处理方法所执行的程序代码。
177.可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
178.可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取待识别图像,其中,待识别图像中包含有至少一个区域,每个区域中存在至少一个对象;对待识别图像的图像数据进行处理,得到至少一个区域所对应的分布数据;根据至少一个区域所对应的分布数据确定至少一个区域的区域类型是否为第一区域类型,其中,第一区域类型所对应的区域中的对象未存储在预设存储区域中。
179.可选地,上述存储介质还可以存储用于执行以下步骤的程序代码:基于预设的机器学习模型对待识别图像的图像数据进行计算,得到至少一个区域所对应的均值和方差值,其中,分布数据至少包括均值和方差值,均值表征了至少一个区域的特征信息,方差值的大小表征至少一个区域为第一区域类型的概率。
180.可选地,上述存储介质还可以存储用于执行以下步骤的程序代码:在至少一个区域中存在方差值大于预设阈值的第一目标区域时,识别第一目标区域的区域类型为第一区域类型;在至少一个区域中存在方差值小于或等于预设阈值的第二目标区域时,识别第二目标区域的区域类型为第二区域类型,其中,第二区域类型所对应的区域中的对象存储在预设存储区域中。
181.可选地,上述存储介质还可以存储用于执行以下步骤的程序代码:在识别第一目标区域的区域类型为第一区域类型之后,获取第一目标区域所对应的第一均值以及第二区域类型所对应区域的第二均值;比对第一均值与第二均值,从预设存储区域存储的区域数据中确定与第一目标区域相似度最高的目标区域;确定目标区域所对应的区域类型为第一目标区域所对应的初始标注类型。
182.可选地,上述存储介质还可以存储用于执行以下步骤的程序代码:在确定目标区域所对应的区域类型为第一目标区域所对应的初始标注类型之后,响应更新指令,对第一目标区域的初始标注类型进行标注,得到标注区域;基于标注区域对预设数据集中的数据进行更新,其中,预设数据集用于对机器学习模型进行优化训练。
183.可选地,上述存储介质还可以存储用于执行以下步骤的程序代码:在识别第一目标区域的区域类型为第一区域类型之后,响应删除指令,从至少一个区域中删除第一区域类型所对应的区域。
184.可选地,上述存储介质还可以存储用于执行以下步骤的程序代码:在根据至少一个区域所对应的分布数据确定至少一个区域的区域类型是否为第一区域类型之前,从预设的历史记录中获取第一区域类型所对应的区域的第一分布信息以及第二区域类型所对应的区域的第二分布信息;基于第一分布信息以及第二分布信息确定预设阈值。
185.可选地,上述存储介质还可以存储用于执行以下步骤的程序代码:在基于预设的机器学习模型对待识别图像的图像数据进行计算,得到至少一个区域所对应的均值和方差值之后,对至少一个区域所对应的方差值进行重采样处理,得到缩放系数;对至少一个区域所对应的均值进行分类计算,得到至少一个区域所对应的分数值;计算缩放系数与分数值之间的比值,得到目标分数值;基于目标分数值计算机器学习模型对应的损失函数值;在损失函数值满足预设条件时,对机器学习模型的网络参数进行优化处理。
186.可选地,上述存储介质还可以存储用于执行以下步骤的程序代码:读取待识别图像,其中,待识别图像中包含有至少一个区域,每个区域中存在至少一个对象;响应图像识别指令,显示至少一个区域所对应的分布数据以及至少一个区域所对应的识别结果,其中,
至少一个区域所对应的分布数据是通过对待识别图像的图像数据进行处理得到的,识别结果是根据至少一个区域所对应的分布数据对至少一个区域进行识别所得到的,识别结果表征至少一个区域的区域类型是否为第一区域类型,第一区域类型所对应的区域中的对象未存储在预设存储区域中。
187.可选地,上述存储介质还可以存储用于执行以下步骤的程序代码:云服务器接收终端设备发送的包含至少一个区域的待识别图像,其中,每个区域中存在至少一个对象;云服务器对待识别图像的图像数据进行处理,得到至少一个区域所对应的分布数据;云服务器根据至少一个区域所对应的分布数据确定至少一个区域的区域类型是否为第一区域类型,得到识别结果,其中,第一区域类型所对应的区域中的对象未存储在预设存储区域中;云服务器将识别结果返回至终端设备上。
188.可选地,上述存储介质还可以存储用于执行以下步骤的程序代码:在云服务器将识别结果返回至终端设备上之后,云服务器获取终端设备对至少一个区域中的第一区域类型的区域进行标注的标注结果,并基于标注后的第一区域类型的区域对预设数据集进行更新,以对机器学习模型进行优化训练。
189.可选地,上述存储介质还可以存储用于执行以下步骤的程序代码:获取待识别的遥感图像,其中,遥感图像中包含有至少一个遥感对象;对遥感图像的图像像素进行处理,得到至少一个遥感对象所对应的分布数据;根据至少一个遥感对象所对应的分布数据确定至少一个遥感对象的对象类型是否为第一对象类型,其中,第一对象类型所对应的对象未存储在预设存储区域中。
190.可选地,上述存储介质还可以存储用于执行以下步骤的程序代码:至少一个遥感对象至少包括如下之一:遥感地物对象、建筑物对象、遥感水体对象。
191.可选地,上述存储介质还可以存储用于执行以下步骤的程序代码:获取待识别图像,其中,待识别图像中包含有至少一个物品;对待识别图像的图像像素进行处理,得到至少一个物品所对应的分布数据;根据至少一个物品所对应的分布数据识别至少一个物品所对应的物品类型;基于物品类型确定至少一个物品是否为违规物品。
192.实施例7
193.本技术的实施例还提供了一种识别图像的系统,可选的,该系统包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:获取待识别图像,其中,待识别图像中包含有至少一个区域,每个区域中存在至少一个对象;对待识别图像的图像数据进行处理,得到至少一个区域所对应的分布数据;根据至少一个区域所对应的分布数据确定至少一个区域的区域类型是否为第一区域类型,其中,第一区域类型所对应的区域中的对象未存储在预设存储区域中。
194.由上可知,在本技术中,采用基于图像中各区域的分布数据确定该区域是否为有效区域的方式,通过获取待识别图像,然后对待识别图像的图像数据进行处理,得到至少一个区域所对应的分布数据,从而根据至少一个区域所对应的分布数据确定至少一个区域的区域类型是否为第一区域类型。其中,待识别图像中包含有至少一个区域,每个区域中存在至少一个对象,第一区域类型所对应的区域中的对象未存储在预设存储区域中。
195.容易注意到的是,在上述过程中,获取各区域对应的分布数据,并根据各区域对应的分布数据确定该区域的区域类型,实现了对图像中有效区域的有效筛选,从而便于用户
在有效区域中确定需要标注的区域,避免了相关系统对待识别图像中无效区域的标注,从而降低区域标注成本。此外,在本技术中,通过基于各区域对应的分布数据确定该区域的区域类型,避免了对分类概率统计分析、人为设定阈值,减小了数据统计性质导致的随机性,也避免了利用额外的分类器对原始模型的特征进行分类,减小了额外计算开销,从而提高对区域的区域类型判断的准确性,并降低计算成本。
196.由此可见,本技术所提供的方案达到了基于图像中各区域的分布数据确定该区域是否为有效区域的目的,从而实现了降低区域标注成本的技术效果,进而解决了现有技术中由于无法有效的从图像中多个区域中筛选出有效区域所导致的区域标注成本高的技术问题。
197.需要说明的是,本实施例中的处理器可执行实施例1所提供的图像数据处理方法,相关内容已在实施例1中进行说明,在此不再赘述。
198.上述本技术实施例序号仅仅为了描述,不代表实施例的优劣。
199.在本技术的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
200.在本技术所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
201.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
202.另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
203.所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
204.以上所述仅是本技术的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本技术的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献