一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

数据处理方法、装置、设备以及计算机存储介质与流程

2022-05-06 09:09:03 来源:中国专利 TAG:


1.本发明实施例涉及计算机数据处理技术领域,具体涉及一种数据处理方法、装置、设备以及计算机存储介质。


背景技术:

2.行人重识别技术是利用计算机视觉算法对跨设备的行人图像或视频进行匹配,即给定一个查询图像,在不同监控设备的图像库检索出同一个行人。由于不同摄像设备之间存在着差异,且行人外观易受穿着、尺度、遮挡、姿态和视角等影响,导致行人重识别技术成为计算机视觉领域中一个既具有研究价值同时又极具挑战性的热门课题。
3.本技术的发明人在实施本技术实施例的过程中发现:现有技术中,原有场景中的行人重识别模型迁移到新的场景后,行人重识别模型的性能显著下降,从而导致识别结果不够准确。


技术实现要素:

4.鉴于上述问题,本发明实施例提供了一种数据处理方法、装置、设备以及计算机存储介质,用于解决现有技术中存在的行人重识别的准确率较低的问题。
5.根据本发明实施例的一个方面,提供了一种数据处理方法,所述方法包括:
6.对源域样本数据和目标域样本数据进行特征增强,得到增强后源域样本数据和增强后目标域样本数据;
7.根据所述增强后源域样本数据和增强后目标域样本数据之间的距离确定所述增强后源域样本数据对应的权重矩阵;
8.根据所述权重矩阵、所述增强后源域样本数据确定源域子空间;
9.根据所述增强后目标域样本数据确定目标域子空间;
10.将所述源域子空间和所述目标域子空间对齐,得到对齐后源域样本数据、对齐后目标域样本数据;
11.根据所述对齐后源域样本数据、对齐后目标域样本数据以及所述源域样本数据对应的样本标签确定所述目标域样本数据对应的样本标签。
12.在一种可选的方式中,所述源域样本数据中包括多个源域样本;所述目标域样本数据中包括多个目标域样本;所述方法还包括:
13.根据高斯核函数分别确定各个所述源域样本以及各个所述目标域样本与样本集合之间的相似度;所述样本集合中包括所有所述源域样本和所有所述目标域样本;
14.根据所述相似度分别对所述源域样本数据和所述目标样本数据进行特征增强,得到所述增强后源域样本数据和所述增强后目标域样本数据。
15.在一种可选的方式中,所述方法还包括:
16.分别确定各个所述增强后目标域样本与所有所述增强后源域样本之间的距离中的最小值;
17.根据所述最小值以及各个所述增强后源域样本与各个所述增强后目标域样本之间的距离分别确定各个所述增强后源域样本对应的权重值,得到所述权重矩阵。
18.在一种可选的方式中,所述方法还包括:
19.根据所述权重矩阵和所述增强后源域样本数据确定协方差矩阵;
20.根据所述协方差矩阵进行特征值分解,得到多个特征值;
21.根据所述多个特征值确定所述源域子空间。
22.在一种可选的方式中,所述方法还包括:
23.根据下式确定所述协方差矩阵:
[0024][0025]
其中,c为所述协方差矩阵;m为所述增强后源域样本的数量;i为所述增强后源域样本的序号;为第i个所述增强后源域样本;wi为在所述权重矩阵中对应的权重值。
[0026]
在一种可选的方式中,所述方法还包括:
[0027]
按照特征值的降序对所述多个特征值进行排序,得到特征值序列;
[0028]
根据所述特征值序列中排名前n的特征值对应的特征向量确定源域子空间;n为正整数。
[0029]
在一种可选的方式中,所述源域样本数据和所述源域样本数据对应的样本标签用于训练原场景对应的行人重识别模型;所述方法还包括:
[0030]
获取目标场景对应的待识别图像数据;
[0031]
将所述待识别图像数据输入所述目标场景对应的行人重识别模型,得到所述待识别图像数据对应的行人识别结果;其中,所述目标场景对应的行人重识别模型根据所述目标域样本数据和所述目标域样本数据对应的样本标签训练得到。
[0032]
根据本发明实施例的另一方面,提供了一种数据处理装置,包括:
[0033]
增强模块,用于对源域样本数据和目标域样本数据进行特征增强,得到增强后源域样本数据和增强后目标域样本数据;
[0034]
第一确定模块,用于根据所述增强后源域样本数据和增强后目标域样本数据之间的距离确定所述增强后源域样本数据对应的权重矩阵;
[0035]
第二确定模块,用于根据所述权重矩阵、所述增强后源域样本数据确定源域子空间;
[0036]
第三确定模块,用于根据所述增强后目标域样本数据确定目标域子空间;
[0037]
对齐模块,用于将所述源域子空间和所述目标域子空间对齐,得到对齐后源域样本数据、对齐后目标域样本数据;
[0038]
第四确定模块,用于根据所述对齐后源域样本数据、对齐后目标域样本数据以及所述源域样本数据对应的样本标签确定所述目标域样本数据对应的样本标签。
[0039]
根据本发明实施例的另一方面,提供了一种数据处理设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相
互间的通信;
[0040]
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如所述的数据处理方法的操作。
[0041]
根据本发明实施例的又一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使数据处理设备执行所述的数据处理方法的操作。
[0042]
本发明实施例通过对源域样本数据和目标域样本数据进行特征增强,得到增强后源域样本数据和增强后目标域样本数据;根据增强后源域样本数据和增强后目标域样本数据之间的距离确定增强后源域样本数据对应的权重矩阵,在权重矩阵中,与目标域样本距离越近的源域样本的权重越高,由此放大了和目标域样本分布接近的源域样本的特征,弱化了和目标域样本分布差异很大的源域样本的特征;根据权重矩阵、增强后源域样本数据确定源域子空间;根据增强后目标域样本数据确定目标域子空间;将源域子空间和目标域子空间对齐,得到对齐后源域样本数据、对齐后目标域样本数据;最后根据对齐后源域样本数据、对齐后目标域样本数据以及源域样本数据对应的样本标签确定目标域样本数据对应的样本标签,其中,所述源域样本数据和所述源域样本数据对应的样本标签用于训练原场景对应的行人重识别模型,所述目标域样本数据和所述目标域样本数据对应的样本标签用于训练目标场景对应的行人重识别模型,由此使模型在从原场景移植到目标场景后也能保持较好的性能,提高了行人重识别模型的鲁棒性和行人重识别的准确性。
[0043]
上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
[0044]
附图仅用于示出实施方式,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0045]
图1示出了本发明实施例提供的数据处理方法的流程示意图;
[0046]
图2示出了本发明实施例提供的数据处理装置的结构示意图;
[0047]
图3示出了本发明实施例提供的数据处理设备的结构示意图。
具体实施方式
[0048]
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。
[0049]
图1示出了本发明实施例提供的数据处理方法的流程图,该方法由计算机处理设备执行。该计算机处理设备可以包括手机、笔记本电脑等。如图1所示,该方法包括以下步骤:
[0050]
步骤10:对源域样本数据和目标域样本数据进行特征增强,得到增强后源域样本数据和增强后目标域样本数据。
[0051]
在本发明的一个实施例中,源域样本数据可以是历史场景对应的行人重识别模型
的训练数据,目标域样本数据可以是新场景对应的行人重识别模型的训练数据。其中,源域样本数据中包括多个源域样本,目标域样本数据中包括多个目标域样本,源域样本和目标域样本可以是图像特征样本,图像特征样本中包括多个图像特征元素。
[0052]
在本发明的一个实施例中,令ds=(x1,x2,...,xm)
t
,xi∈r1×d,其中,ds表示源域样本数据,xi表示源域样本数据中的一个源域样本。令d
t
=(y1,y2,...,yn)
t
,yj∈r1×d,其中,d
t
表示目标域样本数据,yj表示目标域样本数据中的一个目标域样本。可以将源域样本xi与ds∪d
t
中的所有样本之间的相似性作为xi的新的特征表示。其中,相似性可以根据核映射函数确定。
[0053]
在本发明的再一个实施例中,步骤10还包括:
[0054]
步骤101:根据高斯核函数分别确定各个所述源域样本以及各个所述目标域样本与样本集合之间的相似度;所述样本集合中包括所有所述源域样本和所有所述目标域样本。
[0055]
在本发明的一个实施例中,可以用高斯核函数k(x,y)=exp(-γ||x-y||2)的函数值来作为两个样本之间的相似度。若第i个增强后源域样本或增强后目标域样本表示为其中,μi∈(ds∪d
t
),δj∈(ds∪d
t
)。
[0056]
步骤102:根据所述相似度分别对所述源域样本数据和所述目标样本数据进行特征增强,得到所述增强后源域样本数据和所述增强后目标域样本数据。
[0057]
在本发明的一个实施例中,令表示增强后源域样本数据,表示增强后源域数据中的第i个增强后源域样本,其中第i个增强后源域样本中的第j个元素的计算方式如下:
[0058][0059]

[0060]
令其中,表示增强后目标域样本数据,表示增强后目标域数据中的第i个增强后目标域样本,其中第i个增强后目标域样本中的第j个元素的计算方式如下:
[0061][0062]

[0063]
步骤20:根据所述增强后源域样本数据和增强后目标域样本数据之间的距离确定所述增强后源域样本数据对应的权重矩阵。
[0064]
在本发明的一个实施例中,为了在迁移学习过程中放大和目标域样本分布接近的源域样本的特征,弱化和目标域样本分布差异很大源域样本的特征,可以将与增强后目标域样本之间距离近的增强后源域样本的权重设置得较大。即令w=[w1,w2,...,wm],w∈r1×m表示源域样本的权重,那么增强后源域样本的权重wi越大,代表这个增强后源域样本的分布和增强后目标域样本的分布越接近,从而根据源域样本对应的标签对目标域样本的标注即越准确。
[0065]
在本发明的一个实施例中,所述增强后源域样本数据中包括多个增强后源域样本;所述增强后目标域样本数据中包括多个增强后目标域样本;步骤20还包括:
[0066]
步骤201:分别确定各个所述增强后目标域样本与所有所述增强后源域样本之间的距离中的最小值。
[0067]
在本发明的一个实施例中,增强后目标域样本和增强后源域样本之间的距离定义如下:
[0068][0069]
按照上述定义计算每一对增强后目标域样本和增强后源域样本之间的距离,得到距离矩阵如下:
[0070][0071]
计算增强后目标域中的每个样本和增强后源域中所有样本的距离的最小值,即矩阵s每一行的最小值,表示成α=[α1,α2,...,αn]
t
∈rn×1,其中,
[0072]
步骤202:根据所述最小值以及各个所述增强后源域样本与各个所述增强后目标域样本之间的距离分别确定各个所述增强后源域样本对应的权重值,得到所述权重矩阵。
[0073]
在本发明的一个实施例中,每个增强后源域样本的权重可以表示成:
[0074][0075]
其中,w0是初始权重,本发明实施例中设置为1,φ(a)的计算规则如下:
[0076][0077]
从权重表示的公式可知,若d
ji
等于增强后目标域中样本j和增强后源域中的所有样本的距离的最小值,即增强后源域中第i个样本和增强后目标域中第j个样本分布最接近,那么这第i个增强后源域样本的权重便会增加。
[0078]
步骤30:根据所述权重矩阵、所述增强后源域样本数据确定源域子空间。
[0079]
在本发明的一个实施例中,可以根据各个增强后源域样本和权重矩阵确定源域平均值,根据源域平均值确定增强后源域样本数据对应的协方差矩阵,再根据协方差矩阵进行特征值分解,根据分解结果选取最大的预设数目个特征矢量构成源域子空间。
[0080]
因此,在本发明的再一个实施例中,步骤30还包括:
[0081]
步骤301:根据所述权重矩阵和所述增强后源域样本数据确定协方差矩阵。
[0082]
在本发明的一个实施例中,根据权重矩阵计算各个增强后源域样本对应的加权后样本值,再将所有加权后样本值进行归一化,得到所有增强后源域样本对应的平均样本值,根据平均样本值和各个增强后源域样本之间的距离以及该增强后源域样本对应的权重确定协方差矩阵。
[0083]
因此,在本发明的再一个实施例中,所述增强后源域样本数据中包括多个增强后源域样本;所述增强后目标域样本数据中包括多个增强后目标域样本;步骤301还包括:
[0084]
步骤3011:根据下式确定所述协方差矩阵:
[0085][0086][0087]
其中,c为所述协方差矩阵;m为所述增强后源域样本的数量;i为所述增强后源域样本的序号;样本的序号;为第i个所述增强后源域样本;wi为在所述权重矩阵中对应的权重值。
[0088]
步骤302:根据所述协方差矩阵进行特征值分解,得到多个特征值。
[0089]
步骤303:根据所述多个特征值确定所述源域子空间。
[0090]
在本发明的一个实施例中,为了使得源域子空间更能表征源域样本数据的特征,可以将特征值中最大的预设数目个特征值对应的特征向量构造成源域子空间。
[0091]
在本发明的一个实施例中,步骤303还包括:
[0092]
步骤3031:按照特征值的降序对所述多个特征值进行排序,得到特征值序列。
[0093]
步骤3032:根据所述特征值序列中排名前n的特征值对应的特征向量确定源域子空间;n为正整数。
[0094]
在本发明的一个实施例中,得到源域子空间,记作ps∈r
(m n)
×d。
[0095]
步骤40:根据所述增强后目标域样本数据确定目标域子空间。
[0096]
在本发明的一个实施例中,可以利用主成分分析法对增强后目标域样本数据进行计算,得到目标域子空间,记作p
t
∈r
(m n)
×d。
[0097]
步骤50:将所述源域子空间和所述目标域子空间对齐,得到对齐后源域样本数据、对齐后目标域样本数据。
[0098]
在本发明的一个实施例中,可以寻找一个线性变换矩阵m来对齐源域子空间和目标域子空间,变换矩阵m可以通过最小化下式得到:
[0099][0100]
由于frobenius范数对于正交操作具有不变性,上式可以重写为如下形式:
[0101][0102]
根据该改写后上式可以得到最优解的m为:
[0103][0104]
最后,根据m将所述源域子空间和所述目标域子空间对齐,得到对齐后源域样本数
据,表示为以及对齐后目标域样本数据,表示为
[0105]
步骤60:根据所述对齐后源域样本数据、对齐后目标域样本数据以及所述源域样本数据对应的样本标签确定所述目标域样本数据对应的样本标签。
[0106]
在本发明的一个实施例中,可以将对齐后源域样本数据、对齐后目标域样本数据以及源域样本数据对应的样本标签输入到预设的分类器中,分类器会输出输入的目标域样本数据所对应的样本标签。其中,分类器可以是最近邻分类器。
[0107]
在本发明的再一个实施例中,所述源域样本数据和所述源域样本数据对应的样本标签用于训练原场景对应的行人重识别模型;步骤60之后还包括:
[0108]
步骤601:获取目标场景对应的待识别图像数据。
[0109]
在本发明的一个实施例中,目标场景可以是由待识别目标存在的场景,待识别目标可以是行人等。
[0110]
步骤602:将所述待识别图像数据输入所述目标场景对应的行人重识别模型,得到所述待识别图像数据对应的行人识别结果;其中,所述目标场景对应的行人重识别模型根据所述目标域样本数据和所述目标域样本数据对应的样本标签训练得到。
[0111]
在本发明的一个实施例中,原场景和所述目标场景中的同一行人对应的样本标签是相同的,因此,通过前述步骤,根据原场景对应的源域样本数据和所述源域样本数据对应的样本标签确定出目标域样本数据以及对应的样本标签,由此将原场景中的行人重识别模型的训练结果迁移到目标场景中,在提高行人重识别的准确性的同时,提高了行人重识别模型的鲁棒性。
[0112]
本发明实施例提供的数据处理方法通过对源域样本数据和目标域样本数据进行特征增强,得到增强后源域样本数据和增强后目标域样本数据;根据增强后源域样本数据和增强后目标域样本数据之间的距离确定增强后源域样本数据对应的权重矩阵,在权重矩阵中,与目标域样本距离越近的源域样本的权重越高,由此放大了和目标域样本分布接近的源域样本的特征,弱化了和目标域样本分布差异很大源域样本的特征;根据权重矩阵、增强后源域样本数据确定源域子空间;根据增强后目标域样本数据确定目标域子空间;将源域子空间和目标域子空间对齐,得到对齐后源域样本数据、对齐后目标域样本数据;最后根据对齐后源域样本数据、对齐后目标域样本数据以及源域样本数据对应的样本标签确定目标域样本数据对应的样本标签,从而本发明实施例提供的数据处理方法提高了行人重识别模型的鲁棒性,使模型在移植到新的场景后也能保持较好的性能,能够提高行人重识别的准确性。
[0113]
图2示出了本发明实施例提供的数据处理装置的结构示意图。如图2所示,该装置70包括:增强模块701、第一确定模块702、第二确定模块703、第三确定模块704、对齐模块705以及第四确定模块706。
[0114]
其中,增强模块701,用于对源域样本数据和目标域样本数据进行特征增强,得到增强后源域样本数据和增强后目标域样本数据;
[0115]
第一确定模块702,用于根据所述增强后源域样本数据和增强后目标域样本数据之间的距离确定所述增强后源域样本数据对应的权重矩阵;
[0116]
第二确定模块703,用于根据所述权重矩阵、所述增强后源域样本数据确定源域子空间;
[0117]
第三确定模块704,用于根据所述增强后目标域样本数据确定目标域子空间;
[0118]
对齐模块705,用于将所述源域子空间和所述目标域子空间对齐,得到对齐后源域样本数据、对齐后目标域样本数据;
[0119]
第四确定模块706,用于根据所述对齐后源域样本数据、对齐后目标域样本数据以及所述源域样本数据对应的样本标签确定所述目标域样本数据对应的样本标签。
[0120]
在一种可选的方式中,所述源域样本数据中包括多个源域样本;所述目标域样本数据中包括多个目标域样本;
[0121]
增强模块701还用于:根据高斯核函数分别确定各个所述源域样本以及各个所述目标域样本与样本集合之间的相似度;所述样本集合中包括所有所述源域样本和所有所述目标域样本;
[0122]
根据所述相似度分别对所述源域样本数据和所述目标样本数据进行特征增强,得到所述增强后源域样本数据和所述增强后目标域样本数据。
[0123]
在一种可选的方式中,所述增强后源域样本数据中包括多个增强后源域样本;所述增强后目标域样本数据中包括多个增强后目标域样本;
[0124]
第一确定模块702还用于:分别确定各个所述增强后目标域样本与所有所述增强后源域样本之间的距离中的最小值;
[0125]
根据所述最小值以及各个所述增强后源域样本与各个所述增强后目标域样本之间的距离分别确定各个所述增强后源域样本对应的权重值,得到所述权重矩阵。
[0126]
在一种可选的方式中,第一确定模块702还用于:
[0127]
根据所述权重矩阵和所述增强后源域样本数据确定协方差矩阵;
[0128]
根据所述协方差矩阵进行特征值分解,得到多个特征值;
[0129]
根据所述多个特征值确定所述源域子空间。
[0130]
在一种可选的方式中,所述增强后源域样本数据中包括多个增强后源域样本;所述增强后目标域样本数据中包括多个增强后目标域样本;第一确定模块702还用于:
[0131]
根据下式确定所述协方差矩阵:
[0132][0133]
其中,c为所述协方差矩阵;m为所述增强后源域样本的数量;i为所述增强后源域样本的序号;为第i个所述增强后源域样本;wi为在所述权重矩阵中对应的权重值。
[0134]
在一种可选的方式中,第一确定模块702还用于:
[0135]
按照特征值的降序对所述多个特征值进行排序,得到特征值序列;
[0136]
根据所述特征值序列中排名前n的特征值对应的特征向量确定源域子空间;n为正整数。
[0137]
在一种可选的方式中,所述源域样本数据和所述源域样本数据对应的样本标签用于训练原场景对应的行人重识别模型;第四确定模块70还用于:
[0138]
获取目标场景对应的待识别图像数据;
[0139]
将所述待识别图像数据输入所述目标场景对应的行人重识别模型,得到所述待识别图像数据对应的行人识别结果;其中,所述目标场景对应的行人重识别模型根据所述目标域样本数据和所述目标域样本数据对应的样本标签训练得到。
[0140]
本发明实施例提供的数据处理装置通过对源域样本数据和目标域样本数据进行特征增强,得到增强后源域样本数据和增强后目标域样本数据;根据增强后源域样本数据和增强后目标域样本数据之间的距离确定增强后源域样本数据对应的权重矩阵,在权重矩阵中,与目标域样本距离越近的源域样本的权重越高,由此放大了和目标域样本分布接近的源域样本的特征,弱化了和目标域样本分布差异很大源域样本的特征;根据权重矩阵、增强后源域样本数据确定源域子空间;根据增强后目标域样本数据确定目标域子空间;将源域子空间和目标域子空间对齐,得到对齐后源域样本数据、对齐后目标域样本数据;最后根据对齐后源域样本数据、对齐后目标域样本数据以及源域样本数据对应的样本标签确定目标域样本数据对应的样本标签,从而本发明实施例提供的数据处理装置提高了行人重识别模型的鲁棒性,使模型在移植到新的场景后也能保持较好的性能,能够提高行人重识别的准确性。
[0141]
图3示出了本发明实施例提供的数据处理设备的结构示意图,本发明具体实施例并不对数据处理设备的具体实现做限定。
[0142]
如图3所示,该数据处理设备可以包括:处理器(processor)802、通信接口(communications interface)804、存储器(memory)806、以及通信总线808。
[0143]
其中:处理器802、通信接口804、以及存储器806通过通信总线808完成相互间的通信。通信接口804,用于与其它设备比如客户端或其它服务器等的网元通信。处理器802,用于执行程序810,具体可以执行上述用于数据处理方法实施例中的相关步骤。
[0144]
具体地,程序810可以包括程序代码,该程序代码包括计算机可执行指令。
[0145]
处理器802可能是中央处理器cpu,或者是特定集成电路asic(application specific integrated circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。数据处理设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个cpu;也可以是不同类型的处理器,如一个或多个cpu以及一个或多个asic。
[0146]
存储器806,用于存放程序810。存储器806可能包含高速ram存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
[0147]
程序810具体可以被处理器802调用使数据处理设备执行以下操作:
[0148]
对源域样本数据和目标域样本数据进行特征增强,得到增强后源域样本数据和增强后目标域样本数据;
[0149]
根据所述增强后源域样本数据和增强后目标域样本数据之间的距离确定所述增强后源域样本数据对应的权重矩阵;
[0150]
根据所述权重矩阵、所述增强后源域样本数据确定源域子空间;
[0151]
根据所述增强后目标域样本数据确定目标域子空间;
[0152]
将所述源域子空间和所述目标域子空间对齐,得到对齐后源域样本数据、对齐后目标域样本数据;
[0153]
根据所述对齐后源域样本数据、对齐后目标域样本数据以及所述源域样本数据对应的样本标签确定所述目标域样本数据对应的样本标签。
[0154]
在一种可选的方式中,所述源域样本数据中包括多个源域样本;所述目标域样本数据中包括多个目标域样本;所述程序810被处理器802调用使数据处理设备执行以下操作:
[0155]
根据高斯核函数分别确定各个所述源域样本以及各个所述目标域样本与样本集合之间的相似度;所述样本集合中包括所有所述源域样本和所有所述目标域样本;
[0156]
根据所述相似度分别对所述源域样本数据和所述目标样本数据进行特征增强,得到所述增强后源域样本数据和所述增强后目标域样本数据。
[0157]
在一种可选的方式中,所述增强后源域样本数据中包括多个增强后源域样本;所述增强后目标域样本数据中包括多个增强后目标域样本;所述程序810被处理器802调用使数据处理设备执行以下操作:
[0158]
分别确定各个所述增强后目标域样本与所有所述增强后源域样本之间的距离中的最小值;
[0159]
根据所述最小值以及各个所述增强后源域样本与各个所述增强后目标域样本之间的距离分别确定各个所述增强后源域样本对应的权重值,得到所述权重矩阵。
[0160]
在一种可选的方式中,所述程序810被处理器802调用使数据处理设备执行以下操作:
[0161]
根据所述权重矩阵和所述增强后源域样本数据确定协方差矩阵;
[0162]
根据所述协方差矩阵进行特征值分解,得到多个特征值;
[0163]
根据所述多个特征值确定所述源域子空间。
[0164]
在一种可选的方式中,所述增强后源域样本数据中包括多个增强后源域样本;所述增强后目标域样本数据中包括多个增强后目标域样本;所述程序810被处理器802调用使数据处理设备执行以下操作:
[0165]
根据下式确定所述协方差矩阵:
[0166][0167]
其中,c为所述协方差矩阵;m为所述增强后源域样本的数量;i为所述增强后源域样本的序号;为第i个所述增强后源域样本;wi为在所述权重矩阵中对应的权重值。
[0168]
在一种可选的方式中,所述程序810被处理器802调用使数据处理设备执行以下操作:
[0169]
按照特征值的降序对所述多个特征值进行排序,得到特征值序列;
[0170]
根据所述特征值序列中排名前n的特征值对应的特征向量确定源域子空间;n为正整数。
[0171]
在一种可选的方式中,所述源域样本数据和所述源域样本数据对应的样本标签用于训练原场景对应的行人重识别模型;所述程序810被处理器802调用使数据处理设备执行以下操作:
[0172]
获取目标场景对应的待识别图像数据;
[0173]
将所述待识别图像数据输入所述目标场景对应的行人重识别模型,得到所述待识别图像数据对应的行人识别结果;其中,所述目标场景对应的行人重识别模型根据所述目标域样本数据和所述目标域样本数据对应的样本标签训练得到。
[0174]
本发明实施例提供的数据处理设备通过对源域样本数据和目标域样本数据进行特征增强,得到增强后源域样本数据和增强后目标域样本数据;根据增强后源域样本数据和增强后目标域样本数据之间的距离确定增强后源域样本数据对应的权重矩阵,在权重矩阵中,与目标域样本距离越近的源域样本的权重越高,由此放大了和目标域样本分布接近的源域样本的特征,弱化了和目标域样本分布差异很大源域样本的特征;根据权重矩阵、增强后源域样本数据确定源域子空间;根据增强后目标域样本数据确定目标域子空间;将源域子空间和目标域子空间对齐,得到对齐后源域样本数据、对齐后目标域样本数据;最后根据对齐后源域样本数据、对齐后目标域样本数据以及源域样本数据对应的样本标签确定目标域样本数据对应的样本标签,从而本发明实施例提供的数据处理设备提高了行人重识别模型的鲁棒性,使模型在移植到新的场景后也能保持较好的性能,能够提高行人重识别的准确性。
[0175]
本发明实施例提供了一种计算机可读存储介质,所述存储介质存储有至少一可执行指令,该可执行指令在数据处理设备上运行时,使得所述数据处理设备执行上述任意方法实施例中的数据处理方法。
[0176]
可执行指令具体可以用于使得数据处理设备执行以下操作:
[0177]
对源域样本数据和目标域样本数据进行特征增强,得到增强后源域样本数据和增强后目标域样本数据;
[0178]
根据所述增强后源域样本数据和增强后目标域样本数据之间的距离确定所述增强后源域样本数据对应的权重矩阵;
[0179]
根据所述权重矩阵、所述增强后源域样本数据确定源域子空间;
[0180]
根据所述增强后目标域样本数据确定目标域子空间;
[0181]
将所述源域子空间和所述目标域子空间对齐,得到对齐后源域样本数据、对齐后目标域样本数据;
[0182]
根据所述对齐后源域样本数据、对齐后目标域样本数据以及所述源域样本数据对应的样本标签确定所述目标域样本数据对应的样本标签。
[0183]
在一种可选的方式中,所述源域样本数据中包括多个源域样本;所述目标域样本数据中包括多个目标域样本;所述可执行指令使所述数据处理设备执行以下操作:
[0184]
根据高斯核函数分别确定各个所述源域样本以及各个所述目标域样本与样本集合之间的相似度;所述样本集合中包括所有所述源域样本和所有所述目标域样本;
[0185]
根据所述相似度分别对所述源域样本数据和所述目标样本数据进行特征增强,得到所述增强后源域样本数据和所述增强后目标域样本数据。
[0186]
在一种可选的方式中,所述增强后源域样本数据中包括多个增强后源域样本;所述增强后目标域样本数据中包括多个增强后目标域样本;所述可执行指令使所述数据处理设备执行以下操作:
[0187]
分别确定各个所述增强后目标域样本与所有所述增强后源域样本之间的距离中的最小值;
[0188]
根据所述最小值以及各个所述增强后源域样本与各个所述增强后目标域样本之间的距离分别确定各个所述增强后源域样本对应的权重值,得到所述权重矩阵。
[0189]
在一种可选的方式中,所述可执行指令使所述数据处理设备执行以下操作:
[0190]
根据所述权重矩阵和所述增强后源域样本数据确定协方差矩阵;
[0191]
根据所述协方差矩阵进行特征值分解,得到多个特征值;
[0192]
根据所述多个特征值确定所述源域子空间。
[0193]
在一种可选的方式中,所述增强后源域样本数据中包括多个增强后源域样本;所述增强后目标域样本数据中包括多个增强后目标域样本;所述可执行指令使所述数据处理设备执行以下操作:
[0194]
根据下式确定所述协方差矩阵:
[0195][0196]
其中,c为所述协方差矩阵;m为所述增强后源域样本的数量;i为所述增强后源域样本的序号;为第i个所述增强后源域样本;wi为在所述权重矩阵中对应的权重值。
[0197]
在一种可选的方式中,所述可执行指令使所述数据处理设备执行以下操作:
[0198]
按照特征值的降序对所述多个特征值进行排序,得到特征值序列;
[0199]
根据所述特征值序列中排名前n的特征值对应的特征向量确定源域子空间;n为正整数。
[0200]
在一种可选的方式中,所述源域样本数据和所述源域样本数据对应的样本标签用于训练原场景对应的行人重识别模型;所述可执行指令使所述数据处理设备执行以下操作:
[0201]
获取目标场景对应的待识别图像数据;
[0202]
将所述待识别图像数据输入所述目标场景对应的行人重识别模型,得到所述待识别图像数据对应的行人识别结果;其中,所述目标场景对应的行人重识别模型根据所述目标域样本数据和所述目标域样本数据对应的样本标签训练得到。
[0203]
本发明实施例提供的数据处理装置通过对源域样本数据和目标域样本数据进行特征增强,得到增强后源域样本数据和增强后目标域样本数据;根据增强后源域样本数据和增强后目标域样本数据之间的距离确定增强后源域样本数据对应的权重矩阵,在权重矩阵中,与目标域样本距离越近的源域样本的权重越高,由此放大了和目标域样本分布接近的源域样本的特征,弱化了和目标域样本分布差异很大源域样本的特征;根据权重矩阵、增强后源域样本数据确定源域子空间;根据增强后目标域样本数据确定目标域子空间;将源域子空间和目标域子空间对齐,得到对齐后源域样本数据、对齐后目标域样本数据;最后根据对齐后源域样本数据、对齐后目标域样本数据以及源域样本数据对应的样本标签确定目标域样本数据对应的样本标签,从而本发明实施例提供的数据处理装置提高了行人重识别模型的鲁棒性,使模型在移植到新的场景后也能保持较好的性能,能够提高行人重识别的准确性。
[0204]
本发明实施例提供一种数据处理装置,用于执行上述数据处理方法。
[0205]
本发明实施例提供了一种计算机程序,所述计算机程序可被处理器调用使数据处理设备执行上述任意方法实施例中的数据处理方法。
[0206]
本发明实施例提供了一种计算机程序产品,计算机程序产品包括存储在计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令在计算机上运行时,使得所述计算机执行上述任意方法实施例中的数据处理方法。
[0207]
在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
[0208]
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
[0209]
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。
[0210]
本领域技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
[0211]
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献