一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

跟踪模型的训练方法、装置、介质和计算设备与流程

2021-10-24 10:25:00 来源:中国专利 TAG:实施 方式 介质 跟踪 深度


1.本发明的实施方式涉及深度学习技术领域,更具体地,本发明的实施方式涉及一种跟踪模型的训练方法、装置、介质和计算设备。


背景技术:

2.本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
3.近年来,随着人工智能技术的快速发展,人工智能技术在教育领域也有了广泛应用,为提升教学质量与效果,帮助学生更高效的学习书法,并发扬中华传统书法文化魅力,出现了基于人工智能技术对书法学习时笔尖的运动轨迹进行跟踪的模型。目前,通常需要对跟踪模型进行训练,才能将跟踪模型投入实际的应用中。然而,在对跟踪模型进行训练的过程中模型需要寻找全局最优解,在寻找全局最优解的过程中会限于到低学习率区域,从而导致对跟踪模型的训练需要耗费大量的时间,降低了跟踪模型的训练效率。


技术实现要素:

4.在本上下文中,本发明的实施方式期望提供一种跟踪模型的训练方法、装置、介质和计算设备。
5.在本发明实施方式的第一方面中,提供了一种跟踪模型的训练方法,包括:
6.基于对训练数据集进行预训练得到的网络参数构建回归模型;
7.基于所述回归模型对跟踪模型的参数进行更新,以实现对所述跟踪模型的训练。
8.在本实施方式的一个实施例中,基于对训练数据集进行预训练得到的网络参数构建回归模型,包括:
9.对输入的训练数据集进行预训练,得到网络参数和所述网络参数对应的矩阵数据集;
10.基于所述矩阵数据集构建回归模型。
11.在本实施方式的一个实施例中,对输入的训练数据集进行预训练,得到网络参数和所述网络参数对应的矩阵数据集,包括:
12.基于输入的训练数据集对跟踪模型进行预训练,得到所述跟踪模型的网络参数;
13.从所述网络参数中获取权值矩阵、偏置矩阵、权值梯度矩阵以及偏置梯度矩阵;
14.基于所述权值矩阵和所述权值梯度矩阵,生成权值梯度矩阵数据集;
15.基于所述偏置矩阵和所述偏置梯度矩阵,生成偏置梯度矩阵数据集;
16.将所述权值梯度矩阵数据集和所述偏置梯度矩阵数据集确定为矩阵数据集。
17.在本实施方式的一个实施例中,基于所述矩阵数据集构建回归模型,包括:
18.确定所述权值梯度矩阵数据集对应的第一卷积层,并构建所述第一卷积层对应的权值回归模型;
19.确定所述偏置梯度矩阵数据集对应的第二卷积层,并构建所述第二卷积层对应的
偏置回归模型。
20.在本实施方式的一个实施例中,对所述跟踪模型进行训练的算法为梯度下降算法和改进算法,其中:
21.获取对所述跟踪模型进行的最新两次连续训练的训练正确率;
22.基于所述最新两次连续训练的训练正确率,计算正确率增幅;
23.当所述正确率增幅小于预设阈值时,获取当前算法;
24.当所述当前算法为所述梯度下降算法时,将所述当前算法更新为所述改进算法;
25.当所述当前算法为所述改进算法时,将所述当前算法更新为所述梯度下降算法。
26.在本实施方式的一个实施例中,当所述当前算法为改进算法时,基于所述回归模型对跟踪模型的参数进行更新,以实现对所述跟踪模型的训练,包括:
27.利用所述改进算法对所述跟踪模型进行梯度更新,得到所述跟踪模型中卷积层的权值训练矩阵和偏置训练矩阵;
28.基于所述回归模型对所述权值训练矩阵进行计算,得到第一训练梯度;
29.基于所述回归模型对所述偏置训练矩阵进行计算,得到第二训练梯度;
30.调用所述第一训练梯度和所述第二训练梯度对所述卷积层的参数进行更新,以实现对所述跟踪模型的训练。
31.在本发明实施方式的第二方面中,提供了一种跟踪模型的训练装置,包括:
32.构建单元,用于基于对训练数据集进行预训练得到的网络参数构建回归模型;
33.第一更新单元,用于基于所述回归模型对跟踪模型的参数进行更新,以实现对所述跟踪模型的训练。
34.在本实施方式的一个实施例中,所述构建单元包括:
35.训练子单元,用于对输入的训练数据集进行预训练,得到网络参数和所述网络参数对应的矩阵数据集;
36.构建子单元,用于基于所述矩阵数据集构建回归模型。
37.在本实施方式的一个实施例中,所述训练子单元包括:
38.训练模块,用于基于输入的训练数据集对跟踪模型进行预训练,得到所述跟踪模型的网络参数;
39.获取模块,用于从所述网络参数中获取权值矩阵、偏置矩阵、权值梯度矩阵以及偏置梯度矩阵;
40.生成模块,用于基于所述权值矩阵和所述权值梯度矩阵,生成权值梯度矩阵数据集;
41.所述生成模块,还用于基于所述偏置矩阵和所述偏置梯度矩阵,生成偏置梯度矩阵数据集;
42.第一确定模块,用于将所述权值梯度矩阵数据集和所述偏置梯度矩阵数据集确定为矩阵数据集。
43.在本实施方式的一个实施例中,所述构建子单元包括:
44.第二确定模块,用于确定所述权值梯度矩阵数据集对应的第一卷积层,并构建所述第一卷积层对应的权值回归模型;
45.构建模块,用于确定所述偏置梯度矩阵数据集对应的第二卷积层,并构建所述第
二卷积层对应的偏置回归模型。
46.在本实施方式的一个实施例中,对所述跟踪模型进行训练的算法为梯度下降算法和改进算法,所述装置还包括:
47.获取单元,用于获取对所述跟踪模型进行的最新两次连续训练的训练正确率;
48.计算单元,用于基于所述最新两次连续训练的训练正确率,计算正确率增幅;
49.所述获取单元,还用于当所述正确率增幅小于预设阈值时,获取当前算法;
50.第二更新单元,用于当所述当前算法为所述梯度下降算法时,将所述当前算法更新为所述改进算法;
51.所述第二更新单元,还用于当所述当前算法为所述改进算法时,将所述当前算法更新为所述梯度下降算法。
52.在本实施方式的一个实施例中,当所述当前算法为改进算法时,所述第一更新单元包括:
53.更新子单元,用于利用所述改进算法对所述跟踪模型进行梯度更新,得到所述跟踪模型中卷积层的权值训练矩阵和偏置训练矩阵;
54.计算子单元,用于基于所述回归模型对所述权值训练矩阵进行计算,得到第一训练梯度;
55.所述计算子单元,还用于基于所述回归模型对所述偏置训练矩阵进行计算,得到第二训练梯度;
56.所述更新子单元,还用于调用所述第一训练梯度和所述第二训练梯度对所述卷积层的参数进行更新,以实现对所述跟踪模型的训练。
57.在本发明实施方式的第三方面中,提供了一种存储有程序的存储介质,其中,所述存储介质存储有计算机程序,所述计算机程序在被处理器执行时能够实现第一方面中任一项所述的方法。
58.在本发明实施方式的第四方面中,提供了一种计算设备,包括第三方面所述的存储介质。
59.根据本发明实施方式的跟踪模型的训练方法、装置、介质和计算设备,能够基于预训练得到的网络参数构建回归模型,并基于回归模型对跟踪模型进行训练,即能够利用网络参数等先验知识构建的回归模型对跟踪模型进行训练,从而在训练过程中基于先验知识快速的实现对跟踪模型进行训练的训练目标,极大地缩短了训练时间,提升了跟踪模型的训练效率。
附图说明
60.通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
61.图1为本发明一实施例提供的跟踪模型的训练方法的流程示意图;
62.图2为本发明另一实施例提供的跟踪模型的训练方法的流程示意图;
63.图3为本发明一实施例提供的跟踪模型的训练装置的结构示意图;
64.图4示意性地示出了本发明实施例的一种介质的结构示意图;
65.图5示意性地示出了本发明实施例的一种计算设备的结构示意图。
66.在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
67.下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
68.本领域技术人员知道,本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
69.根据本发明的实施方式,提出了一种跟踪模型的训练方法、装置、介质和计算设备。
70.在本文中,需要理解的是,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
71.下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。
72.示例性方法
73.下面参考图1,图1为本发明一实施例提供的跟踪模型的训练方法的流程示意图。需要注意的是,本发明的实施方式可以应用于适用的任何场景。
74.图1所示的本发明一实施例提供的跟踪模型的训练方法的流程,包括:
75.步骤s101,基于对训练数据集进行预训练得到的网络参数构建回归模型;
76.步骤s102,基于所述回归模型对跟踪模型的参数进行更新,以实现对所述跟踪模型的训练。
77.本技术中提出的跟踪模型的训练方法所针对的是基于以机器学习尤其是深度学习为代表的人工智能所构建的跟踪模型,包括但不限于目标检测、目标跟踪、笔尖跟踪等各个适用不同应用场景的跟踪模型。
78.本发明中能够基于预训练得到的网络参数构建回归模型,并基于回归模型对跟踪模型进行训练,即能够利用网络参数等先验知识构建的回归模型对跟踪模型进行训练,从而在训练过程中基于先验知识快速的实现对跟踪模型进行训练的训练目标,极大地缩短了训练时间,提升了跟踪模型的训练效率。
79.下面结合附图说明如何提升跟踪模型的训练效率:
80.本发明实施例中,训练数据集可以为为了训练跟踪模型而预先采集到的大量的训练数据,例如对跟踪目标进行跟踪拍摄采集到的图片或视频等影像数据,跟踪目标可以为笔尖、车辆、动植物等物体,对于目标对象的选择不做限定,其中,笔尖可以为书写过程中的毛笔、钢笔、铅笔等书写工具的笔尖,对此,本发明实施例不做限定。
81.本发明实施例中,可以通过跟踪模型对训练数据集进行预训练,在预训练的过程中可以得到与跟踪模型相关的网络参数,进而可以基于得到的网络参数构建回归模型,得到的网络参数可以认为是预训练得到的先验知识,因此,基于网络参数构建的回归模型可以认为是基于先验知识得到的,构建得到的回归模型可以用于对跟踪模型中的参数进行更
新,从而实现对跟踪模型的训练,即可以基于先验知识的引导使得跟踪模型在训练过程中已知一个或多个可以通往全局最优解的方向,越过数据中的局部极小值或鞍点,降低随机梯度下降算法在模型训练过程中陷入停滞的风险,提高了跟踪模型的训练效率。
82.请参阅图2,图2为本发明另一实施例提供的跟踪模型的训练方法的流程示意图,图2所示的本发明另一实施例提供的跟踪模型的训练方法的流程包括:
83.步骤s201,对输入的训练数据集进行预训练,得到网络参数和所述网络参数对应的矩阵数据集;
84.步骤s202,基于所述矩阵数据集构建回归模型。
85.实施上述的步骤s202~步骤s204,可以对训练数据集进行预训练,从而得到网络参数和网络参数对应的矩阵数据集,该矩阵数据集可以认为是预训练得到的先验知识,根据矩阵数据集构建回归模型,可以认为构建的回归模型是基于先验知识得到的,从而提升基于回归模型训练的模型的训练效率。
86.本发明实施例中,网络参数可以对应多种矩阵数据集,例如权值矩阵、偏置矩阵、权值梯度矩阵以及偏置梯度矩阵等,其中,权值矩阵中可以包含网络参数中的权值数据,偏置矩阵中可以包含网络参数中的偏置数据,权值梯度矩阵中可以包含网络参数中与权值对应的梯度数据,偏置梯度矩阵中可以包含网络参数中与偏置对应的梯度数据。
87.作为一种可选的实施方式,步骤s201对输入的训练数据集进行预训练,得到网络参数和所述网络参数对应的矩阵数据集的方式具体可以包含以下步骤:
88.基于输入的训练数据集对跟踪模型进行预训练,得到所述跟踪模型的网络参数;
89.从所述网络参数中获取权值矩阵、偏置矩阵、权值梯度矩阵以及偏置梯度矩阵;
90.基于所述权值矩阵和所述权值梯度矩阵,生成权值梯度矩阵数据集;
91.基于所述偏置矩阵和所述偏置梯度矩阵,生成偏置梯度矩阵数据集;
92.将所述权值梯度矩阵数据集和所述偏置梯度矩阵数据集确定为矩阵数据集。
93.其中,实施这种实施方式,可以从预训练得到的网络参数中获取到四个矩阵,基于获取到的四个矩阵分别生成权值梯度矩阵数据集和偏置梯度矩阵数据集,从而可以使输出的矩阵数据集中的数据更加全面。
94.本发明实施例中,可以基于输入的训练数据集对跟踪模型进行预训练,跟踪模型的卷积层在每一次迭代的正向传播过程中都可以得到权值、偏置、权值的梯度以及偏置的梯度等网络参数,并且可以根据网络参数类型的不同从网络参数中获取到多种矩阵,例如可以将权值类型的数据从网络参数中提取出来,得到权值对应的权值矩阵;还可以将偏置类型的数据从网络参数中提取出来,得到偏置对应的偏置矩阵;也可以将权值的梯度类型对应的数据从网络参数中提取出来,得到权值的梯度对应的权值梯度矩阵;以及可以将偏置的梯度类型对应的数据从网络参数中提取出来,得到偏置的梯度对应的偏置梯度矩阵等;此外,跟踪模型中的卷积和参数可以转化为矩阵,例如,一个卷积层使用大小为3x3x64的卷积核,那么这个卷积核的参数就是64个3x3的矩阵,因此,也可以表达为3x3x64,根据跟踪模型的结构中卷积层的名称,就可以将名称对应的数值从跟踪模型的参数文件中提取出来。
95.更进一步,可以将得到的权值矩阵和权值梯度矩阵进行组合,得到包含权值矩阵和权值梯度矩阵的权值梯度矩阵数据集,还可以将偏置矩阵和偏置梯度矩阵进行组合,得
到包含偏置矩阵和偏置梯度矩阵的偏置梯度矩阵数据集,以及可以将得到的权值梯度矩阵数据集和偏置梯度矩阵数据集一同确定为矩阵数据集。
96.作为一种可选的实施方式,步骤s202基于所述矩阵数据集构建回归模型的方式具体可以包含以下步骤:
97.确定所述权值梯度矩阵数据集对应的第一卷积层,并构建所述第一卷积层对应的权值回归模型;
98.确定所述偏置梯度矩阵数据集对应的第二卷积层,并构建所述第二卷积层对应的偏置回归模型。
99.其中,实施这种实施方式,可以基于权值梯度矩阵数据集构建权值回归模型,还可以基于偏置梯度矩阵数据集构建偏置回归模型,以使得到的权值回归模型和偏置回归模型更加准确。
100.本发明实施例中,权值梯度矩阵数据集对应的第一卷积层和偏置梯度矩阵数据集对应的第二卷积层可以为跟踪模型中相同的卷积层或者也可以为跟踪模型中不同的卷积层,可以基于不同的数据集构建不同的回归模型,即可以基于权值梯度矩阵数据集构建权值回归模型,还可以基于偏置梯度矩阵数据集构建偏置回归模型。
101.具体的,由于在跟踪模型的卷积层中,层与层之间的参数变化是离散关系,因此需要分别对每一卷积层的参数构建不同的回归模型来拟合变化规律,一个由n层全连接网络形成的回归模型的构建过程为:
102.grad(w)=w0x0 w1x1

w
n
x
n
=σw
i
x
i
103.grad(b)=b0y0 b1y1

b
n
y
n
=σb
j
y
j
104.其中,grad(w)表示权值回归模型,grad(b)表示偏置回归模型,w
i
可以表示回归模型中每一层的权值矩阵,b
j
可以表示回归模型中每一层的偏置矩阵。
105.作为一种可选的实施方式,本发明实施例中对所述跟踪模型进行训练的算法为梯度下降算法和改进算法,本发明实施例还可以包含以下步骤:
106.获取对所述跟踪模型进行的最新两次连续训练的训练正确率;
107.基于所述最新两次连续训练的训练正确率,计算正确率增幅;
108.当所述正确率增幅小于预设阈值时,获取当前算法;
109.当所述当前算法为所述梯度下降算法时,将所述当前算法更新为所述改进算法;
110.当所述当前算法为所述改进算法时,将所述当前算法更新为所述梯度下降算法。
111.其中,实施这种实施方式,可以对连续两次的训练正确率的增幅进行计算,如果正确率增幅达到预设阈值,可以认为当前对跟踪模型进行训练的算法的训练是有效的,因此可以继续通过读取的算法对跟踪模型进行训练,如果正确率增幅未达到预设阈值,可以认为跟踪模型已经陷入低学习率区域,因此需要将当前训练的算法进行更改,从而提升跟踪模型的训练速度。
112.本发明实施例中,对跟踪模型进行训练的算法可以为梯度下降(gradient descent)算法和改进算法,这两种算法可以交叉调用,对跟踪模型的每一轮训练都计算一次当前的训练正确率,对连续两轮训练的训练正确率进行计算,得到正确率增幅,进而可以对正确率增幅进行判断,如果确定正确率增幅未达到预设阈值(如1%、2%等)时,可以认为当前的跟踪模型已经陷入低学习率区域,此时跟踪模型将在下一轮训练开始前停止当前调
用的训练方法,转而使用另一种训练方法进行训练,即如果当前算法为梯度下降算法,则将当前算法调换为改进算法;如果当前算法为改进算法,则将当前算法调换为梯度下降算法,从而使得跟踪模型主动跳出由局部极小值和鞍点带来的低学习率区域,从而有效的提高跟踪模型的训练速度。
113.步骤s203,当所述当前算法为改进算法时,利用所述改进算法对所述跟踪模型进行梯度更新,得到所述跟踪模型中卷积层的权值训练矩阵和偏置训练矩阵;
114.步骤s204,基于所述回归模型对所述权值训练矩阵进行计算,得到第一训练梯度;
115.步骤s205,基于所述回归模型对所述偏置训练矩阵进行计算,得到第二训练梯度;
116.步骤s206,调用所述第一训练梯度和所述第二训练梯度对所述卷积层的参数进行更新,以实现对所述跟踪模型的训练。
117.实施上述的步骤s202~步骤s204,可以利用改进算法对跟踪模型进行训练,基于生成的回归模型分别对权值训练矩阵和偏置训练矩阵进行计算,得到第一训练梯度和第二训练梯度,进而可以基于第一训练梯度和第二训练梯度对卷积层的参数进行更新,从而实现改进算法对跟踪模型的训练,提升了跟踪模型的训练效率。
118.本发明实施例中,可以从跟踪模型中读取各个卷积层分别对应的权值、偏置、权值梯度以及偏置梯度等参数,并且可以根据卷积层的不同生成权值训练矩阵和偏置训练矩阵,其中,每一卷积层都可以对应不同的权值训练矩阵和偏置训练矩阵,由于生成的回归模型中也存在与跟踪模型的每一卷积层对应的,进而可以将得到的权值训练矩阵和偏置训练矩阵输入至回归模型中,回归模型可以针对不同的卷积层进行不同训练,最终拟合得到各个卷积层分别对应的权值训练矩阵的第一训练梯度和偏置训练矩阵的第二训练梯度,最后可以基于得到的第一训练梯度和第二训练梯度对跟踪模型中的卷积层的参数进行更新,以实现对跟踪模型的本轮训练,对跟踪模型的训练目标可以为完成训练预先设定的步数或者跟踪模型的损失函数不再变化等。
119.本发明实施例能够极大地缩短跟踪模型的训练时间,提升跟踪模型的训练效率。此外,本发明实施例可以提升基于回归模型训练的模型的训练效率。此外,本发明实施例可以使输出的矩阵数据集中的数据更加全面。此外,本发明实施例可以使得到的权值回归模型和偏置回归模型更加准确。此外,本发明实施例可以提升跟踪模型的训练速度。此外,本发明实施例可以提升跟踪模型的训练效率。
120.示例性装置
121.在介绍了本发明示例性实施方式的方法之后,接下来,参考图3对本发明示例性实施方式的一种跟踪模型的训练装置进行说明,该装置包括:
122.构建单元301,用于基于对训练数据集进行预训练得到的网络参数构建回归模型;
123.第一更新单元302,用于基于构建单元301构建的所述回归模型对跟踪模型的参数进行更新,以实现对所述跟踪模型的训练。
124.作为一种可选的实施方式,所述构建单元包括:
125.训练子单元,用于对输入的训练数据集进行预训练,得到网络参数和所述网络参数对应的矩阵数据集;
126.构建子单元,用于基于所述矩阵数据集构建回归模型。
127.其中,实施这种实施方式,可以对训练数据集进行预训练,从而得到网络参数和网
络参数对应的矩阵数据集,该矩阵数据集可以认为是预训练得到的先验知识,根据矩阵数据集构建回归模型,可以认为构建的回归模型是基于先验知识得到的,从而提升基于回归模型训练的模型的训练效率。
128.作为一种可选的实施方式,所述训练子单元包括:
129.训练模块,用于基于输入的训练数据集对跟踪模型进行预训练,得到所述跟踪模型的网络参数;
130.获取模块,用于从所述网络参数中获取权值矩阵、偏置矩阵、权值梯度矩阵以及偏置梯度矩阵;
131.生成模块,用于基于所述权值矩阵和所述权值梯度矩阵,生成权值梯度矩阵数据集;
132.所述生成模块,还用于基于所述偏置矩阵和所述偏置梯度矩阵,生成偏置梯度矩阵数据集;
133.第一确定模块,用于将所述权值梯度矩阵数据集和所述偏置梯度矩阵数据集确定为矩阵数据集。
134.其中,实施这种实施方式,可以从预训练得到的网络参数中获取到四个矩阵,基于获取到的四个矩阵分别生成权值梯度矩阵数据集和偏置梯度矩阵数据集,从而可以使输出的矩阵数据集中的数据更加全面。
135.作为一种可选的实施方式,所述构建子单元包括:
136.第二确定模块,用于确定所述权值梯度矩阵数据集对应的第一卷积层,并构建所述第一卷积层对应的权值回归模型;
137.构建模块,用于确定所述偏置梯度矩阵数据集对应的第二卷积层,并构建所述第二卷积层对应的偏置回归模型。
138.其中,实施这种实施方式,可以基于权值梯度矩阵数据集构建权值回归模型,还可以基于偏置梯度矩阵数据集构建偏置回归模型,以使得到的权值回归模型和偏置回归模型更加准确。
139.作为一种可选的实施方式,对所述跟踪模型进行训练的算法为梯度下降算法和改进算法,所述装置还包括:
140.获取单元,用于获取对所述跟踪模型进行的最新两次连续训练的训练正确率;
141.计算单元,用于基于所述最新两次连续训练的训练正确率,计算正确率增幅;
142.所述获取单元,还用于当所述正确率增幅小于预设阈值时,获取当前算法;
143.第二更新单元,用于当所述当前算法为所述梯度下降算法时,将所述当前算法更新为所述改进算法;
144.所述第二更新单元,还用于当所述当前算法为所述改进算法时,将所述当前算法更新为所述梯度下降算法。
145.其中,实施这种实施方式,可以对连续两次的训练正确率的增幅进行计算,如果正确率增幅达到预设阈值,可以认为当前对跟踪模型进行训练的算法的训练是有效的,因此可以继续通过读取的算法对跟踪模型进行训练,如果正确率增幅未达到预设阈值,可以认为跟踪模型已经陷入低学习率区域,因此需要将当前训练的算法进行更改,从而提升跟踪模型的训练速度。
146.作为一种可选的实施方式,当所述当前算法为改进算法时,所述第一更新单元包括:
147.更新子单元,用于利用所述改进算法对所述跟踪模型进行梯度更新,得到所述跟踪模型中卷积层的权值训练矩阵和偏置训练矩阵;
148.计算子单元,用于基于所述回归模型对所述权值训练矩阵进行计算,得到第一训练梯度;
149.所述计算子单元,还用于基于所述回归模型对所述偏置训练矩阵进行计算,得到第二训练梯度;
150.所述更新子单元,还用于调用所述第一训练梯度和所述第二训练梯度对所述卷积层的参数进行更新,以实现对所述跟踪模型的训练。
151.其中,实施这种实施方式,可以利用改进算法对跟踪模型进行训练,基于生成的回归模型分别对权值训练矩阵和偏置训练矩阵进行计算,得到第一训练梯度和第二训练梯度,进而可以基于第一训练梯度和第二训练梯度对卷积层的参数进行更新,从而实现改进算法对跟踪模型的训练,提升了跟踪模型的训练效率。
152.示例性介质
153.在介绍了本发明示例性实施方式的方法和装置之后,接下来,参考图4对本发明示例性实施方式的计算机可读存储介质进行说明,请参考图4,其示出的计算机可读存储介质为光盘40,其上存储有计算机程序(即程序产品),所述计算机程序在被处理器运行时,会实现上述方法实施方式中所记载的各步骤,例如,基于对训练数据集进行预训练得到的网络参数构建回归模型;基于所述回归模型对跟踪模型的参数进行更新,以实现对所述跟踪模型的训练;各步骤的具体实现方式在此不再重复说明。
154.需要说明的是,所述计算机可读存储介质的例子还可以包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他光学、磁性存储介质,在此不再一一赘述。
155.示例性计算设备
156.在介绍了本发明示例性实施方式的方法、介质和装置之后,接下来,参考图5对本发明示例性实施方式的用于跟踪模型的训练的计算设备。
157.图5示出了适于用来实现本发明实施方式的示例性计算设备50的框图,该计算设备50可以是计算机系统或服务器。图5显示的计算设备50仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
158.如图5所示,计算设备50的组件可以包括但不限于:一个或者多个处理器或者处理单元501,系统存储器502,连接不同系统组件(包括系统存储器502和处理单元501)的总线503。
159.计算设备50典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算设备50访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
160.系统存储器502可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(ram)5021和/或高速缓存存储器5022。计算设备50可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,rom5023可以用于读写不
可移动的、非易失性磁介质(图5中未显示,通常称为“硬盘驱动器”)。尽管未在图5中示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如cd

rom,dvd

rom或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线503相连。系统存储器502中可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
161.具有一组(至少一个)程序模块5024的程序/实用工具5025,可以存储在例如系统存储器502中,且这样的程序模块5024包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块5024通常执行本发明所描述的实施例中的功能和/或方法。
162.计算设备50也可以与一个或多个外部设备504(如键盘、指向设备、显示器等)通信。这种通信可以通过输入/输出(i/o)接口605进行。并且,计算设备50还可以通过网络适配器506与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图5所示,网络适配器506通过总线503与计算设备50的其它模块(如处理单元501等)通信。应当明白,尽管图5中未示出,可以结合计算设备50使用其它硬件和/或软件模块。
163.处理单元501通过运行存储在系统存储器502中的程序,从而执行各种功能应用以及数据处理,例如,基于对训练数据集进行预训练得到的网络参数构建回归模型;基于所述回归模型对跟踪模型的参数进行更新,以实现对所述跟踪模型的训练。各步骤的具体实现方式在此不再重复说明。应当注意,尽管在上文详细描述中提及了跟踪模型的训练装置的若干单元/模块或子单元/子模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
164.在本发明的描述中,需要说明的是,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
165.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
166.在本发明所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
167.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
168.另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以
是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
169.所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read

only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
170.最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
171.此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
172.通过上述的描述,本发明的实施例提供了以下的技术方案,但不限于此:
173.1.一种跟踪模型的训练方法,包括:
174.基于对训练数据集进行预训练得到的网络参数构建回归模型;
175.基于所述回归模型对跟踪模型的参数进行更新,以实现对所述跟踪模型的训练。
176.2.如方案1所述的跟踪模型的训练方法,基于对训练数据集进行预训练得到的网络参数构建回归模型,包括:
177.对输入的训练数据集进行预训练,得到网络参数和所述网络参数对应的矩阵数据集;
178.基于所述矩阵数据集构建回归模型。
179.3.如方案2所述的跟踪模型的训练方法,对输入的训练数据集进行预训练,得到网络参数和所述网络参数对应的矩阵数据集,包括:
180.基于输入的训练数据集对跟踪模型进行预训练,得到所述跟踪模型的网络参数;
181.从所述网络参数中获取权值矩阵、偏置矩阵、权值梯度矩阵以及偏置梯度矩阵;
182.基于所述权值矩阵和所述权值梯度矩阵,生成权值梯度矩阵数据集;
183.基于所述偏置矩阵和所述偏置梯度矩阵,生成偏置梯度矩阵数据集;
184.将所述权值梯度矩阵数据集和所述偏置梯度矩阵数据集确定为矩阵数据集。
185.4.如方案3所述的跟踪模型的训练方法,基于所述矩阵数据集构建回归模型,包括:
186.确定所述权值梯度矩阵数据集对应的第一卷积层,并构建所述第一卷积层对应的
权值回归模型;
187.确定所述偏置梯度矩阵数据集对应的第二卷积层,并构建所述第二卷积层对应的偏置回归模型。
188.5.如方案1~4任一项所述的跟踪模型的训练方法,对所述跟踪模型进行训练的算法为梯度下降算法和改进算法,其中:
189.获取对所述跟踪模型进行的最新两次连续训练的训练正确率;
190.基于所述最新两次连续训练的训练正确率,计算正确率增幅;
191.当所述正确率增幅小于预设阈值时,获取当前算法;
192.当所述当前算法为所述梯度下降算法时,将所述当前算法更新为所述改进算法;
193.当所述当前算法为所述改进算法时,将所述当前算法更新为所述梯度下降算法。
194.6.如方案5所述的跟踪模型的训练方法,当所述当前算法为改进算法时,基于所述回归模型对跟踪模型的参数进行更新,以实现对所述跟踪模型的训练,包括:
195.利用所述改进算法对所述跟踪模型进行梯度更新,得到所述跟踪模型中卷积层的权值训练矩阵和偏置训练矩阵;
196.基于所述回归模型对所述权值训练矩阵进行计算,得到第一训练梯度;
197.基于所述回归模型对所述偏置训练矩阵进行计算,得到第二训练梯度;
198.调用所述第一训练梯度和所述第二训练梯度对所述卷积层的参数进行更新,以实现对所述跟踪模型的训练。
199.7.一种跟踪模型的训练装置,包括:
200.构建单元,用于基于对训练数据集进行预训练得到的网络参数构建回归模型;
201.第一更新单元,用于基于所述回归模型对跟踪模型的参数进行更新,以实现对所述跟踪模型的训练。
202.8.如方案7所述的跟踪模型的训练装置,所述构建单元包括:
203.训练子单元,用于对输入的训练数据集进行预训练,得到网络参数和所述网络参数对应的矩阵数据集;
204.构建子单元,用于基于所述矩阵数据集构建回归模型。
205.9.如方案8所述的跟踪模型的训练装置,所述训练子单元包括:
206.训练模块,用于基于输入的训练数据集对跟踪模型进行预训练,得到所述跟踪模型的网络参数;
207.获取模块,用于从所述网络参数中获取权值矩阵、偏置矩阵、权值梯度矩阵以及偏置梯度矩阵;
208.生成模块,用于基于所述权值矩阵和所述权值梯度矩阵,生成权值梯度矩阵数据集;
209.所述生成模块,还用于基于所述偏置矩阵和所述偏置梯度矩阵,生成偏置梯度矩阵数据集;
210.第一确定模块,用于将所述权值梯度矩阵数据集和所述偏置梯度矩阵数据集确定为矩阵数据集。
211.10.如方案9所述的跟踪模型的训练装置,所述构建子单元包括:
212.第二确定模块,用于确定所述权值梯度矩阵数据集对应的第一卷积层,并构建所
述第一卷积层对应的权值回归模型;
213.构建模块,用于确定所述偏置梯度矩阵数据集对应的第二卷积层,并构建所述第二卷积层对应的偏置回归模型。
214.11.如方案7~10任一项所述的跟踪模型的训练装置,对所述跟踪模型进行训练的算法为梯度下降算法和改进算法,所述装置还包括:
215.获取单元,用于获取对所述跟踪模型进行的最新两次连续训练的训练正确率;
216.计算单元,用于基于所述最新两次连续训练的训练正确率,计算正确率增幅;
217.所述获取单元,还用于当所述正确率增幅小于预设阈值时,获取当前算法;
218.第二更新单元,用于当所述当前算法为所述梯度下降算法时,将所述当前算法更新为所述改进算法;
219.所述第二更新单元,还用于当所述当前算法为所述改进算法时,将所述当前算法更新为所述梯度下降算法。
220.12.如方案11所述的跟踪模型的训练装置,当所述当前算法为改进算法时,所述第一更新单元包括:
221.更新子单元,用于利用所述改进算法对所述跟踪模型进行梯度更新,得到所述跟踪模型中卷积层的权值训练矩阵和偏置训练矩阵;
222.计算子单元,用于基于所述回归模型对所述权值训练矩阵进行计算,得到第一训练梯度;
223.所述计算子单元,还用于基于所述回归模型对所述偏置训练矩阵进行计算,得到第二训练梯度;
224.所述更新子单元,还用于调用所述第一训练梯度和所述第二训练梯度对所述卷积层的参数进行更新,以实现对所述跟踪模型的训练。
225.13.一种存储有程序的存储介质,其中,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如方案1

6中的任一项所述的跟踪模型的训练方法。
226.14.一种计算设备,包括如方案13所述的存储介质。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜