一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于训练模型的方法和装置与流程

2022-04-25 05:05:42 来源:中国专利 TAG:


1.本公开涉及计算机技术领域,具体涉及用于训练模型的方法和装置。


背景技术:

2.三维模型是利用空间点、边和面结合的方式定义物体的形状,其灵活的几何结构可以高效、准确的描述物体的形状特征。现有的基于物体的三维模型对物体进行分类的方法主要是:将三维模型转化为二维图像后,基于对二维图像的识别进行分类;获取三维模型的点云数据,并基于点云数据中的顶点坐标作为神经网络模型的输入,以利用神经网络模型对三维模型所指示的物体进行分类;将三维模型的几何特征作为神经网络模型的输入,以利用神经网络模型对三维模型所指示的物体进行分类。
3.然而,现有的基于三维模型对物体进行分类的方法存在分类不准确的问题。


技术实现要素:

4.本公开提供了一种用于训练模型的方法、装置、电子设备以及计算机可读存储介质。
5.根据本公开的第一方面,提供了一种用于训练模型的方法,包括:获取样本数据以及初始分类模型,并通过多轮迭代操作,训练初始分类模型;迭代操作包括:获取样本数据的表征,以及基于样本数据的表征确定样本数据的特征;采用样本数据的特征,对初始分类模型进行基于对比学习的训练,得到训练后的初始分类模型输出的对比损失函数值,并根据对比损失函数值生成反馈信息,初始分类模型在执行下一次迭代操作前基于反馈信息更新;响应于确定初始分类模型达到预设的收敛条件,将最后一轮迭代操作中的初始分类模型确定为目标分类模型。
6.在一些实施例中,样本数据包括三维模型数据,获取样本数据的表征,包括:获取预设网络,其中,预设网络中包括空间特征描述器、以及结构特征描述器;将样本数据输入预设网络,获得空间特征描述器输出的样本数据的空间特征,以及获得结构特征描述器输出的样本数据的结构特征;将样本数据的空间特征输入预设卷积网络,并获得预设卷积网络中每一层卷积层输出的第一输出结果;将样本数据的结构特征输入预设卷积网络,并获得预设卷积网络中每一层卷积层输出的第二输出结果;针对预设卷积网络中的每一层卷积层,将该卷积层输出的第一输出结果、以及该卷积层输出的第二输出结果聚合后,输入自注意力网络,并获得自注意力网络输出的、对应于该卷积层的输出结果;将对应于每一层卷积层的输出结果进行聚合,得到样本数据的表征。
7.在一些实施例中,采用样本数据的特征,对初始分类模型进行基于对比学习的训练,包括:采用样本数据的特征,对初始分类模型进行基于无监督对比学习的训练。
8.在一些实施例中,用于训练模型的方法还包括:获取样本数据的标签;采用样本数据的特征,对初始分类模型进行基于对比学习的训练,包括:采用样本数据的特征以及样本数据的标签,对初始分类模型进行基于有监督对比学习的训练。
9.在一些实施例中,迭代操作还包括:采用样本数据的表征以及样本数据的标签,训练初始分类模型,得到训练后的初始分类模型输出的交叉熵损失函数值;根据对比损失函数值生成反馈信息,包括:根据对比损失函数值以及交叉熵损失函数值,生成反馈信息。
10.根据本公开的第二方面,提供了一种用于对三维模型进行分类的方法,包括:获取待分类的三维模型数据;采用目标分类模型确定待分类三维模型数据的类别,其中,目标分类模型基于第一方面所描述的方法训练得到。
11.根据本公开的第三方面,提供了一种用于训练模型的装置,包括:获取单元,被配置为获取样本数据以及初始分类模型,并通过训练单元进行多轮迭代操作,训练初始分类模型;训练单元包括:获取模块,被配置为获取样本数据的表征,以及基于样本数据的表征确定样本数据的特征;第一更新模块,被配置为采用样本数据的特征,对初始分类模型进行基于对比学习的训练,得到训练后的初始分类模型输出的对比损失函数值,并根据对比损失函数值生成反馈信息,初始分类模型在执行下一次迭代操作前基于反馈信息更新;确定模块,被配置为响应于确定初始分类模型达到预设的收敛条件,将最后一轮迭代操作中的初始分类模型确定为目标分类模型。
12.在一些实施例中,样本数据包括三维模型数据,获取模块,包括:网络获取模块,被配置为获取预设网络,其中,预设网络中包括空间特征描述器、以及结构特征描述器;特征提取模块,被配置为将样本数据输入预设网络,获得空间特征描述器输出的样本数据的空间特征,以及获得结构特征描述器输出的样本数据的结构特征;第一卷积模块,被配置为将样本数据的空间特征输入预设卷积网络,并获得预设卷积网络中每一层卷积层输出的第一输出结果;第二卷积模块,被配置为将样本数据的结构特征输入预设卷积网络,并获得预设卷积网络中每一层卷积层输出的第二输出结果;第一聚合模块,被配置为针对预设卷积网络中的每一层卷积层,将该卷积层输出的第一输出结果、以及该卷积层输出的第二输出结果聚合后,输入自注意力网络,并获得自注意力网络输出的、对应于该卷积层的输出结果;第二聚合模块,被配置为将对应于每一层卷积层的输出结果进行聚合,得到样本数据的表征。
13.在一些实施例中,第一更新模块,包括:第一更新子模块,被配置为采用样本数据的特征,对初始分类模型进行基于无监督对比学习的训练。
14.在一些实施例中,用于训练模型的装置还包括:标签获取模块,被配置为获取样本数据的标签;第一更新模块,包括:第二更新子模块,被配置为采用样本数据的特征以及样本数据的标签,对初始分类模型进行基于有监督对比学习的训练。
15.在一些实施例中,训练单元还包括:第二更新模块,被配置为采用样本数据的表征以及样本数据的标签,训练初始分类模型,得到训练后的初始分类模型输出的交叉熵损失函数值;根据对比损失函数值生成反馈信息,包括:根据对比损失函数值以及交叉熵损失函数值,生成反馈信息。
16.根据本公开的第四方面,提供了一种用于对三维模型进行分类的装置,包括:三维模型数据获取单元,被配置为获取待分类的三维模型数据;分类单元,被配置为采用目标分类模型确定待分类三维模型数据的类别,其中,目标分类模型基于如第三方面所描述的装置训练得到。
17.根据本公开的第五方面,本公开的实施例提供了一种电子设备,包括:一个或多个
处理器:存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面提供的用于训练模型的方法或者实现如第二方面提供的用于对三维模型进行分类的方法。
18.根据本公开的第六方面,本公开的实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其中,程序被处理器执行时实现如第一方面提供的用于训练模型的方法或者实现如第二方面提供的用于对三维模型进行分类的方法。
19.本公开提供的用于训练模型的方法、装置,包括:获取样本数据以及初始分类模型,并通过多轮迭代操作,训练初始分类模型;迭代操作包括:获取样本数据的表征,以及基于样本数据的表征确定样本数据的特征;采用样本数据的特征,对初始分类模型进行基于对比学习的训练,得到训练后的初始分类模型输出的对比损失函数值,并根据对比损失函数值生成反馈信息,初始分类模型在执行下一次迭代操作前基于反馈信息更新;响应于确定初始分类模型达到预设的收敛条件,将最后一轮迭代操作中的初始分类模型确定为目标分类模型,采用该基于对比训练方法训练得到的目标分类模型对三维模型数据进行分类,可以提高针对三维模型数据进行分类的准确性。
20.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
21.附图用于更好地理解本方案,不构成对本技术的限定。其中:
22.图1是本技术的实施例可以应用于其中的示例性系统架构图;
23.图2是根据本技术的用于训练模型的方法的一个实施例的流程图;
24.图3是根据本技术的用于训练模型的方法的另一个实施例的流程图;
25.图4是根据本技术的用于训练模型的方法的一个应用场景中获取样本数据的表征的流程图;
26.图5(a)是根据本技术的用于训练模型的方法的一个用用场景中获取样本数据的表征的简要步骤流程图;
27.图5(b)是根据本技术的用于训练模型的方法的一个用用场景中获取对比损失函数值的简要步骤流程图;
28.图5(c)是根据本技术的用于训练模型的方法的一个用用场景中获取交叉熵损失函数值的简要步骤流程图;
29.图6是根据本技术的用于对三维模型进行分类的方法的一个实施例的流程图;
30.图7是根据本技术的用于训练模型的装置的一个实施例的结构示意图;
31.图8是根据本技术的用于对三维模型进行分类的装置的一个实施例的结构示意图;
32.图9是用来实现本技术实施例的用于训练模型的方法的电子设备的框图。
具体实施方式
33.以下结合附图对本技术的示范性实施例做出说明,其中包括本技术实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识
到,可以对这里描述的实施例做出各种改变和修改,而不会背离本技术的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
34.图1示出了可以应用本技术的用于训练模型的方法或用于训练模型的装置的实施例的示例性系统架构100。
35.如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
36.用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103可以是用户终端设备,其上可以安装有各种客户端应用,例如图像类应用、视频类应用、购物类应用、聊天类应用、搜索类应用、金融类应用等。
37.终端设备101、102、103可以是具有显示屏并且支持接收服务器消息的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、电子播放器、膝上型便携计算机和台式计算机等等。
38.终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是各种电子设备,当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
39.服务器105可以获取样本数据以及初始分类模型,并通过多轮迭代操作,训练初始分类模型;迭代操作包括:获取样本数据的表征,以及基于样本数据的表征确定样本数据的特征;采用样本数据的特征,对初始分类模型进行基于对比学习的训练,得到训练后的初始分类模型输出的对比损失函数值,并根据对比损失函数值生成反馈信息,初始分类模型在执行下一次迭代操作前基于反馈信息更新;若确定初始分类模型达到预设的收敛条件,将最后一轮迭代操作中的初始分类模型确定为目标分类模型。
40.需要说明的是,本公开的实施例所提供的用于训练模型的方法可以由服务器105执行,相应地,用于训练模型的装置可以设置于服务器105中。
41.应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
42.继续参考图2,示出了根据本公开的用于训练模型的方法的一个实施例的流程200,包括以下步骤:
43.步骤201,获取样本数据以及初始分类模型,并通过多轮迭代操作,训练初始分类模型。
44.在本实施例中,用于训练模型的方法的执行主体(例如图1所示的服务器105)可以获取样本数据以及初始分类模型,以采用样本数据对初始分类模型进行多轮迭代训练。其中,样本数据可以包括获取到的数据,以及对获取到的数据进行数据增强操作后的数据。
45.步骤202,迭代操作包括:
46.步骤2021,获取样本数据的表征,以及基于样本数据的表征确定样本数据的特征。
47.在本实施例中,可以基于样本数据获取样本数据的表征,并进一步基于样本数据的表征提取样本数据的特征。其中,样本数据的表征可以是基于卷积网络提取的样本数据的特征,样本数据的特征可以是基于自注意力网络对卷积网络提取的特征进行基于自注意
力机制计算后的特征。
48.步骤2022,采用样本数据的特征,对初始分类模型进行基于对比学习的训练,得到训练后的初始分类模型输出的对比损失函数值,并根据对比损失函数值生成反馈信息,初始分类模型在执行下一次迭代操作前基于反馈信息更新。
49.在本实施例中,可以采用样本数据的特征,对初始分类模型进行基于对比学习的训练,得到训练后的初始分类模型输出的对比损失函数值,并根据对比损失函数值生成反馈信息,并在执行下一次迭代操作前、采用该反馈信息更新初始分类模型,以实现对初始分类模型的迭代训练。
50.步骤203,响应于确定初始分类模型达到预设的收敛条件,将最后一轮迭代操作中的初始分类模型确定为目标分类模型。
51.在本实施例中,若确定初始分类模型达到预设的收敛条件,如对比损失函数值小于预设阈值、或者迭代次数达到次数阈值,则将最后一轮迭代操作中的初始分类模型确定为目标分类模型。
52.本实施例提供的用于训练模型的方法,获取样本数据以及初始分类模型,并通过多轮迭代操作,训练初始分类模型;迭代操作包括:获取样本数据的表征,以及基于样本数据的表征确定样本数据的特征;采用样本数据的特征,对初始分类模型进行基于对比学习的训练,得到训练后的初始分类模型输出的对比损失函数值,并根据对比损失函数值生成反馈信息,初始分类模型在执行下一次迭代操作前基于反馈信息更新;响应于确定初始分类模型达到预设的收敛条件,将最后一轮迭代操作中的初始分类模型确定为目标分类模型,采用该基于对比训练方法训练得到的目标分类模型对三维模型数据进行分类,可以提高针对三维模型数据进行分类的准确性。
53.可选地,样本数据包括三维模型数据,获取样本数据的表征,包括:获取预设网络,其中,预设网络中包括空间特征描述器、以及结构特征描述器;将样本数据输入预设网络,获得空间特征描述器输出的样本数据的空间特征,以及获得结构特征描述器输出的样本数据的结构特征;将样本数据的空间特征输入预设卷积网络,并获得预设卷积网络中每一层卷积层输出的第一输出结果;将样本数据的结构特征输入预设卷积网络,并获得预设卷积网络中每一层卷积层输出的第二输出结果;针对预设卷积网络中的每一层卷积层,将该卷积层输出的第一输出结果、以及该卷积层输出的第二输出结果聚合后,输入自注意力网络,并获得自注意力网络输出的、对应于该卷积层的输出结果;将对应于每一层卷积层的输出结果进行聚合,得到样本数据的表征。
54.在本实施例中,样本数据包括三维模型数据,可以获取预设网络,预设网络中包括空间特征描述器、以及包括结构特征描述器,将样本数据输入预设网络后,获得空间特征描述器输出的该样本数据(即,样本三维模型数据)包含的空间特征,以及获得结构特征描述器输出的该样本数据的结构特征。将样本数据的空间特征输入预设卷积网络,以获得预设卷积网络中的每一层卷积层输出的第一输出结果。将样本数据的结构特征输入预设卷积网络,以获得预设卷积网络中的每一层卷积层输出的第二输出结果。
55.之后,针对预设卷积网络中的每一层卷积层,将该层卷积层输出的第一输出结果、以及该层卷积层输出的第二输出结果进行聚合后,输入自注意力网络,以获得自注意力网络输出的针对该层卷积层的输出结果。可以理解,卷积网络中包含多个卷积层,此时,可以
获得多个输出结果,每个输出结果是对应的卷积层输出的空间特征与结构特征的聚合结果。
56.最后,将得到的多个输出结果进行聚合,并将聚合结果确定为样本数据的表征。
57.本实施例通过对样本数据进行基于卷积网络以及自注意力网络的处理,可以得到三维模型数据的特征之间的全局关系,采用该处理后的样本数据训练分类模型,可以提高训练后的模型对三维模型数据进行分类的准确性。另外,三维网格模型的几何结构复杂,无法直接将卷积神经网络应用到三维网格模型的处理上。现有的方法为了克服这一问题,均设计了大量复杂操作来实现卷积和池化操作,这使得神经网络更容易陷入过拟合,无法应对在三维网格模型形状和结构上的攻击,使得网络的鲁棒性较差,而本实施例中采用的获取样本数据的表征的方法,可以避免这一过拟合问题以及提高网络的鲁棒性。
58.可选地,采用样本数据的特征,对初始分类模型进行基于对比学习的训练,包括:采用样本数据的特征,对初始分类模型进行基于无监督对比学习的训练。
59.在本实施例中,可以采用样本数据的特征,对初始分类模型进行基于无监督对比学习的训练。
60.可选地,用于训练模型的方法还包括:获取样本数据的标签;采用样本数据的特征,对初始分类模型进行基于对比学习的训练,包括:采用样本数据的特征以及样本数据的标签,对初始分类模型进行基于有监督对比学习的训练。
61.在本实施例中,可以预先获取样本数据的标签,并采用样本数据的特征以及样本数据的标签,对初始分类模型进行基于有监督对比学习的训练。
62.继续参考图3,示出了根据本公开的用于训练模型的方法的另一个实施例的流程300,包括以下步骤:
63.步骤301,获取样本数据以及初始分类模型,并通过多轮迭代操作,训练初始分类模型。
64.步骤302,迭代操作包括:
65.步骤3021,获取样本数据的表征,以及基于样本数据的表征确定样本数据的特征。
66.步骤3022,采用样本数据的特征,对初始分类模型进行基于对比学习的训练,得到训练后的初始分类模型输出的对比损失函数值。
67.在本实施例中,可以采用样本数据的特征对初始分类模型进行基于对比学习的训练,并得到训练后的初始分类模型输出的对比损失函数值。
68.步骤3023,采用样本数据的表征以及样本数据的标签,训练初始分类模型,得到训练后的初始分类模型输出的交叉熵损失函数值。
69.在本实施例中,可以采用样本数据的表征以及样本数据的标签,训练初始分类模型,并得到训练后的初始分类模型输出的交叉熵损失函数值。
70.步骤3024,根据对比损失函数值以及交叉熵损失函数值,生成反馈信息,初始分类模型在执行下一次迭代操作前基于反馈信息更新。
71.在本实施例中,可以将本轮训练后得到的对比损失函数值以及交叉熵损失函数值这两种损失进行加权运算,并基于加权运算的结果生成反馈信息,在执行下一次迭代操作前,采用该反馈信息更新初始分类模型的参数。
72.步骤303,响应于确定初始分类模型达到预设的收敛条件,将最后一轮迭代操作中
的初始分类模型确定为目标分类模型。
73.本实施例中对步骤301、步骤3021、步骤303的描述与步骤201、步骤2021、步骤203的描述一致,此处不再赘述。
74.本实施例提供的用于训练模型的方法,相比于图2实施例描述的方法,增加了采用样本数据的表征、以及样本数据的标签,训练初始模型并获得模型输出的交叉熵损失函数的步骤,并利用基于对比学习训练得到的对比损失函数值以及交叉熵损失函数值的加权结果生成反馈信息,以完成模型训练,可以提高训练后的目标分类模型对数据进行分类的准确性。
75.在一些应用场景中,用于训练模型的方法包括以下步骤:
76.第一步,获取样本数据,样本数据即为多个样本三维模型数据,以及对样本三维模型数据进行数据增强操作后的增强数据。可以对每个样本三维模型数据进行两次随机的增强操作,以利用随机的变换使样本三维模型数据的特征发生变化,使机器学习过程更加困难,为神经网络添加正则项。
77.其中,对样本三维模型数据进行的数据增强操作可以包括对三维模型数据的顶点坐标进行像素扰动、平移、缩放、旋转,以及对样本三维模型数据进行模型变形、边翻转操作。其中,模型变形操作是指利用自有形变技术(ffd)为三维模型中的每个顶点指定一个新的位置,从而实现整个三维模型的变形;边翻转操作是指改变三维模型中点与点之间的连接关系,使原本相连形成边的两点不相连,原本不相连的两点相连形成新的边。可以理解,通过模型变形操作以及边翻操作能够实现对三维模型的全局的特征变换。
78.第二步,如图4所示,利用预设网络(如meshnet网络)获取样本数据的表征,预设网络中可以包括空间特征描述器,以及结构特征描述器。将样本数据输入空间特征描述器中,以获得样本数据的空间特征,将样本数据的空间特征输入预设卷积网络,并获得预设卷积网络中的每一层卷积层输出的第一输出结果。
79.将样本数据输入结构特征描述器中,以获得样本数据的结构特征,将样本数据的结构特征输入预设卷积网络,并获得预设卷积网络中的每一层卷积层输出的第二输出结果。
80.针对预设卷积网络中的每一层卷积层,将该卷积网络输出的第一输出结果、以及该卷积层输出的第二输出结果基于全连接层进行聚合后,输入自注意力网络,并获得自注意力网络输出的、对应于该卷积层的输出结果。
81.由于预设卷积网络有多个卷积层,此时,已经获得了对应于多个卷积层中每一层卷积层的输出结果,将每一层卷积层的输出结果基于全连接层进行聚合后,将聚合结果作为样本数据的表征。
82.获取样本数据的表征的过程可以理解为编码过程,执行获取样本数据的表征这一编码过程所采用的装置/单元可以称为编码器/编码器网络。
83.第一步与第二步的简要流程图可参见图5(a)。
84.第三步,将上述样本数据的输入映射网络(z
x
=g(h
x
))中,以获得映射网络输出的样本数据的特征,其中,映射网络中可以包括多层感知机以及隐藏层。
85.z
x
=g(h
x
)=w
(2)
relu(w
(1)hx
)
86.其中,z
x
代表样本数据的特征,h
x
代表样本数据的表征,relu()代表机器学习中的
预设函数,w
(1)
、w
(2)
代表学习参数。
87.第四步,采用样本数据的特征,对初始分类模型进行基于对比学习的训练,并得到对比损失函数。
88.在无监督对比学习中,由于样本数据不具有类别标签,正样本来自于对锚样本进行数据增前后的数据增强结果。负样本是除了正样本和锚样本之外的所有样本,此时,无监督对比学习的对比损失函数可以采用如下公式:
[0089][0090]
其中,i代表锚样本的标识;j代表正样本的标识;k代表负样本的标识;τ代表退火系数。
[0091]
在有监督对比学习中,由于样本数据具有类别标签,每个样本数据的类别属于已知,此时,有监督对比学习的对比损失函数可以采用如下公式:
[0092][0093]
其中,i代表锚样本的标识;p(i)代表锚样本中正样本的集合,p代表正样本的标识;a(i)代表负样本的集合,a代表负样本的标识。由于有监督对比学习的损失函数会令编码器为来自同一类的样本提供更接近的表达,从而能够得到更具有鲁棒性的表达空间聚类效果。
[0094]
另外,在分类任务中,对比学习中所采用的损失函数是利用整个模型的特征映射进行计算,为了给三维网格模型整体的特征带来更多的变换,可以对所有的样本数据进行两次随机的数据增强,并得到两个增强后的样本。对于锚样本i,其正样本包含对其进行数据增强后的增强样本、以及与锚样本同类的样本;锚样本i的负样本由与其不同类的样本组成。在分割任务中,对比学习中所采用的函数是利用单个面片的特征映射计算的。处理所有面片的特征需要非常高的计算开销,因此需要使用采样策略挑选一些面的特征来使得特征的数量下降。由于在分割结果中,大部分类别预测错误的面均来自于边界位置,因此,可以基于边界感知的采样方法,在选择锚样本时,选择边界样本来强制网络更关注于边界样本。在选择正负样本时,可以基于以下两种方法:
[0095]
第一种方法是基于边界样本与困难样本的对比。其中,困难样本指预测错误的样本,具体而言,对于负样本来说,当它和锚样本的相似度接近1,则认为它是困难样本;对于正样本来说,当它和锚样本的相似度接近于0,则认为它是困难样本。构建一个动态的存储空间来存放困难样本,在第一个训练迭代中,计算锚样本与其邻近样本的相似度(包括k个正样本和k个负样本),将临近样本中的困难样本存储至动态空间中;在后续的训练迭代中,需要计算锚样本与其临近样本的相似度和锚样本与困难样本的相似度,当某一个临近样本n比动态空间中的困难样本h更困难时,将n存储到动态空间中来代替h,以此确保动态空间中的样本始终为最困难的。
[0096]
第二种方法是基于边界样本与边界样本的对比。采用处于同一位置的边界样本(例如,人体三维模型数据中处于头与身体的边界处的样本)之间进行对比,从而使正样本
之间彼此靠近,负样本之间彼此远离。
[0097]
第三步与第四步的简要流程图可参见图5(b)。
[0098]
第五步,计算用于训练网络的整体损失函数,并采用整体损失函数训练初始分类模型,以获得目标分类模型。
[0099]
首先获取用于训练网络的交叉熵损失函数:
[0100][0101]
其中,hi代表网络经过归一化后的输出结果(即模型预测标签),yi代表样本数据的真实标签,i代表标签的标识。
[0102]
其次,整体损失函数是第四步得到的对比损失函数、以及本步骤中得到的交叉熵损失函数的加权和:
[0103]
l
all
=l
ce
α
·
l
cl
[0104]
其中,l
ce
代表对比损失函数,α代表对比损失函数的权重。在实际训练过程中,由于l
ce
和l
cl
之间的初始值差距大,并且二者的下降趋势不相同,设置一个合适的权重,可以平衡二者之间的差距,以使二者在训练模型时均能发挥有效作用。可以基于二者对优化器的影响来设置权重:首先,分别计算l
ce
和l
cl
对于变量zi的梯度,并且设置将二者的梯度值拉至同一数量级;之后,通过调整比例参数n来调整l
ce
和l
cl
之间的关系:
[0105][0106]
当训练次数达到预定的迭代次数或损失函数小于预设阈值时,训练结束,得到目标分类模型。
[0107]
第5步中计算交叉熵损失函数的简要流程图可参见图5(c)
[0108]
继续参考图6,示出了根据本公开的用于对三维模型进行分类的方法的一个实施例的流程600,包括以下步骤:
[0109]
步骤601,获取待分类的三维模型数据。
[0110]
在本实施例中,用于训练模型的方法的执行主体(例如图1所示的服务器105)可以获取待分类的三维模型数据。三维模型数据是指具有立体空间特征以及立体结构特征的模型数据。
[0111]
步骤602,采用目标分类模型确定待分类三维模型数据的类别,其中,目标分类模型基于如图2或图3描述的实施例中的方法训练得到。
[0112]
在本实施例中,可以采用基于如图2或图3描述的实施例中的方法所训练得到的目标分类模型,实现对待分类的三维模型数据的分类。
[0113]
本实施例提供的用于对三维模型进行分类的方法,采用基于对比训练方法训练得到的目标分类模型对三维模型数据进行分类,可以提高针对三维模型数据进行分类的准确性。
[0114]
进一步参考图7,作为对上述各图所示方法的实现,本公开提供了一种用于训练模型的装置的一个实施例,该装置实施例与图2和图3所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
[0115]
如图7所示,本实施例的用于训练模型的装置,包括:获取单元701、训练单元702、确定单元703。其中,获取单元,被配置为获取样本数据以及初始分类模型,并通过训练单元进行多轮迭代操作,训练初始分类模型;训练单元包括:获取模块,被配置为获取样本数据的表征,以及基于样本数据的表征确定样本数据的特征;第一更新模块,被配置为采用样本数据的特征,对初始分类模型进行基于对比学习的训练,得到训练后的初始分类模型输出的对比损失函数值,并根据对比损失函数值生成反馈信息,初始分类模型在执行下一次迭代操作前基于反馈信息更新;确定模块,被配置为响应于确定初始分类模型达到预设的收敛条件,将最后一轮迭代操作中的初始分类模型确定为目标分类模型。
[0116]
在一些实施例中,样本数据包括三维模型数据,获取模块,包括:网络获取模块,被配置为获取预设网络,其中,预设网络中包括空间特征描述器、以及结构特征描述器;特征提取模块,被配置为将样本数据输入预设网络,获得空间特征描述器输出的样本数据的空间特征,以及获得结构特征描述器输出的样本数据的结构特征;第一卷积模块,被配置为将样本数据的空间特征输入预设卷积网络,并获得预设卷积网络中每一层卷积层输出的第一输出结果;第二卷积模块,被配置为将样本数据的结构特征输入预设卷积网络,并获得预设卷积网络中每一层卷积层输出的第二输出结果;第一聚合模块,被配置为针对预设卷积网络中的每一层卷积层,将该卷积层输出的第一输出结果、以及该卷积层输出的第二输出结果聚合后,输入自注意力网络,并获得自注意力网络输出的、对应于该卷积层的输出结果;第二聚合模块,被配置为将对应于每一层卷积层的输出结果进行聚合,得到样本数据的表征。
[0117]
在一些实施例中,第一更新模块,包括:第一更新子模块,被配置为采用样本数据的特征,对初始分类模型进行基于无监督对比学习的训练。
[0118]
在一些实施例中,用于训练模型的装置还包括:标签获取模块,被配置为获取样本数据的标签;第一更新模块,包括:第二更新子模块,被配置为采用样本数据的特征以及样本数据的标签,对初始分类模型进行基于有监督对比学习的训练。
[0119]
在一些实施例中,训练单元还包括:第二更新模块,被配置为采用样本数据的表征以及样本数据的标签,训练初始分类模型,得到训练后的初始分类模型输出的交叉熵损失函数值;根据对比损失函数值生成反馈信息,包括:根据对比损失函数值以及交叉熵损失函数值,生成反馈信息。
[0120]
上述装置700中的各单元与参考图2和图3描述的方法中的步骤相对应。由此上文针对用于训练模型的方法描述的操作、特征及所能达到的技术效果同样适用于装置700及其中包含的单元,在此不再赘述。
[0121]
进一步参考图8,作为对上述各图所示方法的实现,本公开提供了一种用于对三维模型进行分类的装置的一个实施例,该装置实施例与图6所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
[0122]
如图8所示,本实施例的用于训练模型的装置,包括:三维模型数据获取单元801、分类单元802。其中,三维模型数据获取单元,被配置为获取待分类的三维模型数据;分类单元,被配置为采用目标分类模型确定待分类三维模型数据的类别,其中,目标分类模型基于如第三方面所描述的装置训练得到。
[0123]
上述装置800中的各单元与参考图6描述的方法中的步骤相对应。由此上文针对用
于对三维模型进行分类的方法描述的操作、特征及所能达到的技术效果同样适用于装置800及其中包含的单元,在此不再赘述。
[0124]
根据本技术的实施例,本技术还提供了一种电子设备和一种可读存储介质。
[0125]
如图9所示,是根据本技术实施例的用于训练模型的方法的电子设备900的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本技术的实现。
[0126]
如图9所示,该电子设备包括:一个或多个处理器901、存储器902,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示gui的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图9中以一个处理器901为例。
[0127]
存储器902即为本技术所提供的非瞬时计算机可读存储介质。其中,该存储器存储有可由至少一个处理器执行的指令,以使该至少一个处理器执行本技术所提供的用于训练模型的方法。本技术的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本技术所提供的用于训练模型的方法。
[0128]
存储器902作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本技术实施例中的用于训练模型的方法对应的程序指令/模块(例如,附图7所示的获取单元701、训练单元702、确定单元703)。处理器901通过运行存储在存储器902中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的用于训练模型的方法。
[0129]
存储器902可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据用于提取视频片段的电子设备的使用所创建的数据等。此外,存储器902可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器902可选包括相对于处理器901远程设置的存储器,这些远程存储器可以通过网络连接至用于提取视频片段的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0130]
用于训练模型的方法的电子设备还可以包括:输入装置903、输出装置904以及总线905。处理器901、存储器902、输入装置903和输出装置904可以通过总线905或者其他方式连接,图9中以通过总线905连接为例。
[0131]
输入装置903可接收输入的数字或字符信息,以及产生与用于提取视频片段的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置904可以包括
显示设备、辅助照明装置(例如,led)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(lcd)、发光二极管(led)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
[0132]
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用asic(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
[0133]
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(pld)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
[0134]
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0135]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
[0136]
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
[0137]
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本技术中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本技术公开的技术方案所期望的结果,本文在此不进行限制。
[0138]
上述具体实施方式,并不构成对本技术保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本技术的精神和原则之内所作的修改、等同替换和改进等,均应包含在本技术保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献