一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于谱归一化向量神经元的多标签预测方法和系统与流程

2022-09-07 22:11:58 来源:中国专利 TAG:


1.本技术涉及多标签算法的技术领域,尤其是基于谱归一化向量神经元的多标签预测方法和系统。


背景技术:

2.多标签算法在行人属性识别、人脸属性识别等任务上取得优越的性能,如上图1所示,利用主干网络(backbone)对输入图像进行特征提取(feature extraction),然而嵌入多个二进制分类层(multiple binary classifiers),然后结合损失函数(bce loss)进行约束。然而,多标签算法固独立预测各个属性存在概率,也限制多标签算法的运用。因为在多个属性标签中,并不是完全独立存在,是存在一定程度上的关联(可能是互相依存的关系,也可能是互相排斥的关系)。若能考虑属性标签中的关联,必定可以提升多标签算法。多标签算法的另一个挑战是数据不均衡问题,导致某些多个二进制分类层收敛方向和速度不同,容易导致训练过程产生发散或者完全抑制某些属性的预测。
3.在现实场景中,某张图片可能具有多个标签,因此多标签算法应运而生,其中应用最为广泛的是行人属性识别、人脸属性识别。行人属性识别和人脸属性识别依靠多标签方式取得显著的性能。然而,多标签算法在任务预测时采用的是多个二进制分类层来预测每个属性,这样的方式完全忽略了不同属性间的关联。与此同时,现有的多标签数据集都存在严重的不均衡问题,导致某些多个二进制分类层收敛方向和速度不同,容易导致训练过程产生发散或者完全抑制某些属性的预测。由于目前的神经元都是标量形式,因此标量神经元只能用于预测属性存在的概率,无法去关联标签之间是否存在关联。在网络结构里插入向量神经元,可以利用多出来的维度去关联标签间的联系。然而,向量神经元的训练经常会存在发散的问题,并且向量神经元参数的增加,导致模型无法很好的收敛或者会产生过拟合的现象。


技术实现要素:

4.为了解决现有技术中多标签算法在任务预测时采用的是多个二进制分类层来预测每个属性,这样的方式完全忽略了不同属性间的关联;以及引入向量神经元来感知属性间的关联存在的训练难等技术问题,本技术提出了一种基于谱归一化向量神经元的多标签预测方法和系统,以解决上述技术问题。
5.根据本技术的第一方面,提出了一种基于谱归一化向量神经元的多标签预测方法,包括:
6.s1:主干网络提取输入图像的特征,并将特征送入标量神经元和向量神经元中训练,向量神经元包括父胶囊向量神经元和子胶囊向量神经元;
7.s2:特征经过父胶囊向量神经元获得m个胶囊层,对胶囊长度进行归一化,并将父胶囊向量神经元的输出送入子胶囊向量神经元;
8.s3:在父胶囊向量神经元的卷积层中嵌入谱归一化使得卷积层的参数谱范数满足
利普希兹约束,利用训练后的模型进行预测任务。
9.在具体的实施例中,标量神经元直接对属性进行二进制分类,向量神经元利用动态路由机制进行计算神经元的长度和方向,长度表示属性存在的概率,方向表示属性间的关联度。
10.在具体的实施例中,s2中对胶囊长度进行归一化具体为:利用挤压函数对胶囊长度进行归一化,挤压函数为其中,s表示胶囊长度,||s||表示胶囊长度的范数。
11.在具体的实施例中,s2中将父胶囊向量神经元输出送入子胶囊向量神经元具体包括:将父胶囊向量神经元的输出通过转移矩阵转移到高维度上。
12.在具体的实施例中,父胶囊向量神经元和子胶囊向量神经元通过动态路由决定浅层的胶囊的输出。
13.在具体的实施例中,s3中的谱范数其中,eig()表示为计算矩阵特征值的函数,它的返回值为向量[λ1,λ2,λ3,

,λn],λi表示第i个特征值,a为代表卷积层的参数矩阵。
[0014]
根据本技术的第二方面,提出了一种计算机可读存储介质,其上存储有一或多个计算机程序,该一或多个计算机程序被计算机处理器执行时实施上述任一项的方法。
[0015]
根据本技术的第三方面,提出了一种基于谱归一化向量神经元的多标签预测系统,系统包括:
[0016]
训练单元:配置用于主干网络提取输入图像的特征,并将特征送入标量神经元和向量神经元中训练,向量神经元包括父胶囊向量神经元和子胶囊向量神经元;特征经过父胶囊向量神经元获得m个胶囊层,对胶囊长度进行归一化,并将父胶囊向量神经元的输出送入子胶囊向量神经元;在父胶囊向量神经元的卷积层中嵌入谱归一化使得卷积层的参数谱范数满足利普希兹约束;
[0017]
预测单元:配置用于训练后的模型进行预测任务。
[0018]
在具体的实施例中,标量神经元直接对属性进行二进制分类,向量神经元利用动态路由机制进行计算神经元的长度和方向,长度表示属性存在的概率,方向表示属性间的关联度。
[0019]
在具体的实施例中,标量神经元直接对属性进行二进制分类,向量神经元利用动态路由机制进行计算神经元的长度和方向,长度表示属性存在的概率,方向表示属性间的关联度。
[0020]
在具体的实施例中,将父胶囊向量神经元输出送入子胶囊向量神经元具体包括:将父胶囊向量神经元的输出通过转移矩阵转移到高维度上,父胶囊向量神经元和子胶囊向量神经元通过动态路由决定浅层的胶囊的输出。
[0021]
在具体的实施例中,谱范数其中,eig()表示为计算矩阵特征值的函数,它的返回值为向量[λ1,λ2,λ3,

,λn],λi表示第i个特征值,a为代表卷积层的参数矩阵。
[0022]
本技术提出了一种基于谱归一化向量神经元的多标签预测方法和系统,在标量神
经元的基础上引入向量神经元,利用向量神经元多余的维度来感知不同标签间的联系;引入谱归一化进向量神经元,使得向量神经元的训练更加稳定。在行人属性识别任务和人脸属性任务上进行验证,实验结果证明本技术提出的谱归一化向量神经元能显著的提升算法性能。
附图说明
[0023]
包括附图以提供对实施例的进一步理解并且附图被并入本说明书中并且构成本说明书的一部分。附图图示了实施例并且与描述一起用于解释本技术的原理。将容易认识到其它实施例和实施例的很多预期优点,因为通过引用以下详细描述,它们变得被更好地理解。通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本技术的其它特征、目的和优点将会变得更明显:
[0024]
图1是本技术可以应用于其中的示例性系统架构图;
[0025]
图2是本技术的一个具体的实施例的一种基于谱归一化向量神经元的多标签预测方法的流程图;
[0026]
图3是本技术的一个实施例的一种基于谱归一化向量神经元的多标签预测系统的框架图;
[0027]
图4是适于用来实现本技术实施例的电子设备的计算机系统的结构示意图。
具体实施方式
[0028]
下面结合附图和实施例对本技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
[0029]
需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本技术。
[0030]
图1示出了可以应用本技术实施例的基于谱归一化向量神经元的多标签预测方法的示例性系统架构100。
[0031]
如图1所示,系统架构100可以包括数据服务器101,网络102和主服务器103。网络102用以在数据服务器101和主服务器103之间提供通信链路的介质。网络102可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0032]
主服务器103可以是提供各种服务的服务器,例如对数据服务器101上传的信息进行处理的数据处理服务器。
[0033]
需要说明的是,本技术实施例所提供的基于谱归一化向量神经元的多标签预测方法一般由主服务器103执行,相应地,用于基于谱归一化向量神经元的多标签预测的系统一般设置于主服务器103中。
[0034]
需要说明的是,数据服务器和主服务器可以是硬件,也可以是软件。当为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务的软件或软件模块),也可以实现成单个软件或软件模块。
[0035]
应该理解,图1中的数据服务器、网络和主服务器的数目仅仅是示意性的。根据实
现需要,可以具有任意数目的终端设备、网络和服务器。
[0036]
根据本技术的一个实施例的一种基于谱归一化向量神经元的多标签预测方法,图2示出了根据本技术的实施例的一种基于谱归一化向量神经元的多标签预测方法的流程图。如图2所示,该方法包括:
[0037]
s201:主干网络提取输入图像的特征,并将特征送入标量神经元和向量神经元中训练,向量神经元包括父胶囊向量神经元和子胶囊向量神经元。
[0038]
在具体的实施例中,标量神经元直接对属性进行二进制分类,向量神经元主要依靠动态路由机制进行计算神经元的长度和方向,长度代表该属性存在的概率,方向代表属性间的关联度。
[0039]
s102:特征经过父胶囊向量神经元获得m个胶囊层,对胶囊长度进行归一化,并将父胶囊向量神经元的输出送入子胶囊向量神经元。
[0040]
在具体的实施例中,向量神经元分为两部分:父胶囊向量神经元和子向量神经元,父胶囊向量神经元由n个卷积层构成,将特征经过父胶囊向量神经元会得到m个胶囊层,然后通过挤压函数对胶囊长度进行归一化,挤压函数如下所示:其中,s表示胶囊长度,||s||表示胶囊长度的范数。
[0041]
在具体的实施例中,将父胶囊向量神经元的输出送入子胶囊向量神经元,为了使得特征能更好的区分度,首先将父胶囊向量神经元的输出通过转移矩阵w转移到高维度上。父胶囊向量神经元和子胶囊向量神经元主要通过动态路由来决定浅层的胶囊输出到哪里。
[0042]
s103:在父胶囊向量神经元的卷积层中嵌入谱归一化使得卷积层的参数谱范数满足利普希兹约束,利用训练后的模型进行预测任务。
[0043]
在具体的实施例中,父胶囊向量神经元主要还是由卷积层组成,本技术引入的谱归一化主要嵌入到这部分的卷积层中,使得卷积层的参数谱范数满足利普希兹约束,谱范数定义如下:其中,eig()表示为计算矩阵特征值的函数,它的返回值为向量[λ1,λ2,λ3,

,λn],λi表示第i个特征值,a为代表卷积层的参数矩阵。
[0044]
本技术解决了多标签算法关联性缺失的问题,以及引入向量神经元来感知属性间的关联存在的训练难的问题。本技术主要分为两个部分:在标量神经元的基础上引入向量神经元,利用向量神经元多余的维度来感知不同标签间的联系;引入谱归一化进向量神经元,使得向量神经元的训练更加稳定。为了验证谱归一化向量神经元的有效性,本技术发明人特地在行人属性识别任务和人脸属性任务上进行验证,实验结果证明提出的谱归一化向量神经元能显著的提升算法性能。
[0045]
继续参考图3,图3示出了根据本技术的实施例的一种基于谱归一化向量神经元的多标签预测系统的框架图。该系统具体包括训练单元301和预测单元302。其中,训练单元301配置用于主干网络提取输入图像的特征,并将特征送入标量神经元和向量神经元中训练,向量神经元包括父胶囊向量神经元和子胶囊向量神经元;特征经过父胶囊向量神经元获得m个胶囊层,对胶囊长度进行归一化,并将父胶囊向量神经元的输出送入子胶囊向量神经元;在父胶囊向量神经元的卷积层中嵌入谱归一化使得卷积层的参数谱范数满足利普希兹约束。预测单元302配置用于训练后的模型进行预测任务。
[0046]
下面参考图4,其示出了适于用来实现本技术实施例的电子设备的计算机系统400
的结构示意图。图4示出的电子设备仅仅是一个示例,不应对本技术实施例的功能和使用范围带来任何限制。
[0047]
如图4所示,计算机系统400包括中央处理单元(cpu)401,其可以根据存储在只读存储器(rom)402中的程序或者从存储部分408加载到随机访问存储器(ram)403中的程序而执行各种适当的动作和处理。在ram 403中,还存储有系统400操作所需的各种程序和数据。cpu 401、rom 402以及ram 403通过总线404彼此相连。输入/输出(i/o)接口405也连接至总线404。
[0048]
以下部件连接至i/o接口405:包括键盘、鼠标等的输入部分406;包括诸如液晶显示器(lcd)等以及扬声器等的输出部分407;包括硬盘等的存储部分408;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分409。通信部分409经由诸如因特网的网络执行通信处理。驱动器410也根据需要连接至i/o接口405。可拆卸介质411,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器410上,以便于从其上读出的计算机程序根据需要被安装入存储部分408。
[0049]
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分409从网络上被下载和安装,和/或从可拆卸介质411被安装。在该计算机程序被中央处理单元(cpu)401执行时,执行本技术的方法中限定的上述功能。需要说明的是,本技术的计算机可读存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本技术中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本技术中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读存储介质,该计算机可读存储介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。
[0050]
可以以一种或多种程序设计语言或其组合来编写用于执行本技术的操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c ,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广
域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
[0051]
附图中的流程图和框图,图示了按照本技术各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0052]
描述于本技术实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。
[0053]
作为另一方面,本技术还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:主干网络提取输入图像的特征,并将特征送入标量神经元和向量神经元中训练,向量神经元包括父胶囊向量神经元和子胶囊向量神经元;特征经过父胶囊向量神经元获得m个胶囊层,对胶囊长度进行归一化,并将父胶囊向量神经元的输出送入子胶囊向量神经元;在父胶囊向量神经元的卷积层中嵌入谱归一化使得卷积层的参数谱范数满足利普希兹约束,利用训练后的模型进行预测任务。
[0054]
以上描述仅为本技术的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本技术中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本技术中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献