一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

双路残差结构神经网络模型及图像目标识别系统的制作方法

2022-04-27 03:40:37 来源:中国专利 TAG:


1.本发明涉及计算机视觉图像识别技术领域,特别是涉及一种双路残差结构神经网络模型及图像目标识别系统。


背景技术:

2.深度学习技术是一种重要的图像分类方法,由单层神经网络逐层叠加构造的深度神经网络具有良好的特征提取和图像分类性能。
3.但现有的用于图像分类的深度学习模型都存在一个显著的问题,即梯度弥散问题。受该问题制约,当深度学习模型达到一定深度时,由于反传梯度微弱而无法推动权值调节,从而影响模型分类性能的提升。
4.深度残差学习(deep residual learning)是一种有效缓解深度神经网络梯度弥散的方法,该方法在深度神经网络中设计跨层连接,进而促进特征的前向传播和梯度的反向传播。但现有的深度残差学习模型(resnet,kaiming he,cvpr 2015)的跨层连接仅有一条,是一种单通路残差结构,仍然不能更充分的促进特征的前向传播和梯度的反向传播。


技术实现要素:

5.为解决现有技术中存在上述问题,本发明提供了一种双路残差结构神经网络模型及图像目标识别系统。
6.为实现上述目的,本发明提供了如下方案:
7.一种双路残差结构神经网络模型,包括:至少两个依次级联的网络单元;
8.每一网络单元均包括多个依次级联的卷积神经网络模块;
9.所述网络单元的输入端和输出端间设置第一残差支路;两两网络单元间设置第二残差支路;所述第一残差支路的输入和输出均为待识别图像;所述第二残差支路的输入和输出均为前一网络单元中任意一个所述卷积神经网络模块的输出;所述第二残差支路用于将前一网络单元中任意一个所述卷积神经网络模块的输出叠加至后一网络单元中的任一卷积神经网络模块进行卷积处理,以得到目标识别结果。
10.优选地,每一网络单元均包括依次级联的第一卷积神经网络模块、第二卷积神经网络模块和第三卷积神经网络模块;
11.当前网络单元中的所述第一卷积神经网络模块的输入端与所述第三卷积神经网络模块的输出端之间设置有第一残差支路;所述当前网络单元中的第二卷积神经网络模块的输入端和与所述当前网络单元级联的下一网络单元中的第一卷积神经网络模块的输出端之间设置有第二残差支路;所述当前网络单元中的第一卷积神经网络模块的输入为所述待识别图像;所述第一残差支路的输出与所述当前网络单元中所述第三卷积神经网络模块的输出的叠加结果作为所述下一网络单元中的第一卷积神经网络模块的输入。
12.优选地,所述第一卷积神经网络模块、所述第二卷积神经网络模块和所述第三卷积神经网络模块均由单卷积层构成。
13.优选地,所述第一卷积神经网络模块、所述第二卷积神经网络模块和所述第三卷积神经网络模块均包括单卷积层和非线性激活层;所述非线性激活层添加在所述单卷积层之后。
14.优选地,所述第一卷积神经网络模块、所述第二卷积神经网络模块和所述第三卷积神经网络模块均由双卷积层构成。
15.优选地,所述第一卷积神经网络模块、所述第二卷积神经网络模块和所述第三卷积神经网络模块均包括双卷积层和非线性激活层;所述非线性激活层添加在所述双卷积层之后。
16.优选地,所述第一卷积神经网络模块、所述第二卷积神经网络模块和所述第三卷积神经网络模块均由三卷积层构成。
17.优选地,所述第一卷积神经网络模块、所述第二卷积神经网络模块和所述第三卷积神经网络模块均包括三卷积层和非线性激活层;所述非线性激活层添加在所述三卷积层之后。
18.根据本发明提供的具体实施例,本发明公开了以下技术效果:
19.本发明提供的双路残差结构神经网络模型,通过设置第一残差支路和第二残差支路的方式得到双路残差结构,能够促进图像特征的前向传播和梯度的反向传播,以弥补现有技术不能充分解决梯度弥散的问题,进而使得深度神经网络的特征提取性能和目标分类性能获得提升。
20.对应于上述提供的双路残差结构神经网络模型,本发明还提供了一种如下实施方式:
21.一种图像目标识别系统,包括:图像采集单元和处理单元;所述图像采集单元和所述处理单元连接;所述处理单元中植入有图像目标识别模型;所述图像目标识别模型为上述提供的双路残差结构神经网络模型;
22.图像采集单元用于获取待识别图像;所述处理单元用于采用其内部植入的所述图像目标识别模型,基于所述图像采集单元获取的待识别图像得到目标识别结果。
23.本发明提供的图像目标识别方法和系统,基于上述提供的双路残差结构神经网络模型能够进一步提高图像目标识别的准确性和时效性。
24.以上的总体描述和下文中的描述仅是示例性和解释性的,不用于限制本技术。
附图说明
25.一个或多个实施例通过与之对应的附图进行示例性说明,这些示例性说明和附图并不构成对实施例的限定,附图中具有相同参考数字标号的元件示为类似的元件,附图不构成比例限制,并且其中:
26.图1为本发明提供的双路残差结构神经网络模型的结构示意图;
27.图2为本发明提供的图像目标识别系统的结构示意图。
具体实施方式
28.为了能够更加详尽地了解本公开实施例的特点与技术内容,下面结合附图对本公开实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本公开实施例。
在以下的技术描述中,为方便解释起见,通过多个细节以提供对所披露实施例的充分理解。然而,在没有这些细节的情况下,一个或多个实施例仍然可以实施。在其它情况下,为简化附图,熟知的结构和装置可以简化展示。
29.本发明提供的双路残差结构神经网络模型,包括:至少两个依次级联的网络单元;
30.每一网络单元均包括多个依次级联的卷积神经网络模块;
31.所述网络单元的输入端和输出端间设置第一残差支路;两两网络单元间设置第二残差支路;所述第一残差支路的输入和输出均为待识别图像;所述第二残差支路的输入和输出均为前一网络单元中任意一个所述卷积神经网络模块的输出;所述第二残差支路用于将前一网络单元中任意一个所述卷积神经网络模块的输出叠加至后一网络单元中的任一卷积神经网络模块进行卷积处理,以得到目标识别结果。
32.下面以每个网络单元包括3个依次级联的卷积神经网络模块(第一卷积神经网络模块a、第二卷积神经网络模块b和第三卷积神经网络模块c)为例,对上述提供的双路残差结构神经网络模型的数据传输过程进行说明。
33.如图1所示,上述双路残差结构神经网络模型命名为doubleresblock,每一网络单元均包括三个堆叠的卷积处理模块,即依次级联的第一卷积神经网络模块a、第二卷积神经网络模块b和第三卷积神经网络模块c。输入信息将依次经过第一卷积神经网络模块a、第二卷积神经网络模块b和第三卷积神经网络模块c,形成信息处理的主通路。第一卷积神经网络模块a、第二卷积神经网络模块b和第三卷积神经网络模块c在主通路上的输入和输出称之为第一卷积神经网络模块a、第二卷积神经网络模块b和第三卷积神经网络模块c的主输入和主输出。
34.当前网络单元中的第一卷积神经网络模块a的输入端与第三卷积神经网络模块c的输出端之间设置有第一残差支路(即图1中的残差支路1)。当前网络单元中的第二卷积神经网络模块b的输入端和与当前网络单元级联的下一网络单元中的第一卷积神经网络模块a的输出端之间设置有第二残差支路(即图1中的残差支路2)。
35.基于上述结构数据传输的处理过程可以为:第一卷积神经网络模块a的主输入信息(即待目标识别图像)会经由一个新增支路被跨层连接到第三卷积神经网络模块c之后,并与第三卷积神经网络模块c的主输出信息进行相加,以构成第三卷积神经网络模块c的最终输出信息。第一卷积神经网络模块a的主输出信息会经由第二残差支路被跨层连接到下一个网络单元的第二卷积神经网络模块b,并与第二卷积神经网络模块b的主输入相加,构成第二卷积神经网络模块b的最终输入信息(即目标识别结果)。
36.为了使得通过该支路的信息可进行恰当的转换,进而符合相关的矩阵数据相加规则,上述第一残差支路和第二残差支路都可选择性的添加卷积层。
37.基于以上设置,本发明能够通过双路残差结构(即第一残差支路和第二残差支路)促进图像特征的前向传播和梯度的反向传播,弥补现有技术不能充分解决梯度弥散的问题,从而使得深度神经网络的特征提取性能和目标分类性能获得提升。
38.在具体的深度学习模型设计中,需要将多个网络单元进行串接级联,并在毗邻的模块之间设置跨层连接的第一残差支路和第二残差支路,从而将多个串接级联的模块用信息主通路和残差支路链接起来,实现协同工作。
39.进一步为了增加所形成的双路残差结构神经网络模型的多样性,每个网络单元中
内嵌的卷积神经网络模块a、b和c是可以是由单层、双层或三层的卷积单元所构成。每层卷积之后可添加一个非线性激活层,也可不添加非线性激活层。
40.因此,基于本发明构成的基于双路残差结构的神经网络模型,可以构造基于深度学习技术的图像分类模型、图像目标检测识别模型,具有广泛用途。
41.对应于上述提供的双路残差结构神经网络模型,本发明还提供了一种图像目标识别系统,如图2所示,该系统包括:图像采集单元200和处理单元201。图像采集单元200和处理单元201连接。处理单元201中植入有图像目标识别模型。图像目标识别模型为上述提供的双路残差结构神经网络模型。
42.图像采集单元200用于获取待识别图像。处理单元201用于采用其内部植入的图像目标识别模型,基于图像采集单元200获取的待识别图像得到目标识别结果。
43.以上描述和附图充分地示出了本公开的实施例,以使本领域的技术人员能够实践它们。其他实施例可以包括结构的、逻辑的、电气的、过程的以及其他的改变。实施例仅代表可能的变化。除非明确要求,否则单独的部件和功能是可选的,并且操作的顺序可以变化。一些实施例的部分和特征可以被包括在或替换其他实施例的部分和特征。本公开实施例的范围包括权利要求书的整个范围,以及权利要求书的所有可获得的等同物。当用于本技术中时,虽然术语“第一”、“第二”等可能会在本技术中使用以描述各元件,但这些元件不应受到这些术语的限制。这些术语仅用于将一个元件与另一个元件区别开。比如,在不改变描述的含义的情况下,第一元件可以叫做第二元件,并且同样第,第二元件可以叫做第一元件,只要所有出现的“第一元件”一致重命名并且所有出现的“第二元件”一致重命名即可。第一元件和第二元件都是元件,但可以不是相同的元件。而且,本技术中使用的用词仅用于描述实施例并且不用于限制权利要求。如在实施例以及权利要求的描述中使用的,除非上下文清楚地表明,否则单数形式的“一个”(a)、“一个”(an)和
“”
(the)旨在同样包括复数形式。类似地,如在本技术中所使用的术语“和/或”是指包含一个或一个以上相关联的列出的任何以及所有可能的组合。另外,当用于本技术中时,术语“包括”(comprise)及其变型“包括”(comprises)和/或包括(comprising)等指陈述的特征、整体、步骤、操作、元素,和/或组件的存在,但不排除一个或一个以上其它特征、整体、步骤、操作、元素、组件和/或这些的分组的存在或添加。在没有更多限制的情况下,由语句“包括一个
…”
限定的要素,并不排除在包括要素的过程、方法或者设备中还存在另外的相同要素。本文中,每个实施例重点说明的可以是与其他实施例的不同之处,各个实施例之间相同相似部分可以互相参见。对于实施例公开的方法、产品等而言,如果其与实施例公开的方法部分相对应,那么相关之处可以参见方法部分的描述。
44.本领域技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,可以取决于技术方案的特定应用和设计约束条件。技术人员可以对每个特定的应用来使用不同方法以实现所描述的功能,但是这种实现不应认为超出本公开实施例的范围。技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
45.本文所披露的实施例中,所揭露的方法、产品(包括但不限于装置、设备等),可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,
可以仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例。另外,在本公开实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
46.附图中的流程图和框图显示了根据本公开实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这可以依所涉及的功能而定。在附图中的流程图和框图所对应的描述中,不同的方框所对应的操作或步骤也可以以不同于描述中所披露的顺序发生,有时不同的操作或步骤之间不存在特定的顺序。例如,两个连续的操作或步骤实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这可以依所涉及的功能而定。框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献