一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于结构重参数化的模型推理速度提升方法及装置与流程

2022-06-12 01:49:53 来源:中国专利 TAG:

技术特征:
1.一种基于结构重参数化的模型推理速度提升方法,其特征在于,包括:获取样本数据并按照多分支结构进行训练,得到训练模型,所述训练模型包括残差连接大层,且所述残差连接大层包括1
×
1卷积层和3
×
3卷积层;将所述残差连接大层的非线性层放在所述残差连接大层的最后一层,再根据conv层与bn层融合的技术对所述1
×
1卷积层和所述3
×
3卷积层进行融合,得到卷积融合层并完成所述残差连接大层的融合,以得到结构重参数化的检测模型。2.根据权利要求1所述的一种基于结构重参数化的模型推理速度提升方法,其特征在于,所述conv层与bn层融合的技术,包括:分别将conv层的表达式conv=wc*x bc和bn层的表达式带入公式y=bn(conv(x))中进行计算,得到第一公式其中x为所述conv层的输入,y为所述conv层的输出,wc为所述conv层的权重,bc为所述conv层的偏置项,γ为所述bn层的缩放系数,β为所述bn层的偏移系数,e为所述bn层的均值,var为所述bn层的方差;对所述第一公式进行变形,得到第二公式所述第二公式为一元一次方程,完成所述conv层和所述bn层的融合。3.根据权利要求2所述的一种基于结构重参数化的模型推理速度提升方法,其特征在于,所述将所述残差连接大层的非线性层放在所述残差连接大层的最后一层,再根据conv层与bn层融合的技术对所述1
×
1卷积层和所述3
×
3卷积层进行融合,得到卷积融合层并完成所述残差连接大层的融合,以得到结构重参数化的检测模型,包括:步骤一、将所述残差连接大层的非线性层放在所述残差连接大层的最后一层;步骤二、预设所述残差连接大层的输入为输出为步骤三、当c1=c2,h1=h2,w1=w2时,可得所述输入m1与所述输出m2的关系式为:且所述残差连接大层的权重为所述残差连接大层的偏置为其中表示从1开始,i表示通道,c1为所述残差连接大层的输入通道,c2为所述残差连接大层的输出通道,n是batch_size,h1、w1是输入特征的高和宽,h2,w2是输出特征的高和宽,var
(3)
,e
(3)

(3)

(3)
分别表示3x3 conv之后的bn的方差、均值、偏置系数、缩放系数,var
(1)
,e
(1)

(1)

(1)
分别表示1x1 conv之后的bn的方差、均值、偏置系数、缩放系数,var
(0)
,e
(0)

(0)

(0)
分别表示identity之后的bn的方差、均值、偏置系数、缩放系数,identity表示一个层;步骤四、根据所述步骤一、所述步骤二、所述步骤三可得,所述残差连接大层按照所述conv层与bn层融合的技术可以完成融合。4.根据权利要求3所述的一种基于结构重参数化的模型推理速度提升方法,其特征在
于,所述当c1=c2,h1=h2,w1=w2时,可得所述输入m1与所述输出m2的关系式为:还包括:当所述c1=c2,h1=h2,w1=w2不成立时,所述输入m1与所述输出m2的关系式为m2=bn(conv(m1),var
(3)
,e
(3)

(3)

(3)
) bn(conv(m1*w1),var
(1)
,e
(1)

(1)

(1)
)。5.根据权利要求1所述的一种基于结构重参数化的模型推理速度提升方法,其特征在于,所述非线性层包括激活函数relu。6.一种基于结构重参数化的模型推理速度提升装置,用于实现如权利要求1所述的一种基于结构重参数化的模型推理速度提升方法,其特征在于,包括:模型训练模块:用于获取样本数据并按照多分支结构进行训练,得到训练模型,所述训练模型包括残差连接大层,且所述残差连接大层包括1
×
1卷积层和3
×
3卷积层;结构重参数化的模型生成模块:用于将所述残差连接大层的非线性层放在所述残差连接大层的最后一层,再根据conv层与bn层融合的技术对所述1
×
1卷积层和所述3
×
3卷积层进行融合,得到卷积融合层并完成所述残差连接大层的融合,以得到结构重参数化的检测模型。7.根据权利要求6所述的一种基于结构重参数化的模型推理速度提升装置,其特征在于,所述结构重参数化的模型生成模块,包括:conv层与bn层第一融合模块:用于分别将conv层的表达式conv=wc*x bc和bn层的表达式带入公式y=bn(conv(x))中进行计算,得到第一公式其中x为所述conv层的输入,y为所述conv层的输出,wc为所述conv层的权重,bc为所述conv层的偏置项,γ为所述bn层的缩放系数,β为所述bn层的偏移系数,e为所述bn层的均值,var为所述bn层的方差;conv层与bn层第二融合模块:用于对所述第一公式进行变形,得到第二公式所述第二公式为一元一次方程,完成所述conv层和所述bn层的融合。8.根据权利要求7所述的一种基于结构重参数化的模型推理速度提升装置,其特征在于,所述结构重参数化的模型生成模块,还包括:第一结构重参数化模块:用于步骤一、将所述残差连接大层的非线性层放在所述残差连接大层的最后一层;第二结构重参数化模块:用于步骤二、预设所述残差连接大层的输入为输出为第三结构重参数化模块:用于步骤三、当c1=c2,h1=h2,w1=w2时,可得所述输入m1与所述输出m2的关系式为:
且所述残差连接大层的权重为所述残差连接大层的偏置为其中表示从1开始,i表示通道,c1为所述残差连接大层的输入通道,c2为所述残差连接大层的输出通道,n是batch_size,h1、w1是输入特征的高和宽,h2,w2是输出特征的高和宽,var
(3)
,e
(3)

(3)

(3)
分别表示3x3 conv之后的bn的方差、均值、偏置系数、缩放系数,var
(1)
,e
(1)

(1)

(1)
分别表示1x1 conv之后的bn的方差、均值、偏置系数、缩放系数,var
(0)
,e
(0)

(0)

(0)
分别表示identity之后的bn的方差、均值、偏置系数、缩放系数,identity表示一个层;第四结构重参数化模块:用于步骤四、根据所述步骤一、所述步骤二、所述步骤三可得,所述残差连接大层按照所述conv层与bn层融合的技术可以完成融合。9.一种基于结构重参数化的模型推理速度提升装置,其特征在于,包括存储器和处理器,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现如权利要求1~5中任一项所述的一种基于结构重参数化的模型推理速度提升方法。10.一种存储有计算机程序的计算机可读存储介质,其特征在于,所述计算机程序被计算机执行时实现如权利要求1~5中任一项所述的一种基于结构重参数化的模型推理速度提升方法。

技术总结
本申请提供了一种基于结构重参数化的模型推理速度提升方法及装置,涉及卷积神经网络模型技术领域,包括:获取样本数据并按照多分支结构进行训练,得到训练模型,所述训练模型包括残差连接大层,且所述残差连接大层包括1


技术研发人员:周祖煜 白博文 林波 陈煜人 张澎彬 莫志敏 张浩 李天齐 刘俊
受保护的技术使用者:杭州领见数字农业科技有限公司
技术研发日:2022.01.23
技术公布日:2022/6/10
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献