一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种轻量化的物流包裹目标检测模型

2022-11-23 17:11:56 来源:中国专利 TAG:

技术特征:
1.一种轻量化的物流包裹目标检测模型,其特征在于所述模型由input模块、backbone模块、neck模块和prediction模块四部分构成,其中:所述input模块是图像数据的输入端,用于将物流运输线上采集的尺寸为752
×
480的3通道图像数据处理成640
×
640
×
3的图像数据;所述backbone模块用于提取input模块输出的图像数据的物流包裹特征;所述neck模块用于对backbone模块提取的物流包裹特征进行混合和组合;所述prediction模块用于处理neck模块获取的图像特征,并对目标类别和边界框进行预测并输出。2.根据权利要求1所述的轻量化的物流包裹目标检测模型,其特征在于所述backbone模块由第0层~第6层构成,neck模块由第7层~第18层构成,第15层和第18层分别作为prediction模块的中目标检测层和大目标检测层;所述第0层为cbrm层,input模块输出的640
×
640
×
3图像数据作为第0层的输入,第0层输出的160
×
160
×
8图像数据作为第1层的输入;所述第1层为shuffle-block层,步长s=2,第1层的输入图像数据大小为160
×
160
×
8,第1层输出的80
×
80
×
64图像数据作为第2层的输入;所述第2层为c3-lite层,使用了3个bottleneck结构,c3-lite层的步长s=1,第2层的输入图像数据大小为80
×
80
×
64,第2层输出的80
×
80
×
64图像数据同时作为第3层和第13层的输入;所述第3层为shuffle-block层,步长s=2,第3层输入的图像数据大小为80
×
80
×
64,第3层输出的40
×
40
×
128图像数据作为第4层的输入;所述第4层为c3-lite层,使用了7个bottleneck结构,c3-lite层的步长s=1,第4层的输入图像数据大小为40
×
40
×
128,第4层输出的40
×
40
×
128图像数据同时作为第5层和第9层的输入;所述第5层为shuffle-block层,步长s=2,第5层的输入图像数据大小为40
×
40
×
128,第5层输出的20
×
20
×
256图像数据作为第6层的输入;所述第6层为c3-lite层,使用了3个bottleneck结构,c3-lite层的步长s=1,第6层的输入图像数据大小为20
×
20
×
256,第6层输出的20
×
20
×
256图像数据作为第7层的输入;所述第7层为conv层,第7层的输入图像数据大小为20
×
20
×
256,第7层输出的20
×
20
×
128图像数据同时作为第8层和第17层的输入;所述第8层为上采样,第8层的输入图像数据大小为20
×
20
×
128,第8层输出的40
×
40
×
128图像数据作为第9层的输入;所述第9层为concat层,第9层的输入图像大小为40
×
40
×
128 40
×
40
×
128,第9层输出的40
×
40
×
256图像数据作为第10层的输入;所述第10层为c3层,第10层的输入图像大小为40
×
40
×
256,第10层输出的40
×
40
×
128图像数据作为第11层输入;所述第11层为conv层,第11层的输入图像大小为40
×
40
×
128,第11层输出的40
×
40
×
64图像数据作为第12层的输入;所述第12层为上采样层,第12层的输入图像大小为40
×
40
×
64,第12层输出的80
×
80
×
64图像数据作为第13层的输入;
所述第13层为concat层,第13层的输入图像大小为80
×
80
×
64 80
×
80
×
64,第13层输出的80
×
80
×
128图像数据作为第14层的输入;所述第14层为focus层,第14层的输入图像大小为80
×
80
×
128,第14层输出的40
×
40
×
128图像数据作为第15层的输入;所述第15层为c3层,第15层的输入图像大小为40
×
40
×
128,第15层输出的40
×
40
×
64图像数据作为第16层的输入,第15层即为prediction模块的中目标检测层;所述第16层为focus层,第16层的输入图像大小为40
×
40
×
64,第16层输出的20
×
20
×
64图像数据作为第17层的输入;所述第17层为concat层,第17层的输入图像大小为20
×
20
×
64 20
×
20
×
128,第17层输出的20
×
20
×
192图像数据作为第18层的输入;所述第18层为c3层,第18层的输入图像大小为20
×
20
×
192,第18层输出为20
×
20
×
64,第18层即为prediction模块的大目标检测层。3.根据权利要求1所述的轻量化的物流包裹目标检测模型,其特征在于所述shuffle-block由分支1、分支2和channel shuffle构成,其中:分支1和分支2的通道数与输入的特征通道数相同,分支1通过3*3/2的dwconv、1*1conv进行处理;分支2通过1*1conv、3*3/2的dwconv、1*1conv进行处理;分支1和分支2经过concat处理后即按照通道数相加,图像数据的长宽都减半,通道数翻倍,concat的输出作为channel shuffle的输入。4.根据权利要求2所述的轻量化的物流包裹目标检测模型,其特征在于所述c3-lite层由分支1、分支2构成,特征图输入分支1经过1*1的dwconv卷积操作降维后,再经过bottleneck叠加的操作,维度不变,得到的特征图与分支2经过1*1的dwconv卷积操作降维得到的特征图进行concat操作,最后再经过1*1的cbs标准卷积操作最终输出。5.根据权利要求4所述的轻量化的物流包裹目标检测模型,其特征在于所述bottleneck由分支a和分支b构成,其中:分支b不进行任何处理,分支a先是使用1*1的标准卷积进行降维,后使用3*3的标准卷积升维,再和分支b进行add操作,维度不变。

技术总结
本发明公开了一种轻量化的物流包裹目标检测模型,所述模型由input模块、backbone模块、neck模块和prediction模块四部分构成,其中:input模块是图像数据的输入端,用于将物流运输线上采集的尺寸为752


技术研发人员:张国伟 孔洋洋 王力 刘智超
受保护的技术使用者:厦门理工学院
技术研发日:2022.08.09
技术公布日:2022/11/22
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献