一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种多人手势识别方法、装置及介质与流程

2022-11-14 02:51:44 来源:中国专利 TAG:

技术特征:
1.一种多人手势识别方法,其包括如下步骤:s1,获取待识别图像或视频;s2,将所述待识别图像或视频送入预先训练好的手势识别网络,以识别出手势;其中所述手势识别网络将yolov5的输出头解耦为两个输出头,其中第一个输出头为回归框位置和前景置信度,第二输出头为类别信息;所述手势识别网络的损失函数为l
fl
=-(1-p
t
)
γ
logp
t
,其中p
t
表示真实值与预测值之间的接近程度,γ随着训练的轮数从0逐渐增到一预设值γ_max。2.根据权利要求1所述的方法,所述γ=(γ_max/total_epoch2)
×
current_epoch2,其中total_epoch、current_epoch分别为总训练轮数与当前训练轮数。3.根据权利要求2所述的方法,所述预设值γ_max为1。4.根据权利要求1所述的方法,所述手势识别网络将yolov5的骨干网络backbone替换为pp-lcnet。5.根据权利要求4所述的方法,所述pp-lcnet的特征图逐通道进行一维卷积得到c个数f,f与特征图每个通道的全局平均值和全局最大值一起进行通道注意力机制的“squeeze”操作得到每个通道重要程度。6.一种多人手势识别装置,其包括如下单元:待识别图像或视频获取单元,用于获取待识别图像或视频;手势识别单元,用于将所述待识别图像或视频送入预先训练好的手势识别网络,以识别出手势;其中所述手势识别网络将yolov5的输出头解耦为两个输出头,其中第一个输出头为回归框位置和前景置信度,第二输出头为类别信息;所述手势识别网络的损失函数为l
fl
=-(1-p
t
)
γ
logp
t
,其中p
t
表示真实值与预测值之间的接近程度,γ随着训练的轮数从0逐渐增到一预设值γ_max。7.根据权利要求6所述的装置,所述γ=(γ_max/total_epoch2)
×
current_epoch2,其中total_epoch、current_epoch分别为总训练轮数与当前训练轮数。8.根据权利要求7所述的装置,所述预设值γ_max为1。9.根据权利要求6所述的装置,所述手势识别网络将yolov5的骨干网络backbone替换为pp-lcnet。10.根据权利要求9所述的装置,所述pp-lcnet的特征图逐通道进行一维卷积得到c个数f,f与特征图每个通道的全局平均值和全局最大值一起进行通道注意力机制的“squeeze”操作得到每个通道重要程度。

技术总结
本发明提供了一种多人手势识别方法,其包括如下步骤:S1,获取待识别图像或视频;S2,将所述待识别图像或视频送入预先训练好的手势识别网络,以识别出手势;其中所述手势识别网络将YOLOV5的输出头解耦为两个输出头,其中第一个输出头为回归框位置和前景置信度,第二输出头为类别信息;所述手势识别网络的损失函数为L


技术研发人员:李观喜 梁倬华 王刚
受保护的技术使用者:广州紫为云科技有限公司
技术研发日:2022.08.23
技术公布日:2022/11/11
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献