一种基于深度学习的大型会场座席定位方法

2022-05-21 02:35:10 来源：中国专利 TAG：

技术特征：
1.一种基于深度学习的大型会场座席定位方法，用于对大型会场视频流中不同尺度比例的座椅实现定位，其特征在于，包括以下步骤：步骤s1，获取待测会场的俯视角度的视频流；步骤s2，采用resnet50和fpn结合的网络作为backbone，连接至fam模块和odm模块以构建初始卷积神经网络；步骤s3，基于随机梯度下降法和最小化损失函数对所述初始卷积神经网络进行训练得到大型会场座席检测模型；步骤s4，采用所述大型会场座席检测模型对所述视频流中每隔设定帧的图像进行座席检测，并输出所述待测会场的所有座椅对应的定位检测结果。2.根据权利要求1所述的一种基于深度学习的大型会场座席定位方法，其特征在于：其中，所述步骤s3包括以下子步骤：步骤s3-1，获取大型会场俯视角度的实时视频流，从所述视频流中截取无人场景下的图像帧；步骤s3-2，采用打好标签的所述图像帧构建数据集，并将所述数据集分为训练集、验证集以及测试集；步骤s3-3，将所述训练集中的图像帧依次输入至所述初始卷积神经网络进行训练以对模型参数进行迭代；步骤s3-4，在每次迭代后，根据所述初始卷积神经网络最后一层的模型参数计算损失误差，利用所述损失误差反向传播，采用所述随机梯度下降算法进行模型参数的优化；步骤s3-5，重复所述步骤s3-3至所述步骤s3-4直至各层的模型参数收敛后完成训练，得到所述大型会场座席检测模型。3.根据权利要求1所述的一种基于深度学习的大型会场座席定位方法，其特征在于：其中，resnet50包括4个残差模块，每个所述残差模块至少由卷积运算conv、线性整流函数relu和批归一化bn依次组成，所述fam模块包括arn子模块和acl子模块，所述arn子模块由两个卷积block堆叠而成的分类分支和回归分支组成，用于基于输入的特征生成高质量的可倾斜的锚点推荐，所述odm模块包括一组动态旋转卷积层和两个预测分支，所述动态旋转卷积层提取得到具有角度不变性的特征，两个所述预测分支分别为分类分支以及回归分支。4.根据权利要求1所述的一种基于深度学习的大型会场座席定位方法，其特征在于：其中，所述最小化损失函数为所述fam模块的损失函数与所述odm模块的损失函数之和，公式如下：
式中，i为锚点索引，n
f
和n
o
分别为fam模块和odm模块中的正例数量，c
if
和x
if
分别为fam模块关于锚点的预测类别和位置，c
io
和x
io
分别为odm模块关于锚点的预测类别和位置，l
i*
和g
i*
分别为锚点相关联的真实边框的类别和位置，l
c
和l
r
分别为focal loss和smooth l1 loss表示的类别损失函数和位置损失函数。5.根据权利要求1所述的一种基于深度学习的大型会场座席定位方法，其特征在于：其中，所述定位检测结果包括分类结果与回归结果，所述分类结果表示该区域被分类为座椅的概率得分，所述回归结果为座椅区域的维数信息，该维数分别表示所述座椅区域的中心点横坐标、中心点纵坐标、区域宽度、区域高度及区域倾斜角度。

技术总结
本发明提供一种基于深度学习的大型会场座席定位方法，用于对大型会场视频流中不同尺度比例的座椅实现定位，其特征在于，包括以下步骤：步骤S1，获取待测会场的俯视角度的视频流；步骤S2，采用ResNet50和FPN结合的网络作为Backbone，连接至FAM模块和ODM模块以构建初始卷积神经网络；步骤S3，基于随机梯度下降法和最小化损失函数对初始卷积神经网络进行训练得到大型会场座席检测模型；步骤S4，采用大型会场座席检测模型对视频流中每隔设定帧的图像进行座席检测，并输出待测会场的所有座椅对应的定位检测结果。本发明能够高效地识别由不同机位拍摄得到的不同色彩模式如室内灯光和夜市红外光下的尺度、角度、比例多样的座椅目标，具有强泛化和高精度的优势。具有强泛化和高精度的优势。具有强泛化和高精度的优势。

技术研发人员：严寒冯瑞
受保护的技术使用者：复旦大学
技术研发日：2022.02.16
技术公布日：2022/5/20

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：电子表格中的公式计算方法、计算装置及计算机可读介质与流程

一种基于深度学习的大型会场座席定位方法

相关文献

最热文献