一种胃部图片识别方法及装置与流程

2021-12-04 02:27:00 来源：中国专利 TAG：

技术特征：
1.一种胃部图片识别方法，其特征在于，包括：根据视频帧顺序，将胃部视频数据划分为多个帧数相同的视频图像集合；将多个视频图像集合输入到训练好的图片识别模型中，得到所述胃部视频数据中每帧图片对应的胃部部位识别结果，其中，所述训练好的图片识别模型是由卷积神经网络、transformer网络和全连接层构建的，并通过标记有胃部部位类别标签的样本视频图像集合训练得到的。2.根据权利要求1所述的胃部图片识别方法，其特征在于，所述训练好的图片识别模型通过以下步骤得到：获取多个帧数相同的样本视频图像集合，并对每个样本视频图像集合中每一帧样本图片标记对应的第一样本标签，构建得到训练样本集，其中，所述第一样本标签为胃部部位类别标签；将所述训练样本集输入到卷积神经网络进行训练，输出得到每个样本视频图像集合中样本图片的第一图片特征，并得到预训练的卷积神经网络，按照每个样本视频图像集合中样本图片的视频帧顺序，将所述第一图片特征输入到transformer网络进行训练，输出得到第二图片特征，并得到预训练的transformer网络；将所述第二图片特征输入到全连接层进行训练，输出得到样本图片预测结果，并基于所述样本图片预测结果与对应的实际样本图片标记结果的误差进行反向传播，以对所述预训练的卷积神经网络和所述预训练的transformer网络进行梯度优化，得到训练好的图片识别模型。3.根据权利要求2所述的胃部图片识别方法，其特征在于，在所述获取多个帧数相同的样本视频图像集合，并对每个样本视频图像集合中每一帧样本图片标记对应的第一样本标签之后，所述方法还包括：对图片像素或图像分辨率低于预设阈值的样本视频图像集合中每一帧样本图片标记对应的第二样本标签；根据标记有第一样本标签的样本视频图像集合和标记有第二样本标签的样本视频图像集合，构建训练样本集。4.根据权利要求1所述的胃部图片识别方法，其特征在于，所述胃部部位类别标签包括食管齿状线部位、胃底贲门部位、胃底体交界部位、胃体小弯部位、胃体大弯部位、胃体下部部位、胃角部位、胃窦幽门部位、十二指肠部位和体外。5.根据权利要求1所述的胃部图片识别方法，其特征在于，所述卷积神经网络为shufflenetv2网络。6.根据权利要求2所述的胃部图片识别方法，其特征在于，在所述获取多个帧数相同的样本视频图像集合之后，所述方法还包括：对每个样本视频图像集合中的样本图片进行图像增强处理，并根据图像增强处理后的样本图片构建训练样本集。7.一种胃部图片识别装置，其特征在于，包括：视频图像采集模块，用于根据视频帧顺序，将胃部视频数据划分为多个帧数相同的视频图像集合；部位识别模块，用于将多个视频图像集合输入到训练好的图片识别模型中，得到所述
胃部视频数据中每帧图片对应的胃部部位识别结果，其中，所述训练好的图片识别模型是由卷积神经网络、transformer网络和全连接层构建的，并通过标记有胃部部位类别标签的样本视频图像集合训练得到的。8.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述胃部图片识别方法的步骤。9.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述胃部图片识别方法的步骤。10.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述胃部图片识别方法的步骤。

技术总结
本发明提供一种胃部图片识别方法及装置，该方法包括：根据视频帧顺序，将胃部视频数据划分为多个帧数相同的视频图像集合；将多个视频图像集合输入到训练好的图片识别模型中，得到所述胃部视频数据中每帧图片对应的胃部部位识别结果，其中，所述训练好的图片识别模型是由卷积神经网络、Transformer网络和全连接层构建的，并通过标记有胃部部位类别标签的样本视频图像集合训练得到的。本发明通过结合卷积神经网络和Transformer网络，使得在对胃部图片进行特征提取时，可获取得到图片特征具有时序性信息，从而结合局部图片信息和时序性信息，更准确的判断胃部图片类别。更准确的判断胃部图片类别。更准确的判断胃部图片类别。

技术研发人员：吴家豪李青原方堉欣王羽嗣
受保护的技术使用者：广州思德医疗科技有限公司
技术研发日：2021.11.05
技术公布日：2021/12/3

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种胶囊胃镜轨迹跟踪方法及装置与流程

一种胃部图片识别方法及装置与流程

相关文献

最热文献