一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

视频处理方法及装置、电子设备、计算机可读存储介质与流程

2021-11-25 02:43:00 来源:中国专利 TAG:

技术特征:
1.一种视频处理方法,其特征在于,包括:获取待处理视频的目标图像序列,所述目标图像序列中包含所述待处理视频中的至少一个图像;确定目标图像序列中的至少一个目标视频图像,所述目标视频图像是指存在目标区域的图像,所述目标区域为非有效信息区域;确定每个所述目标视频图像中的目标区域的初始区域边界;根据所有所述目标视频图像中的各所述初始区域边界在所属的图像中的图像位置,筛选各所述初始区域边界中的有效边界;对于每个所述目标视频图像,基于所述目标视频图像的有效边界,确定所述目标视频图像中目标区域的位置。2.根据权利要求1所述的方法,其特征在于,所述根据所有所述目标视频图像中的各所述初始区域边界在所属的图像中的图像位置,筛选各所述初始区域边界中的有效边界,包括:根据每个所述初始区域边界在图像中的图像位置,确定所有所述目标视频图像中每个图像位置对应的初始边界集合、以及在每个图像位置存在初始区域边界的图像的第一数量,其中,一个图像位置对应的初始边界集合包括在所述图像位置出现的所有初始区域边界;根据每个所述初始边界集合中包括的初始区域边界的第一数量,对各所述初始边界集合进行筛选,得到目标边界集合,将各所述目标边界集合中的初始区域边界作为有效边界。3.根据权利要求2所述的方法,其特征在于,所述根据每个所述初始边界集合中包括的初始区域边界的第一数量,对各所述初始边界集合进行筛选,得到目标边界集合,包括:将各所述初始边界集合中对应的所述第一数量满足第一预设条件的集合,确定为所述目标边界集合,其中,所述第一预设条件包括以下至少一项:所述第一数量大于或等于第一阈值;所述第一数量与第一总数量的第一比值大于或等于第一预设占比,其中,所述第一总数量为所述目标图像序列中目标视频图像的数量。4.根据权利要求1至3中任意一项所述的方法,其特征在于,对于每个所述目标视频图像,所述初始区域边界包括第一方向的初始区域边界和第二方向的初始区域边界,所述第一方向和所述第二方向分别对应于所述目标视频图像的宽度方向和高度方向;所述根据所有所述目标视频图像中的各所述初始区域边界在所属的图像中的图像位置,筛选各所述初始区域边界中的有效边界,包括:根据所有所述目标视频图像中的各所述初始区域边界在所属的图像中的图像位置,确定各所述初始区域边界中对应于所述第一方向上的有效边界;根据所有所述目标视频图像中的各所述初始区域边界在所属的图像中的图像位置,确定各所述初始区域边界中对应于所述第二方向上的有效边界;对于每个所述目标视频图像,所述基于所述目标视频图像的有效边界,确定所述目标视频图像中目标区域的位置,包括:基于所述目标视频图像的第一方向上的有效边界和第二方向上的有效边界,确定所述目标视频图像中目标区域的位置。
5.根据权利要求4所述的方法,其特征在于,对于每个所述目标视频图像,所述基于所述目标视频图像的有效边界,确定所述目标视频图像中目标区域的位置,包括:对于所述目标视频图像的每个有效边界,确定该有效边界与目标边缘的第一距离,所述目标边缘为所述目标视频图像的图像边缘中与该有效边界较近的边缘;其中,所述第一方向上的有效边界对应的目标边缘为第二方向的图像边缘,所述第二方向上的有效边界对应的目标边缘为第一方向的图像边缘;基于所述第一距离大于或等于第二阈值的有效边界,确定所述目标视频图像中目标区域的位置。6.根据权利要求1至3、5中任一项所述的方法,其特征在于,对于每个所述目标视频图像,所述基于所述目标视频图像的有效边界,确定所述目标视频图像中目标区域的位置,包括:确定所述目标视频图像中各有效边界之间的第二距离;对所述第二距离小于或等于第三阈值的各有效边界进行去重处理;基于去重后的有效边界,确定所述目标视频图像中目标区域的位置。7.根据权利要求1所述的方法,其特征在于,所述确定每个所述目标视频图像中的目标区域的初始区域边界,包括:确定所述目标图像序列中包含的目标视频图像的第二数量;在所述第二数量满足第二预设条件时,确定每个所述目标视频图像中的目标区域的初始区域边界,其中,所述第二预设条件包括以下至少一项:所述第二数量大于或等于第四阈值;所述第二数量与第二总数量的第一比值大于或等于第二预设占比,其中,所述第二总数量为所述目标图像序列中所有图像的数量。8.根据权利要求1所述的方法,其特征在于,所述确定目标图像序列中的至少一个目标视频图像,包括:对于所述目标图像序列中的每个图像,通过调用训练好的图像识别模型,得到所述图像的图像识别结果,所述图像识别结果包括第一结果和第二结果,所述第一结果表征了所述图像中是否是目标视频图像,所述第二结果表征了所述图像中包含的目标区域的区域类型;根据所述目标图像序列中的每个图像的第一结果,确定所述目标图像序列中的至少一个目标视频图像;所述方法还包括:根据所述目标图像序列中的每个图像的第二结果,确定各所述目标视频图像中目标区域的区域类型;根据各所述目标视频图像中目标区域的区域类型,确定所述待处理视频中目标区域的区域类型。9.根据权利要求8所述的方法,其特征在于,所述根据各所述目标视频图像中目标区域的区域类型,确定所述待处理视频中目标区域的区域类型,包括:根据各所述目标视频图像中目标区域的区域类型,统计所述目标图像序列中对应于每种区域类型的目标视频图像的第二数量;
将最大的所述第二数量所对应的区域类型,确定为所述待处理视频中目标区域的区域类型。10.根据权利要求8或9所述的方法,其特征在于,所述图像识别模型是通过以下方式训练得到的:获取训练数据集,所述训练数据集中包含多个训练样本,每个所述训练样本包括样本图像以及所述样本图像的标注标签,所述标注标签包括第一标签和第二标签,所述第一标签用于表征所述样本图像是否是目标视频图像,所述第二标签用于表征所述样本图像中包含的目标区域的区域类型;将所述训练数据集中的每个所述样本图像输入至初始神经网络模型中,得到每个所述样本图像的图像识别结果;基于各所述样本图像的第一结果和第一标签,确定所述神经网络模型的第一损失函数的值;基于各所述样本图像的第二结果和第二标签,确定所述神经网络模型的第二损失函数的值;基于所述第一损失函数的值和所述第二损失函数的值,确定总损失值;在所述总损失值满足预设的训练结束条件情况下,结束训练,得到所述图像识别模型;在所述总损失值不满足所述预设的训练结束条件的情况下,对所述神经网络模型的模型参数进行调整,并基于所述训练数据集对调整后的模型继续进行训练。11.根据权利要求1所述的方法,其特征在于,所述待处理视频为待推荐视频集中的每个待推荐视频,所述方法还包括:将所述待推荐视频集中不存在目标视频图像的待推荐视频,确定为目标推荐视频;或者,所述待处理视频为待剪辑视频,所述方法还包括:对所述待处理视频中的每个目标视频图像进行相应的预处理,得到剪辑后的视频。12.一种视频处理装置,其特征在于,包括:图像序列获取模块,用于获取待处理视频的目标图像序列,所述目标图像序列中包含所述待处理视频中的至少一个图像;目标视频图像确定模块,用于确定目标图像序列中的至少一个目标视频图像,所述目标视频图像是指存在目标区域的图像,所述目标区域为非有效信息区域;位置确定模块,用于确定每个所述目标视频图像中的目标区域的初始区域边界;根据所有所述目标视频图像中的各所述初始区域边界在所属的图像中的图像位置,筛选各所述初始区域边界中的有效边界;对于每个所述目标视频图像,基于所述目标视频图像的有效边界,确定所述目标视频图像中目标区域的位置。13.一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现权利要求1

11中任意一项所述的方法。14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1

11中任意一项所述的方法。15.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1

11中任意一项所述的方法。

技术总结
本申请实施例提供了一种视频处理方法及装置、电子设备及计算机可读存储介质,涉及人工智能、云技术和多媒体技术领域。该方法包括:在获取待处理视频的目标图像序列之后,确定该目标图像序列中的目标视频图像,结合视频中各目标视频图像中初始区域边界之间的位置关系,对该目标视频图像中的目标区域的初始区域边界进行筛选,以滤除目标视频图像中的非有效边界,得到最终的目标视频图像的有效边界,确定目标视频图像中目标区域的位置。本申请实施例能够精确地确定目标区域视频中目标区域所在的位置,以便对存在目标区域的待处理视频做进一步处理。一步处理。一步处理。


技术研发人员:李继凡 史欣田
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:2021.10.26
技术公布日:2021/11/24
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献