一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种视频处理方法及装置与流程

2023-02-02 08:26:50 来源:中国专利 TAG:

技术特征:
1.一种视频处理方法,其特征在于,所述方法包括:获取待处理视频,以及,对所述待处理视频进行编码压缩处理,得到所述待处理视频的信息编码特征;对所述信息编码特征进行信息融合处理,得到多空间视野特征图和多时间视野特征图;根据所述多空间视野特征图和所述多时间视野特征图,确定时空互适应特征图;对所述时空互适应特征图进行预设类型视频处理,得到所述待处理视频对应的预设类型处理结果。2.根据权利要求1所述的方法,其特征在于,所述方法应用于双阶时空变换模型,所述双阶时空变换模型包括初阶时空变化子模型;所述对所述待处理视频进行编码压缩处理,得到所述待处理视频的信息编码特征,包括:将所述待处理视频输入所述初阶时空变化子模型,得到所述待处理视频的信息编码特征;其中,所述初阶时空变化子模型包括若干初阶时空变换模块,每个初阶时空变换模块包括空间卷积层、第一残差卷积层、第二残差卷积层和第三残差卷积层。3.根据权利要求1所述的方法,其特征在于,所述方法应用于双阶时空变换模型,所述双阶时空变换模型包括进阶时空变换模型,所述进阶时空变换模型包括深度时空互适应子模型,所述深度时空互适应子模型均包括:空间维度融合模块、时间维度融合模块和时空融合模块;所述对所述信息编码特征进行信息融合处理,得到多空间视野特征图和多时间视野特征图,包括:将所述信息编码特征输入所述空间维度融合模块,利用所述空间维度融合模块对所述信息编码特征进行空间维度信息融合处理,得到多空间视野特征图;将所述信息编码特征输入所述时间维度融合模块,利用所述时间维度融合模块对所述信息编码特征进行时间维度信息融合处理,得到多时间视野特征图;所述根据所述多空间视野特征图和所述多时间视野特征图,确定时空互适应特征图,包括:将所述多空间视野特征图和所述多时间视野特征图输入所述时空融合模块,得到所述时空互适应特征图。4.根据权利要求3所述的方法,其特征在于,所述空间维度融合模块包括:多个空间视野分支、时间卷积层、激活函数层;所述将所述信息编码特征输入所述空间维度融合模块,利用所述空间维度融合模块对所述信息编码特征进行空间维度信息融合处理,得到多空间视野特征图,包括:将所述信息编码特征分别输入所述多个空间视野分支,得到多个空间视野特征图;将所述多个空间视野特征图沿着通道数进行堆叠,得到多视野融合特征图;将所述多视野融合特征图输入所述时间卷积层,得到时间维度特征图;将所述时间维度特征图输入所述激活函数层,所述激活函数层沿着通道数维度对所述时间维度特征图进行激活函数计算,得到多个特征图权重值;根据所述多个空间视野特征图和所述多个特征图权重值,得到多空间视野特征图。
5.根据权利要求3所述的方法,其特征在于,所述时间维度融合模块包括:多个时间视野分支、空间卷积层、激活函数层;所述将所述信息编码特征输入所述时间维度融合模块,利用所述时间维度融合模块对所述信息编码特征进行时间维度信息融合处理,得到多时间视野特征图,包括:将所述信息编码特征分别输入所述多个时间视野分支,得到多个时间视野特征图;将所述多个时间视野特征图沿着通道数进行堆叠,得到多视野融合特征图;将所述多视野融合特征图输入所述空间卷积层,得到空间维度特征图;将所述空间维度特征图输入所述激活函数层,所述激活函数层沿着通道数维度对所述空间维度特征图进行激活函数计算,得到多个特征图权重值;根据所述多个时间视野特征图和所述多个特征图权重值,得到多时间视野特征图。6.根据权利要求3所述的方法,其特征在于,所述时空融合模块包括:空间卷积层、时间卷积层;所述将所述多空间视野特征图和所述多时间视野特征图输入所述时空融合模块,得到所述时空互适应特征图,包括:将所述多空间视野特征图和所述多时间视野特征图沿着通道数进行堆叠,得到多视野融合特征图;将所述多视野融合特征图输入所述空间卷积层,得到空间特征图;将所述空间特征图输入所述时间卷积层,得到所述时空互适应特征图。7.根据权利要求1-6中任一所述的方法,其特征在于,预设类型视频处理包括以下至少一个:视频内容检测、视频内容识别、动作识别。8.一种视频处理方法,其特征在于,所述方法包括:特征提取单元,用于获取待处理视频,以及,对所述待处理视频进行编码压缩处理,得到所述待处理视频的信息编码特征;信息融合单元,用于对所述信息编码特征进行信息融合处理,得到多空间视野特征图和多时间视野特征图;特征确定单元,用于根据所述多空间视野特征图和所述多时间视野特征图,确定时空互适应特征图;结果确定单元,用于对所述时空互适应特征图进行预设类型视频处理,得到所述待处理视频对应的预设类型处理结果。9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并且可以在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述方法的步骤。10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述方法的步骤。

技术总结
本公开提供了一种视频处理方法、装置。该方法在获取待处理视频后,可以先对所述待处理视频进行编码压缩处理,得到所述待处理视频的信息编码特征;然后,可以对所述信息编码特征进行信息融合处理,得到多空间视野特征图和多时间视野特征图;接着,可以根据所述多空间视野特征图和所述多时间视野特征图,确定时空互适应特征图;最后,可以对所述时空互适应特征图进行预设类型视频处理,得到所述待处理视频对应的预设类型处理结果。这样,在视频处理过程中实现了多视野、多跨度且时空信息互适应融合的信息充分挖掘,从而提高视频处理结果的精确度,进而本申请所提供的方法不仅提高了视频处理的处理速度、处理效率,还提高了视频处理结果的精确度。结果的精确度。结果的精确度。


技术研发人员:请求不公布姓名
受保护的技术使用者:深圳须弥云图空间科技有限公司
技术研发日:2022.10.20
技术公布日:2023/1/31
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献