一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

视频的处理方法和模型的构建方法与流程

2022-02-20 05:30:27 来源:中国专利 TAG:


1.本发明涉及视频处理技术领域,具体而言,涉及一种视频的处理方法和模型的构建方法。


背景技术:

2.高动态范围(high dynamic range,以下简称hdr)视频,相对于标准动态范围(standard dynamic range,以下简称sdr)视频,图像的明暗层次更清晰,图像细节更丰富,能够更逼真的重现真实场景。随着hdr技术的发展以及hdr显示器的逐步普及,对hdr视频的需求逐步增加。真正的hdr视频制作需要在采集端使用高动态范围的成像器件,制作时也要使用支持hdr非编软件,也就是说hdr视频的内容制作对拍摄设备和前处理技术都有很高的要求,因此目前的hdr内容仍处于相对匮乏的状态。
3.目前的hdr重建算法主要是针对单帧图片,并不适合用于生成hdr视频,因为视频中存在着更复杂的运动信息。
4.针对上述的问题,目前尚未提出有效的解决方案。


技术实现要素:

5.本发明实施例提供了一种视频的处理方法和模型的构建方法,以至少解决现有技术中重建高动态范围视频的效果不佳的技术问题。
6.根据本发明实施例的一个方面,提供了一种视频的处理方法,包括:接收客户端发送的服务调用请求,其中,所述服务调用请求中携带有满足第一预设条件的视频数据以及满足第二预设条件的视频序列;对满足第一预设条件的视频数据以及满足第二预设条件的视频序列通过机器学习训练;以及输出训练结果,其中,所述训练结果为模型参数集合。
7.进一步地,所述方法还包括:将所述模型参数集合进行打包并发送至所述客户端。
8.根据本发明实施例的一个方面,提供了一种模型的构建方法,包括:获取满足第一预设条件的视频数据;将所述视频数据中的视频序列进行对齐处理;将对齐处理后的视频序列进行处理,得到不同曝光时长下满足第二预设条件的视频序列;将所述满足第二预设条件的视频序列和所述满足第一预设条件的视频数据输入深度卷积神经网络模型进行训练,得到目标模型。
9.进一步地,在得到不同曝光时长下满足第二预设条件的视频序列之后,所述方法还包括:从所述满足第二预设条件的视频序列中进行采样,得到训练样本数据;将所述满足第二预设条件的视频序列和所述满足第一预设条件的视频数据输入深度卷积神经网络模型进行训练,得到目标模型包括:将所述训练样本数据和所述满足第一预设条件的视频数据输入深度卷积神经网络模型进行训练,得到所述目标模型。
10.进一步地,将所述训练样本数据和所述满足第一预设条件的视频数据输入深度卷积神经网络模型进行训练,得到所述目标模型包括:从所述训练样本数据中选取第一组相邻三帧图片输入所述深度卷积神经网络模型,得到中间帧的hdr图像一;将所述中间帧的
hdr图像一与对应的满足所述第一预设条件的图像一进行对比,得到误差一;从所述训练样本数据中选取第二组相邻三帧图片输入所述深度卷积神经网络模型,得到中间帧的hdr图像二,其中,所述第一组相邻三帧图片的中间帧与所述第二组相邻三帧图片的中间帧相邻;将所述中间帧的hdr图像二与对应的满足所述第一预设条件的图像二进行对比,得到误差二;基于所述误差一和所述误差二确定损失函数;将所述损失函数计算出的估计误差通过反向传播算法传回所述深度卷积神经网络模型以梯度下降算法训练模型,得到所述目标模型。
11.进一步地,所述方法还包括:对所述中间帧的hdr图像一和所述中间帧的hdr图像二加入时序一致性的约束条件。
12.进一步地,将所述视频数据集中的视频序列进行对齐处理包括:对所述视频数据中的相邻三帧图像,提取每帧图像上的特征点,其中,所述相邻三帧图像中包括:第一帧图像、第二帧图像和第三帧图像,所述第二帧图像是所述相邻三帧图像中的中间帧;基于每帧图像上的特征点确定所述第一帧图像的变换矩阵和所述第三帧图像的变换矩阵;基于所述第一帧图像的变换矩阵对所述第一帧图像进行变换,以将所述第一帧图像和第二帧图像进行对齐,基于所述第三帧图像的变换矩阵对所述第三帧图像进行变换,以将所述第三帧图像和所述第二帧图像进行对齐。
13.进一步地,从所述满足第二预设条件的视频序列中进行采样,得到训练样本数据包括:对满足所述第二预设条件的视频序列中相邻两帧图像序列之间光流大于预设光流的图像区域进行采样,得到训练样本数据。
14.进一步地,将对齐处理后的视频序列进行处理,得到不同曝光时长下满足第二预设条件的视频序列包括:利用相机响应函数以及随机生成的曝光时间,对对齐处理后的视频序列进行重曝光处理,得到不同曝光时长下的满足所述第二预设条件的视频序列。
15.进一步地,在得到不同曝光时长下的满足所述第二预设条件的视频序列之后,所述方法还包括:对所述不同曝光时长下的满足所述第二预设条件的视频序列加入噪声信号以及应用伽马颜色变化,以模拟真实的满足所述第二预设条件的视频序列。
16.进一步地,在得到目标模型之后,所述方法还包括:获取满足所述第二预设条件的视频数据,其中,所述视频数据中包括不同曝光时长的视频序列;将所述视频序列进行对齐处理;将对齐处理后的视频序列输入目标模型,得到满足所述第一预设条件的视频数据。
17.根据本发明实施例的一个方面,提供了一种计算机可读的存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述任意一项所述的方法。
18.根据本发明实施例的一个方面,提供了一种处理器,其中,所述处理器用于运行程序,其中,所述程序运行时执行上述任意一项所述的方法。
19.在本发明实施例中,通过获取满足第一预设条件的视频数据;将所述视频数据中的视频序列进行对齐处理;将对齐处理后的视频序列进行处理,得到不同曝光时长下满足第二预设条件的视频序列;将所述满足第二预设条件的视频序列和所述满足第一预设条件的视频数据输入深度卷积神经网络模型进行训练,得到目标模型,通过将对齐处理后的视频序列输入目标模型,得到满足所述第一预设条件的视频数据对能够有效避免因视频序列对齐不准导致的输出视频中的迭影现象,从而保证了重建高动态范围视频的效果,进而解
决了现有技术中重建高动态范围视频的效果不佳的技术问题。
附图说明
20.此处所说明的附图用来提供对本发明的进一步理解,构成本技术的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
21.图1是根据本发明实施例的计算机终端的硬件结构框图;
22.图2是根据本发明实施例一提供的模型的构建方法的流程图;
23.图3是根据本发明实施例一的模型的构建方法中训练模型的示意图;
24.图4是根据本发明实施例一提供的可选的模型的构建方法的流程图;
25.图5是根据本发明实施例二提供的视频的处理方法的流程图;以及
26.图6是根据本发明实施例的可选的计算机终端的结构框图。
具体实施方式
27.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当本发明保护的范围。
28.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
29.首先,在对本技术实施例进行描述的过程中出现的部分名词或术语适用于如下解释:
30.交替曝光时长视频序列或不同曝光时长的视频序列:一般拍摄的视频中不同帧的曝光时间是相同的。交替曝光时长视频序列中每一帧的曝光时间可以是不同的,比如第一帧为高曝光、第二帧为低曝光、第三帧为高曝光,以此类推。
31.高动态范围(hdr)视频重建:普通相机拍摄的视频是低动态范围(ldr)的,即在非常黑暗或明亮的视频区域中信号变化非常小,无法还原真实场景中原有的亮度信息。高动态范围视频重建是指根据一些信息(比如低动态范围的视频)重建出能够反映真实场景亮度的高动态范围视频。
32.本技术至少一个实施例中,高动态范围(hdr),指曝光动态范围达到预设阈值,从而使明暗差别达到预设阈值。相对于普通的图形,可以提供更多的动态范围和图像细节,能够更好的翻译出真实环境中的视觉效果。相反,低动态范围(ldr)视频是在非常黑暗或明亮的视频区域中信号变化非常小,无法还原真实场景中原有的亮度信息。高动态范围(hdr)视频重建是指根据一些信息(比如低动态范围的视频)重建出能够反映真实场景亮度的高动态范围视频。
33.卷积神经网络:卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习中的代表算法之一。
34.注意力模型:注意力模型在图像和自然语言处理领域有着广泛的应用。其核心思想是对输入数据的关注不是均衡的,而是有一定的权重区分的。
35.实施例1
36.根据本发明实施例,提供了一种模型的构建方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
37.本技术实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现模型的构建方法的计算机终端(或移动设备)的硬件结构框图。如图1所示,计算机终端10(或移动设备10)可以包括一个或多个(图中采用102a、102b,
……
,102n来示出)处理器102(处理器102可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置。除此以外,还可以包括:显示器、输入/输出接口(i/o接口)、通用串行总线(usb)端口(可以作为i/o接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
38.应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端10(或移动设备)中的其他元件中的任意一个内。如本技术实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
39.存储器104可用于存储应用软件的软件程序以及模块,如本发明实施例中的模型的构建方法对应的程序指令/数据存储装置,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的模型的构建方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
40.传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(network interface controller,nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(radio frequency,rf)模块,其用于通过无线方式与互联网进行通讯。
41.显示器可以例如触摸屏式的液晶显示器(lcd),该液晶显示器可使得用户能够与计算机终端10(或移动设备)的用户界面进行交互。
42.在上述运行环境下,本技术提供了如图2所示的模型的构建方法。图2是根据本发
明实施例一的模型的构建方法的流程图。
43.步骤s101,获取满足第一预设条件的视频数据。
44.满足第一预设条件的视频数据可以从历史数据中获取,上述符合第一预设条件的视频数据为高动态范围hdr的视频数据。
45.步骤s102,将视频数据中的视频序列进行对齐处理。
46.步骤s103,将对齐处理后的视频序列进行处理,得到不同曝光时长下满足第二预设条件的视频序列。
47.上述的第二预设条件的视频序列为低动态范围的视频序列。
48.步骤s104,将满足第二预设条件的视频序列和满足第一预设条件的视频数据输入深度卷积神经网络模型进行训练,得到目标模型。
49.可选的,在本技术实施例一提供的模型的构建方法中,在得到不同曝光时长下满足第二预设条件的视频序列之后,该方法还包括:从满足第二预设条件的视频序列中进行采样,得到训练样本数据;将满足第二预设条件的视频序列和满足第一预设条件的视频数据输入深度卷积神经网络模型进行训练,得到目标模型包括:将训练样本数据和满足第一预设条件的视频数据输入深度卷积神经网络模型进行训练,得到目标模型。
50.也即,从低动态范围的视频序列中进行采样,得到训练样本数据;将训练样本数据和高动态范围的视频数据集输入深度卷积神经网络模型进行训练,得到目标模型。
51.如图3所示,目标模型训练过程可以如下:构建视频图像对齐处理模块(对应图3中的对齐处理模块),随机重曝光模块,随机降质模块,随机智能采样模块,构建基于注意力机制的卷积神经网络作为hdr视频生成器。基于深度卷积神经网络,循环迭代地训练hdr生成模型(对应上述的目标模型),然后基于训练好的模型将输入的交替曝光时长视频序列重建出hdr视频。
52.首先,收集公开的已有hdr视频数据集,尽可能涵盖各种场景,也即,上述的历史数据中包括的满足第一预设条件的视频数据集。
53.可选的,在本技术实施例一提供的模型的构建方法中,将训练样本数据和满足第一预设条件的视频数据输入深度卷积神经网络模型进行训练,得到目标模型包括:从训练样本数据中选取第一组相邻三帧图片输入深度卷积神经网络模型,得到中间帧的hdr图像一;将中间帧的hdr图像一与对应的满足第一预设条件的图像一进行对比,得到误差一;从训练样本数据中选取第二组相邻三帧图片输入深度卷积神经网络模型,得到中间帧的hdr图像二,其中,第一组相邻三帧图片的中间帧与第二组相邻三帧图片的中间帧相邻;将中间帧的hdr图像二与对应的满足第一预设条件的图像二进行对比,得到误差二;基于误差一和误差二确定损失函数;将损失函数计算出的估计误差通过反向传播算法传回深度卷积神经网络模型以梯度下降算法训练模型,得到目标模型,其中,对中间帧的hdr图像一和中间帧的hdr图像二加入时序一致性的约束条件。
54.也即,从训练样本数据中选取第一组相邻三帧图片输入深度卷积神经网络模型,得到中间帧的hdr图像一;将中间帧的hdr图像一与对应的高动态范围的图像一进行对比,得到误差一;从训练样本数据中选取第二组相邻三帧图片输入深度卷积神经网络模型,得到中间帧的hdr图像二,其中,第一组相邻三帧图片的中间帧与第二组相邻三帧图片的中间帧相邻;将中间帧的hdr图像二与对应的高动态范围的图像二进行对比,得到误差二;基于
误差一和误差二确定损失函数;将损失函数计算出的估计误差通过反向传播算法传回深度卷积神经网络模型以梯度下降算法训练模型,得到目标模型。
55.具体地,图3中的生成器的输入是相邻三帧ldr图片,输出是中间帧的hdr图像。生成器是基于卷积神经网络的模型,包含了特征提取网络,基于注意力机制的融合模块和重建网络三个部分。对于每一次训练迭代,先利用特征提取网络分别对三帧输入图片进行特征提取,然后利用基于注意力机制的融合模块得到融合之后的特征,最后利用重建网络将融合之后的特征估计出中间帧的hdr图像h1,并和真实hdr图像计算重建误差。再取三帧图片(其中间帧和上一个输入的中间帧相邻)输入到生成器得到中间帧的hdr图像h2,并计算重建误差。同时h1和h2加入时序一致性约束l
consistent
;基于上述方法,得到hdr生成模型的损失函数为l
hdr
=αl
rec1
βl
rec2
γl
consistent
,其中α、β、γ分别代表对应损失的权重。将误差通过反向传播算法传回生成模型,以梯度下降算法训练模型,收敛后得到一个性能良好的hdr生成模型。
56.根据以上步骤训练得到hdr视频生成模型后,只需将交替曝光时长视频序列进行对齐处理后输入该模型,进行重建,便可生成高质量的hdr视频。
57.也即,本技术方案使用真实hdr视频数据加上随机重曝光模块,随机降质模块,与智能筛选模块生成训练数据,能够有效地模拟真实场景下拍摄的交替曝光时长的视频序列。基于注意力模型的生成模型能够更好地减少因对齐不准导致的输出视频中的迭影现象。加入的相邻帧时序一致性约束能够使输出的视频更加稳定,有效减少闪烁效果。
58.可选的,在本技术实施例一提供的模型的构建方法中,将视频数据集中的视频序列进行对齐处理包括:对视频数据中的相邻三帧图像,提取每帧图像上的特征点,其中,相邻三帧图像中包括:第一帧图像、第二帧图像和第三帧图像,第二帧图像是相邻三帧图像中的中间帧;基于每帧图像上的特征点确定第一帧图像的变换矩阵和第三帧图像的变换矩阵;基于第一帧图像的变换矩阵对第一帧图像进行变换,以将第一帧图像和第二帧图像进行对齐,基于第三帧图像的变换矩阵对第三帧图像进行变换,以将第三帧图像和第二帧图像进行对齐。也即,对于相邻三帧图像,先提取特征点接着配准并计算变换矩阵,将左右两帧对齐到中间帧。
59.上述整个过程通过图3中的对齐处理模块即可完成,也即,将视频数据集输入全局对比模块,通过对齐处理模块对视频数据集中的视频序列进行对齐处理。
60.将上述得到的低动态范围图像经过随机智能采样模块,从整张图片中采样出小图像块作为每次生成器训练的输入。例如,采样的筛选标准是选择运动信息较大的区域。可选的,在本技术实施例一提供的模型的构建方法中,从满足第二预设条件的视频序列中进行采样,得到训练样本数据包括:对满足第二预设条件的视频序列中相邻两帧图像序列之间光流大于预设光流的图像区域进行采样,得到训练样本数据。
61.也即,对低动态范围的视频序列中相邻两帧图像序列之间光流大于预设光流的图像区域进行采样,得到训练样本数据。需要说明的是,训练模型时图像块采样大小有多种选择,若不考虑训练时间成本和资源消耗,可使用更大的图像块甚至整张高质量的图作为训练输入。
62.将对齐处理后的视频数据经过随机重曝光模块得到不同曝光下的低动态范围图像。可选的,在本技术实施例一提供的模型的构建方法中,将对齐处理后的视频序列进行处
理,得到不同曝光时长下满足第二预设条件的视频序列包括:利用相机响应函数以及随机生成的曝光时间,对对齐处理后的视频序列进行重曝光处理,得到不同曝光时长下的满足第二预设条件的视频序列。
63.随机降质模块随机对低动态范围图像加入噪声,伽马颜色变化来模拟真实数据。可选的,在本技术实施例一提供的模型的构建方法中,在得到不同曝光时长下的满足第二预设条件的视频序列之后,该方法还包括:对不同曝光时长下的满足第二预设条件的视频序列加入噪声信号以及应用伽马颜色变化,以模拟真实的满足第二预设条件的视频序列。
64.可选的,在本技术实施例一提供的模型的构建方法中,在得到目标模型之后,该方法还包括:获取满足第二预设条件的视频数据,其中,视频数据中包括不同曝光时长的视频序列;将视频序列进行对齐处理;将对齐处理后的视频序列输入目标模型,得到满足第一预设条件的视频数据。
65.如图4所示,在训练得到hdr视频生成模型之后,将真实的交替曝光时长视频序列通过对齐处理模块进行对齐处理后,输入至hdr视频生成模型(对应上述的目标模型)中输出得到高质量的hdr视频数据。
66.综上,在本技术实施例一提供的模型的构建方法中,通过获取满足第一预设条件的视频数据;将视频数据中的视频序列进行对齐处理;将对齐处理后的视频序列进行处理,得到不同曝光时长下满足第二预设条件的视频序列;将满足第二预设条件的视频序列和满足第一预设条件的视频数据输入深度卷积神经网络模型进行训练,得到目标模型,通过将对齐处理后的视频序列输入目标模型,得到满足第一预设条件的视频数据对能够有效避免因视频序列对齐不准导致的输出视频中的迭影现象,从而保证了重建高动态范围视频的效果,进而解决了现有技术中重建高动态范围视频的效果不佳的技术问题。
67.需要说明的是,本技术实施例一提供的模型的构建方法可适用于对旧视频数据,老电影等进行翻新,得到高动态范围的视频。本技术实施例一提供的模型的构建方法还可以应用于监控领域,例如,若监控到的视频清晰度较低,难以准确获取到监控视频中的信息,可以将监控视频输入至上述的目标模型,对其进行处理,以得到符合条件的视频数据,以便准确获取监控视频中的信息。
68.另外,本领域技术人员还可以对上述实施例一提供的模型的构建方法基于实际应用进行调整,例如,若需要对高动态范围视频转化为低动态范围视频,可以对上述的目标模型的参数进行调整,对输入的高动态范围视频进行模糊化处理,输出低动态范围视频。也即,对上述的目标模型进行反向使用。无论正向使用还是反向使用,在本技术的核心技术构思内,都属于本技术保护的应用场景。
69.需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
70.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的视频的处理方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者
说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
71.实施例2
72.本技术提供了如图5所示的视频的处理方法。图5是根据本发明实施例二的视频的处理方法的流程图。
73.步骤s501,接收客户端发送的服务调用请求,其中,所述服务调用请求中携带有满足第一预设条件的视频数据以及满足第二预设条件的视频序列。
74.步骤s502,对满足第一预设条件的视频数据以及满足第二预设条件的视频序列通过机器学习训练。
75.上述的第二预设条件的视频序列为低动态范围的视频序列。
76.步骤s503,输出训练结果,其中,所述训练结果为模型参数集合。
77.可选地,该方法还包括:将模型参数集合进行打包并发送至客户端。该模型参数集合中的参数用于确定目标模型。
78.在得到目标模型之后,所述方法还包括:获取满足所述第二预设条件的视频数据,其中,所述视频数据中包括不同曝光时长的视频序列;将所述视频序列进行对齐处理;将对齐处理后的视频序列输入目标模型,得到满足所述第一预设条件的视频数据。
79.也即,在训练得到hdr视频生成模型之后,将真实的交替曝光时长视频序列通过对齐处理模块进行对齐处理后,输入至hdr视频生成模型(对应上述的目标模型)中输出得到高质量的hdr视频数据。
80.需要说明的是,在该客户端上还可以对模型参数集合进行显示。
81.需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
82.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的视频的处理方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
83.实施例3
84.本发明的实施例可以提供一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。
85.可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。
86.在本实施例中,上述计算机终端可以执行应用程序的模型的构建方法中以下步骤
的程序代码:获取满足第一预设条件的视频数据;将所述视频数据中的视频序列进行对齐处理;将对齐处理后的视频序列进行处理,得到不同曝光时长下满足第二预设条件的视频序列;将所述满足第二预设条件的视频序列和所述满足第一预设条件的视频数据输入深度卷积神经网络模型进行训练,得到目标模型。
87.上述计算机终端还可以执行应用程序的模型的构建方法中以下步骤的程序代码:在得到不同曝光时长下满足第二预设条件的视频序列之后,所述方法还包括:从所述满足第二预设条件的视频序列中进行采样,得到训练样本数据;将所述满足第二预设条件的视频序列和所述满足第一预设条件的视频数据输入深度卷积神经网络模型进行训练,得到目标模型包括:将所述训练样本数据和所述满足第一预设条件的视频数据输入深度卷积神经网络模型进行训练,得到所述目标模型。
88.上述计算机终端还可以执行应用程序的模型的构建方法中以下步骤的程序代码:将所述训练样本数据和所述满足第一预设条件的视频数据输入深度卷积神经网络模型进行训练,得到所述目标模型包括:从所述训练样本数据中选取第一组相邻三帧图片输入所述深度卷积神经网络模型,得到中间帧的hdr图像一;将所述中间帧的hdr图像一与对应的满足所述第一预设条件的图像一进行对比,得到误差一;从所述训练样本数据中选取第二组相邻三帧图片输入所述深度卷积神经网络模型,得到中间帧的hdr图像二,其中,所述第一组相邻三帧图片的中间帧与所述第二组相邻三帧图片的中间帧相邻;将所述中间帧的hdr图像二与对应的满足所述第一预设条件的图像二进行对比,得到误差二;基于所述误差一和所述误差二确定损失函数;将所述损失函数计算出的估计误差通过反向传播算法传回所述深度卷积神经网络模型以梯度下降算法训练模型,得到所述目标模型。
89.上述计算机终端还可以执行应用程序的模型的构建方法中以下步骤的程序代码:所述方法还包括:对所述中间帧的hdr图像一和所述中间帧的hdr图像二加入时序一致性的约束条件。
90.上述计算机终端还可以执行应用程序的模型的构建方法中以下步骤的程序代码:将所述视频数据集中的视频序列进行对齐处理包括:对所述视频数据中的相邻三帧图像,提取每帧图像上的特征点,其中,所述相邻三帧图像中包括:第一帧图像、第二帧图像和第三帧图像,所述第二帧图像是所述相邻三帧图像中的中间帧;基于每帧图像上的特征点确定所述第一帧图像的变换矩阵和所述第三帧图像的变换矩阵;基于所述第一帧图像的变换矩阵对所述第一帧图像进行变换,以将所述第一帧图像和第二帧图像进行对齐,基于所述第三帧图像的变换矩阵对所述第三帧图像进行变换,以将所述第三帧图像和所述第二帧图像进行对齐。
91.上述计算机终端还可以执行应用程序的模型的构建方法中以下步骤的程序代码:从所述满足第二预设条件的视频序列中进行采样,得到训练样本数据包括:对满足所述第二预设条件的视频序列中相邻两帧图像序列之间光流大于预设光流的图像区域进行采样,得到训练样本数据。
92.上述计算机终端还可以执行应用程序的模型的构建方法中以下步骤的程序代码:将对齐处理后的视频序列进行处理,得到不同曝光时长下满足第二预设条件的视频序列包括:利用相机响应函数以及随机生成的曝光时间,对对齐处理后的视频序列进行重曝光处理,得到不同曝光时长下的满足所述第二预设条件的视频序列。
93.上述计算机终端还可以执行应用程序的模型的构建方法中以下步骤的程序代码:在得到不同曝光时长下的满足所述第二预设条件的视频序列之后,所述方法还包括:对所述不同曝光时长下的满足所述第二预设条件的视频序列加入噪声信号以及应用伽马颜色变化,以模拟真实的满足所述第二预设条件的视频序列。
94.上述计算机终端还可以执行应用程序的模型的构建方法中以下步骤的程序代码:在得到目标模型之后,所述方法还包括:获取满足所述第二预设条件的视频数据,其中,所述视频数据中包括不同曝光时长的视频序列;将所述视频序列进行对齐处理;将对齐处理后的视频序列输入目标模型,得到满足所述第一预设条件的视频数据。
95.可选地,图6是根据本发明实施例的一种计算机终端的结构框图。如图6所示,该计算机终端10可以包括:一个或多个(图6中仅示出一个)处理器以及存储器。
96.其中,存储器可用于存储软件程序以及模块,如本发明实施例中的模型的构建方法对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的模型的构建方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
97.处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取满足第一预设条件的视频数据;将所述视频数据中的视频序列进行对齐处理;将对齐处理后的视频序列进行处理,得到不同曝光时长下满足第二预设条件的视频序列;将所述满足第二预设条件的视频序列和所述满足第一预设条件的视频数据输入深度卷积神经网络模型进行训练,得到目标模型。
98.可选的,处理器还可以通过传输装置调用存储器存储的信息及应用程序,执行下述步骤:在得到不同曝光时长下满足第二预设条件的视频序列之后,所述方法还包括:从所述满足第二预设条件的视频序列中进行采样,得到训练样本数据;将所述满足第二预设条件的视频序列和所述满足第一预设条件的视频数据输入深度卷积神经网络模型进行训练,得到目标模型包括:将所述训练样本数据和所述满足第一预设条件的视频数据输入深度卷积神经网络模型进行训练,得到所述目标模型。
99.可选的,处理器还可以通过传输装置调用存储器存储的信息及应用程序,执行下述步骤:将所述训练样本数据和所述满足第一预设条件的视频数据输入深度卷积神经网络模型进行训练,得到所述目标模型包括:从所述训练样本数据中选取第一组相邻三帧图片输入所述深度卷积神经网络模型,得到中间帧的hdr图像一;将所述中间帧的hdr图像一与对应的满足所述第一预设条件的图像一进行对比,得到误差一;从所述训练样本数据中选取第二组相邻三帧图片输入所述深度卷积神经网络模型,得到中间帧的hdr图像二,其中,所述第一组相邻三帧图片的中间帧与所述第二组相邻三帧图片的中间帧相邻;将所述中间帧的hdr图像二与对应的满足所述第一预设条件的图像二进行对比,得到误差二;基于所述误差一和所述误差二确定损失函数;将所述损失函数计算出的估计误差通过反向传播算法传回所述深度卷积神经网络模型以梯度下降算法训练模型,得到所述目标模型。
100.可选的,处理器还可以通过传输装置调用存储器存储的信息及应用程序,执行下
述步骤:所述方法还包括:对所述中间帧的hdr图像一和所述中间帧的hdr图像二加入时序一致性的约束条件。
101.可选的,处理器还可以通过传输装置调用存储器存储的信息及应用程序,执行下述步骤:将所述视频数据集中的视频序列进行对齐处理包括:对所述视频数据中的相邻三帧图像,提取每帧图像上的特征点,其中,所述相邻三帧图像中包括:第一帧图像、第二帧图像和第三帧图像,所述第二帧图像是所述相邻三帧图像中的中间帧;基于每帧图像上的特征点确定所述第一帧图像的变换矩阵和所述第三帧图像的变换矩阵;基于所述第一帧图像的变换矩阵对所述第一帧图像进行变换,以将所述第一帧图像和第二帧图像进行对齐,基于所述第三帧图像的变换矩阵对所述第三帧图像进行变换,以将所述第三帧图像和所述第二帧图像进行对齐。
102.可选的,处理器还可以通过传输装置调用存储器存储的信息及应用程序,执行下述步骤:从所述满足第二预设条件的视频序列中进行采样,得到训练样本数据包括:对满足所述第二预设条件的视频序列中相邻两帧图像序列之间光流大于预设光流的图像区域进行采样,得到训练样本数据。
103.可选的,处理器还可以通过传输装置调用存储器存储的信息及应用程序,执行下述步骤:将对齐处理后的视频序列进行处理,得到不同曝光时长下满足第二预设条件的视频序列包括:利用相机响应函数以及随机生成的曝光时间,对对齐处理后的视频序列进行重曝光处理,得到不同曝光时长下的满足所述第二预设条件的视频序列。
104.可选的,处理器还可以通过传输装置调用存储器存储的信息及应用程序,执行下述步骤:在得到不同曝光时长下的满足所述第二预设条件的视频序列之后,所述方法还包括:对所述不同曝光时长下的满足所述第二预设条件的视频序列加入噪声信号以及应用伽马颜色变化,以模拟真实的满足所述第二预设条件的视频序列。
105.可选的,处理器还可以通过传输装置调用存储器存储的信息及应用程序,执行下述步骤:在得到目标模型之后,所述方法还包括:获取满足所述第二预设条件的视频数据,其中,所述视频数据中包括不同曝光时长的视频序列;将所述视频序列进行对齐处理;将对齐处理后的视频序列输入目标模型,得到满足所述第一预设条件的视频数据。
106.采用本发明实施例,提供了一种模型的构建方法。通过获取满足第一预设条件的视频数据;将所述视频数据中的视频序列进行对齐处理;将对齐处理后的视频序列进行处理,得到不同曝光时长下满足第二预设条件的视频序列;将所述满足第二预设条件的视频序列和所述满足第一预设条件的视频数据输入深度卷积神经网络模型进行训练,得到目标模型,通过将对齐处理后的视频序列输入目标模型,得到满足所述第一预设条件的视频数据对能够有效避免因视频序列对齐不准导致的输出视频中的迭影现象,从而保证了重建高动态范围视频的效果,进而解决了现有技术中重建高动态范围视频的效果不佳的技术问题。
107.本领域普通技术人员可以理解,图6所示的结构仅为示意,计算机终端也可以是智能手机(如android手机、ios手机等)、平板电脑、掌声电脑以及移动互联网设备(mobile internet devices,mid)、pad等终端设备。图6其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图6中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图6所示不同的配置。
108.本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(read-only memory,rom)、随机存取器(random access memory,ram)、磁盘或光盘等。
109.实施例4
110.本发明的实施例还提供了一种计算机可读的存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例一所提供的模型的构建方法所执行的程序代码。
111.可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
112.可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取满足第一预设条件的视频数据;将所述视频数据中的视频序列进行对齐处理;将对齐处理后的视频序列进行处理,得到不同曝光时长下满足第二预设条件的视频序列;将所述满足第二预设条件的视频序列和所述满足第一预设条件的视频数据输入深度卷积神经网络模型进行训练,得到目标模型。
113.存储介质还被设置为存储用于执行以下步骤的程序代码:在得到不同曝光时长下满足第二预设条件的视频序列之后,所述方法还包括:从所述满足第二预设条件的视频序列中进行采样,得到训练样本数据;将所述满足第二预设条件的视频序列和所述满足第一预设条件的视频数据输入深度卷积神经网络模型进行训练,得到目标模型包括:将所述训练样本数据和所述满足第一预设条件的视频数据输入深度卷积神经网络模型进行训练,得到所述目标模型。
114.存储介质还被设置为存储用于执行以下步骤的程序代码:将所述训练样本数据和所述满足第一预设条件的视频数据输入深度卷积神经网络模型进行训练,得到所述目标模型包括:从所述训练样本数据中选取第一组相邻三帧图片输入所述深度卷积神经网络模型,得到中间帧的hdr图像一;将所述中间帧的hdr图像一与对应的满足所述第一预设条件的图像一进行对比,得到误差一;从所述训练样本数据中选取第二组相邻三帧图片输入所述深度卷积神经网络模型,得到中间帧的hdr图像二,其中,所述第一组相邻三帧图片的中间帧与所述第二组相邻三帧图片的中间帧相邻;将所述中间帧的hdr图像二与对应的满足所述第一预设条件的图像二进行对比,得到误差二;基于所述误差一和所述误差二确定损失函数;将所述损失函数计算出的估计误差通过反向传播算法传回所述深度卷积神经网络模型以梯度下降算法训练模型,得到所述目标模型。
115.存储介质还被设置为存储用于执行以下步骤的程序代码:所述方法还包括:对所述中间帧的hdr图像一和所述中间帧的hdr图像二加入时序一致性的约束条件。
116.存储介质还被设置为存储用于执行以下步骤的程序代码:将所述视频数据集中的视频序列进行对齐处理包括:对所述视频数据中的相邻三帧图像,提取每帧图像上的特征点,其中,所述相邻三帧图像中包括:第一帧图像、第二帧图像和第三帧图像,所述第二帧图像是所述相邻三帧图像中的中间帧;基于每帧图像上的特征点确定所述第一帧图像的变换矩阵和所述第三帧图像的变换矩阵;基于所述第一帧图像的变换矩阵对所述第一帧图像进行变换,以将所述第一帧图像和第二帧图像进行对齐,基于所述第三帧图像的变换矩阵对所述第三帧图像进行变换,以将所述第三帧图像和所述第二帧图像进行对齐。
117.存储介质还被设置为存储用于执行以下步骤的程序代码:从所述满足第二预设条件的视频序列中进行采样,得到训练样本数据包括:对满足所述第二预设条件的视频序列中相邻两帧图像序列之间光流大于预设光流的图像区域进行采样,得到训练样本数据。
118.存储介质还被设置为存储用于执行以下步骤的程序代码:将对齐处理后的视频序列进行处理,得到不同曝光时长下满足第二预设条件的视频序列包括:利用相机响应函数以及随机生成的曝光时间,对对齐处理后的视频序列进行重曝光处理,得到不同曝光时长下的满足所述第二预设条件的视频序列。
119.存储介质还被设置为存储用于执行以下步骤的程序代码:在得到不同曝光时长下的满足所述第二预设条件的视频序列之后,所述方法还包括:对所述不同曝光时长下的满足所述第二预设条件的视频序列加入噪声信号以及应用伽马颜色变化,以模拟真实的满足所述第二预设条件的视频序列。
120.存储介质还被设置为存储用于执行以下步骤的程序代码:在得到目标模型之后,所述方法还包括:获取满足所述第二预设条件的视频数据,其中,所述视频数据中包括不同曝光时长的视频序列;将所述视频序列进行对齐处理;将对齐处理后的视频序列输入目标模型,得到满足所述第一预设条件的视频数据。
121.上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
122.在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
123.在本技术所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
124.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
125.另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
126.所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
127.以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献