RAW域视频去噪方法、装置、电子设备及存储介质

2023-08-25 21:12:02 来源：中国专利 TAG：

raw域视频去噪方法、装置、电子设备及存储介质
技术领域
1.本发明实施例涉及图像处理技术领域，具体涉及一种raw域视频去噪方法、装置、电子设备及存储介质。

背景技术：

2.人类对客观世界的认识绝大部分是通过视觉系统获取的信息。视觉信息在人类感知和认识世界的过程中起到了极其重要的作用，但是在视频信号中往往掺杂着各种噪声，以至于视频变得模糊、质量下降，从而导致视频中的一些重要细节信息丢失。在对视频图像进行处理或者应用时，如何保留视频图像中的有用信息，去除噪声，是一个热点也是一个难点。
3.raw 图像是图像感应器将捕捉到的光源信号转化为数字信号的原始数据，是无损的，包含了物体原始的颜色信息。raw 数据格式一般采用的是bayer（拜耳）排列方式，鉴于人眼对绿色波段的色彩比较敏感，bayer数据格式中包含了50%的绿色信息，以及25%的红色和25%的蓝色信息。
4.在raw域上去噪有助于改善后续的isp（image signal processing，图像信号处理）处理，还原更真实的色彩。因此，如何提高raw域视频的去噪质量成为亟待解决的问题。

技术实现要素：

5.针对现有技术存在的缺陷，本发明实施例提供一种raw域视频去噪方法、装置、电子设备及存储介质。
6.本发明实施例提供一种raw域视频去噪方法，包括：按序获取raw域视频中当前待去噪的视频帧；其中，所述raw域视频中的视频帧按照预设裁剪规则裁剪为多个图像块，空间位置上相对应的所述图像块按时序构成第一图像块序列；根据所述当前待去噪的视频帧的图像块和对应所述第一图像块序列中相邻预设个数的图像块构建第二图像块序列；根据所述当前待去噪的视频帧中的图像块是否为暗部区域，将所述图像块所在的所述第二图像块序列进行对应处理后，利用对应的去噪网络得到所述图像块的去噪结果；将所述当前待去噪的视频帧中的各个图像块的去噪结果进行整合，得到所述当前待去噪的视频帧的去噪结果。
7.根据本发明实施例提供的一种raw域视频去噪方法，所述根据所述当前待去噪的视频帧中的图像块是否为暗部区域，将所述图像块所在的所述第二图像块序列进行对应处理后，利用对应的去噪网络得到所述图像块的去噪结果，包括：响应于所述当前待去噪的视频帧中的图像块为暗部区域，将所述图像块所在的所述第二图像块序列进行vst变换及通道拆分，得到对应各个通道的第三图像块序列；将各个通道的所述第三图像块序列分别输入vst域去噪网络，得到所述当前待去噪的视频帧中的图像块的各通道去噪结果；将所述当前待去噪的视频帧中的图像块的各通道去噪结果进行vst拟变换及通道整合，得到所述图像块的去噪结果。
8.根据本发明实施例提供的一种raw域视频去噪方法，所述根据所述当前待去噪的视频帧中的图像块是否为暗部区域，将所述图像块所在的所述第二图像块序列进行对应处理后，利用对应的去噪网络得到所述图像块的去噪结果，包括：响应于所述当前待去噪的视频帧中的图像块为非暗部区域，将所述图像块所在的所述第二图像块序列进行通道拆分，得到对应各个通道的第四图像块序列；将各个通道的所述第四图像块序列分别输入像素域去噪网络，得到所述当前待去噪的视频帧中的图像块的各通道去噪结果；将所述当前待去噪的视频帧中的图像块的各通道去噪结果进行通道整合，得到所述图像块的去噪结果。
9.根据本发明实施例提供的一种raw域视频去噪方法，在所述按序获取raw域视频中当前待去噪的视频帧之前，所述方法还包括：合成噪声信号满足高斯-泊松分布的raw域样本视频；将所述raw域样本视频中的视频帧裁剪为多个图像块，空间位置上相对应的所述图像块按时序构成第五图像块序列；根据所述raw域样本视频中的待去噪视频帧的图像块和对应所述第五图像块序列中相邻所述预设个数的图像块构建第六图像块序列；对所述第六图像块序列进行vst变换及通道拆分，得到对应各个通道的第七图像块序列；将各个通道的所述第七图像块序列分别输入视频去噪网络模型，得到所述待去噪视频帧的图像块的各通道去噪结果；将所述待去噪视频帧的图像块的各通道去噪结果进行vst拟变换及通道整合，得到所述待去噪视频帧的图像块的去噪结果；将所述待去噪视频帧的图像块的去噪结果进行整合，得到所述待去噪视频帧的去噪结果的预测值；利用所述待去噪视频帧的去噪结果的所述预测值和真值计算损失函数，训练所述视频去噪网络模型，训练结束得到所述vst域去噪网络。
10.根据本发明实施例提供的一种raw域视频去噪方法，在所述按序获取raw域视频中当前待去噪的视频帧之前，所述方法还包括：合成噪声信号满足高斯-泊松分布的raw域样本视频；将所述raw域样本视频中的视频帧裁剪为多个图像块，空间位置上相对应的所述图像块按时序构成第八图像块序列；根据所述raw域样本视频中的待去噪视频帧的图像块和对应所述第八图像块序列中相邻所述预设个数的图像块构建第九图像块序列；对所述第九图像块序列进行通道拆分，得到对应各个通道的第十图像块序列；将各个通道的所述第十图像块序列分别输入视频去噪网络模型，得到所述待去噪视频帧的图像块的各通道去噪结果；将所述待去噪视频帧的图像块的各通道去噪结果进行通道整合，得到所述待去噪视频帧的图像块的去噪结果；将所述待去噪视频帧的图像块的去噪结果进行整合，得到所述待去噪视频帧的去噪结果的预测值；利用所述待去噪视频帧的去噪结果的所述预测值和真值计算损失函数，训练所述视频去噪网络模型，训练结束得到所述像素域去噪网络。
11.根据本发明实施例提供的一种raw域视频去噪方法，所述方法还包括：将所述当前待去噪的视频帧中的图像块的像素值进行归一化处理，得到归一化像素值；根据所述归一化像素值计算均值及方差；响应于所述均值小于预设均值且所述方差小于预设方差，则确定所述图像块为暗部区域；否则，确定所述图像块为非暗部区域。
12.根据本发明实施例提供的一种raw域视频去噪方法，所述预设裁剪规则包括：按照预设方向的预设移动步长将所述视频帧裁剪为多个图像块；其中，所述预设移动步长小于或等于移动方向上所述图像块的尺寸。
13.根据本发明实施例提供的一种raw域视频去噪方法，所述将所述当前待去噪的视频帧中的各个图像块的去噪结果进行整合，得到所述当前待去噪的视频帧的去噪结果，包
括：响应于至少两个图像块包含重叠像素点，则通过计算所述至少两个图像块关于所述重叠像素点的去噪结果的加权和得到所述重叠像素点的像素值。
14.本发明实施例还提供一种raw域视频去噪装置，包括：获取模块，用于：按序获取raw域视频中当前待去噪的视频帧；其中，所述raw域视频中的视频帧按照预设裁剪规则裁剪为多个图像块，空间位置上相对应的所述图像块按时序构成第一图像块序列；构建模块，用于：根据所述当前待去噪的视频帧的图像块和对应所述第一图像块序列中相邻预设个数的图像块构建第二图像块序列；去噪模块，用于：根据所述当前待去噪的视频帧中的图像块是否为暗部区域，将所述图像块所在的所述第二图像块序列进行对应处理后，利用对应的去噪网络得到所述图像块的去噪结果；整合模块，用于：将所述当前待去噪的视频帧中的各个图像块的去噪结果进行整合，得到所述当前待去噪的视频帧的去噪结果。
15.本发明实施例还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述raw域视频去噪方法的步骤。
16.本发明实施例还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述raw域视频去噪方法的步骤。
17.本发明实施例还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述raw域视频去噪方法的步骤。
18.本发明实施例提供的raw域视频去噪方法、装置、电子设备及存储介质，通过按序获取raw域视频中当前待去噪的视频帧，根据当前待去噪的视频帧的图像块和对应第一图像块序列中相邻预设个数的图像块构建第二图像块序列，根据当前待去噪的视频帧中的图像块是否为暗部区域，将图像块所在的第二图像块序列进行对应处理后，利用对应的去噪网络得到图像块的去噪结果，将图像块的去噪结果进行整合得到视频帧的去噪结果，有效地提高了raw域视频的去噪质量。
附图说明
19.为了更清楚地说明本发明的技术方案，下面将对实施例描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
20.图1是本发明实施例提供的raw域视频去噪方法的流程示意图之一；图2是本发明实施例提供的一种raw域视频去噪方法的流程示意图之二；图3是本发明实施例提供的一种raw域视频去噪方法的流程示意图之三；图4是本发明实施例提供的raw域视频去噪装置的结构示意图；图5是本发明实施例提供的电子设备的结构示意图。
具体实施方式
21.为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
22.图1是本发明实施例提供的raw域视频去噪方法的流程示意图之一。如图1所示，该方法包括：步骤s1、按序获取raw域视频中当前待去噪的视频帧；其中，所述raw域视频中的视频帧按照预设裁剪规则裁剪为多个图像块，空间位置上相对应的所述图像块按时序构成第一图像块序列。
23.可以按照时序顺序对raw域视频中的视频帧进行去噪，因此，按序获取raw域视频中当前待去噪的视频帧。
24.可以在去噪之前，预先对raw域视频中的视频帧按照预设裁剪规则裁剪为多个图像块，空间位置上相对应的图像块按时序构成第一图像块序列。比如，左上角位置的各帧裁剪得到的图像块按时序构成一个图像块序列，左下角位置的各帧裁剪得到的图像块按时序构成一个图像块序列。为和其他类型图像块序列相区分，将对raw域视频中的视频帧按照预设裁剪规则裁剪为多个图像块，空间位置上相对应的图像块按时序构成的图像块序列称为第一图像块序列。
25.步骤s2、根据所述当前待去噪的视频帧的图像块和对应所述第一图像块序列中相邻预设个数的图像块构建第二图像块序列。
26.根据去噪网络的要求设置预设个数，则第二图像块序列中具有预设个数 1个图像块。比如，在采用视频去噪网络模型构建去噪网络时，需要对输入的5张图片进行处理，因此预设个数设置为4。将相邻预设个数的图像块一起输入去噪网络，可以提高去噪的准确性。
27.在预设个数为偶数时，可以在第一图像块序列中当前待去噪的视频帧的图像块的前后各选择相同个数的图像块构建相邻预设个数的图像块，如前后各选择2个图像块。可以理解的，相邻预设个数也可以取值为0，也即只针对当前待去噪的视频帧中的图像块进行去噪。
28.步骤s3、根据所述当前待去噪的视频帧中的图像块是否为暗部区域，将所述图像块所在的所述第二图像块序列进行对应处理后，利用对应的去噪网络得到所述图像块的去噪结果。
29.获取当前待去噪的视频帧中的各个图像块是否为暗部区域的结果。视频帧中的噪声可以建模为高斯-泊松分布。相对于非暗部区域（如亮部区域），高斯-泊松分布噪声对于暗部区域的去噪过程影响更大，不利于去噪的处理。因此，根据各个图像块是否为暗部区域的结果进行区分化的去噪处理。具体地，根据当前待去噪的视频帧中的图像块是否为暗部区域，将图像块所在的第二图像块序列进行对应处理后，利用对应的去噪网络得到图像块的去噪结果。
30.步骤s4、将所述当前待去噪的视频帧中的各个图像块的去噪结果进行整合，得到所述当前待去噪的视频帧的去噪结果。
31.由于当前待去噪的视频帧是裁剪为多个图像块的，在得到各个图像块的去噪结果后，将当前待去噪的视频帧中的各个图像块的去噪结果进行整合，得到当前待去噪的视频帧的去噪结果。
32.本发明实施例提供的raw域视频去噪方法，通过按序获取raw域视频中当前待去噪的视频帧，根据当前待去噪的视频帧的图像块和对应第一图像块序列中相邻预设个数的图像块构建第二图像块序列，根据当前待去噪的视频帧中的图像块是否为暗部区域，将图像
块所在的第二图像块序列进行对应处理后，利用对应的去噪网络得到图像块的去噪结果，将图像块的去噪结果进行整合得到视频帧的去噪结果，有效地提高了raw域视频的去噪质量。
33.根据本发明实施例提供的一种raw域视频去噪方法，所述根据所述当前待去噪的视频帧中的图像块是否为暗部区域，将所述图像块所在的所述第二图像块序列进行对应处理后，利用对应的去噪网络得到所述图像块的去噪结果，包括：响应于所述当前待去噪的视频帧中的图像块为暗部区域，将所述图像块所在的所述第二图像块序列进行vst变换及通道拆分，得到对应各个通道的第三图像块序列；将各个通道的所述第三图像块序列分别输入vst域去噪网络，得到所述当前待去噪的视频帧中的图像块的各通道去噪结果；将所述当前待去噪的视频帧中的图像块的各通道去噪结果进行vst拟变换及通道整合，得到所述图像块的去噪结果。
34.若当前待去噪的视频帧中的图像块为暗部区域，则将图像块所在的第二图像块序列进行vst变换及通道拆分后，利用vst域去噪网络得到图像块的去噪结果。其中，可以先进行vst变换，再进行通道拆分；也可以先进行通道拆分，再进行vst变换。
35.经过vst变换后，图像块中的噪声满足高斯分布，有利于去噪的处理，以提高去噪的质量。通道拆分操作的好处在于，其保证输入视频帧的相邻像素表示相同的颜色通道，大大增强了其相关性，更加易于网络学习。
36.raw域数据格式一般采用bayer排列方式，如rggb排列方式。基于bayer排列方式进行通道拆分，可以拆分为r通道的图像块序列，gr通道的图像块序列，gb通道的图像块序列以及b通道的图像块序列。其中，r、b表示红色和蓝色，gr、gb表示绿色。
37.将图像块所在的第二图像块序列进行vst变换及通道拆分后，利用vst域去噪网络得到图像块的去噪结果包括如下处理步骤：将图像块所在的第二图像块序列进行vst变换及通道拆分，得到对应各个通道的第三图像块序列。可以理解的，第三图像块也不是具体指哪一个图像块序列，而是指一类图像块序列，即将图像块所在的第二图像块序列进行vst变换及通道拆分，得到的对应各个通道的图像块序列。
38.本发明实施例中，噪声建模为高斯-泊松噪声，表示为：；其中，代表受噪声影响的像素值，代表真实干净的像素值；代表泊松分布变量，代表高斯分布变量。两个噪声参数分别为图像采集系统的传感器放大系数和电路中噪声方差。
39.对于以上建模的噪声，使用vst变换对其进行进一步化简：；此时有：；
则：；由上，经过vst变换后，图像块的噪声性质得到了进一步的简化，大大降低了学习难度，可以更好地辅助网络进行学习和判断，更易于模型收敛。
40.将各个通道的第三图像块序列分别输入vst域去噪网络，得到当前待去噪的视频帧中的图像块的各通道去噪结果。如得到当前待去噪的视频帧中的图像块的r通道去噪结果、gr通道去噪结果、gb通道去噪结果及b通道去噪结果。
41.将当前待去噪的视频帧中的图像块的各通道去噪结果进行vst拟变换及通道整合，得到图像块的去噪结果。vst拟变换用于将像素值变回原来的数学变换域。通道整合用于将图像块变为原来的格式，如bayer格式。vst拟变换及通道整合的顺序可以预先设定，可以先进行vst拟变换，再进行通道整合；也可以先进行通道整合再进行vst拟变换。
42.本发明实施例提供的raw域视频去噪方法，通过将图像块所在的第二图像块序列进行vst变换及通道拆分，得到对应各个通道的第三图像块序列，将各个通道的第三图像块序列分别输入vst域去噪网络，得到当前待去噪的视频帧中的图像块的各通道去噪结果，将当前待去噪的视频帧中的图像块的各通道去噪结果进行vst拟变换及通道整合，得到图像块的去噪结果，有效地实现了暗部区域图像块的去噪。
43.根据本发明实施例提供的一种raw域视频去噪方法，所述根据所述当前待去噪的视频帧中的图像块是否为暗部区域，将所述图像块所在的所述第二图像块序列进行对应处理后，利用对应的去噪网络得到所述图像块的去噪结果，包括：响应于所述当前待去噪的视频帧中的图像块为非暗部区域，将所述图像块所在的所述第二图像块序列进行通道拆分，得到对应各个通道的第四图像块序列；将各个通道的所述第四图像块序列分别输入像素域去噪网络，得到所述当前待去噪的视频帧中的图像块的各通道去噪结果；将所述当前待去噪的视频帧中的图像块的各通道去噪结果进行通道整合，得到所述图像块的去噪结果。
44.若当前待去噪的视频帧中的图像块为非暗部区域，则将图像块所在的第二图像块序列进行通道拆分后，利用像素域去噪网络得到所述图像块的去噪结果。
45.将图像块所在的第二图像块序列进行通道拆分后，利用像素域去噪网络得到图像块的去噪结果包括如下处理步骤：将图像块所在的第二图像块序列进行通道拆分，得到对应各个通道的第四图像块序列。可以理解的，第四图像块也不是具体指哪一个图像块序列，而是指一类图像块序列，即将图像块所在的第二图像块序列进行通道拆分，得到的对应各个通道的图像块序列。
46.将各个通道的第四图像块序列分别输入像素域去噪网络，得到当前待去噪的视频帧中的图像块的各通道去噪结果。如得到当前待去噪的视频帧中的图像块的r通道去噪结果、gr通道去噪结果、gb通道去噪结果及b通道去噪结果。
47.将当前待去噪的视频帧中的图像块的各通道去噪结果进行通道整合，得到当前待去噪的视频帧中的图像块的去噪结果。通道整合用于将图像块变为原来的格式，如bayer格式。
48.本发明实施例提供的raw域视频去噪方法，通过将图像块所在的第二图像块序列进行通道拆分，得到对应各个通道的第四图像块序列，将各个通道的第四图像块序列分别输入像素域去噪网络，得到当前待去噪的视频帧中的图像块的各通道去噪结果，将当前待去噪的视频帧中的图像块的各通道去噪结果进行通道整合，得到图像块的去噪结果，有效地实现了非暗部区域图像块的去噪。
49.根据本发明实施例提供的一种raw域视频去噪方法，在所述按序获取raw域视频中当前待去噪的视频帧之前，所述方法还包括：合成噪声信号满足高斯-泊松分布的raw域样本视频；将所述raw域样本视频中的视频帧裁剪为多个图像块，空间位置上相对应的所述图像块按时序构成第五图像块序列；根据所述raw域样本视频中的待去噪视频帧的图像块和对应所述第五图像块序列中相邻所述预设个数的图像块构建第六图像块序列；对所述第六图像块序列进行vst变换及通道拆分，得到对应各个通道的第七图像块序列；将各个通道的所述第七图像块序列分别输入视频去噪网络模型，得到所述待去噪视频帧的图像块的各通道去噪结果；将所述待去噪视频帧的图像块的各通道去噪结果进行vst拟变换及通道整合，得到所述待去噪视频帧的图像块的去噪结果；将所述待去噪视频帧的图像块的去噪结果进行整合，得到所述待去噪视频帧的去噪结果的预测值；利用所述待去噪视频帧的去噪结果的所述预测值和真值计算损失函数，训练所述视频去噪网络模型，训练结束得到所述vst域去噪网络。
50.在按序获取raw域视频中当前待去噪的视频帧之前，需要预先训练完成vst域去噪网络。训练vst域去噪网络的一种实施方式的步骤包括：可以预先人工合成噪声信号满足高斯-泊松分布的raw域样本视频。由于vst域去噪网络用于对暗部区域降噪，为提高模型的适应性，可在暗光环境下拍摄视频，并基于拍摄的视频合成噪声信号满足高斯-泊松分布的raw域样本视频。
51.将raw域样本视频中的视频帧裁剪为多个图像块，空间位置上相对应的图像块按时序构成第五图像块序列。将raw域样本视频中的视频帧裁剪为多个图像块的目的是为了便于模型处理。
52.根据raw域样本视频中的待去噪视频帧的图像块和对应第五图像块序列中相邻预设个数的图像块构建第六图像块序列。模型训练时第六图像块序列的获取和模型使用时第二图像块的获取采用相同的规则。比如，若在模型使用时，当前待去噪的视频帧的图像块和对应第一图像块序列中前后各2个图像块构建第二图像块序列；则在模型训练时，待去噪视频帧的图像块和对应第五图像块序列中前后各2个图像块构建第六图像块序列。
53.对第六图像块序列进行vst变换及通道拆分，得到对应各个通道的第七图像块序列。模型训练时vst变换和通道拆分的先后顺序可以和模型使用时相同。模型训练和模型使用时通道拆分的方式相同，比如均是基于bayer格式进行通道拆分。
54.将各个通道的第七图像块序列分别输入视频去噪网络模型，得到待去噪视频帧的图像块的各通道去噪结果。其中，视频去噪网络模型如可以采用fastdvdnet模型，也可以采用具有相同的功能的其他模型。
55.将待去噪视频帧的图像块的各通道去噪结果进行vst拟变换及通道整合，得到待去噪视频帧的图像块的去噪结果。将待去噪视频帧的图像块的去噪结果进行整合，得到待去噪视频帧的去噪结果的预测值。
56.利用待去噪视频帧的去噪结果的预测值和待去噪视频帧的去噪结果的真值计算损失函数，利用raw域样本视频中的视频帧不断训练视频去噪网络模型，训练结束得到vst域去噪网络。由于待去噪视频帧是通过添加噪声得到的数据集，因此，真值即添加噪声之前的结果，预测值为视频去噪网络模型的输出结果。其中，可以使用mseloss（mean-squared loss，均方损失）计算损失函数。
57.本发明实施例提供的raw域视频去噪方法，通过合成噪声信号满足高斯-泊松分布的raw域样本视频，将raw域样本视频中的视频帧裁剪为多个图像块，空间位置上相对应的图像块按时序构成第五图像块序列，根据raw域样本视频中的待去噪视频帧的图像块和对应第五图像块序列中相邻预设个数的图像块构建第六图像块序列，对第六图像块序列进行通道拆分，得到对应各个通道的第七图像块序列，将各个通道的第七图像块序列分别输入视频去噪网络模型，得到待去噪视频帧的图像块的各通道去噪结果，将待去噪视频帧的图像块的各通道去噪结果进行通道整合，得到待去噪视频帧的图像块的去噪结果，将待去噪视频帧的图像块的去噪结果进行整合，得到待去噪视频帧的去噪结果的预测值，利用待去噪视频帧的去噪结果的预测值和真值计算损失函数，训练视频去噪网络模型，训练结束得到像素域去噪网络，实现了基于已有视频降噪模型训练得到适用于暗部区域降噪的vst域降噪网络。
58.根据本发明实施例提供的一种raw域视频去噪方法，在所述按序获取raw域视频中当前待去噪的视频帧之前，所述方法还包括：合成噪声信号满足高斯-泊松分布的raw域样本视频；将所述raw域样本视频中的视频帧裁剪为多个图像块，空间位置上相对应的所述图像块按时序构成第八图像块序列；根据所述raw域样本视频中的待去噪视频帧的图像块和对应所述第八图像块序列中相邻所述预设个数的图像块构建第九图像块序列；对所述第九图像块序列进行通道拆分，得到对应各个通道的第十图像块序列；将各个通道的所述第十图像块序列分别输入视频去噪网络模型，得到所述待去噪视频帧的图像块的各通道去噪结果；将所述待去噪视频帧的图像块的各通道去噪结果进行通道整合，得到所述待去噪视频帧的图像块的去噪结果；将所述待去噪视频帧的图像块的去噪结果进行整合，得到所述待去噪视频帧的去噪结果的预测值；利用所述待去噪视频帧的去噪结果的所述预测值和真值计算损失函数，训练所述视频去噪网络模型，训练结束得到所述像素域去噪网络。
59.在按序获取raw域视频中当前待去噪的视频帧之前，需要预先训练完成像素域去噪网络。训练像素域去噪网络的一种实施方式的步骤包括：可以预先人工合成噪声信号满足高斯-泊松分布的raw域样本视频。由于像素域去噪网络用于对非暗部区域降噪，为提高模型的适应性，可在非暗光环境下拍摄视频，如在亮光环境下拍摄视频，并基于拍摄的视频合成噪声信号满足高斯-泊松分布的raw域样本视频。
60.将raw域样本视频中的视频帧裁剪为多个图像块，空间位置上相对应的图像块按时序构成第八图像块序列。将raw域样本视频中的视频帧裁剪为多个图像块的目的是为了便于模型处理。
61.根据raw域样本视频中的待去噪视频帧的图像块和对应第八图像块序列中相邻预设个数的图像块构建第九图像块序列。模型训练时第九图像块序列的获取和模型使用时第二图像块的获取采用相同的规则。比如，若在模型使用时，当前待去噪的视频帧的图像块和
对应第一图像块序列中前后各3个图像块构建第二图像块序列；则在模型训练时，待去噪视频帧的图像块和对应第八图像块序列中前后各3个图像块构建第九图像块序列。
62.对第九图像块序列进行通道拆分，得到对应各个通道的第十图像块序列。模型训练和模型使用时通道拆分的方式相同，比如均是基于bayer格式进行通道拆分。
63.将各个通道的第十图像块序列分别输入视频去噪网络模型，得到待去噪视频帧的图像块的各通道去噪结果。其中，视频去噪网络模型如可以采用fastdvdnet模型，也可以采用具有相同的功能的其他模型。
64.将待去噪视频帧的图像块的各通道去噪结果进行通道整合，得到待去噪视频帧的图像块的去噪结果。将待去噪视频帧的图像块的去噪结果进行整合，得到待去噪视频帧的去噪结果的预测值。
65.利用待去噪视频帧的去噪结果的预测值和待去噪视频帧的去噪结果的真值计算损失函数，利用raw域样本视频中的视频帧不断训练视频去噪网络模型，训练结束得到像素域去噪网络。由于待去噪视频帧是通过添加噪声得到的数据集，因此，真值即添加噪声之前的结果，预测值为视频去噪网络模型的输出结果。其中，可以使用mseloss计算损失函数。
66.本发明实施例提供的一种raw域视频去噪方法，通过合成噪声信号满足高斯-泊松分布的raw域样本视频，将raw域样本视频中的视频帧裁剪为多个图像块，空间位置上相对应的图像块按时序构成第八图像块序列，根据raw域样本视频中的待去噪视频帧的图像块和对应第八图像块序列中相邻预设个数的图像块构建第九图像块序列，对第九图像块序列进行通道拆分，得到对应各个通道的第十图像块序列，将各个通道的第十图像块序列分别输入视频去噪网络模型，得到待去噪视频帧的图像块的各通道去噪结果，将待去噪视频帧的图像块的各通道去噪结果进行通道整合，得到待去噪视频帧的图像块的去噪结果，将待去噪视频帧的图像块的去噪结果进行整合，得到待去噪视频帧的去噪结果的预测值，利用待去噪视频帧的去噪结果的预测值和真值计算损失函数，训练视频去噪网络模型，训练结束得到像素域去噪网络，实现了基于已有视频降噪模型训练得到适用于非暗部区域降噪的像素域降噪网络。
67.根据本发明实施例提供的一种raw域视频去噪方法，所述方法还包括：将所述当前待去噪的视频帧中的图像块的像素值进行归一化处理，得到归一化像素值；根据所述归一化像素值计算均值及方差；响应于所述均值小于预设均值且所述方差小于预设方差，则确定所述图像块为暗部区域；否则，确定所述图像块为非暗部区域。
68.在判断当前待去噪的视频帧中的图像块是否为暗部区域时，将当前待去噪的视频帧中的图像块的像素值进行归一化处理，如将像素值归一化至[0,1]区间内，得到归一化像素值。根据归一化像素值计算均值及方差，响应于均值小于预设均值且方差小于预设方差，则确定图像块为暗部区域。
[0069]
其中，预设均值和预设方差可以根据不同的使用场景预先通过实验确定合理数值。
[0070]
本发明实施例提供的raw域视频去噪方法，通过将当前待去噪的视频帧中的图像块的像素值进行归一化处理，得到归一化像素值，根据归一化像素值计算均值及方差，响应于均值小于预设均值且方差小于预设方差，则确定图像块为暗部区域，提高了暗部区域确定的准确性。
[0071]
根据本发明实施例提供的一种raw域视频去噪方法，所述预设裁剪规则包括：按照预设方向的预设移动步长将所述视频帧裁剪为多个图像块；其中，所述预设移动步长小于或等于移动方向上所述图像块的尺寸。
[0072]
raw域视频中的视频帧按照预设裁剪规则裁剪为多个图像块。对raw域视频中的视频帧进行图像块的裁剪时，可以按照预设方向的预设移动步长将视频帧裁剪为多个图像块。比如，按照预设移动步长横向移动将视频帧裁剪为多个图像块。
[0073]
若预设移动步长等于移动方向上图像块的尺寸，则各个图像块没有重叠区域。若预设移动步长小于移动方向上图像块的尺寸，则至少两个图像块具有重叠区域，具有重叠区域的图像块的数量与移动步长小于移动方向上图像块的尺寸的程度有关。
[0074]
本发明实施例提供的raw域视频去噪方法，通过按照小于或等于移动方向上图像块的尺寸的预设移动步长将视频帧裁剪为多个图像块，提高了图像块裁剪的灵活性。
[0075]
根据本发明实施例提供的一种raw域视频去噪方法，所述将所述当前待去噪的视频帧中的各个图像块的去噪结果进行整合，得到所述当前待去噪的视频帧的去噪结果，包括：响应于至少两个图像块包含重叠像素点，则通过计算所述至少两个图像块关于所述重叠像素点的去噪结果的加权和得到所述重叠像素点的像素值。
[0076]
在预设移动步长小于移动方向上图像块的尺寸，则至少两个图像块具有重叠区域。由于每个图像块都进行去噪处理，得到对应的去噪结果。若至少两个图像块包含重叠像素点，则通过计算至少两个图像块关于重叠像素点的去噪结果的加权和得到重叠像素点的像素值。去噪结果包括像素点的像素值。也即可以通过计算至少两个图像块关于重叠像素点的像素值的加权和得到重叠像素点的像素值。
[0077]
各个图像块的权重可以根据重叠像素点到各个图像块的中心点的距离确定，距离越近，权重越大。
[0078]
本发明实施例提供的raw域视频去噪方法，通过响应于至少两个图像块包含重叠像素点，则通过计算至少两个图像块关于重叠像素点的去噪结果的加权和得到重叠像素点的像素值，提高了去噪结果的准确性。
[0079]
图2是本发明实施例提供的一种raw域视频去噪方法的流程示意图之二。如图2所示，该方法包括：按序获取raw域视频中当前待去噪的视频帧；其中，所述raw域视频中的视频帧按照预设裁剪规则裁剪为多个图像块，空间位置上相对应的所述图像块按时序构成第一图像块序列；根据所述当前待去噪的视频帧的图像块和对应所述第一图像块序列中相邻预设个数的图像块构建第二图像块序列；判断所述当前待去噪的视频帧中的图像块是否为暗部区域；响应于所述当前待去噪的视频帧中的图像块为暗部区域，则将所述图像块所在的所述第二图像块序列进行vst变换及通道拆分后，利用vst域去噪网络得到所述图像块的去噪结果；响应于所述当前待去噪的视频帧中的图像块为非暗部区域，则将所述图像块所在的所述第二图像块序列进行通道拆分后，利用像素域去噪网络得到所述图像块的去噪结果；
将所述当前待去噪的视频帧中的各个图像块的去噪结果进行整合，得到所述当前待去噪的视频帧的去噪结果。
[0080]
图3是本发明实施例提供的一种raw域视频去噪方法的流程示意图之三。如图3所示，该方法包括：获取待去噪raw域视频帧及4张相邻视频帧；其中，视频帧预先划分为多个图像块；判断raw域视频帧中的图像块是否为暗部区域；若raw域视频帧中的图像块为暗部区域，则对图像块基于已知的噪声参数进行vst变换后再基于bayer格式进行通道拆分打包；若raw域视频帧中的图像块为非暗部区域，则对图像块直接基于bayer格式进行通道拆分打包；对图像块基于bayer格式进行通道拆分打包后，得到r通道图像块序列、gr通道图像块序列、b通道图像块序列及gb通道图像块序列；根据通道拆分前图像块是否为暗部区域，将暗部区域图像块拆分打包得到的各通道的图像块序列分别送入vst域去噪网络，得到各个通道的去噪结果，并将各个通道的去噪结果进行vst逆变换及通道整合，得到各个图像块的去噪结果；将非暗部区域图像块拆分打包得到的各通道的图像块序列分别送入像素域去噪网络，得到各个通道的去噪结果，将各个通道的去噪结果进行通道整合得到各个图像块的去噪结果；将raw域视频帧划分得到的各个图像块的去噪结果进行整合得到raw域视频帧的去噪结果。
[0081]
实验结果表明，本发明实施例提供的raw域视频去噪方法，与不区分暗部和非暗部区域的纯盲去噪模型相比，峰值信噪比（peak signal-to-noise ratio，psnr）可以提升0.28db。
[0082]
需要说明的，本发明实施例中，“第一”、“第二”、“第三
”……
图像块序列前的序号用于表示图像块序列的不同类型。
[0083]
需要说明的是，本实施例所给出的多个优选实施方式，在逻辑或结构相互不冲突的前提下，可以自由组合，本发明对此不做限定。
[0084]
下面对本发明实施例提供的raw域视频去噪装置进行描述，下文描述的raw域视频去噪装置与上文描述的raw域视频去噪方法可相互对应参照。
[0085]
图4是本发明实施例提供的raw域视频去噪装置的结构示意图。如图4所示，该装置包括获取模块10、构建模块20、去噪模块30及整合模块40，其中：获取模块10用于：按序获取raw域视频中当前待去噪的视频帧；其中，所述raw域视频中的视频帧按照预设裁剪规则裁剪为多个图像块，空间位置上相对应的所述图像块按时序构成第一图像块序列；构建模块20用于：根据所述当前待去噪的视频帧的图像块和对应所述第一图像块序列中相邻预设个数的图像块构建第二图像块序列；去噪模块30用于：根据所述当前待去噪的视频帧中的图像块是否为暗部区域，将所述图像块所在的所述第二图像块序列进行对应处理后，利用对应的去噪网络得到所述图像块的去噪结果；整合模块40用于：将所述当前待去噪的视频帧中的各个图像块的去噪结果进行整合，得到所述当前待去噪的视频帧的去噪结果。
[0086]
本发明实施例提供的raw域视频去噪装置，通过按序获取raw域视频中当前待去噪的视频帧，根据当前待去噪的视频帧的图像块和对应第一图像块序列中相邻预设个数的图像块构建第二图像块序列，根据当前待去噪的视频帧中的图像块是否为暗部区域，将图像
块所在的第二图像块序列进行对应处理后，利用对应的去噪网络得到图像块的去噪结果，将图像块的去噪结果进行整合得到视频帧的去噪结果，有效地提高了raw域视频的去噪质量。
[0087]
根据本发明实施例提供的一种raw域视频去噪装置，去噪模块30在用于根据所述当前待去噪的视频帧中的图像块是否为暗部区域，将所述图像块所在的所述第二图像块序列进行对应处理后，利用对应的去噪网络得到所述图像块的去噪结果时，具体用于：响应于所述当前待去噪的视频帧中的图像块为暗部区域，将所述图像块所在的所述第二图像块序列进行vst变换及通道拆分，得到对应各个通道的第三图像块序列；将各个通道的所述第三图像块序列分别输入vst域去噪网络，得到所述当前待去噪的视频帧中的图像块的各通道去噪结果；将所述当前待去噪的视频帧中的图像块的各通道去噪结果进行vst拟变换及通道整合，得到所述图像块的去噪结果。
[0088]
本发明实施例提供的raw域视频去噪装置，通过将图像块所在的第二图像块序列进行vst变换及通道拆分，得到对应各个通道的第三图像块序列，将各个通道的第三图像块序列分别输入vst域去噪网络，得到当前待去噪的视频帧中的图像块的各通道去噪结果，将当前待去噪的视频帧中的图像块的各通道去噪结果进行vst拟变换及通道整合，得到图像块的去噪结果，有效地实现了暗部区域图像块的去噪。
[0089]
根据本发明实施例提供的一种raw域视频去噪装置，去噪模块30在用于根据所述当前待去噪的视频帧中的图像块是否为暗部区域，将所述图像块所在的所述第二图像块序列进行对应处理后，利用对应的去噪网络得到所述图像块的去噪结果时，具体用于：响应于所述当前待去噪的视频帧中的图像块为非暗部区域，将所述图像块所在的所述第二图像块序列进行通道拆分，得到对应各个通道的第四图像块序列；将各个通道的所述第四图像块序列分别输入像素域去噪网络，得到所述当前待去噪的视频帧中的图像块的各通道去噪结果；将所述当前待去噪的视频帧中的图像块的各通道去噪结果进行通道整合，得到所述图像块的去噪结果。
[0090]
本发明实施例提供的raw域视频去噪装置，通过将图像块所在的第二图像块序列进行通道拆分，得到对应各个通道的第四图像块序列，将各个通道的第四图像块序列分别输入像素域去噪网络，得到当前待去噪的视频帧中的图像块的各通道去噪结果，将当前待去噪的视频帧中的图像块的各通道去噪结果进行通道整合，得到图像块的去噪结果，有效地实现了非暗部区域图像块的去噪。
[0091]
根据本发明实施例提供的一种raw域视频去噪装置，所述装置还包括第一训练模块，在获取模块10按序获取raw域视频中当前待去噪的视频帧之前，所述第一训练模块用于：合成噪声信号满足高斯-泊松分布的raw域样本视频；将所述raw域样本视频中的视频帧裁剪为多个图像块，空间位置上相对应的所述图像块按时序构成第五图像块序列；根据所述raw域样本视频中的待去噪视频帧的图像块和对应所述第五图像块序列中相邻所述预设个数的图像块构建第六图像块序列；对所述第六图像块序列进行vst变换及通道拆分，得到对应各个通道的第七图像块序列；将各个通道的所述第七图像块序列分别输入视频去噪网络模型，得到所述待去噪视频帧的图像块的各通道去噪结果；将所述待去噪视频帧的图像块的各通道去噪结果进行vst拟变换及通道整合，得到所述待去噪视频帧的图像块的去噪结果；将所述待去噪视频帧的图像块的去噪结果进行整合，得到所述待去噪视频帧的去噪
结果的预测值；利用所述待去噪视频帧的去噪结果的所述预测值和真值计算损失函数，训练所述视频去噪网络模型，训练结束得到所述vst域去噪网络。
[0092]
本发明实施例提供的raw域视频去噪装置，实现了基于已有视频降噪模型训练得到适用于暗部区域降噪的vst域降噪网络。
[0093]
根据本发明实施例提供的一种raw域视频去噪装置，所述装置还包括第二训练模块，在获取模块10按序获取raw域视频中当前待去噪的视频帧之前，所述第二训练模块用于：合成噪声信号满足高斯-泊松分布的raw域样本视频；将所述raw域样本视频中的视频帧裁剪为多个图像块，空间位置上相对应的所述图像块按时序构成第八图像块序列；根据所述raw域样本视频中的待去噪视频帧的图像块和对应所述第八图像块序列中相邻所述预设个数的图像块构建第九图像块序列；对所述第九图像块序列进行通道拆分，得到对应各个通道的第十图像块序列；将各个通道的所述第十图像块序列分别输入视频去噪网络模型，得到所述待去噪视频帧的图像块的各通道去噪结果；将所述待去噪视频帧的图像块的各通道去噪结果进行通道整合，得到所述待去噪视频帧的图像块的去噪结果；将所述待去噪视频帧的图像块的去噪结果进行整合，得到所述待去噪视频帧的去噪结果的预测值；利用所述待去噪视频帧的去噪结果的所述预测值和真值计算损失函数，训练所述视频去噪网络模型，训练结束得到所述像素域去噪网络。
[0094]
本发明实施例提供的一种raw域视频去噪装置，实现了基于已有视频降噪模型训练得到适用于非暗部区域降噪的像素域降噪网络。
[0095]
根据本发明实施例提供的一种raw域视频去噪装置，所述装置还包括判断模块，用于：将所述当前待去噪的视频帧中的图像块的像素值进行归一化处理，得到归一化像素值；根据所述归一化像素值计算均值及方差；响应于所述均值小于预设均值且所述方差小于预设方差，则确定所述图像块为暗部区域；否则，确定所述图像块为非暗部区域。
[0096]
本发明实施例提供的raw域视频去噪装置，通过将当前待去噪的视频帧中的图像块的像素值进行归一化处理，得到归一化像素值，根据归一化像素值计算均值及方差，响应于均值小于预设均值且方差小于预设方差，则确定图像块为暗部区域，提高了暗部区域确定的准确性。
[0097]
根据本发明实施例提供的一种raw域视频去噪装置，所述预设裁剪规则包括：按照预设方向的预设移动步长将所述视频帧裁剪为多个图像块；其中，所述预设移动步长小于或等于移动方向上所述图像块的尺寸。
[0098]
本发明实施例提供的raw域视频去噪装置，通过按照小于或等于移动方向上图像块的尺寸的预设移动步长将视频帧裁剪为多个图像块，提高了图像块裁剪的灵活性。
[0099]
根据本发明实施例提供的一种raw域视频去噪装置，整合模块40在用于将所述当前待去噪的视频帧中的各个图像块的去噪结果进行整合，得到所述当前待去噪的视频帧的去噪结果时，具体用于：响应于至少两个图像块包含重叠像素点，则通过计算所述至少两个图像块关于所述重叠像素点的去噪结果的加权和得到所述重叠像素点的像素值。
[0100]
本发明实施例提供的raw域视频去噪装置，通过响应于至少两个图像块包含重叠像素点，则通过计算至少两个图像块关于重叠像素点的去噪结果的加权和得到重叠像素点的像素值，提高了去噪结果的准确性。
[0101]
图5是本发明实施例提供的电子设备的结构示意图，如图5所示，该电子设备可以
包括：处理器(processor)410、通信接口(communications interface)420、存储器(memory)430和通信总线440，其中，处理器410，通信接口420，存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令，以执行raw域视频去噪方法，该方法包括：按序获取raw域视频中当前待去噪的视频帧；其中，所述raw域视频中的视频帧按照预设裁剪规则裁剪为多个图像块，空间位置上相对应的所述图像块按时序构成第一图像块序列；根据所述当前待去噪的视频帧的图像块和对应所述第一图像块序列中相邻预设个数的图像块构建第二图像块序列；根据所述当前待去噪的视频帧中的图像块是否为暗部区域，将所述图像块所在的所述第二图像块序列进行对应处理后，利用对应的去噪网络得到所述图像块的去噪结果；将所述当前待去噪的视频帧中的各个图像块的去噪结果进行整合，得到所述当前待去噪的视频帧的去噪结果。
[0102]
此外，上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器（rom，read-only memory）、随机存取存储器（ram，random access memory）、磁碟或者光盘等各种可以存储程序代码的介质。
[0103]
另一方面，本发明实施例还提供一种计算机程序产品，所述计算机程序产品包括计算机程序，计算机程序可存储在非暂态计算机可读存储介质上，所述计算机程序被处理器执行时，计算机能够执行上述各方法所提供的raw域视频去噪方法，该方法包括：按序获取raw域视频中当前待去噪的视频帧；其中，所述raw域视频中的视频帧按照预设裁剪规则裁剪为多个图像块，空间位置上相对应的所述图像块按时序构成第一图像块序列；根据所述当前待去噪的视频帧的图像块和对应所述第一图像块序列中相邻预设个数的图像块构建第二图像块序列；根据所述当前待去噪的视频帧中的图像块是否为暗部区域，将所述图像块所在的所述第二图像块序列进行对应处理后，利用对应的去噪网络得到所述图像块的去噪结果；将所述当前待去噪的视频帧中的各个图像块的去噪结果进行整合，得到所述当前待去噪的视频帧的去噪结果。
[0104]
又一方面，本发明实施例还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各方法提供的raw域视频去噪方法，该方法包括：按序获取raw域视频中当前待去噪的视频帧；其中，所述raw域视频中的视频帧按照预设裁剪规则裁剪为多个图像块，空间位置上相对应的所述图像块按时序构成第一图像块序列；根据所述当前待去噪的视频帧的图像块和对应所述第一图像块序列中相邻预设个数的图像块构建第二图像块序列；根据所述当前待去噪的视频帧中的图像块是否为暗部区域，将所述图像块所在的所述第二图像块序列进行对应处理后，利用对应的去噪网络得到所述图像块的去噪结果；将所述当前待去噪的视频帧中的各个图像块的去噪结果进行整合，得到所述当前待去噪的视频帧的去噪结果。
[0105]
以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单
元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。
[0106]
通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如rom/ram、磁碟、光盘等，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行各个实施例或者实施例的某些部分所述的方法。
[0107]
最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种基于物联网的智能施工监控管理系统的制作方法

RAW域视频去噪方法、装置、电子设备及存储介质

最热文献