一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于视频滤波的方法和装置与流程

2022-11-14 14:41:49 来源:中国专利 TAG:

用于视频滤波的方法和装置
1.援引并入
2.本技术要求于2021年6月28日提交的题为“method and apparatusfor video filtering(用于视频滤波的方法和装置)”的第17/360,761号美国专利申请的优先权权益,该美国专利申请要求了于2020年12月16日提交的题为“harmonized scheme between semi decoupledpartitioning and loop filter(半解耦分割和环路滤波器之间的协调方案)”的第63/126,423号美国临时申请的优先权权益。在先申请的全部公开内容通过引用整体并入本文中。
技术领域
3.本公开描述了总体上涉及视频编码的实施例。


背景技术:

4.本文所提供的背景描述是出于总体上呈现本公开内容的背景的目的。在该背景部分中描述的范围内,目前命名的发明人的作品以及提交之时不可另行具备现有技术资格的本描述的各方面既未明确、亦未默示地承认为本公开的现有技术。
5.可使用具有运动补偿的帧间图片预测来执行视频编码和解码。未压缩的数字视频可包括一系列图片,每个图片具有例如为1920
×
1080的亮度样本及相关联的色度样本的空间大小。该一系列图片可具有例如每秒60幅图片或60hz的固定或可变的图片速率(也非正式地称为帧率)。未压缩的视频具有特定比特率要求。例如,每样本8位的1080p60 4:2:0的视频(60hz帧率的1920
×
1080 亮度样本分辨率)需要接近1.5gbit/s的带宽。一小时的此类视频需要600gb 以上的存储空间。
6.视频编码和解码的一个目的可以是通过压缩来减少输入视频信号中的冗余。压缩可有助于减小上述带宽和/或存储空间需求,在某些情况下可减小两个数量级或大于两个数量级。可采用无损压缩和有损压缩以及它们的组合。无损压缩指的是可以从已压缩的原始信号中重建原始信号的精确副本的技术。当使用有损压缩时,已重建的信号可能与原始信号不同,但是原始信号和已重建的信号之间的失真足够小,以使已重建的信号可用于预期的应用。在视频的情况下,广泛使用有损压缩。可容忍的失真量取决于应用;例如,某些消费流式应用的用户相比电视贡献应用(television contribution application)的用户来说可以容忍更高的失真。可达到的压缩率可以反映:更高的可容许/可容忍的失真可产生更高的压缩率。
7.视频编码器和解码器可利用来自多个大类的技术,这些技术包括例如运动补偿、变换、量化和熵编码。
8.视频编解码器技术可包括称为帧内编码的技术。在帧内编码中,在不参考来自先前重建的参考图片的样本或其它数据的情况下表示样本值。在一些视频编解码器中,图片在空间上细分成样本块。当所有样本块都以帧内模式编码时,该图片可以是帧内图片。帧内图片及其派生物(例如独立解码器刷新图片)可用于重置解码器状态,因此可用作已编码视
频码流和视频会话中的第一张图片,或者用作静止图像。帧内块的样本可受到变换,且可在熵编码之前对变换系数进行量化。帧内预测可以是一种使变换之前的域中的样本值最小化的技术。在一些情况下,变换之后的dc值越小,ac系数越小,在给定的量化步长下表示熵编码之后的块所需的位越少。
9.例如从诸如mpeg-2代编码技术已知的传统帧内编码不使用帧内预测。然而,一些更新的视频压缩技术包括试图从例如周围样本数据和/或元数据中得到数据块的技术,该周围样本数据和/或元数据在空间相邻的编码/解码期间获得并且按照解码顺序排在前。在下文中这样的技术称为“帧内预测”技术。应注意,至少在一些情况下,帧内预测仅使用来自正在重建的当前图片的参考数据,而不使用来自参考图片的参考数据。
10.帧内预测可以有许多不同形式。当在给定的视频编码技术中可使用一种以上这样的技术时,可以以帧内预测模式对使用中的技术进行编码。在一些情况下,模式可具有子模式和/或参数,且这些子模式和/或参数可单独编码或包含在模式码字中。给定的模式/子模式/参数组合使用哪个码字,可能会影响通过帧内预测的编码效率增益,因此可能会影响用于将码字转换成码流的熵编码技术。
11.h.264引入了一种帧内预测模式,该帧内预测模式在h.265中得到完善,且在诸如联合探索模型(jem)、通用视频编码(vvc)和基准集(bms)等更新的编码技术中进一步得到完善。可使用属于已经可用样本的相邻样本值来形成预测值块(predictor block)。相邻样本的样本值根据方向被复制到预测值块中。对使用方向的参考可以在码流中进行编码,或者其本身可被预测。
12.参考图1a,在右下方描绘了从h.265的33种可能的预测方向(对应于35 个帧内模式的33个角度模式)已知的9个预测方向的子集。箭头汇聚的点(101) 表示被预测的样本。箭头表示对样本进行预测所沿的方向。例如,箭头(102) 指示根据在右上方、与水平方向成45度角的一个或多个样本来预测样本(101)。类似地,箭头(103)指示根据在样本(101)的左下方、与水平方向成22.5度角的一个或多个样本来预测样本(101)。
13.仍然参考图1a,在左上方描绘了4
×
4个样本的方形块(104)(由虚黑体线指示)。方形块(104)包括16个样本,每个样本用“s”、其在y维度上的位置(例如,行索引)和其在x维度上的位置(例如,列索引)来标记。例如,样本s21是在y维度上(从顶部开始)的第二个样本和在x维度上(从左侧开始)的第一个样本。类似地,样本s44是在y和x维度上、块(104)中的第四个样本。由于块的大小为4
×
4个样本,因此s44位于右下角。还示出了遵循类似编号方案的参考样本。参考样本用r、其相对于块(104)的y位置(例如,行索引)和x位置(列索引)来标记。在h.264和h.265中,预测样本与正在重建的块相邻;因此,无需使用负值。
14.帧内图片预测可通过适当地沿用信号发送的预测方向从相邻样本复制参考样本值来工作。例如,假设已编码视频码流包括信令,该信令针对该块指示与箭头(102)一致的预测方向,即,根据在右上方、与水平方向成45度角的一个或多个预测样本来预测样本。在那种情况下,根据同一个参考样本r05预测样本s41,s32,s23和s14。然后根据参考样本r08预测样本s44。
15.在一些情况下,可例如通过插值来组合多个参考样本的值,以计算参考样本;尤其是当方向不能被45度整除时。
16.随着视频编码技术的发展,可能的方向的数量增加。在h.264(2003年) 中,可表示
九个不同的方向。在h.265(2013年)中,增加到33个方向,以及在本公开时,jem/vvc/bms可支持多达65个方向。已进行实验以识别最可能的方向,且熵编码中的一些技术用于以小的位数表示那些可能的方向,对于不太可能的方向,接受一定的代价。此外,有时可以根据已经解码的相邻块中使用的相邻方向来预测方向本身。
17.图1b示出了示意图(180),其描绘了根据jem的65个帧内预测方向,以说明随着时间的推移预测方向的数量增加。
18.已编码视频码流中表示方向的帧内预测方向比特的映射可能因视频编码技术而不同;例如,其范围可以从预测方向简单直接映射到帧内预测模式,变化为预测方向映射到码字,映射到涉及最可能模式的复杂自适应方案,以及类似技术。然而,在所有情况下,可存在某些方向,其与某些其它方向相比,在统计上出现在视频内容中的可能性较小。由于视频压缩的目标是减少冗余,因此在一种运行良好的视频编码技术中,相比于更可能的方向,那些不太可能的方向将由更大的位数来表示。
19.运动补偿可以是有损压缩技术,且可涉及以下技术:来自先前重建的图片或其部分(参考图片)的样本数据的块在沿着由运动矢量(此后称为mv)指示的方向上空间偏移之后,被用于预测新重建的图片或图片部分。在一些情况下,参考图片可与当前正在重建的图片相同。mv可具有x和y两个维度,或具有三个维度,第三个维度为正在使用的参考图片的指示(后者间接地可以是时间维度)。
20.在一些视频压缩技术中,可根据其它mv,例如根据在空间上与正在重建的区域相邻的样本数据的另一个区域相关的、且按解码顺序处于该mv之前的 mv,来预测适用于样本数据的某个区域的mv。这样做可大大减少对mv进行编码所需的数据量,从而消除冗余并增加压缩率。mv预测可有效地工作,例如,由于在对从相机获得的输入视频信号(称为自然视频)进行编码时,存在以下统计可能性:比适用单个mv的区域更大的区域沿着相似的方向移动,因此,在某些情况下,可使用从相邻区域的mv导出的相似运动矢量来预测该更大的区域。这使得为给定区域找到的mv与根据周围mv所预测的mv相似或相同,进而在熵编码之后,该为给定区域找到的mv可以采用比直接对mv进行编码时使用的位数更小的位数来进行表示。在一些情况下,mv预测可以是无损压缩从原始信号(即样本流)中导出的信号(即mv)的示例。在其它情况下,例如由于根据多个周围mv计算预测值时出现舍入误差,使得mv预测本身可以是有损的。
21.h.265/hevc(itu-t h.265建议书,“high efficiency video coding(高效视频编码)”,2016年12月)中描述了各种mv预测机制。在h.265提供的多种mv预测机制中,本文描述的是下文称为“空间合并(spatial merge)”的技术。
22.参考图2,当前块(201)包括在运动搜索过程期间已由编码器找到的样本,可根据已产生空间偏移的相同大小的先前块来预测该样本。可以从与一个或多个参考图片相关联的元数据中导出mv,而非直接对mv进行编码,例如使用与被标记为a0、a1和b0、b1、b2(分别对应202到206)的五个周围样本中的任一样本相关联的mv,(按解码次序)从最近的参考图片中导出该mv。在 h.265中,mv预测可使用来自相邻块正在使用的同一参考图片的预测值。


技术实现要素:

23.本公开的各方面提供用于视频编码/解码的方法和装置。在一些示例中,用于视频
解码的装置包括处理电路。处理电路基于已编码视频码流中的已解码信息来确定块的第一颜色分量和第二颜色分量的解耦编码信息。然后,处理电路基于第一环路滤波器配置来在块中的位置处重建第一颜色分量的第一样本,以及基于与第二环路滤波器配置来在块中的该位置处重建第二颜色分量的第二样本,所述第二环路滤波配置不同于所述第一环路滤波器配置。
24.在一些实施例中,解耦编码信息包括亮度分量和色度分量的帧内块复制模式的启用/禁用差异。在一些实施例中,解耦编码信息包括亮度分量和色度分量的解耦分割结构。
25.在一些实施例中,处理电路在第一环路滤波器配置和第二环路滤波器配置中的一者中启用解块滤波器、约束定向增强滤波器(cdef)、环路恢复滤波器、局部样本偏移(lso)滤波器和跨分量样本偏移(ccso)滤波器中的至少一个;以及在第一环路滤波器配置和第二环路滤波器配置中的另一者中禁用解块滤波器、约束定向增强滤波器(cdef)、环路恢复滤波器、局部样本偏移(lso) 滤波器和跨分量样本偏移(ccso)滤波器。
26.在一个实施例中,处理电路响应于对色度分量禁用帧内块复制模式且对亮度分量启用帧内块复制模式,在与色度分量相关联的第二环路滤波器配置中,启用解块滤波器、约束定向增强滤波器(cdef)、环路恢复滤波器、局部样本偏移(lso)滤波器和跨分量样本偏移(ccso)滤波器。
27.在另一实施例中,处理电路响应于对色度分量禁用帧内块复制模式且对亮度分量启用帧内块复制模式,在与色度分量相关联的第二环路滤波器配置中,启用局部样本偏移(lso)滤波器和跨分量样本偏移(ccso)滤波器中的一个。
28.在另一实施例中,处理电路响应于对色度分量禁用帧内块复制模式且对亮度分量启用帧内块复制模式,在与色度分量相关联的第二环路滤波器配置中,启用约束定向增强滤波器(cdef)和跨分量样本偏移(ccso)滤波器。
29.在一些示例中,处理电路基于第一颜色分量和第二颜色分量的相应启用/ 禁用信号来确定块中的第一颜色分量和第二颜色分量的解耦编码信息,相应启用/禁用信号采用块级、视频参数集(vps)、序列参数集(sps)、图片参数集 (pps)、自适应参数集(aps),切片标头和图块标头中的至少一个。
30.在一些示例中,处理电路从已编码视频码流中,解码出与亮度分量相关联的第一启用/禁用标志;以及从已编码视频码流中,解码出与色度分量相关联的第二启用/禁用标志。然后,处理电路基于第一启用/禁用标志和第二启用/禁用标志来确定亮度分量和色度分量的解耦编码信息。
31.在一些示例中,处理电路从已编码视频码流中,解码出亮度分量相关联的第一启用/禁用标志;从已编码视频码流中,解码出与第一色度分量相关联的第二启用/禁用标志;以及从已编码视频码流中,解码出与第二色度分量相关联的第三启用/禁用标志。然后,处理电路基于第一启用/禁用标志、第二启用/禁用标志和第三启用/禁用标志来确定亮度分量、第一色度分量和第二色度分量的解耦编码信息。
32.在一些实施例中,处理电路从比块更高级的语法中,解码出与特定环路滤波器相关联的标志;以及无需考虑解耦编码信息或帧内块复制模式,响应于标志为真,将特定环路滤波器应用于亮度分量。
33.本公开的各方面还提供非暂时性计算机可读介质,非暂时性计算机可读介质存储
有指令,当指令由用于视频解码的计算机执行时,指令使得计算机执行任意用于视频解码的方法。
附图说明
34.根据以下详细描述和附图,所公开的主题的进一步的特征、性质和各种优点将更加明显,在附图中:
35.图1a是帧内预测模式的示例性子集的示意性图示。
36.图1b是示例性帧内预测方向的图示。
37.图2是在一个示例中,当前块及其周围空间合并候选的示意性图示。
38.图3是根据一个实施例的通信系统(300)的简化框图的示意性图示。
39.图4是根据一个实施例的通信系统(400)的简化框图的示意性图示。
40.图5是根据一个实施例的解码器的简化框图的示意性图示。
41.图6是根据一个实施例的编码器的简化框图的示意性图示。
42.图7示出了根据另一实施例的编码器的框图。
43.图8示出了根据另一实施例的解码器的框图。
44.图9示出了根据本公开的实施例的滤波器形状的示例。
45.图10a至图10d示出了根据本公开的实施例的用于计算梯度的子采样位置的示例。
46.图11a和图11b示出了根据本公开的实施例的虚拟边界滤波过程的示例。
47.图12a至图12f示出了根据本公开的实施例的在虚拟边界处的对称填充操作的示例。
48.图13示出了根据本公开的一些实施例的图片的分割示例。
49.图14示出了在一些示例中,图片的四叉树拆分模式。
50.图15示出了根据本公开的一个实施例的跨分量滤波器。
51.图16示出了根据本公开的一个实施例的滤波器形状的示例。
52.图17示出了根据本公开的一些实施例的跨分量滤波器的语法示例。
53.图18a和图18b示出了根据本公开的实施例的色度样本相对于亮度样本的示例性位置。
54.图19示出了根据本公开的一个实施例的方向搜索的示例。
55.图20示出了在一些示例中说明子空间投影的示例。
56.图21示出了根据本公开的一个实施例的多个样本自适应偏移(sao)类型的表。
57.图22示出了在一些示例中,边缘偏移中的像素分类的图案的示例。
58.图23示出了在一些示例中,用于边缘偏移的像素分类规则的表。
59.图24示出了可以用信号发送的语法的示例。
60.图25示出了根据本公开的一些实施例的滤波器支持区域的示例。
61.图26示出了根据本公开的一些实施例的另一滤波器支持区域的示例。
62.图27a至图27c示出了根据本公开的一个实施例的具有81个组合的表。
63.图28示出了用于亮度分量和色度分量的编码树结构的示例。
64.图29示出了概述根据本公开的一个实施例的过程的流程图。
65.图30是根据一个实施例的计算机系统的示意性图示。
具体实施方式
66.图3是根据本技术公开的实施例的通信系统(300)的简化框图。通信系统 (300)包括多个终端装置,该终端装置可通过例如网络(350)彼此通信。举例来说,通信系统(300)包括通过网络(350)互连的终端装置(310)和终端装置(320)。在图3的实施例中,终端装置(310)和终端装置(320)执行单向数据传输。举例来说,终端装置(310)可对视频数据(例如由终端装置(310) 采集的视频图片流)进行编码以通过网络(350)传输到另一终端装置(320)。已编码的视频数据以一个或多个已编码视频码流形式传输。终端装置(320)可从网络(350)接收已编码视频数据,对已编码视频数据进行解码以恢复视频数据,并根据恢复的视频数据显示视频图片。单向数据传输在媒体服务等应用中是较常见的。
67.在另一实施例中,通信系统(300)包括执行已编码视频数据的双向传输的终端装置(330)和(340),该双向传输可例如在视频会议期间发生。对于双向数据传输,终端装置(330)和终端装置(340)中的每个终端装置可对视频数据(例如由终端装置采集的视频图片流)进行编码以通过网络(350)传输到终端装置(330)和终端装置(340)中的另一终端装置。终端装置(330)和终端装置(340)中的每个终端装置还可接收由终端装置(330)和终端装置(340) 中的另一终端装置传输的已编码视频数据,且可对该已编码视频数据进行解码以恢复视频数据,且可根据恢复的视频数据在可访问的显示装置上显示视频图片。
68.在图3的实施例中,终端装置(310)、终端装置(320)、终端装置(330) 和终端装置(340)可为服务器、个人计算机和智能电话,但本技术公开的原理可不限于此。本技术公开的实施例适用于膝上型计算机、平板电脑、媒体播放器和/或专用视频会议设备。网络(350)表示在终端装置(310)、终端装置(320)、终端装置(330)和终端装置(340)之间传送已编码视频数据的任何数目的网络,包括例如有线(连线的)和/或无线通信网络。通信网络(350)可在电路交换和/或分组交换信道中交换数据。该网络可包括电信网络、局域网、广域网和/或互联网。出于本技术的目的,除非在下文中有所解释,否则网络(350) 的架构和拓扑对于本技术公开的操作来说可能是无关紧要的。
69.作为实施例,图4示出视频编码器和视频解码器在流式传输环境中的放置方式。本技术所公开主题可同等地适用于其它支持视频的应用,包括例如视频会议、数字tv、在包括cd、dvd、存储棒等的数字介质上存储压缩视频等等。
70.流式传输系统可包括采集子系统(413),该采集子系统可包括数码相机等视频源(401),该视频源创建未压缩的视频图片流(402)。在实施例中,视频图片流(402)包括由数码相机拍摄的样本。相较于已编码的视频数据(404) (或已编码的视频码流),视频图片流(402)被描绘为粗线以强调高数据量的视频图片流,视频图片流(402)可由电子装置(420)处理,该电子装置(420) 包括耦接到视频源(401)的视频编码器(403)。视频编码器(403)可包括硬件、软件或软硬件组合以实现或实施如下文更详细地描述的所公开主题的各方面。相较于视频图片流(402),已编码的视频数据(404)(或已编码的视频码流(404))被描绘为细线以强调较低数据量的已编码的视频数据(404)(或已编码的视频码流(404)),其可存储在流式传输服务器(405)上以供将来使用。一个或多个流式传输客户端子系统,例如图4中的客户端子系统(406)和客户端子系统(408),可访问流式传输服务器(405)以检索已编码的视频数据(404) 的副本(407)和副本(409)。客户端子系统(406)可包括例如电子装置(430) 中的视频解码器(410)。视频解码器(410)对已编码的视频数据的传入副本(407) 进
行解码,且产生可在显示器(412)(例如显示屏)或另一呈现装置(未描绘) 上呈现的输出视频图片流(411)。在一些流式传输系统中,可根据某些视频编码/压缩标准对已编码的视频数据(404)、视频数据(407)和视频数据(309) (例如视频码流)进行编码。该些标准的实施例包括itu-t h.265。在实施例中,正在开发的视频编码标准非正式地称为下一代视频编码(versatile videocoding,vvc),本技术可用于vvc标准的上下文中。
71.应注意,电子装置(420)和电子装置(430)可包括其它组件(未示出)。举例来说,电子装置(420)可包括视频解码器(未示出),且电子装置(430) 还可包括视频编码器(未示出)。
72.图5是根据本技术公开的实施例的视频解码器(510)的框图。视频解码器(510)可设置在电子装置(530)中。电子装置(530)可包括接收器(531) (例如接收电路)。视频解码器(510)可用于代替图4实施例中的视频解码器 (510)。
73.接收器(531)可接收将由视频解码器(510)解码的一个或多个已编码视频序列;在同一实施例或另一实施例中,一次接收一个已编码视频序列,其中每个已编码视频序列的解码独立于其它已编码视频序列。可从信道(501)接收已编码视频序列,该信道可以是通向存储已编码的视频数据的存储装置的硬件/ 软件链路。接收器(531)可接收已编码的视频数据以及其它数据,例如,可转发到它们各自的使用实体(未标示)的已编码音频数据和/或辅助数据流。接收器(531)可将已编码视频序列与其它数据分开。为了防止网络抖动,缓冲存储器(515)可耦接在接收器(531)与熵解码器/解析器(520)(此后称为“解析器(520)”)之间。在某些应用中,缓冲存储器(515)是视频解码器(510)的一部分。在其它情况下,该缓冲存储器(515)可设置在视频解码器(510)外部(未标示)。而在其它情况下,视频解码器(510)的外部设置缓冲存储器(未标示)以例如防止网络抖动,且在视频解码器(510)的内部可配置另一缓冲存储器(515)以例如处理播出定时。而当接收器(531)从具有足够带宽和可控性的存储/转发装置或从等时同步网络接收数据时,也可能不需要配置缓冲存储器(515),或可以将该缓冲存储器做得较小。当然,为了在互联网等业务分组网络上使用,也可能需要缓冲存储器(515),该缓冲存储器可相对较大且可具有自适应性大小,且可至少部分地实施于操作系统或视频解码器(510)外部的类似元件(未标示)中。
74.视频解码器(510)可包括解析器(520)以根据已编码视频序列重建符号 (521)。这些符号的类别包括用于管理视频解码器(510)的操作的信息,以及用以控制显示装置(512)(例如,显示屏)等显示装置的潜在信息,该显示装置不是电子装置(530)的组成部分,但可耦接到电子装置(530),如图5中所示。用于显示装置的控制信息可以是辅助增强信息(supplemental enhancementinformation,sei消息)或视频可用性信息(video usability information,vui) 的参数集片段(未标示)。解析器(520)可对接收到的已编码视频序列进行解析/熵解码。已编码视频序列的编码可根据视频编码技术或标准进行,且可遵循各种原理,包括可变长度编码、霍夫曼编码(huffman coding)、具有或不具有上下文灵敏度的算术编码等等。解析器(520)可基于对应于群组的至少一个参数,从已编码视频序列提取用于视频解码器中的像素的子群中的至少一个子群的子群参数集。子群可包括图片群组(group of pictures,gop)、图片、图块、切片、宏块、编码单元(coding unit,cu)、块、变换单元(transform unit, tu)、预测单元(prediction unit,pu)等等。解析器(520)还可从已编码视频序列提取信息,例如变换系数、量化器参数值、运动矢量等等。
75.解析器(520)可对从缓冲存储器(515)接收的视频序列执行熵解码/解析操作,从而创建符号(521)。
76.取决于已编码视频图片或一部分已编码视频图片(例如:帧间图片和帧内图片、帧间块和帧内块)的类型以及其它因素,符号(521)的重建可涉及多个不同单元。涉及哪些单元以及涉及方式可由解析器(520)从已编码视频序列解析的子群控制信息控制。为了简洁起见,未描述解析器(520)与下文的多个单元之间的此类子群控制信息流。
77.除已经提及的功能块以外,视频解码器(510)可在概念上细分成如下文所描述的数个功能单元。在商业约束下运行的实际实施例中,这些单元中的许多单元彼此紧密交互并且可以彼此集成。然而,出于描述所公开主题的目的,概念上细分成下文的功能单元是适当的。
78.第一单元是缩放器/逆变换单元(551)。缩放器/逆变换单元(551)从解析器(520)接收作为符号(521)的量化变换系数以及控制信息,包括使用哪种变换方式、块大小、量化因子、量化缩放矩阵等。缩放器/逆变换单元(551) 可输出包括样本值的块,该样本值可输入到聚合器(555)中。
79.在一些情况下,缩放器/逆变换单元(551)的输出样本可属于帧内编码块;即:不使用来自先前重建的图片的预测性信息,但可使用来自当前图片的先前重建部分的预测性信息的块。此类预测性信息可由帧内图片预测单元(552)提供。在一些情况下,帧内图片预测单元(552)采用从当前图片缓冲器(558) 提取的已重建信息生成大小和形状与正在重建的块相同的周围块。举例来说,当前图片缓冲器(558)缓冲部分重建的当前图片和/或完全重建的当前图片。在一些情况下,聚合器(555)基于每个样本,将帧内预测单元(552)生成的预测信息添加到由缩放器/逆变换单元(551)提供的输出样本信息中。
80.在其它情况下,缩放器/逆变换单元(551)的输出样本可属于帧间编码和潜在运动补偿块。在此情况下,运动补偿预测单元(553)可访问参考图片存储器(557)以提取用于预测的样本。在根据符号(521)对提取的样本进行运动补偿之后,这些样本可由聚合器(555)添加到缩放器/逆变换单元(551)的输出(在这种情况下被称作残差样本或残差信号),从而生成输出样本信息。运动补偿预测单元(553)从参考图片存储器(557)内的地址获取预测样本可受到运动矢量控制,且该运动矢量以该符号(521)的形式而供运动补偿预测单元 (553)使用,该符号(521)例如是包括x、y和参考图片分量。运动补偿还可包括在使用子样本精确运动矢量时,从参考图片存储器(557)提取的样本值的内插、运动矢量预测机制等等。
81.聚合器(555)的输出样本可在环路滤波器单元(556)中被各种环路滤波技术采用。视频压缩技术可包括环路内滤波器技术,该环路内滤波器技术受控于包括在已编码视频序列(也称作已编码视频码流)中的参数,且该参数作为来自解析器(520)的符号(521)可用于环路滤波器单元(456)。然而,在其他实施例中,视频压缩技术还可响应于在解码已编码图片或已编码视频序列的先前(按解码次序)部分期间获得的元信息,以及响应于先前重建且经过环路滤波的样本值。
82.环路滤波器单元(556)的输出可以是样本流,该样本流可输出到显示装置 (512)以及存储在参考图片存储器(557),以用于后续的帧间图片预测。
83.一旦完全重建,某些已编码图片就可用作参考图片以用于将来预测。举例来说,一旦对应于当前图片的已编码图片被完全重建,且已编码图片(通过例如解析器(520))被识
别为参考图片,则当前图片缓冲器(558)可变为参考图片存储器(557)的一部分,且可在开始重建后续已编码图片之前重新分配新的当前图片缓冲器。
84.视频解码器(510)可根据例如itu-t h.265标准中的预定视频压缩技术执行解码操作。在已编码视频序列遵循视频压缩技术或标准的语法以及视频压缩技术或标准中记录的配置文件的意义上,已编码视频序列可符合所使用的视频压缩技术或标准指定的语法。具体地说,配置文件可从视频压缩技术或标准中可用的所有工具中选择某些工具作为在该配置文件下可供使用的仅有工具。对于合规性,还要求已编码视频序列的复杂度处于视频压缩技术或标准的层级所限定的范围内。在一些情况下,层级限制最大图片大小、最大帧率、最大重建取样率(以例如每秒兆(mega)个样本为单位进行测量)、最大参考图片大小等。在一些情况下,由层级设定的限制可通过假想参考解码器(hypotheticalreference decoder,hrd)规范和在已编码视频序列中用信号发送的hrd缓冲器管理的元数据来进一步限定。
85.在实施例中,接收器(531)可连同已编码视频一起接收附加(冗余)数据。该附加数据可以是已编码视频序列的一部分。该附加数据可由视频解码器(510) 用以对数据进行适当解码和/或较准确地重建原始视频数据。附加数据可呈例如时间、空间或信噪比(signal noise ratio,snr)增强层、冗余切片、冗余图片、前向纠错码等形式。
86.图6是根据本技术公开的实施例的视频编码器(603)的框图。视频编码器 (603)设置于电子装置(620)中。电子装置(620)包括传输器(640)(例如传输电路)。视频编码器(603)可用于代替图4实施例中的视频编码器(403)。
87.视频编码器(603)可从视频源(601)(并非图6实施例中的电子装置(620) 的一部分)接收视频样本,该视频源可采集将由视频编码器(603)编码的视频图像。在另一实施例中,视频源(601)是电子装置(620)的一部分。
88.视频源(601)可提供将由视频编码器(603)编码的呈数字视频样本流形式的源视频序列,该数字视频样本流可具有任何合适位深度(例如:8位、10 位、12位
……
)、任何色彩空间(例如bt.601y crcb、rgb
……
)和任何合适取样结构(例如y crcb 4:2:0、y crcb 4:4:4)。在媒体服务系统中,视频源(601) 可以是存储先前已准备的视频的存储装置。在视频会议系统中,视频源(601) 可以是采集本地图像信息作为视频序列的相机。可将视频数据提供为多个单独的图片,当按顺序观看时,这些图片被赋予运动。图片自身可构建为空间像素阵列,其中取决于所用的取样结构、色彩空间等,每个像素可包括一个或多个样本。所属领域的技术人员可以很容易理解像素与样本之间的关系。下文侧重于描述样本。
89.根据实施例,视频编码器(603)可实时或在由应用所要求的任何其它时间约束下,将源视频序列的图片编码且压缩成已编码视频序列(643)。施行适当的编码速度是控制器(650)的一个功能。在一些实施例中,控制器(650)控制如下文所描述的其它功能单元且在功能上耦接到这些单元。为了简洁起见,图中未标示耦接。由控制器(650)设置的参数可包括速率控制相关参数(图片跳过、量化器、率失真优化技术的λ值等)、图片大小、图片群组(group ofpictures,gop)布局,最大运动矢量搜索范围等。控制器(650)可用于具有其它合适的功能,这些功能涉及针对某一系统设计优化的视频编码器(603)。
90.在一些实施例中,视频编码器(603)在编码环路中进行操作。作为简单的描述,在实施例中,编码环路可包括源编码器(630)(例如,负责基于待编码的输入图片和参考图片
创建符号,例如符号流)和嵌入于视频编码器(603)中的(本地)解码器(633)。解码器(633)以类似于(远程)解码器创建样本数据的方式重建符号以创建样本数据(因为在本技术所考虑的视频压缩技术中,符号与已编码视频码流之间的任何压缩是无损的)。将重建的样本流(样本数据) 输入到参考图片存储器(634)。由于符号流的解码产生与解码器位置(本地或远程)无关的位精确结果,因此参考图片存储器(634)中的内容在本地编码器与远程编码器之间也是按比特位精确对应的。换句话说,编码器的预测部分“看到”的参考图片样本与解码器将在解码期间使用预测时所“看到”的样本值完全相同。这种参考图片同步性基本原理(以及在例如因信道误差而无法维持同步性的情况下产生的漂移)也用于一些相关技术。
[0091]“本地”解码器(633)的操作可与例如已在上文结合图5详细描述视频解码器(510)的“远程”解码器相同。然而,另外简要参考图5,当符号可用且熵编码器(645)和解析器(520)能够无损地将符号编码/解码为已编码视频序列时,包括缓冲存储器(515)和解析器(520)在内的视频解码器(510)的熵解码部分,可能无法完全在本地解码器(633)中实施。
[0092]
此时可以观察到,除存在于解码器中的解析/熵解码之外的任何解码器技术,也必定以基本上相同的功能形式存在于对应的编码器中。出于此原因,本技术侧重于解码器操作。可简化编码器技术的描述,因为编码器技术与全面地描述的解码器技术互逆。仅在某些区域中需要更详细的描述,并且在下文提供。
[0093]
在操作期间,在一些实施例中,源编码器(630)可执行运动补偿预测编码。参考来自视频序列中被指定为“参考图片”的一个或多个先前已编码图片,该运动补偿预测编码对输入图片进行预测性编码。以此方式,编码引擎(632)对输入图片的像素块与参考图片的像素块之间的差异进行编码,该参考图片可被选作该输入图片的预测参考。
[0094]
本地视频解码器(633)可基于源编码器(630)创建的符号,对可指定为参考图片的图片的已编码视频数据进行解码。编码引擎(632)的操作可为有损过程。当已编码视频数据可在视频解码器(图6中未示)处被解码时,重建的视频序列通常可以是带有一些误差的源视频序列的副本。本地视频解码器(633) 复制解码过程,该解码过程可由视频解码器对参考图片执行,且可使重建的参考图片存储在参考图片高速缓存(634)中。以此方式,视频编码器(603)可在本地存储重建的参考图片的副本,该副本与将由远端视频解码器获得的重建参考图片具有共同内容(不存在传输误差)。
[0095]
预测器(635)可针对编码引擎(632)执行预测搜索。即,对于将要编码的新图片,预测器(635)可在参考图片存储器(634)中搜索可作为该新图片的适当预测参考的样本数据(作为候选参考像素块)或某些元数据,例如参考图片运动矢量、块形状等。预测器(635)可基于样本块逐像素块操作,以找到合适的预测参考。在一些情况下,根据预测器(635)获得的搜索结果,可确定输入图片可具有从参考图片存储器(634)中存储的多个参考图片取得的预测参考。
[0096]
控制器(650)可管理源编码器(630)的编码操作,包括例如设置用于对视频数据进行编码的参数和子群参数。
[0097]
可在熵编码器(645)中对所有上述功能单元的输出进行熵编码。熵编码器 (645)根据例如霍夫曼编码、可变长度编码、算术编码等技术对各种功能单元生成的符号进行无损压缩,从而将该符号转换成已编码视频序列。
[0098]
传输器(640)可缓冲由熵编码器(645)创建的已编码视频序列,从而为通过通信信
道(660)进行传输做准备,该通信信道可以是通向将存储已编码的视频数据的存储装置的硬件/软件链路。传输器(640)可将来自视频编码器(603) 的已编码视频数据与要传输的其它数据合并,该其它数据例如是已编码音频数据和/或辅助数据流(未示出来源)。
[0099]
控制器(650)可管理视频编码器(603)的操作。在编码期间,控制器(650) 可以为每个已编码图片分配某一已编码图片类型,但这可能影响可应用于相应的图片的编码技术。例如,通常可将图片分配为以下任一种图片类型:
[0100]
帧内图片(i图片),其可以是不将序列中的任何其它图片用作预测源就可被编码和解码的图片。一些视频编解码器容许不同类型的帧内图片,包括例如独立解码器刷新(independent decoder refresh,“idr”)图片。所属领域的技术人员了解i图片的变体及其相应的应用和特征。
[0101]
预测性图片(p图片),其可以是可使用帧内预测或帧间预测进行编码和解码的图片,该帧内预测或帧间预测使用至多一个运动矢量和参考索引来预测每个块的样本值。
[0102]
双向预测性图片(b图片),其可以是可使用帧内预测或帧间预测进行编码和解码的图片,该帧内预测或帧间预测使用至多两个运动矢量和参考索引来预测每个块的样本值。类似地,多个预测性图片可使用多于两个参考图片和相关联元数据以用于重建单个块。
[0103]
源图片通常可在空间上细分成多个样本块(例如,4
×
4、8
×
8、4
×
8或16
ꢀ×
16个样本的块),且逐块进行编码。这些块可参考其它(已编码)块进行预测编码,根据应用于块的相应图片的编码分配来确定该其它块。举例来说,i 图片的块可进行非预测编码,或该块可参考同一图片的已经编码的块来进行预测编码(空间预测或帧内预测)。p图片的像素块可参考一个先前编码的参考图片通过空间预测或通过时域预测进行预测编码。b图片的块可参考一个或两个先前编码的参考图片通过空间预测或通过时域预测进行预测编码。
[0104]
视频编码器(603)可根据例如itu-t h.265建议书的预定视频编码技术或标准执行编码操作。在操作中,视频编码器(603)可执行各种压缩操作,包括利用输入视频序列中的时间和空间冗余的预测编码操作。因此,已编码视频数据可符合所用视频编码技术或标准指定的语法。
[0105]
在实施例中,传输器(640)可在传输已编码的视频时传输附加数据。源编码器(630)可将此类数据作为已编码视频序列的一部分。附加数据可包括时间 /空间/snr增强层、冗余图片和切片等其它形式的冗余数据、sei消息、vui 参数集片段等。
[0106]
采集到的视频可作为呈时间序列的多个源图片(视频图片)。帧内图片预测 (常常简化为帧内预测)利用给定图片中的空间相关性,而帧间图片预测则利用图片之间的(时间或其它)相关性。在实施例中,将正在编码/解码的特定图片分割成块,正在编码/解码的特定图片被称作当前图片。在当前图片中的块类似于视频中先前已编码且仍被缓冲的参考图片中的参考块时,可通过称作运动矢量的矢量对当前图片中的块进行编码。该运动矢量指向参考图片中的参考块,且在使用多个参考图片的情况下,该运动矢量可具有识别参考图片的第三维度。
[0107]
在一些实施例中,双向预测技术可用于帧间图片预测中。根据双向预测技术,使用两个参考图片,例如按解码次序都在视频中的当前图片之前(但按显示次序可能分别是过去和将来)第一参考图片和第二参考图片。可通过指向第一参考图片中的第一参考块的第一运动矢量和指向第二参考图片中的第二参考块的第二运动矢量对当前图片中的块进行
编码。具体来说,可通过第一参考块和第二参考块的组合来预测该块。
[0108]
此外,合并模式技术可用于帧间图片预测中以改善编码效率。
[0109]
根据本技术公开的一些实施例,帧间图片预测和帧内图片预测等预测的执行以块为单位。举例来说,根据hevc标准,将视频图片序列中的图片分割成编码树单元(coding tree unit,ctu)以用于压缩,图片中的ctu具有相同大小,例如64
×
64像素、32
×
32像素或16
×
16像素。一般来说,ctu包括三个编码树块(coding tree block,ctb),该三个编码树块是一个亮度ctb和两个色度ctb。更进一步的,还可将每个ctu以四叉树拆分为一个或多个编码单元(coding unit,cu)。举例来说,可将64
×
64像素的ctu拆分为一个64
×ꢀ
64像素的cu,或4个32
×
32像素的cu,或16个16
×
16像素的cu。在实施例中,分析每个cu以确定用于cu的预测类型,例如帧间预测类型或帧内预测类型。此外,取决于时间和/或空间可预测性,将cu拆分为一个或多个预测单元(prediction unit,pu)。通常,每个pu包括亮度预测块(prediction block, pb)和两个色度pb。在实施例中,编码(编码/解码)中的预测操作以预测块为单位来执行。以亮度预测块作为预测块为例,预测块包括像素值(例如,亮度值)的矩阵,例如8
×
8像素、16
×
16像素、8
×
16像素、16
×
8像素等等。
[0110]
图7是根据本技术公开的另一实施例的视频编码器(703)的图。视频编码器(703)用于接收视频图片序列中的当前视频图片内的样本值的处理块(例如预测块),且将该处理块编码到作为已编码视频序列的一部分的已编码图片中。在本实施例中,视频编码器(703)用于代替图4实施例中的视频编码器(403)。
[0111]
在hevc实施例中,视频编码器(703)接收用于处理块的样本值的矩阵,该处理块为例如8
×
8样本的预测块等。视频编码器(703)使用例如率失真 (rate-distortion,rd)优化来确定是否使用帧内模式、帧间模式或双向预测模式来编码该处理块。当在帧内模式中编码处理块时,视频编码器(703)可使用帧内预测技术以将处理块编码到已编码图片中;且当在帧间模式或双向预测模式中编码处理块时,视频编码器(703)可分别使用帧间预测或双向预测技术将处理块编码到已编码图片中。在某些视频编码技术中,合并模式可以是帧间图片预测子模式,其中,在不借助预测值外部的已编码运动矢量分量的情况下,从一个或多个运动矢量预测值导出运动矢量。在某些其它视频编码技术中,可存在适用于主题块的运动矢量分量。在实施例中,视频编码器(703)包括其它组件,例如用于确定处理块模式的模式决策模块(未示出)。
[0112]
在图7的实施例中,视频编码器(703)包括如图7所示的耦接到一起的帧间编码器(730)、帧内编码器(722)、残差计算器(723)、开关(726)、残差编码器(724)、通用控制器(721)和熵编码器(725)。
[0113]
帧间编码器(730)用于接收当前块(例如处理块)的样本、比较该块与参考图片中的一个或多个参考块(例如先前图片和后来图片中的块)、生成帧间预测信息(例如根据帧间编码技术的冗余信息描述、运动矢量、合并模式信息)、以及基于帧间预测信息使用任何合适的技术计算帧间预测结果(例如已预测块)。在一些实施例中,参考图片是基于已编码的视频信息解码的已解码参考图片。
[0114]
帧内编码器(722)用于接收当前块(例如处理块)的样本、在一些情况下比较该块与同一图片中已编码的块、在变换之后生成量化系数、以及在一些情况下还(例如根据一个或多个帧内编码技术的帧内预测方向信息)生成帧内预测信息。在实施例中,帧内编码器
(722)还基于帧内预测信息和同一图片中的参考块计算帧内预测结果(例如已预测块)。
[0115]
通用控制器(721)用于确定通用控制数据,且基于该通用控制数据控制视频编码器(703)的其它组件。在实施例中,通用控制器(721)确定块的模式,且基于该模式将控制信号提供到开关(726)。举例来说,当该模式是帧内模式时,通用控制器(721)控制开关(726)以选择供残差计算器(723)使用的帧内模式结果,且控制熵编码器(725)以选择帧内预测信息且将该帧内预测信息添加在码流中;以及当该模式是帧间模式时,通用控制器(721)控制开关(726) 以选择供残差计算器(723)使用的帧间预测结果,且控制熵编码器(725)以选择帧间预测信息且将该帧间预测信息添加在码流中。
[0116]
残差计算器(723)用于计算所接收的块与选自帧内编码器(722)或帧间编码器(730)的预测结果之间的差(残差数据)。残差编码器(724)用于基于残差数据操作,以对残差数据进行编码以生成变换系数。在实施例中,残差编码器(724)用于将残差数据从时域转换到频域,且生成变换系数。变换系数接着经由量化处理以获得量化的变换系数。在各种实施例中,视频编码器(703) 还包括残差解码器(728)。残差解码器(728)用于执行逆变换,且生成已解码残差数据。已解码残差数据可适当地由帧内编码器(722)和帧间编码器(730) 使用。举例来说,帧间编码器(730)可基于已解码残差数据和帧间预测信息生成已解码块,且帧内编码器(722)可基于已解码残差数据和帧内预测信息生成已解码块。适当处理已解码块以生成已解码图片,且在一些实施例中,该已解码图片可在存储器电路(未示出)中缓冲并用作参考图片。
[0117]
熵编码器(725)用于将码流格式化以产生已编码的块。熵编码器(725) 根据hevc标准等合适标准产生各种信息。在实施例中,熵编码器(725)用于获得通用控制数据、所选预测信息(例如帧内预测信息或帧间预测信息)、残差信息和码流中的其它合适的信息。应注意,根据所公开的主题,当在帧间模式或双向预测模式的合并子模式中对块进行编码时,不存在残差信息。
[0118]
图8是根据本技术公开的另一实施例的视频解码器(810)的图。视频解码器(810)用于接收作为已编码视频序列的一部分的已编码图像,且对该已编码图像进行解码以生成重建的图片。在实施例中,视频解码器(810)用于代替图 4实施例中的视频解码器(410)。
[0119]
在图8实施例中,视频解码器(810)包括如图8中所示耦接到一起的熵解码器(871)、帧间解码器(880)、残差解码器(873)、重建模块(874)和帧内解码器(872)。
[0120]
熵解码器(871)可用于根据已编码图片来重建某些符号,这些符号表示构成该已编码图片的语法元素。此类符号可包括例如用于对该块进行编码的模式 (例如帧内模式、帧间模式、双向预测模式、后两者的合并子模式或另一子模式)、可分别识别供帧内解码器(872)或帧间解码器(880)用以进行预测的某些样本或元数据的预测信息(例如帧内预测信息或帧间预测信息)、呈例如量化的变换系数形式的残差信息等等。在实施例中,当预测模式是帧间或双向预测模式时,将帧间预测信息提供到帧间解码器(880);以及当预测类型是帧内预测类型时,将帧内预测信息提供到帧内解码器(872)。残差信息可经由逆量化并提供到残差解码器(873)。
[0121]
帧间解码器(880)用于接收帧间预测信息,且基于该帧间预测信息生成帧间预测结果。
[0122]
帧内解码器(872)用于接收帧内预测信息,且基于该帧内预测信息生成预测结果。
[0123]
残差解码器(873)用于执行逆量化以提取解量化的变换系数,且处理该解量化的变换系数,以将残差从频域转换到空间域。残差解码器(873)还可能需要某些控制信息(用以获得量化器参数qp),且该信息可由熵解码器(871)提供(未标示数据路径,因为这仅仅是低量控制信息)。
[0124]
重建模块(874)用于在空间域中组合由残差解码器(873)输出的残差与预测结果(可由帧间预测模块或帧内预测模块输出)以形成重建的块,该重建的块可以是重建的图片的一部分,该重建的图片继而可以是重建的视频的一部分。应注意,可执行解块操作等其它合适的操作来改善视觉质量。
[0125]
应注意,可使用任何合适的技术来实施视频编码器(403)、视频编码器(603) 和视频编码器(703)以及视频解码器(410)、视频解码器(510)和视频解码器(810)。在实施例中,可使用一个或多个集成电路来实施视频编码器(403)、视频编码器(603)和视频编码器(703)以及视频解码器(410)、视频解码器 (510)和视频解码器(810)。在另一实施例中,可使用执行软件指令的一个或多个处理器来实施视频编码器(403)、视频编码器(603)和视频编码器(603) 以及视频解码器(410)、视频解码器(510)和视频解码器(810)。
[0126]
本公开的各方面提供用于视频编码/解码的滤波技术。具体地,滤波技术应用于环路滤波器单元,例如预测环路中的环路滤波器单元(556)。例如,通过环路滤波器单元(556)滤波的图像存储在缓冲器(例如参考图片存储器(557)) 中,作为进一步预测的参考。环路滤波器单元可应用各种环路滤波器来进行样本滤波。在一些示例中,用于环路滤波器单元的环路滤波器配置指的是由环路滤波器单元应用的环路滤波器。
[0127]
具有基于块的滤波器自适应的自适应环路滤波器(alf)可由编码器/解码器应用以减少伪影。对于亮度分量,例如,可以基于局部梯度的方向和活性,给4
×
4亮度块选择多个滤波器(例如,25个滤波器)之一。
[0128]
alf可具有任何合适的形状和大小。参考图9,alf(910)-(911)具有菱形形状,例如alf(910)具有5
×
5菱形形状,alf(911)具有7
×
7菱形形状。在alf(910)中,元素(920)-(932)形成菱形形状且可以在滤波过程中使用。七个值(例如,c0-c6)可用于元素(920)-(932)。在alf(911) 中,元素(940)-(964)形成菱形形状且可以在滤波过程中使用。13个值(例如,c0-c12)可用于元素(940)-(964)。
[0129]
参考图9,在一些示例中,使用具有菱形滤波器形状的两个alf(910)
‑ꢀ
(911)。5
×
5菱形滤波器(910)可应用于色度分量(例如,色度块,色度cb),且7
×
7菱形滤波器(911)可应用于亮度分量(例如,亮度块,亮度cb)。可以在alf中使用其它合适的形状和大小。例如,可使用9
×
9菱形滤波器。
[0130]
位于由值(例如,(910)中的c0-c6或(920)中的c0-c12)指示的位置处的滤波器系数可以为非零。此外,当alf包括限幅函数时,位于这些位置处的限幅值可以为非零。
[0131]
对于亮度分量的块分类,可以将4
×
4块(或亮度块,亮度cb)分类或归类成多个(例如,25个)类别之一。可基于方向参数d和活性值a的量化值使用等式(1)来导出分类索引c。
[0132][0133]
为了计算方向参数d和量化值可使用1-d拉普拉斯分别计算垂直方向、水平方
向和两个对角方向(例如,d1和d2)的梯度gv,gh,g
d1
和g
d2
,如下。
[0134][0135][0136][0137][0138]
其中,索引i和j指的是4
×
4块内左上样本的坐标,且r(k,l)指示坐标(k,l)处的已重建样本。方向(例如,d1和d2)可指的是2个对角方向。
[0139]
为了降低上述块分类的复杂度,可应用子采样1-d拉普拉斯计算。图10a 至图10d示出了分别用于计算垂直方向(图10a)、水平方向(图10b)和两个对角方向d1(图10c)和d2(图10d)的梯度gv,gh,g
d1
和g
d2
的子采样位置的示例。相同的子采样位置可用于不同方向的梯度计算。在图10a中,标记
‘v’
示出了计算垂直梯度gv的子采样位置。在图10b中,标记

h’示出了计算水平梯度gh的子采样位置。在图10c中,标记

d1’示出了计算d1对角梯度g
d1
的子采样位置。在图10d中,标记

d2’示出了计算d2对角梯度g
d2
的子采样位置。
[0140]
水平方向的梯度gh和垂直方向的梯度gv的最大值和最小值可设置为:
[0141][0142]
两个对角方向的梯度g
d1
和g
d2
的最大值和最小值可设置为:
[0143][0144]
方向参数d可基于上述值和两个阈值t1和t2导出,如下。
[0145]
步骤1:如果(1)和(2)为真,则d设置为0。
[0146]
步骤2:如果则继续步骤3,否则继续步骤4。
[0147]
步骤3:如果则d设置为2,否则d设置为1。
[0148]
步骤4:如果则d设置为4,否则d设置为3。
[0149]
活性值a可计算为:
[0150][0151]
a可进一步量化到0至4的范围内(包含端点),且量化值表示为
[0152]
块分类不应用于图片中的色度分量,因此单个alf系数集可应用于每个色度分量。
[0153]
几何变换可应用于滤波器系数和对应的滤波器限幅值(还称为修剪值)。在对块(例如,4
×
4亮度块)进行滤波之前,例如根据针对块计算的梯度值(例如,gv,gh,g
d1
和/或g
d2
),诸如旋转或对角和垂直翻转的几何变换可应用于滤波器系数f(k,l)和对应的滤波器限幅值c(k,l)。应用于滤波器系数f(k, l)和对应的滤波器限幅值c(k,l)的几何变换可等同于将几何变换应用于滤波器所支持的区域中的样本。几何变换可通过使相应的方向对齐而使得不同块更类似,alf应用于不同块。
[0154]
包括对角翻转、垂直翻转和旋转的三个几何变换可分别如由等式(9)-(11) 描述
的那样执行。
[0155]
fd(k,l)=f(l,k),cd(k,l)=c(l,k)
ꢀꢀꢀ
等式(9)
[0156]
fv(k,l)=f(k,k-l-1),cv(k,l)=c(k,k-l-1)
ꢀꢀꢀ
等式(10)
[0157]fr
(k,l)=f(k-l-1,k),cr(k,l)=c(k-l-1,k)
ꢀꢀꢀ
等式(11)
[0158]
其中k是alf或滤波器的大小,且0≤k,l≤k-1是系数的坐标。例如,位置(0,0)位于左上角,且位置(k-1,k-1)位于滤波器f或限幅值矩阵(或限幅矩阵)c的右下角。根据针对块计算的梯度值,变换可应用于滤波器系数f (k,l)和限幅值c(k,l)。变换和四个梯度之间的关系的示例在表1中概述。
[0159]
表1:针对块计算的梯度与变换的映射
[0160][0161][0162]
在一些实施例中,在图片的自适应参数集(aps)中用信号发送alf滤波器参数。在aps中,可以用信号发送亮度滤波器系数和限幅值索引的一个或多个集(例如,多达25个集合)。在一个示例中,一个或多个集中的集可包括亮度滤波器系数和一个或多个限幅值索引。可以用信号发送色度滤波器系数和限幅值索引的一个或多个集(例如,多达8个集)为了减少信令开销,针对亮度分量的不同分类(例如,具有不同分类索引)的滤波器系数可以合并。在切片标头中,可以用信号发送用于当前切片的aps的索引。
[0163]
在一个实施例中,可从aps中解码出限幅值索引(还称为限幅索引)。限幅值索引可用于例如基于限幅值索引与对应的限幅值之间的关系来确定对应的限幅值。关系可以在解码器中预先定义并存储起来。在一个示例中,关系由诸如限幅值索引和对应的限幅值的亮度表(例如,用于亮度cb)、限幅值索引和对应的限幅值的色度表(例如,用于色度cb)的表来描述。限幅值可取决于位深度b。位深度b可指的是内部位深度,待滤波的cb中的已重建样本的位深度等。在一些示例中,使用等式(12)获得表(例如,亮度表,色度表)。
[0164][0165]
其中alfclip是限幅值,b是位深度(例如,bitdepth),n(例如,n=4) 是允许的限幅值的数量,且(n-1)是限幅值索引(还称为限幅索引或clipidx)。表2示出了当n=4时使用等式(12)获得的表的示例。在表2中,限幅索引 (n-1)可以是0,1,2和3,n可以是1,2,3和4。表2可用于亮度块或色度块。
[0166]
表2-alfclip可取决于位深度b和clipidx
[0167][0168][0169]
在当前切片的切片标头中,可以用信号发送一个或多个aps索引(例如,多达7个aps索引)以指定可用于当前切片的亮度滤波器集。可以在一个或多个合适的级别(例如图片级,切片级,ctb级等)控制滤波过程。在一个实施例中,可进一步在ctb级控制滤波过程。可以用信号发送标志,以指示alf 是否应用于亮度ctb。亮度ctb可以在多个固定滤波器集(例如,16个固定滤波器集)和在aps中用信号发送的滤波器集(还称为用信号发送的滤波器集) 之中选择滤波器集。滤波器集索引可以用信号发送给亮度ctb,以指示要应用的滤波器集(例如,多个固定滤波器集和用信号发送的滤波器集之中的滤波器集)。多个固定滤波器集可以在编码器和解码器中预先定义和硬编码,且可称为预定义滤波器集。
[0170]
对于色度分量,可以在切片标头中用信号发送aps索引,以指示要用于当前切片的色度滤波器集。在ctb级,如果aps中存在多于一个色度滤波器集,则滤波器集索引可以用信号发送给每个色度ctb。
[0171]
滤波器系数可使用等于128的范数进行量化。为了降低乘法复杂度,可应用码流合规性,使得非中心位置的系数值可位于-27至27-1的范围内(包括端点)。在一个示例中,在码流中不用信号发送中心位置系数,且可认为中心位置系数等于128。
[0172]
在一些实施例中,限幅索引和限幅值的语法和语义定义如下:
[0173]
alf_luma_clip_idx[sfidx][j]可用于指定在与由sfidx指示的用信号发送的亮度滤波器的第j个系数相乘之前所使用的限幅值的限幅索引。码流合规性的要求可包括:当sfidx=0至alf_luma_num_filter_signal_minus 1且j=0至11时 alf_luma_clip_idx[sfidx][j]的值应在0至3的范围内(包括端点)。
[0174]
根据设置成等于bitdepthy的bitdepth和设置成等于alf_luma_clip_idx [alf_luma_coeff_delta_idx[filtidx]][j]的clipidx,可如表2指定的那样导出具有元素alfclipl[adaption_parameter_set_id][filtidx][j]的亮度滤波器限幅值 alfclipl[adaption_parameter_set_id],其中filtidx=0至numalffilters-1且j=0至 11。alf_chroma_clip_idx[altidx][j]可用于指定在与具有索引altidx的替代色度滤波器的第j个系数相乘之前所使用的限幅值的限幅索引。码流合规性的要求可包括:当altidx=0至alf_
chroma_num_alt_filters_minus 1且j=0至5时, alf_chroma_clip_idx[altidx][j]的值应在0至3的范围内(包括端点)。
[0175]
根据设置成等于bitdepthc的bitdepth和设置成等于alf_chroma_clip_idx [altidx]][j]的clipidx,可如表2指定的那样导出具有元素 alfclipc[adaption_parameter_set_id][altidx][j]的色度滤波器限幅值 alfclipc[adaption_parameter_set_id][altidx],其中altidx=0至 alf_chroma_num_alt_filters_minus 1且j=0至5.
[0176]
在一个实施例中,滤波过程可如下所述。在解码器侧,当针对ctb启用 alf时,cu(或cb)内的样本r(i,j)可经滤波,从而产生如下使用等式(13) 所示滤波后的样本值r'(i,j)。在一个示例中,对cu中的每个样本进行滤波。
[0177][0178]
其中f(k,l)指示已解码滤波器系数,k(x,y)是限幅函数,c(k,l) 指示已解码限幅参数(或限幅值)。变量k和l可以在-l/2和l/2之间变化,其中l指示滤波器长度。限幅函数k(x,y)=min(y,max(-y,x)),对应于限幅函数clip3(-y,y,x)。通过包含限幅函数k(x,y),环路滤波方法(例如,alf)变成非线性过程且可称为非线性alf。
[0179]
在非线性alf中,可以在表3中提供多个限幅值集。在一个示例中,亮度集包括四个限幅值{1024,181,32,6},且色度集包括4个限幅值{1024,161, 25,4}。亮度集中的四个限幅值可通过在对数域中近似等分地拆分亮度块的样本值(以10位编码)的全范围(例如,1024)来选择。对于色度集,该范围可以从4到1024。
[0180]
表3-限幅值的示例
[0181] 帧内/帧间图块组亮度{1024,181,32,6}色度{1024,161,25,4}
[0182]
所选择的限幅值可以如下在“alf_data”语法元素中编码:合适的编码方案(例如,golomb编码方案)可用于对与如表3所示所选择的限幅值相对应的限幅索引进行编码。编码方案可以是用于对滤波器集索引进行编码的相同编码方案。
[0183]
在一个实施例中,虚拟边界滤波过程可用于减少alf的线缓冲区要求。因此,可以对接近ctu边界(例如,水平ctu边界)的样本采用经修改的块分类和滤波。如图11a所示,虚拟边界(1130)可通过使水平ctu边界(1120) 移动“n
samples
(n
样本
)”个样本来定义成线,其中n
samples
可以是正整数。在一个示例中,对于亮度分量,n
samples
等于4,且对于色度分量,n
samples
等于2。
[0184]
参考图11a,可以对亮度分量应用经修改的块分类。在一个示例中,对于虚拟边界(1130)上方的4
×
4块(1110)的1d拉普拉斯梯度计算,仅使用虚拟边界(1130)上方的样本。类似地,参考图11b,对于从ctu边界(1121) 移位的虚拟边界(1131)下方的4
×
4块(1111)的1d拉普拉斯梯度计算,仅使用虚拟边界(1131)下方的样本。因此,可通过考虑减少在1d拉普拉斯梯度计算中使用的样本的数量来改变活性值a的量化。
[0185]
对于滤波处理,虚拟边界处的对称填充操作可用于亮度分量和色度分量。图12a至图12f示出了这种经修改的alf滤波用于虚拟边界处的亮度分量的示例。当滤波后的样本位于虚拟边界下方时,可填充位于虚拟边界上方的相邻样本。当滤波后的样本位于虚拟边界
上方时,可填充位于虚拟边界下方的相邻样本。参考图12a,可使用位于虚拟边界(1210)下方的样本c2来填充相邻样本c0。参考图12b,可使用位于虚拟边界(1220)上方的样本c2来填充相邻样本c0。参考图12c,可分别使用位于虚拟边界(1230)下方的样本c5-c7 来填充相邻样本c1-c3。参考图12d,可分别使用位于虚拟边界(1240)上方的样本c5-c7来填充相邻样本c1-c3。参考图12e,可分别使用位于虚拟边界 (1250)下方的样本c10,c11,c12,c11和c10来填充相邻样本c4-c8。参考图12f,可分别使用位于虚拟边界(1260)上方的样本c10,c11,c12,c11 和c10来填充相邻样本c4-c8。
[0186]
在一些示例中,当样本和相邻样本位于虚拟边界的左侧(或右侧)和右侧 (或左侧)时,可适当地调整以上描述。
[0187]
根据本公开的一方面,为了提高编码效率,可基于滤波过程对图片进行分割。在一些示例中,ctu还称为最大编码单元(lcu)。在一个示例中,ctu 或lcu可具有64
×
64像素的大小。在一些实施例中,lcu对齐的图片四叉树拆分可用于基于滤波的分割。在一些示例中,可使用基于编码单元同步图片四元树的自适应环路滤波器。例如,亮度图片可拆分成若干多级四叉树分割,且每个分割边界与lcu的边界对齐。每个分割具有它自己的滤波过程,因此称为滤波器单元(fu)。
[0188]
在一些示例中,可使用2通编码流。在2通编码流的第一通处,可确定图片的四叉树拆分模式和每个fu的最佳滤波器。在一些实施例中,对图片的四叉树拆分模式的确定以及对fu的最佳滤波器的确定是基于滤波失真。在确定过程期间,可通过快速滤波失真估计(ffde)技术来估计滤波失真。使用四叉树分割来分割图片。根据所确定的四叉树拆分模式和所有fu的所选择的滤波器,可以对已重建图片进行滤波。
[0189]
在2通编码流的第二通处,执行cu同步alf开/关控制。根据alf开/关结果,通过已重建图片部分地恢复第一滤波后的图片。
[0190]
具体地,在一些示例中,采用自上而下的拆分策略,以通过率失真标准将图片分成多级四叉树分割。每个分割称为滤波器单元(fu)。拆分过程将四叉树分割与lcu边界对齐。fu的编码顺序遵循z-扫描顺序。
[0191]
图13示出了根据本公开的一些实施例的分割示例。在图13的示例中,图片(1300)拆分成10个fu,编码顺序是fu0,fu1,fu2,fu3,fu4,fu5, fu6,fu7,fu8和fu9。
[0192]
图14示出了用于图片(1300)的四叉树拆分图案(1400)。在图14的示例中,拆分标志用于指示图片分割模式。例如,“1”指示在块上执行四叉树分割;“0”指示块未被进一步分割。在一些示例中,最小大小fu具有lcu大小,最小大小fu不需要拆分标志。如图14所示,以z顺序对拆分标志进行编码和传输。
[0193]
在一些示例中,基于率失真标准从两个滤波器集中选择每个fu的滤波器。第一个集具有针对当前fu导出的、1/2对称的正方形滤波器和菱形滤波器。第二个集来自时间延迟的滤波器缓冲区;时间延迟的滤波器缓冲区存储先前针对先前图片的fu导出的滤波器。可以给当前fu选择具有这两个集的最小率失真成本的滤波器。类似地,如果当前fu不是最小fu且可进一步拆分成4个子 fu,则计算4个子fu的率失真成本。通过递归地比较拆分和不拆分情况下的率失真成本,可决定图片四叉树拆分模式。
[0194]
在一些示例中,可使用最大四叉树拆分级来限制fu的最大数量。在一个示例中,当最大四叉树拆分级为2时,fu的最大数量为16。进一步地,在四叉树拆分确定期间,用于导出
底部四叉树级处的16个fu(最小fu)的维纳系数的相关值可重新使用。其余fu可根据底部四叉树级处的16个fu的相关性来导出其维纳滤波器。因此,在该示例中,仅执行一个帧缓冲区访问,以导出所有fu的滤波器系数。
[0195]
在决定四叉树拆分模式之后,为了进一步减少滤波失真,可执行cu同步 alf开/关控制。通过比较每个叶cu处的滤波失真和非滤波失真,叶cu可以在其本地区域中显式地打开/关闭alf。在一些示例中,可通过根据alf开/关结果重新设计滤波器系数来进一步提高编码效率。
[0196]
跨分量滤波过程可应用跨分量滤波器,例如跨分量自适应环路滤波器 (cc-alf)。跨分量滤波器可使用亮度分量(例如,亮度cb)的亮度样本值来细化色度分量(例如,对应于亮度cb的色度cb)。在一个示例中,亮度cb 和色度cb包括在cu中。
[0197]
图15示出了根据本公开的一个实施例的用于生成色度分量的跨分量滤波器(例如,cc-alf)。在一些示例中,图15示出了针对第一色度分量(例如,第一色度cb)、第二色度分量(例如,第二色度cb)和亮度分量(例如,亮度cb)的滤波过程。亮度分量可由样本自适应偏移(sao)滤波器(1510)滤波,以生成sao滤波后的亮度分量(1541)。sao滤波后的亮度分量(1541) 可进一步经alf亮度滤波器(1516)滤波,以变成滤波后的亮度cb(1561) (例如,

y’)。
[0198]
第一色度分量可由sao滤波器(1512)和alf色度滤波器(1518)滤波,以生成第一中间分量(1552)。此外,sao滤波后的亮度分量(1541)可由用于第一色度分量的跨分量滤波器(例如,cc-alf)(1521)滤波,以生成第二中间分量(1542)。随后,滤波后的第一色度分量(1562)(例如,

cb’)可基于第一中间分量1552和第二中间分量1542中的至少一个而生成。在一个示例中,可通过将第一中间分量(1552)和第二中间分量(1542)与加法器(1522) 组合来生成滤波后的第一色度分量(1562)(例如,

cb’)。第一色度分量的跨分量自适应环路滤波过程可包括由cc-alf(1521)执行的步骤和由例如加法器(1522)执行的步骤。
[0199]
以上描述可适用于第二色度分量。第二色度分量可由sao滤波器(1514) 和alf色度滤波器(1518)滤波,以生成第三中间分量(1553)。此外,sao 滤波后的亮度分量(1541)可由用于第二色度分量的跨分量滤波器(例如, cc-alf)(1531)滤波,以生成第四中间分量(1543)。随后,滤波后的第二色度分量(1563)(例如,

cr’)可基于第三中间分量(1553)和第四中间分量(1543) 中的至少一个而生成。在一个示例中,可通过将第三中间分量(1553)和第四中间分量(1543)与加法器(1532)组合来生成滤波后的第二色度分量(1563) (例如,

cr’)。在一个示例中,第二色度分量的跨分量自适应环路滤波过程可包括由cc-alf(1531)执行的步骤和由例如加法器(1532)执行的步骤。
[0200]
跨分量滤波器(例如,cc-alf(1521),cc-alf(1531))可通过将具有任何合适滤波器形状的线性滤波器应用于亮度分量(或亮度通道)来操作,以细化每个色度分量(例如,第一色度分量,第二色度分量)。
[0201]
图16示出了根据本公开的一个实施例的滤波器(1600)的示例。滤波器 (1600)可包括非零滤波器系数和零滤波器系数。滤波器(1600)具有由滤波器系数(1610)形成的菱形形状(1620)(由具有黑色填充的圆圈指示)。在一个示例中,滤波器(1600)中的非零滤波器系数包括在滤波器系数(1610)中,且未包括在滤波器系数(1610)中的滤波器系数为零。因此,滤波器(1600) 中的非零滤波器系数包括在菱形形状(1620)中,且未包括在菱形形状
(1620) 中的滤波器系数为零。在一个示例中,滤波器(1600)的滤波器系数的数量等于滤波器系数(1610)的数量,在图16所示的示例中,滤波器系数的数量为 18。
[0202]
cc-alf可包括任何合适的滤波器系数(还称为cc-alf滤波器系数)。返回参考图15,cc-alf(1521)和cc-alf(1531)可具有相同的滤波器形状,例如图16所示的菱形形状(1620),以及cc-alf(1521)和cc-alf(1531) 可具有相同数量的滤波器系数。在一个示例中,cc-alf(1521)中的滤波器系数的值与cc-alf(1531)中的滤波器系数的值不同。
[0203]
通常,例如可以在aps中传输cc-alf中的滤波器系数(例如,非零滤波器系数)。在一个示例中,滤波器系数可由因子(例如,2
10
)缩放,且可针对固定点表示进行舍入。可以以可变块大小控制cc-alf的应用,且通过针对样本的每个块接收的上下文编码标志(例如,cc-alf启用标志)用信号发送 cc-alf的应用。上下文编码标志(例如,cc-alf启用标志)可以在任何合适的层级(例如,块级)用信号发送。针对每个色度分量,可以在切片级一起接收块大小和cc-alf启用标志。在一些示例中,可支持块大小(在色度样本中)16
×
16,32
×
32和64
×
64。
[0204]
图17示出了根据本公开的一些实施例的用于cc-alf的语法示例。在图 17的示例中,alf_ctb_cross_component_cb_idc[xctb》》ctblog2sizey][yctb》》 ctblog2sizey]是一个索引,其用于指示是否使用跨分量cb滤波器,以及如果使用的话,其指示跨分量cb滤波器的索引。例如,当 alf_ctb_cross_component_cb_idc[xctb》》ctblog2sizey][yctb》》ctblog2sizey] 等于0时,跨分量cb滤波器不应用于亮度位置(xctb,yctb)处的cb颜色分量样本的块;当alf_ctb_cross_component_cb_idc[xctb》》ctblog2sizey][yctb》》 ctblog2sizey]不等于0时,alf_ctb_cross_component_cb_idc[xctb》》 ctblog2sizey][yctb》》ctblog2sizey]是待应用的滤波器的索引。例如,第 alf_ctb_cross_component_cb_idc[xctb》》ctblog2sizey][yctb》》ctblog2sizey] 个跨分量cb滤波器应用于亮度位置(xctb,yctb)处的cb颜色分量样本的块。
[0205]
进一步地,在图17的示例中,alf_ctb_cross_component_cr_idc[xctb》》 ctblog2sizey][yctb》》ctblog2sizey]用于指示是否使用跨分量cr滤波器,以及是否使用跨分量cr滤波器的索引。例如,当 alf_ctb_cross_component_cr_idc[xctb》》ctblog2sizey][yctb》》ctblog2sizey] 等于0时,跨分量cr滤波器不应用于亮度位置(xctb,yctb)处的cr颜色分量样本的块;当alf_ctb_cross_component_cr_idc[xctb》》ctblog2sizey][yctb》》 ctblog2sizey]不等于0时,alf_ctb_cross_component_cr_idc[xctb》》 ctblog2sizey][yctb》》ctblog2sizey]是跨分量cr滤波器的索引。例如,第 alf_ctb_cross_component_cr_idc[xctb》》ctblog2sizey][yctb》》ctblog2sizey] 个跨分量cr滤波器可应用于亮度位置(xctb,yctb)处的cr颜色分量样本的块。
[0206]
在一些示例中,使用色度子采样技术,因此每个色度块中的样本的数量可小于亮度块中的样本的数量。色度子采样格式(还称为色度子采样格式,例如,由chroma_format_idc指定)可指示每个色度块与对应的亮度块之间的色度水平子采样因子(例如,subwidthc)和色度垂直子采样因子(例如,subheightc)。在一个示例中,色度子采样格式是4:2:0,因此色度水平子采样因子(例如,subwidthc)和色度垂直子采样因子(例如,subheightc)为2,如图18a和图 18b所示。在一个示例中,色度子采样格式是4:2:2,因此色度水平子采样因子(例如,subwidthc)为2,色度垂直子采样因子(例如,subheightc)为 1。
在一个示例中,色度子采样格式是4:4:4,因此色度水平子采样因子(例如,subwidthc)和色度垂直子采样因子(例如,subheightc)为1。色度样本类型(还称为色度样本位置)可指示色度块中的色度样本相对于亮度块中对应的至少一个亮度样本的相对位置。
[0207]
图18a和图18b示出了根据本公开的实施例的色度样本相对于亮度样本的示例性位置。参考图18a,亮度样本(1801)位于行(1811)-(1818)中。图 18a所示的亮度样本(1801)可表示图片的一部分。在一个示例中,亮度块(例如,亮度cb)包括亮度样本(1801)。亮度块可对应于具有色度子采样格式4: 2:0的两个色度块。在一个示例中,每个色度块包括色度样本(1803)。每个色度样本(例如,色度样本(1803(1))对应于四个亮度样本(例如,亮度样本(1801(1))-(1801(4))。在一个示例中,四个亮度样本是左上样本(1801 (1))、右上样本(1801(2))、左下样本(1801(3))和右下样本(1801(4))。色度样本(例如,(1803(1))位于左侧中心位置且位于左上样本(1801(1)) 和左下样本(1801(3))之间,具有色度样本(1803)的色度块的色度样本类型可称为色度样本类型0。色度样本类型0指示与位于左上样本(1801(1)) 和左下样本(1801(3))中间的左侧中心位置对应的相对位置0。四个亮度样本(例如,(1801(1))-(1801(4)))可称为色度样本(1803)(1)的相邻亮度样本。
[0208]
在一个示例中,每个色度块包括色度样本(1804)。参考色度样本(1803) 的以上描述可适用于色度样本(1804),因此为了简洁起见,可省略详细描述。每个色度样本(1804)可位于四个对应的亮度样本的中心位置处,且具有色度样本(1804)的色度块的色度样本类型可称为色度样本类型1。色度样本类型1 指示对应于四个亮度样本(例如,(1801(1))-(1801(4)))的中心位置的相对位置1。例如,一个色度样本(1804)可位于亮度样本(1801(1))-(1801 (4))的中心部分处。
[0209]
在一个示例中,每个色度块包括色度样本(1805)。每个色度样本(1805) 可位于与四个对应的亮度样本(1801)中的左上样本共同定位的左上位置处,且具有色度样本(1805)的色度块的色度样本类型可称为色度样本类型2。因此,每个色度样本(1805)与对应于相应色度样本的四个亮度样本(1801)中的左上样本共同定位。色度样本类型2指示对应于四个亮度样本(1801)的左上位置的相对位置2。例如,一个色度样本(1805)可位于亮度样本(1801(1))
ꢀ‑
(1801(4))的左上位置处。
[0210]
在一个示例中,每个色度块包括色度样本(1806)。每个色度样本(1806) 可位于对应的左上样本与对应的右上样本之间的顶部中心位置处,且具有色度样本(1806)的色度块的色度样本类型可称为色度样本类型3。色度样本类型3 指示对应于左上样本和右上样本之间的顶部中心位置的相对位置3。例如,一个色度样本(1806)可位于亮度样本(1801(1))-(1801(4))的顶部中心位置处。
[0211]
在一个示例中,每个色度块包括色度样本(1807)。每个色度样本(1807) 可位于与四个对应的亮度样本(1801)中的左下样本共同定位的左下位置处,且具有色度样本(1807)的色度块的色度样本类型可称为色度样本类型4。因此,每个色度样本(1807)与对应于相应色度样本的四个亮度样本(1801)中的左下样本共同定位。色度样本类型4指示对应于四个亮度样本(1801)的左下位置的相对位置4。例如,一个色度样本(1807)可位于亮度样本(1801(1))
ꢀ‑
(1801(4))的左下位置处。
[0212]
在一个示例中,每个色度块包括色度样本(1808)。每个色度样本(1808) 位于左下样本与右下样本之间的底部中心位置处,且具有色度样本(1808)的色度块的色度样本类型
可称为色度样本类型5。色度样本类型5指示对应于四个亮度样本(1801)的左下样本和右下样本之间的底部中心位置的相对位置5。例如,一个色度样本(1808)可位于亮度样本(1801(1))-(1801(4))的左下样本和右下样本之间。
[0213]
通常,任何合适的色度样本类型可用于色度子采样格式。色度样本类型0-5 是以色度子采样格式4:2:0描述的示例性色度样本类型。额外的色度样本类型可用于色度子采样格式4:2:0。此外,色度样本类型0-5的变型和/或其它色度样本类型可用于其它色度子采样格式,例如4:2:2,4:4:4等。在一个示例中,组合了色度样本(1805)和(1807)的色度样本类型用于色度子采样格式4:2:2。
[0214]
在一个示例中,认为亮度块具有交替行,例如行(1811)-(1812),行(1811)
ꢀ‑
(1812)分别包括四个亮度样本(例如,1801(1))-(1801(4))的顶部两个样本(例如,(1801(1))-(1801(2)))和四个亮度样本(例如,1801(1)
ꢀ‑
(1801(4)))的底部两个样本(例如,1801(3))-(1801(4)))。因此,行 (1811),(1813),(1815)和(1817)可称为当前行(还称为顶部场),且行(1812), (1814),(1816)和(1818)可称为下一行(还称为底部场)。四个亮度样本(例如,(1801(1))-(1801(4)))位于当前行(例如,(1811))和下一行(例如, (1812))处。相对位置2和3位于当前行中,相对位置0和1位于每个当前行与相应的下一行之间,相对位置4和5位于下一行中。
[0215]
在每个色度块中,色度样本(1803),(1804),(1805),(1806),(1807) 或(1808)位于行(1851)-(1854)中。行(1851)-(1854)的具体位置可取决于色度样本的色度样本类型。例如,对于分别具有色度样本类型0和1的色度样本(1803)-(1804),行(1851)位于行(1811)-(1812)之间。对于分别具有色度样本类型2和3的色度样本(1805)-(1806),行(1851)与当前行(1811)共同定位。对于分别具有色度样本类型4和5的色度样本(1807)
ꢀ‑
(1808),行(1851)与下一行(1812)共同定位。以上描述可适当地适用于行(1852)-(1854),且为了简洁起见,省略详细描述。
[0216]
任何合适的扫描方法可用于显示、存储和/或传输上文在图18a中描述的亮度块和对应的色度块。在一个示例中,使用逐行扫描。
[0217]
可使用隔行扫描,如图18b所示。如上所述,色度子采样格式是4:2:0(例如,chroma_format_idc等于1)。在一个示例中,变量色度位置类型(例如,chromaloctype)指示当前行(例如,chromaloctype是 chroma_sample_loc_type_top_field)或下一行(例如,chromaloctype是 chroma_sample_loc_type_bottom_field)。可分别扫描当前行(1811),(1813), (1815)和(1817)以及下一行(1812),(1814),(1816)和(1818),例如,可首先扫描当前行(1811),(1813),(1815)和(1817),然后扫描下一行(1812), (1814),(1816)和(1818)。当前行可包括亮度样本(1801),而下一行可包括亮度样本(1802)。
[0218]
类似地,可隔行扫描对应的色度块。包括无填充的色度样本(1803),(1804), (1805),(1806),(1807)或(1808)的行(1851)和(1853)可称为当前行 (或当前色度行),且包括灰色填充的色度样本(1803),(1804),(1805),(1806), (1807)或(1808)的行(1852)和(1854)可称为下一行(或下一色度行)。在一个示例中,在隔行扫描期间,首先扫描行(1851)和(1853),然后扫描行 (1852)和(1854)。
[0219]
在一些示例中,可使用约束定向增强滤波技术。环内约束定向增强滤波器 (cdef)的使用可滤除编码伪影,同时保留图像的细节。在一个示例(例如, hevc)中,样本自适应偏
移(sao)算法可通过对不同像素类别定义信号偏移来实现类似目标。与sao不同,cdef是非线性空间滤波器。在一些示例中, cdef可被约束为易于矢量化(即,可使用单指令多数据(simd)操作来实现)。应注意,其它非线性滤波器(例如中值滤波器,双边滤波器)无法以相同的方式处理。
[0220]
在一些情况下,已编码图像中的振铃伪影的量倾向于大致与量化步长成比例。细节量是输入图像的属性,但是保留在量化图像中的最小细节也倾向于与量化步长成比例。对于给定的量化步长,振铃的幅度通常小于细节的幅度。
[0221]
cdef可用于识别每个块的方向,然后沿着所识别的方向自适应地滤波,且沿着从所识别的方向旋转45度的方向较小程度地滤波。在一些示例中,编码器可搜索滤波器强度,且可显式地用信号发送滤波器强度,这允许对模糊的高度控制。
[0222]
具体地,在一些示例中,仅在滤波器解块之后对已重建像素执行方向搜索。由于那些像素可用于解码器,因此方向可由解码器搜索,因此在一个示例中,方向不需要信令。在一些示例中,方向搜索可以在某些块大小例如8
×
8块上操作,8
×
8块足够小以充分处理非直边,同时足够大以在应用于量化图像时可靠地估计方向。此外,在8
×
8区域上具有恒定方向使得滤波器的矢量化更容易。在一些示例中,每个块(例如,8
×
8)可与完美定向块进行比较,以确定差异。完美定向块是使得沿着一个方向的线的所有像素具有相同值的块。在一个示例中,可计算该块和完美定向块中的每一个的差测量,例如平方差(ssd)之和,均方根(rms)误差。然后,可确定具有最小差(例如,最小ssd,最小rms 等)的完美定向块,且所确定的完美定向块的方向可以是与块中的模式最佳匹配的方向。
[0223]
图19示出了根据本公开的一个实施例的方向搜索的示例。在一个示例中,块(1910)是被重建且从滤波器的解块输出的8
×
8块。在图19的示例中,方向搜索可以给块(1910)确定由(1920)示出的8个方向中的一个方向。8个完美定向块(1930)分别对应于8个方向(1920)而形成。对应于方向的完美定向块是使得沿着该方向的线的像素具有相同值的块。此外,可计算块(1910) 和完美定向块(1930)中的每一个的差测量,例如ssd,rms误差等。在图 19的示例中,rms误差由(1940)示出。如(1943)所示,块(1910)和完美定向块(1933)的rms误差最小,因此方向(1923)是与块(1910)中的模式最佳匹配的方向。
[0224]
在识别块的方向之后,可确定非线性低通方向滤波器。例如,非线性低通方向滤波器的滤波器抽头可沿着所识别的方向对齐,以减少振铃,同时保留定向边缘或图案。然而,在一些示例中,仅靠定向滤波有时不能充分地减少振铃。在一个示例中,额外的滤波器抽头还用于不位于所识别的方向上的像素。为了降低模糊的风险,更保守地处理额外的滤波器抽头。为此,cdef包括主滤波器抽头和次滤波器抽头。在一个示例中,完整的2-d cdef滤波器可表示为等式(14):
[0225][0226]
其中,d表示阻尼参数,s
(p)
表示主滤波器抽头的强度,s
(s)
表示次滤波器抽头的强度,round(
·
)表示绕过远离零的限制的操作,w表示滤波器权重, f(d,s,d)是对滤波后的像素和每个相邻像素之间的差进行操作的约束函数。在一个示例中,对于小的差异,函数f(d,s,d)等于d,这可使得滤波器表现得像线性滤波器;当差异较大时,函数f(d,s,d)等于0,
这可有效地忽略滤波器抽头。
[0227]
在一些示例中,在视频编码后解块中使用环路内恢复方案,以大体上去噪并增强边缘的质量,除了解块操作之外。在一个示例中,环路内恢复方案在每个适当大小的图块的帧内是可切换的。环路内恢复方案基于可分离的对称维纳滤波器,具有子空间投影的双自引导滤波器,以及域变换递归滤波器。因为内容统计基本上可以在帧内变化,所以环路内恢复方案集成在可切换的框架内,其中可以在帧的不同区域中触发不同的方案。
[0228]
可分离的对称维纳滤波器可以是环路内恢复方案之一。在一些示例中,退化帧中的每个像素可重建为每个像素周围的w
×
w窗口内的像素的非因果滤波版本,其中w=2r 1,对于整数r,w是奇数。如果2d滤波器抽头由列矢量化形式的w2×
1元素矢量f表示,则直接lmmse优化导致滤波器参数由f=h-1
m 给出,其中h=e[xx
t
]是x,像素周围的w
×
w窗口中的w2个样本的列矢量化版本的自协方差,且m=e[yx
t
]是x与要估计的标量源样本y的互相关。在一个示例中,编码器可根据解块帧和源中的实现来估计h和m,且可以将所得到的滤波器f发送到解码器。然而,这不仅在发送w2个抽头时引起相当大的比特率成本,而且不可分离的滤波将使得解码非常复杂。在一些实施例中,对f的性质施加若干附加约束。对于第一个约束,f被约束为可分离的,使得滤波可实现为可分离的水平和垂直w抽头卷积。对于第二个约束,水平滤波器和垂直滤波器中的每一个被约束为对称。对于第三个约束,假设水平滤波器系数和垂直滤波器系数之和为1。
[0229]
具有子空间投影的双自引导滤波可以是环路内恢复方案之一。引导滤波是图像滤波技术,其中局部线性模型由等式(15)所示:
[0230]
y=fx g
ꢀꢀꢀ
等式(15)
[0231]
局部线性模型用于根据未滤波样本x计算滤波后的输出y,其中f和g基于滤波后的像素附近的引导图像和退化图像的统计来确定。如果引导图像与退化图像相同,则得到的所谓的自引导滤波具有边缘保持平滑的效果。在一个示例中,可使用特定形式的自引导滤波。自引导滤波的具体形式取决于两个参数:半径r和噪声参数e,列举为如下步骤:
[0232]
1.获得每个像素周围的(2r 1)
×
(2r 1)窗口中的像素的均值μ和方差σ2。该步骤可使用基于积分成像的箱式滤波来有效地实现。
[0233]
2.针对每个像素,计算:f=σ2/(σ2 e);g=(1-f)μ
[0234]
3.计算每个像素的f和g,作为所使用的像素周围的3
×
3窗口中的f和g 值的平均值。
[0235]
自引导滤波器的具体形式由r和e控制,其中较高的r意味着较高的空间方差,且较高的e意味着较高的范围方差。
[0236]
图20示出了在一些示例中说明子空间投影的示例。如图20所示,即使恢复x1,x2均不接近源y,适当的乘法器{α,β}可使x1,x2更接近源y,只要 x1,x2沿着向右方向稍微移动即可。
[0237]
在一些示例(例如,hevc)中,可使用被称为样本自适应偏移(sao) 的滤波技术。在一些示例中,在滤波器解块之后将sao应用于重建信号。sao 可使用切片标头中给出的偏移值。在一些示例中,对于亮度样本,编码器可决定是否在切片上应用(启用)sao。当启用sao时,当前图片允许将编码单元递归地拆分成四个子区域,且每个子区域可基于子区域中的特征从多个sao类型中选择sao类型。
[0238]
图21示出了根据本公开的一个实施例的多个sao类型的表(2100)。在表(2100)中,示出了sao类型0-6。应注意,sao类型0用于指示不应用sao。此外,sao类型1至sao类型6中的每个sao类型包括多个类别。sao可以将子区域的已重建像素分类成多个类别,且通过给子区域中的每个类别的像素添加偏移来减少失真。在一些示例中,边缘属性可用于sao类型1至4中的像素分类,且像素强度可用于sao类型5和6中的像素分类。
[0239]
具体地,在一个实施例中,例如sao类型5和6,带偏移(bo)可用于将子区域的所有像素分类成多个带。多个带中的每个带包括相同强度区间中的像素。在一些示例中,强度范围等分成多个区间,例如从零到最大强度值的32 个区间(例如,8位的像素有255个区间),且每个区间与偏移相关联。此外,在一个示例中,32个带分成两个组,例如第一组和第二组。第一组包括中央16 个带(例如,在强度范围的中间的16个区间),而第二组包括其余16个带(例如,在强度范围的低侧的8个区间和在强度范围的高侧的8个区间)。在一个示例中,仅传输两个组中的一个组的偏移。在一些实施例中,当使用bo中的像素分类操作时,每个像素的五个最有效的位可直接用作带索引。
[0240]
此外,在一个实施例中,例如sao类型1至4,边缘偏移(eo)可用于像素分类和确定偏移。例如,可考虑边缘方向信息,基于1维3像素模式来确定像素分类。
[0241]
图22示出了在一些示例中,用于边缘偏移的像素分类的3像素图案的示例。在图22的示例中,第一图案(2210)(如3个灰色像素所示)称为0度图案(水平方向与0度图案相关联),第二图案(2220)(如3个灰色像素所示)称为90 度图案(垂直方向与90度图案相关联),第三图案(2230)(如3个灰色像素所示)称为135度图案(135度对角方向与135度图案相关联),第四图案(2240) (如3个灰色像素所示)称为45度图案(45度对角方向与45度图案相关联)。在一个示例中,可考虑子区域的边缘方向信息来选择图22所示的四个方向图案中的一个方向图案。在一个示例中,选择可以在已编码视频码流中作为辅助信息来传输。然后,可通过将每个像素与在与方向图案相关联的方向上的两个相邻像素进行比较,来将子区域中的像素分类成多个类别。
[0242]
图23示出了在一些示例中,用于边缘偏移的像素分类规则的表(2300)。具体地,像素c(还在图22的每个图案中示出)与两个相邻像素(还在图22 的每个图案中由灰色示出)进行比较,且像素c可基于比较,根据图23所示的像素分类规则,而分类成类别0至4之一。
[0243]
在一些实施例中,解码器侧上的sao可独立于最大编码单元(lcu)(例如,ctu)来操作,使得可节省线缓冲区。在一些示例中,当选择90度、135 度和45度分类图案时,每个lcu中顶部行和底部行的像素未受到sao处理;当选择0度、135度和45度图案时,每个lcu中最左侧列和最右侧列的像素未受到sao处理。
[0244]
图24示出了如果没有从相邻ctu合并参数,则可能需要用信号发送给 ctu的语法的示例(2400)。例如,可以用信号发送语法元素 sao_type_idx[cidx][rx][ry],以指示子区域的sao类型。sao类型可以是bo(带偏移)或eo(边缘偏移)。当sao_type_idx[cidx][rx][ry]取值为0时,其指示sao 为off;取值为1至4,则指示使用对应于0
°
,90
°
,135
°
和45
°
的4个 eo类别之一;取值为5,则指示使用bo。在图24的示例中,bo类型和eo 类型中的每一个具有用信号发送的四个sao偏移值(sao_offset[cidx][rx][ry][0] 至sao_offset[cidx][rx][ry][3])。
[0245]
如图24所示,sao是需要额外的信令开销来指示执行sao滤波所需的所有相关信息
的滤波过程,如图24所示,这可限制sao的潜能。
[0246]
通常,滤波过程可使用第一颜色分量的已重建样本作为输入(例如,y或cb或cr,或者r或g或b)以生成输出,且滤波过程的输出应用于第二颜色分量,第二颜色分量可以与第一颜色分量相同,或者可以是与第一颜色分量不同的另一颜色分量。
[0247]
在跨分量滤波(ccf)的相关示例中,基于一些数学方程导出滤波器系数。从编码器侧到解码器侧,用信号发送所导出的滤波器系数,且使用所导出的滤波器系数来使用线性组合生成偏移。然后,所生成的偏移添加到已重建样本,作为滤波过程。例如,基于滤波系数与亮度样本的线性组合来生成偏移,且所生成的偏移添加到已重建色度样本。ccf的相关示例是基于已重建亮度样本值与原始色度样本和已重建色度样本之间的δ值之间的线性映射关系的假设。然而,已重建亮度样本值与原始色度样本和已重建色度样本之间的δ值之间的映射不一定遵循线性映射过程,因此ccf的编码性能可以在线性映射关系的假设下受到限制。
[0248]
在一些示例中,非线性映射技术可用于跨分量滤波和/或相同颜色分量滤波,而不存在显著的信令开销。在一个示例中,非线性映射技术可用于跨分量滤波,以生成跨分量样本偏移。在另一示例中,非线性映射技术可用于相同颜色分量滤波,以生成局部样本偏移。
[0249]
为了方便起见,使用非线性映射技术的滤波过程可称为通过非线性映射的样本偏移(so-nlm)。在跨分量滤波过程中,so-nlm可称为跨分量样本偏移 (ccso)。在相同颜色分量滤波中,so-nlm可称为局部样本偏移(lso)。
[0250]
在一个示例中,ccso和lso可用作环路滤波,以减少已重建样本的失真。 ccso和lso不依赖于在相关示例ccf中使用的线性映射假设。例如,ccso 不依赖于亮度已重建样本值与原始色度样本和色度已重建样本之间的δ值之间的线性映射关系的假设。类似地,lso不依赖于颜色分量的已重建样本值与颜色分量的原始样本和颜色分量的已重建样本之间的δ值之间的线性映射关系的假设。
[0251]
在以下描述中,描述so-nlm滤波过程,so-nlm滤波过程使用第一颜色分量的已重建样本作为输入(例如,y或cb或cr,或者r或g或b)以生成输出,且滤波过程的输出应用于第二颜色分量。当第二颜色分量是与第一颜色分量相同的颜色分量时,描述适用于lso;以及当第二颜色分量不同于第一颜色分量时,描述适用于ccso。
[0252]
在so-nlm中,在编码器侧导出非线性映射。非线性映射位于滤波器支持区域中的第一颜色分量的已重建样本与带添加到滤波器支持区域中的第二颜色分量的偏移之间。当第二颜色分量与第一颜色分量相同时,非线性映射用于 lso;当第二颜色分量与第一颜色分量不同时,非线性映射用于ccso。非线性映射的域通过处理后的输入已重建样本(还称为可能的已重建样本值的组合) 的不同组合来确定。
[0253]
可使用具体示例来说明so-nlm的技术。在具体示例中,确定来自位于滤波器支持区域(还称为“滤波器支持区域”)中的第一颜色分量的已重建样本。滤波器支持区域是可应用滤波器的区域,且滤波器支持区域可具有任何合适的形状。
[0254]
图25示出了根据本公开的一些实施例的滤波器支持区域(2500)的示例。滤波器支持区域(2500)包括第一颜色分量的四个已重建样本:p0,p1,p2和 p3。在图25的示例中,四个已重建样本可沿着竖直方向和水平方向形成交叉形状,且交叉形状的中心位置是待滤波的样本的位置。在中心位置处且具有与 p0-p3相同的颜色分量的样本由c表示。在中心位置
处且具有第二颜色分量的样本由f表示。第二颜色分量可以与p0-p3的第一颜色分量相同或者可以不同于p0-p3的第一颜色分量。
[0255]
图26示出了根据本公开的一些实施例的另一滤波器支持区域(2600)的示例。滤波器支持区域(2600)包括第一颜色分量的四个已重建样本p0,p1,p2 和p3,样本p0,p1,p2和p3形成正方形形状。在图26的示例中,正方形形状的中心位置是待滤波的样本的位置。在中心位置处且具有与p0-p3相同的颜色分量的样本由c表示。在中心位置处且具有第二颜色分量的样本由f表示。第二颜色分量可以与p0-p3的第一颜色分量相同或者可以不同于p0-p3的第一颜色分量。
[0256]
然后,已重建样本被适当地处理以形成滤波器抽头。在具体示例中,在以下两个步骤中处理已重建样本。
[0257]
在第一步骤中,分别计算p0-p3与c之间的δ值。例如,m0表示p0与c 之间的δ值;m1表示p1与c之间的δ值;m2表示p2与c之间的δ值;m3 表示p3与c之间的δ值。
[0258]
在第二步骤中,进一步量化δ值m0-m3,量化值表示为d0,d1,d2,d3。在一个示例中,量化值可以是基于量化过程的-1,0,1之一。例如,当m小于-n(n是正值且称为量化步长)时,可以将值m量化为-1;当m位于[-n,n] 的范围内时,可以将值m量化为0;以及当m大于n时,可以将值m量化为1。在一些示例中,量化步长n可以是4,8,12,16等之一。
[0259]
在一些实施例中,量化值d0-d3是滤波器抽头,且可用于识别滤波器域中的一个组合。例如,滤波器抽头d0-d3可以在滤波器域中形成组合。每个滤波器抽头可具有三个量化值,因此当使用四个滤波器抽头时,滤波器域包括81(3
ꢀ×3×3×
3)个组合。
[0260]
图27a至图27c示出了根据本公开的一个实施例的具有81个组合的表 (2700)。表(2700)包括对应于81个组合的81行。在对应于组合的每一行中,第一列包括组合的索引;第二列包括组合的滤波器抽头d0的值;第三列包括组合的滤波器抽头d1的值;第四列包括组合的滤波器抽头d2的值;第五列包括组合的滤波器抽头d3的值;第六列包括与非线性映射的组合相关联的偏移值。在一个示例中,当确定滤波器抽头d0-d3时,可根据表(2700)确定与d0-d3 的组合相关联的偏移值(由s表示)。在一个示例中,偏移值s0-s80是整数,例如0,1,-1,3,-3,5,-5,-7等。
[0261]
在一些实施例中,可应用so-nlm的最终滤波过程,如等式(16)所示:
[0262]
f'=clip(f s)
ꢀꢀꢀ
等式(16)
[0263]
其中f是待滤波的第二颜色分量的已重建样本,s是根据滤波器抽头确定的偏移值,滤波器抽头是第一颜色分量的已重建样本的处理结果,例如使用表 (2700)处理的结果。已重建样本f和偏移值s之和进一步限幅到与位深度相关联的范围内,以确定第二颜色分量的最终滤波样本f'。
[0264]
应注意,在lso的情况下,以上描述中的第二颜色分量与第一颜色分量相同;在ccso的情况下,以上描述中的第二颜色分量可以不同于第一颜色分量。
[0265]
应注意,针对本发明的其它实施例,可调整上述描述。
[0266]
在一些示例中,在编码器侧,编码设备可导出滤波器支持区域中的第一颜色分量的已重建样本与待添加到第二颜色分量的已重建样本的偏移之间的映射。映射可以是任何合适的线性或非线性映射。然后,在编码器侧和/或解码器侧,可基于映射来应用滤波过程。例如,向解码器适当地通知映射(例如,映射包括在从编码器侧发送到解码器侧的已编码视
频码流中),然后解码器可基于映射来执行滤波过程。
[0267]
在一些示例中,可使用被称为半解耦分割(sdp)的技术。在一个示例中,一种sdp技术使用半解耦树(sdt)。sdt技术还称为半独立树(sst)或用于色度分量的柔性块分割。在sdt技术中,超级块(sb)(例如在aomedia video 1(av1)定义)或ctu(例如在hevc中定义)中的亮度块和色度块可具有相同或不同的块分割,且块分割可取决于亮度编码块大小或亮度树深度。在一个示例中,当亮度块区域大小大于第一阈值t1或亮度块的编码树拆分深度小于或等于第二阈值t2时,色度块使用与亮度相同的编码树结构。否则,当亮度块区域大小小于或等于t1或亮度拆分深度大于t2时,对应的色度块可具有与亮度分量不同的编码块分割,这称为色度分量的柔性块分割。在上述示例中, t1是正整数,例如128或256;t2是正整数,例如1或2。
[0268]
图28示出了用于亮度分量和色度分量的编码树结构的示例。图28示出了用于超级块中的亮度分量的第一分割结构(2810),以及用于超级块中的色度分量的第二分割结构(2850)。应注意,虽然在图28中使用4:2:0色度子采样方案,但是当使用其它色度子采样方案时,可适当地改变图28。在图28中,块中的d1指示块的编码树拆分深度为1;块中的d2指示块的编码树拆分深度为2;以及块中的d3指示块的编码树拆分深度为3。
[0269]
在图28的示例中,t2设置为1。因此,当编码树拆分深度等于1时,第一分割结构(2810)和第二分割结构(2850)具有相同的块分割结构。例如,超级块的亮度块区域根据四叉树(qt)分割而分成(2811)-(2814)(例如,较大的方形块分成相等大小的四个较小方形块),根据qt分割将对应的色度块区域分成(2851)-(2854)。
[0270]
当编码树拆分深度大于t2时,亮度块区域和对应的色度块区域可具有不同的编码块分割结构。例如,使用垂直二叉树(bt)分割将亮度块区域(2813) 分成(2821)和(2822)(例如,较大块通过垂直线分成相等大小的两个较小块),使用qt分割将对应的色度块区域(2853)分成(2861)-(2864)。
[0271]
此外,在另一sdp技术中,亮度分量和色度分量可以从超级块的根节点开始共享部分树结构,且与亮度和色度开始不同的树分割相关的条件取决于来自码流的高级语法或亮度分量的分割信息。
[0272]
基于块的补偿可用于帧间预测和帧内预测。对于帧间预测,来自不同图片的、基于块的补偿被称为运动补偿。还可以从相同图片内的先前重建区域执行基于块的补偿。来自相同图片内的已重建区域的、基于块的补偿被称为帧内图片块补偿、当前图片参考(cpr)或帧内块复制(intrabc)。指示当前块与相同图片中的参考块之间的偏移的位移矢量被称为块矢量(bv),其中可基于参考块对当前块进行编码/解码。运动补偿中的运动矢量可以是任何值(在x或y 方向上为正值或负值),与运动补偿中的运动矢量不同,bv具有数个约束以确保参考块可用且已重建。此外,在一些示例中,出于并行处理的考虑,排除诸如图块边界、切片边界或波前梯形边界的一些参考区域。
[0273]
可以对块矢量(bv)进行编码以指定预测值块的位置。块矢量的编码可以是显式的或隐式的。在显式模式中,用信号发送块矢量与块矢量的预测值(还被称为块矢量预测值)之间的bv差异。在隐式模式中,块矢量以与合并模式中的运动矢量类似的方式从块矢量的预测值(被称为块矢量预测值)中恢复,不必使用bv差异。显式模式可被称为不合并bv预测模式。隐式模式可被称为合并bv预测模式。
[0274]
在一些实现方式中,块矢量的分辨率限制到整数位置。在其它实现方式中,允许块矢量指向分数位置。
[0275]
在一些示例中,对于当前块,首先在已编码视频码流中发送指示当前块是否处于intrabc模式的标志(例如,intrabc标志)。然后,如果当前块处于intrabc 模式,则通过从当前bv减去参考bv(例如,块矢量预测值)来获得bv差异 (例如,diff),然后根据diff的水平分量和垂直分量将diff分类为四种类型。类型信息需要在码流中发送,之后,可基于类型信息来用信号发送两个分量的diff值。
[0276]
根据本公开的一方面,在intrabc模式中,根据当前图片中的已重建样本来形成预测值块,然后应用环路滤波;以及在帧间预测模式中,在应用环路滤波之后,根据其它图片中的已重建样本来形成预测值块。当在intrabc模式中禁用环路滤波器时,可以在intrabc模式和帧间预测之间共享已重建样本的图片缓冲器,且可简化硬件设计。
[0277]
在一些示例(例如,aomedia video 1(av1))中,当启用intrabc模式时,对亮度分量和色度分量启用intrabc模式,且对亮度分量和色度分量禁用所有环路滤波器。环路滤波器可包括解块滤波器、约束定向增强滤波器(cdef)、环路恢复(lr)滤波器等。然而,在一些示例中,当sdp开启时,可以对一个颜色分量例如亮度分量启用intrabc模式,但是对另一颜色分量例如色度分量禁用intrabc模式。根据本公开的一些方面,可以对不同的颜色分量启用或禁用环路滤波器,且由于在一些颜色分量中使用环路滤波器,因此可实现更好的图片质量。例如,当仅对亮度分量启用intrabc模式时,可以对亮度分量和色度分量不同地启用/禁用环路滤波器。例如,响应于对亮度分量启用intrabc 模式,而对亮度分量禁用环路滤波器,且可响应于对色度分量禁用intrabc模式,而对色度分量启用环路滤波器。因此,由于对亮度分量禁用环路滤波器,因此图片缓冲器可以在intrabc模式与帧间预测模式之间共享,且由于在色度分量中使用环路滤波器,因此可实现更好的图片质量。
[0278]
在以下描述中,在环路滤波中使用的滤波器被称为环路(内)滤波器,且可包括分别对可访问的一个帧/切片/图块内的已重建样本进行操作的任何滤波器。环路(内)滤波器包括但不限于解块(db)滤波器、cdef滤波器、环路恢复滤波器、ccso滤波器、lso滤波器等。
[0279]
根据本公开的一些方面,当对亮度分量启用intrabc模式但是对色度分量禁用intrabc模式时,允许至少一个环路(内)滤波器用于色度分量。
[0280]
在一些实施例中,当对亮度分量启用intrabc模式但是对色度分量禁用 intrabc模式时,可允许所有环路(内)滤波器用于色度分量。在一个示例中,当对亮度分量启用intrabc模式但是对色度分量禁用intrabc模式时,允许db 滤波器、cdef滤波器、lr滤波器、ccso滤波器和lso滤波器用于色度分量。
[0281]
在一些实施例中,当对亮度分量启用intrabc模式但是对色度分量禁用 intrabc模式时,允许ccso滤波器或lso滤波器用于色度分量。
[0282]
在一个实施例中,当对亮度分量启用intrabc模式但是对色度分量禁用 intrabc模式时,允许ccso滤波器和cdef滤波器用于色度分量。
[0283]
在一个实施例中,分别在图片级,用信号发送对不同颜色分量启用/禁用 intrabc模式。然后,如果在图片级对颜色分量禁用intrabc模式,则允许至少一个环路滤波器用于图片中的颜色分量。
[0284]
在一个示例中,分别使用两个不同的图片级标志来指示在图片级,对亮度分量和
色度分量启用/禁用intrabc模式。例如,第一标志“cm-》features.allow_intrabc_luma”用于指示对亮度分量(还被称为亮度通道) 启用/禁用intrabc模式,以及第二标志“cm-》features.allow_intrabc_chroma”用于指示对色度分量(还被称为色度信道)启用/禁用intrabc模式。当第一标志“cm-》features.allow_intrabc_luma”开启(例如,具有值“1”)且第二标志“cm-》features.allow_intrabc_chroma”关闭(例如,具有值“0”)时,允许至少一个环路滤波器用于色度分量。
[0285]
在另一示例中,分别使用三个不同的图片级标志来指示对y/cb/cr分量启用/禁用intrabc模式。例如,第一标志“cm-》features.allow_intrabc_y”用于指示对y分量(还被称为亮度分量)启用/禁用intrabc模式,第二标志“cm-》features.allow_intrabc_cb”用于指示对cb分量(还被称为第一色度分量) 启用/禁用intrabc模式,以及第三标志“cm-》features.allow_intrabc_cr”用于指示对cr分量(还被称为第二色度分量)启用/禁用intrabc模式。例如,当第一标志“cm-》features.allow_intrabc_y”开启(例如,具有值“1”),第二标志“cm-》features.allow_intrabc_cb”和第三标志“cm-》features.allow_intrabc_cr”关闭(均具有值“0”)时,允许至少一个环路滤波器用于cb分量和cr分量。
[0286]
在一个实施例中,如果对亮度分量和色度分量开启intrabc模式,则亮度块和相关联的色度块共享相同的块矢量(bv),且在一些示例中,对亮度块和色度块禁用环路滤波器。
[0287]
在一些示例中,是否对一个颜色分量(例如,y,cb,cr)应用环路(内) 滤波器的条件取决于指示对所述颜色分量启用/禁用intrabc模式的标志。在一个示例中,当标志指示对颜色分量(例如,y,cb,cr)禁用intrabc模式时,环路(内)滤波器可应用于颜色分量;以及标志指示对颜色分量(例如,y, cb,cr)启用intrabc模式时,对颜色分量禁用环路(内)滤波器。
[0288]
在一些示例中,是否对一个颜色通道(亮度/色度)应用环路(内)滤波器的条件取决于指示对所述颜色通道启用/禁用intrabc模式的标志。在一个示例中,当标志指示对颜色通道(例如,亮度或色度)禁用intrabc模式时,环路 (内)滤波器可应用于颜色通道;以及当标志指示对颜色通道(例如,亮度或色度)启用intrabc模式时,对颜色通道禁用环路(内)滤波器。
[0289]
在一些实施例中,单独在块级,用信号发送对不同颜色分量启用/禁用 intrabc模式。然后,如果在块级对颜色分量禁用intrabc模式,则允许至少一个环路滤波器用于颜色分量中的当前块。块可解释为预测块、编码块或编码单元,即cu,ctu块或超级块,或滤波单元(fu)。
[0290]
在一个示例中,分别使用两个不同的块级标志来指示在块级,对亮度分量和色度分量启用/禁用intrabc模式。例如,第一标志“mi_params-》mi_grid_base[x]-》allow_intrabc_luma”用于指示在块级,对亮度分量启用/禁用intrabc模式,以及第二标志“mi_params-》mi_grid_base[x]-》allow_intrabc_chroma”用于指示在块级,对色度分量启用/禁用intrabc模式。例如,当第一标志“mi_params-》mi_grid_base[x]-》allow_intrabc_luma”开启(例如,具有值“1”) 且第二标志“mi_params-》mi_grid_base[x]-》allow_intrabc_chroma”关闭(例如,具有值“0”)时,允许至少一个环路滤波器用于当前色度块。
[0291]
在另一示例中,分别使用三个不同的块级标志来指示对y/cb/cr块启用/禁用intrabc模式。例如,第一标志“mi_params-》mi_grid_base[x]-》allow_intrabc_y”用于指
示对y块启用/禁用intrabc模式,第二标志“mi_params-》mi_grid_base[x]-》allow_intrabc_cb”用于指示对cb块启用/禁用intrabc模式,以及第三标志“mi_params-》mi_grid_base[x]-》allow_intrabc_cr”用于指示对cr块启用/禁用intrabc模式。例如,当第一标志“mi_params-》mi_grid_base[x]-》allow_intrabc_y”开启(例如,具有值“1”),第二标志“mi_params-》mi_grid_base[x]-》allow_intrabc_cb”和第三标志“mi_params-》mi_grid_base[x]-》allow_intrabc_cr”关闭(例如,均具有值“0”) 时,允许至少一个环路滤波器用于当前cb块和当前cr块。
[0292]
在另一实施例中,可以采用高级语法(hls)用信号发送intrabc模式的启用/禁用,hls例如自适应参数集(aps),切片标头,帧标头,图片参数集 (pps),序列参数设置(sps),视频参数集(vps)等。
[0293]
在一些实施例中,当应用intrabc模式时,是否可应用特定环路滤波器(例如,db滤波器,cdef滤波器,lr滤波器,ccso滤波器,lso滤波器),取决于在hls(aps,切片标头,帧标头,pps,sps,vps)处用信号发送的另一标志。在一个实施例中,针对cdef滤波器,在切片标头处用信号发送标志“slice_force_cdef_flag_luma”。在一个示例中,当标志“slice_force_cdef_flag_luma”在切片的切片标头中用信号发送为真(例如,具有值“1”)时,cdef滤波器将应用于切片中的亮度分量,而不考虑是否启用 intrabc模式。在另一示例中,当标志“slice_force_cdef_flag_luma”在切片的切片标头中用信号发送为假(例如,具有值“0”)时,cdef滤波器是否将应用于切片中的亮度分量,仍然取决于是否启用intrabc模式。
[0294]
在一些实施例中,无论是否允许intrabc模式用于当前帧/切片/图块,都允许至少一个环路(内)滤波器用于色度分量。
[0295]
在一些实施例中,无论是否对当前帧/切片/图块启用intrabc模式,都可允许所有环路(内)滤波器用于色度分量。
[0296]
在另一实施例中,无论是否对当前帧/切片/图块启用intrabc模式,都允许 ccso滤波器或lso滤波器或cdef滤波器用于色度分量。
[0297]
根据本公开的一些方面,sdp可用于确定启用/禁用环路滤波器。当应用 sdp时,允许至少一个环路(内)滤波器用于色度分量。
[0298]
在一些实施例中,当应用sdp时,可允许所有环路(内)滤波器用于色度分量。在一个示例中,当应用sdp时,允许db滤波器、cdef滤波器、lr 滤波器、ccso滤波器和lso滤波器均用于色度分量。
[0299]
在一些实施例中,当应用sdp时,允许ccso滤波器或lso滤波器用于色度分量。
[0300]
在一个实施例中,当应用sdp时,允许ccso滤波器和cdef滤波器均用于色度分量。
[0301]
图29示出了概述根据本公开的一个实施例的过程(2900)的流程图。过程 (2900)可用于重建已编码视频序列的图片中的块。术语块可解释为预测块、编码单元、亮度块、色度块等。在各个实施例中,过程(2900)由诸如下述处理电路之类的处理电路来执行:终端设备(310)、终端设备(320)、终端设备 (330)和终端设备(340)中的处理电路、执行视频编码器(403)的功能的处理电路、执行视频解码器(410)的功能的处理电路、执行视频解码器(510) 的功能的处理电路、执行视频编码器(603)的功能的处理电路等。在一些实施例中,过程(2900)以软件指令实现,因此当处理电路执行该软件指令时,处理电路执行过程(2900)。过程从(s2901)开始且进行到(s2910)。
[0302]
在(s2910)处,基于已编码视频码流中的已解码信息来确定块的第一颜色分量和第二颜色分量的解耦编码信息。在一些示例中,解耦编码信息包括亮度分量和色度分量的帧内块复制模式的启用/禁用差异。例如,对亮度分量启用帧内块复制模式,且对色度分量禁用帧内块复制模式。在一些示例中,解耦编码信息包括亮度分量和色度分量的解耦分割结构。在一个示例中,应用sdp,因此亮度分量和色度分量在块中具有不同的分割结构。
[0303]
在一些实施例中,基于第一颜色分量和第二颜色分量的相应启用/禁用信号来确定块中的第一颜色分量和第二颜色分量的解耦编码信息,相应启用/禁用信号采用块级、视频参数集(vps)、序列参数集(sps)、图片参数集(pps)、自适应参数集(aps),切片标头和图块标头中的至少一个。
[0304]
在一些示例中,从已编码视频码流中,解码出与亮度分量相关联的第一启用/禁用标志,以及从已编码视频码流中,解码出与色度分量相关联的第二启用 /禁用标志。基于第一启用/禁用标志和第二启用/禁用标志来确定亮度分量和色度分量的解耦编码信息。
[0305]
在一些示例中,从已编码视频码流中,解码出与亮度分量相关联的第一启用/禁用标志;从已编码视频码流中,解码出与第一色度分量相关联的第二启用 /禁用标志;以及从已编码视频码流中,解码出与第二色度分量相关联的第三启用/禁用标志。然后,基于第一启用/禁用标志、第二启用/禁用标志和第三启用/ 禁用标志来确定亮度分量、第一色度分量和第二色度分量的解耦编码信息。
[0306]
在(s2920)处,基于第一环路滤波器配置来在块中的位置处重建第一颜色分量的第一样本,以及基于第二环路滤波器配置来在块中的该位置处重建第二颜色分量的第二样本。第一环路滤波器配置与第一环路滤波器配置不同。
[0307]
在一些实施例中,在第一环路滤波器配置和第二环路滤波器配置中的一者中启用解块滤波器、约束定向增强滤波器(cdef)、环路恢复滤波器、局部样本偏移(lso)滤波器和跨分量样本偏移(ccso)滤波器中的至少一个;以及在第一环路滤波器配置和第二环路滤波器配置中的另一者中禁用解块滤波器、约束定向增强滤波器(cdef)、环路恢复滤波器、局部样本偏移(lso)滤波器和跨分量样本偏移(ccso)滤波器。
[0308]
在一个实施例中,响应于对色度分量禁用帧内块复制模式且对亮度分量启用帧内块复制模式,在与色度分量相关联的第二环路滤波器配置中,启用解块滤波器、约束定向增强滤波器(cdef)、环路恢复滤波器、局部样本偏移(lso) 滤波器和跨分量样本偏移(ccso)滤波器。
[0309]
在另一实施例中,响应于对色度分量禁用帧内块复制模式且对亮度分量启用帧内块复制模式,在与色度分量相关联的第二环路滤波器配置中,启用局部样本偏移(lso)滤波器和跨分量样本偏移(ccso)滤波器中的一个。
[0310]
在另一实施例中,响应于对色度分量禁用帧内块复制模式且对亮度分量启用帧内块复制模式,在与色度分量相关联的第二环路滤波器配置中,启用约束定向增强滤波器(cdef)和跨分量样本偏移(ccso)滤波器。
[0311]
在一些实施例中,从比块更高级的语法中,解码出与特定环路滤波器相关联的标志;以及无需考虑解耦编码信息,响应于标志为真,将特定环路滤波器应用于亮度分量。
[0312]
过程(2900)进行到(s2999)并结束。
[0313]
可适当地调整过程(2900)。可修改和/或省略过程(2900)中的步骤。可添加另外的
步骤。可使用任何合适的实现顺序。
[0314]
本公开的实施例可单独地使用或以任何顺序组合。此外,方法(或实施例)、编码器和解码器中的每一个可由处理电路(例如,一个或多个处理器或者一个或多个集成电路)实现。在一个示例中,一个或多个处理器执行存储在非暂时性计算机可读介质中的程序。
[0315]
上述技术可实现为计算机软件,该计算机软件使用计算机可读指令,且物理地存储在一个或多个计算机可读介质中。例如,图30示出了适于实施所公开的主题的某些实施例的计算机系统(3000)。
[0316]
可使用任何合适的机器代码或计算机语言对计算机软件进行编码,任何合适的机器代码或计算机语言可经受汇编、编译、链接或类似的机制以创建包括指令的代码,该指令可由一个或多个计算机中央处理单元(cpu)、图形处理单元(gpu)等直接执行,或者通过解释、微码执行等执行。
[0317]
指令可以在各种类型的计算机或其组件上执行,计算机或其组件例如包括个人计算机、平板计算机、服务器、智能电话、游戏设备、物联网设备等。
[0318]
图30所示的计算机系统(3000)的组件本质上是示例性的,并不旨在对实施本公开的实施例的计算机软件的用途或功能的范围提出任何限制。组件的配置也不应解释为具有与计算机系统(3000)的示例性实施例中所示的组件中的任何一个组件或组件的组合相关的任何依赖或要求。
[0319]
计算机系统(3000)可包括某些人机接口输入设备。此类人机接口输入设备可响应于一个或多个人类用户通过例如下述的输入:触觉输入(例如:击键、划动,数据手套移动)、音频输入(例如:语音、拍手)、视觉输入(例如:手势)、嗅觉输入(未描绘)。人机接口设备还可用于捕获不一定与人的意识输入直接相关的某些媒介,例如音频(例如:语音、音乐、环境声音)、图像(例如:扫描图像、从静止图像相机获取的拍摄图像)、视频(例如二维视频、包括立体视频的三维视频)。
[0320]
人机接口输入设备可包括下述中的一项或多项(每种中仅示出一个):键盘 (3001)、鼠标(3002)、触控板(3003)、触摸屏(3010)、数据手套(未示出)、操纵杆(3005)、麦克风(3006)、扫描仪(3007)、相机(3008)。
[0321]
计算机系统(3000)还可包括某些人机接口输出设备。此类人机接口输出设备可例如通过触觉输出、声音、光和气味/味道来刺激一个或多个人类用户的感官。此类人机接口输出设备可包括触觉输出设备(例如触摸屏(3010)的触觉反馈、数据手套(未示出)或操纵杆(3005),但还可以是不作为输入设备的触觉反馈设备)、音频输出设备(例如:扬声器(3009)、耳机(未描绘))、视觉输出设备(例如包括crt屏幕、lcd屏幕、等离子屏幕、oled屏幕的屏幕 (3010),每种屏幕具有或没有触摸屏输入功能,每种屏幕具有或没有触觉反馈功能,其中的一些屏幕能够通过诸如立体图像输出之类的装置、虚拟现实眼镜 (未描绘)、全息显示器和烟箱(未描绘)以及打印机(未描绘)来输出二维视觉输出或超过三维的输出。
[0322]
计算机系统(3000)还可包括人类可访问存储设备及其关联介质,例如包括具有cd/dvd等介质(3021)的cd/dvd rom/rw(3020)的光学介质、指状驱动器(3022)、可拆卸硬盘驱动器或固态驱动器(3023)、诸如磁带和软盘之类的传统磁性介质(未描绘)、诸如安全软件狗之类的基于专用 rom/asic/pld的设备(未描绘)等。
[0323]
本领域技术人员还应该理解,结合当前公开的主题所使用的术语“计算机可读介
质”不涵盖传输介质、载波或其它暂时性信号。
[0324]
计算机系统(3000)还可包括通向一个或多个通信网络(3055)的接口 (3054)。网络可例如是无线网络、有线网络、光网络。网络可进一步是本地网络、广域网络、城域网络、车辆和工业网络、实时网络、延迟容忍网络等。网络的示例包括诸如以太网之类的局域网、无线lan、包括gsm、3g、4g、5g、 lte等的蜂窝网络、包括有线电视、卫星电视和地面广播电视的电视有线或无线广域数字网络、包括canbus的车辆和工业网络等。某些网络通常需要附接到某些通用数据端口或外围总线(3049)的外部网络接口适配器(例如计算机系统(3000)的usb端口);如下所述,其它网络接口通常通过附接到系统总线而集成到计算机系统(3000)的内核中(例如,连接到pc计算机系统中的以太网接口或连接到智能手机计算机系统中的蜂窝网络接口)。计算机系统 (3000)可使用这些网络中的任何一个网络与其它实体通信。此类通信可以是仅单向接收的(例如,广播电视)、仅单向发送的(例如,连接到某些canbus 设备的canbus)或双向的,例如,使用局域网或广域网数字网络连接到其它计算机系统。如上所述,可以在那些网络和网络接口中的每一个上使用某些协议和协议栈。
[0325]
上述人机接口设备、人机可访问的存储设备和网络接口可附接到计算机系统(3000)的内核(3040)。
[0326]
内核(3040)可包括一个或多个中央处理单元(cpu)(3041)、图形处理单元(gpu)(3042)、现场可编程门区域(fpga)(3043)形式的专用可编程处理单元、用于某些任务的硬件加速器(3044)、图形适配器(3050)等。这些设备以及只读存储器(rom)(3045)、随机存取存储器(3046)、诸如内部非用户可访问的硬盘驱动器、ssd等之类的内部大容量存储器(3047)可通过系统总线(3048)连接。在一些计算机系统中,可以以一个或多个物理插头的形式访问系统总线(3048),以能够通过附加的cpu、gpu等进行扩展。外围设备可直接附接到内核的系统总线(3048)或通过外围总线(3049)附接到内核的系统总线(3048)。在一个示例中,显示器(3010)可连接到图形适配器(3050)。外围总线的架构包括pci、usb等。
[0327]
cpu(3041)、gpu(3042)、fpga(3043)和加速器(3044)可执行某些指令,这些指令可组合来构成上述计算机代码。该计算机代码可存储在rom (3045)或ram(3046)中。过渡数据还可存储在ram(3046)中,而永久数据可例如存储在内部大容量存储器(3047)中。可通过使用高速缓存来进行通向任何存储设备的快速存储及检索,该高速缓存可与下述紧密关联:一个或多个cpu(3041)、gpu(3042)、大容量存储(3047)、rom(3045)、ram (3046)等。
[0328]
计算机可读介质可以在其上具有执行各种由计算机实现的操作的计算机代码。介质和计算机代码可以是出于本公开的目的而专门设计和构造的介质和计算机代码,或者介质和计算机代码可以是计算机软件领域的技术人员公知且可用的类型。
[0329]
作为示例而非限制,可由于一个或多个处理器(包括cpu、gpu、fpga、加速器等)执行包含在一种或多种有形的计算机可读介质中的软件而使得具有架构(3000),特别是内核(3040)的计算机系统提供功能。此类计算机可读介质可以是与如上所述的用户可访问的大容量存储相关联的介质,以及某些非暂时性内核(3040)的存储器,例如内核内部大容量存储器(3047)或rom(3045)。实施本公开的各个实施例的软件可存储在此类设备中并由内核(3040)执行。根据特定需要,计算机可读介质可包括一个或多个存储设备或芯片。软件可使得内核(3040),特别是其中的处理器(包括cpu、gpu、fpga等)执行本文所描述的特定过程或特定过程的特定部分,包括定义存储在ram(3046)中的数据结构以及根据由软件定义的过
程来修改此类数据结构。附加地或替换地,可由于硬连线或以其它方式体现在电路(例如,加速器(3044))中的逻辑而使得计算机系统提供功能,该电路可替换软件或与软件一起运行以执行本文描述的特定过程或特定过程的特定部分。在适当的情况下,提及软件的部分可包含逻辑,反之亦然。在适当的情况下,提及计算机可读介质的部分可包括存储用于执行的软件的电路(例如集成电路(ic))、体现用于执行的逻辑的电路或包括两者。本公开包括硬件和软件的任何合适的组合。
[0330]
附录a:首字母缩写词
[0331]
jem:联合探索模型
[0332]
vvc:通用视频编码
[0333]
bms:基准集
[0334]
mv:运动矢量
[0335]
hevc:高效视频编码
[0336]
mpm:最可能模式
[0337]
waip:广角帧内预测
[0338]
sei:辅助增强信息
[0339]
vui:视频可用性信息
[0340]
gop:图片群组
[0341]
tu:变换单元
[0342]
pu:预测单元
[0343]
ctu:编码树单元
[0344]
ctb:编码树块
[0345]
pb:预测块
[0346]
hrd:假想参考解码器
[0347]
sdr:标准动态范围
[0348]
snr:信噪比
[0349]
cpu:中央处理单元
[0350]
gpu:图形处理单元
[0351]
crt:阴极射线管
[0352]
lcd:液晶显示器
[0353]
oled:有机发光二极管
[0354]
cd:光盘
[0355]
dvd:数字视频光盘
[0356]
rom:只读存储器
[0357]
ram:随机存取存储器
[0358]
asic:特定用途集成电路
[0359]
pld:可编程逻辑器件
[0360]
lan:局域网
[0361]
gsm:全球移动通信系统
[0362]
lte:长期演进
[0363]
canbus:控制器区域网络总线
[0364]
usb:通用串行总线
[0365]
pci:互连外围设备
[0366]
fpga:现场可编程门区域
[0367]
ssd:固态驱动器
[0368]
ic:集成电路
[0369]
cu:编码单元
[0370]
pdpc:位置相关预测组合
[0371]
isp:帧内子分区
[0372]
sps:序列参数设置
[0373]
虽然本公开已描述多个示例性实施例,但是存在落入本公开的范围内的修改、置换和各种替换等效物。因此,应理解,本领域技术人员将能够设计出许多虽然未在本文中明确示出或描述,但是体现了本公开的原理,因此落入本公开的精神和范围内的系统和方法。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献