视频编码的色度直接模式产生方法和装置与流程

2022-04-30 04:27:03 来源：中国专利 TAG：

视频编码的色度直接模式产生方法和装置
1.相关引用
2.本发明主张在2019年5月10日提出的第62/845,962号的美国临时专利申请的优先权，该申请案以引用的方式并入本文。
技术领域
3.本发明涉及用于颜色视频数据的视频编解码的帧间/帧内预测，更具体地说，涉及使用亮度帧内编解码信息的色度帧内预测模式的处理。

背景技术：

4.高效率视频编解码(high-efficiency video coding，hevc)是由视频编解码联合协作小组(joint collaborative team on video coding，jct-vc)开发的新的国际视频编解码标准。hevc是基于基于混合块的运动补偿离散余弦变换(discrete cosine transform，简称dct)类似的变换的编解码架构。用于压缩的基础单元，称为编解码单元(coding unit，简称cu)，是2nx2n正方形块，以及每个cu可被递归地分成四个较小的cu，直到达到预定义的最小尺寸。每个图像被划分为多个编解码树单元(coding tree unit，简称编解码单元)，并且每个ctu被划分为一个或多个cu。对于彩色视频数据，每个cu可包括对应于多个颜色分量的多个编码块(coding block，简称cb)。每个cu包含一个或多个预测单元(prediction unit，简称pu)。对于彩色视频数据，每个pu可包括对应于多个颜色分量的多个预测块(prediction block，简称pb)。为了在hevc中获得混合编解码架构的最佳编解码效率，有两种预测模式(即帧内预测和帧间预测)用于每个pu。对于帧内预测模式，空间相邻的重构像素可被用于生成方向预测。
5.在开发hevc标准之后，在itu-t sg 16 wp 3和iso/iec jtc 1/sc 29/wg 11的联合视频探索小组(joint video exploration team，简称jvet)的指导下，另一种合并的视频编解码标准正在开发，被称为通用视频编解码(versatile video coding，简称vvc)。各种新的编解码工具以及一些现有的编解码工具被评估用于vvc。
6.以下综述了用于hevc/vvc的一些相关编解码工具。
7.帧间模式
8.当cu/pu在帧间高级运动向量预测(advanced motion vector prediction，简称amvp)模式下进行编解码时，运动补偿的预测使用传输的运动向量差(motion vector difference，简称mvd)来执行，该运动向量差可与运动向量预测子(motion vector prediction，简称mvp)一起被用来推导运动向量(motion vector，简称mv)。为了在帧间amvp模式下确定mvp，amvp方案被用于在包括两个空间mvp和一个时间mvp的amvp候选集合中选择运动向量预测子。因此，在amvp模式下，mvp的mvp索引和相应的mvd需要被编码和发送。另外，用于在双向预测和单向预测(列表0(l0)或列表1(l1))中指定预测方向的帧间预测方向以及每个列表的参考帧索引也应该被编码和发送。
9.当pu由跳跃或合并模式编解码时，除了所选择的候选的合并索引之外，运动信息
不被发送。这是因为跳跃和合并模式利用从候选列表的候选的运动推断方法。对于跳跃和合并模式，潜在的mv和mv预测子之间的mvd为零(即mv＝mvp mvd＝mvp)。因此，运动信息可从同位图像中的空间相邻块(空间候选)或时间块(时间候选)获得。同位图像是列表0或列表1中的第一个参考图像，第一个参考图像在片段标头中发送。在跳跃pu的情况下，残差信号也被省略。为了确定跳跃和合并模式模式的合并索引，合并方案被用来从包含四个空间mvp和一个时间mvp的合并候选集合中选择运动向量预测子。
10.帧内块复制(intra block copy，简称ibc)/当前图像参考
11.运动估计/补偿是混合视频编码中的众所周知的关键技术，其探索相邻图像之间的像素相关性。在视频序列中，相邻帧之间的对象运动很小，并且对象运动可通过二维平移运动进行建模。因此，与帧中的对象或背景相对应的图案被位移以在后续帧中形成对应的对象，或者与当前帧内的其他图案相关。通过估计位移(例如，使用块匹配技术)，图案可在无需重新编解码图案的情况下大部分地再现。类似地，块匹配和复制被尝试以允许从同一图像中选择参考块。当将此概念应用于摄影机拍摄的视频时，效率低下。部分原因是空间相邻区域中的文字图案可能类似于当前的编解码块，但通常会随着空间的变化而逐渐变化。因此，对于一个块来说，很难在摄影机捕获的视频的同一张图像中找到精确匹配。因此，编解码性能的提高受到限制。
12.然而，同一图像内的像素之间的空间相关性对于屏幕内容而言是不同的。对于带有文本和图形的典型视频，同一张图像中通常会有重复的图案。因此，已经观察到的帧内(图像)块补偿是非常有效的。一种新的预测模式，即帧内块复制(intra block copy，简称ibc)模式或被称为当前图像参考(current picture referencing，简称cpr)，被引入用于屏幕内容编解码，以利用该特性。在cpr模式中，pu根据同一图像内先前重构的块来预测。此外，位移向量(称为块向量或bv)被用来发送从当前块位置到参考块位置的相对位移。然后预测误差使用变换、量化和熵编解码进行编解码。cpr补偿的示例在图1中示出，其中区域110对应于将被编码的图像，片段或图像区域。块120和130对应于将被编码的两个块。在该示例中，每个块可在当前图像的先前编码区域中找到相对应的块(即，分别为122和132)。根据该技术，参考样本对应于在包括hevc中的解块和样本自适应偏移(sample adaptive offset，简称sao)滤波器的环路滤波器操作之前的当前解码图像的重构样本。
13.cpr的早期版本在itu-t sg 16的视频编码联合协作团队(jct-vc)的jctvc-m0350(m.budagavi,et al,“ahg8:video coding using intra motion compensation”,joint collaborative team on video coding(jct-vc)of itu-t sg 16 wp 3 and iso/iec jtc 1/sc 29/wg 11,13th meeting:incheon,kr,18
–
26 apr.2013,document:jctvc-m0350)，作为hevc范围扩展(range extension，简称rext)发展的候选技术提交。在jctvc-m0350中，cpr补偿仅被限制在较小的局部区域内，并且对于块大小为2nx2n，搜索被限制为一维块向量。后来，一种更高级的cpr方法在hevc scc(屏幕内容编解码)的标准化过程中被开发。
14.块内复制(intra block copy，简称ibc)在scc的hevc扩展和新兴的视频编解码标准vvc中采用。众所周知，它显著提高了屏幕内容材料的编解码效率。由于ibc模式被实现为块级编解码模式，所以块匹配(block matching，简称bm)在编码器处执行以找到每个cu的最优块向量(或运动向量)。这里，块向量被用于指示从当前块到参考块的位移，该参考块已经在当前图像内部重构。ibc编解码的cu的亮度块向量具有整数精度。色度块向量也被舍入
为整数精度。当ibc模式与amvr结合使用时，ibc模式可在1像素和4像素运动向量精度之间切换。除帧内或帧间预测模式以外，ibc编解码的cu被视为第三预测模式。ibc模式适用于宽度和高度均小于或等于64个亮度采样的cu。
15.在编码器侧，基于哈希(hash-based)的运动估计被执行以用于ibc。编码器对宽度或高度不大于16个亮度样本的块执行速率失真(rate-distortion)检查。对于非合并模式，块向量搜索首先使用基于哈希的搜索来执行。如果哈希搜索未返回有效的候选，则基于块匹配的本地搜索被执行。
16.在基于哈希的搜索中，当前块和参考块之间的哈希密钥匹配(32位crc)被扩展到所有允许的块大小。当前图像中每个位置的哈希密钥计算均基于4x4子块。对于较大尺寸的当前块，当所有4
×
4子块的所有哈希密钥与对应参考位置中的哈希密钥相匹配时，哈希密钥被确定与参考块的哈希密钥相匹配。如果多个参考块的哈希密钥被发现与当前块的哈希密钥相匹配，则每个匹配的参考的块向量成本被计算，然后成本最小的那个被选择。
17.例如，在块匹配搜索中，搜索范围被设置为覆盖先前的ctu和当前的ctu。对于另一示例，搜索范围在当前ctu中和左ctu中。对于另一示例，搜索范围被设置为在当前ctu内的当前块的左侧和顶部的n个样本。在ctu的开始处，如果没有时间参考图像，则n值被初始化为128，如果有至少一个时间参考图像，则n值被初始化为64。哈希命中率被定义为ctu中使用基于哈希的搜索找到匹配项的样本的百分比。在对当前ctu进行编码时，如果哈希命中率低于5％，则n将减少一半。
18.在cu级别，ibc模式用标志来发送，并且它可以被发送为ibc amvp模式或ibc跳跃/合并模式，如下所示：
19.·
ibc跳跃/合并模式：合并候选索引被用来指示相邻候选ibc编解码块中列表中的哪个块向量被用于预测当前块。合并列表由空间、基于历史记录的mvp(history-based mvp，简称hmvp)和成对候选组成。
20.·
ibc amvp模式：块向量差的编解码方式与运动向量差相同。块向量预测方法使用两个候选作为预测子，一个来自左相邻块，另一个来自上方相邻块(如果是ibc编解码的)。当任一相邻块都不可用时，默认块向量将被用作预测子。标志被发送以指示块向量预测子索引。
21.在本发明中，用于ibc模式的mv、mvd和mvp分别命名为bv、bvd和bvp。
22.使用67帧内预测模式的帧内模式编解码
23.为了捕获自然视频中呈现的任意边缘方向，vtm4中的方向(directional)帧内模式的数量从hevc中使用的33种扩展到65种。存在67种帧内预测模式，包括65种方向模式，平面(planar)和直流(dc)模式如图2所示，其中不在hevc中的新的方向模式如图2中的虚线所示。平面模式和dc模式保持不变。这些更密集的方向帧内预测模式适用于所有块大小以及亮度和色度帧内预测。
24.在vtm4(j.chen,et al.,“algorithm description for versatile video coding and test model 4(vtm 4)”,joint video experts team(jvet)of itu-t sg 16 wp 3 and iso/iec jtc 1/sc 29/wg 11,13th meeting:marrakech,ma,9
–
18 jan.2019,document:jvet-m1002)，对于非正方形块，几种习知的角度帧内预测模式自适应地被替换为广角帧内预测模式。vtm4的第3.3.1.2节介绍了广角帧内预测。
derived mode”,joint video experts team(jvet)of itu-t sg 16 wp 3 and iso/iec jtc 1/sc 29/wg 11,12th meeting:macao,cn,3
–
12 oct.2018,jvet-l0272)中找到。
36.pcm模式
37.当块以内部模式进行编解码时，脉冲编码调制(pulse code modulation，简称pcm)模式或帧内模式可被使用。在pcm模式下，预测、变换、量化和熵编解码被绕过，并且样本由预定义的位数量直接表示。其主要目的是在信号特性极为异常(例如，类似噪声的信号)并且无法被混合编解码正确处理时，避免过多的位消耗。
38.组合帧间合并/帧内预测(combined inter merge/intra prediction，简称ciip)模式
39.当cu以合并模式进行编解码时，并且如果cu包含至少64个亮度样本(即，cu宽度乘以cu高度≥64)，则附加标志被发送以指示ciip模式被应用于当前cu。为了形成ciip预测，诸如平面模式的帧内预测模式被使用。然后，帧间预测(例如，从合并运动候选生成的合并预测)和帧内预测信号使用常规帧内和帧间解码处理来导出。最后，帧间和帧内预测信号的加权平均被执行以获得ciip预测。该算法的更详细说明可在jvet-l0100(m.-s.chiang,et al.,“ce10.1.1:multi-hypothesis prediction for improving amvp mode,skip or merge mode,and intra mode,”12th meeting:macao,joint video experts team(jvet)of itu-t sg 16 wp 3 and iso/iec jtc 1/sc 29/wg 11,12th meeting:macao,cn,3
–
12 oct.2018,document:jvet-l0100)and jvet-n0302(l.pham van,et al.,“ce10:ciip with position-independent weights(test ce10-1.1),”joint video experts team(jvet)of itu-t sg 16 wp 3 and iso/iec jtc 1/sc 29/wg 11,12th meeting:macao,cn,3
–
12 oct.2018,document:jvet-n0302)中找到。
40.bdpcm
41.块差分脉冲编码调制或基于块的三角脉冲编码调制(block-based delta pulse code modulation，简称bdpcm)，也被称为残差块差分脉冲编码调制(residual block-differential pulse coded modulation，简称rdpcm)，在jvet-m057(f.henry,et al.,“ce8:bdpcm with horizontal/vertical predictor and independently decodable areas(test 8.3.1b)”,joint video experts team(jvet)of itu-t sg 16 wp 3 and iso/iec jtc 1/sc 29/wg 11,13th meeting:marrakech,ma,9
–
18 jan.2019,document:jvet-m0057)中提出的方法使用重构的样本逐行预测行或列。vvc支持bdpcm进行屏幕内容编解码。在序列级别上，bdpcm使能标志在sps中发送。仅当在sps中变换换跳跃模式(在下一节中介绍)被使能时，此标志才会发出。当bdpcm被使能时，如果cu大小在亮度采样方面小于或等于maxtssize乘maxtssize(根据亮度样本)，并且在cu进行帧内编解码，则标志在cu级别被发出，其中maxtssize是允许跳跃模式的最大块大小。该标志指示是否常规帧内编解码或bdpcm被使用。如果bdpcm被使用，则bdpcm预测方向标志被发送以指示预测是水平还是垂直。
42.然后，使用常规的水平或垂直帧内预测过程利用未滤波的参考样本，块被预测。残差被量化，并且每个量化的残差与其预测子之间的差(如，水平或垂直(取决于bdpcm预测方向)相邻位置的先前编解码的残差)被编解码。
43.对于大小为m(行)
×
n(列)的块，在使用来自上方或左侧块边界样本的未过滤样本
水平地(即，在整个预测块上逐行复制左侧相邻像素值)或垂直地(即，将顶部相邻行复制到预测块中的每一行)执行帧内预测后，令r
i，j
，0≤i≤m-1，0≤j≤n-1成为预测残差。令q(r
i，j
)，0≤i≤m-1，0≤j≤n-1表示残差r
i，j
的量化形式，其中残差对应于原始块和预测块之间的差值。然后，bdpcm被应用于量化后的残差样本，从而得到具有元素的修改后的m
×
n数组r
～
。当垂直bdpcm(bdpcm预测方向是指垂直帧内预测)被使用时：
[0044][0045]
对于水平预测，适用类似的规则，并且残余量化样本可通过以下方式获得：
[0046][0047]
残差量化样本被发送到解码器。
[0048]
在解码器侧，上述计算被取反以产生q(r
i，j
)，0≤i≤m-1，0≤j≤n-1。对于垂直预测：
[0049][0050]
对于水平预测：
[0051][0052]
逆量化残差q-1
(q(r
i，j
))被加到帧内块预测值以产生重构的样本值。使用与变换跳跃模式残差编解码中相同的残差编解码处理，预测的量化残差值被发送到解码器。对于无损编解码，如果slice_ts_residual_coding_disabled_flag被设置为1，则使用常规变换残差编解码，量化后的残差值被发送到解码器。更多详细信息可在jvet-n0413(m.karczewicz,et al.,“ce8-related:quantized residual bdpcm,”joint video experts team(jvet)of itu-t sg 16 wp 3 and iso/iec jtc 1/sc 29/wg 11,14th meeting:geneva,ch,19
–
27 mar.2019,document:jvet-n0413)中找到。

技术实现要素：

[0053]
公开了一种用于视频编解码的预测的方法和装置。根据该方法，在视频编码器侧与当前图像中的当前色度块有关的输入数据被接收，或者在视频解码器侧与包括当前图像中的当前色度块的压缩数据相对应的视频比特流被接收。与当前色度块同位的(collocated)对应亮度块的亮度内预测模式被确定，其中当与当前色度块同位的对应亮度块满足一个或多个条件时，预定义模式被分配给亮度帧内预测模式。根据与当前色度块同位的对应亮度块的亮度帧内预测模式，当前色度块的色度帧内预测模式被导出。当前色度块可对应于色度编解码块(coding block，简称cb)，并且对应的亮度块对应于亮度cb或亮度预测块(prediction block，简称pb)。
[0054]
当前色度块的色度帧内预测模式可直接从与当前色度块同位的对应亮度块的亮度帧内预测模式继承。在一实施例中，与当前色度块同位的对应亮度块覆盖当前色度块的
中心位置。
[0055]
在一实施例中，预定义模式对应于平面模式或dc模式。在一实施例中，条件包括对应亮度块使用帧内块复制(intra block coy，简称ibc)模式进行编码。在另一实施例中，条件包括对应亮度块使用脉冲编码调制(pulse coded modulation，简称pcm)模式、调色板(palette)模式、非帧内模式、或残差块差分脉冲编码调制(residual block-dpcm(differential pulse coded modulation，简称rdpcm))模式进行编码。
[0056]
在一实施例中，当条件对应于对应亮度块由rdpcm模式进行编解码时，取决于rdpcm模式的预测方向，预定义模式被设置为水平或垂直模式。
[0057]
在一实施例中，当所述一个或多个条件对应于对应亮度块由ibc模式进行编解码时，预定义模式被设置为以下之一：平面模式，dc模式，水平模式和垂直模式。
[0058]
在一实施例中，当条件对应于对应亮度块由ibc模式进行编解码时，预定义模式被设置为dc模式。
[0059]
根据另一种方法，当当前块满足一个或多个条件时，预定义模式被分配给当前块的帧内预测模式。然后根据当前块的帧内预测模式和/或后续的编解码块参考的帧内预测模式，当前块或后续的编解码块被编码或解码。
[0060]
在一实施例中，预定义模式对应于平面模式或dc模式。在一实施例中，条件包括当前块使用ibc模式或调色板模式进行编码。
附图说明
[0061]
图1示出cpr(当前图像参考)补偿的示例，其中两个块由同一图像中的另外两个块预测。
[0062]
图2示出包括65种方向模式以及平面模式和dc模式的67种帧内预测模式，其中hevc以外的新方向模式用虚线表示。
[0063]
图3示出与当前色度块相关的对应亮度块的两个示例。
[0064]
图4示出根据本发明实施例的基于与当前色度块相关的对应亮度块的帧内预测模式来导出当前色度块的帧内预测模式的示例性视频编解码的流程图，其中，当与当前色度块同位的对应亮度块满足一个或多个条件时，预定义帧内模式被分配给与当前色度块相关的对应亮度块的帧内预测模式。
[0065]
图5示出根据本发明的实施例的示例性视频编解码的流程图，其中当前块是用ibc，bdpcm或调色板模式进行编解码的。
具体实施方式
[0066]
以下描述是实现本发明的最佳方案。进行该描述是为了说明本发明的一般原理，而不应被视为具有限制意义。通过参考所附权利要求，本发明的范围被最好地确定。
[0067]
本发明中任一提出的方法都可由隐式规则或显式规则控制或与隐式规则或显式规则组合。在一实施例中，隐式规则可取决于cb/pb宽度，cb/pb高度和/或cb/pb面积。在另一实施例中，显式规则可取决于在pu、cu、ctu、片段、图块、图块组、序列参数集合(sequence parameter set，简称sps)和/或图像参数集合(picture parameter set，简称pps)级别发送的标志。
[0068]
当前色度块的帧内预测模式
[0069]
当前色度块的帧内预测模式是根据与当前色度块相关的对应亮度块的帧内预测模式导出的。例如，当前色度块的帧内预测模式的规格取决于与当前色度块相关的对应亮度块的帧内预测模式。对于使用色度dm作为当前色度块的帧内预测模式的另一示例，当前色度块的帧内预测模式直接从与当前色度块同位的对应亮度块的亮度帧内预测模式继承。又例如，当确定与当前色度块相关的对应亮度块的帧内预测模式时，默认模式设置或禁止设置被建议应用。与当前色度块相关的对应亮度块与当前色度块相同或与分割树中的当前色度块不同。例如，当前色度块和与当前色度块相关的对应亮度块在不同的分割树中。当前色度块在色度分割树中，并且与当前色度块相关的对应亮度块在亮度分割树中。在这种情况下，当色度块由帧内模式编解码时，与当前色度块相关的对应亮度块可由非帧内模式进行编解码。基于默认模式设置或禁止设置，与当前色度块相关的相应亮度块的帧内预测模式被确定。
[0070]
i.默认模式设置
[0071]
默认模式设置意味着当与当前色度块同位的对应亮度块满足一个或多个条件时，预定义模式(在本发明中也称为默认模式)被分配给帧内预测模式，用于与当前色度块同位的对应亮度块。
[0072]
在一实施例中，条件是与当前色度cb/pb同位的对应亮度cb/pb由ibc模式编解码。
[0073]
在另一实施例中，条件是与当前色度cb/pb同位的对应亮度cb/pb由pcm模式编解码。
[0074]
在另一实施例中，条件是与当前色度cb/pb同位的对应亮度cb/pb由调色板模式编解码。
[0075]
在另一实施例中，条件是与当前色度cb/pb同位的对应亮度cb/pb由非帧内模式(例如ibc模式)编解码。
[0076]
在另一实施例中，条件是与当前色度cb/pb同位的对应亮度cb/pb由rdpcm模式编解码。
[0077]
在另一实施例中，默认模式是平面模式。
[0078]
在另一实施例中，当与当前色度cb/pb同位的对应亮度cb/pb由rdpcm模式编解码时，根据用于与由rdpcm模式编解码的当前色度cb/pb同位的对应亮度cb/pb的预测方向(即，水平或垂直预测)，默认模式可以是水平或垂直模式。在一示例中，如果预测方向是水平的，则默认模式被设置为水平模式。在另一子实施例中，如果预测方向是垂直的，则默认模式设置为水平模式。在另一示例中，如果预测方向是垂直的，则默认模式设置为垂直模式。在另一示例中，如果预测方向是水平的，则默认模式被设置为垂直模式。
[0079]
在另一实施例中，默认模式是dc模式。
[0080]
在另一实施例中，默认模式是非角度模式。
[0081]
在另一实施例中，默认模式是{平面模式，dc，水平，垂直}中的一种。
[0082]
在另一实施例中，默认模式是根据当前色度的cb/pb宽度，高度和/或面积决定的。例如，如果色度cb/pb宽度等于色度cb/pb高度，则默认模式为非角度模式，例如平面模式或dc模式。在另一示例中，当色度cb/pb长边大于色度cb/pb短边乘以特定阈值(例如1、2、3、4、5、6、7或8)时，默认模式被分配如下：
[0083]
·
如果长边是块宽，则默认模式是垂直模式。
[0084]
·
如果长边是块高，则默认模式是水平模式。
[0085]
在另一示例中，如果色度cb/pb面积大于特定阈值，例如16、32、64、128、256、512或1024，则默认模式为平面模式。在又一示例中，如果色度cb/pb面积小于特定阈值，例如16、32、64、128、256、512或1024，则默认模式是平面模式。在又一个示例中，如果色度cb/pb面积大于特定阈值，例如16、32、64、128、256、512或1024，则默认模式为dc模式。在又一示例中，如果色度cb/pb面积小于特定阈值，例如16、32、64、128、256、512或1024，则默认模式为dc模式。
[0086]
ii.禁止设置
[0087]
禁止设置意味着当以下之一条件发生时，对于当前色度块，色度dm模式被跳过，或者对于生成当前色度块的帧内预测模式，与当前色度块相关的对应亮度块被视为无效。
[0088]
在一实施例中，条件是与当前色度cb/pb同位的对应亮度cb/pb由ibc模式编解码。
[0089]
在另一实施例中，条件是与当前色度cb/pb同位的对应亮度cb/pb由pcm模式编解码。
[0090]
在另一实施例中，条件是与当前色度cb/pb同位的对应亮度cb/pb由调色板模式编解码。
[0091]
在另一实施例中，条件是当前色度cb/pb同位的对应亮度cb/pb由非帧内模式(例如ibc模式)编解码。
[0092]
在另一实施例中，条件是与当前色度cb/pb同位的对应亮度cb/pb由rdpcm模式编解码。
[0093]
用于ibc模式的运动信息修改
[0094]
在一实施例中，bv，bvd和/或bvp的值被限制在预定范围内。例如，预定义范围可由16位表示。在一子实施例中，预定义范围是[-2
15
，2
15
]。例如，预定义范围可由18位表示，这与常规帧间隔相同。在一子实施例中，预定义范围是[-2
17
，2
17
]。
[0095]
在另一实施例中，bv，bvd和/或bvp可以整数像素精度存储，并且可由后续编解码块引用。
[0096]
在另一实施例中，bv，bvd和/或bvp可以1/4像素的精度存储，并且可由后续编解码块引用。
[0097]
在另一实施例中，bv，bvd和/或bvp可以1/16像素精度存储，并且可由后续编解码块来引用。
[0098]
用于ibc/pcm/调色板模式的帧内预测模式
[0099]
在一实施例中，用于ibc/pcm/调色板模式的帧内预测模式被设置为{平面，dc，水平，垂直}之一。
[0100]
在另一实施例中，基于当前块的宽度，高度和/或面积，用于ibc/pcm/调色板模式的帧内预测模式被确定。例如，如果当前块宽度等于当前块高度，则帧内预测模式是非角度模式，例如平面模式或dc模式。在另一示例中，当当前块长边大于当前块短边乘以特定阈值(例如1、2、3、4、5、6、7或8)时，帧内预测模式被分配如下：
[0101]
·
如果长边是块宽，则帧内预测模式是垂直模式。
[0102]
·
如果长边是块高，则帧内预测模式是水平模式。
[0103]
在另一示例中，如果当前块面积大于特定阈值，例如16、32、64、128、256、512或1024，则帧内预测模式是平面模式。在另一示例中，如果当前块面积小于特定阈值，例如16、32、64、128、256、512或1024，则帧内预测模式是平面模式。在另一示例中，如果当前块面积大于特定阈值，例如16、32、64、128、256、512或1024，则帧内预测模式是dc模式。在另一示例中，如果当前块面积小于特定阈值，例如16、32、64、128、256、512或1024，则帧内预测模式是dc模式。
[0104]
在另一实施例中，ibc/pcm/调色板的帧内预测模式可由以下编解码块引用或在某些情况下在以下过程中使用。例如，情况是在导出用于后续编解码的色度cb/pb的帧内预测模式时，或在对后续色度cb/pb使用色度dm时，与后续色度cb/pb相关的对应亮度cb/pb是由ibc/pcm/调色板模式编解码。对于另一示例，情况是rdpcm的帧内预测模式在帧内预测生成中使用或变换过程中使用。
[0105]
rdpcm模式的帧内预测模式
[0106]
在一实施例中，rdpcm模式的帧内预测模式被设置为{平面，dc，水平，垂直}之一。
[0107]
在另一实施例中，根据预测方向(即，水平或垂直预测)，rdpcm模式的帧内预测模式可以是水平或垂直模式。例如，如果预测方向是水平的，则rdpcm模式的帧内预测模式被设置为水平模式。在另一示例中，如果预测方向是垂直的，则rdpcm模式的帧内预测模式被设置为水平模式。在又一示例中，如果预测方向是垂直的，则rdpcm模式的帧内预测模式被设置为垂直模式。在又一示例中，如果预测方向是水平的，则rdpcm模式的帧内预测模式被设置为垂直模式。
[0108]
在另一实施例中，基于当前块的宽度，高度和/或面积，rdpcm模式的帧内预测模式被确定。例如，如果当前块宽度等于当前块高度，则帧内预测模式是诸如平面模式或dc模式的非角度模式。在另一示例中，当当前块长边大于当前块短边乘以特定阈值(例如1、2、3、4、5、6、7或8)时，帧内预测模式被分配如下：
[0109]
·
如果长边为块宽，则帧内预测模式为垂直模式。
[0110]
·
如果长边是块高，则帧内预测模式是水平模式。
[0111]
在另一示例中，如果当前块面积大于特定阈值，例如16、32、64、128、256、512或1024，则帧内预测模式是平面模式。在另一示例中，如果当前块面积小于特定阈值，例如16、32、64、128、256、512或1024，则帧内预测模式是平面模式。在另一示例中，如果当前块面积大于特定阈值，例如16、32、64、128、256、512或1024，则帧内预测模式是dc模式。在另一示例中，如果当前块面积小于特定阈值，例如16、32、64、128、256、512或1024，则帧内预测模式是dc模式。
[0112]
在另一实施例中，rdpcm的帧内预测模式可由后续编解码块引用或在某些情况下在后续处理中使用。例如，情况是，在导出帧内预测模式用于后续编解码色度cb/pb时，或后续色度cb/pb使用色度dm时，与后续色度cb/pb相关的对应亮度cb/pb由rdpcm模式编解码。对于另一示例，情况是，rdpcm的帧内预测模式不仅在帧内预测生成中使用，也在变换过程中使用。
[0113]
以上方法的任一组合可被应用。
[0114]
任一前述提出的方法可在编码器和/或解码器中实现。例如，任一所提出的方法可由编码器和/或解码器的ibc/帧内/pcm/帧间/rdpcm编解码来实现。可替代地，任一所提出
的方法可被实现为与编码器和/或解码器的ibc/帧内/pcm/帧间/rdpcm编码耦合的电路，从而提供ibc/帧内/pcm/帧间/rdpcm编解码所需的信息。
[0115]
图4示出了根据本发明的实施例根据与当前色度块相关的对应亮度块的帧内预测模式(例如，使用色度dm(直接模式))来推导当前色度块的帧内预测模式的示例性视频编解码的流程图，其中当与当前色度块同位的对应亮度块满足一个或多个条件时，默认帧内模式被分配给与当前色度块相关的对应亮度块的帧内预测模式。流程图中所示的步骤以及本公开中的其他后续流程图可被实现为可在编码器侧和/或解码器侧的一个或多个处理器(例如，一个或多个cpu)上执行的程序代码。流程图中所示的步骤也可以基于硬件来实现，例如被布置为执行流程图中的步骤的一个或多个电子装置或处理器。根据该方法，在步骤410中，在视频编码器侧与当前图像中的当前色度块有关的输入数据被接收，或者在视频解码器侧与包括当前图像中的当前色度块的压缩数据相对应的视频比特流被接收。在步骤420中，与当前色度块同位的对应亮度块的亮度帧内预测模式被确定，其中当与当前色度块同位的对应亮度块满足一个或多个条件时，预定义模式被分配给亮度帧内预测模式。在步骤430中，根据与当前色度块同位的对应亮度块的亮度帧内预测模式，当前色度块的色度帧内预测模式被导出。在步骤440中，根据当前色度块的色度帧内预测模式，当前色度块被编码或解码。
[0116]
图5示出了根据本发明实施例的示例性视频编解码的流程图。根据该方法，在步骤510中，在视频编码器侧与当前图像中的当前块有关的输入数据被接收，或者在视频解码器侧与包括当前图像中的当前块的压缩数据相对应的视频比特流被接收。当在步骤520中，当当前块满足一个或多个条件时，预定义模式被分配给当前块的帧内预测模式。条件包括当前块由ibc、bdpcm或调色板模式编解码。在步骤530中，根据当前块的帧内预测模式，当前块或后续编解码块被编码或解码。
[0117]
所示的流程图旨在说明根据本发明的视频编解码的示例。所属技术领域的技术人员可在不脱离本发明的精神的情况下修改每个步骤、重新布置步骤、拆分步骤或组合步骤以实施本发明。在本公开中，特定的语法和语义被用来说明用于实现本发明的实施例的示例。所属技术领域的技术人员可通过用等效的语法和语义替换语法和语义来实践本发明而不脱离本发明的精神。
[0118]
呈现以上描述是为了使所属技术领域的技术人员能够实践在特定应用及其要求的上下文中提供的本发明。对所描述的实施例的各种修改对于所属技术领域的技术人员将是显而易见的，并且本文中定义的一般原理可以应用于其他实施例。因此，本发明并不旨在限于所示出和描述的特定实施例，而是与与本文所公开的原理和新颖特征相一致的最广范围相一致。在以上详细描述中，示出了各种具体细节以便提供对本发明的透彻理解。然而，所属技术领域的技术人员将理解本发明可被实施。
[0119]
如上所述的本发明的实施例可以各种硬件，软件代码或两者的组合来实现。例如，本发明的实施例可以是集成到视频压缩芯片中的一个或多个电路电路或集成到视频压缩软件中的程序代码，以执行以上描述的处理。本发明的实施例还可以是将在数字信号处理器(digital signal processor，简称dsp)上执行的程序代码，以执行以上描述的处理。本发明还可以涉及由计算机处理器，dsp，微处理器或现场可程序设计门阵列(field programmable gate array，简称fpga)执行的许多功能。该些处理器可被配置为通过执行
定义本发明所体现的特定方法的机器可读软件代码或固件代码来执行根据本发明的特定任务。软件代码或固件代码可以用不同的程序设计语言和不同的格式或样式开发。还可以针对不同的目标平台编译软件代码。然而，软件代码的不同代码格式，样式和语言以及配置代码以执行根据本发明的任务的其他装置将不脱离本发明的精神和范围。
[0120]
在不脱离本发明的精神或基本特征的情况下，本发明可以其他特定形式实施。所描述的示例在所有方面都应被视为仅是说明性的而非限制性的。因此，本发明的范围由所附权利要求而不是以上的描述表示。在权利要求的含义和等同范围内的所有变化都包含在其范围内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

视频编码的色度直接模式产生方法和装置与流程

相关文献

最热文献