一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

帧内块复制编码模式中的二分之一像素插值滤波器的制作方法

2021-11-27 03:57:00 来源:中国专利 TAG:

帧内块复制编码模式中的二分之一像素插值滤波器
1.相关申请的交叉引用
2.根据适用的《专利法》和/或《巴黎公约》的规定,本技术及时要求2019年4月1日提交的国际专利申请no.pct/cn2019/080754的优先权和权益。根据法律,将上述申请的全部公开以参考方式并入本文,作为本技术公开的一部分。
技术领域
3.本专利文件涉及视频处理技术、设备和系统。


背景技术:

4.尽管在视频压缩方面取得了进步,在互联网和其他数字通信网络中,数字视频占用的带宽仍然最大。随着能够接收和显示视频的连接用户设备数量的增加,预计数字视频使用的带宽需求将继续增长。


技术实现要素:

5.描述了涉及数字视频处理、并且具体地涉及导出运动矢量的设备、系统和方法。所述方法可应用于现有视频编解码标准(例如,高效视频编解码(hevc)或多功能视频编解码)和未来视频编解码标准或视频编解码器。
6.在一个代表性方面,所公开的技术可用于提供用于视频处理的方法。所述方法包括:执行视频的当前视频块和所述视频的编码表示之间的转换,其中所述编码表示包括第一参数和/或第二参数,所述第一参数指示来自不使用默认运动信息精度的所述当前视频块的多个精度集的运动信息精度,所述第二参数标识是否将可选的二分之一像素插值滤波器用于所述转换,并且其中,所述第一参数和/或所述第二参数中的每一个与一个或多个二进制数相关联,并且将基于上下文模型的编解码仅用于所述编码表示中的所述一个或多个二进制数中的第一个二进制数。
7.在另一方面,所公开的技术可用于提供用于视频处理的方法。所述方法包括:使用插值滤波器为视频的当前视频块和所述视频的编码表示之间的转换确定运动信息,所述运动信息具有m整数像素精度或1/n子像素精度,其中m和n是正整数且n不等于2;以及基于所述运动信息执行所述转换;其中,所述编码表示中的语法字段对应于所述插值滤波器。
8.在另一方面,所公开的技术可用于提供用于视频处理的方法。所述方法包括:基于运动候选列表中的一个或多个运动候选、以及与所述一个或多个运动候选相关联的一个或多个插值滤波器,为视频的当前视频块和所述视频的编码表示之间的转换生成第一运动候选,其中,根据取决于与所述一个或多个运动候选相关联的所述一个或多个插值滤波器的规则,将插值滤波器分配给所述第一运动候选;将所述第一运动候选插入所述运动候选列表;以及基于所述运动候选列表执行所述转换。
9.在另一方面,所公开的技术可用于提供用于视频处理的方法。所述方法包括:将运动信息与包括视频的第一视频区域中的第一块和第二视频区域中的第二块的多个块中的
每一个相关联,所述运动信息包括关于用于对所述多个块中的每个块的运动矢量差信息进行插值的各个插值滤波器的信息;以及使用所述运动信息执行所述视频和所述视频的编码表示之间的转换。
10.在另一方面,所公开的技术可用于提供用于视频处理的方法。所述方法包括:执行视频的当前视频块和所述视频的编码表示之间的转换,其中,使用merge模式或运动矢量差merge(mmvd)模式在所述编码表示中表示所述当前视频块,其中根据规则将具有1/n精度的插值滤波器用于插值与所述当前视频块相关联的预测块,其中n是正整数;其中,所述规则定义了在所述插值滤波器是不同于默认插值滤波器的可选插值滤波器的情况下用于继承插值信息的条件。
11.在一个代表性方面,所公开的技术可用于提供用于视频处理的方法。所述方法包括:在包括当前视频块的视频和所述视频的编码表示之间的转换期间处理所述当前视频块;以及用所述当前视频块的运动信息比较并选择性地更新merge候选列表,其中所述运动信息包括插值滤波器信息;其中所述插值滤波器信息包括用于对用于在所述编码表示中表示所述当前视频块的运动矢量差值进行插值的插值滤波器的参数。
12.在一个代表性方面,所公开的技术可用于提供用于视频处理的方法。所述方法包括:在视频区域的当前视频块和所述视频的编码表示之间的转换之前,维护至少一个基于历史的运动矢量预测(hmvp)表,其中所述hmvp表包括对应于一个或多个先前处理的块的运动信息的一个或多个条目;以及使用所述至少一个hmvp表执行所述转换;并且其中,每个条目的所述运动信息被配置为包括所述一个或多个先前处理的块的插值滤波器信息,其中,所述插值滤波器信息指示用于对所述一个或多个先前处理的块的预测块进行插值的插值滤波器。
13.在一个代表性方面,所公开的技术可用于提供用于视频处理的方法。所述方法包括:在视频区域的当前视频块和所述视频的编码表示之间的转换之前,维护至少一个基于历史的运动矢量预测(hmvp)表,所述hmvp表包括对应于一个或多个先前处理的块的运动信息的一个或多个条目,并且其中,每个条目的所述运动信息被配置为包括所述一个或多个先前处理的块的插值滤波器信息;为所述转换构造包括hmvp merge候选的运动候选列表,其中,通过从包括与一个条目相关联的对应插值滤波器信息的所述hmvp表中继承所述一个条目来导出所述hmvp候选;以及基于所述运动候选列表执行所述转换。
14.在一个代表性方面,所公开的技术可用于提供用于视频处理的方法。所述方法包括:确定用于在视频的编码表示中表示所述视频的当前视频块的编解码模式;以及根据所述编解码模式将所述当前视频块编码成所述编码表示,其中,由于使用了所述编解码模式,对所述当前视频块禁用用于表示运动信息的二分之一像素精度。
15.在一个代表性方面,所公开的技术可用于提供用于视频处理的方法。所述方法包括:解析视频的编码表示,以确定所述视频的当前视频块是使用编解码模式编码的;以及根据所述编解码模式从所述编码表示生成所述当前视频块的解码表示,其中,由于使用了所述编解码模式,对所述当前视频块禁用用于表示运动信息的二分之一像素精度。
16.在一个代表性方面,所公开的技术可用于提供用于视频处理的方法。所述方法包括:为使用广义双向预测(gbi)模式处理的当前视频块,确定对第一预测块和第二预测块分别使用第一权重因子和不同的第二权重因子,所述第一权重因子和所述第二权重因子是从
权重因子集中选择的;以及基于所述确定执行视频的所述当前视频块和所述视频的编码表示之间的转换,其中,用于帧间模式的第一权重因子集不同于用于仿射帧间模式的第二权重因子集。
17.在一个代表性方面,所公开的技术可用于提供用于视频处理的方法。所述方法包括:为视频的视频区域的多个视频单元与所述多个视频单元的编码表示之间的转换,确定与取决于视频单元的编解码模式的插值滤波器相关的信息,所述插值滤波器用于对所述编码表示中的运动矢量差值进行插值,并且具有m整数像素精度或1/n子像素精度,其中m和n是正整数;以及使用所述插值滤波器执行所述转换。
18.在一个代表性方面,所公开的技术可用于提供用于视频编解码的方法。所述方法包括:确定用于在视频的编码表示中表示所述视频的当前视频块的编解码模式;以及根据所述编解码模式将所述当前视频块编码成所述编码表示,其中,由于使用了所述编解码模式,为所述当前视频块禁用用于表示运动信息的除了默认二分之一像素精度滤波器之外的可选二分之一像素精度滤波器。
19.在一个代表性方面,所公开的技术可用于提供用于视频解码的方法。所述方法包括:解析视频的编码表示,以确定当前视频块是使用编解码模式编码的;以及根据所述编解码模式从所述编码表示生成所述当前视频块的解码表示,其中,由于使用了所述编解码模式,为所述当前视频块禁用用于表示运动信息的除了默认二分之一像素精度滤波器之外的可选二分之一像素精度滤波器。
20.在一个代表性方面,所公开的技术可用于提供用于视频编解码的方法。所述方法包括:由于使用了为视频的视频块启用的可选插值滤波器,确定禁用用于将所述视频块编码成所述视频的编码表示的编解码模式;以及基于所述确定生成所述视频块的所述编码表示,其中所述可选插值滤波器用于对当前视频块的帧间预测块进行插值。
21.在一个代表性方面,所公开的技术可用于提供用于视频解码的方法。所述方法包括:由于使用了为视频的视频块启用的可选插值滤波器,确定禁用用于在所述视频的编码表示中表示所述视频块的编解码模式;以及基于所述确定通过解析所述编码表示来生成解码视频块。
22.此外,在一个代表性方面,上述任一方法是编码器侧实现。
23.此外,在一个代表性方面,上述任一方法是解码器侧实现。
24.上述方法中的一个以处理器可执行代码的形式实现并存储在计算机可读程序介质中。
25.在又一代表性方面,公开了一种视频系统中的装置,其包括处理器和其上具有指令的非暂时性存储器。在所述处理器执行所述指令时,所述指令使所述处理器实现所公开的任一方法。
26.在附图、说明书和权利要求书中更详细地描述了所公开技术的上述方面、以及其他方面和特征。
附图说明
27.图1示出了四叉树加二叉树(qtbt)块结构的图示。
28.图2示出了构造merge候选列表的示例。
29.图3示出了空域候选的位置的示例。
30.图4示出了经历空域merge候选的冗余检查的候选对的示例。
31.图5a和5b示出了基于当前块的尺寸和形状的第二预测单元(pu)的位置的示例。
32.图6示出了时域merge候选的运动矢量缩放的示例。
33.图7示出了时域merge候选的候选位置的示例。
34.图8示出了创建组合双向预测merge候选的示例。
35.图9示出了构造运动矢量预测候选的示例。
36.图10示出了空域运动矢量候选的运动矢量缩放的示例。
37.图11a和11b是用于实现本文所述的视觉媒体解码或视觉媒体编码技术的硬件平台的示例的框图。
38.图12a和12b示出了基于所公开技术的一些实现的视频处理的示例方法的流程图。
39.图13a至13c示出了基于所公开技术的一些实现的视频处理的示例方法的流程图。
40.图14a和14b示出了基于所公开技术的一些实现的视频处理的示例方法的流程图。
41.图15a至15d示出了基于所公开技术的一些实现的视频处理的示例方法的流程图。
42.图16a至16d示出了基于所公开技术的一些实现的视频处理的示例方法的流程图。
具体实施方式
43.1.hevc/h.265中的视频编解码
44.视频编解码标准主要是通过开发众所周知的itu

t和iso/iec标准而发展起来的。itu

t制作了h.261和h.263,iso/iec制作了mpeg

1和mpeg

4视频,并且这两个组织共同制作了h.262/mpeg

2视频和h.264/mpeg

4高级视频编解码(avc)和h.265/hevc标准。自h.262开始,视频编解码标准基于混合视频编解码结构,其中利用了时域预测加变换编解码。为探索hevc之外的未来视频编解码技术,vceg和mpeg于2015年共同成立了联合视频探索团队(jvet)。从那时起,jvet采用了许多新的方法,并将其应用到了名为联合探索模型(jem)的参考软件中。2018年4月,vceg(q6/16)和iso/iec jtc1 sc29/wg11(mpeg)之间的联合视频专家团队(jvet)成立,以致力于目标是与hevc相比其降低50%比特率的vvc标准。
45.2.1具有更大ctu的四叉树加二叉树(qtbt)块结构
46.在hevc中,通过使用四叉树结构(表示为编解码树)将ctu划分成cu来适应各种局部特性。在cu级别决定是使用图片间(时域)预测还是图片内(空域)预测对图片区域进行编解码。根据pu的划分类型,每个cu可以进一步划分成一个、两个或四个pu。在一个pu中,应用相同的预测处理,并且相关信息以pu为基础传输到解码器。在基于pu划分类型通过应用预测处理获得残差块后,可以根据与cu的编解码树相似的另一个四叉树结构将cu划分成变换单元(tu)。hevc结构的一个重要特征是它具有多个划分概念,包括cu、pu以及tu。
47.图1示出了四叉树加二叉树(qtbt)块结构的图示。qtbt结构消除了多个划分类型的概念。即,其消除了cu、pu和tu概念的分离,并支持cu划分形状的更多灵活性。在qtbt块结构中,cu可以是方形或矩形。如图1所示,首先用四叉树结构对编解码树单元(ctu)进行分割。四叉树叶节点进一步被二叉树结构分割。在二叉树分割中有两种分割类型:对称的水平分割和对称的垂直分割。二叉树叶节点被称为编解码单元(cu),该分割用于预测和转换处理,而无需进一步分割。这意味着在qtbt编解码块结构中cu、pu和tu具有相同的块尺寸。在
jem中,cu有时由不同颜色分量的编解码块(cb)组成,例如,在4:2:0色度格式的p条带和b条带中,一个cu包含一个亮度cb和两个色度cb,并且cu有时由单个分量的cb组成,例如,在i条带的情况下,一个cu仅包含一个亮度cb或仅包含两个色度cb。
48.为qtbt分割方案定义了以下参数。
49.–
ctu尺寸:四叉树的根节点尺寸,与hevc中的概念相同。
50.–
minqtsize:最小允许的四叉树叶节点尺寸
51.–
maxbtsize:最大允许的二叉树根节点尺寸
52.–
maxbtdepth:最大允许的二叉树深度
53.–
minbtsize:最小允许的二叉树叶节点尺寸
54.在qtbt分割结构的一个示例中,ctu尺寸被设置为具有两个对应的64
×
64色度样本块的128
×
128个亮度样本点,minqtsize被设置为16
×
16,maxbtsize被设置为64
×
64,minbtsize(宽度和高度)被设置为4
×
4,maxbtsize被设置为4。四叉树分割首先应用于ctu,以生成四叉树叶节点。四叉树叶节点的尺寸可以具有从16
×
16(即minqtsize)到128
×
128(即ctu尺寸)的尺寸。如果叶四叉树节点是128
×
128,则其不会被二叉树进一步划分,因为其尺寸超过了maxbtsize(即64
×
64)。否则,叶四叉树节点可以被二叉树进一步划分。因此,四叉树叶节点也是二叉树的根节点,并且其二叉树深度为0。当二叉树深度达到maxbtdepth(即4)时,不考虑进一步划分。当二叉树节点的宽度等于minbtsize(即4)时,不考虑进一步的水平划分。同样,当二叉树节点的高度等于minbtsize时,不考虑进一步的垂直划分。通过预测和变换处理进一步处理二叉树的叶节点,而不需要进一步的划分。在jem中,最大ctu尺寸为256
×
256个亮度样本点。
55.图1(左侧)示出了通过使用qtbt分割的块的示例,并且图1(右侧)示出了对应的树表示。实线指示四叉树划分,并且虚线指示二叉树划分。在二叉树的每个划分(即非叶)节点中,会信令通知一个标志来指示使用哪种划分类型(即水平或垂直),其中0表示水平划分,1表示垂直划分。对于四叉树划分,不需要指明划分类型,因为四叉树划分总是水平和垂直划分一个块,以生成尺寸相同的4个子块。
56.此外,qtbt方案支持亮度和色度具有单独的qtbt结构的能力。目前,对于p条带和b条带,一个ctu中的亮度和色度ctb共享相同的qtbt结构。然而,对于i条带,用qtbt结构将亮度ctb划分为cu,用另一个qtbt结构将色度ctb划分为色度cu。这意味着i条带中的cu由亮度分量的编解码块或两个色度分量的编解码块组成,p条带或b条带中的cu由所有三种颜色分量的编解码块组成。
57.在hevc中,为了减少运动补偿的内存访问,限制小块的帧间预测,使得4
×
8和8
×
4块不支持双向预测,并且4
×
4块不支持帧间预测。在jem的qtbt中,这些限制被移除。
58.2.2 hevc/h.265中的帧间预测
59.每个帧间预测的pu都有一个或两个参考图片列表的运动参数。运动参数包括运动矢量和参考图片索引。两个参考图片列表之一的使用也可以使用inter_pred_idc信令通知。运动矢量可显式地编码为相对于预测器的增量。
60.当cu采用跳过模式编解码时,一个pu与cu相关联,并且没有显著的残差系数,没有编解码运动矢量增量或参考图片索引。指定了一种merge模式,通过该模式,可以从临近的pu(包括空域和时域候选)中获取当前pu的运动参数。merge模式可以应用于任何帧间预测
的pu,而不仅仅是跳过模式。merge模式的另一种选择是运动参数的显式传输,其中运动矢量(更精确地,与运动矢量预测器相比的运动矢量差)、每个参考图片列表的对应的参考图片索引、以及参考图片列表的使用都会根据每个pu显式地信令通知。在本公开中,这样的模式被命名为高级运动矢量预测(amvp)。
61.当信令指示要使用两个参考图片列表中的一个时,从一个样本点块中生成pu。这被称为“单向预测”。单向预测对p条带(slice)和b条带都可用。
62.当信令指示要使用两个参考图片列表时,从两个样本点块中生成pu。这被称为“双向预测”。双向预测仅对b条带可用。
63.下文提供了在hevc中规定的关于帧间预测模式的细节。描述将从merge模式开始。
64.2.2.1 merge模式
65.2.2.1.1 merge模式的候选的推导
66.当使用merge模式预测pu时,从比特流中解析指向merge候选列表中条目的索引,并且使用该索引检索运动信息。在hevc标准中规定了此列表的构建,并且可按以下步骤顺序进行概括:
67.步骤1:初始候选推导
68.步骤1.1:空域候选推导
69.步骤1.2:空域候选冗余检查
70.步骤1.3:时域候选推导
71.步骤2:附加候选插入
72.步骤2.1:创建双向预测候选
73.步骤2.2:插入零运动候选
74.在图2中也示意性地示出了这些步骤。对于空域merge候选推导,在位于五个不同位置的候选中最多选择四个merge候选。对于时域merge候选推导,在两个候选中最多选择一个merge候选。由于在解码器处假定每个pu的候选数为常量,因此当从步骤1获得的候选数未达到条带标头中信令通知的最大merge候选数(maxnummergecand)时,生成附加的候选。由于候选数是恒定的,所以最佳merge候选的索引使用截断的一元二值化(tu)进行编解码。如果cu的尺寸等于8,则当前cu的所有pu都共享一个merge候选列表,这与2n
×
2n预测单元的merge候选列表相同。
75.在下文中,详细描述与前述步骤相关联的操作。
76.2.2.1.2空域候选推导
77.在空域merge候选的推导中,在位于图3所示位置的候选中最多选择四个merge候选。推导顺序为a1、b1、b0、a0和b2。只有当位置a1、b1、b0、a0的任何pu不可用(例如,因为它属于另一个条带或片)或是帧内编解码时,才考虑位置b2。在增加a1位置的候选后,对剩余候选的增加进行冗余检查,其确保具有相同运动信息的候选被排除在列表之外,从而提高编解码效率。为了降低计算的复杂度,在所提到的冗余检查中并不考虑所有可能的候选对。相反,只有与图4中的箭头链接的对才会被考虑,并且只有当用于冗余检查的对应候选没有相同的运动信息时,才将候选添加到列表中。复制运动信息的另一个来源是与2nx2n不同的分区相关的“第二pu”。例如,图5分别描述了n
×
2n和2n
×
n情况下的第二pu。当当前的pu被划分为n
×
2n时,对于列表构建不考虑a1位置的候选。实际上,通过添加此候选可能导致两个
具有相同运动信息的预测单元,这对于在编解码单元中仅具有一个pu是冗余的。同样地,当当前pu被划分为2n
×
n时,不考虑位置b1。
78.2.2.1.3时域候选推导
79.在此步骤中,只有一个候选添加到列表中。特别地,在这个时域merge候选的推导中,基于属于与给定参考图片列表中当前图片具有最小poc差的图片的并置pu导出了缩放运动矢量。用于推导并置pu的参考图片列表在条带标头中显式地信令通知。获取时域merge候选的缩放运动矢量(如图6中虚线所示),其使用poc距离tb和td从并置pu的运动矢量进行缩放,其中tb定义为当前图片的参考图片和当前图片之间的poc差,并且td定义为并置图片的参考图片与并置图片之间的poc差。时域merge候选的参考图片索引设置为零。hevc规范中描述了缩放处理的实际实现。对于b条带,得到两个运动矢量(一个是对于参考图片列表0,另一个是对于参考图片列表1)并将其组合使其成为双向预测merge候选。
80.在属于参考帧的并置pu(y)中,在候选c0和c1之间选择时域候选的位置,如图7所示。如果位置c0处的pu不可用、帧内编解码或在当前ctu行之外,则使用位置c1。否则,位置c0被用于时域merge候选的推导。
81.2.2.1.4附加候选插入
82.除了空域和时域merge候选,还有两种附加类型的merge候选:组合双向预测merge候选和零merge候选。组合双向预测merge候选是利用空域和时域merge候选生成的。组合双向预测merge候选仅用于b条带。通过将初始候选的第一参考图片列表运动参数与另一候选的第二参考图片列表运动参数相结合,生成组合双向预测候选。如果这两个元组提供不同的运动假设,它们将形成新的双向预测候选。作为示例,图7示出了该情形,其中原始列表(在左侧)中具有mvl0和refidxl0或mvl1和refidxl1的两个候选被用于创建添加到最终列表(在右侧)中的组合双向预测merge候选。定义了许多关于被认为生成这些附加merge候选的组合的规则。
83.插入零运动候选以填充merge候选列表中的其余条目,从而达到maxnummergecand的容量。这些候选具有零空域位移和从零开始并且每次将新的零运动候选添加到列表中时都会增加的参考图片索引。对于单向和双向预测,这些候选使用的参考帧的数量分别是1和2。最后,对这些候选不执行冗余检查。
84.2.2.1.5用于并行处理的运动估计区域
85.为了加快编解码处理,可以并行地执行运动估计,从而同时导出给定区域内所有预测单元的运动矢量。来自空域邻居的merge候选的推导可能会干扰并行处理,因为一个预测单元在其相关联的运动估计完成之前无法从相邻pu导出运动参数。为了缓解编解码效率和处理延迟之间的权衡,hevc定义了运动估计区域(mer),使用“log2_parallel_merge_level_minus2”语法元素在图片参数集中信令通知其尺寸。定义mer时,落入同一区域的merge候选被标记为不可用,并且因此在列表构造中不考虑。
86.2.2.2 amvp
87.amvp利用运动矢量与临近的pu的空时相关性,其用于运动参数的显式传输。对于每个参考图片列表,首先通过检查左上方的时域临近的pu位置的可用性、去掉多余的候选并且加上零矢量以使候选列表长度恒定来构建运动矢量候选列表。然后,编解码器可以从候选列表中选择最佳的预测器,并发送指示所选候选的对应索引。与merge索引信令类似,
最佳运动矢量候选的索引使用截断的一元进行编解码。在这种情况下,要编解码的最大值是2(参见图9)。在以下各章节中,提供了关于运动矢量预测候选的推导处理的细节。
88.2.2.2.1 amvp候选的推导
89.图9概括了运动矢量预测候选的推导处理。
90.在运动矢量预测中,考虑了两种类型的运动矢量候选:空域运动矢量候选和时域运动矢量候选。对于空域运动矢量候选的推导,基于位于图3所示的五个不同位置的每个pu的运动矢量最终推导出两个运动矢量候选。
91.对于时域运动矢量候选的推导,从两个候选中选择一个运动矢量候选,这两个候选是基于两个不同的并置位置推导出的。在做出第一个空时候选列表后,移除列表中重复的运动矢量候选。如果潜在候选的数量大于二,则从列表中移除相关联的参考图片列表中参考图片索引大于1的运动矢量候选。如果空时运动矢量候选数小于二,则会在列表中添加附加的零运动矢量候选。
92.2.2.2.2空域运动矢量候选
93.在推导空域运动矢量候选时,在五个潜在候选中最多考虑两个候选,这五个候选来自图3所示位置上的pu,这些位置与运动merge的位置相同。当前pu左侧的推导顺序定义为a0、a1、以及缩放的a0、缩放的a1。当前pu上侧的推导顺序定义为b0、b1,b2、缩放的b0、缩放的b1、缩放的b2。对于每侧,可以有四种情况用作运动矢量候选,其中两种情况不与空域缩放相关联,并且两种情况使用空域缩放。四种不同的情况概括如下:
94.‑‑
无空域缩放
95.(1)相同的参考图片列表,并且相同的参考图片索引(相同的poc)
96.(2)不同的参考图片列表,但是相同的参考图片(相同的poc)
97.‑‑
空域缩放
98.(3)相同的参考图片列表,但是不同的参考图片(不同的poc)
99.(4)不同的参考图片列表,并且不同的参考图片(不同的poc)
100.首先检查无空域缩放的情况,然后检查允许空域缩放的情况。当poc在临近pu的参考图片与当前pu的参考图片之间不同时,都会考虑空域缩放,而不管参考图片列表如何。如果左侧候选的所有pu都不可用或是帧内编解码,则允许对上述运动矢量进行缩放,以帮助左侧和上方mv候选的平行推导。否则,不允许对上述运动矢量进行空域缩放。
101.在空域缩放处理中,以与时域缩放类似的方式缩放临近pu的运动矢量,如图10所示。主要区别是,给出当前pu的参考图片列表和索引作为输入;实际的缩放处理与时域缩放处理相同。
102.2.2.2.3时域运动矢量候选
103.除了参考图片索引的推导外,时域merge候选的所有推导处理与空域运动矢量候选的推导处理相同(参见图7)。将参考图片索引信令通知给解码器。
104.2.3自适应运动矢量差分辨率(amvr)
105.在vvc中,对于常规帧间模式,可以用四分之一亮度样本点、整数亮度样本点或四亮度样本点的单位对mvd进行编解码。mvd分辨率在编解码单元(cu)级控制,并且对于具有至少一个非零mvd分量的每个cu,有条件地信令通知mvd分辨率标志。
106.对于具有至少一个非零mvd分量的cu,信令通知第一标志以指示是否在cu中使用
四分之一亮度样本点mv精度。当第一标志(等于1)指示不使用四分之一亮度样本点mv精度时,信令通知另一个标志以指示是使用整数亮度样本点mv精度还是四亮度样本点mv精度。
107.当cu的第一个mvd分辨率标志为零,或未对cu进行编解码(意味着cu中的所有mvd都为零)时,将四分之一亮度样本点mv分辨率用于cu。当cu使用整数亮度样本点mv精度或四亮度样本点mv精度时,将cu的amvp候选列表中的mvp取整到对应的精度。
108.2.4 vvc中的插值滤波器
109.对于亮度插值滤波,将8抽头可分离插值滤波器用于1/16像素精度样本点,如表1所示。
110.表1:用于1/16像素亮度插值的8抽头系数f
l

[0111][0112]
类似地,将4抽头可分离插值滤波器用于1/32像素精度色度插值,如表2所示。
[0113]
表2:用于1/32像素色度插值的4抽头插值系数f
c

[0114]
[0115][0116]
对于4:2:2的垂直插值和4:4:4色度通道的水平和垂直插值,不使用表2中的奇数位置,从而产生1/16像素色度插值。
[0117]
2.5可选的亮度二分之一像素插值滤波器
[0118]
在jvet

n0309中,提出了可选的二分之一像素插值滤波器。
[0119]
二分之一像素亮度插值滤波器的切换取决于运动矢量精度。除了现有的四分之一像素、全像素和4像素amvr模式外,还引入了一种新的二分之一像素精度amvr模式。只有在二分之一像素运动矢量精度的情况下,才可以选择可选的二分之一像素亮度插值滤波器。
[0120]
2.5.1.二分之一像素amvr模式
[0121]
提出了用于非仿射非merge帧间编解码cu的附加amvr模式,该模式允许以二分之一像素精度信令通知运动矢量差。当前vvc草案的现有amvr方案直接扩展如下:紧随语法元素amvr_flag,如果amvr_flag==1,则存在新的上下文建模的二进制语法元素hpel_amvr_flag,如果hpel_amvr_flag==1,则其指示使用新的二分之一amvr模式。否则,即如果hpel_amvr_flag==0,则由语法元素amvr_precision_flag指示全像素和4像素amvr模式之间的选择,如当前vvc草案中所示。
[0122]
2.5.2可选的亮度二分之一像素插值滤波器
[0123]
对于使用二分之一像素运动矢量精度(即二分之一像素amvr模式)的非仿射非merge帧间编解码的cu,基于新语法元素if_idx的值在hevc/vvc二分之一像素亮度插值滤波器和一个或多个可选的二分之一像素插值之间进行切换。仅在二分之一像素amvr模式下信令通知语法元素if_idx。在使用空域merge候选的跳过/merge模式的情况下,从临近块继承语法元素if_idx的值。
[0124]
2.5.2.1测试1:一个可选的二分之一像素插值滤波器
[0125]
在这个测试案例中,一个6抽头插值滤波器作为普通hevc/vvc二分之一像素插值滤波器的替代。下表示出语法元素if_idx的值与选定的二分之一像素亮度插值过滤器之间的映射:
[0126]
if_idx二值化滤波器插值滤波器系数00高斯(6抽头)[0,3,9,20,20,9,3,0]11hevc/vvc(8抽头)[

1,4,

11,40,40,

11,4,

1]
[0127]
2.5.2.2测试2:两个可选的二分之一像素插值滤波器
[0128]
在这个测试案例中,两个8抽头插值滤波器作为普通hevc/vvc二分之一像素插值滤波器的替代。下表示出语法元素if_idx的值与选定的二分之一像素亮度插值过滤器之间的映射:
[0129]
if_idx二值化滤波器插值滤波器系数00滤波器1(8抽头)[3,6,10,13,13,10,6,3]110滤波器2(8抽头)[

1,

1,9,25,25,9,

1,

1]211hevc/vvc(8抽头)[

1,4,

11,40,40,

11,4,

1]
[0130]
信令通知amvr_precision_idx以指示当前cu是否采用1/2像素、1像素或4像素mv精度。需要编解码两个二进制数。
[0131]
信令通知hpel_if_idx以指示是否使用默认的二分之一像素插值滤波器或可选的二分之一像素插值滤波器。当使用两个可选的二分之一像素插值滤波器时,需要编解码两个二进制数。
[0132]
2.6广义双向预测
[0133]
在传统的双向预测中,使用相等的权重0.5对来自l0和l1的预测器进行平均以生成最终预测器。预测器生成公式如等式(3)所示:
[0134]
p
traditionalbipred
=(p
l0
p
l1
roundingoffset)>>shiftnum,
ꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0135]
在等式(3)中,p
traditionalbipred
是传统双向预测的最终预测器,p
l0
和p
l1
分别是来自l0和l1的预测器,并且roundingoffset和shiftnum被用于对最终预测器进行归一化。
[0136]
提出广义的双向预测(gbi)以允许对来自l0和l1的预测器应用不同的权重。预测器生成如等式(4)所示。
[0137]
p
gbi
=((1

w1)*p
l0
w1*p
l1
roundingoffset
gbi
)>>shiftnum
gbi
,
ꢀꢀꢀꢀ
(2)
[0138]
在等式(4)中,p
gbi
是gbi的最终预测。(1

w1)和w1分别是应用到l0和l1的预测器的所选择的gbi权重。roundingoffset
gbi
和shiftnum
gbi
被用于对gbi中的最终预测器进行归一化。
[0139]
支持的w1权重表是{

1/4,3/8,1/2,5/8,5/4}。支持一个等权重集和四个不等权重集。对于等权重情况,生成最终预测器的处理与传统双向预测模式中的处理完全相同。对于随机访问(ra)条件下的真实双向预测情况,候选权重集的数量减少为三个。
[0140]
对于高级运动矢量预测(amvp)模式,如果用双向预测对该cu进行编解码,则gbi中的权重选择会在cu级显式地信令通知。对于merge模式,权重选择是从merge候选继承的。
[0141]
3.传统实现中的问题
[0142]
尽管在mmvd模式下导出的mv不是1/2像素精度的,但在运动矢量差merge(mmvd)模式时可以继承可选的二分之一像素插值滤波器,这是不合理的。
[0143]
在对amvr_precision_idx和hpel_if_idx进行编解码时,所有二进制数都是上下文编解码的。
[0144]
4.示例实施例和技术
[0145]
下面详述的实施例应被视为解释一般概念的示例。不应狭义地解释这些实施例。此外,这些实施例可以以任何方式组合。
[0146]
解码器侧运动矢量推导(dmvd)用于表示bdof(双向光流)或/和dmvr(解码器侧运动矢量细化)或/和与解码器处的细化运动矢量或预测样本点相关联的其他工具。
[0147]
在下文中,默认的插值滤波器可以指示在hevc/vvc中定义的滤波器。在下面的描述中,新引入的插值滤波器(诸如jvet

n0309中提出的插值滤波器)也可以被称为可选插值滤波器。
[0148]
1.可选的1/n像素插值滤波器可用于n不等于2的不同的n。
[0149]
a.在一个示例中,n可以等于4、16等。
[0150]
b.在一个示例中,可以在amvr模式中信令通知1/n像素插值滤波器的索引。
[0151]
i.此外,可选地,仅当块选择1/n像素mv/mvd精度时,才可以信令通知1/n像素插值滤波器的索引。
[0152]
c.在一个示例中,可不在merge模式或/和mmvd模式中继承可选的1/n像素插值滤波器。
[0153]
i.此外,可选地,在merge模式或/和mmvd模式中可以仅使用默认的1/n像素插值滤波器。
[0154]
d.在一个示例中,可在merge模式中继承可选的1/n像素插值滤波器。
[0155]
e.在一个示例中,可以在mmvd模式中继承可选的1/n像素插值滤波器。
[0156]
i.在一个示例中,当最终导出的mv为1/n像素精度(即没有mv分量具有更精细的mv精度)时,可以在mmvd模式中继承可选的1/n像素插值滤波器。
[0157]
ii.在一个示例中,当最终导出的mv的k(k>=1)个mv分量为1/n像素精度时,可在mmvd模式中继承可选的1/n像素插值滤波器。
[0158]
f.在一个示例中,可在mmvd模式或/和merge模式中继承可选的1/n像素插值滤波器,然而,仅将可选的1/n像素插值滤波器用于运动补偿。可以不为块存储可选的1/n像素插值滤波器的索引,并且可选的1/n像素插值滤波器的索引可以不被后续编解码块使用。
[0159]
2.插值滤波器(诸如默认的二分之一像素插值滤波器、可选的二分之一像素插值滤波器)的指示可以与其他运动信息(诸如运动矢量、参考索引)一起存储。
[0160]
a.在一个示例中,对于要编码/解码的一个块,当它访问位于不同区域(诸如在不同的ctu行中、在不同的vpdu中)的第二块时,不允许使用与第二块相关联的插值滤波器来编码/解码当前块。
[0161]
3.在merge模式或/和mmvd模式下,可以不继承可选的二分之一像素插值滤波器。
[0162]
a.在一个示例中,可以不在mmvd模式中继承可选的二分之一像素插值滤波器。
[0163]
i.此外,可选地,可将vvc中默认的二分之一像素插值滤波器始终用于mmvd模式。
[0164]
ii.可选地,可以在mmvd模式中继承可选的二分之一像素插值滤波器。也就是说,对于mmvd模式,可以继承与基础merge候选相关联的可选的二分之一像素插值滤波器。
[0165]
b.在一个示例中,在特定条件下,可在mmvd模式下继承可选的二分之一像素插值滤波器。
[0166]
i.在一个示例中,当最终导出的mv为1/2像素精度(即没有mv分量为更精细的mv精度,如1/4像素精度、1/16像素精度)时,可继承可选的二分之一像素插值滤波器。
[0167]
ii.在一个示例中,当最终导出的mv的k(k>=1)个mv分量为1/2像素精度时,可在mmvd模式中继承可选的二分之一像素插值滤波器。
[0168]
c.在一个示例中,可在mmvd模式或/和merge模式中继承可选的二分之一像素插值滤波器,然而,仅将可选的二分之一像素插值滤波器用于运动补偿。可以为块存储默认的二分之一像素插值滤波器而不是可选的二分之一像素插值滤波器的索引,并且该索引可以由后续编解码块使用。
[0169]
d.上述方法可适用于其中可应用1/n像素精度的多个插值滤波器的其它情况。
[0170]
4.可将插值滤波器信息存储在基于历史的运动矢量预测(hmvp)表中,并且可以由hmvp merge候选继承。在一些实现中,在视频区域的视频块和编码表示之间的转换之后,选择性地更新hmvp表。是否更新表(即更新表的选择性)是基于在视频块的转换之后、确定用于转换的运动候选中是否存在适于更新hmvp表的运动候选(例如,通过应用修剪等)。
[0171]
a.在一个示例中,当向hmvp查找表中插入新候选时,可以考虑插值滤波器信息。例如,可将具有相同运动信息但具有不同插值滤波器信息的两个候选被视为两个不同的候选。
[0172]
b.在一个示例中,当向hmvp查找表中插入新候选时,可将具有相同相同的运动信息但具有不同插值滤波器信息的两个候选被视为相同的候选。
[0173]
5.在向merge候选列表中插入merge候选时,在修剪处理中可以考虑插值滤波器信息。
[0174]
a.在一个示例中,可将具有不同插值滤波器的两个merge候选视为两个不同的merge候选。
[0175]
b.在一个示例中,当将hmvp merge候选插入merge列表时,在修剪处理中可以考虑插值滤波器信息。
[0176]
c.在一个示例中,当将hmvpmerge候选插入merge列表时,在修剪处理中可以不考虑插值滤波器信息。
[0177]
6.当生成成对merge候选或/和组合merge候选或/和零运动矢量候选或/和其他默认候选时,可以考虑插值滤波器信息,而不是总是使用默认的插值滤波器。
[0178]
a.在一个示例中,如果两个候选(生成成对merge候选或/和组合merge候选所涉及的)使用相同的可选插值滤波器,则可以在成对merge候选或/和组合merge候选中继承该插值滤波器。
[0179]
b.在一个示例中,如果两个候选中的一个(生成成对merge候选或/和组合merge候选所涉及的)不使用默认的插值滤波器,则可以在成对merge候选或/和组合merge候选中继承其插值滤波器。
[0180]
c.在一个示例中,如果两个候选中的一个(生成组合merge候选所涉及的)不使用默认的插值滤波器,则可以在组合merge候选中继承其插值滤波器。然而,可将这种插值滤波器仅用于对应的预测方向。
[0181]
d.在一个示例中,如果两个候选(生成组合merge候选所涉及的)使用不同的插值滤波器,则可以在组合merge候选中同时继承其插值滤波器。在这种情况下,可将不同的插值滤波器用于不同的预测方向。
[0182]
e.在一个示例中,不超过k(k>=0)个成对merge候选或/和组合merge候选可使用可选插值滤波器。
[0183]
f.在一个示例中,将默认的插值滤波器始终用于成对merge候选或/和组合merge候选。
[0184]
7.提出当当前块用ibc模式编解码时,禁止使用二分之一像素运动矢量/运动矢量差精度。
[0185]
a.此外,可选地,无需信令通知使用二分之一像素mv/mvd精度的指示。
[0186]
b.在一个示例中,如果当前块是用ibc模式编解码的,则始终禁用可选的二分之一像素插值滤波器。
[0187]
c.此外,可选地,无需信令通知二分之一像素插值滤波器的指示。
[0188]
d.在一个示例中,可将“当前块是用ibc模式编解码的”的条件替换为“当前块是用一种模式编解码的”。可将这种模式定义为三角模式、merge模式等。一个示例模式对应于这样的一种编解码模式,其中块被划分成两部分,每个部分与一个运动候选相关联,并且从相同的运动候选列表导出两个运动候选。
[0189]
8.在编解码amvr_precision_idx和/或hpel_if_idx时,只能对第一个二进制数进行上下文编解码。
[0190]
a.此外,可选地,还可以对其他二进制数进行旁路编解码。
[0191]
b.在一个示例中,可以对amvr_precision_idx的第一个二进制数进行旁路编解码。
[0192]
c.在一个示例中,可以对hpel_if_idx的第一个二进制数进行旁路编解码。
[0193]
d.在一个示例中,只能使用1个上下文来编解码amvr_precision_idx的第一个二进制数。
[0194]
e.在一个示例中,只能使用1个上下文来编解码hpel_if_idx的第一个二进制数。
[0195]
f.在一个示例中,amvr_precision_idx的所有二进制数可以共享相同的上下文。
[0196]
g.在一个示例中,hpel_if_idx的所有二进制数可以共享相同的上下文。
[0197]
9.当使用可选插值滤波器时,可禁用一些编解码工具。
[0198]
a.在一个示例中,当使用可选插值滤波器时,可禁用双向光流(bdof)。
[0199]
b.在一个示例中,当使用可选插值滤波器时,可禁用dmvr或/和dmvd。
[0200]
c.在一个示例中,当使用可选插的值滤波器时,可禁用ciip(组合帧间帧内预测)。
[0201]
i.在一个示例中,当merge候选继承可选插值滤波器时,ciip标志可以被跳过并且被推断为假。
[0202]
ii.可选地,当ciip标志为真时,可以始终使用默认的插值滤波器。
[0203]
d.在一个示例中,当使用可选插值滤波器时,可禁用smvd(对称运动矢量差)。
[0204]
i.在一个示例中,当使用smvd时,始终使用默认的插值滤波器,并且不信令通知与可选插值滤波器相关的语法元素。
[0205]
ii.可选地,当与可选插值滤波器相关的语法元素指示使用可选插值滤波器时,可不信令通知与smvd相关的语法元素,并且不使用smvd模式。
[0206]
e.在一个示例中,当使用可选插值滤波器时,可禁用sbt(子块变换)。
[0207]
i.在一个示例中,当使用sbt时,始终使用默认的插值滤波器,并且不信令通知与可选插值滤波器相关的语法元素。
[0208]
ii.可选地,当与可选插值滤波器相关的语法元素指示使用可选插值滤波器时,可不信令通知与sbt相关的语法元素,并且不使用sbt。
[0209]
f.在一个示例中,当使用可选插值滤波器时,可禁用其中将块划分成两部分的三角预测和其它编解码模式。在一些实现中,当块被分成两个部分时,每个部分与一个运动候选相关联,并且从相同的运动候选列表导出两个运动候选。
[0210]
i.在一个示例中,在三角预测中可不继承插值滤波器信息,并且可仅使用默认的插值滤波器。
[0211]
g.可选地,当使用可选插值滤波器时,可允许其中将块划分成两部分的三角预测和其它编解码模式。在一些实现中,当块被分成两个部分时,每个部分与一个运动候选相关联,并且从相同的运动候选列表导出两个运动候选。
[0212]
i.在一个示例中,可以在三角预测中继承插值滤波器信息。
[0213]
h.可选地,对于上面提到的编解码工具,如果其被启用,则可以禁用可选的二分之一像素插值滤波器。
[0214]
10.可将滤波器应用于n像素精度的mv。
[0215]
a.在一个示例中,n可以等于1、2或4等。
[0216]
b.在一个示例中,滤波器可以是低通滤波器。
[0217]
c.在一个示例中,滤波器可以是一维滤波器。
[0218]
i.例如,滤波器可以是一维水平滤波器。
[0219]
ii.例如,滤波器可以是一维垂直滤波器。
[0220]
d.在一个示例中,可以信令通知标志以指示是否使用了这种滤波器。
[0221]
i.此外,可选地,仅当将n像素mvd精度(在amvr模式下信令通知的)用于块时,才可以信令通知该标志。
[0222]
11.在gbi模式下,常规帧间模式和仿射模式可以使用不同的权重因子集。
[0223]
a.在一个示例中,可以在sps/片组标头/条带标头/vps/pps等中信令通知用于常规帧间模式和仿射模式的权重因子集。
[0224]
b.在一个示例中,可在编码器和解码器处预定义用于常规帧间模式和仿射模式的权重因子集。
[0225]
12.如何定义/选择可选插值滤波器可取决于编解码模式信息。
[0226]
a.在一个示例中,对于仿射模式和非仿射模式,允许的可选插值滤波器集合可以不同。
[0227]
b.在一个示例中,对于ibc模式和非ibc模式,允许的可选插值滤波器集合可以不同。
[0228]
5.公开技术的示例实现
[0229]
图11a是视频处理设备1100的框图。设备1100可用于实现本文所述的一种或多种方法。设备1100可实施于智能手机、平板电脑、计算机、物联网(iot)接收器等中。设备1100可以包括一个或多个处理器1102、一个或多个存储器1104和视频处理硬件1106。处理器1102可以被配置成实现本文中描述的一个或多个方法。存储器1104可用于存储用于实现本文描述的方法和技术的数据和代码。视频处理硬件1106可用于在硬件电路中实现本文中描述的一些技术,并且可以部分或完全地是处理器1102的一部分(例如,图形处理器核心gpu或其他信号处理电路)。
[0230]
图11b是可以实现所公开的技术的视频处理系统的框图的另一示例。图11b是示出其中可以实现本文公开的各种技术的示例性视频处理系统4100的框图。各种实现可以包括系统4100的部分或全部组件。系统4100可以包括用于接收视频内容的输入4102。视频内容可以原始或未压缩格式(例如,8或10比特多分量像素值)接收,或者可以压缩或编码格式接收。输入4102可以表示网络接口、外围总线接口或存储接口。网络接口的示例包括诸如以太网、无源光网络(pon)等有线接口和诸如wi

fi或蜂窝接口的无线接口。
[0231]
系统4100可以包括编解码组件4104,其可以实现本文中描述的各种编码或译码方法。编解码组件4104可以降低从输入4102到编解码组件4104的输出的视频的平均比特率,以产生视频的编码表示。因此,编解码技术有时被称为视频压缩或视频转码技术。编解码组件4104的输出可以被存储,或者通过如组件4106表示的连接的通信来发送。组件4108可以使用在输入4102处接收的视频的存储或通信的比特流(或编码)表示来生成发送到显示接口4110的像素值或可显示视频。从比特流表示生成用户可视视频的处理有时称为视频解压缩。此外,虽然某些视频处理操作被称为“编码”操作或工具,但是应当理解,编码工具或操作在编码器处使用,并且将由解码器执行反转编码结果的对应的解码工具或操作。
[0232]
外围总线接口或显示接口的示例可以包括通用串行总线(usb)或高清晰度多媒体接口(hdmi)或显示端口等。存储接口的示例包括sata(串行高级技术附件)、pci、ide接口等。本文中描述的技术可以实施在各种电子设备中,例如能够执行数字数据处理和/或视频显示的移动电话、膝上型计算机、智能手机或其他设备。
[0233]
所公开技术的一些实施例包括:作出启用视频处理工具或模式的决策或确定。在一个示例中,当视频处理工具或模式被启用时,编解码器将在视频块的处理中使用或实现该工具或模式,但不一定基于该工具或模式的使用来修改产生的比特流。也就是说,当基于
决策或确定启用视频处理工具或模式时,从视频块到视频的比特流表示的转换将使用该视频处理工具或模式。在另一示例中,当视频处理工具或模式被启用时,解码器将在知晓已经基于视频处理工具或模式修改了比特流的情况下处理比特流。也就是说,将使用基于决策或确定而启用的视频处理工具或模式来执行从视频的比特流表示到视频块的转换。
[0234]
所公开技术的一些实施例包括:作出禁用视频处理工具或模式的决策或确定。在一个示例中,当视频处理工具或模式被禁用时,编解码器将不在将视频块转换到视频的比特流表示的转换中使用该工具或模式。在另一示例中,当视频处理工具或模式被禁用时,解码器将在知晓未使用基于所述决策或确定而启用的视频处理工具或模式修改比特流的情况下来处理比特流。
[0235]
在本文中,术语“视频处理”可指视频编码、视频解码、视频转码、视频压缩或视频解压缩。例如,可以在从视频的像素表示到对应的比特流表示的转换期间应用视频压缩算法,反之亦然。例如,当前视频块的比特流表示可以对应于由语法定义的比特流中的并置位置或在不同位置传播的比特。例如,可以根据经过转换和编码的误差残差来编解码宏块,并且也可以使用比特流中的标头和其他字段中的比特来编解码宏块。
[0236]
应当理解的是,通过允许使用本文中公开的技术,所公开的方法和技术将有利于并入诸如智能手机、笔记本电脑、台式机和类似设备的视频处理设备中的视频编码器和/或解码器实施例。
[0237]
图12a是视频处理的示例方法1210的流程图。方法1210包括:在1212处,执行视频的当前视频块和视频的编码表示之间的转换。在一些实现中,编码表示包括第一参数和/或第二参数,所述第一参数指示来自不使用默认运动信息精度的当前视频块的多个精度集的运动信息精度,所述第二参数标识是否将可选的二分之一像素插值滤波器用于转换。在一些实现中,第一参数和/或第二参数中的每一个与一个或多个二进制数相关联,并且将基于上下文模型的编解码仅用于编码表示中的一个或多个二进制数中的第一个二进制数。在一些实现中,使用merge模式或运动矢量差merge(mmvd)模式在编码表示中表示当前视频块,其中根据规则将1/n精度的插值滤波器用于插值与当前视频块相关联的预测块,其中n是正整数;其中,所述规则定义了在插值滤波器是不同于默认插值滤波器的可选插值滤波器的情况下用于继承插值信息的条件。
[0238]
图12b是视频处理的示例方法1220的流程图。方法1220包括:在1222处,使用插值滤波器为视频的当前视频块和视频的编码表示之间的转换确定运动信息,运动信息为m整数像素精度或1/n子像素精度,其中m和n是正整数且n不等于2。方法1220还包括:在1224处,基于运动信息执行转换。
[0239]
图13a是视频处理的示例方法1310的流程图。方法1310包括:在1312处,基于运动候选列表中的一个或多个运动候选、以及与一个或多个运动候选相关联的一个或多个插值滤波器,为视频的当前视频块和视频的编码表示之间的转换生成第一运动候选,其中,根据取决于与一个或多个运动候选相关联的一个或多个插值滤波器的规则,将插值滤波器分配给第一运动候选。方法1310还包括:在1314处,将第一运动候选插入运动候选列表。方法1310还包括:在1316处,基于运动候选列表执行转换。
[0240]
图13b是视频处理的示例方法1320的流程图。方法1320包括:在1322处,将运动信息与包括视频的第一视频区域中的第一块和第二视频区域中的第二块的多个块中的每一
个相关联,所述运动信息包括关于用于对多个块中的每个块的运动矢量差信息进行插值的各个插值滤波器的信息。方法1320还包括:在1324处,使用运动信息执行视频和视频的编码表示之间的转换。
[0241]
图13c是视频处理的示例方法1330的流程图。方法1330包括:在1332处,在包括当前视频块的视频和视频的编码表示之间的转换期间处理当前视频块。方法1330还包括:在1334处,用当前视频块的运动信息比较并选择性地更新merge候选列表。在一些实现中,运动信息包括插值滤波器信息,并且插值滤波器信息包括用于对用于在编码表示中表示当前视频块的运动矢量差值进行插值的插值滤波器的参数。
[0242]
图14a是视频处理的示例方法1410的流程图。方法1410包括:在1412处,在视频区域的当前视频块和视频的编码表示之间的转换之前,维护至少一个基于历史的运动矢量预测(hmvp)表,其中hmvp表包括对应于一个或多个先前处理的块的运动信息的一个或多个条目。方法1410还包括:在1414处,使用至少一个hmvp表执行转换。在一些实现中,每个条目的运动信息被配置为包括一个或多个先前处理的块的插值滤波器信息。在一些实现中,插值滤波器信息指示用于对一个或多个先前处理的块的预测块进行插值的插值滤波器。
[0243]
图14b是视频处理的示例方法1420的流程图。方法1420包括:在1422处,在视频区域的当前视频块和视频的编码表示之间的转换之前,维护至少一个基于历史的运动矢量预测(hmvp)表,该hmvp表包括对应于一个或多个先前处理的块的运动信息的一个或多个条目,并且其中,每个条目的运动信息被配置为包括一个或多个先前处理的块的插值滤波器信息。方法1420还包括:在1424处,为所述转换构造包括hmvp merge候选的运动候选列表,其中,通过从包括与一个条目相关联的对应插值滤波器信息的hmvp表中继承一个条目来导出hmvp候选。方法1420还包括:在1426处,基于运动候选列表执行转换。
[0244]
图15a是视频处理的示例方法1510的流程图。方法1510包括:在1512处,确定用于在视频的编码表示中表示视频的当前视频块的编解码模式。方法1510还包括:在1514处,根据编解码模式将当前视频块编码成编码表示,其中,由于使用了编解码模式,对当前视频块禁用用于表示运动信息的二分之一像素精度。
[0245]
图15b是视频处理的示例方法1520的流程图。方法1520包括:解析视频的编码表示,以确定所述视频的当前视频块是使用编解码模式编码的。方法1520还包括:在1524处,根据编解码模式从编码表示生成当前视频块的解码表示,其中,由于使用了编解码模式,对当前视频块禁用用于表示运动信息的二分之一像素精度。
[0246]
图15c是视频处理的示例方法1530的流程图。方法1530包括:在1532处,为使用广义双向预测(gbi)模式处理的当前视频块,确定对第一预测块和第二预测块分别使用第一权重因子和不同的第二权重因子,第一权重因子和第二权重因子是从权重因子集中选择的。方法1530还包括:在1534处,基于确定执行视频的当前视频块和视频的编码表示之间的转换。在一些实现中,用于帧间模式的第一权重因子集不同于用于仿射帧间模式的第二权重因子集。
[0247]
图15d是视频处理的示例方法1540的流程图。方法1540包括:在1542处,为视频的视频区域的多个视频单元与多个视频单元的编码表示之间的转换,确定与取决于视频单元的编解码模式的插值滤波器相关的信息,所述插值滤波器用于对编码表示中的运动矢量差值进行插值,并且具有m整数像素精度或1/n子像素精度,其中m和n是正整数。方法1540还包
括:在1544处,使用插值滤波器执行转换。
[0248]
图16a是视频处理的示例方法1610的流程图。方法1610包括:在1612处,确定用于在视频的编码表示中表示视频的当前视频块的编解码模式。方法1610还包括:在1614处,根据编解码模式将当前视频块编码成编码表示。在一些实现中,由于使用了编解码模式,为当前视频块禁用用于表示运动信息的除了默认的二分之一像素精度滤波器之外的可选二分之一像素精度滤波器。
[0249]
图16b是视频处理的示例方法1620的流程图。方法1620包括:在1622处,解析视频的编码表示,以确定视频的当前视频块是使用编解码模式编码的。在一些实现中,方法1620还包括:在1624处,根据编解码模式从编码表示生成当前视频块的解码表示,由于使用了编解码模式,为当前视频块禁用用于表示运动信息的除了默认的二分之一像素精度滤波器之外的可选二分之一像素精度滤波器。
[0250]
图16c是视频处理的示例方法1630的流程图。方法1630包括:在1632处,由于使用了为视频的视频块启用的可选插值滤波器,确定禁用用于将视频块编码成视频的编码表示的编解码模式。方法1630还包括:在1634处,基于所述确定生成视频块的编码表示,其中可选插值滤波器用于对当前视频块的帧间预测块进行插值。
[0251]
图16d是视频处理的示例方法1640的流程图。方法1640包括:在1642处,由于使用了为视频的视频块启用的可选插值滤波器,确定禁用用于在视频的编码表示中表示视频块的编解码模式。方法1640还包括:在1644处,基于确定通过解析编码表示来生成解码视频块。
[0252]
可以使用以下基于条款的格式来描述各种技术和实施例。
[0253]
第一组条款描述了先前章节中公开的技术的某些特征和方面。
[0254]
1.一种视频处理方法,包括:基于对一组临近块应用至少一个插值滤波器来为当前视频块确定单个运动信息集,其中,所述至少一个插值滤波器可配置为所述单个运动信息集的整数像素精度或子像素精度;并且执行所述当前视频块和所述当前视频块的比特流表示之间的转换,其中所述转换包括解码器运动矢量细化(dmvr)步骤,其用于细化在所述比特流表示中信令通知信号的所述单个运动信息集。
[0255]
2.根据条款1所述的方法,其中当所述单个运动信息集与自适应运动矢量分辨率(amvr)模式相关联时,在所述比特流表示中信令通知所述至少一个插值滤波器的索引。
[0256]
3.根据条款1所述的方法,其中当所述单个运动信息集与merge模式相关联时,从先前的视频块继承所述至少一个插值滤波器的索引。
[0257]
4.根据条款1所述的方法,其中当所述单个运动信息集与运动矢量差merge(mmvd)模式相关联时,从先前的视频块继承所述至少一个插值滤波器的索引。
[0258]
5.根据条款1所述的方法,其中所述至少一个插值滤波器对应于具有所述子像素精度的默认滤波器,并且其中,所述单个运动信息集与运动矢量差merge(mmvd)模式相关联。
[0259]
6.根据条款2至4中任一项所述的方法,其中所述当前视频块的所述至少一个插值滤波器的系数是从所述先前的视频块继承的。
[0260]
7.根据条款1至6中任一项所述的方法,其中所述单个运动信息集的所述子像素精度等于1/4像素或1/16像素。
[0261]
8.根据条款1至7中任一项所述的方法,其中所述单个运动信息集的一个或多个分量具有所述子像素精度。
[0262]
9.根据条款1所述的方法,其中使用6个系数或8个系数来表示所述至少一个插值滤波器。
[0263]
10.根据条款5所述的方法,其中所述至少一个插值滤波器的索引仅与所述当前视频块相关联,而不与后续视频块相关联。
[0264]
11.根据条款1所述的方法,其中与所述至少一个插值滤波器相关的信息与所述单个运动信息集一起存储。
[0265]
12.根据条款11所述的方法,其中与所述至少一个插值滤波器相关的信息将所述至少一个插值滤波器标识为默认滤波器。
[0266]
13.根据条款1所述的方法,其中另一个视频块的插值滤波器禁止使用所述当前视频块的所述至少一个插值滤波器的系数。
[0267]
14.根据条款1至13中任一项所述的方法,其中所述至少一个插值滤波器对应于多个滤波器,所述多个滤波器中的每个滤波器都与所述单个运动信息集的所述子像素精度相关联。
[0268]
15.根据条款1至14中任一项所述的方法,其中所述单个运动信息集的每个分量的精度等于或低于所述单个运动信息集的所述子像素精度。
[0269]
16.根据条款1至15中任一项所述的方法,其中将所述至少一个插值滤波器存储在基于历史的运动矢量预测(hmvp)查找表中。
[0270]
17.根据条款16所述的方法,还包括:
[0271]
在检测到另一视频块的运动信息与所述当前视频块的所述单个运动集相同时,将所述单个运动信息集插入所述hmvp表中,而不将所述另一视频块的所述运动信息插入所述hmvp表。
[0272]
18.根据条款16所述的方法,还包括:在检测到另一视频块的运动信息与所述当前视频块的所述单个运动集相同时,将所述当前视频块的所述单个运动信息集和所述另一视频块的所述运动信息都插入所述hmvp表中。
[0273]
19.根据条款17至18中任一项所述的方法,其中所述另一视频块与插值滤波器相关联,并且其中,所述插入至少部分基于所述当前视频块的所述至少一个插值滤波器和/或所述另一视频块的所述插值滤波器。
[0274]
20.根据条款17至19中任一项所述的方法,其中所述当前视频块和所述另一视频块对应于成对候选或组合merge候选。
[0275]
21.根据条款17至20中任一项所述的方法,其中所述当前视频块的所述至少一个插值滤波器和所述另一视频块的所述插值滤波器相同。
[0276]
22.根据条款17至20中任一项所述的方法,其中所述当前视频块的所述至少一个插值滤波器与所述另一视频块的所述插值滤波器不同。
[0277]
23.根据条款1所述的方法,其中所述当前视频块以帧内块复制(ibc)模式编解码,并且其中,禁用所述单个运动信息集的表示中的所述子像素精度。
[0278]
24.根据条款1至23中任一项所述的方法,其中禁用所述至少一个插值滤波器。
[0279]
25.根据条款1所述的方法,其中所述至少一个插值滤波器与amvr_precision_idx
标志和/或hpel_if_idx标志相关联。
[0280]
26.根据条款25所述的方法,其中所述amvr_precision_idx标志和/或所述hpel_if_idx标志与旁路编解码的二进制数或上下文编解码的二进制数相关联。
[0281]
27.根据条款26所述的方法,其中第一个二进制数是旁路编解码的二进制数或上下文编解码的二进制数。
[0282]
28.根据条款25至27中任一项所述的方法,其中所有二进制数共享相同的上下文。
[0283]
29.根据条款1所述的方法,其中基于采用所述至少一个插值滤波器而禁用一个或多个视频处理步骤。
[0284]
30.根据条款29所述的方法,其中所述一个或多个视频处理步骤包括解码器运动矢量细化(dmvr)步骤、双向光流(bdof)步骤、组合帧间帧内预测(ciip)步骤、对称运动矢量差(smvd)步骤、子块变换(sbt)步骤或三角预测步骤。
[0285]
31.根据条款30所述的方法,其中所述至少一个插值滤波器对应于默认滤波器。
[0286]
32.根据条款30至31中任一项所述的方法,其中禁用所述一个或多个视频处理步骤包括:在所述比特流表示中禁用所述一个或多个视频处理步骤的指示。
[0287]
33.根据条款30至31中任一项所述的方法,其中禁用所述一个或多个视频处理步骤包括:禁用所述当前视频块的所述至少一个插值滤波器到另一视频块的继承。
[0288]
34.根据条款1所述的方法,其中所述单个运动信息集的所述整数像素精度对应于1像素、2像素或4像素。
[0289]
35.根据条款34所述的方法,其中所述至少一个插值滤波器是低通滤波器。
[0290]
36.根据条款34所述的方法,其中所述至少一个插值滤波器是一维滤波器。
[0291]
37.根据条款36所述的方法,其中所述一维滤波器是水平滤波器或垂直滤波器。
[0292]
38.根据条款34所述的方法,其中所述比特流表示中的标志指示是否使用所述至少一个插值滤波器。
[0293]
39.根据条款1至38中任一项所述的方法,其中所述当前视频块与自适应运动矢量分辨率(amvr)模式相关联。
[0294]
40.根据条款1至39中任一项所述的方法,其中用于所述当前视频块的帧间模式的所述至少一个插值滤波器不同于所述当前视频块的广义双预测(gbi)模式的插值滤波器。
[0295]
41.根据条款1至40中任一项所述的方法,其中所述至少一个插值滤波器是预先确定的。
[0296]
42.根据条款1至41中任一项所述的方法,其中所述比特流表示包括与所述当前视频块相关联的视频参数集(vps)、图片参数集(pps)、图片标头、片组标头或条带标头。
[0297]
43.根据条款1至42中任一项或多项所述的方法,其中所述视频处理是编码器侧实现。
[0298]
44.根据条款1至70中任一项或多项所述的方法,其中所述视频处理是解码器侧实现。
[0299]
45.一种视频系统中的装置,其包括处理器和其上具有指令的非暂时性存储器,其中,在所述处理器执行所述指令时,所述指令使所述处理器实现条款1至44中任一项所述的方法。
[0300]
46.一种存储在非暂时性计算机可读介质上的计算机程序产品,所述计算机程序
产品包括用于实现条款1至44中任一项所述的方法的程序代码。
[0301]
第二组条款描述了先前章节(例如,包括示例性实现1、8和10)中列出的公开技术的某些特征和方面。
[0302]
1.一种视频处理方法,包括:执行视频的当前视频块和所述视频的编码表示之间的转换,其中所述编码表示包括第一参数和/或第二参数,所述第一参数指示来自不使用默认运动信息精度的所述当前视频块的多个精度集的运动信息精度,所述第二参数标识是否将可选的二分之一像素插值滤波器用于所述转换,并且其中,所述第一参数和/或所述第二参数中的每一个与一个或多个二进制数相关联,并且将基于上下文模型的编解码仅用于所述编码表示中的所述一个或多个二进制数中的第一个二进制数。
[0303]
2.根据条款1所述的方法,其中所述运动信息包括运动矢量预测、运动矢量差、和运动矢量中的至少一个。
[0304]
3.根据条款1所述的方法,其中所述第一参数是amvr_precision_idx。
[0305]
4.根据条款1所述的方法,其中所述默认运动信息精度为1/4亮度样本点。
[0306]
5.根据条款1所述的方法,其中所述多个精度集包括1/16亮度样本点、1/2亮度样本点、1亮度样本点和4亮度样本点中的至少一个。
[0307]
6.根据条款1所述的方法,其中所述当前块以帧间模式、仿射帧间模式或帧内块复制模式编码。
[0308]
7.根据条款1所述的方法,其中将一个上下文用于所述第一参数的所述第一个二进制数。
[0309]
8.根据条款1所述的方法,其中其余的二进制数是旁路编解码的。
[0310]
9.根据条款1所述的方法,其中所述第一参数的所述第一个二进制数和/或所述第二参数的所述第一个二进制数是旁路编解码的。
[0311]
10.根据条款1所述的方法,其中将一个上下文用于所述第二参数的所述第一个二进制数。
[0312]
11.根据条款1所述的方法,其中所述第一参数的所有二进制数共享一个上下文。
[0313]
12.根据条款1所述的方法,其中所述第二参数的所有二进制数共享一个上下文。
[0314]
13.根据条款1所述的方法,其中所述第二参数具有第一值,所述第一值指示使用默认的二分之一像素插值滤波器。
[0315]
14.根据条款1所述的方法,其中所述第二参数具有第二值,所述第二值使用所述可选的二分之一像素插值滤波器。
[0316]
15.根据条款13所述的方法,其中所述默认的二分之一像素插值滤波器的系数集为[

1,4,

11,40,40,

11,4,

1]。
[0317]
16.根据条款1所述的方法,其中所述可选的二分之一像素插值滤波器的系数集为[0,3,9,20,20,9,3,0]。
[0318]
17.一种视频处理方法,包括:使用插值滤波器为视频的当前视频块和所述视频的编码表示之间的转换确定运动信息,所述运动信息具有m整数像素精度或1/n子像素精度,其中m和n是正整数且n不等于2;以及基于所述运动信息执行所述转换;其中,所述编码表示中的语法字段对应于所述插值滤波器。
[0319]
18.根据条款17所述的方法,其中n等于4。可选地,在一些实施例中,n等于16。
[0320]
19.根据条款17所述的方法,其中,由于所述当前视频块使用自适应运动矢量差分辨率(amvr)模式编解码,所述编码表示包括所述插值滤波器的索引。
[0321]
20.根据条款17所述的方法,其中,由于所述当前视频块使用merge模式和/或运动矢量差merge(mmvd)模式编解码,不从先前的视频块继承所述插值滤波器的索引。
[0322]
21.根据条款17所述的方法,其中,由于所述当前视频块使用merge模式和/或运动矢量差merge(mmvd)模式编解码,所述语法字段指示默认插值滤波器。
[0323]
22.根据条款17所述的方法,其中,对于使用merge模式和/或运动矢量差merge(mmvd)模式编解码的所述当前视频块,从先前的视频块继承所述插值滤波器的索引。
[0324]
23.根据条款22所述的方法,其中所述运动信息具有所述子像素精度。
[0325]
24.根据条款22所述的方法,其中所述运动信息包括具有所述子像素精度的一个或多个分量。
[0326]
25.根据条款22所述的方法,其中所述插值滤波器的索引仅与所述当前视频块相关联,而不与后续视频块相关联。
[0327]
26.根据条款17所述的方法,其中m等于1、2或4。
[0328]
27.根据条款17所述的方法,其中所述插值滤波器是低通滤波器。
[0329]
28.根据条款17所述的方法,其中所述插值滤波器是一维滤波器。
[0330]
29.根据条款28所述的方法,其中所述一维滤波器是水平滤波器或垂直滤波器。
[0331]
30.根据条款17所述的方法,其中所述编码表示选择性地包括指示是否启用具有m整数像素精度的所述插值滤波器的标志。
[0332]
31.根据条款30所述的方法,其中,当且仅当所述当前视频块是使用整数像素运动矢量精度编码时,才信令通知所述标志。
[0333]
32.根据条款1至31中任一项所述的方法,其中所述转换的所述执行包括从所述编码表示生成所述视频。
[0334]
33.根据条款1至31中任一项所述的方法,其中所述转换的所述执行包括从所述视频生成所述编码表示。
[0335]
34.一种视频系统中的装置,其包括处理器和其上具有指令的非暂时性存储器,其中,在所述处理器执行所述指令时,所述指令使所述处理器实现条款1至33中任一项所述的方法。
[0336]
35.一种存储在非暂时性计算机可读介质上的计算机程序产品,所述计算机程序产品包括用于实现条款1至35中任一项所述的方法的程序代码。
[0337]
第三组条款描述了先前章节(例如,包括示例性实现2、3、5和6)中列出的公开技术的某些特征和方面。
[0338]
1.一种视频处理方法,包括:基于运动候选列表中的一个或多个运动候选、以及与所述一个或多个运动候选相关联的一个或多个插值滤波器,为视频的当前视频块和所述视频的编码表示之间的转换生成第一运动候选,其中,根据取决于与所述一个或多个运动候选相关联的所述一个或多个插值滤波器的规则,将插值滤波器分配给所述第一运动候选;将所述第一运动候选插入所述运动候选列表;以及基于所述运动候选列表执行所述转换。
[0339]
2.根据条款1所述的方法,其中所述第一运动候选对应于成对merge候选、组合merge候选、零运动矢量候选、和/或其他默认候选中的至少一个。
[0340]
3.根据条款1所述的方法,其中每个运动候选与二分之一样本点插值滤波器索引相关联,并且由至少两个运动候选的二分之一样本点插值滤波器索引来确定所述第一运动候选的二分之一样本点插值滤波器。
[0341]
4.根据条款1所述的方法,其中,对于与相同的二分之一样本点插值滤波器相关联的两个运动候选,所述规则指定在所述第一运动候选中继承所述相同的二分之一样本点插值滤波器。
[0342]
5.根据条款4所述的方法,其中所述相同的二分之一样本点插值滤波器对应于与等于1的二分之一样本点插值滤波器索引相关联的可选的二分之一样本点插值滤波器,所述可选的二分之一样本点插值滤波器不同于与等于0的二分之一样本点插值滤波器索引相关联的默认的二分之一样本点插值滤波器。
[0343]
6.根据条款1所述的方法,其中,对于不与默认插值滤波器相关联的所述运动候选中的一个,所述规则指定在所述第一运动候选中继承所述插值滤波器。
[0344]
7.根据条款6所述的方法,其中仅将所述插值滤波器用于对应的预测方向。
[0345]
8.根据条款1所述的方法,其中,对于与不同的插值滤波器相关联的两个运动候选,所述规则指定在所述第一运动候选中继承所述不同的插值滤波器。
[0346]
9.根据条款1所述的方法,其中将所述不同的插值滤波器用于不同的预测方向。
[0347]
10.根据条款1所述的方法,其中所分配的插值滤波器对应于可选插值滤波器的所述第一运动候选的数量不大于k,其中k等于或大于0。
[0348]
11.根据条款1所述的方法,其中始终将默认插值滤波器用于所述第一运动候选。
[0349]
12.一种视频处理方法,包括:将运动信息与包括视频的第一视频区域中的第一块和第二视频区域中的第二块的多个块中的每一个相关联,所述运动信息包括关于用于对所述多个块中的每个块的运动矢量差信息进行插值的各个插值滤波器的信息;以及使用所述运动信息执行所述视频和所述视频的编码表示之间的转换。
[0350]
13.根据条款12所述的方法,其中所述运动信息包括指示使用默认运动插值滤波器的信息。
[0351]
14.根据条款12所述的方法,其中,所述运动信息标识不同于默认插值滤波器的可选插值滤波器。
[0352]
15.根据条款12所述的方法,其中所述运动信息包括一个或多个运动矢量和一个或多个参考帧索引。
[0353]
16.根据条款12至15中任一项所述的方法,其中所述第一视频区域和所述第二视频区域是编解码树单元行。
[0354]
17.根据条款12至15中任一项所述的方法,其中所述第一视频区域和所述第二视频区域是虚拟管道数据单元。
[0355]
18.根据条款12至17中任一项所述的方法,其中所述第一视频区域和所述第二视频区域是不同的区域。
[0356]
19.根据条款12至18中任一项所述的方法,其中,通过访问所述第一块来对所述第二块进行编码或解码,并且其中,所述运动信息是根据规则的,所述规则规定在所述第一视频区域与所述第二视频不同的情况下,用于所述第二块的插值滤波器不允许与用于所述第一块的插值滤波器相同。
[0357]
20.根据条款12至17中任一项所述的方法,其中所述第一视频区域和所述第二视频区域相同。
[0358]
21.一种视频处理方法,包括:执行视频的当前视频块和所述视频的编码表示之间的转换,其中,使用merge模式或运动矢量差merge(mmvd)模式在所述编码表示中表示所述当前视频块,其中根据规则将具有1/n精度的插值滤波器用于插值与所述当前视频块相关联的预测块,其中n是正整数;其中,所述规则定义了在所述插值滤波器是不同于默认插值滤波器的可选插值滤波器的情况下用于继承插值信息的条件。
[0359]
22.根据条款21所述的方法,其中所述规则确定不允许对所述可选插值滤波器的系数的所述继承。
[0360]
23.根据条款21所述的方法,其中所述编码表示中的语法元素始终指示所述默认插值滤波器。
[0361]
24.根据条款21所述的方法,其中所述规则确定允许对所述可选插值滤波器的系数的继承。
[0362]
25.根据条款24所述的方法,其中当最终导出的运动矢量具有1/2像素精度并且没有运动矢量分量具有更精细的运动矢量精度时,继承所述可选插值滤波器的所述系数。
[0363]
26.根据条款24所述的方法,其中当最终导出的运动矢量包括具有1/2像素精度的一个或多个运动矢量分量时,继承所述可选插值滤波器的所述系数。
[0364]
27.根据条款24所述的方法,其中仅将所述可选插值滤波器用于运动补偿。
[0365]
28.根据条款24所述的方法,其中为所述当前视频块存储所述默认插值滤波器的索引,并由所述当前视频块之后的编解码块使用。
[0366]
29.一种视频处理方法,包括:在包括当前视频块的视频和所述视频的编码表示之间的转换期间处理所述当前视频块;以及用所述当前视频块的运动信息比较并选择性地更新merge候选列表,其中所述运动信息包括插值滤波器信息;其中所述插值滤波器信息包括用于对用于在所述编码表示中表示所述当前视频块的运动矢量差值进行插值的插值滤波器的参数。
[0367]
30.根据条款29所述的方法,其中将与不同的插值滤波器相关联的两个merge候选视为两个不同的merge候选。
[0368]
31.根据条款29所述的方法,其中比较并选择性地更新所述merge候选列表包括:通过考虑所述插值滤波器信息将基于历史的运动矢量预测(hmvp)merge候选插入所述merge候选列表中。
[0369]
32.根据条款29所述的方法,其中比较并选择性地更新所述merge候选列表包括:通过不考虑所述插值滤波器信息将基于历史的运动矢量预测(hmvp)merge候选插入所述merge候选列表中。
[0370]
33.根据条款1至32中任一项所述的方法,其中所述默认运动插值滤波器的系数集为[

1,4,

11,40,40,

11,4,

1]。
[0371]
34.根据条款1至32中任一项所述的方法,其中所述可选插值滤波器的系数集为[0,3,9,20,20,9,3,0]。
[0372]
35.根据条款1至34中任一项所述的方法,其中所述转换的所述执行包括从所述当前视频块生成所述编码表示。
[0373]
36.根据条款1至34中任一项所述的方法,其中所述转换的所述执行包括从所述编码表示生成所述当前视频块。
[0374]
37.一种视频系统中的装置,其包括处理器和其上具有指令的非暂时性存储器,其中,在所述处理器执行所述指令时,所述指令使所述处理器实现条款1至36中任一项所述的方法。
[0375]
38.一种存储在非暂时性计算机可读介质上的计算机程序产品,所述计算机程序产品包括用于实现条款1至36中任一项所述的方法的程序代码。
[0376]
第四组条款描述了先前章节(例如,包括示例性实现4)中列出的公开技术的某些特征和方面。
[0377]
1.一种视频处理方法,包括:在视频区域的当前视频块和所述视频的编码表示之间的转换之前,维护至少一个基于历史的运动矢量预测(hmvp)表,其中所述hmvp表包括对应于一个或多个先前处理的块的运动信息的一个或多个条目;以及使用所述至少一个hmvp表执行所述转换;并且其中,每个条目的所述运动信息被配置为包括所述一个或多个先前处理的块的插值滤波器信息,其中,所述插值滤波器信息指示用于对所述一个或多个先前处理的块的预测块进行插值的插值滤波器。
[0378]
2.一种视频处理方法,包括:在视频区域的当前视频块和所述视频的编码表示之间的转换之前,维护至少一个基于历史的运动矢量预测(hmvp)表,所述hmvp表包括对应于一个或多个先前处理的块的运动信息的一个或多个条目,并且其中,每个条目的所述运动信息被配置为包括所述一个或多个先前处理的块的插值滤波器信息;为所述转换构造包括hmvp merge候选的运动候选列表,其中,通过从包括与一个条目相关联的对应插值滤波器信息的所述hmvp表中继承所述一个条目来导出所述hmvp候选;以及基于所述运动候选列表执行所述转换。
[0379]
3.根据条款1或2所述的方法,所述方法还包括:在所述转换之后选择性地更新所述hmvp表。
[0380]
4.根据条款1或2所述的方法,所述方法还包括:使用在所述当前视频块的所述转换期间导出的所述运动信息来选择性地更新所述hmvp表,其中,为所述当前视频块导出的所述运动信息包括所述当前视频块的插值滤波器信息。
[0381]
5.根据条款3或4所述的方法,其中所述更新包括:在不考虑所述插值滤波器信息的情况下确定是否将新候选插入所述hmvp表。
[0382]
6.根据条款4所述的方法,其中将所述新候选和更新前所述hmvp表中插值滤波器信息不同、但除了所述插值滤波器信息之外的部分或所有其余运动信息都相同的条目视为相同的候选。
[0383]
7.根据条款3或4所述的方法,其中所述更新包括:通过考虑所述插值滤波器信息来确定是否将新候选插入所述hmvp表。
[0384]
8.根据条款7所述的方法,其中将所述新候选和更新前所述hmvp表中除了所述插值滤波器信息之外的部分或所有其余运动信息都相同的条目视为两个不同的候选。
[0385]
9.根据条款5至8中任一项所述的方法,其中基于所述当前视频块的所述运动信息导出所述新候选。
[0386]
10.根据条款5至8中任一项所述的方法,其中所述更新包括:对于与所述hmvp表中
的条目不同的所述新候选,将所述新候选添加到所述hmvp表中。
[0387]
11.根据条款5至8中任一项所述的方法,其中所述更新包括,对于与所述hmvp表中的条目相同的所述新候选,从所述hmvp表中移除所述条目,并且将所述新候选添加到所述hmvp表中。
[0388]
12.根据条款1至11中任一项所述的方法,其中,所述插值滤波器信息包括二分之一样本点插值滤波器索引,其指示对可选插值滤波器或默认插值滤波器的使用。
[0389]
13.根据条款12所述的方法,其中所述二分之一样本点插值滤波器索引等于0,以指示对所述默认插值滤波器的所述使用。
[0390]
14.根据条款12所述的方法,其中所述二分之一样本点插值滤波器索引等于1,以指示对所述可选插值滤波器的所述使用。
[0391]
15.根据条款12所述的方法,其中所述默认插值滤波器的系数集为[

1,4,

11,40,40,

11,4,

1]。
[0392]
16.根据条款12所述的方法,其中所述可选插值滤波器的系数集为[0,3,9,20,20,9,3,0]。
[0393]
17.根据条款1至16中任一项所述的方法,其中所述转换的所述执行包括从所述当前视频块生成所述编码表示。
[0394]
18.根据条款1至16中任一项所述的方法,其中所述转换的所述执行包括从所述编码表示生成所述当前视频块。
[0395]
19.一种视频系统中的装置,其包括处理器和其上具有指令的非暂时性存储器,其中,在所述处理器执行所述指令时,所述指令使所述处理器实现条款1至18中任一项所述的方法。
[0396]
20.一种存储在非暂时性计算机可读介质上的计算机程序产品,所述计算机程序产品包括用于实现条款1至18中任一项所述的方法的程序代码。
[0397]
第五组条款描述了先前章节(例如,包括示例性实现7和11至12)中列出的公开技术的某些特征和方面。
[0398]
1.一种视频编解码方法,包括:确定用于在视频的编码表示中表示所述视频的当前视频块的编解码模式;以及根据所述编解码模式将所述当前视频块编码成所述编码表示,其中,由于使用了所述编解码模式,对所述当前视频块禁用用于表示运动信息的二分之一像素精度。
[0399]
2.一种视频解码方法,包括:解析视频的编码表示,以确定所述视频的当前视频块是使用编解码模式编码的;以及根据所述编解码模式从所述编码表示生成所述当前视频块的解码表示,其中,由于使用了所述编解码模式,对所述当前视频块禁用用于表示运动信息的二分之一像素精度。
[0400]
3.根据条款1或2所述的方法,其中所述运动信息对应于所述当前视频块的一个或多个运动矢量。
[0401]
4.根据条款1或2所述的方法,其中所述运动信息对应于所述当前视频块的一个或多个运动矢量差值。
[0402]
5.根据条款1或2所述的方法,其中所述运动信息对应于所述当前视频块的一个或多个运动矢量和所述当前视频块的一个或多个运动矢量差值。
[0403]
6.根据条款1至4中任一项所述的方法,其中,由于使用了所述编解码模式,所述编码表示省略了用于信令通知二分之一像素分辨率是否适用于所述当前视频块的比特和/或二进制数。
[0404]
7.根据条款1至6中任一项所述的方法,其中所述编解码模式对应于帧内块复制(ibc)模式,所述帧内块复制(ibc)模式使用至少指向包含所述当前视频块的视频帧的块矢量来生成预测块,用于对所述当前视频块进行编解码。
[0405]
8.根据条款7所述的方法,其中不信令通知二分之一像素插值滤波器的指示。
[0406]
9.根据条款1所述的方法,其中所述编解码模式对应于将所述当前视频块划分成两个部分的模式,每个部分与一个运动候选相关联,并且从相同的运动候选列表导出两个运动候选。
[0407]
10.根据条款9所述的方法,其中所述编解码模式对应于三角预测模式。
[0408]
11.根据条款1所述的方法,其中所述编解码模式对应于所述当前视频块和临近块共享所述运动信息的merge模式。
[0409]
12.一种视频处理方法,包括:为使用广义双向预测(gbi)模式处理的当前视频块,确定对第一预测块和第二预测块分别使用第一权重因子和不同的第二权重因子,所述第一权重因子和所述第二权重因子是从权重因子集中选择的;以及使用所述最终预测器执行视频的所述当前视频块和所述视频的编码表示之间的转换,其中,用于帧间模式的第一权重因子集不同于用于仿射帧间模式的第二权重因子集。
[0410]
13.根据条款12所述的方法,其中所述第一权重因子和所述第二权重因子的和等于1。
[0411]
14.根据条款12所述的方法,其中在与所述当前视频块相关联的序列参数集(sps)、视频参数集(vps)、图片参数集(pps)、图片标头、片组标头或条带标头中信令通知所述权重因子集。
[0412]
15.根据条款12所述的方法,其中所述权重因子集是预定义的。
[0413]
16.一种视频处理方法,包括:为视频的视频区域的多个视频单元与所述多个视频单元的编码表示之间的转换,确定与取决于视频单元的编解码模式的插值滤波器相关的信息,所述插值滤波器用于对所述编码表示中的运动矢量差值进行插值,并且具有m整数像素精度或1/n子像素精度,其中m和n是正整数;以及使用所述插值滤波器执行所述转换。
[0414]
17.根据条款16所述的方法,其中,所述确定为用仿射模式编解码的所述视频单元确定所述插值滤波器的第一系数集,并且其中,所述确定为用非仿射模式编解码的另一视频单元确定所述插值的不同的第二系数集。
[0415]
18.根据条款16所述的方法,其中,所述确定为用ibc模式编解码的所述视频单元确定所述插值滤波器的第一系数集,并且其中,所述确定为用非ibc模式编解码的另一视频单元确定所述插值的不同的第二系数集。
[0416]
19.根据条款1至18中任一项所述的方法,其中所述转换的所述执行包括从所述当前视频块生成所述编码表示。
[0417]
20.根据条款1至18中任一项所述的方法,其中所述转换的所述执行包括从所述编码表示生成所述当前视频块。
[0418]
21.一种视频系统中的装置,其包括处理器和其上具有指令的非暂时性存储器,其
中,在所述处理器执行所述指令时,所述指令使所述处理器实现条款1至20中任一项所述的方法。
[0419]
22.一种存储在非暂时性计算机可读介质上的计算机程序产品,所述计算机程序产品包括用于实现条款1至20中任一项所述的方法的程序代码。
[0420]
第六组条款描述了先前章节(例如,包括示例性实现9)中列出的公开技术的某些特征和方面。
[0421]
1.一种视频编码方法,包括:确定用于在视频的编码表示中表示所述视频的当前视频块的编解码模式;以及根据所述编解码模式将所述当前视频块编码成所述编码表示,其中,由于使用了所述编解码模式,为所述当前视频块禁用用于表示运动信息的除了默认二分之一像素精度滤波器之外的可选二分之一像素精度滤波器。
[0422]
2.一种视频解码方法,包括:解析视频的编码表示,以确定当前视频块是使用编解码模式编码的;以及根据所述编解码模式从所述编码表示生成所述当前视频块的解码表示,其中,由于使用了所述编解码模式,为所述当前视频块禁用用于表示运动信息的除了默认二分之一像素精度滤波器之外的可选二分之一像素精度滤波器。
[0423]
3.根据条款1或2所述的方法,其中所述编解码模式对应于三角预测模式,在所述三角预测模式中,将所述视频块分割成多个分区的,其中所述多个分区中的至少一个分区是非矩形分区。
[0424]
4.根据条款3所述的方法,其中在所述三角预测模式中不继承与所述可选二分之一像素精度滤波器相关的信息,并且仅使用所述默认二分之一像素精度滤波器。
[0425]
5.根据条款1或2所述的方法,其中所述编解码模式对应于双向光流(bdof),在所述bdof中,所述当前块是双向预测的。
[0426]
6.根据条款1或2所述的方法,其中所述编解码模式对应于解码器侧运动矢量细化(dmvr),所述dmvr从解码器侧导出的运动信息细化预测信息。
[0427]
7.根据条款1或2所述的方法,其中所述编解码模式对应于解码器侧运动矢量推导(dmvd),所述dmvd在解码器侧导出运动信息。
[0428]
8.根据条款1或2所述的方法,其中所述编解码模式对应于组合帧间帧内预测(ciip),在所述ciip中,将帧间和帧内预测组合以生成最终预测信号。
[0429]
9.根据条款1或2所述的方法,其中所述编解码模式对应于smvd(对称运动矢量差),所述smvd对称地处理运动矢量差。
[0430]
10.根据条款1或2所述的方法,其中所述编解码模式对应于sbt(子块变换),所述sbt将子块变换为变换块。
[0431]
11.一种视频编解码方法,包括:由于使用了为视频的视频块启用的可选插值滤波器,确定禁用用于将所述视频块编码成所述视频的编码表示的编解码模式;以及基于所述确定生成所述视频块的所述编码表示,其中所述可选插值滤波器用于对当前视频块的帧间预测块进行插值。
[0432]
12.一种视频解码方法,包括:由于使用了为视频的视频块启用的可选插值滤波器,确定禁用用于在所述视频的编码表示中表示所述视频块的编解码模式;以及基于所述确定通过解析所述编码表示来生成解码视频块。
[0433]
13.根据条款11或12所述的方法,其中所述可选插值滤波器是可选的二分之一样
本点插值滤波器。
[0434]
14.根据条款11所述的方法,其中,所述确定决定禁用与将所述当前视频块划分成两部分的编解码模式相对应的所述编解码模式,每个部分与一个运动候选相关联,并且从相同的运动候选列表导出两个运动候选。
[0435]
15.根据条款14所述的方法,其中所述编解码模式对应于三角预测模式。
[0436]
16.根据条款13或14所述的方法,其中在所述编解码模式中不继承与所述可选插值滤波器相关的信息,并且仅使用默认的二分之一样本点插值滤波器。
[0437]
17.根据条款11或12所述的方法,其中所述确定决定禁用与双向光流(bdof)相对应的所述编解码模式,在所述bdof中,所述当前块是双向预测的。
[0438]
18.根据条款17所述的方法,其中所述确定决定禁用与解码器侧运动矢量细化(dmvr)相对应的所述编解码模式,所述dmvr从解码器侧导出的运动信息细化预测信息。
[0439]
19.根据条款12所述的方法,其中,所述确定决定禁用与解码器侧运动矢量推导(dmvd)相对应的所述编解码模式,所述dmvd在解码器侧导出运动信息。
[0440]
20.根据条款11所述的方法,其中,所述确定决定禁用与组合帧间帧内预测(ciip)相对应的所述编解码模式,在所述ciip中,将帧间和帧内预测组合以生成最终预测信号。
[0441]
21.根据条款20所述的方法,其中,如果merge候选继承所述插值滤波器,则跳过ciip标志并将其推断为假。
[0442]
22.根据条款20所述的方法,其中如果ciip标志为真,则始终使用默认插值滤波器。
[0443]
23.根据条款11所述的方法,其中所述确定决定禁用与smvd(对称运动矢量差)相对应的所述编解码模式,所述smvd对称地处理运动矢量差。
[0444]
24.根据条款23所述的方法,其中由于所述smvd的所述使用,始终使用默认插值滤波器,并且其中,不信令通知与所述插值滤波器相关的语法元素。
[0445]
25.根据条款23所述的方法,其中与所述插值滤波器相关的语法元素指示不使用所述插值滤波器,不信令通知与所述smvd相关的语法元素,并且不使用所述smvd。
[0446]
26.根据条款12所述的方法,其中所述确定决定禁用与sbt(子块变换)相对应的所述编解码模式,所述sbt将子块变换为变换块。
[0447]
27.根据条款26所述的方法,其中由于所述sbt的所述使用,始终使用默认插值滤波器,并且不信令通知与所述插值滤波器相关的语法元素。
[0448]
28.根据条款26所述的方法,其中与所述插值滤波器相关的语法元素指示不使用所述插值滤波器,不信令通知与所述sbt相关的语法元素,并且不使用所述sbt。
[0449]
29.根据条款11所述的方法,其中所述生成所述编码表示包括:通过使用三角编解码模式对所述视频块进行编码来生成所述编码表示,在所述三角编解码模式中,将所述视频块分割成多个分区,其中所述多个分区中的至少一个分区是非矩形分区。
[0450]
30.根据条款29所述的方法,其中在所述三角编解码模式中继承与所述插值滤波器相关的信息。
[0451]
31.根据条款11所述的方法,其中所述生成所述编码表示包括:通过省略对所述编解码模式的使用进行信令通知的语法元素来生成所述编码表示。
[0452]
32.根据条款12所述的方法,其中所述解析所述编码表示包括:在不存在对所述编
解码模式的使用进行信令通知的语法元素的情况下解析所述编码表示。
[0453]
33.一种视频系统中的装置,其包括处理器和其上具有指令的非暂时性存储器,其中,在所述处理器执行所述指令时,所述指令使所述处理器实现条款1至32中任一项所述的方法。
[0454]
34.一种存储在非暂时性计算机可读介质上的计算机程序产品,所述计算机程序产品包括用于实现条款1至32中任一项所述的方法的程序代码。
[0455]
在一些实施例中,上述公开的方法可以由包括可配置来执行该方法的处理器的装置来实现。
[0456]
本文中描述的所公开的和其他解决方案、示例、实施例、模块和功能操作可以在数字电子电路或计算机软件、固件或硬件中实现,包括本文中公开的结构及其结构等效物,或者一个或多个的组合。所公开的实施例和其他实施例可以实现为一个或多个计算机程序产品,即在计算机可读介质上编码以供数据处理设备执行或控制其操作的计算机程序指令的一个或多个模块。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储设备、影响机器可读传播信号的物质的组合,或者一个或多个它们的组合。术语“数据处理设备”包括用于处理数据的所有设备、装置和机器,包括例如可编程处理器、计算机或多个处理器或计算机。除硬件外,设备还可以包括为计算机程序创建执行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统或其中一个或多个的组合的代码。传播的信号是人为生成的信号,例如,机器生成的电、光或电磁信号,其被生成以编码信息以传输到合适的接收器设备。
[0457]
计算机程序(也称为程序、软件、软件应用、脚本或代码)可以用任何形式的编程语言(包括编译语言或解释语言)编写,并且可以以任何形式部署,包括作为独立程序或作为模块、组件、子程序或其他适合在计算环境中使用的单元。计算机程序不一定与文件系统中的文件对应。程序可以存储在保存其他程序或数据的文件的部分中(例如,存储在标记语言文档中的一个或多个脚本)、专用于该程序的单个文件中、或多个协调文件(例如,存储一个或多个模块、子程序或部分代码的文件)中。计算机程序可以部署在一台或多台计算机上来执行,这些计算机位于一个站点上或分布在多个站点上,并通过通信网络互连。
[0458]
本说明书中描述的处理和逻辑流可以通过一个或多个可编程处理器执行,该处理器执行一个或多个计算机程序,通过在输入数据上操作并生成输出来执行功能。处理和逻辑流也可以通过特殊用途的逻辑电路来执行,并且装置也可以实现为特殊用途的逻辑电路,例如,fpga(现场可编程门阵列)或asic(专用集成电路)。
[0459]
例如,适于执行计算机程序的处理器包括通用和专用微处理器,以及任何类型数字计算机的任何一个或多个。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是执行指令的处理器和存储指令和数据的一个或多个存储设备。通常,计算机还将包括一个或多个用于存储数据的大容量存储设备,例如,磁盘、磁光盘或光盘,或通过操作耦合到一个或多个大容量存储设备来从其接收数据或将数据传输到一个或多个大容量存储设备,或两者兼有。然而,计算机不一定具有这样的设备。适用于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括例如半导体存储器设备,例如eprom、eeprom和闪存设备;磁盘,例如,内部硬盘或可移动硬盘;磁光盘;以及cd rom和dvd rom盘。处理器和存储器可以由专用逻辑电路来
补充,或合并到专用逻辑电路中。
[0460]
虽然本专利文件包含许多细节,但不应将其解释为对任何主题或权利要求范围的限制,而应解释为对某些技术的某些实施例的特征的描述。本专利文件在单独实施例的上下文描述的某些特征也可以在单个实施例中组合实施。相反,在单个实施例的上下文中描述的各种功能也可以在多个实施例中单独实施,或在任何合适的子组合中实施。此外,尽管上述特征可以描述为在某些组合中起作用,甚至最初要求是这样,但在某些情况下,可以从组合中移除权利要求组合中的一个或多个特征,并且权利要求的组合可以指向子组合或子组合的变体。
[0461]
同样,尽管附图中以某些顺序描述了操作,但这不应理解为要获得想要的结果必须按照所示的某些顺序或顺序执行此类操作,或执行所有说明的操作。此外,本专利文件实施例中各种系统组件的分离不应理解为在所有实施例中都需要这样的分离。
[0462]
仅描述了一些实现和示例,其他实现、增强和变体可以基于本专利文件中描述和说明的内容做出。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献