基于变换的图像编码方法及其装置与流程

2022-02-22 10:15:47 来源：中国专利 TAG：

1.本公开涉及一种图像编码技术，并且更具体地，涉及图像编码系统中的用于基于变换对图像进行编码的方法和设备。

背景技术：

2.如今，在各个领域中对诸如4k、8k或更高的超高清(uhd)图像/视频这样的高分辨率和高质量图像/视频的需求已经不断增长。随着图像/视频数据变成更高分辨率和更高质量，与传统图像数据相比，所发送的信息量或比特量增加。因此，当使用诸如传统有线/无线宽带线这样的介质来发送图像数据或者使用现有存储介质来存储图像/视频数据时，其传输成本和存储成本增加。
3.另外，如今，对于诸如虚拟现实(vr)和人工现实(ar)内容或全息图等这样的沉浸式媒体的兴趣和需求正在增加，并且对具有与诸如游戏图像这样的真实图像不同的图像特征的图像/视频的广播正在增加。
4.因此，需要有效地压缩并发送或存储以及再现具有如上所述的各种特征的高分辨率和高质量图像/视频的信息的高效图像/视频压缩技术。

技术实现要素：

5.技术问题
6.本公开的一技术方面在于提供用于增加图像编码效率的方法和设备。
7.本公开的另一技术方面在于提供用于增加变换索引编码的效率的方法和设备。
8.本公开的又一技术方面在于提供使用lfnst的图像编码方法和设备。
9.本公开的又一技术方面在于提供一种用于在应用lfnst时执行的清零(zero-out)的图像编码方法和设备。
10.技术方案
11.根据本公开的实施方式，提供了一种由解码设备执行的图像解码方法。该方法可以包括：从比特流中获得残差信息；基于残差信息来推导当前块的变换系数；确定在当前块的除了位于左上的第一区域之外的第二区域中是否存在有效系数；当第二区域中不存在有效系数时，从比特流中解析lfnst索引；通过将基于lfnst索引推导出的lfnst矩阵应用于第一区域中的变换系数来推导修改的变换系数；基于修改的变换系数的逆一次变换来推导当前块的残差样本；以及基于当前块的残差样本来生成重构图片。
12.这里，基于当前块的大小来推导第一区域，当当前块的大小是4
×
4或8
×
8时，第一区域为从当前块的左上角至扫描方向上的第八样本位置，并且当当前块的大小不是4
×
4或8
×
8时，第一区域为当前块的左上的4
×
4区域。
13.扫描方向是对角线扫描方向。
14.基于当前块的大小来推导预定数量的修改的变换系数，当当前块的高度和宽度大于或等于8时，推导出48个修改的变换系数，并且当当前块的宽度和高度为4或更大并且当
前块的宽度或高度小于8时，推导出16个修改的变换系数。
15.48个修改的变换系数被布置在当前块的左上8
×
8区域内的左上4
×
4区域、右上4
×
4区域和左下4
×
4区域中。
16.16个修改的变换系数被布置在当前块的左上4
×
4区域中。
17.根据本公开的另一实施方式，提供了一种由编码设备执行的图像编码方法。该方法可以包括：推导当前块的预测样本；基于预测样本来推导当前块的残差样本；基于残差样本的一次变换来推导当前块的变换系数；基于当前块的位于左上的第一区域的变换系数和预定lfnst矩阵来推导当前块的修改的变换系数；对当前块的不存在修改的变换系数的第二区域进行清零；以及对通过修改的变换系数的量化推导出的残差信息和指示lfnst矩阵的lfnst索引进行编码。
18.根据本公开的又一实施方式，可以提供一种数字存储介质，该数字存储介质存储包括根据由编码设备执行的图像编码方法生成的编码的图像信息和比特流的图像数据。
19.根据本公开的又一实施方式，可以提供一种数字存储介质，该数字存储介质存储包括编码的图像信息和比特流的图像数据以使解码设备执行图像解码方法。
20.技术效果
21.根据本公开，可以增加整体图像/视频压缩效率。
22.根据本公开，可以增加变换索引编码的效率。
23.本公开的技术方面可以提供使用lfnst的图像编码方法和设备。
24.本公开的技术方面可以提供用于在应用lfnst时执行的清零的图像编码方法和设备。
25.可以通过本公开的具体示例获得的效果不限于上面列出的效果。例如，可以存在相关领域的普通技术人员可以理解或从本公开推导出的各种技术效果。因此，本公开的特定效果不限于本公开中明确描述的那些，并且可以包括可以根据本公开的技术特征理解或推导出的各种效果。
附图说明
26.图1示意性地例示了可应用本公开的视频/图像编码系统的示例。
27.图2是示意性地例示可应用本公开的视频/图像编码设备的配置的图。
28.图3是示意性地例示可应用本公开的视频/图像解码设备的配置的图。
29.图4示意性地例示根据本文档的实施方式的多变换方案。
30.图5示意性地示出了65个预测方向的帧内定向模式。
31.图6是用于说明根据本文档的实施方式的rst的图。
32.图7是例示根据示例的将正向一次变换的输出数据布置成一维向量的顺序的图。
33.图8是例示根据示例的将正向二次变换的输出数据布置成二维向量的顺序的图。
34.图9是例示根据本文档的实施方式的广角帧内预测模式的图。
35.图10是例示lfnst被应用于的块形状的图。
36.图11是例示根据示例的正向lfnst的输出数据的布置的图。
37.图12是例示根据示例的正向lfnst的输出数据的数量被限制为最大值16的图。
38.图13是例示根据示例的应用4
×
4lfnst的块中的清零的图。
39.图14是例示根据示例的应用8
×
8lfnst的块中的清零的图。
40.图15是例示根据另一示例的应用8
×
8lfnst的块中的清零的图。
41.图16是用于说明根据示例的图像解码方法的流程图。
42.图17是用于说明根据示例的图像编码方法的流程图。
43.图18例示了应用本公开的内容流系统的结构。
具体实施方式
44.尽管本公开可能易于进行各种修改并且包括各种实施方式，但是其具体实施方式已在附图中通过示例的方式示出，并且现在将对其进行详细描述。然而，这并不旨在将本公开限制于本文公开的具体实施方式。本文中使用的术语只是出于描述特定实施方式的目的，并不旨在限制本公开的技术思路。除非上下文另外清楚指示，否则单数形式可以包括复数形式。诸如“包括”和“具有”之类的术语旨在指示存在以下描述中使用的特征、数字、步骤、操作、元件、组件或其组合，因此不应被理解为预先排除了存在或添加一个或更多个不同特征、数字、步骤、操作、元件、组件或其组合的可能性。
45.此外，为了方便描述彼此不同的特性功能，独立地例示了本文中描述的附图上的各组件，然而，并不意指各组件由单独的硬件或软件来实现。例如，可以组合这些组件中的任何两个或更多个以形成单个组件，并且任何单个组件可以被划分成多个组件。其中组件被组合和/或划分的实施方式将属于本公开的专利权的范围，只要它们不脱离本公开的实质即可。
46.在下文中，将参照附图更详细地说明本公开的优选实施方式。另外，在附图中，相同的附图标号用于相同的组件，并且将省略对相同组件的重复描述。
47.本文档涉及视频/图像编码。例如，本文档中公开的方法/示例可以涉及vvc(通用视频编码)标准(itu-t rec.h.266)、vvc之后的下一代视频/图像编码标准、或其它视频编码相关标准(例如，hevc(高效视频编码)标准(itu-t rec.h.265)、evc(基本视频编码)标准、avs2标准等)。
48.在本文档中，可以提供与视频/图像编码相关的各种实施方式，并且除非相反地指定，否则这些实施方式可以彼此组合并执行。
49.在本文档中，视频可以是指一段时间内一系列图像的集合。通常，图片是指表示特定时间区域的图像的单元，而条带/贴片是构成图片的一部分的单元。条带/贴片可以包括一个或更多个编码树单元(ctu)。一幅图片可以由一个或更多个条带/贴片组成。一幅图片可以由一个或多个贴片组组成。一个贴片组可以包括一个或更多个贴片。
50.像素或图元(pel)可以是指构成一幅图片(或图像)的最小单元。另外，“样本”可用作与像素相对应的术语。样本通常可以表示像素或像素值，并且可以仅表示亮度分量的像素/像素值或仅表示色度分量的像素/像素值。另选地，样本可以意指空间域中的像素值，或者当该像素值被变换为频域时，其可以意指频域中的变换系数。
51.单元可以表示图像处理的基本单位。单元可以包括特定区域和与该区域相关的信息中的至少一个。一个单元可以包括一个亮度块和两个色度(例如，cb、cr)块。根据情况，可以将单元和诸如块、区域等这样的术语互换地使用。在通常情况下，m
×
n块可以包括由m列和n行组成的样本(或样本阵列)或变换系数的集(或阵列)。
52.在本文档中，术语“/”和“，”应该被解释为指示“和/或”。例如，表述“a/b”可以意指“a和/或b”。另外，“a、b”可以意指“a和/或b”。另外，“a/b/c”可以意指“a、b和/或c中的至少一个”。另外，“a/b/c”可以意指“a、b和/或c中的至少一个”。
53.另外，在该文档中，术语“或”应该被解释为指示“和/或”。例如，表述“a或b”可以包括1)仅a、2)仅b和/或3)a和b二者。换句话说，本文档中的术语“或”应该被解释为指示“附加地或另选地”。
54.在本公开中，“a和b中的至少一个”可以意指“仅a”、“仅b”或“a和b两者”。此外，在本公开中，表述“a或b中的至少一个”或者“a和/或b中的至少一个”可以被解释为“a和b中的至少一个”。
55.此外，在本公开中，“a、b和c中的至少一个”可以意指“仅a”、“仅b”、“仅c”或“a、b和c的任何组合”。此外，“a、b或c中的至少一个”或“a、b和/或c中的至少一个”可以意指“a、b和c中的至少一个”。
56.另外，本公开中使用的括号可以表示“例如”。具体地，当指示为“预测(帧内预测)”时，可以意指“帧内预测”被提出为“预测”的示例。换句话说，本公开的“预测”不限于“帧内预测”，并且“帧内预测”是作为“预测”的示例而提出的。另外，当指示为“预测(即，帧内预测)”时，这也可以意指“帧内预测”被提出为“预测”的示例。
57.在本公开中的一个附图中单独描述的技术特征可以单独地实现或可以同时实现。
58.图1示意性地例示了可应用本公开的视频/图像编码系统的示例。
59.参照图1，视频/图像编码系统可以包括第一装置(源装置)和第二装置(接收装置)。源装置可以经由数字存储介质或网络以文件或流的形式将编码后的视频/图像信息或数据传递到接收装置。
60.源装置可以包括视频源、编码设备和发送器。接收装置可以包括接收器、解码设备和渲染器。编码设备可以被称为视频/图像编码设备，并且解码设备可以被称为视频/图像解码设备。发送器可以被包括在编码设备中。接收器可以被包括在解码设备中。渲染器可以包括显示器，并且显示器可以被配置为单独的装置或外部组件。
61.视频源可以通过捕获、合成或生成视频/图像的处理来获得视频/图像。视频源可以包括视频/图像捕获装置和/或视频/图像生成装置。视频/图像捕获装置可以包括例如一个或更多个相机、包括先前捕获的视频/图像的视频/图像档案等。视频/图像生成装置可以包括例如计算机、平板计算机和智能电话，并且可以(电子地)生成视频/图像。例如，可以通过计算机等生成虚拟视频/图像。在这种情况下，视频/图像捕获处理可以被生成相关数据的处理取代。
62.编码设备可以对输入视频/图像进行编码。编码设备可以执行诸如针对压缩和编码效率的预测、变换和量化这样的一系列过程。编码后的数据(编码后的视频/图像信息)可以以比特流的形式输出。
63.发送器可以通过数字存储介质或网络以文件或流的形式将以比特流的形式输出的编码后的视频/图像信息或数据发送到接收装置的接收器。数字存储介质可以包括诸如usb、sd、cd、dvd、蓝光、hdd、ssd等这样的各种存储介质。发送器可以包括用于通过预定文件格式生成媒体文件的元件，并且可以包括用于通过广播/通信网络进行发送的元件。接收器可以接收/提取比特流，并且将接收/提取的比特流发送到解码设备。
64.解码设备可以通过执行与编码设备的操作对应的诸如解量化、逆变换、预测等这样的一系列过程来解码视频/图像。
65.渲染器可以渲染解码后的视频/图像。可以通过显示器显示渲染后的视频/图像。
66.图2是示意性地例示可应用本公开的视频/图像编码设备的配置的图。在下文中，所谓的视频编码设备可以包括图像编码设备。
67.参照图2，编码设备200可以包括图像划分器210、预测器220、残差处理器230、熵编码器240、加法器250、滤波器260和存储器270。预测器220可以包括帧间预测器221和帧内预测器222。残差处理器230可以包括变换器232、量化器233、解量化器234、逆变换器235。残差处理器230可以进一步包括减法器231。加法器250可以称为重构器或重构块生成器。根据实施方式，以上描述的图像划分器210、预测器220、残差处理器230、熵编码器240、加法器250和滤波器260可以由一个或更多个硬件组件(例如，编码器芯片组或处理器)构成。此外，存储器270可以包括解码图片缓冲器(dpb)，并且可以由数字存储介质构成。硬件组件可以进一步包括作为内部/外部组件的存储器270。
68.图像划分器210可以将输入到编码设备200的输入图像(或图片或帧)划分为一个或更多个处理单元。作为一个示例，处理单元可以被称为编码单元(cu)。在这种情况下，从编码树单元(ctu)或最大编码单元(lcu)开始，可以根据四叉树二叉树三叉树(qtbttt)结构来递归地划分编码单元。例如，基于四叉树结构、二叉树结构和/或三叉树结构，一个编码单元可以被划分为深度较深的多个编码单元。在这种情况下，例如，可以首先应用四叉树结构，并且可以稍后应用二叉树结构和/或三叉树结构。另选地，可以首先应用二叉树结构。可以基于未进一步划分的最终编码单元来执行根据本公开的编码过程。在这种情况下，基于根据图像特性的编码效率，最大编码单元可以直接用作最终编码单元。另选地，可以根据需要将编码单元递归地划分为更深的深度的编码单元，由此可以将最佳大小的编码单元用作最终编码单元。这里，编码过程可以包括诸如预测、变换和重构之类的过程，其将在后面描述。作为另一示例，处理单元可以进一步包括预测单元(pu)或变换单元(tu)。在这种情况下，预测单元和变换单元可以与上述最终编码单元分开或划分开。预测单元可以是样本预测的单元，并且变换单元可以是用于推导变换系数的单元和/或用于从变换系数推导残差信号的单元。
69.根据情况，可以使用单元和诸如块、区域等之类的术语来代替彼此。在通常情况下，m
×
n块可以表示由m列和n行构成的样本或变换系数的集。样本通常可以表示像素或像素值，并且可以仅表示亮度分量的像素/像素值，或者仅表示色度分量的像素/像素值。样本可用作与一幅图片(或图像)的像素或图元(pel)相对应的术语。
70.减法器231从输入图像信号(原始块、原始样本阵列)中减去从预测器220输出的预测信号(预测块、预测样本阵列)以生成残差信号(残差块、残差样本阵列)，并且所生成的残差信号被发送到变换器232。预测器220可以对处理目标块(下文称为“当前块”)执行预测，并且可以生成包括当前块的预测样本的预测块。预测器220可以确定是以当前块或cu为基础应用帧内预测还是应用帧间预测。如稍后在每个预测模式的描述中所讨论的，预测器可以生成诸如预测模式信息之类的与预测有关的各种信息，并将所生成的信息发送到熵编码器240。关于预测的信息可以在熵编码器240中编码并以比特流的形式输出。
71.帧内预测器222可以通过参考当前图片中的样本来预测当前块。根据预测模式，参
考样本可以位于当前块的附近或与当前块分开。在帧内预测中，预测模式可以包括多种非定向模式和多种定向模式。非定向模式可以包括例如dc模式和平面模式。根据预测方向的详细程度，定向模式可以包括例如33种定向预测模式或65种定向预测模式。然而，这仅仅是示例，并且根据设置，可以使用更多或更少的定向预测模式。帧内预测器222可以通过使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
72.帧间预测器221可以基于参照图片上的运动向量所指定的参考块(参考样本阵列)来推导针对当前块的预测块。此时，为了减少在帧间预测模式下发送的运动信息的量，可以基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为基础来预测运动信息。运动信息可以包括运动向量和参照图片索引。运动信息还可以包括帧间预测方向(l0预测、l1预测、bi预测等)信息。在帧间预测的情况下，邻近块可以包括当前图片中存在的空间邻近块和参照图片中存在的时间邻近块。包括参考块的参照图片和包括时间邻近块的参照图片可以彼此相同或彼此不同。时间邻近块可以被称为并置参考块、并置cu(colcu)等，并且包括时间邻近块的参照图片可以被称为并置图片(colpic)。例如，帧间预测器221可以基于邻近块来配置运动信息候选列表，并且生成指示哪个候选被用于推导当前块的运动向量和/或参照图片索引的信息。可以基于各种预测模式来执行帧间预测。例如，在跳变模式和合并模式的情况下，帧间预测器221可以使用邻近块的运动信息作为当前块的运动信息。在跳变模式下，与合并模式不同，不能发送残差信号。在运动信息预测(运动向量预测、mvp)模式的情况下，邻近块的运动向量可以被用作运动向量预测符，并且可以通过发信号通知运动向量差来指示当前块的运动向量。
73.预测器220可以基于各种预测方法来生成预测信号。例如，预测器可以将帧内预测或帧间预测应用于对一个块的预测，并且也可以同时应用帧内预测和帧间预测。这可以被称为组合的帧间和帧内预测(ciip)。另外，预测器可以基于块内复制(ibc)预测模式或调色板模式，以便对块执行预测。ibc预测模式或调色板模式可以被用于诸如屏幕内容编码(scc)这样的游戏等的内容图像/视频编码。尽管ibc基本上在当前块中执行预测，但是其执行方式与帧间预测的相似之处在于，它推导当前块中的参考块。也就是说，ibc可以使用本公开中描述的帧间预测技术中的至少一种。
74.通过帧间预测器221和/或帧内预测器222生成的预测信号可以被用于生成重构信号或者生成残差信号。变换器232可以通过向残差信号应用变换技术来生成变换系数。例如，变换技术可以包括离散余弦变换(dct)、离散正弦变换(dst)、karhunen-lo
è
ve变换(klt)、基于图的变换(gbt)或有条件非线性变换(cnt)中的至少一种。这里，gbt意指当用曲线图表示像素之间的关系信息时从曲线图获得的变换。cnt是指基于使用所有先前重构的像素生成的预测信号而获得的变换。另外，变换处理可以被应用于大小相同的正方形像素块，或者可以应用于大小可变的块而非正方形的块。
75.量化器233可以对变换系数进行量化并且将它们发送到熵编码器240，并且熵编码器240可以对量化后的信号(关于量化变换系数的信息)进行编码并且输出比特流中的编码后的信号。关于量化变换系数的信息可以被称为残差信息。量化器233可以基于系数扫描顺序将块类型的量化变换系数重新布置成一维向量形式，并且基于一维向量形式的量化变换系数来生成关于量化变换系数的信息。熵编码器240可以执行诸如例如指数哥伦布(exponential golomb)、上下文自适应可变长度编码(cavlc)、上下文自适应二进制算术编
码(cabac)等这样的各种编码方法。熵编码器240可以对除了量化变换系数(例如，语法元素的值等)之外的视频/图像重构所需的信息一起或分别进行编码。编码后的信息(例如，编码后的视频/图像信息)可以以比特流的形式在网络抽象层(nal)的单元基础上进行发送或存储。视频/图像信息还可以包括关于诸如适应参数集(aps)、图片参数集(pps)、序列参数集(sps)、视频参数集(vps)等这样的各种参数集的信息。另外，视频/图像信息还可以包括常规约束信息。在本公开中，从编码设备发送到/发信号通知给解码设备的信息和/或语法元素可以被包括在视频/图像信息中。视频/图像信息可以通过上述编码过程进行编码并且被包括在比特流中。可以通过网络传输比特流，或者将其存储在数字存储介质中。这里，网络可以包括广播网络、通信网络和/或类似物，并且数字存储介质可以包括诸如usb、sd、cd、dvd、蓝光、hdd、ssd等这样的各种存储介质。发送从熵编码器240输出的信号的发送器(未示出)或存储其的存储器(未示出)可以被配置为编码设备200的内部/外部元件，或者发送器可以被包括在熵编码器240中。
76.从量化器233输出的量化变换系数可以被用于生成预测信号。例如，通过利用解量化器234和逆变换器235向量化变换系数应用解量化和逆变换，可以重构残差信号(残差块或残差样本)。加法器155将重构后的残差信号与从帧间预测器221或帧内预测器222输出的预测信号相加，使得可以生成重构信号(重构图片、重构块、重构样本阵列)。当如在应用跳变模式的情况下一样没有针对处理目标块的残差时，可以将预测块用作重构块。加法器250可以被称为重构器或重构块生成器。所生成的重构信号可以被用于目标图片中的下一处理目标块的帧内预测，并且如随后描述的，可以被用于通过滤波进行的下一图片的帧间预测。
77.此外，在图片编码和/或重构处理中，可以应用具有色度缩放的亮度映射(lmcs)。
78.滤波器260可以通过向重构信号应用滤波来改善主观/客观视频质量。例如，滤波器260可以通过向重构图片应用各种滤波方法来生成修改后的重构图片，并且可以将修改后的重构图片存储在存储器270中，尤其是存储在存储器270的dpb中。各种滤波方法可以包括例如解块滤波、样本自适应偏移、自适应环形滤波器、双边滤波器等。如随后在对每种滤波方法的描述中所讨论的，滤波器260可以生成与滤波相关的各种信息，并且将所生成的信息发送到熵编码器240。关于滤波的信息可以在熵编码器240中被编码并且以比特流的形式被输出。
79.已发送到存储器270的修改后的重构图片可以被用作帧间预测器221中的参照图片。据此，编码设备可以避免在应用帧间预测时编码设备100和解码设备中的预测失配，并且还可以提高编码效率。
80.存储器270dpb可以存储修改后的重构图片，以便使用它作为帧间预测器221中的参照图片。存储器270可以存储从中已推导(或编码了)运动信息的当前图片中的块的运动信息和/或已经重构的图片中的块的运动信息。所存储的运动信息可以被发送到帧间预测器221，以被用作邻近块的运动信息或时间邻近块的运动信息。存储器270可以存储当前图片中的重构块的重构样本，并且将它们发送到帧内预测器222。
81.图3是示意性地例示可应用本公开的视频/图像解码设备的配置的图。
82.参照图3，视频解码设备300可以包括熵解码器310、残差处理器320、预测器330、加法器340、滤波器350和存储器360。预测器330可以包括帧间预测器331和帧内预测器332。残差处理器320可以包括解量化器321和逆变换器321。根据实施方式，上面已描述的熵解码器
310、残差处理器320、预测器330、加法器340和滤波器350可以由一个或更多个硬件组件(例如，解码器芯片组或处理器)构成。另外，存储器360可以包括解码图片缓冲器(dpb)，并且可以由数字存储介质构成。硬件组件还可以包括存储器360作为内部/外部组件。
83.当输入包括视频/图像信息的比特流时，解码设备300可以与据此已在图2的编码设备中处理视频/图像信息的处理对应地重构图像。例如，解码设备300可以基于与从比特流获得的与块分割相关的信息来推导单元/块。解码设备300可以通过使用在编码设备中应用的处理单元来执行解码。因此，解码的处理单元可以是例如编码单元，可以用编码树单元或最大编码单元顺着四叉树结构、二叉树结构和/或三叉树结构对其进行分割。可以用编码单元推导一个或更多个变换单元。并且，可以通过再现器来再现通过解码设备300解码并输出的重构图像信号。
84.解码设备300可以以比特流的形式接收从图2的编码设备输出的信号，并且可以通过熵解码器310对接收到的信号进行解码。例如，熵解码器310可以对比特流进行解析，以推导图像重构(或图片重构)所需的信息(例如，视频/图像信息)。视频/图像信息还可以包括关于诸如自适应参数集(aps)、图片参数集(pps)、序列参数集(sps)、视频参数集(vps)等这样的各种参数集的信息。另外，视频/图像信息还可以包括常规约束信息。解码设备可以进一步基于关于参数集的信息和/或常规约束信息对图片进行解码。在本公开中，随后将描述的发信号通知/接收的信息和/或语法元素可以通过解码过程被解码并且从比特流中获得。例如，熵解码器310可以基于诸如指数哥伦布编码、cavlc、cabac等这样的编码方法对比特流中的信息进行解码，并且可以输出图像重构所需的语法元素的值和关于残差的变换系数的量化值。更具体地，cabac熵解码方法可以接收与比特流中的各语法元素对应的bin，使用解码目标语法元素信息以及邻近和解码目标块的解码信息或者在先前步骤中解码的符号/bin的信息来确定上下文模型，根据所确定的上下文模型来预测bin生成概率并且对bin执行算术解码以生成与每个语法元素值对应的符号。这里，cabac熵解码方法可以在确定上下文模型之后使用针对下一个符号/bin的上下文模型解码的符号/bin的信息来更新上下文模型。在熵解码器310中解码的信息当中的关于预测的信息可以被提供到预测器(帧间预测器332和帧内预测器331)，并且在熵解码器310中已对其执行了熵解码的残差值(即，量化变换系数)和关联的参数信息可以被输入到残差处理器320。残差处理器320可以推导残差信号(残差块、残差样本、残差样本阵列)。另外，在熵解码器310中解码的信息当中的关于滤波的信息可以被提供到滤波器350。此外，接收从编码设备输出的信号的接收器(未示出)还可以将解码设备300构成为内部/外部元件，并且接收器可以是熵解码器310的组件。此外，根据本公开的解码设备可以被称为视频/图像/图片编码设备，并且解码设备可以被分为信息解码器(视频/图像/图片信息解码器)和样本解码器(视频/图像/图片样本解码器)。信息解码器可以包括熵解码器310，并且样本解码器可以包括解量化器321、逆变换器322、加法器340、滤波器350、存储器360、帧间预测器332和帧内预测器331中的至少一个。
85.解量化器321可以通过对量化变换系数进行解量化来输出变换系数。解量化器321可以将量化变换系数重新布置为二维块的形式。在这种情况下，可以基于已在编码设备中执行的系数扫描的顺序来执行重新布置。解量化器321可以使用量化参数(例如，量化步长信息)对量化变换系数执行解量化，并且获得变换系数。
86.解量化器322通过对变换系数进行逆变换来获得残差信号(残差块、残差样本阵
列)。
87.预测器可以对当前块执行预测，并且生成包括针对当前块的预测样本的预测块。预测器可以基于从熵解码器310输出的关于预测的信息来确定向当前块应用帧内预测还是帧间预测，并且具体地可以确定帧内/帧间预测模式。
88.预测器可以基于各种预测方法来生成预测信号。例如，预测器可以将帧内预测或帧间预测应用于对一个块的预测，并且也可以同时应用帧内预测和帧间预测。这可以被称为组合的帧间和帧内预测(ciip)。另外，预测器可以针对块的预测执行块内复制(ibc)。块内复制可以被用于诸如屏幕内容编码(scc)这样的游戏等的内容图像/视频编码。尽管ibc基本上在当前块中执行预测，但是其执行方式与帧间预测的相似之处在于，它推导当前块中的参考块。也就是说，ibc可以使用本公开中描述的帧间预测技术中的至少一种。
89.帧内预测器331可以通过参考当前图片中的样本来预测当前块。根据预测模式，参考样本可以位于当前块的附近或与当前块分开。在帧内预测中，预测模式可以包括多种非定向模式和多种定向模式。帧内预测器331可以通过使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
90.帧间预测器332可以基于参照图片上的运动向量所指定的参考块(参考样本阵列)来推导针对当前块的预测块。此时，为了减少在帧间预测模式下发送的运动信息的量，可以基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为基础来预测运动信息。运动信息可以包括运动向量和参照图片索引。运动信息还可以包括帧间预测方向(l0预测、l1预测、bi预测等)信息。在帧间预测的情况下，邻近块可以包括当前图片中存在的空间邻近块和参照图片中存在的时间邻近块。例如，帧间预测器332可以基于邻近块来配置运动信息候选列表，并且基于接收到的候选选择信息来推导当前块的运动向量和/或参照图片索引。可以基于各种预测模式来执行帧间预测，并且关于预测的信息可以包括指示针对当前块的帧间预测的模式的信息。
91.加法器340可以通过将所获得的残差信号与从预测器330输出的预测信号(预测块、预测样本阵列)相加来生成重构信号(重构图片、重构块、重构样本阵列)。当如在应用跳变模式的情况下一样没有针对处理目标块的残差时，可以将预测块用作重构块。
92.加法器340可以被称为重构器或重构块生成器。所生成的重构信号可以被用于当前块中的下一处理目标块的帧内预测，并且如随后描述的，可以通过滤波来输出或者被用于下一图片的帧间预测。
93.此外，在图片解码处理中，可以应用具有色度缩放的亮度映射(lmcs)。
94.滤波器350可以通过向重构后的信号应用滤波来改善主观/客观视频质量。例如，滤波器350可以通过向重构图片应用各种滤波方法来生成修改后的重构图片，并且可以将修改后的重构图片发送到存储器360中，尤其是发送到存储器360的dpb中。各种滤波方法可以包括例如解块滤波、样本自适应偏移、自适应环形滤波器、双边滤波器等。
95.已存储在存储器360的dpb中的(修改后的)重构图片可以被用作帧间预测器332中的参照图片。存储器360可以存储从中已推导(或解码了)运动信息的当前图片中的块的运动信息和/或已经重构的图片中的块的运动信息。所存储的运动信息可以被发送到帧间预测器260，以被用作邻近块的运动信息或时间邻近块的运动信息。存储器360可以存储当前图片中的重构块的重构样本，并且将它们发送到帧内预测器331。
96.在本说明书中，在解码设备300的预测器330、解量化器321、逆变换器322和滤波器350中描述的示例可以分别类似地或对应地应用于编码设备200的预测器220、解量化器234、逆变换器235和滤波器260。
97.如上所述，执行预测，以便提高执行视频编码时的压缩效率。据此，可以生成包括针对作为编码目标块的当前块的预测样本的预测块。这里，预测块包括空间域(或像素域)中的预测样本。可以在编码设备和解码设备中相同地推导预测块，并且编码设备可以通过向解码设备发信号通知并非原始块本身的原始样本值而是关于原始块与预测块之间的残差的信息(残差信息)来提高图像编码效率。解码设备可以基于残差信息来推导包括残差样本的残差块，通过将残差块与预测块相加来生成包括重构样本的重构块，并且生成包括重构块的重构图片。
98.可以通过变换过程和量化过程来生成残差信息。例如，编码设备可以推导原始块与预测块之间的残差块，通过对残差块中所包括的残差样本(残差样本阵列)执行变换过程来推导变换系数，并且通过对变换系数执行量化过程来推导量化变换系数，使得它可以(通过比特流)向解码设备发信号通知关联的残差信息。这里，残差信息可以包括量化变换系数的值信息、位置信息、变换技术、变换核、量化参数等。解码设备可以基于残差信息来执行量化/解量化过程并且推导残差样本(或残差样本块)。解码设备可以基于预测块和残差块来生成重构块。编码设备可以通过对量化变换系数进行解量化/逆变换来推导残差块以便作为下一个图片的帧间预测的参考，并且可以基于此来生成重构图片。
99.图4示意性地例示了根据本公开的实施方式的多变换技术。
100.参照图4，变换器可以对应于前述图2的编码设备中的变换器，并且逆变换器可以对应于前述图2的编码设备中的逆变换器、或者图3的解码设备中的逆变换器。
101.变换器可以通过基于残差块中的残差样本(残差样本阵列)执行一次变换来推导(一次)变换系数(s410)。该一次变换可以被称为核心变换。在本文中，一次变换可以基于多变换选择(mts)，并且当将多变换用作一次变换时，可以将其称为多核心变换。
102.多核心变换可以表示附加地使用离散余弦变换(dct)类型2和离散正弦变换(dst)类型7、dct类型8和/或dst类型1进行变换的方法。也就是说，多核心变换可以表示基于从dct类型2、dst类型7、dct类型8和dst类型1当中选择的多个变换核将空间域的残差信号(或残差块)变换为频域的变换系数(或一次变换系数)的变换方法。在本文中，从变换器的视角来看一次变换系数可以称为临时变换系数。
103.换句话说，当应用常规变换方法时，可以通过基于dct类型2对残差信号(或残差块)应用从空间域到频率域的变换来生成变换系数。与此不同，当应用多核心变换时，可以通过基于dct类型2、dst类型7、dct类型8和/或dst类型1对残差信号(或残差块)应用从空间域到频率域的变换来生成变换系数(或一次变换系数)。在本文中，dct类型2、dst类型7、dct类型8和dst类型l可以被称为变换类型、变换核或变换核心。可以基于基函数来定义这些dct/dst变换类型。
104.当执行多核心变换时，可以从变换核当中选择用于目标块的垂直变换核和水平变换核，可以基于垂直变换核对目标块执行垂直变换，并且可以基于水平变换核对目标块执行水平变换。这里，水平变换可以指示对目标块的水平分量的变换，并且垂直变换可以指示对目标块的垂直分量的变换。可以基于包括残差块的目标(cu或子块)的预测模式和/或变
换索引来适应性地确定垂直变换核/水平变换核。
105.此外，根据示例，如果通过应用mts来执行一次变换，则可以通过将特定基函数设置为预定值并组合要在垂直变换或水平变换中应用的基函数来设置变换核的映射关系。例如，当水平变换核表示为trtypehor，并且垂直方向变换核表示为trtypever时，可以将值为0的trtypehor或trtypever设置给dct2，将值为1的trtypehor或trtypever设置给dst7，并且将值为2的trtypehor或trtypever可以设置给dct8。
106.在这种情况下，mts索引信息可以被编码并且发信号通知到解码设备以指示多个变换核集中的任何一个。例如，mts索引0可以指示trtypehor和trtypever值均为0，mts索引1可以指示trtypehor和trtypever值均为1，mts索引2可以指示trtypehor值为2并且trtypever值为1，mts索引为3可以指示trtypehor值为1并且trtypever值为2，而mts索引4可以指示trtypehor和trtypever值均为2。
107.在一个示例中，根据mts索引信息的变换核集在下表中示出。
108.[表1]
[0109]
tu_mts_idx[x0][y0]01234trtypehor01212trtvpever01122
[0110]
变换器可以通过基于(一次)变换系数执行二次变换来推导修改的(二次)变换系数(s420)。一次变换是从空间域到频域的变换，而二次变换是指通过使用(一次)变换系数之间存在的相关性，变换为更具压缩性的表示。二次变换可以包括不可分离的变换。在这种情况下，二次变换可以称为不可分离的二次变换(nsst)或模式相关的不可分离的二次变换(mdnsst)。不可分离的二次变换可以表示这样的变换，其通过基于不可分离的变换矩阵对通过一次变换推导出的(一次)变换系数进行二次变换来生成针对残差信号的修改的变换系数(或二次变换系数)。此时，垂直变换和水平变换可以不单独应用于(一次)变换系数(或者水平变换和垂直变换可以不独立应用)，但是可以基于不可分离的变换一次地应用变换矩阵。换句话说，不可分离的二次变换可以表示这样的变换方法，其中，(一次)变换系数的垂直分量和水平分量不分离，并且例如，将二维信号(变换系数)通过某个确定的方向(例如，行第一方向或列第一方向)重新布置为一维信号，然后基于不可分离的变换矩阵生成修改的变换系数(或二次变换系数)。例如，根据行优先顺序，m
×
n个块以第一行、第二行、
…
和第n行的顺序设置成排。根据列优先顺序，m
×
n个块以第一列、第二列、
…
和第m列的顺序设置成排。不可分离的二次变换可以应用于配置有(一次)变换系数的块(在下文中，可以称为变换系数块)的左上区域。例如，如果变换系数块的宽度(w)和高度(h)均等于或大于8，则可以将8
×
8不可分离的二次变换应用于变换系数块的左上8
×
8区域。此外，如果变换系数块的宽度(w)和高度(h)均等于或大于4，并且变换系数块的宽度(w)或高度(h)小于8，那么可以将4
×
4不可分离的二次变换应用于变换系数块的左上min(8,w)
×
min(8,h)区域。然而，实施方式不限于此，并且例如，即使仅满足变换系数块的宽度(w)或高度(h)等于或大于4的条件，4
×
4不可分离的二次变换也可以应用于变换系数块的左上min(8,w)
×
min(8,h)区域。
[0111]
具体地，例如，如果使用4
×
4输入块，则不可分离的二次变换可以如下执行。
[0112]4×
4输入块x可以表示如下。
[0113]
[式1]
[0114][0115]
如果x以向量的形式表示，则向量可以如下表示。
[0116]
[式2]
[0117][0118]
在式2中，向量是通过根据行优先顺序重新布置式1的二维块x而获得的一维向量。
[0119]
在这种情况下，可以如下计算不可分离的二次变换。
[0120]
[式3]
[0121][0122]
在此式中，表示变换系数向量，而t表示16
×
16(不可分离的)变换矩阵。
[0123]
通过前述式3，可以推导16
×
1变换系数向量并且可以通过扫描顺序(水平、垂直和对角线等)将向量重新组织为4
×
4块。然而，上述计算是示例，并且超立方体-吉文斯变换(hygt)等也可以用于不可分离的二次变换的计算，以便降低不可分离的二次变换的计算复杂度。
[0124]
此外，在不可分离的二次变换中，可以将变换核(或变换核心、变换类型)选择为模式相关。在这种情况下，模式可以包括帧内预测模式和/或帧间预测模式。
[0125]
如上所述，可以基于以变换系数块的宽度(w)和高度(h)为基础确定的8
×
8变换或4
×
4变换来执行不可分离的二次变换。8
×
8变换是指当w和h二者都等于或大于8时可应用于变换系数块中包含的8
×
8区域的变换，并且8
×
8区域可以是变换系数块中的左上8
×
8区域。类似地，4
×
4变换是指当w和h二者都等于或大于4时可应用于变换系数块中包含的4
×
4区域的变换，并且4
×
4区域可以是变换系数块中的左上4
×
4区域。例如，8
×
8变换核矩阵可以是64
×
64/16
×
64矩阵，而4
×
4变换核矩阵可以是16
×
16/8
×
16矩阵。
[0126]
这里，为了选择模式相关的变换核，可以针对8
×
8变换和4
×
4变换二者配置用于不可分离的二次变换的每个变换集二个不可分离的二次变换核，并且可以存在四个变换集。也就是说，可以针对8
×
8变换配置四个变换集，并且可以针对4
×
4变换配置四个变换集。在这种情况下，针对8
×
8变换的四个变换集中的每个变换集可以包括二个8
×
8变换核，并且针对4
×
4变换的四个变换集中的每个变换集可以包括二个4
×
4变换核。
[0127]
然而，随着变换的大小(即，变换所应用于的区域的大小)可以为例如除了8
×
8或4
×
4之外的大小，集的数量可以是n，并且每个集中的变换核的数量可以是k。
[0128]
变换集可以被称为nsst集或lfnst集。可以例如基于当前块(cu或子块)的帧内预测模式来选择变换集当中的特定集。低频不可分离的变换(lfnst)可以是缩减不可分离的
变换的示例，其将稍后描述，并且表示用于低频分量的不可分离的变换。
[0129]
作为参考，例如，帧内预测模式可以包括两个非定向(或非角度)帧内预测模式和65个定向(或角度)帧内预测模式。非定向帧内预测模式可以包括0号的平面帧内预测模式和1号的dc帧内预测模式，并且定向帧内预测模式可以包括2号至66号的65个帧内预测模式。然而，这是示例，并且即使帧内预测模式的数量不同也可以应用本文档。此外，在一些情况下，还可以使用67号帧内预测模式，并且67号帧内预测模式可以表示线性模型(lm)模式。
[0130]
图5示意性地示出了65个预测方向的帧内定向模式。
[0131]
参照图5，基于具有左上对角预测方向的帧内预测模式34，帧内预测模式可以划分为具有水平方向性的帧内预测模式和具有垂直方向性的帧内预测模式。在图5中，h和v分别标示水平方向性和垂直方向性，并且数字-32至32指示样本网格位置上的1/32单位的位移。这些数字可以表示对于模式索引值的偏移。帧内预测模式2至33具有水平方向性，并且帧内预测模式34至66具有垂直方向性。严格地说，帧内预测模式34可以被视为既不是水平的也不是垂直的，但在确定二次变换的变换集时可以被分类为属于水平方向性。这是因为输入数据被转置以用于基于帧内预测模式34对称的垂直定向模式，并且针对水平模式的输入数据对准方法用于帧内预测模式34。对输入数据进行转置意指将二维的m
×
n块数据的行和列切换成n
×
m数据。帧内预测模式18和帧内预测模式50可以分别表示水平帧内预测模式和垂直帧内预测模式，并且帧内预测模式2可以被称为右上对角帧内预测模式，因为帧内预测模式2具有左参考像素并且在右上方向上执行预测。类似地，帧内预测模式34可以被称为右下对角帧内预测模式，而帧内预测模式66可以被称为左下对角帧内预测模式。
[0132]
根据示例，可以映射根据帧内预测模式的四个变换集，例如，如下表所示。
[0133]
[表2]
[0134]
lfnstpredmodeintralfnsttrsetidxlfnstpredmodeintra＜010＜＝lfnstpredmodeintra＜＝102＜＝lfnstpredmodeintra＜＝12113＜＝lfnstpredmodeintra＜＝23224＜＝lfnstpredmodeintra＜＝44345＜＝lfnstpredmodeintra＜＝55256＜＝lfnstpredmodeintra＜＝80181＜＝lfnstpredmodeintra＜＝830
[0135]
如表2所示，根据帧内预测模式，四个变换集中的任何一个，即，lfnsttrsetidx，可以映射到四个索引(即，0至3)中的任何一个。
[0136]
当确定特定集用于不可分离的变换时，可以通过不可分离的二次变换索引来选择特定集中的k个变换核之一。编码设备可以基于率失真(rd)校验来推导指示特定变换核的不可分离的二次变换索引，并且可以将不可分离的二次变换索引发信号通知给解码设备。解码设备可以基于不可分离的二次变换索引来选择特定集中的k个变换核中的一个。例如，lfnst索引值0可以指代第一不可分离的二次变换核，lfnst索引值1可以指代第二不可分离的二次变换核，lfnst索引值2可以指代第三不可分离的二次变换核。另选地，lfnst索引值0可以指示第一不可分离的二次变换没有被应用于目标块，并且lfnst索引值1至3可以指示
三个变换核。
[0137]
变换器可以基于所选择的变换核来执行不可分离的二次变换，并且可以获得修改的(二次)变换系数。如上所述，修改的变换系数可以被推导为通过量化器量化的变换系数，并且可以被编码并发信号通知给解码设备，并且被传送到编码设备中的解量化器/逆变换器。
[0138]
此外，如上所述，如果省略了二次变换，则可以将作为一次(可分离的)变换的输出的(一次)变换系数推导为如上所述通过量化器量化的变换系数，并且可以被编码并发信号通知给解码设备，并传送到编码设备中的解量化器/逆变换器。
[0139]
逆变换器可以与在上述变换器中已经执行的顺序相反的顺序执行一系列过程。逆变换器可以接收(解量化的)变换系数，并且通过执行二次(逆)变换来推导(一次)变换系数(s450)，并且可以通过对(一次)变换系数执行一次(逆)变换来获得残差块(残差样本)(s460)。就此而言，从逆变换器的视角来看，一次变换系数可以被称为修改的变换系数。如上所述，编码设备和解码设备可以基于残差块和预测块来生成重构块，并且可以基于重构块来生成重构图片。
[0140]
解码设备还可以包括二次逆变换应用确定器(或用于确定是否应用二次逆变换的元件)和二次逆变换确定器(或用于确定二次逆变换的元件)。二次逆变换应用确定器可以确定是否应用二次逆变换。例如，二次逆变换可以是nsst、rst或lfnst，并且二次逆变换应用确定器可以基于通过解析比特流而获得的二次变换标志来确定是否应用二次逆变换。在另一示例中，二次逆变换应用确定器可以基于残差块的变换系数来确定是否应用二次逆变换。
[0141]
二次逆变换确定器可以确定二次逆变换。在这种情况下，二次逆变换确定器可以基于根据帧内预测模式指定的lfnst(nsst或rst)变换集来确定应用于当前块的二次逆变换。在实施方式中，可以取决于一次变换确定方法来确定二次变换确定方法。可以根据帧内预测模式来确定一次变换和二次变换的各种组合。此外，在示例中，二次逆变换确定器可以基于当前块的大小来确定应用二次逆变换的区域。
[0142]
此外，如上所述，如果省略二次(逆)变换，则可以接收(解量化的)变换系数，可以执行一次(可分离的)逆变换，并且可以获得残差块(残差样本)。如上所述，编码设备和解码设备可以基于残差块和预测块来生成重构块，并且可以基于重构块来生成重构图片。
[0143]
此外，在本公开中，可以在nsst的概念中应用其中减小了变换矩阵(核)的大小的缩减二次变换(rst)，以便减少不可分离的二次变换所需的计算量和存储量。
[0144]
此外，本公开中描述的变换核、变换矩阵以及构成变换核矩阵的系数，即，核系数或矩阵系数，可以以8比特来表示。这可以是在解码设备和编码设备中实现的条件，并且与现有的9比特或10比特相比，可以减少存储变换核所需的存储量，并且可以合理地适应性能劣化。另外，以8比特表示核矩阵可以允许使用小的乘法器，并且可以更适合于用于最佳软件实现的单指令多数据(simd)指令。
[0145]
在本说明书中，术语“rst”可以是指基于大小根据缩减因子而减小的变换矩阵来对目标块的残差样本执行的变换。在执行缩减变换的情况下，由于变换矩阵的大小的减小，可以减少变换所需的计算量。也就是说，rst可以用于解决在大小大的块的变换或不可分离的变换时发生的计算复杂性问题。
[0146]
rst可以被称为诸如缩减变换、缩减二次变换、缩小变换、简化变换和简单变换等之类的各种术语，并且rst可以被称为的名称不限于所列示例。另选地，由于rst主要在变换块中的包括非零系数的低频区域中执行，因此它可以被称为低频不可分离的变换(lfnst)。变换索引可以被称作lfnst索引。
[0147]
此外，当基于rst执行二次逆变换时，编码设备200的逆变换器235和解码设备300的逆变换器322可以包括：逆缩减二次变换器，其基于变换系数的逆rst来推导修改的变换系数；以及逆一次变换器，其基于修改的变换系数的逆一次变换来推导目标块的残差样本。逆一次变换是指应用于残差的一次变换的逆变换。在本公开中，基于变换推导变换系数可以是指通过应用变换来推导变换系数。
[0148]
图6是例示根据本公开的实施方式的rst的图。
[0149]
在本公开中，“目标块”可以指代要编码的当前块，残差块或变换块。
[0150]
在根据示例的rst中，可以将n维向量映射到位于另一个空间中的r维向量，从而可以确定缩减变换矩阵，其中r小于n。n可以是指应用了变换的块的侧边的长度的平方，或与应用了变换的块相对应的变换系数的总数，并且缩减因子可以是指r/n值。缩减因子可以被称为缩减因子、缩小因子、简化因子、简单因子或其它各种术语。此外，r可以被称为缩减系数，但是根据情况，缩减因子可以是指r。此外，根据情况，缩减因子可以是指n/r值。
[0151]
在示例中，可以通过比特流来用信号通知缩减因子或缩减系数，但是示例不限于此。例如，可以在编码设备200和解码设备300中的每一个中存储针对缩减因子或缩减系数的预定值，并且在这种情况下，可以不单独发信号通知缩减因子或缩减系数。
[0152]
根据示例的缩减变换矩阵的大小可以是小于n
×
n(常规变换矩阵的大小)的r
×
n，并且可以如下面的式4所限定。
[0153]
[式4]
[0154][0155]
图6的(a)中所示的缩减变换块中的矩阵t可以是指式4的矩阵tr×n。如图6的(a)所示，当将缩减变换矩阵tr×n乘以目标块的残差样本时，可以推导当前块的变换系数。
[0156]
在示例中，如果应用了变换的块的大小是8
×
8并且r＝16(即，r/n＝16/64＝1/4)，则根据图6的(a)的rst可以被表示为以下式5所示的矩阵运算。在这种情况下，存储和乘法计算可以通过缩减因子缩减至大约1/4。
[0157]
在本公开中，矩阵运算可以理解为通过将列向量与设置在列向量的左侧的矩阵相乘来获得列向量的运算。
[0158]
[式5]
[0159][0160]
在式6中，r1至r
64
可以表示目标块的残差样本，并且具体地可以是通过应用一次变
换而生成的变换系数。作为式5的计算的结果，可以推导目标块的变换系数ci，并且推导ci的过程可以如式6所示。
[0161]
[式6]
[0162][0163]
作为式6的计算的结果，可以推导目标块的变换系数c1至cr。也就是说，当r＝16时，可以推导目标块的变换系数c1至c
16
。如果应用常规变换而不是rst，并将64
×
64(n
×
n)大小的变换矩阵与64
×
1(n
×
1)大小的残差样本相乘，则因为应用了rst而针对目标块仅推导16(r)个变换系数，尽管针对目标块推导了64(n)个变换系数。由于用于目标块的变换系数的总数从n缩减到r，所以编码设备200向解码设备300发送的数据量减少，因此编码设备200与解码设备300之间的传输效率可以提高。
[0164]
当从变换矩阵的大小的视角考虑时，常规变换矩阵的大小为64
×
64(n
×
n)，但缩减变换矩阵的大小缩减为16
×
64(r
×
n)，因此与执行常规变换的情况相比，执行rst的情况下的存储使用率可以减小r/n比率。另外，当与使用常规变换矩阵的情况下的乘法计算的数量n
×
n相比时，使用缩减变换矩阵可以将乘法计算的数量(r
×
n)减小r/n比率。
[0165]
在示例中，编码设备200的变换器232可以通过对目标块的残差样本执行一次变换和基于rst的二次变换来推导目标块的变换系数。这些变换系数可以被传送到解码设备300的逆变换器，并且解码设备300的逆变换器322可以基于针对变换系数的逆缩减二次变换(rst)来推导修改的变换系数，并且可以基于针对修改的变换系数的逆一次变换来推导目标块的残差样本。
[0166]
根据示例的逆rst矩阵tn×r的大小为比常规逆变换矩阵n
×
n的大小小的n
×
r，并且与式4中所示的缩减变换矩阵tr×n具有转置关系。
[0167]
图6的(b)所示的缩减逆变换块中的矩阵t
t
可以是指逆rst矩阵tn×
rt
(上标t是指转置)。如图6的(b)所示，当将逆rst矩阵tn×
rt
乘以目标块的变换系数时，可以推导目标块的修改的变换系数或目标块的残差样本。逆rst矩阵tr×
nt
可以表示为(tr×
nt
)n×r。
[0168]
更具体地，当逆rst被用作二次逆变换时，当逆rst矩阵tn×
rt
被乘以目标块的变换系数时，可以推导目标块的修改的变换系数。此外，可以将逆rst用作逆一次变换，并且在这种情况下，当将逆rst矩阵tn×
rt
与目标块的变换系数相乘时，可以推导目标块的残差样本。
[0169]
在示例中，如果应用逆变换的块的大小是8
×
8并且r＝16(即，r/n＝16/64＝1/4)，则根据图6的(b)的rst可以被表示为以下式7所示的矩阵运算。
[0170]
[式7]
[0171][0172]
在式7中，c1至c
16
可以表示目标块的变换系数。作为式7的计算的结果，可以推导表示目标块的修改的变换系数或目标块的残差样本的rj，并且推导rj的过程可以如式8所示。
[0173]
[式8]
[0174][0175]
作为式8的计算的结果，可以推导表示目标块的修改的变换系数或目标块的残差样本的r1至rn。从逆变换矩阵的大小的视角考虑，常规逆变换矩阵的大小为64
×
64(n
×
n)，但逆缩减变换矩阵的大小缩减为64
×
16(r
×
n)，因此与执行常规逆变换的情况相比，执行逆rst的情况下的存储使用率可以减小r/n比率。另外，当与使用常规逆变换矩阵的情况下的乘法计算的数量n
×
n相比时，使用逆缩减变换矩阵可以将乘法计算的数量(n
×
r)减少r/n比率。
[0176]
表2所示的变换集配置也可以应用于8
×
8rst。也就是说，可以根据表2中的变换集来应用8
×
8rst。由于根据帧内预测模式，一个变换集包括两个或三个变换(核)，因此可以将其配置为选择包括在不应用二次变换的情况下在内的至多四个变换中的一个。在不应用二次变换的变换中，可以考虑应用恒等矩阵(identity matrix)。假设分别将索引0、1、2和3分配给四个变换(例如，可以将索引0分配给应用恒等矩阵的情况，即，不应用二次变换的情况)，可以针对每个变换系数块发信号通知作为语法元素的变换索引或lfnst索引，由此指定要应用的变换。也就是说，针对左上8
×
8块，通过变换索引，可以指定rst配置中的8
×
8nsst，或者当应用lfnst时可以指定8
×
8lfnst。8
×
8lfnst和8
×
8rst指代当要变换的目标块的w和h均等于或大于8时可应用于变换系数块中包括的8
×
8区域的变换，并且8
×
8区域可以是变换系数块中的左上8
×
8区域。类似地，4
×
4lfnst和4
×
4rst指代当目标块的w和h均等于或大于4时可应用于变换系数块中包括的4
×
4区域的变换，并且4
×
4区域可以是变换系数块中的左上4
×
4区域。
[0177]
根据本公开的实施方式，对于编码过程中的变换，可以仅选择48条数据，并且可以向其应用最大16
×
48变换核矩阵，而不是将16
×
64变换核矩阵应用于形成8
×
8区域的64条数据。此处，“最大”意味着m在m
×
48变换核矩阵中具有最大值16以用于生成m个系数。也就是说，当通过将m
×
48变换核矩阵(m≤16)应用于8
×
8区域来执行rst时，输入48条数据，并且生成m个系数。当m是16时，输入48条数据并且生成16个系数。也就是说，假设48条数据形成48
×
1向量，16
×
48矩阵和48
×
1向量依次相乘，由此生成16
×
1向量。这里，形成8
×
8区域的48条数据可以被适当地布置，由此形成48
×
1向量。例如，可以基于构成8
×
8区域当中的
除了右下4
×
4区域之外的区域的48条数据来构造48
×
1向量。这里，当通过应用最大16
×
48变换核矩阵来执行矩阵运算时，生成16个修改的变换系数，并且可以根据扫描顺序将16个修改的变换系数布置在左上4
×
4区域中，并且可以用零填充右上4
×
4区域和左下4
×
4区域。
[0178]
对于解码过程中的逆变换，可以使用前述变换核矩阵的转置矩阵。也就是说，当在由解码设备执行的逆变换过程中执行逆rst或lfnst时，根据预定布置顺序在一维向量中配置应用逆rst的输入系数数据，并且可以根据预定布置顺序将通过将一维向量与在一维向量左侧的对应的逆rst矩阵相乘而获得的修改的系数向量布置到二维块中。
[0179]
总之，在变换过程中，当rst或lfnst被应用于8
×
8区域时，在8
×
8区域的除了右下区域之外的左上区域、右上区域和左下区域中的48个变换系数与16
×
48变换核矩阵的矩阵运算。对于矩阵运算，以一维阵列输入48个变换系数。当执行矩阵运算时，推导出16个修改的变换系数，并且可以将修改的变换系数布置于8
×
8区域的左上区域中。
[0180]
相反，在逆变换过程中，当将逆rst或lfnst应用于8
×
8区域时，可以根据扫描顺序以一维阵列输入8
×
8区域中的变换系数当中的对应于8
×
8区域的左上区域的16个变换系数，并且可以经历与48
×
16变换核矩阵的矩阵运算。也就是说，矩阵运算可以表示为(48
×
16矩阵)*(16
×
1变换系数向量)＝(48
×
1修改的变换系数向量)。这里，n
×
1向量可以被解释为具有与n
×
1矩阵相同的含义，并且因此可以被表示为n
×
1列向量。此外，*表示矩阵乘法。当执行矩阵运算时，可以推导出48个修改的变换系数，并且可以将48个修改的变换系数布置在8
×
8区域中的除了右下区域之外的左上区域、右上区域和左下区域中。
[0181]
当二次逆变换基于rst时，编码设备200的逆变换器235和解码设备300的逆变换器322可以包括用于基于对变换系数的逆rst推导修改的变换系数的逆缩减二次变换器以及用于基于对修改的变换系数的逆一级变换来推导目标块的残差样本的逆一次变换器。逆一次变换指代应用于残差的一次变换的逆变换。在本公开中，基于变换推导变换系数可以指代通过应用变换来推导变换系数。
[0182]
上面描述的非分离变换(lfnst)将如下详细描述。lfnst可以包括由编码设备进行的正向变换和由解码设备进行的逆变换。
[0183]
编码设备接收在应用一次(核心)变换之后推导出的结果(或结果的一部分)作为输入，并且应用正向二次变换(二次变换)。
[0184]
[式9]
[0185]
y＝g
t
x
[0186]
在式9中，x和y分别是二次变换的输入和输出，g是表示二次变换的矩阵，并且变换基向量由列向量组成。在逆lfnst的情况下，当变换矩阵g的维度表示为[行的数量
×
列的数量]时，在正向lfnst的情况下，矩阵g的转置变成g
t
的维度。
[0187]
对于逆lfnst，矩阵g的维度是[48
×
16]、[48
×
8]、[16
×
16]、[16
×
8]，并且[48
×
8]矩阵和[16
×
8]矩阵是分别从[48
×
16]矩阵和[16
×
16]矩阵的左侧采样的8个变换基向量的部分矩阵。
[0188]
另一方面，对于正向lfnst，矩阵g
t
的维度是[16
×
48]、[8
×
48]、[16
×
16]、[8
×
16]，并且[8
×
48]矩阵和[8
×
16]矩阵是通过分别从[16
×
48]矩阵和[16
×
16]矩阵的上部采样8个变换基向量而获得的部分矩阵。
[0189]
因此，在正向lfnst的情况下，[48
×
1]向量或[16
×
1]向量可以作为输入x，并且[16
×
1]向量或[8
×
1]向量可以作为输出y。在视频编码和解码中，正向一次变换的输出是二维(2d)数据，因此为了构造[48
×
1]向量或[16
×
1]向量作为输入x，需要通过将作为正向变换的输出的2d数据适当地布置来构造一维向量。
[0190]
图7是例示根据示例的将正向一次变换的输出数据布置成一维向量的顺序的图。图7的(a)和(b)的左图示出了用于构造[48
×
1]向量的顺序，并且图7的(a)和(b)的右图示出了用于构造[16
×
1]向量的顺序。在lfnst的情况下，可以通过将2d数据按与图7的(a)和(b)中相同的次序顺序地布置来获得一维向量x。
[0191]
可以根据当前块的帧内预测模式确定正向一次变换的输出数据的布置方向。例如，当当前块的帧内预测模式相对于对角线方向处于水平方向时，可以按图7的(a)的次序布置正向一次变换的输出数据，并且当当前块的帧内预测模式相对于对角线方向处于垂直方向时，可以按图7的(b)的次序布置正向一次变换的输出数据。
[0192]
根据示例，可以应用不同于图7的(a)和(b)的布置次序的布置次序，并且为了推导与应用图7的(a)和(b)的布置次序时相同的结果(y向量)，可以根据布置次序重新布置矩阵g的列向量。也就是说，可以重新布置g的列向量，使得构成x向量的每个元素总是乘以相同的变换基向量。
[0193]
由于通过式9推导的输出y是一维向量，因此当在使用正向二次变换的结果作为输入的过程中(例如，在执行量化或残差编码的过程中)需要二维数据作为输入数据时，式9的输出y向量需要再次被适当地布置为2d数据。
[0194]
图8是例示根据示例的将正向二次变换的输出数据布置成二维向量的顺序的图。
[0195]
在lfnst的情况下，输出值可以根据预定扫描次序布置在2d块中。图8的(a)示出了当输出y是[16
×
1]向量时，根据对角线扫描次序将输出值布置在2d块的16个位置处。图8的(b)示出了当输出y是[8
×
1]向量时，根据对角线扫描次序将输出值布置在2d块的8个位置处，并且用零填充其余的8个位置。图8的(b)中的x指示它被填充有零。
[0196]
根据另一示例，由于可以预设在执行量化或残差编码时处理输出向量y的次序，因此输出向量y可以不布置在如图8中所示的2d块中。然而，在残差编码的情况下，可以在2d块(例如，4
×
4)单元(例如，cg(系数组))中执行数据编码，并且在此情况下，根据如图8的对角线扫描次序中的特定次序来布置数据。
[0197]
此外，解码设备可以通过根据用于逆变换的预设扫描次序来布置通过解量化过程输出的二维数据来配置一维输入向量y。输入向量y可以通过下式输出为输出向量x。
[0198]
[式10]
[0199]
x＝gy
[0200]
在逆lfnst的情况下，可以通过将作为[16
×
1]向量或[8
×
1]向量的输入向量y乘以g矩阵来推导输出向量x。对于逆lfnst，输出向量x可以是[48
×
1]向量或[16
×
1]向量。
[0201]
输出向量x根据图7中所示的次序布置在二维块中，并且被布置为二维数据，并且该二维数据成为逆一次变换的输入数据(或输入数据的一部分)。
[0202]
因此，逆二次变换整体上是正向二次变换过程的相反，并且在逆变换的情况下，与在正向方向上不同，首先应用逆二次变换，然后应用逆一次变换。
[0203]
在逆lfnst中，可以选择8个[48
×
16]矩阵和8个[16
×
16]矩阵中的一个作为变换
矩阵g。是应用[48
×
16]矩阵还是应用[16
×
16]矩阵取决于块的大小和形状。
[0204]
另外，可以从如上表2所示的四个变换集中推导8个矩阵，并且每个变换集可以由两个矩阵组成。根据帧内预测模式确定在4个变换集当中使用哪个变换集，并且更具体地，基于通过考虑广角帧内预测(waip)而扩展的帧内预测模式的值来确定变换集。通过索引信令来推导从构成所选择的变换集的两个矩阵当中选择哪个矩阵。更具体地，0、1和2可以作为发送的索引值，0可以指示不应用lfnst，并且1和2可以指示构成基于帧内预测模式值选择的变换集的两个变换矩阵中的任何一个。
[0205]
图9是例示根据本文档的实施方式的广角帧内预测模式的图。
[0206]
一般帧内预测模式值可以具有从0到66以及从81到83的值，并且由于waip而扩展的帧内预测模式值可以具有所示的从-14到83的值。从81到83的值指示cclm(跨分量线性模型)模式，并且从-14到-1的值和从67到80的值指示由于waip应用而扩展的帧内预测模式。
[0207]
当当前预测块的宽度大于高度时，上参考像素通常更接近要预测的块内部的位置。因此，在左下方向上比在右上方向上进行预测可以更准确。相反，当块的高度大于宽度时，左参考像素通常更接近要预测的块内部的位置。因此，在右上方向上比在左下方向上进行预测可以更准确。因此，将重映射(即，模式索引修改)应用到广角帧内预测模式的索引可以是有利的。
[0208]
当应用广角帧内预测时，关于现有帧内预测的信息可以被发信号通知，并且在信息被解析之后，该信息可以被重映射到广角帧内预测模式的索引。因此，可以不改变用于特定块(例如，特定大小的非正方形块)的帧内预测模式的总数量，也就是说，帧内预测模式的总数量是67，并且可以不改变用于特定块的帧内预测模式编码。
[0209]
下表3示出了通过将帧内预测模式重映射到广角帧内预测模式来推导修改的帧内模式的过程。
[0210]
[表3]
[0211][0212]
在表3中，扩展的帧内预测模式值最终存储在predmodeintra变量中，并且isp_no_split指示cu块不通过当前在vvc标准中采用的帧内子分区(isp)技术划分成子分区，并且0、1和2的cidx变量值分别指示亮度分量、cb分量和cr分量的情况。表3所示的log2函数返回基数为2的log值，并且abs函数返回绝对值。
[0213]
指示帧内预测模式的变量predmodeintra以及变换块的高度和宽度等用作广角帧内预测模式映射过程的输入值，并且输出值是修改的帧内预测模式predmodeintra。变换块或编码块的高度和宽度可以为用于帧内预测模式的重映射的当前块的高度和宽度。此时，反映宽度与宽度的比率的变量whratio可以被设置为abs(log2(nw/nh))。
[0214]
对于非正方形块，帧内预测模式可以划分成两种情况并且被修改。
[0215]
首先，如果条件(1)至(3)全部被满足，(1)当前块的宽度大于高度、(2)在修改之前的帧内预测模式等于或大于2、以及(3)帧内预测模式当变量whratio大于1时小于被推导为(8 2*whratio)的值并且当变量whratio小于或等于1时小于8(predmodeintra小于(whratio》1)？(8 2*whratio):8)，则帧内预测模式被设置为比predmodeintra大65的值[predmodeintra被设置为等于(predmodeintra 65)]。
[0216]
如果与以上不同，即，如果条件(1)至(3)被满足，(1)当前块的高度大于宽度、(2)
在修改之前的帧内预测模式小于或等于66、以及(3)帧内预测模式当whratio大于1时大于被推导为(60-2*whratio)的值并且当whratio小于或等于1时大于60(predmodeintra大于(whratio》1)？(60-2*whratio):60)，则帧内预测模式被设置为比predmodeintra小67的值[predmodeintra被设置为等于(predmodeintra-67)]。
[0217]
上表2示出了如何在lfnst中基于由waip扩展的帧内预测模式值选择变换集。如图9所示，模式14到33和模式35到80关于模式34周围的预测方向对称。例如，模式14和模式54关于对应于模式34的方向是对称的。因此，相同的变换集应用于位于相互对称的方向上的模式，并且这种对称性也反映在表2中。
[0218]
此外，假设模式54的正向lfnst输入数据与模式14的正向lfnst输入数据对称。例如，对于模式14和模式54，根据图7的(a)和图7的(b)所示的布置次序将二维数据重新布置为一维数据。另外，可以看出，图7的(a)和图7的(b)所示的次序的图案关于由模式34指示的方向(对角线方向)是对称的。
[0219]
此外，如上所述，由变换目标块的大小和形状来确定将[48
×
16]矩阵和[16
×
16]矩阵中的哪个变换矩阵应用于lfnst。
[0220]
图10是例示lfnst被应用于的块形状的图。图10的(a)示出了4
×
4块，图10的(b)示出了4
×
8块和8
×
4块，图10的(c)示出了4
×
n块或n
×
4块，其中n为16或更大，图10的(d)示出了8
×
8块，图10的(e)示出了m
×
n块，其中m≥8、n≥8并且n》8或m》8。
[0221]
在图10中，具有厚边界的块指示lfnst被应用到的区域。对于图10的(a)和(b)的块，lfnst被应用于左上4
×
4区域，并且对于图10的(c)的块，lfnst被单独地应用于被连续地布置的两个左上4
×
4区域。在图10的(a)、(b)和(c)中，由于lfnst以4
×
4区域为单位应用，所以该lfnst在下文中将被称为“4
×
4lfnst”。基于g的矩阵维度，可以应用[16
×
16]或[16
×
8]矩阵。
[0222]
更具体地，[16
×
8]矩阵被应用到图10的(a)的4
×
4块(4
×
4tu或4
×
4cu)，并且[16
×
16]矩阵被应用到图10的(b)和(c)中的块。这是为了将最坏情况的计算复杂度调整为每个样本8次乘法。
[0223]
关于图10的(d)和(e)，lfnst被应用于左上8
×
8区域，并且该lfnst在下文中被称为“8
×
8lfnst”。作为对应的变换矩阵，可以应用[48
×
16]矩阵或[48
×
8]矩阵。在正向lfnst的情况下，由于[48
×
1]向量(式9中的x向量)作为输入数据被输入，所以不是左上8
×
8区域的所有样本值都被用作正向lfnst的输入值。也就是说，如可以从图7的(a)的左侧次序或图7的(b)的左侧次序看出的，可以基于属于在将右下4
×
4块原样留下的同时的其余3个4
×
4块的样本来构造[48
×
1]向量。
[0224]
[48
×
8]矩阵可以应用于图10的(d)中的8
×
8块(8
×
8tu或8
×
8cu)，并且[48
×
16]矩阵可以应用于图10的(e)中的8
×
8块。这也是为了将最坏情况的计算复杂度调整为每个样本8次乘法。
[0225]
取决于块形状，当对应的正向lfnst(4
×
4或8
×
8lfnst)被应用时，生成8或16个输出数据(式9中的y向量，[8
×
1]或[16
×
1]向量)。在正向lfnst中，由于矩阵g
t
的特性，输出数据的数量等于或小于输入数据的数量。
[0226]
图11是例示根据示例的正向lfnst的输出数据的布置的图，并且示出了其中根据块形状布置正向lfnst的输出数据的块。
[0227]
在图11所示的块的左上的阴影区域对应于正向lfnst的输出数据所位于的区域，用0标记的位置指示填充有0值的样本，并且其余区域表示未被正向lfnst改变的区域。在未被lfnst改变的区域中，正向一次变换的输出数据保持不变。
[0228]
如上所述，由于所应用的变换矩阵的尺寸根据块的形状而变化，因此输出数据的数量也变化。如图11，正向lfnst的输出数据可能不完全填充左上4
×
4块。在图11的(a)和(d)的情况下，将[16
×
8]矩阵和a[48
×
8]矩阵分别应用于由粗线指示的块或块内部的部分区域，并且生成作为正向lfnst的输出的[8
×
1]向量。也就是说，根据图8的(b)所示的扫描次序，可以仅填充8个输出数据，如图11的(a)和(d)所示，并且可以在其余的8个位置中填充0。在图10的(d)的lfnst应用的块的情况下，如图11的(d)所示，与左上4
×
4块相邻的右上和左下的两个4
×
4块也被填充有0值。
[0229]
如上所述，基本上，通过发信号通知lfnst索引，规定了是否应用lfnst和要应用的变换矩阵。如图11所示，当lfnst被应用时，由于正向lfnst的输出数据的数量可以等于或小于输入数据的数量，所以出现如下填充有零值的区域。
[0230]
1)如图11的(a)所示，来自左上4
×
4块中的扫描次序上的第八个位置和后面的位置的样本，即，来自第九到第十六的样本。
[0231]
2)如图11的(d)和(e)中所示，当应用[48
×
16]矩阵或[48
×
8]矩阵时，与左上4
×
4块相邻的两个4
×
4块或者扫描次序上的第二和第三4
×
4块。
[0232]
因此，如果通过检查区域1)和2)存在非零数据，则确定未应用lfnst，使得可以省略对应的lfnst索引的信令。
[0233]
根据示例，例如，在vvc标准中采用的lfnst的情况下，由于在残差编码之后执行lfnst索引的信令，因此编码设备可以通过残差编码来知道在tu或cu块内的所有位置是否存在非零数据(有效系数)。因此，编码设备可以基于非零数据的存在来确定是否执行关于lfnst索引的信令，并且解码设备可以确定是否解析lfnst索引。当非零数据不存在于以上1)和2)中指定的区域中时，执行lfnst索引的信令。
[0234]
由于截短的一元码被应用为lfnst索引的二值化方法，所以lfnst索引由多达两个bin组成，并且0、10和11分别被指派为用于可能的lfnst索引值0、1和2的二进制码。在当前用于vvc的lfnst的情况下，将基于上下文的cabac编码应用于第一bin(常规编码)，并且将旁通编码应用于第二bin。第一bin的上下文的总数量为2，当(dct-2，dct-2)被应用为用于水平和垂直方向的一次变换对并且亮度分量和色度分量以双树类型编码时，一个上下文被分配并且另一上下文应用于其余情况。lfnst索引的编码如下表所示。
[0235]
[表4]
[0236][0237]
此外，对于采用的lfnst，可以应用以下简化方法。
[0238]
(i)根据示例，正向lfnst的输出数据的数量可以被限于最大值16。
[0239]
在图10的(c)的情况下，4
×
4lfnst可以分别应用于与左上方相邻的两个4
×
4区域，并且在这种情况下，可以生成最大32个lfnst输出数据。当正向lfnst的输出数据的数量
被限制为最大值16时，在4
×
n/n
×
4(n≥16)块(tu或cu)的情况下，4
×
4lfnst仅应用于左上方的一个4
×
4区域，lfnst可以仅应用于图10的所有块一次。通过此，可以简化图像编码的实现方式。
[0240]
图12示出了根据示例的正向lfnst的输出数据的数量被限制为最大值16。在图12，当lfnst被应用到4
×
n或n
×
4块(其中n为16或更大)中的最左上的4
×
4区域时，正向lfnst的输出数据成为16个。
[0241]
(ii)根据示例，可以附加地清零应用到未应用lfnst的区域。在本文档中，清零可以表示用为0的值填充属于特定区域的所有位置。也就是说，可以将清零应用于由于lfnst而未改变的区域，并且维持正向一次变换的结果。如上所述，由于lfnst被划分为4
×
4lfnst和8
×
8lfnst，所以清零可以如下划分为两种类型((ii)-(a)和(ii)-(b))。
[0242]
(ii)-(a)当应用4
×
4lfnst时，未应用4
×
4lfnst的区域可以被清零。图13是例示根据示例的应用4
×
4lfnst的块中的清零的图。
[0243]
如图13所示，关于应用了4
×
4lfnst的块，即，对于图11的(a)、(b)和(c)中的所有块，未应用lfnst的整个区域可以用零填充。
[0244]
另一方面，图13的(d)示出当正向lfnst的输出的最大值被限制为16(如图12所示)时，对未应用4
×
4lfnst的其余块执行清零。
[0245]
(ii)-(b)当应用8
×
8lfnst时，未应用8
×
8lfnst的区域可以被清零。图14是例示根据示例的应用8
×
8lfnst的块中的清零的图。
[0246]
如图14所示，关于应用8
×
8lfnst的块，即，对于图11的(d)和(e)中的所有块，lfnst未被应用到的整个区域可以用零填充。
[0247]
(iii)由于以上(ii)中呈现的清零，用零填充的区域可以不与当lfnst被应用时相同。因此，可以根据对比图11的lfnst的情况更宽的区域进行(ii)中提出的清零来检查是否存在非零数据。
[0248]
例如，当(ii)-(b)被应用时，在检查图11的(d)和(e)中的用零填充的区域是否存在非零数据之后，另外附加地检查图14中填充有0的区域是否存在非零数据，可以仅当不存在非零数据时执行针对lfnst索引的信令。
[0249]
当然，即使应用(ii)中提出的清零，也可以与现有lfnst索引信令相同的方式检查非零数据是否存在。也就是说，在检查在图11中用零填充的块中是否存在非零数据之后，可以应用lfnst索引信令。在此情况下，编码设备仅执行清零并且解码设备不假设清零，也就是，仅检查非零数据是否仅存在于图11中明确标记为0的区域中，可以执行lfnst索引解析。
[0250]
另选地，根据另一示例，可以执行如图15所示的清零。图15是例示根据另一示例的应用8
×
8lfnst的块中的清零的图。
[0251]
如图13和图14所示，可以将清零应用于除了应用lfnst的区域之外的所有区域，或者可以将清零仅应用于局部区域，如图15所示。清零仅应用于除了图15的左上8
×
8区域之外的区域，清零可以不应用于左上
×
8区域内的右下4
×
4块。
[0252]
可以推导出应用lfnst的简化方法((i)、(ii)-(a)、(ii)-(b)、(iii))的组合的各种实施方式。当然，上述简化方法的组合不限于以下实施方式，并且可以将任何组合应用于lfnst。
[0253]
实施方式1
[0254]-将正向lfnst的输出数据的数量限制为最大值16
→
(ii)
[0255]-当应用4
×
4lfnst时，未应用4
×
4lfnst的所有区域被清零
→
(ii)-(a)
[0256]-当应用8
×
8lfnst时，未应用8
×
8lfnst的所有区域被清零
→
(ii)-(b)
[0257]-在检查非零数据是否也存在于填充有零值的现有区域以及由于附加的清零而填充有零的区域中((ii)-(a)、(ii)-(b))之后，仅在不存在非零数据时发信号通知lfnst索引
→
(iii)。
[0258]
在实施方式1的情况下，当应用lfnst时，可以存在非零输出数据的区域限于左上4
×
4区域的内部。更详细地，在图13的(a)和图14的(a)的情况下，扫描次序上的第八个位置是其中可以存在非零数据的最后位置。在图13的(b)和(c)以及图14的(b)的情况下，扫描次序上的第十六个位置(即，左上4
×
4块的右下边缘的位置)是其中可以存在除了0以外的数据的最后位置。
[0259]
因此，在应用lfnst之后，在检查非零数据是否存在于残差编码过程不允许的位置(在超出最后位置的位置处)之后，可以确定是否发信号通知lfnst索引。
[0260]
以下是示出根据实施方式1的lfnst过程的表。
[0261]
[表5]
[0262][0263]
[表6]
[0264][0265]
表5和表6示出了lfnst简化方法的(ii)和(iii)的解码过程。
[0266]
根据表5的上部，当其中存在最后非零系数的子块的索引大于0且变换块的宽度和高度大于4[(lastsubblock》0&&log2tbwidth》＝2&&log2tbheight》＝2)]，或者其中存在最后非零系数的子块内的非零系数的最后位置大于7且变换块的大小为4
×
4或8
×
8[(lastscanpos》7&&(log2tbwidth＝＝2||log2tbheight＝＝3)&&log2tbwidth＝＝log2tbheight)]时，将用于lfnst的清零的标志变量lfnstzerooutsigcoeffflag设置为1。
[0267]
也就是说，第一条件是，非零系数是从变换块中除了可以应用lfnst的左上区域之外的区域推导出的(也就是说，当推导出除了左上子块(4
×
4)之外的子块中的有效系数时)。当满足第一条件时，将用于lfnst的清零的标志变量lfnstzerooutsigcoeffflag设置为1。在这种情况下，由于变换块的大小是4
×
4或更大，所以其指示在应用4
×
4lfnst和8
×
8lfnst的变换块中执行清零。
[0268]
因为第二条件是当lfnst被应用到4
×
4块和8
×
8块时，非零系数可以存在的最后位置是如图11的(a)和(d)所示的第八个位置，当非零系数存在于在从0开始时的第七个位置之外时，标志变量lfnstzerooutsigcoeffflag被设置为1。
[0269]
这样，当标志变量lfnstzerooutsigcoeffflag被设置为1时，如表6所示，当lfnstzerooutsigcoeffflag为0时在编码单元层级处发信号通知的lfnst_idx不被信令。
[0270]
根据另一示例，当满足表5的第一条件或第二条件时，标志变量lfnstzerooutsigcoeffflag设置为0，并且当lfnstzerooutsigcoeffflag为1时，可以发信号通知lfnst_idx。
[0271]
[表7]
[0272]
块和8
×
8块的正向lfnst的输出数据或逆lfnst的输入数据的长度是8。对于所有其它块，正向lfnst的输出数据或逆lfnst的输入数据的长度是16[nonzerosize＝((ntbw＝＝4&&ntbh＝＝4)||(ntbw＝＝8&&ntbh＝＝8))？8:16]。也就是说，当应用正向lfnst时，输出数据的最大数量被限制为16。
[0275]
该逆lfnst的输入数据可以根据对角线扫描来二维地布置[xc＝diagscanorder[log2lfnstsize][log2lfnstsize][x][0],yc＝diagscanorder[log2lfnstsize][log2lfnstsize][x][1]]。上述部分示出了用于lfnst简化方法的(i)的解码过程。
[0276]
此外，当lfnst索引为非零时，指示输入到逆一次变换的非零变换系数可以存在于其中的左上块的宽度和高度的变量nonzerow和nonzeroh，如果变换块的宽度或宽度为4，则被推导为4，否则被推导为8[nonzerow＝(ntbw＝＝4||ntbh＝＝4)？4:8,nonzeroh＝(ntbw＝＝4||ntbh＝＝4)？4:8]。也就是说，在变换块中，在除了应用lfnst的4
×
4区域和8
×
8区域之外的区域中执行清零。该区域示出了用于lfnst简化方法的(ii)的解码过程。
[0277]
实施方式2
[0278]-将正向lfnst的输出数据的数量限制为最大值16
→
(i)。
[0279]
在实施方式2)中，由于不应用(ii)中提出的清零，因此应用根据不检查是否存在非零数据的方法的lfnst索引信令方法。也就是说，仅检查图11所示的清零，并且基于此来发信号通知lfnst索引。图11的(c)的情况与实施方式2不同，因为输出数据的数量是32(即，实施方式2的情况如图12所示)，但是除了输出数据位于左上4
×
4块中之外，同样的内容应用于不应用(ii)中提出的清零。
[0280]
如图12所示，当将4
×
4lfnst仅应用于左上4
×
4区域并且将[16
×
16]矩阵应用于对应的区域时，不发生填充有零值的区域。由于用于检查非零数据的存在的区域不改变，所以可以原样应用根据不检查是否存在非零数据的方法的lfnst索引信令方法。
[0281]
[表8]
[0282][0283]
[0284]
参照表8，指示对其执行矩阵运算以便应用lfnst的非零系数的大小或数量的变量nonzerosize被设置为8或16。当变换块的宽度和高度是4或8时，即，如图11所示，4
×
4块和8
×
8块的正向lfnst的输出数据或逆lfnst的输入数据的长度是8。对于所有其它块，正向lfnst的输出数据或逆lfnst的输入数据的长度是16[nonzerosize＝((ntbw＝＝4&&ntbh＝＝4)||(ntbw＝＝8&&ntbh＝＝8))？8:16]。也就是说，当应用正向lfnst时，输出数据的最大数量被限制为16。
[0285]
该逆lfnst的输入数据可以根据对角线扫描来二维地布置[xc＝diagscanorder[log2lfnstsize][log2lfnstsize][x][0],yc＝diagscanorder[log2lfnstsize][log2lfnstsize][x][1]]。参照表8描述的部分示出了用于lfnst简化方法的(i)的解码过程。
[0286]
实施方式3
[0287]-当应用8
×
8lfnst时，未应用8
×
8lfnst的所有区域被清零
→
(ii)-(b)
[0288]-在检查非零数据是否也存在于填充有零值的现有区域(图11所示的清零区域)以及由于附加的清零而填充有零的区域中((ii)-(b))之后，仅在不存在非零数据时发信号通知lfnst索引
→
(iii)。
[0289]
[表9]
[0290][0291]
在表9中，表5的上部的条件被改变。将用于lfnst的清零的标志变量lfnstzerooutsigcoeffflag设置为1的第一条件所应用于的变换块的大小从4
×
4改变为8
×
8。变换块的大小的此改变指示清零仅在应用8
×
8lfnst的变换块中执行。
[0292]
表6可以应用于实施方式3的编码单元的语法语法。
[0293]
[表10]
[0294][0295]
在该实施方式中，由于lfnst的清零在其中执行8
×
8lfnst的具有8或更大的宽度和高度的变换块中执行。如表10所示，当lfnst索引大于0并且变换块的宽度和高度是8或更大时，指示包括输入到逆一次变换的非零变换系数的块的宽度和高度的变量nonzerow和nonzeroh可以被推导为8[(lfnst_idx[xtby][ytby]》0&&ntbw》＝8&&ntbh》＝8)？8,(lfnst_idx[xtby][ytby]》0&&ntbw》＝8&&ntbh》＝8)？8]。也就是说，在变换块中，在除了应用lfnst的8
×
8区域之外的区域中执行清零。该部分示出了用于lfnst简化方法的(ii)-(b)的解码过程。
[0296]
实施方式4
[0297]-当应用8
×
8lfnst时，未应用8
×
8lfnst的所有区域被清零
→
(ii)-(b)
[0298]
可以原样应用根据不检查是否存在非零数据的方法的lfnst索引信令方法。也就是说，由编码设备执行(ii)-(b)中的清零，并且解码设备可以假设对应的清零区域可能存在非零数据地执行lfnst索引信令。即使在这种情况下，仅检查图11中呈现的清零，并且基于此来发信号通知lfnst索引。
[0299]
实施方式5
[0300]-将正向lfnst的输出数据的数量限制为最大值16
→(i)[0301]-当应用8
×
8lfnst时，未应用8
×
8lfnst的所有区域被清零
→
(ii)-(b)
[0302]-在检查非零数据是否也存在于填充有零值的现有区域(除了图11的(c)之外的图11中的其余清零区域，其中应用图12而非图11的(c)但不应用清零的区域)以及由于附加的清零而填充有零的区域中((ii)-(b))之后，仅在不存在非零数据时发信号通知lfnst索引
→
(iii)。
[0303]
在此实施方式的情况下，实施方式3的表9可以应用于用于残差编码的语法语法，并且实施方式1的表6可以应用于用于编码单元的语法语法。
[0304]
根据表9，将用于lfnst的清零的标志变量lfnstzerooutsigcoeffflag设置为1的第一条件所应用于的变换块的大小为8
×
8。此变换块的大小限制指示仅在应用8
×
8lfnst的变换块中执行清零。
[0305]
[表11]
[0306][0307]
参照表11，指示对其执行矩阵运算以便应用lfnst的非零系数的大小或数量的变量nonzerosize被设置为8或16。当变换块的宽度和高度是4或8时，即，如图11所示，4
×
4块和8
×
8块的正向lfnst的输出数据或逆lfnst的输入数据的长度是8。对于所有其它块，正向lfnst的输出数据或逆lfnst的输入数据的长度是16[nonzerosize＝((ntbw＝＝4&&ntbh＝
＝4)||(ntbw＝＝8&&ntbh＝＝8))？8:16]。也就是说，当应用正向lfnst时，输出数据的最大数量被限制为16。
[0308]
该逆lfnst的输入数据可以根据对角线扫描来二维地布置[xc＝diagscanorder[log2lfnstsize][log2lfnstsize][x][0],yc＝diagscanorder[log2lfnstsize][log2lfnstsize][x][1]]。上述部分示出了用于lfnst简化方法的(i)的解码过程。
[0309]
此外，在该实施方式中，由于lfnst的清零在其中执行8
×
8lfnst的具有8或更大的宽度和高度的变换块中执行。如表11所示，当lfnst索引大于0并且变换块的宽度和高度是8或更大时，指示包括输入到逆一次变换的非零变换系数的块的宽度和高度的变量nonzerow和nonzeroh可以被推导为8[(lfnst_idx[xtby][ytby]》0&&ntbw》＝8&&ntbh》＝8)？8,(lfnst_idx[xtby][ytby]》0&&ntbw》＝8&&ntbh》＝8)？8]。也就是说，在变换块中，在除了应用lfnst的8
×
8区域之外的区域中执行清零。该部分示出了用于lfnst简化方法的(ii)-(b)的解码过程。
[0310]
实施方式6。
[0311]-将正向lfnst的输出数据的数量限制为最大值16
→(i)[0312]-当应用8
×
8lfnst时，未应用8
×
8lfnst的所有区域被清零
→
(ii)-(b)
[0313]
可以原样应用根据不检查是否存在非零数据的方法的lfnst索引信令方法。也就是说，由编码设备执行(ii)-(b)中的清零，并且解码设备可以假设对应的清零区域可能存在非零数据地执行lfnst索引信令。即使在这种情况下，仅检查图11(除了图11的(c)之外)中呈现的清零，并且基于此来发信号通知lfnst索引。
[0314]
在实施方式4和6的情况下，lfnst索引的规范文本不改变，因为清零仅在编码设备中执行，并且解码设备在不考虑清零的情况下解析lfnst索引。
[0315]
在(ii)中提出的清零方法的情况下，由于当应用了一次变换和lfnst两者时最终生成的数据的数量，所以执行整个变换过程所需的计算量可以降低。也就是说，当lfnst被应用时，由于清零被应用于正向一次变换输出数据存在于未应用lfnst的区域中，因此不需要为在执行正向一次变换期间成为清零的区域生成数据。因此，可以降低生成对应的数据所需的计算量。在(ii)中提出的清零方法的附加效果总结如下。
[0316]
首先，如上所述，减少执行整个变换过程所需的计算量。
[0317]
特别地，当应用(ii)-(b)时，最坏情况的计算量被减少，使得变换过程可以被变轻。换句话说，一般来说，需要大量的计算来执行大尺寸的一次变换。通过应用(ii)-(b)，作为执行正向lfnst的结果而推导出的数据的数量可以减小到16或更小。另外，随着整个块(tu或cu)的大小增加，减少变换操作的量的效果进一步增加。
[0318]
第二，可以减少整个变换过程所需的计算量，由此降低执行变换所需的功耗。
[0319]
第三，减小了变换过程中涉及的延迟。
[0320]
诸如lfnst之类的次级变换向现有的一次变换添加了计算量，因而增加了执行变换时涉及的总体延迟时间。特别地，在帧内预测的情况下，由于在预测过程中使用相邻块的重构数据，所以在编码期间，由于二次变换导致的延迟的增加导致直到重构的延迟的增加。这可以导致帧内预测编码的总体延迟的增加。
[0321]
然而，如果应用(ii)中提出的清零，则当应用lfnst时可以极大地减少执行一次变换的延迟时间，保持或减少整个变换的延迟时间，使得可以更简单地实现编码设备。
[0322]
提供以下附图以描述本公开的具体示例。由于在附图中示出的装置的特定名称或特定信号/消息/字段的名称是为了例示而提供的，所以本公开的技术特征不限于在以下附图中使用的特定名称。
[0323]
图16是例示根据本公开的实施方式的视频解码设备的操作的流程图。
[0324]
图16所示的每个操作可以由图3所示的解码设备300执行。具体地，s1610和s1640可以由图3所示的熵解码器310执行，s1620可以由图3所示的解量化器321执行，并且s1630、s1650和s1660可以由图3所示的逆变换器322执行，并且s1670可以由图3所示的加法器340执行。根据s1610至s1670的操作基于参照图4至图15解释的前述细节中的一些。因此，将省略或将简要地描述与上文参照图3至图15解释的那些细节重叠的具体细节的描述。
[0325]
根据实施方式的解码设备300接收包括残差信息的比特流，并且可以从比特流中推导出关于当前块(即，要被变换的变换块)的残差信息，例如，量化变换系数(s1610)。
[0326]
更具体地，解码设备300可以从比特流解码关于目标块的量化变换系数的信息，并且可以基于关于当前块的量化变换系数的信息来推导当前块的量化变换系数。关于目标块的量化变换系数的信息可以包括在序列参数集(sps)或条带报头中，并且可以包括关于是否应用缩减变换(rst)的信息、关于简化因子的信息、关于应用缩减变换的最小变换大小的信息、关于应用缩减变换的最大变换大小的信息、缩减逆变换大小、以及关于指示包括在变换集中的任何一个变换核矩阵的变换索引的信息中的至少一者。
[0327]
解码设备300可以对当前块的量化变换系数执行解量化以推导出变换系数(s1620)。
[0328]
所推导的变换系数可以二维地布置在当前块中，并且解码设备可以通过残差编码推导非零数据，即，关于当前块中的非零有效系数的信息。也就是说，解码设备可确定当前块中的非零有效系数的最后位置信息。
[0329]
s1620的基于残差信息推导出的变换系数可以为如上所述的解量化的变换系数，或可以是量化变换系数。也就是说，变换系数可以是不管是否量化都能够检查非零数据是否在当前块中的数据。
[0330]
根据示例，解码设备可以确定有效系数是否存在于当前块的除了位于左上的第一区域之外的第二区域中(s1630)。
[0331]
可以基于当前块的大小来推导第一区域。
[0332]
例如，当当前块的大小为4
×
4或8
×
8时，第一区域可以为从当前块的左上角至扫描方向上的第八样本位置。
[0333]
当当前块的大小为4
×
4或8
×
8时，由于通过正向lfnst输出8个数据，因此由解码设备接收的8个变换系数可以从当前块的左上角至扫描方向上的第八样本位置布置。
[0334]
此外，当当前块的大小不是4
×
4或8
×
8时，第一区域可以是当前块的左上的4
×
4区域。如果当前块的大小不是4
×
4或8
×
8，因为通过正向lfnst输出16个数据，则由解码设备接收的16个变换系数可以布置在当前块的左上4
×
4区域中，如图13的(b)到(d)和图14的(b)所示。
[0335]
此外，可以布置在第一区域中的变换系数可以沿着对角线扫描方向布置，如图8所示。
[0336]
此外，根据示例，用于应用lfnst的块的变换系数的数量可以高达16。
[0337]
当确定除了第一区域之外的第二区域中不存在有效系数时(即，如果通过检查有效系数直到当前块的第二区域而不存在有效系数)，解码设备可以从比特流中解析lfnst索引(s1640)。
[0338]
如上文所描述，当由编码设备执行正向lfnst时，除了其中存在根据lfnst的变换系数的区域之外，可以执行其中当前块的其余区域被看作0的清零。
[0339]
因此，当在第二区域中存在有效系数时，由于未应用lfnst，所以不发信号通知lfnst索引且解码设备不解析lfnst索引。
[0340]
lfnst索引信息作为语法信息被接收并且语法信息作为包括0和1的二值化bin串被接收。
[0341]
根据本实施方式的lfnst索引的语法元素可以指示是否应用逆lfnst或逆不可分离的变换以及变换集中包括的变换核矩阵中的任何一个，并且变换集包括两个变换核矩阵。在这种情况下，变换索引的语法元素可以具有三个值。
[0342]
也就是说，根据实施方式，lfnst索引的语法元素值可以包括0、1和2，0指示逆lfnst没有应用于目标块的情况，1指示变换核矩阵当中的第一变换核矩阵，2指示变换核矩阵当中的第二变换核矩阵。
[0343]
当lfnst索引被解析时，解码设备可以将lfnst矩阵应用于第一区域的变换系数以推导修改的变换系数(s1650)。
[0344]
解码设备300的逆变换器332可以根据应用于目标块的帧内预测模式基于映射关系确定变换集，并且可以基于变换集和lfnst索引的语法元素的值来执行逆lfnst，即，逆不可分离的变换。
[0345]
如上所述，可以根据要变换的变换块的帧内预测模式来确定多个变换集，并且可以基于变换核矩阵(即，包括在由lfnst索引指示的变换集中的lfnst矩阵)中的任何一个来执行逆lfnst。应用于逆lfnst的矩阵可以被命名为逆lfnst矩阵或lfnst矩阵，并且该矩阵的名称是不相关的，只要它与用于正向lfnst的矩阵具有转置关系即可。
[0346]
在一个示例中，逆lfnst矩阵可以是其中列的数量小于行的数量的非正方形矩阵。
[0347]
此外，可以基于当前块的大小推导预定数量的修改的变换系数。例如，当当前块的高度和宽度为8或更大时，推导48个修改的变换系数，如图7的左侧所示。另外，当当前块的宽度和高度不等于或大于8时，即，当当前块的宽度和高度大于或等于4且当前块的宽度或高度小于8时，可以推导出16个修改的变换系数，如图7的右侧所示。
[0348]
如图7所示，48个修改的变换系数可以布置在当前块的左上8
×
8区域中的左上4
×
4区域、右上4
×
4区域和左下4
×
4区域中，并且16个修改的变换系数可以布置在当前块的左上4
×
4区域中。
[0349]
可以根据当前块的帧内预测模式在垂直或水平方向上布置48个修改的变换系数以及16个修改的变换系数。例如，当帧内预测模式是基于对角线方向(图9中的模式34)的水平方向(图9中的模式2到34)时，修改的变换系数可以在水平方向上布置，即，在行第一方向上，如图7的(a)所示。当帧内预测模式是基于对角线方向的垂直方向(图9中的模式35到66)时，修改的变换系数可以在垂直方向上布置，即，在列第一方向上，如图7的(b)所示。
[0350]
在一个实施方式中，s1650可以包括对变换索引进行解码，基于变换索引(即，lfnst索引)确定其是否对应于应用逆rst的条件，当满足应用逆lfnst的条件时，选择变换
核矩阵并基于选择的变换核矩阵和/或简化因子对变换系数应用逆lfnst。在这种情况下，可以基于简化因子来确定简化逆变换矩阵的大小。
[0351]
参照s1650，可以确认，基于目标块的变换系数的逆lfnst来推导出目标块的残差样本。关于逆变换矩阵的大小，一般逆变换矩阵的大小为n
×
n，而逆lfnst矩阵的大小被缩减为n
×
r，因此与执行一般变换时相比，在执行逆lfnst时可以使存储器占用减少r/n比率。此外，与当使用一般逆变换矩阵时的乘法运算的数量n
×
n相比，当使用逆lfnst矩阵时，可以将乘法运算的数量减少r/n比率(到n
×
r)。另外，由于在应用逆lfnst时仅需要解码r个变换系数，所以与应用其中需要解码n个变换系数的一般逆变换相比，目标块的变换系数的总数量可以从n减小到r，因此增加解码效率。也就是说，根据1650，解码设备300的(逆)变换效率和解码效率可以通过逆lfnst增加。
[0352]
根据实施方式的解码设备300可以基于修改的变换系数的逆一次变换来推导目标块的残差样本(s1660)。
[0353]
另一方面，当不应用lfnst时，如下在逆变换过程中可以仅应用基于mts的一次逆变换过程。也就是说，解码设备可以如在上述实施方式中那样确定lfnst是否被应用于当前块，并且当没有应用lfnst时，解码设备可以通过一次逆变换从变换系数推导出残差样本。
[0354]
如图16所示，当在当前块的除了位于左上的第一区域之外的第二区域中存在有效系数时，确定未应用lfnst，并且解码设备通过一次逆变换从变换系数中推导残差样本。
[0355]
一次逆变换过程可以被称为逆一次变换过程或逆mts变换过程。在一些情况下也可以省略这种基于mts的一次逆变换过程。
[0356]
另外，可以将简化的逆变换应用于逆一次变换，或者可以使用常规的可分离的变换。
[0357]
根据实施方式的解码设备300可以基于当前块的残差样本和当前块的预测样本生成重构样本(s1670)。
[0358]
提供以下附图以描述本公开的具体示例。由于在附图中示出的装置的特定名称或特定信号/消息/字段的名称是为了例示而提供的，所以本公开的技术特征不限于在以下附图中使用的特定名称。
[0359]
图17是例示根据本公开的实施方式的视频编码设备的操作的流程图。
[0360]
图17所示的每个操作可以由图2所示的编码设备200执行。具体地，s1710可以由图2所示的预测器执行，s1720可以由由图2所示的减法器231执行，s1730至s1750可以由图2所示的变换器232执行，并且s1760可以由图2所示的量化器233和熵编码器240执行。根据s1710至s1760的操作基于在图4至图15中描述的内容中的一些。因此，将省略或将简要描述与上文参照图2和图4至图15解释的那些细节重叠的具体细节的描述。
[0361]
根据实施方式的编码设备200可以基于应用于当前块的帧内预测模式来推导预测样本(s1710)。
[0362]
根据实施方式的编码设备200可以基于预测样本来推导当前块的残差样本(s1720)。
[0363]
根据实施方式的编码设备200可以基于残差样本的一次变换来推导目标块的变换系数(s1730)。
[0364]
可以通过多个变换核来执行一次变换，并且在这种情况下，可以基于帧内预测模
式来选择变换核。
[0365]
编码设备200可以确定是否对当前块的变换系数执行二次变换或不可分离的变换，特别是lfnst。
[0366]
当确定执行lfnst时，编码设备200可以基于当前块的位于左上的第一区域的变换系数和预定lfnst矩阵推导当前块的修改的变换系数(s1740)。
[0367]
编码设备200可以根据应用于当前块的帧内预测模式基于映射关系确定变换集，并且可以基于变换集中所包含的两个lfnst矩阵中的一个执行lfnst，即，不可分离的变换。
[0368]
如上所述，可以根据要变换的变换块的帧内预测模式确定多个变换集。应用于lfnst的矩阵与用于逆lfnst的矩阵具有转置关系。
[0369]
在一个示例中，lfnst矩阵可以是其中行的数量小于列的数量的非正方形矩阵。
[0370]
可以基于当前块的大小推导第一区域。例如，当当前块的高度和宽度大于或等于8时，第一区域是如图7的左侧所示的当前块的左上的8
×
8区域中的左上方、右上方和左下方的4
×
4区域。当当前块的高度和宽度不等于或大于8时，第一区域可以是当前块的左上的4
×
4区域，如图7的右侧所示。
[0371]
第一区域的变换系数可以根据当前块的帧内预测模式在垂直方向或水平方向上一维地布置以用于与lfnst矩阵的乘法运算。
[0372]
可以根据当前块的帧内预测模式在垂直或水平方向上布置第一区域的48个修改的变换系数或16个修改的变换系数。例如，如果帧内预测模式是基于对角线方向(图9中的模式34)的水平方向(图9中的模式2到34)，则变换系数可以在水平方向上布置，即，在行第一方向上，如图7的(a)所示。当帧内预测模式是基于对角线方向的垂直方向(图9中的模式35到66)时，修改的变换系数可以在垂直方向上布置，即，在列第一方向上，如图7的(b)所示。
[0373]
在一个示例中，lfnst可以基于简化的变换矩阵或变换核矩阵来执行，并且简化的变换矩阵可以是其中行数小于列数的非正方形矩阵。
[0374]
在一个实施方式中，s1740可以包括确定是否满足应用lfnst的条件，并且当满足应用lfnst的条件时，基于该确定生成和编码lfnst索引，选择变换核矩阵并且基于选择的变换核矩阵和/或简化因子将lfnst应用于残差样本。在这种情况下，可以基于简化因子来确定简化变换矩阵的大小。
[0375]
参见s1740，可以确认，目标块的变换系数是基于针对残差样本的lfnst来推导的。关于变换核矩阵的大小，一般变换核矩阵的大小是n
×
n，而简化的变换矩阵的大小被缩减为r
×
n，因此与执行一般变换时相比，在执行rst时可以使存储器占用减少r/n比率。此外，与当使用一般变换矩阵时的乘法运算的数量n
×
n相比，当使用简化的变换核矩阵时，可以将乘法运算的数量减少r/n比率(到n
×
r)。另外，由于在应用rst时仅需要推导r个变换系数，所以与应用其中推导n个变换系数的一般变换相比，目标块的变换系数的总数量可以从n减小到r，因此减少由编码设备200发送到解码设备300的数据量。也就是说，根据s1740，编码设备200的变换效率和编码效率可以通过lfnst增加。
[0376]
此外，根据示例，编码设备可以将当前块的其中不存在修改的变换系数的第二区域清零(s1750)。
[0377]
如图13和图14所示，当前块的其中不存在修改的变换系数的所有其余区域可以被
视为零。由于清零，执行整个变换过程所需的计算量被减少，并且整个变换过程所需的计算量被减少，由此降低了执行变换所需的功耗。另外，可以通过减小变换过程中所涉及的延迟来增加图像编码效率。
[0378]
另一方面，当不应用lfnst时，如下在变换过程中可以仅应用基于mts的一次变换过程。也就是说，编码设备可以如在上述实施方式中那样确定lfnst是否被应用于当前块，并且当没有应用lfnst时，编码设备可以通过一次变换从残差样本推导出变换系数。
[0379]
该一次变换过程可以被称为一次变换过程或mts变换过程。在一些情况下也可以省略这种基于mts的一次变换过程。
[0380]
根据实施方式的编码设备200可以通过基于目标块的修改的变换系数执行量化来推导量化变换系数，并且可以对关于量化变换系数和lfnst索引的信息进行编码(s1760)。也就是说，编码设备可以生成包括关于量化变换系数的信息的残差信息。残差信息可以包括上述变换相关信息/语法元素。编码设备可以对包括残差信息的图像/视频信息进行编码并且以比特流的形式输出编码的图像/视频信息。
[0381]
更具体地，编码设备200可以生成关于量化变换系数的信息并且对关于所生成的量化变换系数的信息进行编码。
[0382]
在一个示例中，关于量化变换系数的信息可以包括关于是否应用lfnst的信息、关于简化因子的信息、关于应用lfnst的最小变换大小的信息和关于应用lfnst的最大变换大小的信息中的至少一者。
[0383]
此外，编码设备200可以在序列参数集层级编码关于最大变换应用块的大小的信息，例如，诸如sps_max_luma_transform_size_64_flag之类的标志信息。
[0384]
在本公开中，可以省略量化/解量化和/或变换/逆变换中的至少一者。当省略量化/解量化时，可以将量化变换系数称为变换系数。当省略变换/逆变换时，变换系数可以被称为系数或残差系数，或者为了表述一致性仍可以被称为变换系数。
[0385]
另外，在本公开中，量化变换系数和变换系数可以分别被称为变换系数和缩放变换系数。在此情况下，残差信息可以包括关于变换系数的信息，并且可以通过残差编码语法发信号通知关于变换系数的信息。可以基于残差信息(或关于变换系数的信息)来推导变换系数，并且可以通过变换系数的逆变换(缩放)来推导缩放变换系数。可以基于缩放变换系数的逆变换(变换)来推导残差样本。这些细节也可以在本公开的其它部分中应用/表达。
[0386]
在上述实施方式中，借助于一系列步骤或方框基于流程图解释了方法，但是本公开不限于步骤的顺序，并且可以按与上述顺序或步骤不同的顺序或步骤来执行某一步骤，或某一步骤与其它步骤并发地执行。此外，本领域普通技术人员可以理解，流程图中所示的步骤不是排它的，并且在不影响本公开的范围的情况下，可以并入另一步骤或者可以删除流程图中的一个或更多个步骤。
[0387]
根据本公开的上述方法可以被实现为软件形式，并且根据本公开的编码设备和/或解码设备可以被包括在诸如电视、计算机、智能电话、机顶盒和显示装置等之类的用于图像处理的设备中。
[0388]
当本公开中的实施方式通过软件来实施时，上述方法可以被实施为用于执行上述功能的模块(步骤、功能等)。这些模块可以存储在存储器中并且可以由处理器执行。存储器可以在处理器内部或外部，并且可以以各种众所周知的方式连接到处理器。处理器可以包
括专用集成电路(asic)、其它芯片组、逻辑电路和/或数据处理装置。存储器可以包括只读存储器(rom)、随机存取存储器(ram)、闪存、存储卡、存储介质和/或其它存储装置。也就是说，本公开中描述的实施方式可以在处理器、微处理器、控制器或芯片上实施和执行。例如，每个附图中所示的功能单元可以在计算机、处理器、微处理器、控制器或芯片上实施和执行。
[0389]
此外，应用本公开的解码设备和编码设备可以包括在多媒体广播收发器、移动通信终端、家庭影院视频装置、数字影院视频装置、监控相机、视频聊天装置、实时通信装置(诸如视频通信)、移动流装置、存储介质、摄像机、视频点播(vod)服务提供装置、顶置(ott)视频装置、互联网流服务提供装置、三维(3d)视频装置、视频电话视频装置、和医疗视频装置，并且可以用于处理视频信号或数据信号。例如，顶置(ott)视频装置可以包括游戏机、蓝光播放器、互联网接入tv、家庭影院系统、智能电话、平板pc、数字视频记录仪(dvr)等。
[0390]
另外，应用本公开的处理方法可以以由计算机执行的程序的形式来生产，并且可以存储在计算机可读记录介质中。具有根据本公开的数据结构的多媒体数据也可以存储在计算机可读记录介质中。计算机可读记录介质包括存储计算机可读数据的各种存储装置和分布式存储装置。计算机可读记录介质可以包括例如蓝光盘(bd)、通用串行总线(usb)、rom、prom、eprom、eeprom、ram、cd-rom、磁带、软盘和光学数据存储装置。此外，计算机可读记录介质包括以载波(例如，互联网上的传输)形式实施的介质。另外，通过编码方法所生成的比特流可以存储在计算机可读记录介质中，或者通过有线或无线通信网络来传输。另外，本公开的实施方式可以通过程序代码被实施为计算机程序产品，并且程序代码可以按照本公开的实施方式在计算机上执行。程序代码可以存储在计算机可读载体上。
[0391]
图18例示了应用本公开的内容流系统的结构。
[0392]
此外，应用本公开的内容流系统可以大致包括编码服务器、流服务器、web服务器、媒体存储装置、用户设备和多媒体输入装置。
[0393]
编码服务器用于将从诸如智能电话、相机、摄像机等的多媒体输入装置输入的内容压缩成数字数据以生成比特流，并且向流服务器发送它。作为另一示例，在诸如智能电话、相机、摄像机等的多媒体输入装置直接生成比特流的情况下，可以省略编码服务器。可以通过应用本公开的编码方法或比特流生成方法来生成比特流。并且流服务器可以在发送或接收比特流的过程期间临时存储比特流。
[0394]
流服务器基于用户的请求通过web服务器向用户装置发送多媒体数据，web服务器用作向用户通知存在什么服务的器具。当用户请求用户想要的服务时，web服务器将请求传送至流服务器，并且流服务器向用户发送多媒体数据。在此而言，内容流系统可以包括单独的控制服务器，并且在这种情况下，控制服务器用于控制内容流系统中的相应装置之间的命令/响应。
[0395]
流服务器可以从媒体存储装置和/或编码服务器接收内容。例如，在从编码服务器接收内容的情况下，可以实时地接收内容。在这种情况下，为了平稳地提供流服务，流服务器可以存储比特流达预定时间。
[0396]
例如，用户装置可以包括移动电话、智能电话、膝上型计算机、数字广播终端、个人数字助理(pda)、便携式多媒体播放器(pmp)、导航仪、板式pc、平板pc、超级本、可穿戴装置(例如，手表型终端(智能手表)、眼镜型终端(智能眼镜)、头戴式显示器(hmd))、数字tv、台
式计算机、数字标牌等。内容流系统中的各个服务器可以作为分布式服务器操作，并且在这种情况下，由各个服务器接收到的数据可以用分布式方式进行处理。
[0397]
本文所公开的权利要求可以以各种方式组合。例如，本公开的方法权利要求的技术特征可以被组合以在设备中实现或执行，并且设备权利要求的技术特征可以被组合以在方法中实现或执行。此外，方法权利要求和设备权利要求的技术特征可以被组合以在设备中实现或执行，并且方法权利要求和设备权利要求的技术特征可以被组合以在方法中实现或执行。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：视频译码中的时间运动矢量预测候选的推导的制作方法

基于变换的图像编码方法及其装置与流程

相关文献

最热文献