一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种熵编码方法及装置与流程

2022-02-20 19:52:29 来源:中国专利 TAG:


1.本技术属于图像处理的技术领域,尤其涉及一种熵编码方法及装置。


背景技术:

2.熵编码即编码过程中按熵原理不丢失任何信息的编码。信息熵为信源的平均信息量(不确定性的度量)。常见的熵编码有:香农编码、哈夫曼编码和算术编码。熵编码是根据字符被预估的概率来进行编码,预估概率越准确,文件压缩比则越高。
3.由于现有的熵编码无法充分估计每个字符的概率。使得现有的熵编码的编码效率较低,进而导致图像压缩效果较差。


技术实现要素:

4.有鉴于此,本技术实施例提供了一种熵编码方法及装置,用于提高熵编码的编码效率,进而提高图像压缩效果。
5.本技术实施例的第一方面提供了一种熵编码方法,方法包括:
6.获取第一特征图,第一特征图为对待压缩图像进行卷积、量化和归一化后的特征图;
7.采用预设切分策略对第一特征图进行多次切分,得到多个子特征图,每次切分后的两个子特征图中的一个子特征图预测另一个子特征图包含的各个字符的概率的准确率大于等于预设准确率;
8.在对第一特征图进行多次切分的过程中,采用预设概率算法根据每次切分后的两个子特征图中的一个子特征图、第一卷积块、第二卷积块和深度学习模型获得多个概率图;其中,每个特征图是根据每次切分后的两个子特征图中的一个子特征图与第一卷积块、第二卷积块或深度学习模型确定的;
9.对多个子特征图和多个概率图进行算术编码,得到熵解码后的文件。
10.本技术实施例的第二方面提供了一种熵编码装置,装置包括:
11.获取单元,用于获取第一特征图,第一特征图为对待压缩图像进行卷积、量化和归一化后的特征图;
12.切分单元,用于采用预设切分策略对第一特征图进行多次切分,得到多个子特征图,每次切分后的两个子特征图中的一个子特征图预测另一个子特征图包含的各个字符的概率的准确率大于等于预设准确率;
13.计算单元,用于在对第一特征图进行多次切分的过程中,采用预设概率算法根据每次切分后的两个子特征图中的一个子特征图、第一卷积块、第二卷积块和深度学习模型获得多个概率图;其中,每个特征图是根据每次切分后的两个子特征图中的一个子特征图与第一卷积块、第二卷积块或深度学习模型确定的;
14.编码单元,用于对多个子特征图和多个概率图进行算术编码,得到熵解码后的文件。
15.本技术实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述第一方面方法的步骤。
16.本技术实施例的第四方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述第一方面方法的步骤。
17.本技术实施例与现有技术相比存在的有益效果是:相较于每次将特征图切分成多个子特征图,降低了多个子特征图之间的相关性,导致多个子特征图中的任意一个子特征图无法准确预测其他的子特征图包含的各个字符的概率,降低熵编码的编码效率,进而降低图像压缩效果。在本技术中,获取第一特征图,采用预设切分策略对第一特征图进行多次切分,得到多个子特征图。在对第一特征图进行多次切分的过程中,采用预设概率算法根据每次切分后的两个子特征图中的一个子特征图、第一卷积块、第二卷积块和深度学习模型获得多个概率图,对多个子特征图和多个概率图进行算术编码,得到熵解码后的文件。由于每次切分后的两个子特征图中的一个子特征图预测另一个子特征图包含的各个字符的概率的准确率大于等于预设准确率,换句话说,每次切分后的两个子特征图中的一个子特征图能够准确预测另一个子特征图包含的各个字符的概率,因此有助于提高熵编码的编码效率,进而提高图像压缩效果。
附图说明
18.为了更清楚地说明本技术实施例或背景技术中的技术方案,下面将对本技术实施例或背景技术中所需使用的附图进行说明。
19.图1示出了本技术提供的一种熵编码方法的示意性流程图;
20.图2示出了本技术提供的一种熵编码方法中步骤102的具体示意性流程图;
21.图3示出了本技术提供的一种熵编码方法中步骤103的具体示意性流程图;
22.图4示出了本技术提供的另一种熵编码方法的示意性流程图;
23.图5示出了本技术提供的一种熵解码方法的示意性流程图;
24.图6示出了本技术提供的一种熵编码装置的示意图;
25.图7示出了本技术一实施例提供的一种终端设备的示意图。
具体实施方式
26.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
27.本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
28.在本技术中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以
包含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本技术所描述的实施例可以与其它实施例相结合。
29.请参见图1,图1示出了本技术提供的一种熵编码方法的示意性流程图,该方法包括步骤101-104,具体如下:
30.101,熵编码装置获取第一特征图,第一特征图为对待压缩图像进行卷积、量化和归一化后的特征图。
31.图像压缩是指对待压缩图像的数据矩阵经过分析变换,得到的新的数据矩阵,并将新的数据矩阵进行无损压缩。图像压缩的目的就是减少表示图片信息的数据矩阵中的冗余量,即将像素矩阵转变成在统计学层面上无相关关系的新的数据分布。这种以较少的存储空间完全或者部分地表示原图像的数据矩阵的方法,也被称作图像的编码技术。
32.本实例中的熵编码装置通过卷积、量化和归一化不断地变换待压缩图像的数据矩阵,将待压缩图像的数据矩阵进行一定程度的缩小,得到待压缩图像对应的第一特征图。而待压缩图像对应的第一特征图中的数据矩阵具有更多规律以及更具有执行空间的数据矩阵。第一特征图中的数据矩阵与待压缩图像的数据矩阵相比,相当于对数据进行降维。第一特征图中的数据矩阵相较于原图片具有尺寸更小、信息熵更小、更适用于二进制编码。
33.102,熵编码装置采用预设切分策略对第一特征图进行多次切分,得到多个子特征图,每次切分后的两个子特征图中的一个子特征图预测另一个子特征图包含的各个字符的概率的准确率大于等于预设准确率。
34.由于在第一特征图中,上半部分图像和下半部分图像之间存在大量的关联性,左半部分图像和右半部分图像之间存在大量的关联性,即图像的上下文关系。故本实施例中的熵编码装置采用预设切分策略对第一特征图进行多次切分,得到多个子特征图,以计算子特征图之间的关联性。其中,每次切分后得到的子特征图,有且仅有两张子特征图,且每次切分后的一个子特征图能够准确预测另一个子特征图包含的各个字符的概率。
35.需要强调的是,经过每次切分操作后,得到的两个子特征图可以是相等大小的特征图(即均等切分),也可以是不相等大小的特征图(即非均等切分),在此不做任何限定。为了便于说明,在本实施例中,熵编码装置采用的切分方式为均等切分。
36.在一些可能的实施例中,熵编码装置采用预设切分策略对第一特征图进行多次切分,得到多个子特征图,包括:
37.采用预设切分策略对第一特征图沿两个切分方向进行交替切分,得到多个子特征图。
38.请参见图2,图2示出了本技术提供的一种熵编码方法中步骤采用预设切分策略对第一特征图沿两个切分方向进行交替切分,得到多个子特征图的具体示意性流程图,包括步骤1021-1026,具体如下:
39.1021,熵编码装置对第一特征图沿第一预设方向进行第一次切分,得到第一子特征图和第二子特征图。
40.第一预设方向包括但不限于以高为方向、以宽为方向、以对角线为方向或者以函数式表达式的斜率为方向等等。其中,第一预设方向的形状包括但不限于直线、曲线或者不规则线条等。为了更好的说明本实施的技术方案,本实施例以高的方向作为第一预设方向,
即第一预设方向为特征图的高度方向,进行解释说明。
41.1022,熵编码装置对第一子特征图沿第二预设方向进行第二次切分,得到第三子特征图和第四子特征图。
42.第二预设方向包括但不限于以高为方向、以宽为方向、以对角线为方向或者以函数式表达式的斜率为方向等等。其中,第二预设方向的形状包括但不限于直线、曲线或者不规则线条等。为了更好的说明本实施的技术方案,本实施例以宽的方向作为第二预设方向,即第二预设方向为特征图的宽度方向,进行解释说明。
43.1023,熵编码装置对第三子特征图沿第一预设方向进行第三次切分,得到第五子特征图和第六子特征图。
44.1024,熵编码装置对第五子特征图沿第二预设方向进行第四次切分,得到第七子特征图和第八子特征图。
45.1025,熵编码装置对第七子特征图沿第一预设方向进行第五次切分,得到第九子特征图和第十子特征图。
46.1026,熵编码装置对第九子特征图沿第二预设方向进行第六次切分,得到第十一子特征图和第十二子特征图,第一子特征图、第二子特征图、第三子特征图、第四子特征图、第五子特征图、第六子特征图、第七子特征图、第八子特征图、第九子特征图、第十子特征图、第十一子特征图和第十二子特征图为多个子特征图。
47.作为本技术的一个实施例,预设切分策略对应的切分次数可根据具体场景设定,例如:若待压缩图像中的内容信息较为复杂,可将切分次数设置为较多次。若待压缩图像中的内容信息较为简单,可将切分次数设置为较少次。
48.需要强调的是,熵编码装置对于相邻的两次切分操作的切分方向,分别是以高和宽为切分方向交替进行更换。即若当前次切分操作,按照第一预设方向切分,则与当前次切分操作相邻的下一次切分操作,按照第二预设方向切分。
49.优选地,相同切分方向的切分对象,必须是同一侧的子特图。例如:假设第一子特征图为第一特征图的左半部分图像,第二子特征图为第一特征图的右半部分图像。第三子特征图为第一子特征图的上半部分图像,第四子特征图为第一子特征图的下半部分图像。在后续的切分操作时,按照第一预设方向切分的对象,必须都是处于左侧的子特征图。按照第二预设方向切分的对象,必须都是处于上侧的子特征图。
50.103,熵编码装置在对第一特征图进行多次切分的过程中,采用预设概率算法根据每次切分后的两个子特征图中的一个子特征图、第一卷积块、第二卷积块和深度学习模型获得多个概率图;其中,每个特征图是根据每次切分后的两个子特征图中的一个子特征图与第一卷积块、第二卷积块或深度学习模型确定的。
51.预设概率算法包括但不限于神经网络模型或一切可计算特征图对应的概率图的模型等。本实施例中的熵编码装置通过预设概率算法,计算多个子特征图各自对应的多个概率图。概率图用于表示概率图对应的子特征图中每个字符出现的概率分布。
52.由于根据不同切分方向,切分得到的子特征图的长宽比不同,故本实施例中的熵编码装置采用不同的卷积核对不同切分方向的子特征图,进行卷积处理。例如:当特征图的长宽比为4:2。若以高为方向对特征图进行切分,则得到的子特征图像的长宽比为2:2。若以高为方向对特征图进行切分,则得到的子特征图像的长宽比为4:1。由于长宽比不同的卷积
核,在长和宽上的特征提取能力不同。为了更好得适应不同长宽比的子特征图。故本实例对于通过不同切分方向,得到的子特征图,采用不同的卷积核进行卷积计算。
53.故本实施例中的熵编码装置采用两种卷积块,分别对不同切分方向,得到的子特征图进行卷积运算。两种卷积块分别为第一卷积块和第二卷积块。其中,第一卷积块的卷积核大小为f1
×
f2,第二卷积块的卷积核大小为f2
×
f1(例如:当第一卷积块的卷积核大小为3
×
5,则第二卷积块的卷积核大小为5
×
3)。第一卷积块的步长大小与第二卷积块的步长大小相同。第一卷积块的填充大小为p1
×
p2,第二卷积块的填充大小为p2
×
p1(例如:当第一卷积块的填充大小为1
×
2,则第二卷积块的填充大小为2
×
1)。
54.请参见图3,图3示出了本技术提供的一种熵编码方法中步骤103的具体示意性流程图,包括步骤1031-1037,具体如下:
55.1031,熵编码装置将第一子特征图输入第一卷积块进行运算,输出第二子特征图对应的第一概率图。
56.由于第一子特征图和第二子特征图是由第一特征图通过第一预设方向切分而得。故第一子特征图和第二子特征图之间存在较强的关联性。故可将第一子特征图输入第一卷积块进行运算,输出第二子特征图对应的第一概率图。
57.示例性地,第一卷积块如表1所示,在第一卷积块中设置有四层卷积层。其中,第一卷积块的卷积核大小为3
×
5,步长大小为1,填充大小为1
×
2。表1中的第一卷积块仅仅起实例作用,对于第一卷积块中的参数以及函数的设定,并不做任何限定。
58.表1:
[0059][0060]
1032,熵编码装置将第三子特征图输入第二卷积块进行运算,输出第四子特征图对应的第二概率图。
[0061]
由于第三子特征图和第四子特征图是由第一子特征图通过第二预设方向切分而得。故第一子特征图和第二子特征图之间存在较强的关联性。故可将第三子特征图输入第二卷积块进行运算,输出第四子特征图对应的第二概率图。其中,由于步骤1031和1032对应的特征图是根据不同切分方向而得,故采用不同切分方向对应的卷积块,即第一卷积块和第二卷积块。
[0062]
示例性地,对应于如表1所示的第一卷积块,第二卷积块如表2所示,在第二卷积块中设置有四层卷积层。其中,第一卷积块的卷积核大小为5
×
3,步长大小为1,填充大小为2
×
1。表2中的第二卷积块仅仅起实例作用,对于第二卷积块中的参数以及函数的设定,并不做任何限定。
[0063]
表2:
[0064][0065]
其中,表1和表2中所示卷积核大小不同,以增强第一卷积块和第二卷积块在不同方向上的特征提取能力。
[0066]
1033,熵编码装置将第五子特征图输入第一卷积块进行运算,输出第六子特征图对应的第三概率图。
[0067]
由于第五子特征图和第六子特征图是由第三子特征图通过第一预设方向切分而得。故第五子特征图和第六子特征图之间存在较强的关联性。故可将第五子特征图输入第一卷积块进行运算,输出第六子特征图对应的第三概率图。
[0068]
1034,熵编码装置将第七子特征图输入第二卷积块进行运算,输出第八子特征图对应的第四概率图。
[0069]
由于第七子特征图和第八子特征图是由第五子特征图通过第二预设方向切分而得。故第七子特征图和第八子特征图之间存在较强的关联性。故可将第七子特征图输入第
二卷积块进行运算,输出第八子特征图对应的第四概率图。
[0070]
1035,熵编码装置将第九子特征图输入第一卷积块进行运算,输出第十子特征图对应的第五概率图。
[0071]
由于第九子特征图和第十子特征图是由第七子特征图通过第一预设方向切分而得。故第九子特征图和第十子特征图之间存在较强的关联性。故可将第九子特征图输入第一卷积块进行运算,输出第十子特征图对应的第五概率图。
[0072]
1036,熵编码装置将第十一子特征图输入第二卷积块进行运算,输出第十二子特征图对应的第六概率图。
[0073]
由于第十一子特征图和第十二子特征图是由第九子特征图通过第二预设方向切分而得。故第十一子特征图和第十二子特征图之间存在较强的关联性。故可将第十一子特征图输入第二卷积块进行运算,输出第十二子特征图对应的第六概率图。
[0074]
1037,熵编码装置将第十一子特征图输入深度学习模型进行处理,输出第十一子特征图对应的第七概率图,第一概率图、第二概率图、第三概率图、第四概率图、第五概率图、第六概率图和第七概率图为多个概率图。
[0075]
由于第十一子特征作为最后一个子特征图,无法用其他子特征图得到它的概率图。故本实施例通过将第十一子特征图输入深度学习模型进行处理,输出第十一子特征图对应的第七概率图。由深度学习模型中的参数,得到第七概率图。其中,深度学习模型包括但不限于一切可训练参数的模型。
[0076]
104,熵编码装置对多个子特征图和多个概率图进行算术编码,得到熵解码后的文件。
[0077]
熵编码是指编码过程中按熵原理不丢失任何信息的编码。信息熵为信源的平均信息量(不确定性的度量)。常见的熵编码有:香农编码、哈夫曼编码和算术编码。
[0078]
优选地,本实施例中的熵编码装置采用算术编码对多个子特征图和多个概率图进行编码运算,得到熵解码后的文件。其中,算术编码可以简单的分为固定长度编码和变动长度编码。固定长度编码就是在编码时对所有需要编码的数值使用相同的存储位数。变动长度编码则会考虑待编码矩阵的分布情况,尽可能地用较小的编码位数编码出现次数越多的符号。相对地出现次数较少的数值分配相对较大的码字,这样相较于固定长度编码,可以显著地减少存储所需要的空间。这种变动长度的编码方式也叫做熵编码,它可以把经过变换得到的数据矩阵,以尽可能减少的信息量存储量。
[0079]
具体地,熵编码装置对多个子特征图和多个概率图进行算术编码过程如下:将多个子特征图中图像特征对应的特征值,合并为第一数组。将多个概率图的概率值,合并为第二数组。对第一数组和第二数组进行算术编码,得到熵解码后的文件。
[0080]
在本实施例中,相较于每次将特征图切分成多个子特征图,降低了多个子特征图之间的相关性,导致多个子特征图中的任意一个子特征图无法准确预测其他的子特征图包含的各个字符的概率,降低熵编码的编码效率,进而降低图像压缩效果。在本技术中,获取第一特征图,采用预设切分策略对第一特征图进行多次切分,得到多个子特征图。在对第一特征图进行多次切分的过程中,采用预设概率算法根据每次切分后的两个子特征图中的一个子特征图、第一卷积块、第二卷积块和深度学习模型获得多个概率图,对多个子特征图和多个概率图进行算术编码,得到熵解码后的文件。由于每次切分后的两个子特征图中的一
个子特征图预测另一个子特征图包含的各个字符的概率的准确率大于等于预设准确率,换句话说,每次切分后的两个子特征图中的一个子特征图能够准确预测另一个子特征图包含的各个字符的概率,因此有助于提高熵编码的编码效率,进而提高图像压缩效果。
[0081]
请参见图4,图4示出了本技术提供的另一种熵编码方法的示意性流程图,该熵编码方法包括步骤401-407,具体如下:
[0082]
401,熵编码装置将待压缩图像输入编码网络进行处理,输出第二特征图。
[0083]
熵编码装置将待压缩图像输入编码网络,通过编码网络进行特征提取,得到由编码网络输出的第二特征图。
[0084]
402,熵编码装置对第二特征图进行量化,得到第三特征图。
[0085]
熵编码装置通过量化处理将第二特征图的矩阵数据进行取整操作,得到第三特征图。
[0086]
403,熵编码装置对第三特征图进行归一化,得到第一特征图。
[0087]
熵编码装置对第三特征图进行归一化处理,将第三特征图的数据矩阵化为无量纲的表达式,成为标量,得到第一特征图。
[0088]
404,熵编码装置获取第一特征图,第一特征图为对待压缩图像进行卷积、量化和归一化后的特征图。
[0089]
405,熵编码装置采用预设切分策略对第一特征图进行多次切分,得到多个子特征图,每次切分后的两个子特征图中的一个子特征图预测另一个子特征图包含的各个字符的概率的准确率大于等于预设准确率。
[0090]
406,熵编码装置在对第一特征图进行多次切分的过程中,采用预设概率算法根据每次切分后的两个子特征图中的一个子特征图、第一卷积块、第二卷积块和深度学习模型获得多个概率图;其中,每个特征图是根据每次切分后的两个子特征图中的一个子特征图与第一卷积块、第二卷积块或深度学习模型确定的。
[0091]
407,熵编码装置对多个子特征图和多个概率图进行算术编码,得到熵解码后的文件。
[0092]
需要说明的是,本实施例中步骤404至步骤407,与图1所示实施例中步骤101至步骤104相同,具体请参阅图1所示实施例中步骤101至步骤104的相关描述,此处不赘述。
[0093]
在本实施例中,由于待压缩图像的冗余信息较多,故通过将待压缩图像输入编码网络进行处理,输出第二特征图;对第二特征图进行量化,得到第三特征图;对第三特征图进行归一化,得到第一特征图。第一特征图相较待压缩图像尺寸更小,同时信息熵也更小。因此有助于提高熵编码的编码效率,进而提高图像压缩效果。
[0094]
请参见图5,图5示出了本技术提供的一种熵解码方法的示意性流程图,该熵解码包括步骤501-5023,具体如下:
[0095]
501,熵解码装置对深度学习模型进行加载,得到第七概率图。
[0096]
502,熵解码装置对第七概率图和熵编码后的文件进行算术解码,得到第十一子特征图。
[0097]
503,熵解码装置将第十一子特征图输入第二卷积块进行运算,得到第十二子特征图对应的第六概率图。
[0098]
504,熵解码装置对第六概率图和熵编码后的文件进行算术解码,得到第十二子特
征图。
[0099]
505,熵解码装置对第十一子特征图和第十二子特征图进行合并,得到第九子特征图。
[0100]
506,熵解码装置将第九子特征图输入第一卷积块进行运算,得到第十子特征图对应的第五概率图。
[0101]
507,熵解码装置对第五概率图和熵编码后的文件进行算术解码,得到第十子特征图。
[0102]
508,熵解码装置对第九子特征图和第十子特征图进行合并,得到第七子特征图。
[0103]
509,熵解码装置将第七子特征图输入第二卷积块进行运算,得到第八子特征图对应的第四概率图。
[0104]
510,熵解码装置对第四概率图和熵编码后的文件进行算术解码,得到第八子特征图。
[0105]
511,熵解码装置对第七子特征图和第八子特征图进行合并,得到第五子特征图。
[0106]
512,熵解码装置将第五子特征图输入第一卷积块进行运算,得到第六子特征图对应的第三概率图。
[0107]
513,熵解码装置对第三概率图和熵编码后的文件进行算术解码,得到第六子特征图。
[0108]
514,熵解码装置对第五子特征图和第六子特征图进行合并,得到第三子特征图。
[0109]
515,熵解码装置将第三子特征图输入第二卷积块进行运算,得到第四子特征图对应的第二概率图。
[0110]
516,熵解码装置对第二概率图和熵编码后的文件进行算术解码,得到第四子特征图。
[0111]
517,熵解码装置对第三子特征图和第四子特征图进行合并,得到第一子特征图。
[0112]
518,熵解码装置将第一子特征图输入第一卷积块进行处理,得到第二子特征图对应的第一概率图。
[0113]
519,熵解码装置对第一概率图和熵编码后的文件进行算术解码,得到第二子特征图。
[0114]
520,熵解码装置对第一子特征图和第二子特征图进行合并,得到第一特征图。
[0115]
521,熵解码装置对第一特征图进行反归一化,得到第三特征图。
[0116]
522,熵解码装置对第三特征图进行反量化,得到第二特征图。
[0117]
523,熵解码装置将第二特征图输入解码网络进行处理,输出待压缩图像。
[0118]
在本实施中,根据多个子特征图、多个概率图以及熵编码后的文件,实现对待压缩图像的解压过程。使得待压缩图像可实现图像压缩和图像解压的处理方式。
[0119]
请参见图6,图6示出了本技术提供的一种熵编码装置的示意图,该熵编码装置6包括:
[0120]
获取单元61,用于获取第一特征图,第一特征图为对待压缩图像进行卷积、量化和归一化后的特征图。
[0121]
切分单元62,用于采用预设切分策略对第一特征图进行多次切分,得到多个子特征图,每次切分后的两个子特征图中的一个子特征图预测另一个子特征图包含的各个字符
的概率的准确率大于等于预设准确率。
[0122]
计算单元63,用于在对第一特征图进行多次切分的过程中,采用预设概率算法根据每次切分后的两个子特征图中的一个子特征图、第一卷积块、第二卷积块和深度学习模型获得多个概率图;其中,每个特征图是根据每次切分后的两个子特征图中的一个子特征图与第一卷积块、第二卷积块或深度学习模型确定的;
[0123]
编码单元64,用于对多个子特征图和多个概率图进行算术编码,得到熵解码后的文件。
[0124]
在采用预设切分策略对第一特征图进行多次切分,得到多个子特征图方面,切分单元62具体用于:
[0125]
采用预设切分策略对第一特征图沿两个切分方向进行交替切分,得到多个子特征图。
[0126]
在采用预设切分策略对第一特征图沿两个切分方向进行交替切分,得到多个子特征图方面,切分单元62具体用于:
[0127]
对第一特征图沿第一预设方向进行第一次切分,得到第一子特征图和第二子特征图;
[0128]
对第一子特征图沿第二预设方向进行第二次切分,得到第三子特征图和第四子特征图;
[0129]
对第三子特征图沿第一预设方向进行第三次切分,得到第五子特征图和第六子特征图;
[0130]
对第五子特征图沿第二预设方向进行第四次切分,得到第七子特征图和第八子特征图;
[0131]
对第七子特征图沿第一预设方向进行第五次切分,得到第九子特征图和第十子特征图;
[0132]
对第九子特征图沿第二预设方向进行第六次切分,得到第十一子特征图和第十二子特征图,第一子特征图、第二子特征图、第三子特征图、第四子特征图、第五子特征图、第六子特征图、第七子特征图、第八子特征图、第九子特征图、第十子特征图、第十一子特征图和第十二子特征图为多个子特征图。
[0133]
在采用预设概率算法根据每次切分后的两个子特征图中的一个子特征图、第一卷积块、第二卷积块和深度学习模型获得多个概率图方面,计算单元63具体用于:
[0134]
将第一子特征图输入第一卷积块进行运算,输出第二子特征图对应的第一概率图;
[0135]
将第三子特征图输入第二卷积块进行运算,输出第四子特征图对应的第二概率图;
[0136]
将第五子特征图输入第一卷积块进行运算,输出第六子特征图对应的第三概率图;
[0137]
将第七子特征图输入第二卷积块进行运算,输出第八子特征图对应的第四概率图;
[0138]
将第九子特征图输入第一卷积块进行运算,输出第十子特征图对应的第五概率图;
[0139]
将第十一子特征图输入第二卷积块进行运算,输出第十二子特征图对应的第六概率图;
[0140]
将第十一子特征图输入深度学习模型进行处理,输出第十一子特征图对应的第七概率图,第一概率图、第二概率图、第三概率图、第四概率图、第五概率图、第六概率图和第七概率图为多个概率图。
[0141]
熵编码装置6中的第一预设方向为特征图的高度方向,第二预设方向为特征图的宽度方向。第一卷积块的卷积核大小为f1
×
f2,第二卷积块的卷积核大小为f2
×
f1,第一卷积块的步长大小与第二卷积块的步长大小相同,第一卷积块的填充大小为p1
×
p2,第二卷积块的填充大小为p2
×
p1,f1、f2、p1和p2均为大于等于1的整数。
[0142]
熵编码装置6还包括:
[0143]
处理单元65,用于将待压缩图像输入编码网络进行处理,输出第二特征图;
[0144]
量化单元66,用于对第二特征图进行量化,得到第三特征图;
[0145]
归一化单元67,用于对第三特征图进行归一化,得到第一特征图。
[0146]
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本技术实施例的实施过程构成任何限定。
[0147]
图7示出了本技术一实施例提供的一种终端设备的示意图。如图7所示,该实施例的一种终端设备7包括:处理器70、存储器71以及存储在存储器71中并可在处理器70上运行的计算机程序72,例如一种图像压缩的程序。处理器70执行计算机程序72时实现上述各个一种熵编码方法实施例中的步骤,例如图1所示的步骤101至104。或者,处理器70执行计算机程序72时实现上述各装置实施例中各单元的功能,例如图6所示单元61至64。
[0148]
示例性的,计算机程序72可以被分割成一个或多个单元,一个或者多个单元被存储在存储器71中,并由处理器70执行,以完成本技术。一个或多个单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序72在一种终端设备7中的执行过程。例如,计算机程序72可以被分割成各单元具体功能如下:
[0149]
获取单元,用于获取第一特征图,第一特征图为对待压缩图像进行卷积、量化和归一化后的特征图;
[0150]
切分单元,用于采用预设切分策略对第一特征图进行多次切分,得到多个子特征图,每次切分后的两个子特征图中的一个子特征图预测另一个子特征图包含的各个字符的概率的准确率大于等于预设准确率;
[0151]
计算单元,用于在对第一特征图进行多次切分的过程中,采用预设概率算法根据每次切分后的两个子特征图中的一个子特征图、第一卷积块、第二卷积块和深度学习模型获得多个概率图;其中,每个特征图是根据每次切分后的两个子特征图中的一个子特征图与第一卷积块、第二卷积块或深度学习模型确定的;
[0152]
编码单元,用于对多个子特征图和多个概率图进行算术编码,得到熵解码后的文件。
[0153]
一种终端设备7可以是移动终端、桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。一种终端设备可包括,但不仅限于,处理器70、存储器71。本领域技术人员可以理解,图7仅仅是一种终端设备7的示例,并不构成对一种终端设备7的限定,可以包括比图
示更多或更少的部件,或者组合某些部件,或者不同的部件,例如一种终端设备还可以包括输入输出设备、网络接入设备、总线等。
[0154]
所称处理器70可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0155]
存储器71可以是一种终端设备7的内部存储单元,例如一种终端设备7的硬盘或内存。存储器71也可以是一种终端设备7的外部存储设备,例如一种终端设备7上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,存储器71还可以既包括一种终端设备7的内部存储单元也包括外部存储设备。存储器71用于存储计算机程序以及一种终端设备所需的其他程序和数据。存储器71还可以用于暂时地存储已经输出或者将要输出的数据。
[0156]
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本技术并不受所描述的动作顺序的限制,因为依据本技术,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本技术所必须的。
[0157]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0158]
在本技术所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
[0159]
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0160]
另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0161]
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本技术各个实施例上述方法的全部或部分
步骤。而前述的存储器包括:u盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0162]
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:read-only memory,简称:rom)、随机存取器(英文:random access memory,简称:ram)、磁盘或光盘等。
[0163]
以上对本技术实施例进行了详细介绍,本文中应用了具体个例对本技术的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本技术的方法及其核心思想;同时,对于本领域的一般技术人员,依据本技术的思想,在具体实现方式及应用范围上均会有改变之处,综上上述,本说明书内容不应理解为对本技术的限制。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献