一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

数据处理方法、装置、电子设备及介质与流程

2021-11-25 01:19:00 来源:中国专利 TAG:


1.本公开涉及计算机技术领域,尤其涉及芯片领域,具体涉及一种数据处理的方法、装置、电子设备、计算机可读存储介质和计算机程序产品。


背景技术:

2.人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术:人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
3.用于实现人工智能处理的芯片往往涉及大量的神经网络运算。随着人工智能技术的迭代,需要芯片能够具有高效处理复杂神经网络运算的能力。
4.在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。


技术实现要素:

5.本公开提供了一种数据处理的方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
6.根据本公开的一方面,提供了一种数据处理方法,包括:将输入特征图中的多个第一目标点存储于预设存储空间中,其中,多个第一目标点能够用于计算输出特征图中的至少一个第二目标点,并且针对至少一个第二目标点中的每一个第二目标点,多个第一目标点中的用于计算该第二目标点的至少一个第一目标点存储于预设存储空间中一段连续的存储区域内;以及针对至少一个第二目标点中的每一个第二目标点,通过以下计算来得到:确定第一存储地址,其中,第一存储地址为用于计算该第二目标点的至少一个第一目标点所在的存储区域的起始位置;根据第一存储地址,从预设存储空间中的一段连续的存储区域内读取该第二目标点所对应的至少一个第一目标点;以及利用所读取的至少一个第一目标点,执行针对该第二目标点的计算。
7.根据本公开的另一方面,提供了一种数据处理装置,包括:存入单元,被配置用于将输入特征图中的多个第一目标点存储于预设存储空间中,其中,多个第一目标点能够用于计算输出特征图中的至少一个第二目标点,并且针对至少一个第二目标点中的每一个第二目标点,多个第一目标点中的用于计算该第二目标点的至少一个第一目标点存储于预设存储空间中一段连续的存储区域内;以及计算单元,被配置用于针对至少一个第二目标点中的每一个第二目标点,执行计算,计算单元包括:确定子单元,被配置用于确定第一存储地址,其中,第一存储地址为用于计算该第二目标点的至少一个第一目标点所在的存储区域的起始位置;读取子单元,被配置用于根据第一存储地址,从预设存储空间中的一段连续
的存储区域内读取该第二目标点所对应的至少一个第一目标点;以及计算子单元,被配置用于利用所读取的至少一个第一目标点,执行针对该第二目标点的计算。
8.根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述方法。
9.根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行上述方法。
10.根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,其中,计算机程序在被处理器执行时实现上述方法。
11.根据本公开的一个或多个实施例,可以提升卷积计算的执行效率。
12.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
13.附图示例性地示出了实施例并且构成说明书的一部分,与说明书的文字描述一起用于讲解实施例的示例性实施方式。所示出的实施例仅出于例示的目的,并不限制权利要求的范围。在所有附图中,相同的附图标记指代类似但不一定相同的要素。
14.图1a示出了根据本公开的实施例一种数据处理方法的流程图;
15.图1b示出了根据本公开的实施例另一种数据处理方法的流程图;
16.图2示出了根据本公开的实施例一种输入特征图的存储模式示意图;
17.图3示出了根据本公开的实施例另一种输入特征图的存储模式示意图;
18.图4示出了根据本公开的实施例另一种输入特征图的存储模式示意图;
19.图5示出了根据本公开的实施例的数据处理装置的结构框图;
20.图6示出了能够用于实现本公开的实施例的示例性电子设备的结构框图。
具体实施方式
21.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
22.在本公开中,除非另有说明,否则使用术语“第一”、“第二”等来描述各种要素不意图限定这些要素的位置关系、时序关系或重要性关系,这种术语只是用于将一个元件与另一元件区分开。在一些示例中,第一要素和第二要素可以指向该要素的同一实例,而在某些情况下,基于上下文的描述,它们也可以指代不同实例。
23.在本公开中对各种示例的描述中所使用的术语只是为了描述特定示例的目的,而并非旨在进行限制。除非上下文另外明确地表明,如果不特意限定要素的数量,则该要素可以是一个也可以是多个。此外,本公开中所使用的术语“和/或”涵盖所列出的项目中的任何一个以及全部可能的组合方式。
24.卷积神经网络是一种包含卷积计算的神经网络,是深度学习的代表算法之一。卷
积神经网络中往往包含多个卷积层,其中,卷积层中的计算包括卷积计算,池化计算和激活计算等。例如,卷积层能够通过对输入特征图执行卷积计算来进行特征提取,并将计算得到的输出特征图传输至卷积神经网络的后续结构中进行进一步处理。卷积层内部包含一个或多个卷积核,其中的每一个卷积核在工作时,会基于相应的卷积计算的参数扫过输入特征图,在该卷积核的感受野内对输入特征图做矩阵元素乘法求和并叠加偏差量。
25.随着人工智能技术的不断迭代发展,卷积神经网络中的计算日趋复杂。复杂的计算带来了芯片中计算资源开销的增长和执行效率的降低。如何能够在满足当前计算需求的条件下,提供更加高效的计算方法是本领域迫切需要解决的问题。
26.相关技术中,为了提升计算的速度,往往通过在芯片中增设计算单元的方式提升芯片算力,然而,增设计算单元将不可避免地扩张芯片的尺寸,这无疑与当前对电子设备的小型化需求背道而驰,无法从根本上提升计算的执行效率。
27.基于此,本公开提供了一种数据处理方法,通过将输入特征图中的多个第一目标点存储于预设存储空间内的一段连续的存储区域中,使得在执行对这多个第一目标点所对应的输出特征图中的一个第二目标点的计算时,能够连续的读取该计算所需的该多个第一目标点,简化了计算中的数据读取过程,有效地提升了计算的执行效率。
28.本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
29.图1a和图1b示出了根据本公开实施例的一种数据处理方法,包括:步骤s101、将输入特征图中的多个第一目标点存储于预设存储空间中,其中,多个第一目标点能够用于计算输出特征图中的至少一个第二目标点,并且针对至少一个第二目标点中的每一个第二目标点,多个第一目标点中的用于计算该第二目标点的至少一个第一目标点存储于预设存储空间中一段连续的存储区域内;以及步骤s102、针对至少一个第二目标点中的每一个第二目标点,通过以下计算来得到:步骤s102

1、确定第一存储地址,其中,第一存储地址为用于计算该第二目标点的至少一个第一目标点所在的存储区域的起始位置;步骤s102

2、根据第一存储地址,从预设存储空间中的一段连续的存储区域内读取该第二目标点所对应的至少一个第一目标点;以及步骤s102

3、利用所读取的至少一个第一目标点,执行针对该第二目标点的计算。基于该数据处理方法能够简化计算中的数据读取过程,有效地提升了计算的执行效率。
30.根据一些实施例,计算可以为卷积计算。
31.以下仅以卷积计算为例进行说明,本领域技术人员应当知晓,上述数据处理方法也能够应用于卷积层的其它类型的计算中。
32.图2示出了根据本公开实施例的一种输入特征图的存储模式示意图。如图2所示,输入特征图210的通道数为c,每个通道层的宽度为w,高度为h,每个通道层中分布w
×
h个点,例如,在输入特征图210的第一通道层中的第一行分布000~00n共w个点(即输入特征图210中通道维度序数为1且高维度序数为1的w个点),第二行分布010~01n共w个点(即输入特征图210中通道维度序数为1且高维度序数为2的w个点),最后一行分布0m0~0mn共w个点(即输入特征图210中通道维度序数为1且高维度序数为h的w个点),其中,n=w

1,m=h

1,l=c

1。
33.在实际处理过程中,输入特征图在存储空间中常常以chw模式进行存储,例如,在
存储器220中,首先存储输入特征图210的第一通道层中的第一行的w个点(即输入特征图210中通道维度序数为1且高维度序数为1的w个点),再存储第一通道层中的第二行的w个点(即输入特征图210中通道维度序数为1且高维度序数为2的w个点),以此类推,直至将输入特征图210的第一通道层(即输入特征图210中通道维度序数为1的w
×
h个点)完整地存储在存储器220中之后,再按照与上述存储输入特征图210的第一通道层相同的方式,依次存储输入特征图210的后续通道层,直至将整个输入特征图存储在存储器220中。
34.申请人发现在chw模式下,在对输入特征图执行卷积计算时,输入特征图中用于计算输出特征图中的一个第二目标点的多个第一目标点处于离散存储的状态,即用于计算一个第二目标点的多个第一目标点在存储器中的存储地址不连续。
35.例如,如图2所示,假设卷积计算参数中的填充为0、卷积核的感受野为3*3,步长为1,在此情况下,用于计算输出特征图中对应通道层中的位于第一行的第一列的第二目标点(即输出特征图的对应通道层中宽维度序数为1且高维度序数为1的点)的输入特征图中的多个第一目标点为输入特征图210中阴影部分的多个点,即输入特征图210中的宽维度序数在1至3之间,且高维度序数在1至3之间的位于各个通道层的3*3*c个点。在存储器220中,上述阴影部分中的多个第一目标点(对应于存储器220中的阴影块)离散存储,具体地,上述输入特征图210的阴影部分的多个第一目标点中具有不同的高维度序数的点之间存在输入特征图210中的其它点,并且多个第一目标点中具有不同的通道维度序数的点之间也存在输入特征图210中的其它点,这就意味着,为了计算上述第二目标点而从存储器220中读取相应的多个第一目标点时,需要多次确定读取地址才能将在存储器220中离散存储的多个第一目标值全部读取出来。
36.基于此,本公开在步骤s101中对用于计算一个第二目标点的多个第一目标点在存储器中的存储方式进行优化,通过将用于计算一个第二目标点的多个第一目标点依次集中排布于预设存储空间中一段连续的存储区域内,使得在卷积计算的过程中,只需要确定该连续的存储区域的起始位置的地址,就能够一次性地从该预设存储空间中读取计算该第二目标点的所有第一目标点,有效地简化了卷积计算中的数据读取过程,提升了卷积计算的执行效率。
37.同时,在硬件设计上,因为地址连续使得硬件的状态及地址设计简化,在支持任意多路卷积时,能够保证硬件的并行执行效率。
38.根据一些实施例,预设存储空间可以为独立于存储输入特征图的存储器的一块预先设置的存储空间。
39.特别地,预设存储空间可以为context层。
40.根据一些实施例,至少一个第二目标点可以为位于输出特征图中的一个第二目标行中的多个点。由此,可以基于存储于预设存储空间中的多个第一目标点,计算得到输出特征图中的一整行的点,即第二目标行中的点,避免频繁更新预设存储空间中所存储的点,提升了整体处理效率。
41.其中,第二目标行为参与当前卷积计算的卷积核所对应的输出特征图中的对应通道层中的其中一行。
42.根据一些实施例,多个第一目标点可以为在输入特征图中的至少一个第一目标行中的多个点,至少一个第一目标行为根据第二目标行和卷积计算的参数而确定的。由此,基
于所要计算的输出特征图中的第二目标行,可以相应地确定需要存入预设存储空间中的输入特征图中的多个第一目标点。
43.其中,卷积计算的参数包括参与当前卷积计算的卷积核的感受野的大小和当前卷积计算的步长。
44.例如,如果卷积计算的参数中卷积核的感受野为3*3,为了计算输出特征图中的一个第二目标行中的多个点,需要从输入特征图中获取连续的三行点,以计算输出特征图中的该第二目标行。
45.根据一些实施例,将输入特征图中的多个第一目标点依次存储于预设存储空间中可以包括:针对多个第一目标点中的每一个第一目标点,令该第一目标点在预设存储空间中的存储次序与该第一目标点在输入特征图中的宽维度序数的大小正相关。
46.换言之,在预设存储空间中,宽维度序数相对较小的第一目标点总是存储在宽维度序数相对较大的第一目标点之前。由此,能够提供一种对多个第一目标点在预测存储空间中的存储次序进行重排的方式,以使预测存储空间中的多个第一目标点摆脱chw模式对输入特征图中的点的存储次序的限制,以使用于计算一个第二目标点的多个第一目标点能够集中排布于预设存储空间中的一段连续的存储区域内。
47.可以理解,上述存储方式仅仅是一种示例性的实施例,本领域技术人员能够采用其它的不同于传统chw模式的其它存储方式,在设置的预设存储空间中,对多个第一目标点进行存储次序的重排,以实现针对多个第二目标点中的每一个第二目标点,多个第一目标点中的用于计算该第二目标点的至少一个第一目标点存储于预设存储空间中一段连续的存储区域内。
48.根据一些实施例,针对多个第一目标点中具有相同宽维度序数的预设数量的第一目标点中的每一个第一目标点,令该第一目标点在预设存储空间中的存储次序与该第一目标点的在输入特征图中的高维度序数的大小正相关。
49.即针对多个第一目标点中具有相等的宽维度序数的多个第一目标点,其中高维度序数相对较小的第一目标点总是存储在高维度序数相对较大的第一目标点之前。换言之,在预设存储空间中,总是将同时具有相同的宽维度序数和相同的高维度序数的位于各个通道层中的点集中存储。
50.根据一些实施例,针对多个第一目标点中具有相等的宽维度序数且具有相等的高维度序数的多个第一目标点中的每一个第一目标点,令该第一目标点在预设存储空间中的存储次序与该第一目标点的在输入特征图中的通道维度序数的大小正相关。
51.图3示出了根据本公开实施例的另一种输入特征图的存储模式示意图。图3所示输入特征图310与图2中的输入特征图210相同,在此不再赘述。
52.假设卷积计算参数中填充为0、卷积核的感受野为3*3,步长为1,在此情况下,用于计算输出特征图中对应通道层中的位于第一行(即第二目标行)中的多个第二目标点的输入特征图中的多个第一目标点为输入特征图310中的高维度序数在1至3之间的3*w*c个点。
53.从输入特征图中获取上述3*w*c个第一目标点,并采用whc模式在预设存储空间320中依次存储该3*w*c个第一目标点。具体地,在whc模式中,首先按照通道层的排序,存储输入特征图310中的位于第一行第一列的c个点(即输入特征图310中宽维度序数为1且高维度序数为1的c个点),再存储输入特征图310中的位于第二行第一列的c个点(即输入特征图
310中宽维度序数为1且高维度序数为2的c个点),以此类推,直至将3*w*c个第一目标点中位于第一列的3*c个点(即输入特征图310中宽维度序数为1的3*c个点)完整地存储在存储空间320中之后,再按照与上述存储宽维度序数为1的3*c个点相同的方式,依次存储3*w*c个第一目标点中的后续宽维度上的点,直至将所获取的所有3*w*c个第一目标点全部存储在预设存储空间320中。
54.在上述的whc模式下,在对输入特征图执行卷积计算时,输入特征图310中用于计算输出特征图中的特定第二目标点的多个第一目标点在预设存储空间320中处于连续存储的状态,即用于计算一个第二目标点的多个第一目标点在预设存储空间320中的存储地址连续。
55.例如,如图3所示,假设卷积计算参数的填充为0、卷积核的感受野为3*3,步长为1,在此情况下,用于计算输出特征图中对应通道层中的位于第一行的第一列的第二目标点(即输出特征图的对应通道层中宽维度序数为1且高维度序数为1的点)的输入特征图310中的多个第一目标点为输入特征图310中阴影部分的多个点,即输入特征图310中的宽维度序数在1至3之间,且高维度序数在1至3之间的位于各个通道层的3*3*c个点。在存储器320中,上述阴影部分的多个第一目标点(对应于存储器320中的阴影块)连续存储,有效简化了卷积计算中的数据读取操作。
56.基于步骤s101中依次存储了多个第一目标点的预设存储空间,可以高效地执行步骤s102中的针对多个第二目标点中的每一个第二目标点的卷积计算。
57.针对步骤s102

1~s102

3,由于用于计算该第二目标点的多个第一目标点存储于预设存储空间中一段连续的存储区域内,因此,根据确定的指向该存储区域的起始位置的第一存储地址,就能够从该预设存储空间连续地读取当前卷积计算所需要的所有第一目标点。
58.根据一些实施例,针对至少一个第二目标点中的每一个第二目标点,确定第一存储地址可以包括:至少基于该第二目标点在输出特征图中的宽维度序数、至少一个第一目标行的行数,以及输入特征图的通道数,确定第一存储地址。
59.根据一些实施例,对于第二目标行中宽维度序数相邻的任意两个第二目标点,其中在后的一个第二目标点所对应的第一存储地址与其中在先的一个第二目标点所对应的第一存储地址之间具有第一距离差,其中,该第一距离差为至少一个第一目标行的行数、卷积计算的步长以及输入特征图的通道数三者的乘积。
60.仍以图3为例,假设卷积计算参数的填充为0、卷积核的感受野为3*3,步长为2,在此情况下,输出特征图的对应通道层中的位于第一行的第一列的第二目标点(即输出特征图的对应通道层中宽维度序数为1且高维度序数为1的点)对应于存储器320中的第一存储地址321,输出特征图的对应通道层中的位于第一行的第二列的第二目标点(即输出特征图的对应通道层中宽维度序数为2且高维度序数为1的点)对应于存储器320中的第一存储地址322。
61.在确定了第一存储地址的基础上,可以进一步执行步骤s102

3,利用所读取的至少一个第一目标点,执行针对该第二目标点的卷积计算。
62.在计算得到第二目标行中的所有第二目标点后,可以进而计算输出特征图中位于第二目标行的下一行中的多个第四目标点的卷积值。为此,需要对预设存储空间进行更新,
以使更新后的预设存储空间能够满足计算该多个第四目标点的需要。
63.根据一些实施例,响应于确定对多个第一目标点的卷积计算已完成,可以更新预设存储空间,以使更新后的预设存储空间中包括输入特征图中的多个第三目标点,其中,多个第三目标点能够用于计算输出特征图中的多个第四目标点,多个第四目标点为位于输出特征图中的第二目标行的下一行中的多个点,并且针对多个第四目标点中的每一个第四目标点,多个第三目标点中的用于计算该第四目标点的至少一个第三目标点存储于预设存储空间中一段连续的存储区域中。
64.由此,可以基于更新后的预设存储空间进一步计算输入特征图中的其它点,直至计算得到输入特征图中的所有点的卷积值。
65.根据一些实施例,更新预设存储空间可以包括:响应于确定多个第三目标点与多个第一目标点中具有至少一个相同点,将多个第三目标点中除至少一个相同点以外的其它点确定为更新点;以及利用多个更新点更新预设存储空间,并且维持至少一个相同点中的每一个相同点在预设存储空间中的存储次序不变。由此,可以在多个第三目标点与多个第一目标点中具有相同点的情况下,最大限度减少对预设存储空间中所存储的点的移位更新,提升更新的效率。
66.图4示出了根据本公开实施例的另一种输入特征图的存储模式示意图。图4所示的输入特征图410与图2中的输入特征图210相同,在此不再赘述。
67.如图4所示,假设卷积计算参数中填充为0、卷积核的感受野为3*3,步长为1,在此情况下,用于计算输出特征图的对应通道层中的位于第一行中的多个第二目标点的输入特征图中的多个第一目标点为输入特征图410中的高维度序数在1至3之间的3*w*c个点。用于计算输出特征图的对应通道层中的位于第二行中的多个第四目标点的输入特征图中的多个第三目标点为输入特征图410中位于阴影部分的多个点,即输入特征图410中的高维度序数在2至4之间的3*w*c个点。
68.由于位于输入特征图410中的高维度序数在2至3之间的2*w*c个点已经依次存储在原始预设存储空间420

1中,因此,在对原始预设存储空间420

1进行更新时,只需要利用输入特征图410中的高维度序数为4的w*c个点更新原始预设存储空间420

1,使得更新后的预设存储空间420

2中包括输入特征图410中的高维度序数在2至4之间的全部3*w*c个点,并在更新的过程中维持输入特征图410中的高维度序数在2至3之间的2*w*c个点在更新后的预设存储空间420

2中的存储地址不变。
69.根据一些实施例,将多个第一目标点中除至少一个相同点以外的其它点确定为待替换点;利用多个更新点更新预设存储空间可以包括:响应于更新点中任意一个子更新点的宽维度序数不等于输入特征图的宽度,利用该子更新点替换待替换点中与该子更新点相对应的子待替换点,其中,该相对应的子待替换点的宽维度序数与该子更新点的宽维度序数之差为1,该子更新点的高维度序数与相对应的子待替换点的高维度序数之差为至少一个第一目标行的行数,该子更新点的通道维度序数与相对应的子待替换点的通道维度序数相等。
70.根据一些实施例,利用多个更新点更新预设存储空间还包括:响应于更新点中任意一个子更新点的宽维度序数等于输入特征图的宽度,将该子更新点存储在预设存储空间的末尾。
71.如图4所示,在更新前的预设存储空间420

1中,维持其中已经存储的输入特征图410中的高维度序数在2至3之间的2*w*c个点的存储地址不变,利用子更新点030,130

l30依次替换子待替换点001,101

l01,利用子更新点031,131

l31依次替换子待替换点002,102

l02,以此类推,将输入特征图410中的高维度序数为1且宽维度序数在2至w之间的子待替换点替换为输入特征图410中的高维度序数为4且宽维度序数在1至w

1之间的子更新点,最后将特征图410中的高维度序数为4且宽维度序数为w的子更新点依次存储在原始预设存储空间420

1的末尾,由此可以得到更新后的预设存储空间420

2。
72.需要注意的是,在对输出特征图中的第二目标行中的第一个第二目标点进行卷积计算时,从原始预设存储空间420

1中的第一存储地址421开始依次读取所需的多个第一目标点;而在对输出特征图中的位于第二目标行的下一行的第一个第四目标点进行卷积计算时,从更新后的预设存储空间420

2中的第一存储地址422开始依次读取所需的多个第三目标点。
73.在一种实施方式中,更新预设存储空间还可以包括:基于环形缓冲区(circlebuffer)机制,更新预设存储空间。
74.根据本公开的另一方面,如图5所示,还提供一种数据处理装置500,包括:存入单元510,被配置用于将输入特征图中的多个第一目标点存储于预设存储空间中,其中,多个第一目标点能够用于计算输出特征图中的至少一个第二目标点,并且针对至少一个第二目标点中的每一个第二目标点,多个第一目标点中的用于计算该第二目标点的至少一个第一目标点存储于预设存储空间中一段连续的存储区域内;以及计算单元520,被配置用于针对至少一个第二目标点中的每一个第二目标点,执行计算,计算单元包括:确定子单元521,被配置用于确定第一存储地址,其中,第一存储地址为用于计算该第二目标点的至少一个第一目标点所在的存储区域的起始位置;读取子单元522,被配置用于根据第一存储地址,从预设存储空间中的一段连续的存储区域内读取该第二目标点所对应的至少一个第一目标点;以及计算子单元523,被配置用于利用所读取的至少一个第一目标点,执行针对该第二目标点的计算。
75.根据一些实施例,计算单元进一步被配置用于执行卷积计算。
76.根据一些实施例,至少一个第二目标点为位于输出特征图中的一个第二目标行中的多个点。
77.根据一些实施例,多个第一目标点为在输入特征图中的至少一个第一目标行中的多个点,至少一个第一目标行为根据第二目标行和卷积计算的参数而确定的。
78.根据一些实施例,存储单元包括:针对多个第一目标点中的每一个第一目标点,令该第一目标点在预设存储空间中的存储次序与该第一目标点在输入特征图中的宽维度序数的大小正相关的模块。
79.根据一些实施例,存储单元还包括:针对多个第一目标点中具有相同宽维度序数的预设数量的第一目标点中的每一个第一目标点,令该第一目标点在预设存储空间中的存储次序与该第一目标点的在输入特征图中的高维度序数的大小正相关的模块。
80.根据一些实施例,确定子单元包括:至少基于该第二目标点在输出特征图中的宽维度序数、至少一个第一目标行的行数,以及输入特征图的通道数,确定第一存储地址的模块。
81.根据一些实施例,该装置还包括:更新单元,被配置用于响应于确定对多个第一目标点的卷积计算已完成,更新预设存储空间,以使更新后的预设存储空间中包括输入特征图中的多个第三目标点,其中,多个第三目标点能够用于计算输出特征图中的多个第四目标点,多个第四目标点为位于输出特征图中的第二目标行的下一行中的多个点,并且针对多个第四目标点中的每一个第四目标点,多个第三目标点中的用于计算该第四目标点的至少一个第三目标点存储于预设存储空间中一段连续的存储区域中。
82.根据一些实施例,更新单元包括:响应于确定多个第三目标点与多个第一目标点中具有至少一个相同点,将多个第三目标点中除至少一个相同点以外的其它点确定为更新点的模块;以及利用多个更新点更新预设存储空间,并且维持至少一个相同点中的每一个相同点在预设存储空间中的存储次序不变的模块。
83.根据本公开的另一方面,还提供一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述任意一种方法。
84.根据本公开的另一方面,还提供一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行上述任意一种方法。
85.根据本公开的另一方面,还提供一种计算机程序产品,包括计算机程序,其中,计算机程序在被处理器执行时实现上述任意一种方法。
86.根据本公开的实施例,还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
87.参考图6,现将描述可以作为本公开的服务器或客户端的电子设备600的结构框图,其是可以应用于本公开的各方面的硬件设备的示例。电子设备旨在表示各种形式的数字电子的计算机设备,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
88.如图6所示,设备600包括计算单元601,其可以根据存储在只读存储器(rom)602中的计算机程序或者从存储单元608加载到随机访问存储器(ram)603中的计算机程序,来执行各种适当的动作和处理。在ram 603中,还可存储设备600操作所需的各种程序和数据。计算单元601、rom 602以及ram 603通过总线604彼此相连。输入/输出(i/o)接口605也连接至总线604。
89.设备600中的多个部件连接至i/o接口605,包括:输入单元606、输出单元607、存储单元608以及通信单元609。输入单元606可以是能向设备600输入信息的任何类型的设备,输入单元606可以接收输入的数字或字符信息,以及产生与电子设备的用户设置和/或功能控制有关的键信号输入,并且可以包括但不限于鼠标、键盘、触摸屏、轨迹板、轨迹球、操作杆、麦克风和/或遥控器。输出单元607可以是能呈现信息的任何类型的设备,并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元608可以包括但不限于磁盘、光盘。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据,并且可以包括但不限于调制解调器、网卡、红外通信设
备、无线通信收发机和/或芯片组,例如蓝牙tm设备、1302.11设备、wifi设备、wimax设备、蜂窝通信设备和/或类似物。
90.计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理,例如数据处理方法。例如,在一些实施例中,数据处理方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元606。在一些实施例中,计算机程序的部分或者全部可以经由rom 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到ram 603并由计算单元601执行时,可以执行上文描述的数据处理方法的一个或多个步骤。备选地,在其他实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行数据处理方法。
91.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
92.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
93.在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd

rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
94.为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
95.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
96.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端

服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
97.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行、也可以顺序地或以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
98.虽然已经参照附图描述了本公开的实施例或示例,但应理解,上述的方法、系统和设备仅仅是示例性的实施例或示例,本发明的范围并不由这些实施例或示例限制,而是仅由授权后的权利要求书及其等同范围来限定。实施例或示例中的各种要素可以被省略或者可由其等同要素替代。此外,可以通过不同于本公开中描述的次序来执行各步骤。进一步地,可以以各种方式组合实施例或示例中的各种要素。重要的是随着技术的演进,在此描述的很多要素可以由本公开之后出现的等同要素进行替换。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献