一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种图像矩阵卷积的实现方法、计算设备及储存介质与流程

2021-12-01 01:31:00 来源:中国专利 TAG:

技术特征:
1.一种图像矩阵卷积的实现方法,在计算设备中执行,其特征在于,所述方法包括:获取待卷积图像矩阵和卷积核,其中,所述待卷积图像矩阵的每一元素为图像的像素值;将所述待卷积图像矩阵展开为行矩阵,得到第一展开图像矩阵;为所述第一展开图像矩阵分配连续的内存地址,作为第一内存空间;将所述第一展开图像矩阵保存至所述第一内存空间;将所述第一展开图像矩阵转换为列矩阵,得到第二展开图像矩阵,其中,所述第二展开图像矩阵中每一行数据大小为所述计算设备中cpu的向量寄存器的大小;将所述卷积核展开为以所述第二展开图像矩阵的列数作为列数、以卷积核大小作为行数的矩阵,得到第三展开矩阵,其中,所述第三展开矩阵中每一行数据大小为所述向量寄存器的大小;将所述第二展开图像矩阵和所述第三展开矩阵进行卷积运算,得到图像矩阵的卷积结果矩阵,所述卷积结果矩阵为图像矩阵的特征矩阵。2.如权利要求1所述的方法,其特征在于,所述将所述待卷积图像矩阵展开为行矩阵,得到第一展开图像矩阵的步骤包括:根据所述卷积核的大小,通过im2col算法将所述待卷积图像矩阵展开为行矩阵,作为所述第一展开图像矩阵。3.如权利要求1所述的方法,其特征在于,还包括步骤:将所述待卷积图像矩阵进行归一化处理,使得得到的所述待卷积图像矩阵中每一元素大小为所述向量寄存器支持浮点数据运算的浮点数据的大小。4.如权利要求1所述的方法,其特征在于,所述将所述第一展开图像矩阵转换为列矩阵,得到第二展开图像矩阵的步骤包括:确定所述向量寄存器可同时执行浮点数据运算的次数,将所述执行浮点数据运算的次数作为第一数值;将所述第一展开图像矩阵相邻行中、每一列的元素作为一组数据,以所述一组数据作为矩阵的一行元素,其中,所述第一展开图像矩阵相邻行的行数与所述第一数值相等;当所述第一展开图像矩阵余下的行数少于所述第一数值时,通过零元素将所述第一展开图像矩阵中缺失的元素补齐至所述余下的行数与所述第一数值相等,得到所述第二展开图像矩阵。5.如权利要求4所述的方法,其特征在于,还包括步骤:为所述第二展开图像矩阵分配连续的内存地址,作为第二内存空间;将所述第二展开图像矩阵保存至所述第二内存空间中。6.如权利要求1至5中任一项所述的方法,其特征在于,还包括步骤:将所述卷积核中每一元素大小强制转换为所述向量寄存器支持浮点数据运算的浮点数据的大小;其中,所述将所述卷积核展开为以所述第二展开图像矩阵的列数作为列数、以卷积核大小作为行数的矩阵,得到第三展开矩阵的步骤包括:按照第一预设规则将转换后的卷积核中每一个元素复制为所述第二展开图像矩阵的列数个,得到一组相同数据,其中,所述第一预设规则为由左至右、由上至下的顺序规则;
按照复制的顺序依次将得到的一组相同的数据作为矩阵的一行元素,得到所述第三展开矩阵。7.如权利要求6所述的方法,其特征在于,还包括步骤:为所述第三展开矩阵分配连续的内存地址,作为第三内存空间;将所述第三展开矩阵保存至所述第三内存空间。8.如权利要求1至7中任一项所述的方法,其特征在于,所述将所述第二展开图像矩阵和所述第三展开矩阵进行卷积运算,得到图像矩阵的卷积结果矩阵的步骤包括:根据所述待卷积图像矩阵和所述卷积核确定所述卷积结果矩阵的大小;将所述第二展开图像矩阵根据所述第三展开矩阵的大小划分为多组矩阵,其中,每一组矩阵的行数和列数与所述第三展开矩阵的相同,各组矩阵中的每一行元素不重叠;将各组矩阵与所述第三展开矩阵进行卷积运算,得到各组矩阵中每一元素的卷积结果;将各组矩阵的最后一行元素的卷积结果,按照所述第一预设规则写入所述图像矩阵的卷积结果矩阵中。9.一种计算设备,其特征在于,包括:至少一个处理器;以及存储器,存储有程序指令,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行如权利要求1

8中任一项所述的方法的指令。10.一种存储有程序指令的可读存储介质,其特征在于,当所述程序指令被计算设备读取并执行时,使得所述计算设备执行如权利要求1

8中任一项所述的方法。

技术总结
本发明公开了一种图像矩阵卷积的实现方法、计算设备及储存介质,方法包括:获取待卷积图像矩阵和卷积核,待卷积图像矩阵根据卷积核的大小将待卷积图像矩阵展开为行矩阵,得到第一展开图像矩阵,将第一展开图像矩阵转换为列矩阵,得到第二展开图像矩阵,将卷积核展开为以第二展开图像矩阵的列数作为列数、以卷积核大小作为行数的矩阵,得到第三展开矩阵,第二展开图像矩阵中每一行数据大小、第三展开矩阵中每一行数据大小均为向量寄存器的大小,将第二展开图像矩阵和第三展开矩阵进行卷积运算,得到图像矩阵的特征矩阵。本发明利用计算设备中CPU的向量寄存器,实现在同一时间内执行多次浮点数据运算,显著提高图像矩阵的卷积计算速度。速度。速度。


技术研发人员:王正阳 张勇 刘明航
受保护的技术使用者:成都统信软件技术有限公司
技术研发日:2021.08.02
技术公布日:2021/11/30
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献