一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种大规模多运算浮点矩阵计算加速实现方法及装置与流程

2022-03-22 22:54:22 来源:中国专利 TAG:

技术特征:
1.一种大规模多运算浮点矩阵计算加速实现方法,其特征在于,包括:步骤s1:根据待处理矩阵的操作类型,接收外部输入信号,判断矩阵运算模式:当运算模式是矩阵加、矩阵减时,转入执行步骤s3,当运行模式是矩阵乘、矩阵-向量乘、矩阵-标量乘时,转入执行步骤s2;步骤s2:初始化片上ram为零,转入执行步骤s4;步骤s3:通过ram通道加载数据源c到片上ram中,转入执行步骤s4;步骤s4:通过ram通道预加载部分数据流a,而后边计算边加载数据流a和数据流b;步骤s5:计算完后,将计算结果传输到片外存储器。2.根据权利要求1所述的大规模多运算浮点矩阵计算加速实现方法,其特征在于,所述矩阵乘是指矩阵a和矩阵b的乘积,即实现c
m
×
n
=a
m
×
k
×
b
k
×
n
c
m
×
n
,其中,数据流a、数据流b为输入数据流,数据流c在片上直接初始化为零。3.根据权利要求1所述的大规模多运算浮点矩阵计算加速实现方法,其特征在于,所述矩阵加、矩阵减是指矩阵a和矩阵c的相加、相减,即实现c
m
×
k
=a
m
×
k
×
i
k
×
k
±
c
m
×
k
,其中,数据流a、数据流c为输入数据流,数据流b为引入的单位矩阵i,直接在片上由一个计数器产生。4.根据权利要求1所述的大规模多运算浮点矩阵计算加速实现方法,其特征在于,所述矩阵-向量乘是指矩阵a和向量b的乘积,即实现c
m
×1=a
m
×
k
×
b
k
×1 c
m
×1,其中,数据流a、数据流b为输入数据流,数据流c在片上直接初始化为零。5.根据权利要求1所述的大规模多运算浮点矩阵计算加速实现方法,其特征在于,所述矩阵-标量乘是指矩阵a和标量b的乘积,即实现c
m
×
k
=a
m
×
k
×
b,其中,数据流a、数据流b为输入数据流,数据流c在片上直接初始化为零。6.根据权利要求1-5中任意一项所述的大规模多运算浮点矩阵计算加速实现方法,其特征在于,所述数据源包括数据源a、数据源b、数据源c,其中,数据源a指矩阵a,数据源b指矩阵b、向量b或标量b,数据源c指片上存储的参与累加矩阵或向量。7.根据权利要求1-5中任意一项所述的大规模多运算浮点矩阵计算加速实现方法,其特征在于,采用分块矩阵方法,包括:在步骤s1之前,根据待处理矩阵规模计算分块大小,而后逐一对子块进行操作;在步骤s5之后,继续进行下一个子矩阵块的计算,即重复步骤s2-s5,直至所有子块计算完成。8.一种大规模多运算浮点矩阵计算加速装置,其特征在于,包括:预处理模块,用于将矩阵、向量分块,并根据待处理矩阵的操作类型,接收外部输入信号,判断矩阵运算模式:当运算模式是矩阵加、矩阵减时,通过ram通道加载数据源c到片上ram中;当运行模式是矩阵乘、矩阵-向量乘、矩阵-标量乘时,初始化片上ram为零,通过ram通道预加载部分数据流a,而后边计算边加载数据流a和数据流b;数据传输控制模块,用于加载各数据源及返回数据计算结果;矩阵计算加速单元模块,为若干个完全相同的基本计算单元pe组成的线性阵列结构,用于实现矩阵运算操作。9.根据权利要求8所述的大规模多运算浮点矩阵计算加速装置,其特征在于,所述基本计算单元pe包括一个浮点计算部件、两个寄存器、一个fifo和一个双端口ram。10.根据权利要求8所述的大规模多运算浮点矩阵计算加速装置,其特征在于,所述浮
点计算部件是符合ieee 754标准的ip核,集成了乘加操作或乘减操作,具体计算时根据外部操作模式信号。

技术总结
本发明公开了一种大规模多运算浮点矩阵计算加速实现方法,该方法包括:步骤S1:根据待处理矩阵的操作类型,接收外部输入信号,判断矩阵运算模式:当运算模式是矩阵加、矩阵减时,转入执行步骤S3,当运行模式是矩阵乘、矩阵-向量乘、矩阵-标量乘时,转入执行步骤S2;步骤S2:初始化片上RAM为零,转入执行步骤S4;步骤S3:通过RAM通道加载数据源C到片上RAM中,转入执行步骤S4;步骤S4:通过RAM通道预加载部分数据流A,而后边计算边加载数据流A和数据流B;步骤S5:计算完后,将计算结果传输到片外存储器。该装置用来实施上述方法。本发明具有低存储需求、高计算效率、复用度高、适用范围广等优点。适用范围广等优点。适用范围广等优点。


技术研发人员:彭元喜 张龙龙 郭阳 扈啸 黄啊慧 粟毅 张世亮 田甜 李岩
受保护的技术使用者:北京动力机械研究所
技术研发日:2021.11.01
技术公布日:2022/3/21
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献