一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种异构众核架构上CPU共享数组引导维选取策略的制作方法

2022-03-22 20:21:42 来源:中国专利 TAG:

技术特征:
1.一种异构众核架构上cpu共享数组引导维选取策略,其特征在于:对于大小为m
×
n的双精度矩阵,nd == 0,m%m == 0,行主序,引导维为ld,分块大小为m
×
64;运算时,从核每次dma获取某个分块运算,并按下表约定下列标记:标记含义k=512芯片共享空间地址以k字节为单位,由不同存控管理n=6核组数stride=(ld-64)*8bdma时跨步大小,单位为字节block=64*8bdma时跨步向量块大小,单位为字节src矩阵首地址dispdma时源地址相对于矩阵首地址偏移量,单位为字节ld矩阵引导维大小,单位为(矩阵元素)个数;对矩阵引导维进行如下调整后,将矩阵根据调整后获得的引导维参数存储于cpu共享空间指定地址中,供从核dma访存取用:s1、申请cpu共享空间时,控制申请空间的首地址即src 128b对界,使得从核dma取时源地址始终128b对界;s2、选取 ld = 64 * (6a 1),a为满足64 * (6a 1) >= n的最小整数值,使得从核dma访存时存控利用率最高且dma跨步满足128b对界;s3、如果s2中取得的ld1==0,取a=a 1,使得体冲突问题得到规避;s4、m
×
n双精度矩阵,行主序,以s3中取得的ld作为引导维,以src为首地址,存储在cpu共享空间中。

技术总结
本发明公开一种异构众核架构上CPU共享数组引导维选取策略,对矩阵引导维进行如下调整,并存储于CPU共享空间中:S1、申请CPU共享空间时,控制申请空间的首地址即src 128B对界,使得从核DMA取时源地址始终128B对界;S2选取ld=64*(6a 1),a为满足64*(6a 1)>=N的最小整数值;S3、如果S2中取得的ld1==0,取a=a 1,使得体冲突问题得到规避;S4、M


技术研发人员:尹万旺 袁欣辉 林蓉芬 魏迪 孙浩男 孙强 史俊达 王飞 郑岩
受保护的技术使用者:无锡江南计算技术研究所
技术研发日:2021.04.30
技术公布日:2022/3/21
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献