一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于异构协同计算核心的融合算子设计与实现方法与流程

2022-08-26 22:46:14 来源:中国专利 TAG:

技术特征:
1.一种基于异构协同计算核心的融合算子设计与实现方法,其特征在于,异构协同计算核心包括通用计算核心、卷积专用计算核心,融合算子以如下方法运行:s1、通用计算核心将数据进行分块处理;s2、通用计算核心对第一分块进行预处理计算,并将第一分块的预处理结果映射到卷积专用计算核心;s3、卷积专用计算核心依据s2中第一分块的预处理结果进行卷积计算;s4、通用计算核心载入第二分块,并进行预处理,并将第二分块的预处理结果映射到卷积专用计算核心;s5、卷积专用计算核心向通用计算核心反馈对第一分块进行卷积计算的结果,通用计算核心依据第一分块的卷积计算结果,对第一分块进行后处理运算获得第一结果块,并将第一结果块返回内存,同时,通用计算核心载入第三分块,并进行预处理,并将第三分块的预处理结果映射到卷积专用计算核心;s6、卷积专用计算核心依据第二分块的预处理结果返回s3进行卷积计算,直至全部分块处理完成、结果块全部进行存储。2.一种基于异构协同计算核心的融合算子设计与实现方法,其特征在于,异构协同计算核心包括通用计算核心、卷积专用计算核心,融合算子以如下方法运行:s1、通用计算核心将数据进行分块处理;s2、通用计算核心对全部分块进行预处理计算,并将第一分块的预处理结果映射到卷积专用计算核心;s3、卷积专用计算核心依据s2中第一分块的预处理结果进行卷积计算;s4、通用计算核心将第二分块的预处理结果映射到卷积专用计算核心;s5、卷积专用计算核心向通用计算核心反馈对第一分块进行卷积计算的结果,通用计算核心依据第一分块的卷积计算结果,对第一分块进行后处理运算获得第一结果块,并将第一结果块返回内存,同时,通用计算核心将第三分块的预处理结果映射到卷积专用计算核心;s6、卷积专用计算核心依据第二分块的预处理结果返回s3进行卷积计算,直至全部分块处理完成、结果块全部进行存储。3.如权利要求1或2所述的基于异构协同计算核心的融合算子设计与实现方法,其特征在于,所述融合算子包含:卷积、批归一化、激活、池化算子。4.如权利要求1或2所述的基于异构协同计算核心的融合算子设计与实现方法,其特征在于,所述融合算子包含conv->bn->relu结构块。

技术总结
本发明的一种基于异构协同计算核心的融合算子设计与实现方法,异构协同计算核心包括通用计算核心、卷积专用计算核心,通用计算核心将数据进行分块处理;通用计算核心对第一分块进行预处理计算;卷积专用计算核心依据S2中第一分块的预处理结果进行卷积计算;之后,通用计算核心对第二分块进行预处理;通用计算核心依据第一分块的卷积计算结果,对第一分块进行后处理运算获得第一结果块,并将第一结果块返回内存,之后,通用计算核心对第三分块进行预处理,并将第三分块的预处理结果映射到卷积专用计算核心;卷积专用计算核心依据第二分块的预处理结果卷积计算,至全部分块处理完成、结果块全部进行存储。该方法将计算进行并行流水分配,通过不同计算核心的并行执行,减少计算的时间。算的时间。算的时间。


技术研发人员:叶楠 杨晋喆 王洪磊 高伟
受保护的技术使用者:太初(无锡)电子科技有限公司
技术研发日:2021.09.30
技术公布日:2022/8/25
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献