一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

针对GPU计算核进行性能统计分析的方法、装置及介质与流程

2022-04-25 00:55:57 来源:中国专利 TAG:

技术特征:
1.一种针对gpu计算核进行性能统计分析的方法,其特征在于,所述方法包括:根据执行计算任务的调度顺序对被调度的调度单元进行排序;针对排序后的每个被调度的调度单元,将对应的执行时间统计至待分析的gpu中所述调度单元被调度至目标处理核的执行总时间;将所有被调度的目标处理核的执行总时间中的最大值确定为所述待分析的gpu执行所述计算任务所需的总体时间。2.根据权利要求1所述的方法,其特征在于,所述根据执行计算任务的调度顺序对被调度的调度单元进行排序,包括:根据执行计算任务的调度顺序为每个被调度的调度单元进行标识;将每个被调度的调度单元对应的标识以及执行时间按照所述调度顺序填写入一队列。3.根据权利要求2所述的方法,其特征在于,所述针对排序后的每个被调度的调度单元,将对应的执行时间统计至待分析的gpu中所述调度单元被调度至目标处理核的执行总时间,包括:将所述待分析的gpu中用于执行所述计算任务的每个处理核的执行总时间初始化为零;从所述队列中读取第i个被调度的调度单元对应的标识以及执行时间,其中,1≤i≤n-1,n为所有被调度的调度单元数量;从所有处理核中选择执行总时间最少的处理核;根据所述第i个被调度的调度单元对应的执行时间更新被选择的处理核的执行总时间;读取第i 1个被调度的调度单元对应的标识以及执行时间,以及从所有处理核中选择执行总时间最少的处理核,并根据所述第i 1个被调度的调度单元对应的执行时间更新被选择的处理核的执行总时间,直至所有被调度的调度单元从所述队列中读取完毕。4.根据权利要求3所述的方法,其特征在于,所述将所述待分析的gpu中用于执行所述计算任务的每个处理核的执行总时间初始化为零,包括:构建一长度为m的全零数组;其中,m表示所述待分析的gpu中用于执行所述计算任务的处理核数量;数组中的各元素对应的编号与处理核的标识对应且数组中的各元素表示对应处理核的执行总时间。5.根据权利要求2或3所述的方法,其特征在于,所述队列满足先入先出fifo规则。6.根据权利要求1所述的方法,其特征在于,所述被调度的调度单元包括被调度的线程或者被调度的线程簇warp。7.一种针对gpu计算核进行性能统计分析的装置,其特征在于,所述装置包括:排序部分、统计部分和确定部分;其中,所述排序部分,经配置为根据执行计算任务的调度顺序对被调度的调度单元进行排序;所述统计部分,经配置为针对排序后的每个被调度的调度单元,将对应的执行时间统计至待分析的gpu中所述调度单元被调度至目标处理核的执行总时间;所述确定部分,经配置为将所有被调度的目标处理核的执行总时间中的最大值确定为所述待分析的gpu执行所述计算任务所需的总体时间。
8.根据权利要求7所述的装置,其特征在于,所述排序部分,经配置为:根据执行计算任务的调度顺序为每个被调度的调度单元进行标识;以及,将每个被调度的调度单元对应的标识以及执行时间按照所述调度顺序填写入一队列;相应地,所述统计部分,经配置为:将所述待分析的gpu中用于执行所述计算任务的每个处理核的执行总时间初始化为零;从所述队列中读取第i个被调度的调度单元对应的标识以及执行时间,其中,1≤i≤n-1,n为所有被调度的调度单元数量;从所有处理核中选择执行总时间最少的处理核;根据所述第i个被调度的调度单元对应的执行时间更新被选择的处理核的执行总时间;读取第i 1个被调度的调度单元对应的标识以及执行时间,以及从所有处理核中选择执行总时间最少的处理核,并根据所述第i 1个被调度的调度单元对应的执行时间更新被选择的处理核的执行总时间,直至所有被调度的调度单元从所述队列中读取完毕。9.一种计算设备,其特征在于,所述计算设备包括:存储器和处理器;其中,所述存储器,用于存储能够在所述处理器上运行的计算机程序;所述处理器,用于在运行所述计算机程序时,执行权利要求1至6任一项所述针对gpu计算核进行性能统计分析的方法的步骤。10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有针对gpu计算核进行性能统计分析的程序,所述针对gpu计算核进行性能统计分析的程序被至少一个处理器执行时实现权利要求1至6任一项所述针对gpu计算核进行性能统计分析的方法的步骤。

技术总结
本发明实施例公开了一种针对GPU计算核进行性能统计分析的方法、装置及介质;该方法可以包括:根据执行计算任务的调度顺序对被调度的调度单元进行排序;针对排序后的每个被调度的调度单元,将对应的执行时间统计至待分析的GPU中所述调度单元被调度至目标处理核的执行总时间;将所有被调度的目标处理核的执行总时间中的最大值确定为所述待分析的GPU执行所述计算任务所需的总体时间。计算任务所需的总体时间。计算任务所需的总体时间。


技术研发人员:齐航空 张竞丹 李亮
受保护的技术使用者:西安芯瞳半导体技术有限公司
技术研发日:2022.03.25
技术公布日:2022/4/22
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献