一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

内核函数传输方法、装置及设备

2022-05-18 04:47:08 来源:中国专利 TAG:

技术特征:
1.一种内核函数传输方法,其特征在于,包括:中央处理器根据待发送至图像处理器的多个内核函数确定融合内核函数;所述中央处理器确定所述多个内核函数之间的依赖关系、每个内核函数的函数参数、所述融合内核函数对应的发射参数和所述融合内核函数对应的处理线程数;所述中央处理器向所述图像处理器同步所述多个内核函数之间的依赖关系、每个内核函数的函数参数、所述融合内核函数对应的发射参数和所述融合内核函数对应的处理线程数,以使所述图像处理器根据所述依赖关系、每个内核函数的函数参数、所述融合内核函数对应的发射参数和所述融合内核函数对应的处理线程数,对所述多个内核函数进行处理。2.根据权利要求1所述的方法,其特征在于,所述中央处理器向所述图像处理器同步所述多个内核函数之间的依赖关系、每个内核函数的函数参数、所述融合内核函数对应的发射参数和所述融合内核函数对应的处理线程数,包括:所述中央处理器通过远程直接数据存取rdma的方式向所述图像处理器同步所述多个内核函数之间的依赖关系、每个内核函数的函数参数、所述融合内核函数对应的发射参数和所述融合内核函数对应的处理线程数。3.根据权利要求1或2所述的方法,其特征在于,所述中央处理器确定所述融合内核函数对应的发射参数,包括:所述中央处理器对所述多个内核函数对应的线程块和线程网格进行统一化处理;所述中央处理器对线程块中离散的线程束进行补齐处理。4.根据权利要求1-3任一项所述的方法,其特征在于,中央处理器确定待发送至图像处理器的多个内核函数,包括:所述中央处理器确定多个待选内核函数;所述中央处理器确定每个待选内核函数的运行时间和所述多个待选内核函数之间的依赖关系;所述中央处理器根据每个待选内核函数的运行时间和所述多个待选内核函数之间的依赖关系,在所述多个待选内核函数中确定所述多个内核函数。5.一种内核函数传输方法,其特征在于,包括:图像处理器从中央处理器获取多个内核函数之间的依赖关系、每个内核函数的函数参数、融合函数对应的发射参数和所述融合函数对应的处理线程数,所述融合内核函数为对所述多个内核函数进行融合后的函数;所述图像处理器确定所述融合内核函数对应的多个线程标识;所述图像处理器根据所述融合内核函数对应的多个线程标识和所述融合内核函数对应的处理线程数,确定每个处理线程对应的内核函数;所述图像处理器根据多个内核函数之间的依赖关系、每个内核函数的函数参数、每个处理线程对应的内核函数和所述融合函数对应的发射参数,对所述多个内核函数进行处理。6.根据权利要求5所述的方法,其特征在于,所述图像处理器根据多个内核函数之间的依赖关系、每个内核函数的函数参数和每个处理线程对应的内核函数,对所述多个内核函数进行处理,包括:所述图像处理器根据所述多个内核函数之间的依赖关系,确定所述多个内核函数的执
行顺序;所述图像处理器根据每个内核函数的函数参数,按照所述执行顺序,对所述多个内核函数进行处理。7.根据权利要求6所述的方法,其特征在于,针对任意一个处理线程;所述图像处理器根据所述处理线程对应的内核函数的函数参数,对所述内核函数进行处理,包括:所述图像处理器根据所述内核函数的函数参数,调用所述处理线程,以实现通过所述处理线程执行所述内核函数。8.根据权利要求7所述的方法,其特征在于,所述图像处理器根据所述内核函数的函数参数,调用所述处理线程,以实现通过所述处理线程执行所述内核函数之后,还包括:将处理线程的标识添加至所述内核函数对应的完成数组中,以指示所述处理线程执行完成。9.根据权利要求5-8任一项所述的方法,所述图像处理器从中央处理器获取多个内核函数之间的依赖关系、每个内核函数的函数参数和融合函数对应的处理线程数,包括:所述图像处理器通过远程直接数据存取rdma的方式从所述中央处理器获取所述多个内核函数之间的依赖关系、每个内核函数的函数参数和融合函数对应的处理线程数。10.一种内核函数的传输装置,其特征在于,包括:第一确定模块、第二确定模块和同步模块,其中,所述第一确定模块用于,根据待发送至图像处理器的多个内核函数确定融合内核函数;所述第二确定模块用于,确定所述多个内核函数之间的依赖关系、每个内核函数的函数参数、所述融合内核函数对应的发射参数和所述融合内核函数对应的处理线程数;所述同步模块用于,向所述图像处理器同步所述多个内核函数之间的依赖关系、每个内核函数的函数参数、所述融合内核函数对应的发射参数和所述融合内核函数对应的处理线程数,以使所述图像处理器根据所述依赖关系、每个内核函数的函数参数、所述融合内核函数对应的发射参数和所述融合内核函数对应的处理线程数,对所述多个内核函数进行处理。11.一种内核函数的传输装置,其特征在于,包括:获取模块、第一确定模块、第二确定模块和处理模块,其中,所述获取模块用于,从中央处理器获取多个内核函数之间的依赖关系、每个内核函数的函数参数、融合函数对应的发射参数、和所述融合函数对应的处理线程数,所述融合内核函数为对所述多个内核函数进行融合后的函数;所述第一确定模块用于,确定所述融合内核函数对应的多个线程标识;所述第二确定模块用于,根据所述融合内核函数对应的多个线程标识和所述融合内核函数对应的处理线程数,确定每个处理线程对应的内核函数;所述处理模块用于,根据多个内核函数之间的依赖关系、每个内核函数的函数参数、每个处理线程对应的内核函数和所述融合函数对应的发射参数,对所述多个内核函数进行处理。12.一种电子设备,其特征在于,中央处理器和内核处理器,其中,所述中央处理器用于执行权利要求1至4任一项所述的方法;
所述内核处理器用于执行权利要求5至9任一项所述的方法。13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当所述计算机执行指令被处理器执行时用于实现权利要求1至4任一项所述的方法,或者权利要求5至9任一项所述的方法。14.一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现权利要求1至4任一项所述的方法,或者权利要求5至9任一项所述的方法。

技术总结
本申请实施例提供一种内核函数传输方法、装置及设备。该方法包括:中央处理器根据待发送至图像处理器的多个内核函数确定融合内核函数;中央处理器确定多个内核函数之间的依赖关系、每个内核函数的函数参数、融合内核函数对应的发射参数和融合内核函数对应的处理线程数;中央处理器向图像处理器同步多个内核函数之间的依赖关系、每个内核函数的函数参数、融合内核函数对应的发射参数和融合内核函数对应的处理线程数,以使图像处理器根据依赖关系、每个内核函数的函数参数、融合内核函数对应的发射参数和融合内核函数对应的处理线程数,对多个内核函数进行处理,提高了图像处理器的运行效率。器的运行效率。器的运行效率。


技术研发人员:陆游游 舒继武 谢旻晖
受保护的技术使用者:清华大学
技术研发日:2021.12.30
技术公布日:2022/5/17
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献