一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于减少发散的计算单元排序的制作方法

2022-02-25 18:33:50 来源:中国专利 TAG:

技术特征:
1.一种用于减少单指令多数据处理器中的控制流发散的方法,所述方法包括:在发散控制流的点处识别不同执行项的控制流目标;对所述执行项进行排序以生成排序后的执行项组;基于所述排序后的执行项组重组所述执行项;以及在所述发散控制流的点之后以所述重组的执行项来执行。2.如权利要求1所述的方法,其中识别所述不同执行项的所述控制流目标包括识别所述不同执行项是否采用分支。3.如权利要求1所述的方法,其中识别所述不同执行项的所述控制流目标包括识别跳转的目标地址。4.如权利要求1所述的方法,其中对所述执行项进行排序包括将具有相同控制流目标的执行项一起分组为所述执行项组。5.如权利要求1所述的方法,其中所述重组包括波前间技术,其中跨工作组的波前重组执行项。6.如权利要求5所述的方法,其中基于所述排序重组所述执行项包括将执行项组分配给所述工作组的所述波前。7.如权利要求1所述的方法,其中所述重组包括波前内技术,其中跨波前的时隙重组执行项。8.如权利要求7所述的方法,其中基于所述排序重组所述执行项包括将执行项组分配给所述波前的所述时隙。9.如权利要求1所述的方法,其还包括:由编译器将实施所述排序和重组的指令添加到着色器程序中。10.一种用于减少单指令多数据(“simd”)处理器中的控制流发散的装置,所述装置包括:存储器,其被配置成存储着色器程序;以及simd处理器,其被配置成使用多个执行项执行所述着色器程序,且被配置成:在发散控制流的点处识别所述多个执行项中的不同执行项的控制流目标;对所述执行项进行排序以生成排序后的执行项组;基于所述排序后的执行项组重组所述执行项;以及在所述发散控制流的点之后以所述重组的执行项来执行。11.如权利要求10所述的装置,其中识别所述不同执行项的所述控制流目标包括识别所述不同执行项是否采用分支。12.如权利要求10所述的装置,其中识别所述不同执行项的所述控制流目标包括识别跳转的目标地址。13.如权利要求10所述的装置,其中对所述执行项进行排序包括将具有相同控制流目标的执行项一起分组为所述执行项组。14.如权利要求10所述的装置,其中所述重组包括波前间技术,其中跨工作组的波前重组执行项。15.如权利要求14所述的装置,其中基于所述排序重组所述执行项包括将执行项组分配给所述工作组的所述波前。
16.如权利要求10所述的装置,其中所述重组包括波前内技术,其中跨波前的时隙重组执行项。17.如权利要求16所述的装置,其中基于所述排序重组所述执行项包括将执行项组分配给所述波前的所述时隙。18.一种存储指令的非暂时性计算机可读介质,所述指令当由处理器执行时使得所述处理器通过以下步骤减少单指令多数据(“simd”)处理器中的控制流的发散:在发散控制流的点处识别不同执行项的控制流目标;对所述执行项进行排序以生成排序后的执行项组;基于所述排序后的执行项组重组所述执行项;以及在所述发散控制流的点之后以所述重组的执行项来执行。19.如权利要求18所述的非暂时性计算机可读介质,其中识别所述不同执行项的所述控制流目标包括识别所述不同执行项是否采用分支。20.如权利要求18所述的非暂时性计算机可读介质,其中识别所述不同执行项的所述控制流目标包括识别跳转的目标地址。

技术总结
本文描述用于减少单指令多数据处理器中的控制流发散的技术。所述方法包括在发散控制流的点处识别不同执行项的控制流目标,基于所述控制流目标对所述执行项进行排序,基于所述排序重组所述执行项,以及在所述发散控制流的点之后以所述重组的执行项来执行。点之后以所述重组的执行项来执行。点之后以所述重组的执行项来执行。


技术研发人员:大卫
受保护的技术使用者:超威半导体公司
技术研发日:2020.05.07
技术公布日:2022/2/24
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献