一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

tanh和sigmoid函数执行的制作方法

2022-03-02 01:12:00 来源:中国专利 TAG:

技术特征:
1.一种计算机实现的方法,包括:通过以下步骤在图形处理单元的执行单元eu的数学流水线和浮点单元fpu流水线中执行tanh函数:基于输入x的值的范围,通过执行tanh(x)操作或tanh(x)/x操作来生成中间结果;基于所述输入x的值的范围,使用最小操作来生成比例因子;以及将所述中间结果与所述比例因子相乘以对输入x生成tanh函数的输出。2.如权利要求1所述的方法,包括:如果x的值在第一范围内,则:确定tanh(x)/x以生成所述中间结果,并且将所述中间结果乘以x;或者如果x的值在第二范围内,则:确定tanh(x)以生成所述中间结果,并且将所述中间结果乘以值。3.如权利要求2所述的方法,其中,确定tanh(x)包括:执行二次内插操作或钳制到固定值。4.如权利要求3所述的方法,其中,执行二次内插操作包括:生成c0 c1*

c2*

*

,其中:c0、c1和c2包括基于x的值从查找表选择的恒定值;并且

包括x的尾数的位。5.如权利要求4所述的方法,其中,内插逻辑执行生成c0 c1*

c2*

*

。6.如权利要求1所述的方法,其中,使用最小操作生成比例因子包括执行以下操作:min(abs(x),1),用于选择x的绝对值与1中的较小者。7.如权利要求1所述的方法,其中,tanh操作由编译器从tanh应用程序接口api生成,作为tanh指令、最小指令、以及一条乘法指令。8.一种执行sigmoid的方法,包括:对输入值执行sigmoid操作,包括:基于所述输入值的范围,将输出钳制到固定值,或执行分段二次内插。9.如权利要求8所述的方法,其中,将输出钳制到固定值或执行分段二次内插包括:10.如权利要求9所述的方法,包括:提供对不同范围的系数的不同查找表条目的访问,其中,仅用于负输入的系数被存储在不同的查找表条目中,并且用于正输入的系数从用于负输入的系数导出。11.一种包括存储在其上的指令的非暂态计算机可读介质,所述指令如果由一个或多个处理器执行,则使所述一个或多个处理器用于:将tanh应用程序接口api执行为tanh指令、最小指令、以及一条乘法指令的组合。12.如权利要求11所述的非暂态计算机可读介质,其中,所述tanh指令包括:
如果输入x的值在[0,1)范围内,则tanh指令的执行引起:生成tanh(x)/x操作以生成中间结果;以及引起所述中间结果乘以x的乘法;或者如果所述输入x的值在1和更大的范围内,则tanh指令的执行引起:生成tanh(x)操作以生成中间结果;以及引起所述中间结果乘以1.0f的乘法。13.如权利要求12所述的非暂态计算机可读介质,其中,生成tanh(x)包括执行二次内插操作,或钳制到固定值。14.如权利要求13所述的非暂态计算机可读介质,其中,执行二次内插操作包括:确定c0 c1*

c2*

*

,其中:c0、c1和c2包括基于输入值x的值从查找表选择的恒定值;并且

包括x的尾数的位。15.一种包括存储在其上的指令的非暂态计算机可读介质,所述指令如果由一个或多个处理器执行,则使所述一个或多个处理器用于:将sigmoid应用程序接口api执行为:基于输入值的范围,将输出钳制到固定值,或执行分段二次内插。16.如权利要求15所述的非暂态计算机可读介质,其中,执行分段二次内插包括:提供对不同范围的系数的不同查找表条目的访问,其中,仅用于负输入的系数被存储在不同的查找表条目中,并且用于正输入的系数从用于负输入的系数导出。17.一种图形处理装置,包括:存储器设备;以及图形处理单元gpu,包括至少一个执行单元,执行单元被配置成用于:将tanh应用操作执行为tanh指令、最小指令、以及一条乘法指令的组合;以及对输入值执行sigmoid操作,包括:基于所述输入值的范围,将输出钳制到固定值,或执行分段二次内插。18.如权利要求17所述的图形处理装置,其中:所述执行单元包括数学流水线和浮点单元fpu流水线。19.如权利要求18所述的图形处理装置,其中,为了执行tanh应用操作,所述数学流水线用于:如果x的值在第一范围内,则:确定tanh(x)/x以生成中间结果,并且将所述中间结果乘以x;或者如果所述x的值在第二范围内,则:确定tanh(x)以生成中间结果,并且将所述中间结果乘以值,其中,确定tanh(x)包括:执行二次内插操作,或钳制到固定值。20.如权利要求18所述的图形处理装置,其中,执行分段二次内插包括:访问不同范围的系数的不同查找表条目,其中,仅用于负输入的系数被存储在不同的查找表条目中,并且用于正输入的系数从用于负输入的系数导出。

技术总结
本申请公开了tanh和sigmoid函数执行。本文中描述的示例关于用于请求执行tanh指令和sigmoid指令的指令。例如,编译器可生成原生tanh指令以执行tanh。在一些示例中,tanh函数可被编译为三条指令,包括:用于取决于输入的值而执行tanh(输入)或tanh(输入)/输入以生成中间输出的指令;用于基于输入而引起执行比例因子的生成的指令;以及用于引起执行对中间结果与比例因子的乘法操作的指令。例如,可编译sigmoid函数以使数学流水线执行范围校验并基于范围来执行操作。于范围来执行操作。于范围来执行操作。


技术研发人员:穆帅 C
受保护的技术使用者:英特尔公司
技术研发日:2021.07.26
技术公布日:2022/2/28
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献