Optimize Gemm on GPU

合适地选择Block Size和Grid Size

Block Size是指一个Block中的thread个数,增大block的数量一方面有利于提高程序的并行性,但是如果同一个block的thread之间存在线程的同步,则过大的block size会带来同步的overhead,导致SM利用率降低,而Grid Size是指Block的数量,如何好的

a hgemm tvm schedule Windows Server AMD 玄学驱动安装

Comments

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×