Optimize Gemm on GPU Aug 24 2022 Technical a few seconds read (About 102 words) 合适地选择Block Size和Grid SizeBlock Size是指一个Block中的thread个数,增大block的数量一方面有利于提高程序的并行性,但是如果同一个block的thread之间存在线程的同步,则过大的block size会带来同步的overhead,导致SM利用率降低,而Grid Size是指Block的数量,如何好的 #Digilal Design #EEEE a hgemm tvm schedule Windows Server AMD 玄学驱动安装
Comments