Harrison Barclay

Harrison Barclay 是 NVIDIA 的高级性能架构师,致力于确保 DL 内核性能达到光速。他毕业于德克萨斯大学奥斯汀分校,拥有电气和计算机工程硕士学位。

Posts by Harrison Barclay

AI 平台/部署

借助启发式算法和 CUTLASS 4.2 提高 NVIDIA GPU 上的 GEMM 内核自动调整效率

为特定问题和硬件选择合适的通用矩阵乘法(GEMM)核函数是一项重大挑战。GEMM 核函数的性能由一系列编译时和运行时的元参数共同决定, 2 MIN READ