Divya Shanmughan

Divya Shanmughan 是 NVIDIA 的高级编译器工程师。她拥有德克萨斯大学奥斯汀分校的硕士学位。

Posts by Divya Shanmughan

数据中心/云端

如何通过共享内存寄存器溢出来提高 CUDA 内核性能

当 CUDA 内核所需的硬件寄存器数量超过可用数量时,编译器会将多余的变量溢出到本地内存中,这一过程称为寄存器溢出。 3 MIN READ