nvcc

2025年 8月 27日
如何通过共享内存寄存器溢出来提高 CUDA 内核性能
当 CUDA 内核所需的硬件寄存器数量超过可用数量时,编译器会将多余的变量溢出到本地内存中,这一过程称为寄存器溢出。
3 MIN READ

2025年 5月 9日
CUDA C++ 编译器更新对 ELF 可见性和链接影响
在下一个 CUDA 主要版本 CUDA 13.0 中,NVIDIA 将对 NVIDIA CUDA 编译器驱动程序 (NVCC)…
4 MIN READ

2025年 5月 1日
NVIDIA Blackwell 和 NVIDIA CUDA 12.9 引入基于系列的架构特性
最早进入 NVIDIA GPU CUDA 平台的架构设计决策之一是支持 GPU 代码的向后兼容性。这种设计意味着,
3 MIN READ

2025年 3月 12日
了解 CUDA GPU 计算的汇编语言 PTX
并行线程执行(PTX)是一种虚拟机指令集架构,从一开始就是 CUDA 的一部分。您可以将 PTX 视为 NVIDIA CUDA GPU…
4 MIN READ

2025年 3月 10日
优化 CUDA C++ 编译时间
在现代软件开发中,时间是非常宝贵的资源,尤其是在编译过程中。对于在大规模 GPU 加速应用程序上使用 CUDA C++的开发者而言,
2 MIN READ