nvcc
    
        
          2025年 8月 27日
        
      
      如何通过共享内存寄存器溢出来提高 CUDA 内核性能
          当 CUDA 内核所需的硬件寄存器数量超过可用数量时,编译器会将多余的变量溢出到本地内存中,这一过程称为寄存器溢出。
        
      
        3 MIN READ
      
      
    
    
        
          2025年 5月 9日
        
      
      CUDA C++ 编译器更新对 ELF 可见性和链接影响
          在下一个 CUDA 主要版本 CUDA 13.0 中,NVIDIA 将对 NVIDIA CUDA 编译器驱动程序 (NVCC)…
        
      
        4 MIN READ
      
      
    
    
        
          2025年 5月 1日
        
      
      NVIDIA Blackwell 和 NVIDIA CUDA 12.9 引入基于系列的架构特性
          最早进入 NVIDIA GPU CUDA 平台的架构设计决策之一是支持 GPU 代码的向后兼容性。这种设计意味着,
        
      
        3 MIN READ
      
      
    
    
        
          2025年 3月 12日
        
      
      了解 CUDA GPU 计算的汇编语言 PTX
          并行线程执行(PTX)是一种虚拟机指令集架构,从一开始就是 CUDA 的一部分。您可以将 PTX 视为 NVIDIA CUDA GPU…
        
      
        4 MIN READ
      
      
    
    
        
          2025年 3月 10日
        
      
      优化 CUDA C++ 编译时间
          在现代软件开发中,时间是非常宝贵的资源,尤其是在编译过程中。对于在大规模 GPU 加速应用程序上使用 CUDA C++的开发者而言,
        
      
        2 MIN READ