Posts by Tony Scudiero
        
                    开发与优化
        
        
        2025年 9月 29日
      
      释放 GPU 性能:CUDA 中的全局内存访问
                  
            管理内存是编写 GPU 内核时影响性能的关键因素之一。本文将为您介绍全局内存及其对性能影响的重要知识。 CUDA 设备上存在多种类型的显存,
                
          
            4 MIN READ
          
        
      
    
        
                    数据科学
        
        
        2025年 8月 6日
      
      CUDA 工具包 13.0 的新特性和重要更新
                  
            CUDA Toolkit 13.0 是该工具包的最新版本,具有加速最新 NVIDIA CPU 和 GPU 计算的优势。作为一项重大发布,
                
          
            4 MIN READ
          
        
      
    
        
                    数据中心/云端
        
        
        2025年 8月 4日
      
      GPU 架构支持导航:面向 NVIDIA CUDA 开发者的指南
                  
            如果您最近使用 NVIDIA CUDA 编译器 (NVCC) 开发 NVIDIA GPU 应用,您可能会遇到以下警告消息: 这究竟意味着什么,
                
          
             1 MIN READ
          
        
      
    
        
                    数据中心/云端
        
        
        2025年 7月 2日
      
      先进的 NVIDIA CUDA 内核优化技术:手写 PTX
                  
            随着加速计算不断提升 AI 和科学计算各个领域的应用程序性能,人们对 GPU 优化技术的兴趣也越来越浓厚,以确保应用程序获得尽可能好的性能。
                
          
            3 MIN READ
          
        
      
    
        
                    数据中心/云端
        
        
        2025年 5月 1日
      
      NVIDIA Blackwell 和 NVIDIA CUDA 12.9 引入基于系列的架构特性
                  
            最早进入 NVIDIA GPU CUDA 平台的架构设计决策之一是支持 GPU 代码的向后兼容性。这种设计意味着,
                
          
            3 MIN READ
          
        
      
    
        
                    模拟/建模/设计
        
        
        2025年 3月 12日
      
      了解 CUDA GPU 计算的汇编语言 PTX
                  
            并行线程执行(PTX)是一种虚拟机指令集架构,从一开始就是 CUDA 的一部分。您可以将 PTX 视为 NVIDIA CUDA GPU…
                
          
            4 MIN READ