Posts by Justin Luitjens
        
                    模拟/建模/设计
        
        
        2025年 8月 4日
      
      CUDA 专业提示:通过矢量化内存访问提高性能
                  
            许多 CUDA 内核受带宽限制,新硬件中 FLOPS 与带宽的比例不断增加,导致更多内核受带宽限制。因此,
                
          
            2 MIN READ
          
        
      
    
        
                    Uncategorized
        
        
        2022年 2月 24日
      
      在 Nvidia MATX 中用 Python 语法加速 C ++的数值计算
                  
            Rob Smallshire 曾经说过,“你可以在 C ++中编写更快的代码,但是在 Python 中编写代码更快。”自从它发布超过十年前,
                
          
            2 MIN READ