Posts by 金国强
        
                    模型/库/框架
        
        
        2025年 6月 26日
      
      在魔搭社区使用 NVIDIA TensorRT-LLM PyTorch 新架构优化 Qwen3 系列模型推理
                  
            摘要: TensorRT-LLM 采用 PyTorch 全新架构进一步优化模型部署流程,提升开发者使用体验。
                
          
            2 MIN READ
          
        
      
    
        
                    代理式 AI/生成式 AI
        
        
        2025年 5月 30日
      
      在阿里云 PAI 上一键部署和使用 NVIDIA Cosmos Reason-1 模型
                  
            NVIDIA 近期发布了 Cosmos Reason-1 的 7B 和 56B 两款多模态大语言模型 (MLLM),它们经过了“物理 AI…
                
          
            3 MIN READ
          
        
      
    
        
                    Uncategorized
        
        
        2024年 9月 2日
      
      使用 NVIDIA NIM 在阿里云容器服务(ACK)中加速 LLM 推理
                  
            大语言模型(LLM)是近年来发展迅猛并且激动人心的热点话题,引入了许多新场景,满足了各行各业的需求。随着开源模型能力的不断增强,
                
          
            4 MIN READ