Posts by 严春伟
        
                    代理式 AI/生成式 AI
        
        
        2025年 1月 2日
      
      TensorRT-LLM:LLM API 精简指令畅享卓越性能!
                  
            NVIDIA TensorRT-LLM 是一个专为 优化大语言模型 (LLM) 推理而设计的库。它提供了多种先进的优化技术 ,
                
          
            2 MIN READ