Posts by NVIDIA TensorRT-LLM 团队
生成式人工智能/大语言模型
2025年 7月 11日
突破延迟极限:在 NVIDIA Blackwell GPU 上优化 DeepSeek-R1 的性能
近年来,大语言逻辑推理模型取得了显著进步,但也带来了新的部署挑战。其中,因复杂的“思考与逻辑推理”过程而引起的输出序列长度 (OSL)…
3 MIN READ