NVIDIA TensorRT-LLM 团队

NVIDIA TensorRT-LLM 团队

Posts by NVIDIA TensorRT-LLM 团队

生成式人工智能/大语言模型

突破延迟极限:在 NVIDIA Blackwell GPU 上优化 DeepSeek-R1 的性能

近年来,大语言逻辑推理模型取得了显著进步,但也带来了新的部署挑战。其中,因复杂的“思考与逻辑推理”过程而引起的输出序列长度 (OSL)… 3 MIN READ