Robin Kobus

Robin Kobus 是 NVIDIA 的高级 AI 开发者技术工程师。他的工作重点是优化 TensorRT-LLM 中的大语言模型推理。Robin 在德国 Mainz 的 Johannes Gutenberg 大学学习数学和计算机科学。在他的博士论文中,他研究了生物信息学算法在多 GPU 系统上的加速。

Posts by Robin Kobus

生成式人工智能/大语言模型

NVIDIA TensorRT-LLM 现支持 Recurrent Drafting,实现 LLM 推理优化

Recurrent Drafting (简称 ReDrafter) 是苹果公司为大语言模型 (LLM) 推理开发并开源的一种新型推测解码技术, 2 MIN READ