Posts by Anish Maddipoti
代理式 AI/生成式 AI
2025年 9月 29日
利用 NVIDIA Run:ai 和 NVIDIA Dynamo 进行快速高效 LLM 推理的智能多节点调度
大语言模型的复杂性呈指数级增长,带来了诸多挑战,例如模型规模超出单个 GPU 的承载能力、对高吞吐量与低延迟工作负载的需求,
3 MIN READ
代理式 AI/生成式 AI
2025年 1月 6日
借助 NVIDIA Launchables 实现出色 NVIDIA AI 的一键式部署
AI 开发已成为现代软件工程的核心部分,NVIDIA 致力于寻找方法,为所有希望开始使用 AI 的开发者提供优化的加速计算。 为解决这一问题,
1 MIN READ