DEVELOPER
首页
博客
论坛
论坛 (英文)
文档
下载
培训
Search
加入
生成式人工智能
2025年 10月 13日
使用 NVIDIA Dynamo 部署 72B 模型提升 PD 分离性能
在生产环境部署大模型推理服务时,技术团队往往会遇到诸多挑战,例如缺乏成熟的 PD 分离方案、自动扩缩容机制不够灵活、缺乏动态路由,
2 MIN READ
使用 NVIDIA Dynamo 部署 72B 模型提升 PD 分离性能
加载更多