Posts by 黄俊毓
生成式人工智能/大语言模型
2025年 10月 13日
使用 NVIDIA Dynamo 部署 72B 模型提升 PD 分离性能
在生产环境部署大模型推理服务时,技术团队往往会遇到诸多挑战,例如缺乏成熟的 PD 分离方案、自动扩缩容机制不够灵活、缺乏动态路由,
2 MIN READ