黄俊毓

黄俊毓，金山办公 · AI算力平台 · AI Infra工程师, 主要从事高性能推理系统架构及研发

Posts by 黄俊毓

生成式人工智能/大语言模型 2025年 10月 13日

在生产环境部署大模型推理服务时，技术团队往往会遇到诸多挑战，例如缺乏成熟的 PD 分离方案、自动扩缩容机制不够灵活、缺乏动态路由， 2 MIN READ