Posts by Matheen Raza
AI 平台/部署
2025年 5月 21日
NVIDIA Dynamo 加速 llm-d 社区计划,推动大规模分布式推理
在 Red Hat Summit 2025 上推出的 llm-d 社区标志着开源生态系统在加速生成式 AI 推理创新方面迈出了重要一步。
1 MIN READ
AI 平台/部署
2025年 4月 9日
借助 Rafay 为企业 AI 工作负载提供 NVIDIA 加速计算
生成式 AI 在全球的应用推动了全球对加速计算硬件的巨大需求。在企业中,这加快了加速私有云基础设施的部署。在地区层面,
2 MIN READ
数据中心/云端
2024年 9月 30日
使用 NVIDIA NIM Operator 在 Kubernetes 上管理 AI 推理流程
NVIDIA NIM 微服务 是一套易于使用的云原生微服务,可缩短产品上市时间,并简化生成式 AI 模型在云、数据中心、
2 MIN READ