Harry Kim

Harry Kim 是 NVIDIA 的首席产品经理,通过 Triton 实现高性能和可扩展的 AI/ML 推理。他在 Meta 的推荐系统、Intel AI 的 AI 基础架构以及 Google 的广告排名和推荐系统方面拥有丰富的工作经验。他拥有加州大学伯克利分校的统计学博士学位。

Posts by Harry Kim

AI 平台/部署

NVIDIA Dynamo 加速 llm-d 社区计划,推动大规模分布式推理

在 Red Hat Summit 2025 上推出的 llm-d 社区标志着开源生态系统在加速生成式 AI 推理创新方面迈出了重要一步。 1 MIN READ
数据中心/云端

NVIDIA Dynamo 新增 GPU 自动缩放、Kubernetes 自动化和网络优化功能

在 NVIDIA GTC 2025 上,我们宣布推出 NVIDIA Dynamo ,这是一种高吞吐量、低延迟的开源推理服务框架, 2 MIN READ
数据中心/云端

隆重推出 NVIDIA Dynamo:用于扩展推理AI模型的低延迟分布式推理框架

NVIDIA 今天在 GTC 2025 宣布发布 NVIDIA Dynamo 。NVIDIA Dynamo 是一个高吞吐量、 4 MIN READ
数据中心/云端

使用 NVIDIA GenAI-Perf 和 OpenAI 兼容 API 测量生成式 AI 模型性能

NVIDIA 提供 Perf Analyzer 和 Model Analyzer 等工具,帮助机器学习工程师测量和平衡延迟与吞吐量之间的权衡, 2 MIN READ