Yoed Ginzburg

Yoed Ginzburg 是 NVIDIA 的软件工程团队主管,致力于通过采用虚拟化和容器化领域的资源管理技术来探索和构建先进的 GPU 共享技术。在此之前,Yoed 曾在 Run:ai on Run:ai GPU 分数和 GPU 显存交换技术部门工作,并于 2024 年加入 NVIDIA,参与 Run:ai 收购。Yoed 热衷于提高高性能和利用率,并对编排、操作系统和低级编程感兴趣。

Posts by Yoed Ginzburg

AI 平台/部署

降低模型部署成本,同时通过 GPU 显存交换保持性能

大规模部署大语言模型(LLM)面临双重挑战:一方面需保障高需求时段的快速响应能力,另一方面又要有效控制 GPU 成本。组织通常面临两难选择: 2 MIN READ