AI 初创公司的关键在于了解现有工具和资源的潜力。从小型项目开始您的 AI 之旅,采用“爬行、行走、运行”的方法,在扩展到生产之前先学习早期成功经验。
根据德勤的一项调查 ,83% 的受访者表示他们的公司已经从人工智能项目中获得了中等(53%)或显著(30%)的经济效益。要取得成功,选择一个既灵活又安全的预生产环境至关重要,以便跟上迅速发展的技术。
虚拟桌面基础架构(Virtual Desktop Infrastructure,VDI)使 IT 团队能够为远程工作者提供桌面和应用程序虚拟化,使他们能够开展日常业务运营。虽然 VDI 已经诞生了十多年,但 GPU 技术的进步已发展为支持实时渲染和虚拟现实等尖端应用程序的能力。
GPU 架构 和 虚拟 GPU 软件 方面的突破使 VDI 成为公司启动 AI 项目的理想切入点,为开发和部署提供了一系列引人注目的优势组合。
借助 VDI 实现 AI
从您的数据中心构建 AI 虚拟工作站有三个基本要素:
- Tensor Core GPU :配备 Tensor Core 的 NVIDIA L4 0S 、NVIDIA L4 和 NVIDIA A10 等数据中心 GPU 可以显著提高生成式 AI 性能。最新一代的 Tensor Core 可将万亿参数生成式 AI 模型的训练速度提高 4 倍 ,将推理性能提高 30 倍。
- NVIDIA vGPU 软件 :NVIDIA RTX 虚拟工作站 (vWS),是 NVIDIA vGPU 软件版本的一部分,利用 NVIDIA RTX 技术来提高计算能力。该软件通过在多个虚拟机 (VM) 之间划分 GPU 资源,或将多个 GPU 分配给单个 VM,从而提高 IT 管理能力,并集中应用程序和数据。
- AI vWS 工具包 :针对不同用例,AI vWS 工具包提供快速入门指南、演练演示、部署指南和配置指南等参考信息,适用于 IT 和 AI 开发者。这些工具包包括 NVIDIA 开发者工具,如 NVIDIA AI Workbench 和 NVIDIA Developer Program ,以及对 NVIDIA NIM for Developer 的访问权限等,帮助您快速开发、自定义和微调 AI 项目,并将其集成到业务应用中。
AI 虚拟工作站的优势
使用现有的虚拟桌面基础设施(VDI)来构建 AI 虚拟工作站可为组织的 AI 工作带来以下优势:
- 经济高效的实施:使用 NVIDIA GPUs 和 NVIDIA RTX Virtual Workstation 可立即在通常支持生产力和图形应用程序的虚拟化基础设施上实现 AI 工作负载。IT 可以在同一平台内快速为数据科学家和开发者启动虚拟机,从而消除对新基础设施和验证的需求。
- 灵活性和可管理性:与传统企业应用不同,AI 应用随着模型大小的增加而迅速发展。NVIDIA vGPU 软件使 IT 能够将 GPU 划分为多个 vGPU,并即时调整 VM 框架缓冲区。支持不同用户类型(高级用户和知识工作者)或不同框架缓冲区(0.5-48 GB)在单个 GPU 上的能力可最大限度地提高 GPU 利用率。IT 可以集中基础设施管理,并将 VDI 的范围扩展到整个工作人员。
- 数据和安全性: VDI 可改善组织的整体安全性和灾难防护措施,同时确保设计、数据和知识产权集中存储在数据中心。将 AI 与 VDI 集成可避免 AI 孤岛,并确保遵守可见性、安全性和治理方面的 IT 标准,使 AI 更接近数据。
- 顺利过渡到生产:在预生产项目或概念验证验证 AI 有效性后,过渡到生产需要企业级稳定性、安全性和支持。像 NVIDIA AI Enterprise 这样的生产就绪型解决方案有助于实现这种无缝进步。
经过验证的性能,可加速 AI
NVIDIA RTX 虚拟工作站(vWS)可从数据中心实现 NVIDIA RTX 技术和 GPU 加速,从而实现出色的 AI 开发,使其成为开始 AI 之旅的组织的理想切入点。
图 2 显示,在测试 Llama-3-8B 模型以在 NVIDIA vWS 上构建 RAG 应用时,最新的 NVIDIA Ada Lovelace 架构 GPU L40S 可提供比 NVIDIA Turing 架构 GPU 高出 2 倍以上的加速。
根据同一测试,图 3 通过测量 GPU 共享对不同 GPU 分区选项 (从完整 GPU 到 L40S GPU 的一半和三分之一) 的总体吞吐量的影响,显示了 vGPU 可扩展性性能。
与直通相比,虚拟化 GPU 的总吞吐量明显更高,因为它们能够在多个虚拟机之间高效地共享资源。
通过使用 NVIDIA vGPU 技术,您的组织可以动态地将 GPU 资源分配给各种工作负载,从而最大限度地提高利用率并最小化空闲时间。这增强了需要密集加速处理的人工智能开发,同时还能随着需求的波动而提高可扩展性。
开始您的 AI 开发
借助现有资源,GPU 助力的虚拟桌面架构集敏捷性和灵活性于一身,这对于以可管理的规模采用人工智能(AI) 的公司至关重要。其最低的升级成本可确保您的组织可以投资人工智能(AI) 计划,而不会过度承受财务压力,同时保持运营效率和安全性。
有关更多信息,请参阅以下资源:
- 使用虚拟工作站加速 AI 开发
- NVIDIA vGPU 软件评估许可证 (免费 90 天许可证)
- AI vWS 工具包
NVIDIA RTX 虚拟工作站也在 各大 CSP 市场 上市,可立即使用。