数据中心/云端

NVIDIA vGPU 19.0 支持 NVIDIA Blackwell GPU 的图形和 AI 虚拟化功能

虚拟化长期以来一直承诺提高效率和可扩展性。然而,由于图形和计算工作负载的需求不断增加,以及需要找到经济高效的解决方案来提高用户密度,挑战依然存在。NVIDIA RTX PRO 6000 Blackwell 系列是首款支持 NVIDIA 多实例 GPU (MIG) 的 GPU,旨在加速图形和计算工作负载。最近发布的 NVIDIA 虚拟 GPU (vGPU) 19.0 利用 NVIDIA RTX PRO 6000 Blackwell 服务器版 GPU 和 NVIDIA RTX PRO 服务器的功能,为虚拟化数据中心提供卓越的可扩展性和更高的投资回报率。

本文详细介绍了 NVIDIA vGPU 19.0 版本的主要亮点,包括 NVIDIA RTX PRO Blackwell GPU 的增强功能、新的 AI vWS 工具套件以及其他功能。

NVIDIA Blackwell 和 NVIDIA vGPU 如何提升 AI 虚拟化工作负载的性能?

作为终极数据中心 GPU,NVIDIA RTX PRO 6000 Blackwell 服务器版配备 96 GB 超高速 GDDR7 显存。它专为加速最苛刻的企业工作负载而设计,从多模态 AI 推理和物理 AI 到科学计算、图形和视频应用。

NVIDIA vGPU 19.0 为这个多功能平台提供全面支持,包括 NVIDIA RTX PRO 6000 Blackwell 服务器版 GPUNVIDIA RTX PRO 服务器,显著提升了 AI 时代所有虚拟化工作负载和虚拟桌面的性能。

Performance chart of RTX PRO 6000 Blackwell GPU versus L40S. NVIDIA RTX PRO 6000 GPU delivers better performance compared to the NVIDIA L40S GPU: 2.3x acceleration in Siemens UFX, 2x in Dassault Abaqus, 1.9x in Autodesk Arnold, 3.5x in NVIDIA Omniverse, and 5.6x in running Llama 3 70B model.
图 1。与 NVIDIA L40S GPU 相比,NVIDIA RTX PRO 6000 Blackwell GPU 在各种工作负载中可提供高达 5.6 倍的加速性能。

如何通过 MIG 和 vGPU 最大限度地提高 GPU 利用率

NVIDIA MIG 技术可将单个 GPU 空间划分为多个独立实例,每个实例都有自己的显存、缓存、引擎和 SM。这可提供增强的服务质量 (QoS) ,确保 MIG 上的各个工作负载能够不间断地执行。通过将 NVIDIA vGPU 技术(一种时间切片 GPU 共享方法)与支持 MIG 的 GPU 结合使用,用户可以在每个 MIG 中建立多租户。这使得高可扩展性成为可能,并使集成基础设施能够在单个 GPU 上支持各种工作负载。

视频 1。详细了解 MIG 和 vGPU 如何协同工作以满足不同的用例需求

NVIDIA vGPU 19.0 和 NVIDIA RTX PRO Blackwell GPU 在启用 MIG 后,单个 GPU 上最多可支持 48 个并发虚拟机 (VM) 。该配置能够管理各种工作负载,例如业务运营、视频流、图形渲染、产品设计和 AI 开发。

 Illustration showing a configuration where up to 48 VMs are sharing a single NVIDIA RTX Pro 6000 Blackwell Server Edition GPU with NVIDIA vGPU technology. NVIDIA vGPU can partition each MIG up to 12 VMs. When using RTX PRO 6000 Blackwell GPU that has 4 MIG together with NVIDIA vGPU, IT can create the maximum user density up to 48 VMs.
图 2。NVIDIA vGPU 软件与支持 MIG 的 RTX PRO 6000 Blackwell 一起提供高达 48 个 VM 的最大用户密度

如何通过 3B 配置满足现代应用日益增长的需求

对虚拟协作、丰富媒体和快速信息访问的需求日益增长,突显了工作方式的重大转变。内部测试表明,Windows 11 上的知识工作者应用的 GPU 显存占用率比 Windows 10 高 60%。为了解决这个问题,NVIDIA vGPU 19.0 引入了 NVIDIA 虚拟 PC (vPC) 的新 3B 配置文件。此项新增功能旨在增强需要更多加速图形的现代应用程序的用户体验,同时提高服务器的可扩展性和用户密度。

如何使用新的 AI vWS 工具包构建代理式 RAG

NVIDIA AI 虚拟工作站 (vWS) 工具包通过提供专门针对现有虚拟化环境的详细部署指南和规模建议,为 AI 开发提供简化的方法。一个新的附加工具包 Building an Agentic RAG 专注于创建使用检索增强生成 (RAG) 从文档和网络搜索中动态检索信息并提高响应质量的 AI 智能体。如需了解更多信息,请观看 AI vWS 演示视频

基于虚拟化的安全支持

基于虚拟化的安全 (VBS) 使用硬件虚拟化和 hypervisor 来创建一个与操作系统分开的隔离虚拟环境,以保护敏感的流程和数据,即使操作系统受到攻击。NVIDIA vGPU 19.0 现在支持 Microsoft Azure Local 和 Microsoft Windows Server 虚拟机管理程序的 VBS,从而增强了虚拟化环境的安全性。这对于金融服务、医疗健康和政府等受到严格监管的行业尤其有益。

NVIDIA vGPU 现已在 AWS 上提供

NVIDIA L4 Tensor Core GPU 加速的 Amazon EC2 G6f 实例现已提供分数 vGPU 解决方案,提供经济高效且可扩展的选项。这些实例有五种大小,从八分之一 GPU(3 GB GPU 显存)到一半 GPU(12 GB GPU 显存)。用户可以根据需要选择精确的 GPU 资源,以满足自然语言处理、图形工作负载、游戏流式传输等加速工作负载的需求。

NVIDIA nVector 与 Login Enterprise 集成

NVIDIA nVector 是一款基准测试工具,用于大规模模拟知识工作者的工作流。最近,NVIDIA 与 Login VSI 的 VDI 解决方案 Login Enterprise(用于图像、应用和桌面的性能和可扩展性测试)进行了集成,为支持 GPU 的 VDI 环境提供自动化测试和监控。该联合解决方案可以评估和展示主流应用的图形响应速度和 CPU 卸载,同时提供全面的性能分析,以确保大规模的用户体验。

There are examples of performance analysis results of GPU versus non-GPU testing by using Login VSI and NVIDIA nVector, such as user experience score, frames per second, CPU usage, and more.
图 3。使用 Login Enterprise 和 NVIDIA nVector 进行 GPU 与非 GPU 测试的性能分析示例

开始在虚拟化环境中提升性能

NVIDIA vGPU 软件的最新版本引入了先进功能,可让更多用户和工作负载充分利用 NVIDIA RTX PRO Blackwell GPU。通过增加对 3B 配置文件的支持并与 Login VSI 集成,NVIDIA vGPU 为加速现代应用程序和虚拟化环境中的稳定性能提供了一个全面的解决方案。

标签