NVIDIA 最近宣布推出 新一代 PC GPU – GeForce RTX 50 系列 ,以及面向开发者的全新 AI 赋能 SDK 和工具。GeForce RTX 50 系列由 NVIDIA Blackwell 架构 、第五代 Tensor Cores 和第四代 RT Cores 提供动力支持,在神经着色器、数字人技术、几何图形和照明等 AI 驱动渲染方面实现了突破。
今天,NVIDIA 发布了第一波适用于 GeForce RTX 50 Series GPUs 的 SDK。作为开发者,您可以开始将这些更新集成到您的应用中,以确保与 NVIDIA Blackwell RTX GPUs 的软件兼容性和最佳性能,并展示 GeForce RTX 50 Series GPUs 的新功能。
本文详细介绍了新的和更新的 SDK,这些 SDK 可助力开发者充分利用 NVIDIA Blackwell GeForce RTX 50 系列 GPUs。
改进的 AI 框架:CUDA、TensorRT 和 PyTorch
为确保与 GeForce RTX 50 系列兼容,建议开发者更新到最新版 AI 框架。
- CUDA 工具包 12.8 和 NVIDIA TensorRT 10.8 现已推出,可优化 RTX 50 系列 GPU 的 AI 性能。
- NVIDIA Blackwell RTX GPU 上适用于原生 Windows 的 PyTorch 更新已上传到 PyTorch GitHub 主库。适用于 Windows 的 PyPi 二进制文件和软件包将很快更新。
- NVIDIA Blackwell RTX GPU 上的 PyTorch for Linux x86_64 现在可在 每日版 本中使用。
有关将应用程序更新到最新 AI 框架的详细信息,请参阅适用于 NVIDIA Blackwell RTX GPU 的 软件迁移指南:CUDA 12.8、PyTorch、TensorRT 和 Llama.cpp 指南。
TensorRT 10.8 引入了对 FP4 的支持,与 RTX 4090 上的 FP16 精度相比,FP4 可将基于扩散的最新模型 (如 Flux) 的性能提升 2 倍以上。此外,TensorRT 10.8 还提供了 weight-stripped engines,以防止在为不同的 GPU arch 系列提供专用引擎时出现权重重复,从而提高内存利用率。此外, NVIDIA TensorRT-Cloud 现在支持最新的 GeForce RTX 50 Series GPUs,使开发者能够远程构建优化的推理引擎。
AI 驱动的游戏
GeForce RTX 50 系列 GPUs 和最新的 SDK 更新让开发者能够使用以下技术打造革命性游戏。
使用 NVIDIA DLSS 进行神经网络渲染
NVIDIA DLSS 是一套神经渲染技术,可利用 AI 提升 FPS、降低延迟并提高画质。 DLSS 4 由 GeForce RTX 50 系列 GPUs 和第五代 Tensor Cores 提供动力支持,引入了 DLSS 多帧生成技术,可额外生成多达三个帧,并与全套 DLSS 技术协同工作,相较于传统的强力渲染,帧率可提升高达 8 倍。此外,DLSS 光线重建、DLSS 超分辨率和 DLAA 技术现在由基于 Transformer 的模型提供支持,可改善所有 GeForce RTX GPUs 的图像和照明细节以及稳定性。
通过 NVIDIA Streamline 开始使用 DLSS。NVIDIA Streamline 是一种开源的交叉 IHV 解决方案,可简化将最新的 NVIDIA 和其他超分辨率技术集成到应用和游戏中的过程。
借助 NVIDIA ACE 让游戏角色如生
NVIDIA ACE 是一套数字人技术,可借助生成式 AI 让游戏角色和数字助理如生。现在,ACE 可让您在游戏或应用中为数字人轻松添加代理功能。它包括以下内容:
- 抢先体验版新的多模态 SLMs,适用于高级和自主代理工作流,并支持更长的上下文和复杂的推理任务。
- Audio2Face 3D NIM 使用实时音频提供先进的唇同步和面部动画。
借助 NVIDIA In-Game Inferencing SDK 简化 AI 模型部署
NVIDIA 游戏内推理 (IGI) SDK 可简化 PC 游戏开发者的 AI 模型部署和集成。SDK 预配置 PC 所需的 AI 模型、引擎和依赖项。它为 C++ 游戏编排进程内 AI 推理,并跨不同硬件加速器 (GPU、NPU、CPU) 支持所有主要推理后端。IGI SDK 现已为部分合作伙伴提供 beta 测试版,即将全面推出。
加速内容创作
支持在 Blackwell RTX GPU 上创建内容的全新和更新 SDK 包括以下内容。
使用 NVIDIA Maxine 增强视频会议效果
NVIDIA Maxine 是一系列高性能、易于使用的 NVIDIA NIM 微服务和 SDK 的集合,用于部署 AI 功能,以增强音频、视频和增强现实效果,从而实现视频会议和远程呈现。新功能包括:
- Studio Voice 可以使任何麦克风发出专业的声音。
- “Virtual Key Light” 可将面部重塑为使用虚拟按键光的效果 (即将推出)。
使用 NVIDIA Iray 生成逼真的图像
NVIDIA Iray SDK 是一种基于物理性质的直观渲染技术,可为交互式批量渲染工作流程生成逼真的图像。更新包括:
- 使用新的 NVIDIA MDL SDK 1.10 改进了漫反射和光泽 BRDF
- 改进了几何图形的镶嵌和位移
- 焦散的精确可靠渲染
- 新模式可自动启用和禁用焦散采样,从而提高渲染质量或性能
- 支持更快的集群或网络渲染
使用 NVIDIA Video Codec SDK 进行硬件加速的视频编码和解码
NVIDIA 视频编解码器 SDK 是一组 API,用于在 Windows 和 Linux 上执行硬件加速的视频编码和解码。更新包括:
- 支持 4:2:2 H.264、HEVC 编码和解码,以利用 Blackwell 中的第九代 NVENC 编码
- 推出 MV-HEVC 和 UHQ AV1,以提高编码质量
- 与前几代产品相比,每个 NVDEC 的显存解码优化和 2xH.264 解码吞吐量为 2 倍
这些更新即将通过 FFMPEG、Microsoft DXVA 和 MFT 框架使用。
使用 NVIDIA OptiX 优化光线追踪
NVIDIA OptiX SDK 是一个应用框架,用于在 GPU 上实现出色的光线追踪性能。它提供了一个简单、递归且灵活的工作流,用于加速光线追踪算法。OptiX 9.0 的更新包括:
- 集群 API,可加速大规模动态三角形网格的 BVH 构建
- 协作向量 API,用于在由 NVIDIA Tensor Core 加速的 OptiX 着色器程序中执行小型 AI 网络
- Blackwell GPU 上的硬件加速线性曲线
借助 NVIDIA RTX Video SDK 提升 AI 增强效果
NVIDIA RTX Video SDK 为创意和媒体播放应用提供 AI 增强效果技术,以提高清晰度和清晰度,并将 SDR 视频自动转换为 HDR。这些更新带来了新的神经网络,其性能提高了 40%,将 AI 放大应用于 10 位 HDR 视频,并支持 CUDA。
开始使用
准备好在全球超过 1 亿台 RTX PC 上试验、开发和优化新的 AI 功能了吗?在 NVIDIA RTX PC 上开始使用 AI。如需详细了解如何在 AI 应用中添加对 NVIDIA Blackwell RTX GPU 的支持以实现更高性能,请查看《Software Migration Guide for NVIDIA Blackwell RTX GPUs:CUDA 12.8、PyTorch、TensorRT 和 Llama.cpp 指南》。