新一代 NVIDIA 图形硬件已经面世。由 NVIDIA Blackwell 提供支持的 GeForce RTX 50 系列 GPU 可提供突破性的全新 RTX 功能,例如支持多帧生成的 DLSS 4,以及支持 RTX Mega Geometry 和 RTX Neural Shaders 的 NVIDIA RTX Kit 。NVIDIA RTX Blackwell 架构采用第五代 Tensor Cores 来驱动 AI 工作负载和第四代 RT Cores,三角形交叉速率是上一代的两倍。它配备超快的 GDDR7 内存,可大幅提升总内存带宽。
NVIDIA Nsight 开发者工具 支持图形开发者使用 GeForce RTX 50 系列 GPUs 打造更加逼真的世界和仿真。
在 NVIDIA Nsight Graphics 中设计和优化光线追踪应用
NVIDIA Nsight Graphics 是一款用于设计、调试和优化游戏和其他图形应用的独立工具。在版本 2025.1 中,所有开发工作流现均可在 Blackwell GPUs 上使用:Frame Debugging、Ray Tracing Inspector、GPU Trace、Real Time Shader Profiler 和 Vulkan Shader Debugging。
对于从事优化工作的开发者而言, NVIDIA Blackwell 架构 的一项主要功能是显著提高了性能计数器观察功能,支持的计数器数量约为 NVIDIA Ada Lovelace 架构 的 8 倍。硬件性能计数器和管理软件堆栈—NVIDIA Nsight Perf SDK 库—构成了 Nsight Graphics GPU Trace 等性能分析工具的基础。
Blackwell 架构中的扩展计数器在流多处理器 (SM) 利用率和效率、线程束和资源占用率、缓存带宽、命中率等方面带来了革命性的新细节水平。GPU Trace 可在时间轴上、改进的表格和工具提示中显示这些计数器。由于能够同时收集更多计数器,因此您不必选择配置或重新运行应用程序。您只需一次运行即可收到所有内容。
NVIDIA Nsight Systems 中的系统级性能调优
NVIDIA Nsight Systems 自上而下地捕获图形应用程序的性能以及 CPU 和 GPU 的资源利用率。这样可以识别性能限制器,并将其与其他硬件事件关联,从而为调优活动提供指导。用例包括确定运行时中受 CPU 限制的部分与受 GPU 限制的部分、卡顿分析、图形 API 资源跟踪等。Nsight Systems 2025.1 增加了记录 Blackwell GPU 指标的功能。
使用 NVIDIA Nsight Aftermath SDK 诊断崩溃
NVIDIA Nsight Aftermath SDK 集成到 D3D12 和 Vulkan 应用中,可在发生异常或 TDR 时生成 GPU 崩溃报告,帮助开发者追踪和调试已部署应用中难以重现的错误。版本 2025.1 增加了在 Blackwell GPU 上生成崩溃报告的支持。应用应更新到最新的 SDK,以确保跨所有架构提供持续支持。
借助 NVIDIA Nsight Perf SDK 实现实时 HUD
NVIDIA Nsight Perf SDK empowers 您可以将 GPU 性能测量、可视化和报告生成功能直接引入自己的应用。它包含内置的 HUD 渲染器,可轻松实现实时的高级性能分诊。Nsight Perf SDK 还管理硬件性能计数器的基础,所有 Nsight 工具都是在此基础上构建的。版本 2025.1 全面支持 Blackwell 架构现已提供的单遍指标扩展功能集。
开始使用 Nsight Developer Tools
借助 Nsight Developer Tools 开发者工具,创造新世界并探索 AI 增强型神经渲染技术的强大功能。支持 NVIDIA RTX Blackwell 架构的全套工具现已推出。首先,下载最新版本:
- NVIDIA Nsight Graphics 2025.1
- NVIDIA Nsight Aftermath SDK 2025.1
- NVIDIA Nsight Systems 2025.1.1
- NVIDIA Nsight Perf SDK 2025.1
详细了解 Nsight Developer Tools ,并探索 Nsight Tools 的 教程 。 在 Nsight Developer Forums 上提出问题、提供反馈并与开发者社区互动。