News

使用新的 Nsight Compute 改进导航和性能可视化

 

NVIDIA Nsight Compute 是一款用于 CUDA 应用程序的交互式内核分析器。它通过用户界面和命令行工具提供详细的性能指标和 API 调试。 Nsight Compute 2022.2 包含扩展支持的环境和工作流程的功能,用于 CUDA 内核评测和优化。

立即下载。>>

以下概述了 Nsight Compute 2022.2 的功能亮点。

NVIDIA OptiX 加速结构查看器

使用新的 NVIDIA OptiX acceleration structure viewer ,用户可以在启动光线跟踪管道之前检查他们构建的结构。加速结构描述渲染场景的几何体,用于光线跟踪交点计算。用户创建这些加速结构, OptiX 将其转换为内部数据结构。有时,用户创建的描述很容易出错,很难理解渲染结果为什么不符合预期,或者是什么限制了性能。

有了这个新功能,用户可以在三维可视化工具中浏览它们,并查看创建过程中使用的参数,如构建标志、三角形网格顶点和 AABB 坐标。此查看器可用于识别重叠或低效的层次结构,从而产生亚像素光线跟踪性能。

Nsight Compute Acceleration Structure Viewer provides 3D Scene Navigation and metrics]
图 1 :。带 3D 场景导航的 Nsight Compute acceleration structure viewer

每个内核的问题检测

最新版本在摘要页面中添加了一个新的“检测到的问题”列,用户可以根据检测到的性能问题的数量对所有分析的内核进行排序。这为用户提供了在多个结果(内核配置文件)中集中精力的指导。如果用户不确定要将优化工作集中在哪个内核上,那么一个长时间运行且检测到大量问题的内核是一个很好的起点。

The Issues Detected Column in the Summary Page identifies kernels with the most performance issues
图 2 :。摘要页面中的“检测到的问题”列标识性能问题最多的内核

其他改进

源页面上的度量分组和选择选项有改进,使其更易于使用。此外,此版本还增加了对在基于 ARM SBSA 和 L4T 的平台上运行 Nsight Compute 用户界面的支持,用户无需远程连接或单独的主机即可进行配置。

查看以下 NVIDIA GTC 2022 发布的课程,展示 Nsight 工具功能、对 Jetson Orin 的支持等。

Nsight 计算资源