高级 API 性能： CPU

本文介绍了使用 NVIDIA GPU 时的 CPU 最佳实践。要在应用程序中获得高且一致的帧速率，请参阅高级API 性能提示。

要从 NVIDIA GPU 中获得最佳性能，请将其与 CPU 上的高效工作委派配对。帧速率上限、卡顿和其他低于标准的应用程序性能事件通常可以追溯到 CPU 上的瓶颈。使用以下技巧来了解你应该做什么以及应该避免什么。

多线程和工作负载平衡

再多的 GPU 工作优化也无法克服 CPU 瓶颈。均匀平衡所有线程的工作，以获得最佳效果。

不推荐

CPU 密集型命令列表不应记录在其上ExecuteCommandLists被调用。典型的ExecuteCommandLists在给定帧的命令列表记录之后被序列化。将其与所有其他命令列表记录线程保持在一个单独的线程上，可以使后续的帧 CPU 工作从不那么复杂的负载平衡开始。
细粒度查询的使用增加了 CPU 开销，例如在绘制调用的计时方面。

执行命令列表和多个命令队列

ExecuteCommandLists向 GPU 提交一个命令列表数组（ ECL ）以供执行。 NVIDIA 硬件支持多个命令队列以并行化图形工作，使图形计算或计算工作能够同时执行。

资源分配和销毁

创建和销毁缓冲区、纹理和着色器是高效计算机图形的基础。

构建光线跟踪加速度结构

光线跟踪加速结构是组织场景的几何信息以优化光线和场景对象之间的相交测试的数据结构。BuildRaytracingAccelerationStructure使用场景几何体执行加速度结构的初始构造。

CreatePipelineState 和 CreateStateObject

CreatePipelineState用于创建渲染管道状态对象，该对象定义图形管道的配置。管道状态对象封装执行图形命令所需的所有状态，例如输入布局、着色器程序、混合状态、深度模具状态和光栅化器状态。

CreateStateObject使开发人员能够创建一个状态对象，将图形管道的状态封装为一个整体。状态对象包括使用创建的管道状态对象CreatePipelineState，以及其他状态信息，如视口、剪刀形矩形和输入布局。

不推荐

避免不必要地创建管道状态对象和光线跟踪对象。这些操作涉及着色器创建，这可能会消耗大量的 CPU 周期。着色器复杂性直接影响创建调用的复杂性。

高级 API 性能： CPU

多线程和工作负载平衡

推荐

不推荐

执行命令列表和多个命令队列

推荐

资源分配和销毁

推荐

构建光线跟踪加速度结构

推荐

CreatePipelineState 和 CreateStateObject

推荐

不推荐

Tags

关于作者

高级 API 性能： CPU

多线程和工作负载平衡

推荐

不推荐

执行命令列表和多个命令队列

推荐

资源分配和销毁

推荐

构建光线跟踪加速度结构

推荐

CreatePipelineState 和 CreateStateObject

推荐

不推荐

Tags

关于作者

Related posts

在 Direct3D 12 中使用工作图推进 GPU 驱动的渲染

释放 Phi-2 小语言模型在聊天、研究、编码等领域的强大功能

借助由 NVIDIA 提供支持的新款 Varjo XR-4 系列头显设备，增强沉浸式体验

限制 CPU 线程以获得更好的游戏性能

使用新的 NVIDIA AI 基础模型生成代码、回答查询并翻译文本