我们每周的综述包括最新的软件更新、学习资源、活动和值得注意的新闻。本周我们有几个软件发布
软件发布
在 HPC SDK 中利用标准语言实现可移植和高性能代码
NVIDIA HPC SDK 是一套完整的编译器、库和工具,用于开发加速的 HPC 应用程序。通过各种灵活的支持选项,用户可以创建与他们的情况最相关的编程模型的应用程序。
HPC SDK 提供了多种编程模型,包括性能优化的插件库、标准语言、基于指令的方法,以及 CUDA 提供的专门化。最近的许多改进都是在标准语言支持的领域中进行的,例如 ISO C ++、 ISO FORTRAN 和 Python 。
NVIDIA HPC 编译器使用这些语言的公共规范的最新进展,提供了一种既可移植又可用于缩放 GPU 加速平台的有生产力的编程环境。
请访问我们的网站下载新的 HPCSDK 版本 22.3 ,并在“参考资料”部分阅读我们关于使用标准语言进行并行编程的新帖子。
利用NVIDIA CuQuin SDK 加速量子电路仿真
cuQuantum –用于加速量子电路模拟的 SDK
NVIDIA cuQuantum 是一个 SDK ,包含用于加速量子计算工作流的优化库和工具。开发者可以使用 cuQuantum ,同时更轻松、可靠地创建和验证新算法。对于状态向量和张量网络方法,将量子电路模拟速度提高几个数量级有助于开发人员更快地模拟更大的问题。
扩大生态系统整合和合作
cuQuantum 现在作为后端集成在流行的行业模拟器中。它也是量子应用开发平台的一部分,用于推动从化学到气候建模等领域的大规模量子研究。
新设备测试版提供 SDK
cuQuantum SDK 现在是 GA ,可以免费下载。 NVIDIA 还打包了一个优化的测试版软件容器, cuQuantum DGX 设备,可从 NGC 目录中获得。
了解更多: cuQuantum SDK
使用 Nsight Graphics 2022.2 提高光线跟踪应用程序性能
Nsight Graphics 是一种性能分析工具,旨在可视化、分析和优化编程模型。它还可以在 CPU 和 GPU 的任何数量或大小上进行有效调整,从工作站到超级计算机。
Nsight Graphics 2022.2 的最新功能包括:
- AABB 叠加热图显示
- 着色器计时热图(支持 D3D12 / Vulkan + RT )
- 显示了使用 GPU 和 ETW 的其他过程
- Vulkan 视频扩展
现在下载: Nsight Graphics 2022.2
使用 Nsight Systems 2022.2 简化系统分析和调试
Nsight Systems 是一个分类和性能分析工具,旨在在系统范围内跟踪 GPU 工作负载到其 CPU 来源。这些功能可以帮助您分析应用程序的 GPU 利用率、图形和计算 API 活动,以及操作系统运行时操作。这有助于优化您的应用程序,以便在 CPU 和 GPU 的任何数量或大小上高效地执行和扩展,从工作站到超级计算机。
What’s new:
- NVIDIA NIC 以太网标准采样
- Vulkan 内存操作和警告
- Vulkan 图形管道库
- 多报表视图增强功能
现在下载: Nsight Systems 2022.2
使用 Nsight Deep Learning Designer 2022.1 进行高级深度学习模型设计
NVIDIA Nsight Deep Learning Designer 是一个集成开发环境,帮助开发人员高效地设计和部署用于应用内推理的高性能深度神经网络。
Features include:
- 支持嵌套模板,允许开发人员轻松创建分层模型图。
- 改进了 NeuralEditor 中类型检查过程的性能,以及 PyTorch 导出器的整体用户体验。
- 支持在分析模式下保存所有张量。
- 新的纯标量常量输入层和新的分析层——信号注入器。
- BatchNorm 层和高端层的性能改进。
- 支持在高比例层中向下缩放和固定大小缩放。
增强版 CUDA 11.6 ,更新版 1 ,适用于所有新 SDK 的平台
此 CUDA 工具包版本的重点是增强 CUDA 应用程序的编程模型和性能。 CUDA 11.6 附带 R510 驱动程序,这是一个更新分支。 CUDA 工具包 11.6 ,更新 1 ,可下载。
What’s new:
- GSP 驱动程序架构现在是 NVIDIA Turing and Ampere GPU 的默认配置。
- 用于禁用实例化图中节点的新 API 。
- 完全支持 128 位整数类型
- 协作组名称空间更新
- CUDA 编译器更新
- Nsight Compute 2022.1 版本
了解更多信息: CUDA 工具包 11.6 ,更新 1
借助 cuNumeric 向 Python 提供分布式加速计算
NVIDIA cuNumeric 是一个 Legate 库,希望在 Legion 运行时之上提供 NumPy API 的替代品。这将分布式和加速计算在NVIDIA 平台上 Python 社区。
What’s new:
- 透明地加速和扩展现有 NumPy 工作流
- 最佳可扩展到数千个 GPU
- 需要零代码更改以确保开发人员的工作效率
- 免费提供,从 GitHub 或 Conda 开始
了解更多: cuNumeric
Warp 帮助 Python 编码器进行 GPU 加速图形模拟
Warp 是一个 Python 框架,它为程序员提供了一种用 NVIDIA Omniverse 和 OmniGraph 编写 GPU 加速、基于内核的程序的简便方法。通过 Warp , Omniverse 开发者可以创建 GPU 加速的 3D 仿真工作流和奇妙的虚拟世界!
What’s new:
- Python 中基于内核的代码
- 可微规划
- 内建几何处理
- 基于本地代码的 PAR 仿真性能
- 缩短上市时间,改进迭代时间
了解更多: Warp