NVIDIA 在 CUDA -X AI 软件中发布更新和新功能

NVIDIA CUDA -X AI 是一个深入学习的软件堆栈，供研究人员和软件开发人员构建高性能 GPU – 用于对话 AI 、推荐系统和计算机视觉的加速应用程序。

了解 CUDA -X AI 工具和库的最新版本。有关 NVIDIA 开发工具的更多信息，请参加 NVIDIA GTC 上的在线研讨会、培训和“联系专家”课程。

有关更多信息，请参阅documentation中每个软件包的发行说明。

NVIDIA Triton 推理服务器

NVIDIA Triton ™ 推理服务器是一种开源的推理服务软件，它为生产中的应用程序提供快速、可扩展的 AI 模型。它支持每一个框架，在每一个基于 GPU 或 CPU 的本地、云中和边缘基础设施上运行。

更新内容包括：

业务逻辑脚本（测试版）：用于调用正在执行的 Python 模型中的其他模型的函数。
容器组合实用程序：使用特定后端和存储库代理创建自定义 Triton 容器。
NGC 上的两个新容器，从 Triton 21 . 08 开始
- nvcr . io / NVIDIA / Triton 服务器： 21 . 08-tf- Python -py3 – GPU 已启用 Triton 服务器，只有 TensorFlow 2 . x 和 Python 后端。
- nvcr . io / NVIDIA / Triton 服务器： 21 . 08-pyt- Python -py3 – GPU 已启用 Triton 服务器，仅具有 PyTorch 和 Python 后端。

TensorRT 是一个高性能深度学习推理平台。此版本包括：

NVIDIA NeMo 是一个开源工具包，用于开发最先进的对话人工智能模型。 NVIDIA 在 Interspeech 2021 上共享了新的语音处理research和使用 NeMo 的教程，包括：

有关所有已接受研究的链接，请访问 NVIDIA interspeech event page。

Maxine 提供加速实时视频效果（ VFX ）、音频效果（ AFX ）和增强现实（ AR ） SDK ，这些 SDK 具有最先进的基于 AI 的功能，用于构建虚拟协作和内容创建应用程序。

本版本的亮点包括：

虚拟背景（ VFX ）通过各种对象分割（椅子、衣服、麦克风）提供更高的流质量，对运动和光线变化的鲁棒性，以及在 GPU 密集工作负载下启用 CUDA 图形以减少延迟的选项。
超分辨率（ VFX ）增加了对 4K 视频输入分辨率的支持，具有 2 倍的高比例因子。
噪音消除（ AFX ）可以更好地保留语音，尤其是当输入本质上是情绪化的时。房间回声消除（ AFX ）在与噪音消除一起工作的同时，提高了整体质量。
三维人体姿态估计（ AR ）增强了身体关节位置和角度的准确性和时间稳定性。它还提供了关键点跟踪鲁棒性的身体四肢，同时伸出和到一边。
所有 Linux SDK 都支持 A100 、 A30 和 A10 MIG ，以确保跨 GPU 分区的性能一致。

NGC 目录是 GPU 优化容器、预训练模型、 SDK 和头盔图表的中心，旨在加速端到端 AI 工作流。更新内容包括：

Autovox 印地语 ASR 集装箱： Autovox 是 Cogknit 语义的语音操作系统平台，提供多种语言模型： ASR 、 MT 和 TTS 。此受限访问 ASR 容器将印地语音频转换为印地语文本。
丛式卫星容器–提供了一套丰富的工具，用于在核心 Scientific Plexus 软件堆栈上设置和管理孤立的联网 Kubernetes 群集。一个新特性允许 Plexus 平台通过 ssh 连接管理单个节点，而无需任何资源管理器。