NVIDIA Holoscan for Media 是一个 NVIDIA 加速平台,专为多供应商实时制作和 AI 而设计。它将在 GTC 上展示,重点介绍可增强实时制作工作流的 NVIDIA NIM、AI SDK 和微服务。
容器编排平台基于 Kubernetes 构建,通过 NVIDIA 组件 (例如 GPU 和网络运算符)、ST 2110 的性能调优和监控堆栈简化了媒体计时、同步和管理。参考应用使用 NVIDIA Rivermax、NVIDIA NMOS 和 NVIDIA DeepStream SDK,使您能够从一开始就运行真实的直播媒体工作流。
Holoscan for Media 通过将新一代模型与未压缩的直播媒体管线连接起来,提供创新的观众体验和制作流程,从而加速行业对 AI 的采用。
借助 NVIDIA NIM 革新 AI 视频和音频管道
NIM 作为通过 Helm 图表部署在 Kubernetes 上的可下载微服务,提供具有最佳推理性能和可靠性的参考 AI 模型。Holoscan for Media 基于完全相同的架构构建,可实现多供应商应用程序部署,并通过 ST 2110 和 NMOS 促进未压缩媒体支持。
在 GTC 2025 上,我们将现场展示 AI SDK、微服务和代码示例如何为媒体制作提供支持:包括使用 NVIDIA 的 GPU 和 DPU 加速媒体工作流,使用 PyTorch 和 cuOpt 进行分布式渲染,使用 LangChain 和 Llama 3 8B Instruct 进行 AI 驱动的内容创建,以及使用 Stable Diffusion 进行 AI 驱动的图像和视频编辑。
- 参考代码示例,用于将 ST 2110 音频流连接到 NVIDIA Riva 自动语音识别 (ASR) NIM 微服务,以进行实时转录和搜索。
- 人员检测和识别,为 ST 2110 视频中的虚拟摄像头提供下一代升级(超分辨率、降噪和去模糊)。

NVIDIA 正在为直播媒体构建下一阶段的 AI NIM 微服务和 SDK。
面向直播媒体开发者的更多内容
Holoscan for Media 平台的新版本 (版本 25.4) 也提供了新工具:
- 提高了单节点 OpenShift 生产环境的自动化程度,并支持更多网络变体
- 完整的监控堆栈,包含可在 Red Hat OpenShift 生产环境中运行的平台和应用程序指标和仪表板,以及面向使用 NVIDIA Cloud Native Stack 的开发者的开源 Kubernetes。
- 更新的开发者部署指南
- 支持 Red Hat OpenShift 4.16 版本和 NVIDIA 驱动 R570

我们执行了扩展的 200GbE 基准测试,包括压力测试和流冗余,每个接口可实现 17 个未压缩的 4K60 视频流和 71 个未压缩的 1080p60 视频流。所有产品都完全符合 ST 2110 规格,提供无与伦比的密度。
最后但并非最不重要的一点是,您可以在 NVIDIA LaunchPad 上托管的专用 Holoscan for Media 生产环境上验证您的应用程序集成。如需访问 LaunchPad 实验室,请联系 Holoscan-Media-Support@nvidia.com 。
开始使用 Holoscan for Media
探索在线文档并 从 NGC 下载 Holoscan for Media 。
在 GTC 2025 上深入了解 Holoscan for Media!参加 Connecting NIM Microservices to Uncompressed Video Pipelines with Holoscan for Media 会议,并在展厅寻找演示。