NCCL

2025年 1月 31日
NVIDIA 集合通信库 2.23 促使新的缩放算法和初始化方法的诞生
NVIDIA 集合通信库 (NCCL) 可实现针对 NVIDIA GPU 和网络进行优化的多 GPU 和多节点通信基元。
2 MIN READ

2024年 10月 25日
利用 NVIDIA SHARP 网络计算提升系统性能
AI 和科学计算应用是分布式计算问题的绝佳示例。这些问题太大了,计算太密集,无法在单台机器上运行。这些计算被分解为并行任务,
2 MIN READ

2024年 9月 16日
借助 NVIDIA 集合通信库实现显存高效、快速初始化和成本估算优化 2.22
在过去几个月中,NVIDIA 集合通信库(NCCL)开发者一直在努力开发一系列新的库功能和错误修复。在本文中,我们将讨论 NCCL 2.22…
2 MIN READ

2024年 9月 6日
利用 NVIDIA Magnum IO NVSHMEM 3.0 实现跨平台应用程序的可移植性和兼容性增强
NVSHMEM 是一个并行编程接口,可为 NVIDIA GPU 集群提供高效且可扩展的通信。NVSHMEM 是 NVIDIA Magnum…
3 MIN READ

2024年 4月 26日
使用张量并行技术进行自动驾驶感知模型训练
由于采用了多摄像头输入和深度卷积骨干网络,用于训练自动驾驶感知模型的 GPU 内存占用很大。
3 MIN READ

2024年 3月 6日
CUDA 工具包 12.4 增强对 NVIDIA Grace Hopper 和机密计算的支持
最新版本的 CUDA 工具包,即 版本 12.4,继续利用最新的 NVIDIA GPU 来推动加速计算性能。
3 MIN READ

2023年 10月 12日
适用于数据中心和 AI 时代的网络
十多年来,传统的云数据中心一直是计算基础设施的基石,满足了各种用户和应用程序的需求。然而,近年来,
1 MIN READ

2023年 5月 29日
使用 NVIDIA Spectrum-X 网络平台进行涡轮增压生成 AI 工作负载
大型语言模型( LLM )和人工智能应用程序,如ChatGPT和 DALL-E 最近出现了快速增长。由于 GPU 、 CPU 、 DPU 、
2 MIN READ

2023年 5月 25日
为网络管理员导航生成式人工智能
我们都知道人工智能正在改变世界。对于网络管理员来说,人工智能可以以一些惊人的方式改善日常运营: 然而,
1 MIN READ