InfiniBand

2025年 8月 26日
行业协作共推 NVIDIA CPO 技术
NVIDIA 通过光、电组件的无缝集成,重塑数据中心互连新格局。这一突破的关键在于与整个行业的合作伙伴的紧密合作。
1 MIN READ

2025年 8月 18日
利用 CPO 技术扩展 AI 工厂,提高能效
随着 AI 重新定义计算格局,网络已成为构建未来数据中心发展的关键支柱。大语言模型的训练性能不仅取决于计算资源,更受到底层网络敏捷性、
2 MIN READ

2025年 7月 14日
借助 NCCL 2.27 实现快速推理和弹性训练
随着 AI 工作负载的扩展,快速可靠的 GPU 通信变得至关重要,这不仅适用于训练,而且越来越适用于大规模推理。
3 MIN READ

2025年 7月 10日
InfiniBand 多层安全保护数据中心和 AI 工作负载
在当今数据驱动的世界中,安全性不仅仅是一项功能,更是基础。随着 AI、HPC 和超大规模云计算的指数级增长,
1 MIN READ

2024年 11月 13日
NVIDIA Blackwell 在 MLPerf 训练 v4.1 中将 LLM 训练性能提高一倍
随着模型规模的扩大以及使用更多数据进行训练,它们的能力也随之提升,实用性也随之提升。为了快速训练这些模型,需要在数据中心规模上提供更高的性能。
3 MIN READ

2024年 10月 25日
利用 NVIDIA SHARP 网络计算提升系统性能
AI 和科学计算应用是分布式计算问题的绝佳示例。这些问题太大了,计算太密集,无法在单台机器上运行。这些计算被分解为并行任务,
2 MIN READ

2024年 10月 15日
NVIDIA SuperNIC 驱动新一代 AI 网络发展
在生成式 AI 时代,加速网络对于为大规模分布式 AI 工作负载构建高性能计算结构至关重要。NVIDIA 在该领域继续保持领先地位,
1 MIN READ

2024年 9月 6日
利用 NVIDIA Magnum IO NVSHMEM 3.0 实现跨平台应用程序的可移植性和兼容性增强
NVSHMEM 是一个并行编程接口,可为 NVIDIA GPU 集群提供高效且可扩展的通信。NVSHMEM 是 NVIDIA Magnum…
3 MIN READ

2024年 1月 23日
借助 NVIDIA Quantum InfiniBand 简化 AI 网络运营
一个常见的技术误区是,性能和复杂性直接相关。也就是说,高性能的实现也是实现和管理最具挑战性的。但是,在考虑数据中心网络时,情况并非如此。
1 MIN READ

2023年 11月 14日
高性能计算的能效:平衡速度与可持续性
计算世界正处于巨变的边缘。 对计算能力的需求,尤其是高性能计算 (HPC) 逐年增长,这也意味着能源消耗也在增长。然而,潜在的问题当然是,
4 MIN READ

2023年 10月 12日
适用于数据中心和 AI 时代的网络
十多年来,传统的云数据中心一直是计算基础设施的基石,满足了各种用户和应用程序的需求。然而,近年来,
1 MIN READ

2023年 7月 6日
新的 MLPerf 推理网络部门展示 NVIDIA InfiniBand 和 GPUDirect RDMA 功能
在 MLPerf Inference v3.0 中,NVIDIA 首次向新推出的 网络分割 投入,
3 MIN READ

2023年 5月 25日
为网络管理员导航生成式人工智能
我们都知道人工智能正在改变世界。对于网络管理员来说,人工智能可以以一些惊人的方式改善日常运营: 然而,
1 MIN READ

2023年 5月 15日
使用 Alpa 和 Ray 在大型 GPU 集群中高效扩展 LLM 训练
近年来,大型语言模型( LLM )的数量激增,它们超越了传统的语言任务,扩展到生成式人工智能这包括像 ChatGPT 和 Stable…
4 MIN READ

2023年 4月 5日
通过 AI 的全栈优化在 MLPerf 推理 v3.0 中创下新纪录
目前最令人兴奋的计算应用程序依赖于在复杂的人工智能模型上进行训练和运行推理,通常是在要求苛刻的实时部署场景中。需要高性能、
5 MIN READ