NVLink

2025年 7月 14日
借助 NCCL 2.27 实现快速推理和弹性训练
随着 AI 工作负载的扩展,快速可靠的 GPU 通信变得至关重要,这不仅适用于训练,而且越来越适用于大规模推理。
3 MIN READ

2025年 7月 7日
提出一个维基百科规模的问题:如何利用数百万 token 的实时推理使世界更加智能
现代 AI 应用越来越依赖于将庞大的参数数量与数百万个令牌的上下文窗口相结合的模型。无论是经过数月对话的 AI 智能体、
3 MIN READ

2025年 6月 18日
NVIDIA 集合通信库 2.26 实现性能和监控功能的提升
NVIDIA 集合通信库 (NCCL) 可实现针对 NVIDIA GPU 和网络优化的多 GPU 和多节点通信基元。
3 MIN READ

2025年 6月 4日
NVIDIA Blackwell 在 MLPerf Training v5.0 中实现高达 2.6 倍的性能提升
创建先进的大语言模型 (LLM) 的过程始于预训练过程。预训练最先进的模型具有很高的计算要求,因为热门的开放权重模型具有数百亿到数千亿个参数,
3 MIN READ

2025年 5月 18日
借助 NVIDIA NVLink Fusion 将半定制计算平台集成到机架级架构
为了高效应对 AI 工作负载,数据中心正在被重构。这是一项非常复杂的工作,因此,
2 MIN READ

2025年 5月 16日
借助 NVIDIA MGX 为 AI 工厂奠定模块化基础
生成式 AI、 大语言模型 (LLMs) 和高性能计算的指数级增长给数据中心基础设施带来了前所未有的需求。
2 MIN READ

2025年 4月 2日
NVIDIA Blackwell 在 MLPerf Inference v5.0 中实现巨大的性能飞跃
在不断增长的模型大小、实时延迟要求以及最近的 AI 推理的推动下, 大语言模型 (LLM) 推理的计算需求正在快速增长。与此同时,
3 MIN READ

2025年 3月 27日
NVIDIA 硅光网络交换开启数据中心网络新时代
NVIDIA 通过将硅光技术直接与 NVIDIA Quantum 和 NVIDIA Spectrum 交换机 IC 集成,开辟了新的领域。
1 MIN READ

2025年 3月 25日
借助 NVIDIA Mission Control 实现 AI 工厂自动化
DeepSeek-R1 等先进的 AI 模型证明,企业现在可以构建专用于自己的数据和专业知识的尖端 AI 模型。
2 MIN READ

2025年 3月 19日
AI 推理时代的 NVIDIA Blackwell Ultra
多年来,AI 的进步一直通过预训练扩展遵循清晰的轨迹:更大的模型、更多的数据和更丰富的计算资源带来了突破性的功能。在过去 5 年中,
2 MIN READ

2024年 12月 24日
借助 NVIDIA 全栈解决方案提升 AI 推理性能
AI 驱动的应用的爆炸式发展对开发者提出了前所未有的要求,他们必须在提供先进的性能与管理运营复杂性和成本以及 AI 基础设施之间取得平衡。
2 MIN READ

2024年 11月 21日
RAPIDS 与 Dask 结合实现多 GPU 数据分析的高效实践指南
随着我们向更密集的计算基础设施迈进,拥有更多的计算、更多的 GPU、加速网络等,多 GPU 训练和分析变得越来越流行。
1 MIN READ

2024年 11月 1日
NVSwitch 和 TensorRT-LLM MultiShot 共同加速 AllReduce 速度达 3 倍
在用户数量可能在数百到数十万之间波动,且输入序列长度随每个请求而变化的生产环境中,部署生成式 AI 工作负载会面临独特的挑战。
1 MIN READ

2024年 10月 8日
将 AI-RAN 引入您附近的电信公司
生成式 AI 和 AI 智能体的推理将推动 AI 计算基础设施从边缘分配到中央云的需求。 IDC 预测 ,“商业 AI (消费者除外)…
5 MIN READ

2024年 9月 16日
借助 NVIDIA 集合通信库实现显存高效、快速初始化和成本估算优化 2.22
在过去几个月中,NVIDIA 集合通信库(NCCL)开发者一直在努力开发一系列新的库功能和错误修复。在本文中,我们将讨论 NCCL 2.22…
2 MIN READ

2024年 9月 6日
利用 NVIDIA Magnum IO NVSHMEM 3.0 实现跨平台应用程序的可移植性和兼容性增强
NVSHMEM 是一个并行编程接口,可为 NVIDIA GPU 集群提供高效且可扩展的通信。NVSHMEM 是 NVIDIA Magnum…
3 MIN READ