NVLink

2025年 8月 22日

揭秘 NVIDIA Blackwell Ultra：推动 AI 工厂时代的芯片动力

作为 NVIDIA Blackwell 架构系列的最新成员，NVIDIA Blackwell Ultra GPU 依托核心创新，

5 MIN READ

2025年 8月 22日

NVIDIA 硬件创新和开源贡献正在塑造 AI

Cosmos、DeepSeek、Gemma、GPT-OSS、Llama、Nemotron、Phi、

2 MIN READ

2025年 8月 21日

借助 NVIDIA NVLink 和 NVLink Fusion 扩展 AI 推理性能和灵活性

AI 模型复杂性的指数级增长驱动参数规模从数百万迅速扩展到数万亿，对计算资源提出了前所未有的需求，必须依赖大规模 GPU 集群才能满足。

2 MIN READ

2025年 8月 7日

在单个 NVIDIA Grace Hopper 超级芯片上使用 XGBoost 3.0 训练 TB 级数据集

梯度提升决策树 (GBDT) 驱动着从实时欺诈过滤到 PB 级需求预测的各种功能。由于其先进的准确性、

2 MIN READ

2025年 7月 14日

借助 NCCL 2.27 实现快速推理和弹性训练

随着 AI 工作负载的扩展，快速可靠的 GPU 通信变得至关重要，这不仅适用于训练，而且越来越适用于大规模推理。

3 MIN READ

2025年 7月 7日

提出一个维基百科规模的问题：如何利用数百万 token 的实时推理使世界更加智能

现代 AI 应用越来越依赖于将庞大的参数数量与数百万个令牌的上下文窗口相结合的模型。无论是经过数月对话的 AI 智能体、

3 MIN READ

2025年 6月 18日

NVIDIA 集合通信库 2.26 实现性能和监控功能的提升

NVIDIA 集合通信库 (NCCL) 可实现针对 NVIDIA GPU 和网络优化的多 GPU 和多节点通信基元。

3 MIN READ

2025年 6月 4日

NVIDIA Blackwell 在 MLPerf Training v5.0 中实现高达 2.6 倍的性能提升

创建先进的大语言模型 (LLM) 的过程始于预训练过程。预训练最先进的模型具有很高的计算要求，因为热门的开放权重模型具有数百亿到数千亿个参数，

3 MIN READ

2025年 5月 18日

借助 NVIDIA NVLink Fusion 将半定制计算平台集成到机架级架构

为了高效应对 AI 工作负载，数据中心正在被重构。这是一项非常复杂的工作，因此，

2 MIN READ

2025年 5月 16日

借助 NVIDIA MGX 为 AI 工厂奠定模块化基础

生成式 AI、大语言模型 (LLMs) 和高性能计算的指数级增长给数据中心基础设施带来了前所未有的需求。

2 MIN READ

2025年 4月 2日

NVIDIA Blackwell 在 MLPerf Inference v5.0 中实现巨大的性能飞跃

在不断增长的模型大小、实时延迟要求以及最近的 AI 推理的推动下，大语言模型 (LLM) 推理的计算需求正在快速增长。与此同时，

3 MIN READ

2025年 3月 27日

NVIDIA 硅光网络交换开启数据中心网络新时代

NVIDIA 通过将硅光技术直接与 NVIDIA Quantum 和 NVIDIA Spectrum 交换机 IC 集成，开辟了新的领域。

1 MIN READ

2025年 3月 25日

借助 NVIDIA Mission Control 实现 AI 工厂自动化

DeepSeek-R1 等先进的 AI 模型证明，企业现在可以构建专用于自己的数据和专业知识的尖端 AI 模型。

2 MIN READ

2025年 3月 19日

AI 推理时代的 NVIDIA Blackwell Ultra

多年来，AI 的进步一直通过预训练扩展遵循清晰的轨迹：更大的模型、更多的数据和更丰富的计算资源带来了突破性的功能。在过去 5 年中，

2 MIN READ

2024年 12月 24日

借助 NVIDIA 全栈解决方案提升 AI 推理性能

AI 驱动的应用的爆炸式发展对开发者提出了前所未有的要求，他们必须在提供先进的性能与管理运营复杂性和成本以及 AI 基础设施之间取得平衡。

2 MIN READ

2024年 11月 21日

RAPIDS 与 Dask 结合实现多 GPU 数据分析的高效实践指南

随着我们向更密集的计算基础设施迈进，拥有更多的计算、更多的 GPU、加速网络等，多 GPU 训练和分析变得越来越流行。

1 MIN READ