GB200

2025年 4月 2日
NVIDIA Blackwell 在 MLPerf Inference v5.0 中实现巨大的性能飞跃
在不断增长的模型大小、实时延迟要求以及最近的 AI 推理的推动下, 大语言模型 (LLM) 推理的计算需求正在快速增长。与此同时,
3 MIN READ

2025年 3月 25日
借助 NVIDIA Mission Control 实现 AI 工厂自动化
DeepSeek-R1 等先进的 AI 模型证明,企业现在可以构建专用于自己的数据和专业知识的尖端 AI 模型。
2 MIN READ

2025年 3月 18日
隆重推出 NVIDIA Dynamo:用于扩展推理AI模型的低延迟分布式推理框架
NVIDIA 今天在 GTC 2025 宣布发布 NVIDIA Dynamo 。NVIDIA Dynamo 是一个高吞吐量、
4 MIN READ

2024年 12月 24日
借助 NVIDIA 全栈解决方案提升 AI 推理性能
AI 驱动的应用的爆炸式发展对开发者提出了前所未有的要求,他们必须在提供先进的性能与管理运营复杂性和成本以及 AI 基础设施之间取得平衡。
2 MIN READ

2024年 11月 13日
NVIDIA Blackwell 在 MLPerf 训练 v4.1 中将 LLM 训练性能提高一倍
随着模型规模的扩大以及使用更多数据进行训练,它们的能力也随之提升,实用性也随之提升。为了快速训练这些模型,需要在数据中心规模上提供更高的性能。
3 MIN READ

2024年 10月 9日
NVIDIA Grace CPU 实现全球顶级数据中心性能和突破性能效优势
NVIDIA 将 NVIDIA Grace CPU 设计为一种新型高性能数据中心 CPU,旨在提供突破性的 能效 ,
2 MIN READ

2024年 10月 8日
将 AI-RAN 引入您附近的电信公司
生成式 AI 和 AI 智能体的推理将推动 AI 计算基础设施从边缘分配到中央云的需求。 IDC 预测 ,“商业 AI (消费者除外)…
5 MIN READ