头条新闻

2025年 8月 29日
小型语言模型如何成为可扩展代理人工智能的关键
代理式 AI 的迅速崛起,正在重塑企业、开发者以及整个行业对自动化与数字生产力的认知。从软件开发流程到企业级任务编排,
2 MIN READ

2025年 8月 25日
NVFP4 实现 16 位训练精度,4 位训练速度和效率
近年来,AI工作负载呈指数级增长,这不仅体现在大型语言模型(LLM)的广泛部署上,也反映在预训练和后训练阶段对处理更多token的迫切需求。
2 MIN READ

2025年 8月 22日
揭秘 NVIDIA Blackwell Ultra:推动 AI 工厂时代的芯片动力
作为 NVIDIA Blackwell 架构系列的最新成员,NVIDIA Blackwell Ultra GPU 依托核心创新,
5 MIN READ

2025年 8月 21日
借助 NVIDIA NVLink 和 NVLink Fusion 扩展 AI 推理性能和灵活性
AI 模型复杂性的指数级增长驱动参数规模从数百万迅速扩展到数万亿,对计算资源提出了前所未有的需求,必须依赖大规模 GPU 集群才能满足。
2 MIN READ

2025年 8月 20日
借助 NVIDIA NeMo-RL 进行强化学习:Megatron 核心支持优化训练吞吐量
NVIDIA NeMo-RL 的初始版本通过 PyTorch DTensor(也称为 FSDP2)提供训练支持。
3 MIN READ

2025年 8月 11日
如何在交互式模拟中即时渲染现实世界场景
将现实世界环境转变为交互式仿真不再需要花费数天或数周的时间。借助 NVIDIA Omniverse NuRec 和…
2 MIN READ

2025年 8月 6日
CUDA 工具包 13.0 的新特性和重要更新
CUDA Toolkit 13.0 是该工具包的最新版本,具有加速最新 NVIDIA CPU 和 GPU 计算的优势。作为一项重大发布,
4 MIN READ

2025年 8月 5日
NVIDIA 从云到边缘加速 OpenAI gpt-oss 模型部署,在 NVIDIA GB200 NVL72 上实现 150 万 TPS 推理
自 2016 年推出 NVIDIA DGX 以来,NVIDIA 与 OpenAI 便开始共同推动 AI 技术的边界。
1 MIN READ

2025年 7月 7日
提出一个维基百科规模的问题:如何利用数百万 token 的实时推理使世界更加智能
现代 AI 应用越来越依赖于将庞大的参数数量与数百万个令牌的上下文窗口相结合的模型。无论是经过数月对话的 AI 智能体、
3 MIN READ

2025年 6月 26日
在 NVIDIA Jetson 和 RTX 上运行 Google DeepMind 的 Gemma 3n
截至今日,NVIDIA 现已支持在 NVIDIA RTX 和 Jetson 上全面推出 Gemma 3n。上个月,
1 MIN READ

2025年 6月 24日
隆重推出 NVFP4,实现高效准确的低精度推理
为了充分利用 AI,优化至关重要。当开发者考虑优化用于推理的 AI 模型时,通常会想到量化、蒸馏和剪枝等模型压缩技术。毫无疑问,
4 MIN READ

2025年 6月 11日
隆重推出 NVIDIA DGX 云 Lepton:面向开发者的统一 AI 平台
AI 原生应用的时代已经到来。开发者正在构建先进的代理式 AI 和物理 AI 系统,但跨地区和 GPU 提供商进行扩展仍然是一项挑战。
2 MIN READ

2025年 6月 11日
使用适用于物理 AI 的 NVIDIA NeMo Agent 工具包扩展逼真的机器人仿真
物理 AI 使自主系统 (例如机器人、自动驾驶汽车和智能空间) 能够在现实世界中智能地感知、理解和行动。但是,
4 MIN READ

2025年 6月 11日
使用开源 NVIDIA cuOpt 加速决策优化
企业每天都会做出成千上万的决策,包括生产什么、在哪里发货、如何分配资源。大规模优化这些决策成为一项计算挑战。线性规划 (LP) 、
2 MIN READ

2025年 6月 11日
借助神经重建和世界基础模型提升自动驾驶汽车仿真速度
自动驾驶汽车 (AV) 堆栈正在从离散构建块的层次结构发展为基于foundation models构建的端到端架构。
1 MIN READ

2025年 6月 3日
全新 NVIDIA Llama Nemotron Nano 视觉语言模型在 OCR 准确性基准测试中位居榜首
PDF、图形、图表和控制面板等文档是丰富的数据源,在提取和整理时,可提供信息丰富的决策见解。从自动化财务报表处理到改进商业智能工作流程,
2 MIN READ