NeMo

2025年 10月 11日

探索在大模型训练中使用 Megatron-Core 训练框架提高显存使用效率

在大模型训练中，显存（GPU Memory）始终是最稀缺的资源之一。随着模型规模迈入百亿、千亿甚至万亿参数级别，如何在有限显存中“塞下”…

3 MIN READ

2025年 10月 7日

使用 NVIDIA TensorRT Model Optimizer 剪枝和蒸 LLM

大语言模型（LLM）在自然语言处理（NLP）任务，如代码生成、推理和数学计算等方面，展现出卓越的性能，树立了新的标杆。然而，

3 MIN READ

2025年 9月 23日

借助 NVIDIA NeMo 在 FP8 精度下提高训练吞吐量

在之前关于 FP8 训练的博文中，我们探讨了 FP8 精度的基础知识并深入分析了适用于大规模深度学习的多种扩展方法。

3 MIN READ

2025年 9月 3日

如何运行 AI 驱动的 CAE 仿真

在现代工程领域，创新速度与执行模拟分析的效率密切相关。计算机辅助工程（CAE）在验证产品性能与安全性方面发挥着关键作用，

3 MIN READ

2025年 8月 29日

小型语言模型如何成为可扩展代理人工智能的关键

代理式 AI 的迅速崛起，正在重塑企业、开发者以及整个行业对自动化与数字生产力的认知。从软件开发流程到企业级任务编排，

2 MIN READ

2025年 8月 27日

如何将生产环境中的 LangGraph 智能体从单个用户扩展到 1000 名同事

您已经成功构建了一个功能强大的 AI 智能体，并准备与同事分享，但您有一个重要的顾虑：如果同时有 10 位、100…

3 MIN READ

2025年 8月 22日

NVIDIA 硬件创新和开源贡献正在塑造 AI

Cosmos、DeepSeek、Gemma、GPT-OSS、Llama、Nemotron、Phi、

2 MIN READ

2025年 8月 20日

借助 NVIDIA NeMo-RL 进行强化学习：Megatron 核心支持优化训练吞吐量

NVIDIA NeMo-RL 的初始版本通过 PyTorch DTensor（也称为 FSDP2）提供训练支持。

3 MIN READ

2025年 8月 18日

使用 NVIDIA Streaming Sortformer 实时识别会议、通话和语音应用中的演讲者

在每一次会议、电话交流、多人场合或支持语音的应用中，技术始终面临一个核心难题：谁在何时发言？几十年来，若不依赖专用设备或离线批量处理，

2 MIN READ

2025年 7月 23日

PDF 数据提取方法及其在信息检索中的应用

PDF 是共享财务报告、研究论文、技术文档和营销材料等信息的常用文件格式之一。然而，在构建有效的检索增强生成 (RAG) 系统时，

4 MIN READ

2025年 7月 22日

使用 NVIDIA NeMo 在一个周末内训练一个具备推理能力的 LLM

您是否曾想构建自己的推理模型，但认为它过于复杂或需要大量资源？再想想。借助 NVIDIA 强大的工具和数据集，

4 MIN READ

2025年 7月 21日

传统 RAG 与代理 RAG——AI 智能体如何通过动态知识实现更高智能

是否曾依赖不知道新高速公路旁路或道路突然关闭的旧 GPS？它可能会让您到达目的地，但不是最有效或最准确的方式。

1 MIN READ

2025年 7月 17日

使用 NVIDIA 安全配方保护代理式 AI 系统

随着大语言模型 (LLM) 驱动更多能够执行自主操作、工具使用和推理的代理式系统，企业被其灵活性和低推理成本所吸引。

2 MIN READ

2025年 7月 17日

黑客松获奖者借助 NVIDIA NeMo Agent Toolkit 让代理式 AI 如生

学习新工具包的最佳方式是构建一些真实的东西，这正是开发者在最近的 NVIDIA NeMo Agent 工具包黑客松上所做的。在两周的时间里，

1 MIN READ

2025年 7月 9日

使用 NVIDIA NeMo-RL 进行强化学习：通过 GRPO 复制 DeepScaleR 配方

强化学习 (RL) 是交互式 AI 的支柱。它对于教导智能体推理和从人类偏好中学习、实现多轮工具使用等至关重要。

2 MIN READ

2025年 7月 3日

新视频：使用 NVIDIA Data Flywheel Blueprint 构建可自我提升的 AI 代理

由大语言模型驱动的 AI 智能体正在改变企业工作流，但高昂的推理成本和延迟可能会限制其可扩展性和用户体验。为解决这一问题，

1 MIN READ