Posts by Gao Wenwen
生成式人工智能/大语言模型
2025年 8月 20日
借助 NVIDIA NeMo-RL 进行强化学习:Megatron 核心支持优化训练吞吐量
NVIDIA NeMo-RL 的初始版本通过 PyTorch DTensor(也称为 FSDP2)提供训练支持。
3 MIN READ
开发与优化
2025年 7月 9日
使用 NVIDIA NeMo-RL 进行强化学习:通过 GRPO 复制 DeepScaleR 配方
强化学习 (RL) 是交互式 AI 的支柱。它对于教导智能体推理和从人类偏好中学习、实现多轮工具使用等至关重要。
2 MIN READ
对话式人工智能
2025年 6月 2日
通过高效的长上下文大语言模型训练扩展到数百万个 Token
大语言模型 (LLM) 的演变标志着其处理和生成文本的能力有了显著提升。在这些发展中,上下文长度的概念 (模型可以处理的单个输入样本中的…
2 MIN READ
数据中心/云端
2025年 5月 14日
借助 NVIDIA Nemo 框架,在远程数据中心网络中加速 LLM 训练
多数据中心训练对 AI 工厂至关重要,因为预训练扩展会推动更大模型的创建,导致对计算性能的需求超过单个设施的能力。
2 MIN READ
生成式人工智能/大语言模型
2025年 5月 12日
在 NVIDIA NeMo 框架的首发日支持下即时运行 Hugging Face 模型
在企业组织努力更大限度地提高其 生成式 AI 投资的价值时,获取最新的模型开发成果对于持续取得成功至关重要。通过在首发日使用先进的模型,
2 MIN READ
数据中心/云端
2025年 5月 6日
LLM 推理基准测试指南:NVIDIA GenAI-Perf 和 NIM
这是 LLM 基准测试系列 的第二篇文章,介绍了在使用 NVIDIA NIM 部署 Meta Llama 3 模型 时,
4 MIN READ