Gao Wenwen

Wenwen Gao 是 NVIDIA NeMo 的高级产品经理,专注于 LLM 训练框架和微服务。她过去的经验包括 LLM 推理 (NIM) 和推荐系统 (Merlin) 。她拥有学士学位。多伦多大学计算机科学专业博士学位和麻省理工学院斯隆管理学院工商管理硕士学位。

Posts by Gao Wenwen

生成式人工智能/大语言模型

借助 NVIDIA NeMo-RL 进行强化学习:Megatron 核心支持优化训练吞吐量

NVIDIA NeMo-RL 的初始版本通过 PyTorch DTensor(也称为 FSDP2)提供训练支持。 3 MIN READ
开发与优化

使用 NVIDIA NeMo-RL 进行强化学习:通过 GRPO 复制 DeepScaleR 配方

强化学习 (RL) 是交互式 AI 的支柱。它对于教导智能体推理和从人类偏好中学习、实现多轮工具使用等至关重要。 2 MIN READ
对话式人工智能

通过高效的长上下文大语言模型训练扩展到数百万个 Token

大语言模型 (LLM) 的演变标志着其处理和生成文本的能力有了显著提升。在这些发展中,上下文长度的概念 (模型可以处理的单个输入样本中的… 2 MIN READ
数据中心/云端

借助 NVIDIA Nemo 框架,在远程数据中心网络中加速 LLM 训练

多数据中心训练对 AI 工厂至关重要,因为预训练扩展会推动更大模型的创建,导致对计算性能的需求超过单个设施的能力。 2 MIN READ
生成式人工智能/大语言模型

在 NVIDIA NeMo 框架的首发日支持下即时运行 Hugging Face 模型

在企业组织努力更大限度地提高其 生成式 AI 投资的价值时,获取最新的模型开发成果对于持续取得成功至关重要。通过在首发日使用先进的模型, 2 MIN READ
数据中心/云端

LLM 推理基准测试指南:NVIDIA GenAI-Perf 和 NIM

这是 LLM 基准测试系列 的第二篇文章,介绍了在使用 NVIDIA NIM 部署 Meta Llama 3 模型 时, 4 MIN READ