强化学习

2025年 8月 20日
借助 NVIDIA NeMo-RL 进行强化学习:Megatron 核心支持优化训练吞吐量
NVIDIA NeMo-RL 的初始版本通过 PyTorch DTensor(也称为 FSDP2)提供训练支持。
3 MIN READ

2025年 8月 13日
使用 ProRL v2 通过长时间训练扩展 LLM 强化学习
目前,AI 领域最引人注目的问题之一是大型语言模型 (LLM) 是否可以通过持续强化学习 (RL) 继续改进,或者其能力是否最终会达到顶峰。
4 MIN READ

2024年 7月 29日
利用 NVIDIA Isaac 实验室加速机器人模拟学习
机器人需要具备适应能力,能够随时学习新技能并适应周围环境。然而,传统训练方法可能会限制机器人在新情况下应用所学技能的能力,
2 MIN READ