强化学习

2025年 9月 25日
R²D²:NVIDIA 研究的三项神经突破改变机器人学习的格局
尽管当今的机器人在受控环境中表现出色,但在应对现实世界任务所需的不可预测性、灵活性和细微交互方面仍面临挑战,
2 MIN READ

2025年 8月 20日
借助 NVIDIA NeMo-RL 进行强化学习:Megatron 核心支持优化训练吞吐量
NVIDIA NeMo-RL 的初始版本通过 PyTorch DTensor(也称为 FSDP2)提供训练支持。
3 MIN READ

2025年 8月 13日
使用 ProRL v2 通过长时间训练扩展 LLM 强化学习
目前,AI 领域最引人注目的问题之一是大型语言模型 (LLM) 是否可以通过持续强化学习 (RL) 继续改进,或者其能力是否最终会达到顶峰。
4 MIN READ

2024年 7月 29日
利用 NVIDIA Isaac 实验室加速机器人模拟学习
机器人需要具备适应能力,能够随时学习新技能并适应周围环境。然而,传统训练方法可能会限制机器人在新情况下应用所学技能的能力,
2 MIN READ