强化学习

2025年 9月 25日

尽管当今的机器人在受控环境中表现出色，但在应对现实世界任务所需的不可预测性、灵活性和细微交互方面仍面临挑战，

2 MIN READ

2025年 8月 20日

NVIDIA NeMo-RL 的初始版本通过 PyTorch DTensor（也称为 FSDP2）提供训练支持。

3 MIN READ

2025年 8月 13日

目前，AI 领域最引人注目的问题之一是大型语言模型 (LLM) 是否可以通过持续强化学习 (RL) 继续改进，或者其能力是否最终会达到顶峰。

4 MIN READ

2024年 7月 29日

机器人需要具备适应能力，能够随时学习新技能并适应周围环境。然而，传统训练方法可能会限制机器人在新情况下应用所学技能的能力，

2 MIN READ