Reinforcement Learning

2026년 5월 14일

NVIDIA Nemotron 3 Super 공개 — 에이전틱 추론을 위한 오픈 하이브리드 Mamba-Transformer MoE

NVIDIA Nemotron 3 Super가 120B 총 파라미터·12B 활성 파라미터의 하이브리드 Mamba-Transformer MoE 아키텍처와 1M 토큰 컨텍스트, 네이티브 NVFP4 사전 학습으로 에이전틱 추론 성능과 효율을 동시에 끌어올리며 정식 공개됐습니다.

8 MIN READ

2025년 8월 20일

ProRL v2를 활용한 장기 학습 기반 LLM 강화학습 확장

현재 AI 분야에서 가장 흥미로운 질문 중 하나는, 거대 언어 모델(LLM)이 지속적인 강화학습(RL)을 통해 계속 발전할 수 있을지…

6 MIN READ

2024년 8월 23일

시뮬레이션에서 빠르게 로봇을 학습하기 위해 NVIDIA Isaac Lab 사용하기

로봇은 새로운 기술을 쉽게 배우고 주변 환경에 적응할 수 있는 적응력을 갖춰야 합니다. 하지만 기존의 교육 방법으로는 로봇이 새로운 상황에서 학습한…

5 MIN READ