Posts by Parth Chadha
生成式人工智能/大语言模型
2025年 8月 20日
借助 NVIDIA NeMo-RL 进行强化学习:Megatron 核心支持优化训练吞吐量
NVIDIA NeMo-RL 的初始版本通过 PyTorch DTensor(也称为 FSDP2)提供训练支持。
3 MIN READ
人工智能/深度学习
2021年 12月 2日
使用 NVIDIA TensorRT 优化 T5 和 GPT-2 进行实时推理
这个 transformer 体系结构 完全改变了(双关语)自然语言处理( NLP )的领域。近年来,
3 MIN READ