Parth Chadha

Parth Chadha 是 NVIDIA 的深度学习软件工程师。他在 TensorRT 上工作,这是一个高性能的深度学习推理 SDK 。 Parth 在卡内基梅隆大学获得电气和计算机工程硕士学位,主要研究机器学习和并行计算机体系结构。

Posts by Parth Chadha

生成式人工智能/大语言模型

借助 NVIDIA NeMo-RL 进行强化学习:Megatron 核心支持优化训练吞吐量

NVIDIA NeMo-RL 的初始版本通过 PyTorch DTensor(也称为 FSDP2)提供训练支持。 3 MIN READ
人工智能/深度学习

使用 NVIDIA TensorRT 优化 T5 和 GPT-2 进行实时推理

这个 transformer 体系结构 完全改变了(双关语)自然语言处理( NLP )的领域。近年来, 3 MIN READ