Markel Ausin

Markel Ausin 是 NVIDIA 的深度学习算法工程师。在目前的角色中,他致力于构建和部署大型语言模型,作为 NeMo- Megatron 框架的一部分。 Markel 针对 NVIDIA DGX SuperPOD 集群开发了数据准备、模型训练、评估和模型检查点转换的解决方案。 Markel 是超参数搜索工具的主要开发人员,该工具搜索给定模型的最佳配置,并决定如何在多个 GPU 上拆分模型。在 NVIDIA 之前, Markel 在北卡罗来纳州立大学完成了博士学位,研究如何使用深度强化学习改进教育系统。

Posts by Markel Ausin

对话式人工智能/自然语言处理

NVIDIA AI 平台为大型语言模型带来巨大收益

随着大型语言模型( LLM )的规模和复杂性不断增长, NVIDIA 今天宣布更新 NeMo Megatron 框架,提供高达 30% 2 MIN READ