Markel Ausin

Markel Ausin 是 NVIDIA 的深度学习算法工程师。在目前的角色中,他致力于构建和部署大型语言模型,作为 NeMo- Megatron 框架的一部分。 Markel 针对 NVIDIA DGX SuperPOD 集群开发了数据准备、模型训练、评估和模型检查点转换的解决方案。 Markel 是超参数搜索工具的主要开发人员,该工具搜索给定模型的最佳配置,并决定如何在多个 GPU 上拆分模型。在 NVIDIA 之前, Markel 在北卡罗来纳州立大学完成了博士学位,研究如何使用深度强化学习改进教育系统。

Posts by Markel Ausin

对话式人工智能

NVIDIA AI 平台为大型语言模型带来巨大收益

随着大型语言模型( LLM )的规模和复杂性不断增长, NVIDIA 今天宣布更新 NeMo Megatron 框架,提供高达 30% 2 MIN READ