Keval Morabia

Keval Morabia 是 NVIDIA TensorRT Model Optimizer 团队的高级深度学习工程师,专注于优化 LLM 的算法。更具体地说,Keval 从事剪枝、神经架构搜索和知识提炼等优化技术的研究,这些技术在过去显著加快了 MLPerf 推理提交速度。Keval 加入 NVIDIA 后,他收购了 OmniML Inc.,并在那里担任过早期的 ML 工程师。Keval 拥有伊利诺伊大学香槟分校计算机科学硕士学位,以及印度 BITS Pilani 分校计算机科学学士学位。

Posts by Keval Morabia

开发与优化

使用 NVIDIA TensorRT Model Optimizer 剪枝和蒸 LLM

大语言模型(LLM)在自然语言处理(NLP)任务,如代码生成、推理和数学计算等方面,展现出卓越的性能,树立了新的标杆。然而, 3 MIN READ
对话式人工智能

NVIDIA TensorRT 模型优化器 v0.15 提高推理性能扩展模型支持能力

NVIDIA 宣布推出新版 v0.15 NVIDIA TensorRT 模型优化器,这是一种先进的模型优化技术量化工具包,包含量化、 2 MIN READ