Keval Morabia

Keval Morabia 是 NVIDIA TensorRT Model Optimizer 团队的高级深度学习工程师,专注于优化 LLM 的算法。更具体地说,Keval 从事剪枝、神经架构搜索和知识提炼等优化技术的研究,这些技术在过去显著加快了 MLPerf 推理提交速度。Keval 加入 NVIDIA 后,他收购了 OmniML Inc.,并在那里担任过早期的 ML 工程师。Keval 拥有伊利诺伊大学香槟分校计算机科学硕士学位,以及印度 BITS Pilani 分校计算机科学学士学位。

Posts by Keval Morabia

对话式人工智能

NVIDIA TensorRT 模型优化器 v0.15 提高推理性能扩展模型支持能力

NVIDIA 宣布推出新版 v0.15 NVIDIA TensorRT 模型优化器,这是一种先进的模型优化技术量化工具包,包含量化、 2 MIN READ