Asha Anoosheh

Asha Anoosheh 是 NVIDIA 的深度学习算法工程师,致力于开发 TensorRT Model Optimizer 库。他拥有理科硕士学位。专注于计算机视觉。

Posts by Asha Anoosheh

开发与优化

使用 NVIDIA TensorRT Model Optimizer 剪枝和蒸 LLM

大语言模型(LLM)在自然语言处理(NLP)任务,如代码生成、推理和数学计算等方面,展现出卓越的性能,树立了新的标杆。然而, 3 MIN READ
数据中心/云端

使用 NVIDIA NeMo 框架进行 LLM 模型剪枝和知识蒸馏

模型剪枝和知识蒸馏是功能强大且经济高效的策略,用于从最初较大的同级获得较小的语言模型。 在一篇“ 如何剪枝和蒸馏 Llama-3.1 8B ”… 4 MIN READ