Posts by Asha Anoosheh
开发与优化
2025年 10月 7日
使用 NVIDIA TensorRT Model Optimizer 剪枝和蒸 LLM
大语言模型(LLM)在自然语言处理(NLP)任务,如代码生成、推理和数学计算等方面,展现出卓越的性能,树立了新的标杆。然而,
3 MIN READ
数据中心/云端
2025年 2月 12日
使用 NVIDIA NeMo 框架进行 LLM 模型剪枝和知识蒸馏
模型剪枝和知识蒸馏是功能强大且经济高效的策略,用于从最初较大的同级获得较小的语言模型。 在一篇“ 如何剪枝和蒸馏 Llama-3.1 8B ”…
4 MIN READ