Saurav Muralidharan

Saurav Muralidharan 是 NVIDIA Research 的高级研究科学家,曾供职于深度学习效率研究 (DLER) 团队。Saurav 的工作重点是使用模型压缩 (稀疏、低排名分解、提炼等) 和神经架构搜索 (NAS) 等技术,提高深度神经网络 (尤其是大型语言模型 (LLM)) 的运行时性能和效率。

Posts by Saurav Muralidharan

数据中心/云端

Mistral-NeMo-Minitron 8B 模型提供超高精度

本文最初发布于 2024 年 8 月 21 日,但已根据当前数据进行了修订。 最近,NVIDIA 和 Mistral AI 推出了… 3 MIN READ
数据中心/云端

Mistral-NeMo-Minitron 8B 基础模型实现准确性巅峰

上个月,NVIDIA 和 Mistral AI 推出了 Mistral NeMo 12B,这是一款领先的先进的大型语言模型(LLM)。 1 MIN READ
数据中心/云端

如何在 NVIDIA Llama-3.1-Minitron 4B 模型上修剪和提炼 Llama-3.1 8B

由于大型语言模型(LLM)的有效性和通用性,它们现在已经成为自然语言处理和理解领域的主导力量。LLM(例如 Llama 3.1… 4 MIN READ