Asma Kuriparambil Thekkumpate

Asma 是 NVIDIA 的高级工程师,负责开发 NVIDIA TensorRT Model Optimizer 工具包。她的兴趣涵盖深度学习模型的训练和推理优化,尤其是 LLM。

Posts by Asma Kuriparambil Thekkumpate

生成式人工智能/大语言模型

量化感知训练如何实现低精度恢复

训练 AI 模型后,可采用多种压缩技术来优化模型的部署。其中较为常见的是后训练量化(PTQ),该方法通过数值缩放技术, 3 MIN READ
生成式人工智能/大语言模型

使用量化感知训练微调 gpt-oss 提高准确性和性能

对于 AI 社界而言,主要的开源基础模型版本带来了独特的架构创新与功能突破,正掀起一股令人振奋的浪潮。作为 OpenAI 实验室自 GPT… 3 MIN READ
对话式人工智能

NVIDIA TensorRT 模型优化器 v0.15 提高推理性能扩展模型支持能力

NVIDIA 宣布推出新版 v0.15 NVIDIA TensorRT 模型优化器,这是一种先进的模型优化技术量化工具包,包含量化、 2 MIN READ