Jan Lasek

Jan Lasek 是 NVIDIA 的高级深度学习算法工程师,专注于大语言模型和推荐系统。他参与的项目包括 MLPerf Training、NeMo 和 TensorRT Model Optimizer.他拥有华沙大学数学硕士学位和华沙工业大学计算机科学博士学位。

Posts by Jan Lasek

对话式人工智能

使用 NVIDIA NeMo 和 NVIDIA TensorRT 模型优化器对 LLM 进行训练后量化

随着大语言模型(LLMs)的规模不断扩大,提供易于使用且高效的部署路径变得越来越重要,因为为此类 LLMs 提供服务的成本越来越高。 3 MIN READ