李博

李博,2024 年加入 NVIDIA DevTech 团队,专注于 NVIDIA GPU 上 AI 模型推理的加速计算。目前他主要负责 TensorRT-LLM 中大语言模型的推理优化。

Posts by 李博

生成式人工智能/大语言模型

NVIDIA TensorRT-LLM 支持腾讯混元最新大语言模型 Hunyuan-A13B 推理加速

腾讯混元 (Hunyuan) 最新大语言模型 Hunyuan-A13B 今日发布,NVIDIA TensorRT-LLM 作为全球领先的… 1 MIN READ