谷鋆

谷鋆,深度学习解决方案架构师。他于 2022 年加入 NVIDIA 解决方案架构师团队,专门为中国 CSP 进行 LLM 模型推理服务优化。

Posts by 谷鋆

生成式人工智能/大语言模型

NVIDIA TensorRT-LLM 支持腾讯混元最新大语言模型 Hunyuan-A13B 推理加速

腾讯混元 (Hunyuan) 最新大语言模型 Hunyuan-A13B 今日发布,NVIDIA TensorRT-LLM 作为全球领先的… 1 MIN READ