袁劲飏

袁劲飏,来自 NVIDIA DevTech 团队,从事企业用户 GPU 加速计算支持工作,目前主要负责大语言模型推理的性能优化工作。

Posts by 袁劲飏

生成式人工智能/大语言模型

NVIDIA TensorRT-LLM 支持腾讯混元最新大语言模型 Hunyuan-A13B 推理加速

腾讯混元 (Hunyuan) 最新大语言模型 Hunyuan-A13B 今日发布,NVIDIA TensorRT-LLM 作为全球领先的… 1 MIN READ