王猛

王猛,NVIDIA 加速计算专家,专注于大语言模型和扩散模型的推理优化,对 NVIDIA TensorRT 和 TensorRT-LLM 拥有丰富的经验。

Posts by 王猛

生成式人工智能/大语言模型

NVIDIA TensorRT-LLM 支持腾讯混元最新大语言模型 Hunyuan-A13B 推理加速

腾讯混元 (Hunyuan) 最新大语言模型 Hunyuan-A13B 今日发布,NVIDIA TensorRT-LLM 作为全球领先的… 1 MIN READ