Wenhan Tan

Wenhan Tan 是 NVIDIA 的解决方案架构师,协助客户大规模采用 NVIDIA AI 解决方案。他的工作重点是加速深度学习应用以及应对推理和训练挑战。

Posts by Wenhan Tan

对话式人工智能

利用 NVIDIA Triton 和 NVIDIA TensorRT-LLM 及 Kubernetes 实现 LLM 扩展

大语言模型 (LLMs) 已广泛应用于聊天机器人、内容生成、摘要、分类、翻译等领域。State-of-the-art LLMs 和基础模型如… 5 MIN READ