J Wyman

J Wyman 是 NVIDIA 的高级系统软件架构师,专注于 AI 和分布式系统。他的工作重点是 NVIDIA Triton 推理服务器以及 NVIDIA 的新一代推理服务产品和解决方案。

Posts by J Wyman

对话式人工智能

利用 NVIDIA Triton 和 NVIDIA TensorRT-LLM 及 Kubernetes 实现 LLM 扩展

大语言模型 (LLMs) 已广泛应用于聊天机器人、内容生成、摘要、分类、翻译等领域。State-of-the-art LLMs 和基础模型如… 5 MIN READ