Neal Vaidya

Neal Vaidya 是 NVIDIA 深度学习软件的技术营销工程师。他负责开发和展示以开发人员为中心的关于深度学习框架和推理解决方案的内容。他拥有杜克大学统计学学士学位。

Posts by Neal Vaidya

生成式人工智能/大语言模型

借助 NVIDIA TensorRT-LLM 和 NVIDIA Triton 推理服务器提升 Meta Llama 3 性能

我们很高兴地宣布支持 Meta Llama 3 系列模型,通过 NVIDIA TensorRT LLM 加速和优化 LLM 推理性能。 2 MIN READ
数据中心/云端

NVIDIA NIM 提供经过优化的推理微服务,用于大规模部署 AI 模型

数字生成的生成式 AI 采用率一直很高。在 2022 年推出 OpenAI 聊天 GPT 的推动下, 2 MIN READ
对话式人工智能

掌握 LLM 技术:推理优化

通过堆叠 Transformer 层来创建大型模型,可以提高准确性、实现少量学习功能,并且在各种语言任务中实现近乎人类的性能。 4 MIN READ
数据中心/云端

NVIDIA AI Foundation 模型:使用生产就绪型 LLM 构建自定义企业聊天机器人和 Co-Pilot

大型语言模型(LLM)正在革新数据科学领域,特别是在自然语言理解、AI 以及 机器学习 方面。 3 MIN READ
生成式人工智能/大语言模型

现已公开发布!欢迎使用 NVIDIA TensorRT-LLM 优化大语言模型推理

NVIDIA 于 2023 年 10 月 19 日公开发布 TensorRT-LLM, 3 MIN READ
对话式人工智能

使用 NVIDIA Triton 管理服务扩展深度学习部署

组织正在以前所未有的速度将机器学习(ML)集成到整个系统和产品中。他们正在寻找解决方案,以帮助处理在生产规模部署模型的复杂性。 2 MIN READ