Neelay Shah

Neelay Shah 是 NVIDIA Triton 推理服务器的首席软件架构师兼 AI 解决方案工程师。他的重点是帮助开发者实现从原型设计到大规模高性能生产部署的流畅过渡。在加入 NVIDIA 之前,Neelay 曾担任英特尔的首席工程师,负责领导计算机视觉管线的开源项目。他拥有威廉姆斯学院的计算机科学学士学位和伊利诺伊大学香槟分校的计算机科学硕士学位。

Posts by Neelay Shah

数据中心/云端

LLM 推理基准测试指南:NVIDIA GenAI-Perf 和 NIM

这是 LLM 基准测试系列 的第二篇文章,介绍了在使用 NVIDIA NIM 部署 Meta Llama 3 模型 时, 4 MIN READ
数据中心/云端

LLM 基准测试:基本概念

在过去几年中,作为广泛的 AI 革命的一部分, 生成式 AI 和 大语言模型 (LLMs) 越来越受欢迎。 4 MIN READ
数据中心/云端

隆重推出 NVIDIA Dynamo:用于扩展推理AI模型的低延迟分布式推理框架

NVIDIA 今天在 GTC 2025 宣布发布 NVIDIA Dynamo 。NVIDIA Dynamo 是一个高吞吐量、 4 MIN READ
计算机视觉/视频分析

在 NVIDIA AI 推理平台上使用 Stable Diffusion XL 生成令人惊叹的图像

扩散模型正在各行各业中改变创意工作流程。这些模型通过采用降噪扩散技术,将随机噪声逐步塑造为 AI 生成的艺术, 4 MIN READ
计算机视觉/视频分析

在 NVIDIA AI 推理平台上使用 Stable Diffusion XL 生成令人惊叹的图像

扩散模型正在各行各业中改变创意工作流程。这些模型通过采用降噪扩散技术,将随机噪声逐步塑造为 AI 生成的艺术, 4 MIN READ