Shubham Agrawal

Shubham Agrawal 是 NVIDIA 的 AI 开发者技术工程师,在 Metropolis 团队工作。他专注于使用视觉语言模型 (VLM) 将基于生成式 AI 的解决方案引入行业。他之前的研究主要集中在医疗领域的计算机视觉。他拥有哥伦比亚大学计算机科学硕士学位和 NITK Surathkal 信息技术学士学位。

Posts by Shubham Agrawal

计算机视觉/视频分析

使用 NVIDIA AI Blueprint 构建实时多模态 XR 应用以进行视频搜索和摘要

随着 生成式 AI 和视觉基础模型的最新进展,VLM 呈现了新一波视觉计算浪潮,其中模型能够实现高度复杂的感知和深度上下文理解。 2 MIN READ
计算机视觉/视频分析

图像和视频理解的视觉语言模型提示工程实践指南

视觉语言模型 (VLMs) 正在以极快的速度发展。2020 年,首批 VLMs 通过使用视觉编码器将视觉理解引入大语言模型 (LLMs) , 4 MIN READ
计算机视觉/视频分析

NVIDIA TAO 5.5 带来新基础模型和增强训练功能

NVIDIA TAO 是一个旨在简化和加速 AI 模型开发和部署的框架。它使您能够使用预训练模型,使用自己的数据微调模型, 3 MIN READ