Posts by Shubham Agrawal
计算机视觉/视频分析
2025年 3月 11日
使用 NVIDIA AI Blueprint 构建实时多模态 XR 应用以进行视频搜索和摘要
随着 生成式 AI 和视觉基础模型的最新进展,VLM 呈现了新一波视觉计算浪潮,其中模型能够实现高度复杂的感知和深度上下文理解。
2 MIN READ
计算机视觉/视频分析
2025年 2月 26日
图像和视频理解的视觉语言模型提示工程实践指南
视觉语言模型 (VLMs) 正在以极快的速度发展。2020 年,首批 VLMs 通过使用视觉编码器将视觉理解引入大语言模型 (LLMs) ,
4 MIN READ
计算机视觉/视频分析
2024年 8月 28日
NVIDIA TAO 5.5 带来新基础模型和增强训练功能
NVIDIA TAO 是一个旨在简化和加速 AI 模型开发和部署的框架。它使您能够使用预训练模型,使用自己的数据微调模型,
3 MIN READ