Posts by Song Han
计算机视觉/视频分析
2024年 5月 3日
基于 VILA 的 NVIDIA 硬件可视化语言模型
视觉语言模型最近有了显著的发展。然而,现有技术通常仅支持一个图像。他们无法在多个图像之间进行推理、支持上下文学习或理解视频。此外,
3 MIN READ
计算机视觉/视频分析
2024年 5月 3日
视觉语言智能与 Edge AI 2.0
VILA 是 NVIDIA Research 和麻省理工学院共同开发的一系列高性能视觉语言模型。这些模型的参数规模从 ~3B 到 ~40B…
3 MIN READ