Song Han

宋涵是麻省理工学院 EECS 的副教授。他在斯坦福大学获得博士学位。他提出了“深度压缩”技术,包括被广泛用于高效人工智能计算的修剪和量化,以及首次为现代人工智能芯片带来权重稀疏性的“高效推理引擎”,使其成为 ISCA 50 年历史上被引用最多的前五篇论文之一。他开创了 TinyML 研究,将深度学习带到物联网设备中,实现边缘学习。他的团队在硬件感知神经架构搜索(一劳永逸的网络)方面的工作使用户能够设计、优化、缩小人工智能模型,并将其部署到资源受限的硬件设备上,在旗舰人工智能会议的许多低功耗计算机视觉竞赛中获得第一名。

Posts by Song Han

计算机视觉/视频分析

基于 VILA 的 NVIDIA 硬件可视化语言模型

视觉语言模型最近有了显著的发展。然而,现有技术通常仅支持一个图像。他们无法在多个图像之间进行推理、支持上下文学习或理解视频。此外, 3 MIN READ
计算机视觉/视频分析

视觉语言智能与 Edge AI 2.0

VILA 是 NVIDIA Research 和麻省理工学院共同开发的一系列高性能视觉语言模型。这些模型的参数规模从 ~3B 到 ~40B… 3 MIN READ