Posts by Yao (Jason) Lu
        
                    计算机视觉/视频分析
        
        
        2024年 5月 3日
      
      基于 VILA 的 NVIDIA 硬件可视化语言模型
                  
            视觉语言模型最近有了显著的发展。然而,现有技术通常仅支持一个图像。他们无法在多个图像之间进行推理、支持上下文学习或理解视频。此外,
                
          
            3 MIN READ
          
        
      
    
        
                    计算机视觉/视频分析
        
        
        2024年 5月 3日
      
      视觉语言智能与 Edge AI 2.0
                  
            VILA 是 NVIDIA Research 和麻省理工学院共同开发的一系列高性能视觉语言模型。这些模型的参数规模从 ~3B 到 ~40B…
                
          
            3 MIN READ