Posts by Pavlo Molchanov
对话式人工智能
2024年 11月 22日
Hymba 混合头架构提高小型语言模型性能
Transformer 及其基于注意力的架构,凭借强大的性能、并行化功能以及通过键值 (KV) 缓存进行的长期召回,已成为语言模型 (LM)…
5 MIN READ
计算机视觉/视频分析
2024年 5月 3日
基于 VILA 的 NVIDIA 硬件可视化语言模型
视觉语言模型最近有了显著的发展。然而,现有技术通常仅支持一个图像。他们无法在多个图像之间进行推理、支持上下文学习或理解视频。此外,
3 MIN READ