Posts by Anjali Shah
生成式人工智能/大语言模型
2024年 12月 17日
借助 NVIDIA TensorRT-LLM 预测解码,将 Llama 3.3 的推理吞吐量提升 3 倍
随着近期新增的 Llama 3.3 70B (一种纯文本指令调整模型),Meta 的开放 大语言模型 (LLMs) 集合将继续增长。
4 MIN READ
生成式人工智能/大语言模型
2024年 12月 11日
NVIDIA TensorRT-LLM 现支持动态批处理加速编码器 - 解码器模型
NVIDIA 最近宣布, NVIDIA TensorRT-LLM 现可加速编码器 – 解码器模型架构 。
1 MIN READ
数据中心/云端
2024年 11月 19日
Llama 3.2 全栈优化释放 NVIDIA GPU 的高性能
Meta 最近发布了 Llama 3.2 系列视觉语言模型(VLM),其中包含 11B 参数和 90B 参数变体。这些模型是多模态模型,
2 MIN READ
对话式人工智能
2024年 9月 25日
Llama 3.2 加速部署从边缘到云端实现提速
扩展开源 Meta Llama 模型集合,Llama 3.2 集合包括视觉语言模型(VLM)、小语言模型(SLM)和更新版的 Llama…
2 MIN READ
生成式人工智能/大语言模型
2024年 8月 22日
Jamba 1.5 LLM 混合架构实现出色的推理和长上下文处理能力
AI21 Labs 推出了最新、最先进的 Jamba 1.5 模型系列,这是一个先进的大型语言模型(LLM)集合,
1 MIN READ
生成式人工智能/大语言模型
2024年 7月 26日
单个 GPU 上的 Mistral NeMo 12B 加速文本生成应用程序
NVIDIA 与 Mistral 合作构建了下一代语言模型,该模型可在其类别中的基准测试中实现领先的性能。
2 MIN READ