Posts by Anu Srivastava
计算机视觉/视频分析
2025年 4月 5日
NVIDIA 加速推理 Meta Llama 4 Scout 与 Maverick 模型
最新一代热门 Llama AI 模型现已支持 Llama 4 Scout 和 Llama 4 Maverick。
2 MIN READ
数据中心/云端
2025年 3月 12日
轻量级、多模态、多语种 Gemma 3 模型实现性能优化
使用基础模型构建 AI 系统需要在内存、延迟、存储、计算等资源之间实现微妙的平衡。在将生成式 AI 功能引入快速发展的 AI 应用生态系统时,
1 MIN READ
AI 平台/部署
2025年 2月 26日
在 NVIDIA GPU 上训练的 Microsoft Phi SLM 的多模态最新进展
大语言模型(LLMs)已渗透到各行各业,并改变了技术潜力。但是,由于规模庞大,它们对于许多公司目前面临的资源限制来说并不切实际。
1 MIN READ
生成式人工智能/大语言模型
2024年 12月 17日
借助 NVIDIA TensorRT-LLM 预测解码,将 Llama 3.3 的推理吞吐量提升 3 倍
随着近期新增的 Llama 3.3 70B (一种纯文本指令调整模型),Meta 的开放 大语言模型 (LLMs) 集合将继续增长。
4 MIN READ