Posts by Anu Srivastava
AI 平台/部署
2025年 9月 15日
全新 Qwen3-Next 开源模型预览:MoE 架构在 NVIDIA 平台实现更高精度与加速并行处理速度
随着 AI 模型规模不断扩大且处理的文本序列越来越长,效率变得与规模同样重要。 为展示未来趋势,
2 MIN READ
AI 平台/部署
2025年 8月 5日
NVIDIA 从云到边缘加速 OpenAI gpt-oss 模型部署,在 NVIDIA GB200 NVL72 上实现 150 万 TPS 推理
自 2016 年推出 NVIDIA DGX 以来,NVIDIA 与 OpenAI 便开始共同推动 AI 技术的边界。
1 MIN READ
AI 平台/部署
2025年 6月 26日
在 NVIDIA Jetson 和 RTX 上运行 Google DeepMind 的 Gemma 3n
截至今日,NVIDIA 现已支持在 NVIDIA RTX 和 Jetson 上全面推出 Gemma 3n。上个月,
1 MIN READ
计算机视觉/视频分析
2025年 4月 5日
NVIDIA 加速推理 Meta Llama 4 Scout 与 Maverick 模型
最新一代热门 Llama AI 模型现已支持 Llama 4 Scout 和 Llama 4 Maverick。
2 MIN READ
数据中心/云端
2025年 3月 12日
轻量级、多模态、多语种 Gemma 3 模型实现性能优化
使用基础模型构建 AI 系统需要在内存、延迟、存储、计算等资源之间实现微妙的平衡。在将生成式 AI 功能引入快速发展的 AI 应用生态系统时,
1 MIN READ
AI 平台/部署
2025年 2月 26日
在 NVIDIA GPU 上训练的 Microsoft Phi SLM 的多模态最新进展
大语言模型(LLMs)已渗透到各行各业,并改变了技术潜力。但是,由于规模庞大,它们对于许多公司目前面临的资源限制来说并不切实际。
1 MIN READ