Blackwell
2024年 10月 8日
将 AI-RAN 引入您附近的电信公司
生成式 AI 和 AI 智能体的推理将推动 AI 计算基础设施从边缘分配到中央云的需求。 IDC 预测 ,“商业 AI (消费者除外)…
5 MIN READ
2024年 8月 28日
NVIDIA Blackwell 平台在 MLPerf Inference v4.1 中创下新的 LLM 推理记录
大型语言模型 (LLM) 推理是一项全栈挑战。实现高吞吐量、低延迟推理需要强大的 GPU、高带宽 GPU 之间的互连、
4 MIN READ
2024年 6月 12日
揭开万亿参数大型语言模型 AI 推理部署的神秘面纱
人工智能(AI)正在改变各行各业,解决精准药物发现、自动驾驶汽车开发等重大人类科学挑战,
4 MIN READ
2024年 5月 8日
NVIDIA TensorRT 模型优化器加速生成人工智能推理性能,现已公开
在快速发展的环境中,生成人工智能的发展对加速推理速度的需求仍然是一个紧迫的问题。随着模型规模和复杂性的指数级增长,
3 MIN READ