Posts by Ashraf Eassa
数据中心/云端
2024年 3月 27日
NVIDIA H200 Tensor Core GPU 和 NVIDIA TensorRT-LLM 集 MLPerf LLM 推理记录
随着生成式 AI 模型的持续创新,生成式 AI 在计算应用方面取得了巨大进步,从而大幅增强人类能力。这些模型包括 生成式 AI 模型,
3 MIN READ
数据中心/云端
2023年 12月 13日
借助 NVIDIA H100 Tensor Core GPU 和 NVIDIA TensorRT-LLM 实现出色的推理性能
出色的 AI 性能需要高效的并行计算架构、高效的工具堆栈和深度优化的算法。NVIDIA 发布了 NVIDIA TensorRT-LLM,
2 MIN READ
数据中心/云端
2023年 12月 4日
新的 NVIDIA NeMo 框架功能和 NVIDIA H200 强效助力 LLM 训练性能和通用性
AI 在规模、复杂性和多样性方面的快速增长推动了对 大型语言模型 (LLM) 训练性能的不断需求。要提供出色的性能,
3 MIN READ
数据中心/云端
2023年 9月 11日
NVIDIA GH200 Grace Hopper 超级芯片首次亮相,取得领先的 MLPerf 推理 v3.1 结果
人工智能正在改变计算方式,推动AI在全球范围内的应用部署。智能聊天机器人、图像和视频合成的简单文本提示、
4 MIN READ
网络
2023年 7月 6日
新的 MLPerf 推理网络部门展示 NVIDIA InfiniBand 和 GPUDirect RDMA 功能
在 MLPerf Inference v3.0 中,NVIDIA 首次向新推出的 网络分割 投入,
3 MIN READ
数据中心/云端/边缘
2023年 4月 5日
通过 AI 的全栈优化在 MLPerf 推理 v3.0 中创下新纪录
目前最令人兴奋的计算应用程序依赖于在复杂的人工智能模型上进行训练和运行推理,通常是在要求苛刻的实时部署场景中。需要高性能、
5 MIN READ