Author: - NVIDIA 技术博客

Ashraf Eassa

Ashraf Eassa 是NVIDIA 加速计算集团内部的高级产品营销经理。

Posts by Ashraf Eassa

数据中心/云端 2024年 3月 27日

NVIDIA H200 Tensor Core GPU 和 NVIDIA TensorRT-LLM 集 MLPerf LLM 推理记录

随着生成式 AI 模型的持续创新，生成式 AI 在计算应用方面取得了巨大进步，从而大幅增强人类能力。这些模型包括生成式 AI 模型， 3 MIN READ

数据中心/云端 2023年 12月 13日

借助 NVIDIA H100 Tensor Core GPU 和 NVIDIA TensorRT-LLM 实现出色的推理性能

出色的 AI 性能需要高效的并行计算架构、高效的工具堆栈和深度优化的算法。NVIDIA 发布了 NVIDIA TensorRT-LLM， 2 MIN READ

数据中心/云端 2023年 12月 4日

新的 NVIDIA NeMo 框架功能和 NVIDIA H200 强效助力 LLM 训练性能和通用性

AI 在规模、复杂性和多样性方面的快速增长推动了对大型语言模型 (LLM) 训练性能的不断需求。要提供出色的性能， 3 MIN READ

数据中心/云端 2023年 9月 11日

NVIDIA GH200 Grace Hopper 超级芯片首次亮相，取得领先的 MLPerf 推理 v3.1 结果

人工智能正在改变计算方式，推动AI在全球范围内的应用部署。智能聊天机器人、图像和视频合成的简单文本提示、 4 MIN READ

网络 2023年 7月 6日

新的 MLPerf 推理网络部门展示 NVIDIA InfiniBand 和 GPUDirect RDMA 功能

在 MLPerf Inference v3.0 中，NVIDIA 首次向新推出的网络分割投入， 3 MIN READ

数据中心/云端/边缘 2023年 4月 5日

通过 AI 的全栈优化在 MLPerf 推理 v3.0 中创下新纪录

目前最令人兴奋的计算应用程序依赖于在复杂的人工智能模型上进行训练和运行推理，通常是在要求苛刻的实时部署场景中。需要高性能、 5 MIN READ