Ashraf Eassa

Ashraf Eassa 是NVIDIA 加速计算集团内部的高级产品营销经理。

Posts by Ashraf Eassa

生成式人工智能/大语言模型

NVIDIA TensorRT 模型优化器加速生成人工智能推理性能,现已公开

在快速发展的环境中,生成人工智能的发展对加速推理速度的需求仍然是一个紧迫的问题。随着模型规模和复杂性的指数级增长, 3 MIN READ
数据中心/云端

NVIDIA H200 Tensor Core GPU 和 NVIDIA TensorRT-LLM 集 MLPerf LLM 推理记录

随着生成式 AI 模型的持续创新,生成式 AI 在计算应用方面取得了巨大进步,从而大幅增强人类能力。这些模型包括 生成式 AI 模型, 3 MIN READ
数据中心/云端

借助 NVIDIA H100 Tensor Core GPU 和 NVIDIA TensorRT-LLM 实现出色的推理性能

出色的 AI 性能需要高效的并行计算架构、高效的工具堆栈和深度优化的算法。NVIDIA 发布了 NVIDIA TensorRT-LLM, 2 MIN READ
数据中心/云端

新的 NVIDIA NeMo 框架功能和 NVIDIA H200 强效助力 LLM 训练性能和通用性

AI 在规模、复杂性和多样性方面的快速增长推动了对 大型语言模型 (LLM) 训练性能的不断需求。要提供出色的性能, 3 MIN READ
数据中心/云端

NVIDIA GH200 Grace Hopper 超级芯片首次亮相,取得领先的 MLPerf 推理 v3.1 结果

人工智能正在改变计算方式,推动AI在全球范围内的应用部署。智能聊天机器人、图像和视频合成的简单文本提示、 4 MIN READ
网络

新的 MLPerf 推理网络部门展示 NVIDIA InfiniBand 和 GPUDirect RDMA 功能

在 MLPerf Inference v3.0 中,NVIDIA 首次向新推出的 网络分割 投入, 3 MIN READ