Pradeep Ramani

Pradeep Ramani 是 NVIDIA 的高级深度学习架构师,致力于设计 GPU 上光速线性代数计算的抽象概念。Pradeep 拥有超过 14 年的 GPU 堆栈多层工作经验,包括硬件设计、架构、编程模型和库设计 (CUTLASS)。他获得了理科硕士学位。电气和计算机工程专业的博士生,来自加州大学圣巴巴拉分校 (University of California Santa Barbara)。

Posts by Pradeep Ramani

数据中心/云端

NVIDIA Blackwell 上的 OpenAI Triton 提升 AI 性能和可编程性

矩阵乘法和注意力机制是现代 AI 工作负载的计算支柱。虽然库如 NVIDIA cuDNN 提供高度优化的实现, 2 MIN READ