Ian Tramble

Ian 是 NVIDIA TensorRT 团队的高级系统软件工程师,他专注于 MLPerf 推理。在加入 TensorRT 团队之前,他曾为 NVIDIA 自动驾驶软件开发实时调度系统。伊恩毕业于多伦多大学工程科学专业,主修电气和计算机工程。

Posts by Ian Tramble

AI 平台/部署

借助启发式算法和 CUTLASS 4.2 提高 NVIDIA GPU 上的 GEMM 内核自动调整效率

为特定问题和硬件选择合适的通用矩阵乘法(GEMM)核函数是一项重大挑战。GEMM 核函数的性能由一系列编译时和运行时的元参数共同决定, 2 MIN READ
模拟/建模/设计

在 MLPerf 推理 2.0 上获得最佳性能

Megatron 530B 等机型正在扩大人工智能可以解决的问题范围。然而,随着模型的复杂性不断增加,它们对人工智能计算平台构成了双重挑战: 4 MIN READ