Cris Cecka

Cris Cecka 博士于 2011 年获得斯坦福大学计算与数学工程博士学位。他加入哈佛大学新成立的应用计算科学研究所,担任讲师兼研究科学家,期间开设了关于并行计算和稳健软件开发的课程。他还曾在麻省理工学院数学系担任研究助理,专注于积分方程方法、结构化密集矩阵分解以及使用分层算法的广义 N-body 问题。2015 年,Cris 加入 NVIDIA 研究团队,在设计高级数值算法和软件方面整合了所有这些兴趣。

Posts by Cris Cecka

AI 平台/部署

CUTLASS:基于张量和空间微核处理多维数据的原理抽象

在生成式 AI 时代,充分发挥 GPU 的潜力对于训练更好的模型和大规模服务用户至关重要。通常, 4 MIN READ
开发与优化

CUTLASS 3.x:用于 GEMM 内核设计的正交、可重用和组合抽象

GPU 上的 GEMM 优化是一个模块化问题。高性能实现需要指定超参数,例如图块形状、数学和复制指令以及线程束专用方案。 3 MIN READ