Deepak Unnikrishnan

Deepak Unnikrishnan 是 NVIDIA CUDA 性能团队的高级软件工程师。他拥有马萨诸塞大学阿默斯特分校电气和计算机工程博士学位。他的兴趣是异构计算加速器系统的设计和性能优化。

Posts by Deepak Unnikrishnan

数据中心/云端

CUDA 12.1 支持大内核参数

CUDA 内核函数参数通过恒定存储器传递给设备,并且被限制为 4096 字节。 CUDA 12.1… 2 MIN READ