Matthew Nicely

Matthew Nicely 于 2019 年 3 月加入 NVIDIA ,之前曾在美国 AL-Huntsville 的美国陆军航空和导弹研究开发与工程中心工作。在那里,他专注于 CUDA 算法开发和 Jetson 系列的优化。在 NVIDIA ,他曾在联邦部门工作,协助 CUDA 的开发和优化,以及在各种 NVIDIA 工具集上为客户提供教育和概念验证,最近转为 math libraries 产品经理。 2019 年,他获得了博士学位。计算机工程学位,专注于 GPU 的算法优化。

Posts by Matthew Nicely

AI 平台/部署

了解 NCCL 调优以加速 GPU 之间的通信

NVIDIA 集合通信库 (NCCL) 对于 AI 工作负载中的快速 GPU 到 GPU 通信至关重要,可使用各种优化和调优来提升性能。但是, 3 MIN READ
AI 平台/部署

NCCL 深度解析:跨数据中心通信与网络拓扑感知

随着 AI 训练规模的扩大,单个数据中心 (DC) 不足以提供所需的计算能力。 2 MIN READ
对话式人工智能

使用 NVIDIA cuDNN 9 加速多个 Transformer

我们提供的 NVIDIA CUDA 深度神经网络库(cuDNN) 是一个专门为深度学习应用而设计的 GPU 加速库, 4 MIN READ
模拟/建模/设计

CUDA 工具包 12.0 正式发布

NVIDIA 宣布最新的 CUDA 工具包软件版本 12.0 。该版本是多年来的第一个主要版本, 4 MIN READ
高性能计算

使用 cuTENSOR v1.4 编程分布式多 GPU 张量运算

今天, NVIDIA 宣布推出 cuTENSOR 1.4 版,它支持多达 64 维张量、分布式多 GPU 张量操作, 1 MIN READ
高性能计算

使用 CUTLASS v2.8 实现高性能矩阵乘法

NVIDIA 继续增强 Cutslass ,以提供对混合精度计算的广泛支持,提供专门的数据移动和多重累积抽象。今天, 1 MIN READ