Matthew Nicely

Matthew Nicely 于 2019 年 3 月加入 NVIDIA ,之前曾在美国 AL-Huntsville 的美国陆军航空和导弹研究开发与工程中心工作。在那里,他专注于 CUDA 算法开发和 Jetson 系列的优化。在 NVIDIA ,他曾在联邦部门工作,协助 CUDA 的开发和优化,以及在各种 NVIDIA 工具集上为客户提供教育和概念验证,最近转为 math libraries 产品经理。 2019 年,他获得了博士学位。计算机工程学位,专注于 GPU 的算法优化。

Posts by Matthew Nicely

对话式人工智能

使用 NVIDIA cuDNN 9 加速多个 Transformer

我们提供的 NVIDIA CUDA 深度神经网络库(cuDNN) 是一个专门为深度学习应用而设计的 GPU 加速库, 4 MIN READ
模拟/建模/设计

CUDA 工具包 12.0 正式发布

NVIDIA 宣布最新的 CUDA 工具包软件版本 12.0 。该版本是多年来的第一个主要版本, 4 MIN READ
高性能计算

使用 cuTENSOR v1.4 编程分布式多 GPU 张量运算

今天, NVIDIA 宣布推出 cuTENSOR 1.4 版,它支持多达 64 维张量、分布式多 GPU 张量操作, 1 MIN READ
高性能计算

使用 CUTLASS v2.8 实现高性能矩阵乘法

NVIDIA 继续增强 Cutslass ,以提供对混合精度计算的广泛支持,提供专门的数据移动和多重累积抽象。今天, 1 MIN READ
高性能计算

加速 ReLu 和 GeLu 激活功能,并在 cuSPARSELt v0.2.0 中批量稀疏 GEMM

今天,英伟达宣布推出 cuSPARSELt,版本 0 . 2 . 0 ,它提高了激活函数、偏差向量和批处理稀疏 GEMM 的性能。 2 MIN READ
高性能计算

在 nvCOMP v2.1.0 中使用完全重新设计的批处理 API 和性能优化

今天, NVIDIA 宣布推出 nvCOMP 2 . 1 . 0 版。现在可以免费下载此软件。 立即下载 有关更多信息, 1 MIN READ