Posts by Matthew Nicely
AI 平台/部署
2025年 7月 22日
了解 NCCL 调优以加速 GPU 之间的通信
NVIDIA 集合通信库 (NCCL) 对于 AI 工作负载中的快速 GPU 到 GPU 通信至关重要,可使用各种优化和调优来提升性能。但是,
3 MIN READ
对话式人工智能
2024年 5月 24日
使用 NVIDIA cuDNN 9 加速多个 Transformer
我们提供的 NVIDIA CUDA 深度神经网络库(cuDNN) 是一个专门为深度学习应用而设计的 GPU 加速库,
4 MIN READ
模拟/建模/设计
2022年 12月 12日
CUDA 工具包 12.0 正式发布
NVIDIA 宣布最新的 CUDA 工具包软件版本 12.0 。该版本是多年来的第一个主要版本,
4 MIN READ
高性能计算
2021年 11月 29日
使用 cuTENSOR v1.4 编程分布式多 GPU 张量运算
今天, NVIDIA 宣布推出 cuTENSOR 1.4 版,它支持多达 64 维张量、分布式多 GPU 张量操作,
1 MIN READ
高性能计算
2021年 11月 23日
使用 CUTLASS v2.8 实现高性能矩阵乘法
NVIDIA 继续增强 Cutslass ,以提供对混合精度计算的广泛支持,提供专门的数据移动和多重累积抽象。今天,
1 MIN READ