Posts by Fred Oh
数据科学
2025年 1月 31日
CUDA 工具包现已支持 NVIDIA Blackwell 架构
CUDA 工具包 的最新版本 (版本 12.8) 使用最新的 NVIDIA CPU 和 GPU,持续提升数据科学、AI、
3 MIN READ
数据中心/云端
2025年 1月 31日
CUDA 运行时中的动态加载机制
过去,我们使用 等离线工具将 GPU 设备代码与应用程序一起编译。在这种情况下,GPU 设备代码在 CUDA 运行时内部进行管理。然后,
3 MIN READ
数据中心/云端
2025年 1月 31日
NVIDIA 集合通信库 2.23 促使新的缩放算法和初始化方法的诞生
NVIDIA 集合通信库 (NCCL) 可实现针对 NVIDIA GPU 和网络进行优化的多 GPU 和多节点通信基元。
2 MIN READ
数据中心/云端
2024年 9月 16日
借助 NVIDIA 集合通信库实现显存高效、快速初始化和成本估算优化 2.22
在过去几个月中,NVIDIA 集合通信库(NCCL)开发者一直在努力开发一系列新的库功能和错误修复。在本文中,我们将讨论 NCCL 2.22…
2 MIN READ
生成式人工智能/大语言模型
2024年 9月 11日
用于直线 CUDA 图形和其他性能增强的恒定时间启动
CUDA Graphs 是一种将 GPU 运算定义为图形(而非一系列流启动)并将其批量处理的方法。CUDA Graph 将一组 CUDA…
3 MIN READ
数据中心/云端
2024年 9月 6日
利用 NVIDIA Magnum IO NVSHMEM 3.0 实现跨平台应用程序的可移植性和兼容性增强
NVSHMEM 是一个并行编程接口,可为 NVIDIA GPU 集群提供高效且可扩展的通信。NVSHMEM 是 NVIDIA Magnum…
3 MIN READ