CUDA C++

2025年 5月 9日
CUDA C++ 编译器更新对 ELF 可见性和链接影响
在下一个 CUDA 主要版本 CUDA 13.0 中,NVIDIA 将对 NVIDIA CUDA 编译器驱动程序 (NVCC)…
4 MIN READ

2024年 8月 8日
通过降低指令缓存未命中率提高 GPU 性能
GPU 专为高速处理大量数据而设计。GPU 具有称为流多处理器 (SM) 的大量计算资源,以及一系列可为其提供数据的设施:高带宽内存、
2 MIN READ

2022年 3月 23日
通过 GPU 内存预取提高应用程序性能
NVIDIA GPU 具有强大的计算能力,通常必须以高速传输数据才能部署这种能力。原则上这是可能的,因为 GPU 也有很高的内存带宽,
3 MIN READ

2022年 2月 10日
用 CUDA int128 实现高精度十进制算法
“事实太复杂了,除了近似,什么都不允许。 ” — 约翰·冯·诺依曼 计算的历史已经证明,用计算机硬件实现的相对简单的算法所能实现的是无限的。
6 MIN READ