开发与优化

2025年 5月 9日
CUDA C++ 编译器更新对 ELF 可见性和链接影响
在下一个 CUDA 主要版本 CUDA 13.0 中,NVIDIA 将对 NVIDIA CUDA 编译器驱动程序 (NVCC)…
4 MIN READ

2025年 5月 2日
CUDA 入门教程:更简单的介绍 (更新版)
注意:本博文最初发布于 2017 年 1 月 25 日,但已进行编辑以反映新的更新。 本文非常简单地介绍了 CUDA,
5 MIN READ

2025年 5月 1日
借助超参数优化实现堆叠泛化:使用 NVIDIA cuML 在15分钟内最大化准确性
堆叠泛化是机器学习 (ML) 工程师广泛使用的技术,通过组合多个模型来提高整体预测性能。另一方面,超参数优化 (HPO)…
3 MIN READ

2025年 5月 1日
NVIDIA Blackwell 和 NVIDIA CUDA 12.9 引入基于系列的架构特性
最早进入 NVIDIA GPU CUDA 平台的架构设计决策之一是支持 GPU 代码的向后兼容性。这种设计意味着,
3 MIN READ

2025年 4月 29日
Kaggle 大师揭秘数据科学超能力的获胜策略
来自 NVIDIA 的 Kaggle Grandmaster David Austin 和 Chris Deotte 以及 HP 的…
2 MIN READ

2025年 4月 23日
NVIDIA cuPyNumeric 25.03 现已完全开源,支持 PIP 和 HDF5
NVIDIA cuPyNumeric 是一个库,旨在为基于 Legate 框架构建的 NumPy 提供分布式和加速的插入式替换。
2 MIN READ

2025年 4月 23日
利用 NVIDIA DesignWorks 实现实时 GPU 加速的高斯体渲染示例 vk_gaussian_splatting
高斯射是一种渲染复杂 3D 场景的新颖方法,可将这些场景表示为 3D 空间中各向异性 Gaussians 的集合。
1 MIN READ

2025年 4月 21日
使用 NVIDIA TensorRT 优化基于 Transformer 的扩散模型以生成视频
先进的图像扩散模型需要数十秒才能处理单张图像。这使得视频扩散更具挑战性,需要大量计算资源和高昂成本。
4 MIN READ