Posts by Mike Murphy
生成式人工智能/大语言模型
2024年 6月 18日
使用 NVIDIA CUDA Toolkit 12.4 编译器创建运行时 Fatbin
CUDA Toolkit 12.4 引入了一个新的 nvFatbin 库,用于在运行时创建 fatbins。fatbins,
4 MIN READ
模拟/建模/设计
2023年 1月 17日
CUDA 12.0 编译器使用 nvJitLink 库支持运行时 LTO
CUDA Toolkit 12.0 引入了一个新的 nvJitLink 库,用于实时链接时间优化( JIT LTO )支持。
5 MIN READ
高性能计算
2021年 10月 25日
使用 CUDA C ++编译辅助工具减少应用程序构建时间
CUDA 11 . 5 C ++编译器解决了不断增长的客户请求。具体来说,如何减少 CUDA 应用程序构建时间。除了消除未使用的内核外,
4 MIN READ
人工智能/深度学习
2021年 2月 12日
利用 NVIDIA CUDA 11 . 2 设备链路时间优化提高 GPU 应用性能
CUDA 11 . 2 的特点是在 GPU 加速应用程序中为设备代码提供强大的链路时间优化( LTO )功能。
3 MIN READ
人工智能/深度学习
2021年 2月 12日
用 NVIDIA CUDA 11 . 2 C ++编译器提高生产率和性能
11 . 2 CUDA C ++编译器结合了旨在提高开发者生产力和 GPU 加速应用性能的特性和增强。 编译器工具链将 LLVM 升级到 7…
6 MIN READ