CUDA

6月 05, 2023
CUDA 12.1 支持大内核参数
CUDA 内核函数参数通过恒定存储器传递给设备,并且被限制为 4096 字节。 CUDA 12.1…
2 MIN READ

6月 02, 2023
利用 NVIDIA AI 企业在 Azure 机器学习上的力量
人工智能正在改变行业,实现流程自动化,并在快速发展的技术格局中为创新开辟新的机会。随着越来越多的企业认识到将人工智能融入运营的价值,
2 MIN READ

5月 17, 2023
高级 API 性能: CPU
本文介绍了使用 NVIDIA GPU 时的 CPU 最佳实践。要在应用程序中获得高且一致的帧速率,请参阅高级API 性能提示。
1 MIN READ

5月 16, 2023
异步错误报告:当 printf 无法执行时
有些编程情况要求异步报告“软”错误。虽然可以是一个有用的工具,它可以增加寄存器的使用并影响性能。在这篇文章中,我们提出了一个替代方案,
5 MIN READ

4月 28, 2023
微软和 TempoQuest 利用 AceCast 加速风能预测
准确的天气建模对于公司正确预测可再生能源生产和规划自然灾害至关重要。仅在 2022 年,无效和未预测的天气就造成了 7140 亿美元的损失。
2 MIN READ

4月 23, 2023
调试混合 Python 和 C 语言堆栈
调试很困难。跨多种语言调试尤其具有挑战性,跨设备调试通常需要一个具有不同技能和专业知识的团队来揭示潜在问题 然而,项目通常需要使用多种语言,
7 MIN READ

4月 14, 2023
GROMACS 2023 中的 CUDA 图指南
GPU 随着新一代的出现而不断加快,通常情况下 GPU 上的每个活动(如内核或内存拷贝)都会很快完成。在过去,
3 MIN READ

4月 04, 2023
使用 Dataiku 和 NVIDIA Data Science 进行主题建模和图像分类
这个Dataiku platform日常人工智能简化了深度学习。用例影响深远,从图像分类到对象检测和自然语言处理( NLP )。
4 MIN READ

3月 07, 2023
开发用于自动车辆感知的端到端自动标记管道
精确标注的数据集对于基于相机的深度学习算法执行自动驾驶车辆感知至关重要。然而,手动标记数据是一个耗时且成本密集的过程。
2 MIN READ

3月 06, 2023
在 GPU 上使用大规模并行哈希图实现性能最大化
数十年的计算机科学史致力于设计有效存储和检索信息的解决方案。哈希图(或哈希表)是一种流行的信息存储数据结构,因为它对元素的插入和检索具有摊销、
5 MIN READ

2月 10, 2023
基于 FLAME GPU 的 NVIDIA GPU 快速大规模代理模拟
新冠肺炎疫情引起了公众对基于代理的建模与仿真( ABMS )的关注。它是研究行为的一种强大的计算技术,无论是流行病学、生物学、
5 MIN READ

1月 31, 2023
使用 cuNumeric 和 Legate 加速 Python 应用程序
cuNumeric 是一个库,旨在为支持所有 indexing view 功能(如就地更新、 NumPy 和完整 indexing view…
4 MIN READ

1月 17, 2023
CUDA 12.0 编译器使用 nvJitLink 库支持运行时 LTO
CUDA Toolkit 12.0 引入了一个新的 nvJitLink 库,用于实时链接时间优化( JIT LTO )支持。
5 MIN READ

12月 12, 2022
CUDA 工具包 12.0 正式发布
NVIDIA 宣布最新的 CUDA 工具包软件版本 12.0 。该版本是多年来的第一个主要版本,
4 MIN READ

12月 12, 2022
CUDA 上下文无关模块加载
大多数 CUDA 开发人员都熟悉 API 及其对应的 API ,用于将包含设备代码的模块加载到 CUDA context 中。在大多数情况下,
1 MIN READ

12月 12, 2022
通过设备图启动启用 CUDA 图中的动态控制流
CUDA 图形通过将用户操作定义为任务图(可以在单个操作中启动),显著减少了启动大量用户操作的开销。
2 MIN READ