CUDA
2024年 7月 2日
使用 CRIU 实现 CUDA 应用程序检查点
CUDA 的检查点和恢复功能通过名为 cuda-checkpoint 的命令行实用程序公开,
3 MIN READ
2024年 6月 12日
在 cuBLAS 中引入分组 GEMM API 以及更多性能更新
最新版本 NVIDIA cuBLAS 库版本 12.5 将继续为深度学习(DL)和高性能计算(HPC)工作负载提供功能和性能。
2 MIN READ
2024年 5月 21日
使用 QUELO-G 和 CUDA 图进行量子力学增强型药物研发
在药物研发中,人们经常使用基于所谓经典力场的方法,并认为这些方法很有用。然而,人们也广泛认识到,力场模型中缺少一些重要的物理特性,
2 MIN READ
2024年 5月 14日
NVIDIA DeepStream 7.0 里程碑式发布,用于下一代视觉 AI 开发
NVIDIA DeepStream 是一个功能强大的 SDK,可以解锁 GPU 加速的构建块,以构建端到端的视觉 AI 管道。
3 MIN READ
2024年 5月 12日
NVIDIA CUDA-Q 新功能提升量子应用程序性能
NVIDIA CUDA-Q(前身为 NVIDIA CUDA Quantum)是一个开源编程模型,旨在构建 量子加速超级计算,充分发挥 CPU、
2 MIN READ
2024年 5月 10日
具有条件节点的 CUDA 图的动态控制流
CUDA 图 可以显著提高性能,因为驱动程序能够使用任务和依赖关系的完整描述来优化执行。特别是在静态工作流中,图形可以提供难以置信的好处,
2 MIN READ
2024年 3月 27日
高效的 CUDA 调试:将 NVIDIA Compute Sanitizer 与 NVIDIA 工具扩展程序结合使用并创建自定义工具
NVIDIA Compute Sanitizer 是一款功能强大的工具,可以节省时间和精力,同时提高 CUDA 应用程序的可靠性和性能。
5 MIN READ
2024年 3月 6日
CUDA 工具包 12.4 增强对 NVIDIA Grace Hopper 和机密计算的支持
最新版本的 CUDA 工具包,即 版本 12.4,继续利用最新的 NVIDIA GPU 来推动加速计算性能。
3 MIN READ
2024年 2月 28日
针对药物研发优化 OpenFold 训练
从氨基酸序列预测 3D 蛋白质结构一直是生物信息学领域由来已久的重要问题。近年来,基于深度学习的计算方法不断涌现,并已显示出有希望的结果。
2 MIN READ
2024年 1月 5日
在某些场景中使用 cgroup 缩短 CUDA 初始化时间
在多 GPU 平台上运行的许多 CUDA 应用程序通常使用单个 GPU 来满足其计算需求。在这种情况下,应用程序会支付性能损失,
2 MIN READ
2023年 4月 14日
GROMACS 2023 中的 CUDA 图指南
GPU 随着新一代的出现而不断加快,通常情况下 GPU 上的每个活动(如内核或内存拷贝)都会很快完成。在过去,
3 MIN READ
2023年 4月 4日
使用 Dataiku 和 NVIDIA Data Science 进行主题建模和图像分类
这个Dataiku platform日常人工智能简化了深度学习。用例影响深远,从图像分类到对象检测和自然语言处理( NLP )。
4 MIN READ
2023年 3月 22日
SDK 加速行业 5.0 、数据管道、计算科学等在 GTC 2023 上亮相
在 2023 年的 NVIDIA GTC 2023 上, NVIDIA 公布了其 NVIDIA AI 软件套件的显著更新,供开发者加速计算。
3 MIN READ
2023年 3月 21日
NVIDIA L4 GPU 实现 AI 视频和 AI 推理性能的超级充电
NVIDIA T4 于 4 年前作为通用 GPU 引入主流服务器。 T4 GPU 已被广泛采用,
3 MIN READ
2023年 3月 7日
开发用于自动车辆感知的端到端自动标记管道
精确标注的数据集对于基于相机的深度学习算法执行自动驾驶车辆感知至关重要。然而,手动标记数据是一个耗时且成本密集的过程。
2 MIN READ
2023年 3月 6日
在 GPU 上使用大规模并行哈希图实现性能最大化
数十年的计算机科学史致力于设计有效存储和检索信息的解决方案。哈希图(或哈希表)是一种流行的信息存储数据结构,因为它对元素的插入和检索具有摊销、
5 MIN READ