CUDA

2025年 6月 4日
借助 NVIDIA 多进程服务更大限度地提高 OpenMM 分子动力学吞吐量
分子动力学 (MD) 模拟模拟原子在一段时间内的相互作用,并且需要强大的计算能力。然而,许多模拟的系统规模很小 (约 400K 个原子) ,
3 MIN READ

2025年 5月 23日
AI 将脑部 MRI 转化为潜在的中风预测因子
研究人员使用 AI 分析常规脑部扫描,发现了一种前景良好的新方法,可以可靠地识别常见但难以检测的多中风先兆。
1 MIN READ

2025年 5月 22日
Blackwell 借助 Meta 的 Llama 4 Maverick 突破 1000 TPS/ 用户门槛
NVIDIA 的大语言模型 (LLM) 推理速度创下了世界纪录。在包含 400 亿参数的 Llama 4 Maverick 模型 (…
3 MIN READ

2025年 5月 9日
CUDA C++ 编译器更新对 ELF 可见性和链接影响
在下一个 CUDA 主要版本 CUDA 13.0 中,NVIDIA 将对 NVIDIA CUDA 编译器驱动程序 (NVCC)…
4 MIN READ

2025年 5月 2日
CUDA 入门教程:更简单的介绍 (更新版)
注意:本博文最初发布于 2017 年 1 月 25 日,但已进行编辑以反映新的更新。 本文非常简单地介绍了 CUDA,
5 MIN READ

2025年 5月 1日
借助 NVIDIA cuBLAS 12.9 提高矩阵乘法速度和灵活性
NVIDIA CUDA-X 数学库助力开发者为 AI、科学计算、数据处理等领域构建加速应用。
3 MIN READ

2025年 5月 1日
NVIDIA Blackwell 和 NVIDIA CUDA 12.9 引入基于系列的架构特性
最早进入 NVIDIA GPU CUDA 平台的架构设计决策之一是支持 GPU 代码的向后兼容性。这种设计意味着,
3 MIN READ

2025年 4月 23日
NVIDIA cuPyNumeric 25.03 现已完全开源,支持 PIP 和 HDF5
NVIDIA cuPyNumeric 是一个库,旨在为基于 Legate 框架构建的 NumPy 提供分布式和加速的插入式替换。
2 MIN READ

2025年 4月 16日
宣布推出基于 CUDA 评估 LLM 的开源框架 ComputeEval
大语言模型 (LLMs) 正在彻底改变开发者的编码方式和编码学习方式。对于经验丰富的或初级的开发者来说,
1 MIN READ

2025年 4月 7日
初创公司利用人工智能改善孕产期和新生儿护理服务
每年,全球有近 30 万名女性死于因孕期或生产引起的并发症。在出生后的第一个月内死亡的死产儿和婴儿的数量每年超过近 400 万。
1 MIN READ

2025年 3月 12日
了解 CUDA GPU 计算的汇编语言 PTX
并行线程执行(PTX)是一种虚拟机指令集架构,从一开始就是 CUDA 的一部分。您可以将 PTX 视为 NVIDIA CUDA GPU…
4 MIN READ

2025年 3月 10日
优化 CUDA C++ 编译时间
在现代软件开发中,时间是非常宝贵的资源,尤其是在编译过程中。对于在大规模 GPU 加速应用程序上使用 CUDA C++的开发者而言,
2 MIN READ

2025年 3月 4日
使用 Numba 将 GPU 加速的算法交易模拟提高 100 多倍
量化开发者需要运行回测模拟,以便从损益(P&L)的角度了解金融算法的表现。统计技术对于根据可能的损益路径可视化算法的可能结果非常重要。
3 MIN READ

2025年 2月 25日
NVIDIA cuDSS 提高工程和科学计算中的求解器技术
NVIDIA cuDSS 是第一代稀疏直接求解器库,旨在加速工程和科学计算。cuDSS 正越来越多地应用于数据中心和其他环境,
4 MIN READ

2025年 2月 10日
适用于 RHEL9 的 NVIDIA 开放 GPU 数据中心驱动,由 Red Hat 签署
NVIDIA 和 Red Hat 合作,对 2020 年推出的预编译 NVIDIA Driver 进行持续改进。上个月,NVIDIA 宣布 ,
2 MIN READ

2025年 2月 4日
AI 基础模型增强癌症诊断并实现个性化治疗
斯坦福大学研究人员的一项新研究和 AI 模型正在简化癌症诊断、治疗规划和预后预测。这项名为 MUSK (Multimodal…
1 MIN READ