Development & Optimization

2025年 4月 16日
宣布推出基于 CUDA 评估 LLM 的开源框架 ComputeEval
大语言模型 (LLMs) 正在彻底改变开发者的编码方式和编码学习方式。对于经验丰富的或初级的开发者来说,
1 MIN READ

2025年 4月 3日
使用 GPU 加速 Apache Spark 上的 Apache Parquet 扫描
随着各行各业企业的数据规模不断增长, Apache Parquet 已成为一种重要的数据存储格式。
3 MIN READ

2025年 4月 2日
NVIDIA Blackwell 在 MLPerf Inference v5.0 中实现巨大的性能飞跃
在不断增长的模型大小、实时延迟要求以及最近的 AI 推理的推动下, 大语言模型 (LLM) 推理的计算需求正在快速增长。与此同时,
3 MIN READ

2025年 3月 25日
借助 NVIDIA Mission Control 实现 AI 工厂自动化
DeepSeek-R1 等先进的 AI 模型证明,企业现在可以构建专用于自己的数据和专业知识的尖端 AI 模型。
2 MIN READ

2025年 3月 20日
NVIDIA 展示用于游戏 AI 推理和简化实操机会的 GeForce NOW
NVIDIA 云游戏服务 GeForce NOW 为开发者和发行商提供新工具,让更多游戏玩家畅玩他们的游戏,并提供只有通过云才能实现的新体验。
1 MIN READ

2025年 3月 18日
隆重推出 NVIDIA Dynamo:用于扩展推理AI模型的低延迟分布式推理框架
NVIDIA 今天在 GTC 2025 宣布发布 NVIDIA Dynamo 。NVIDIA Dynamo 是一个高吞吐量、
4 MIN READ

2025年 3月 12日
了解 CUDA GPU 计算的汇编语言 PTX
并行线程执行(PTX)是一种虚拟机指令集架构,从一开始就是 CUDA 的一部分。您可以将 PTX 视为 NVIDIA CUDA GPU…
4 MIN READ

2025年 3月 10日
优化 CUDA C++ 编译时间
在现代软件开发中,时间是非常宝贵的资源,尤其是在编译过程中。对于在大规模 GPU 加速应用程序上使用 CUDA C++的开发者而言,
2 MIN READ

2025年 2月 25日
NVIDIA cuDSS 提高工程和科学计算中的求解器技术
NVIDIA cuDSS 是第一代稀疏直接求解器库,旨在加速工程和科学计算。cuDSS 正越来越多地应用于数据中心和其他环境,
4 MIN READ

2025年 2月 20日
制造业产品设计工作流程的生成式 AI 转型
长期以来,制造行业的传统设计和工程工作流程一直以顺序迭代的方法为特征,这种方法通常既耗时又需要大量资源。这些传统方法通常涉及需求收集、
2 MIN READ

2025年 2月 13日
使用 DeepSeek-R1 和推理时间缩放实现自动化 GPU 内核生成
随着 AI 模型扩展其功能以解决更复杂的挑战,一种称为“ 测试时扩展 ”或“ 推理时扩展 ”的新扩展法则正在出现。
2 MIN READ

2025年 1月 15日
提升 AI 性能的 GPU 内存基础知识
生成式 AI 彻底改变了人们将想法变为现实的方式,而代理 AI 代表着这一技术变革的下一次飞跃。通过利用复杂的自主推理和迭代规划,
2 MIN READ

2024年 12月 17日
NVIDIA OptiX 着色器绑定表优化实现高效光线追踪
NVIDIA OptiX 是通过 CUDA 实现 GPU 加速光线追踪的 API,通常用于渲染包含各种物体和材质的场景。
2 MIN READ

2024年 12月 16日
2024 年热门文章:NVIDIA NIM、语言模型突破和数据科学优化的精要
对于使用 NVIDIA 技术的开发者、研究人员和创新者来说,2024 年又是具有里程碑意义的一年。
2 MIN READ

2024年 11月 20日
使用 EMBark 加速大规模推荐系统嵌入式训练优化
推荐系统是互联网行业的核心,而高效地训练这些系统对于各大公司来说是一个关键问题。大多数推荐系统是深度学习推荐模型(DLRMs),
2 MIN READ

2024年 10月 31日
深度学习 AI 模型无需手术即可检测乳腺癌扩散
在诊断癌细胞是否扩散(包括扩散到附近的淋巴结)时, 新的深度学习模型 可以减少对手术的需求(也称为转移)。
1 MIN READ