Deep dive

2025年 3月 10日
优化 CUDA C++ 编译时间
在现代软件开发中,时间是非常宝贵的资源,尤其是在编译过程中。对于在大规模 GPU 加速应用程序上使用 CUDA C++的开发者而言,
2 MIN READ

2025年 3月 5日
借助 NVIDIA NIM 和 NVIDIA Holoscan for Media 增强直播媒体工作流程效率
NVIDIA Holoscan for Media 是一个 NVIDIA 加速平台,专为多供应商实时制作和 AI 而设计。
2 MIN READ

2025年 3月 4日
使用 Numba 将 GPU 加速的算法交易模拟提高 100 多倍
量化开发者需要运行回测模拟,以便从损益(P&L)的角度了解金融算法的表现。统计技术对于根据可能的损益路径可视化算法的可能结果非常重要。
3 MIN READ

2025年 2月 25日
NVIDIA cuDSS 提高工程和科学计算中的求解器技术
NVIDIA cuDSS 是第一代稀疏直接求解器库,旨在加速工程和科学计算。cuDSS 正越来越多地应用于数据中心和其他环境,
4 MIN READ

2025年 2月 25日
定义 LLM 红色团队
在一项活动中,人们为生成式 AI 技术 (例如大语言模型 (LLMs)) 提供输入,以确定输出是否会偏离可接受的标准。
1 MIN READ

2025年 2月 25日
基于 Marco 多 AI 智能体框架的可配置图形任务求解在芯片设计中的应用
芯片和硬件设计因其复杂性和先进的技术而面临众多挑战。这些挑战导致在合成、验证、物理设计和可靠性循环期间优化性能、功耗、
2 MIN READ

2025年 2月 24日
NVIDIA 视频编解码器 SDK 13.0 由 NVIDIA Blackwell 驱动
NVIDIA Video Codec SDK 13.0 的发布标志着重大升级,增加了对新一代 NVIDIA Blackwell GPU…
3 MIN READ

2025年 2月 20日
制造业产品设计工作流程的生成式 AI 转型
长期以来,制造行业的传统设计和工程工作流程一直以顺序迭代的方法为特征,这种方法通常既耗时又需要大量资源。这些传统方法通常涉及需求收集、
2 MIN READ

2025年 2月 13日
使用 DeepSeek-R1 和推理时间缩放实现自动化 GPU 内核生成
随着 AI 模型扩展其功能以解决更复杂的挑战,一种称为“ 测试时扩展 ”或“ 推理时扩展 ”的新扩展法则正在出现。
2 MIN READ

2025年 2月 11日
NVIDIA DGX 云推出即用型模板,更好地评估 AI 平台性能
在快速发展的 AI 系统和工作负载环境中,实现出色的模型训练性能远远超出芯片速度。这需要对整个堆栈进行全面评估,从计算到网络,再到模型框架。
2 MIN READ

2025年 2月 10日
NVIDIA Grace CPU 与 Arm 软件生态系统集成
NVIDIA Grace CPU 将节能高效的性能提升到了新的高度,正在改变数据中心的设计。Grace CPU 专为数据中心规模打造,
2 MIN READ

2025年 2月 5日
利用特定领域的微调和 NVIDIA NIM 提高翻译质量
翻译在助力公司实现跨国业务扩展方面发挥着至关重要的作用,在语调、准确性和技术术语处理方面的要求差异很大。
3 MIN READ

2025年 1月 31日
CUDA 运行时中的动态加载机制
过去,我们使用 等离线工具将 GPU 设备代码与应用程序一起编译。在这种情况下,GPU 设备代码在 CUDA 运行时内部进行管理。然后,
3 MIN READ

2025年 1月 29日
掌握 LLM 技术:评估
评估大语言模型(LLMs) 和 检索增强生成(RAG) 系统是一个复杂而微妙的过程,反映了这些系统的复杂性和多面性。 与传统机器学习(ML)…
2 MIN READ

2025年 1月 29日
使用 GPU 在 Apache Spark 上加速 JSON 处理
JSON 是一种热门的文本数据格式,可实现 Web 应用程序中系统之间的互操作性以及数据管理。这种格式自 21 世纪初就已存在,
3 MIN READ