Intermediate Technical

2025年 5月 14日
借助 NVIDIA Nemo 框架,在远程数据中心网络中加速 LLM 训练
多数据中心训练对 AI 工厂至关重要,因为预训练扩展会推动更大模型的创建,导致对计算性能的需求超过单个设施的能力。
2 MIN READ

2025年 5月 13日
使用 NVIDIA Air 服务将模拟与现实世界连接
NVIDIA Air 通过创建真实数据中心基础设施部署的相同副本来实现云规模效率。借助 NVIDIA Air,您可以启动数百台交换机和服务器,
2 MIN READ

2025年 5月 9日
应用具有推理能力的专用大语言模型(LLM)加速电池研究
人工评估材料通常会拖慢电池创新等复杂领域的科学研究,限制了每天只有数十个候选材料的进展。在这篇博客文章中,
3 MIN READ

2025年 5月 9日
CUDA C++ 编译器更新对 ELF 可见性和链接影响
在下一个 CUDA 主要版本 CUDA 13.0 中,NVIDIA 将对 NVIDIA CUDA 编译器驱动程序 (NVCC)…
4 MIN READ

2025年 5月 8日
扩展 NVIDIA Agent Intelligence Toolkit 以支持新的代理式框架
NVIDIA Agent Intelligence toolkit 是一个开源库,用于高效连接和优化 AI 智能体 团队。
4 MIN READ

2025年 5月 8日
云端 Apache Spark 加速深度学习和大语言模型推理
Apache Spark 是用于大数据处理和分析的行业领先平台。随着非结构化数据(documents、emails、
4 MIN READ

2025年 5月 8日
借助 3DGUT 在 gsplat 中革新神经重建和渲染
从训练自动驾驶汽车 (AV) 到为机器人和数字孪生提供支持,逼真的 3D 仿真正在成为现代 AI 和图形的基石。
1 MIN READ

2025年 5月 8日
应用基于自动编码器的 GNN 检测 NetFlow 数据中的高吞吐量网络异常
随着现代企业和云环境的扩展,网络流量的复杂性和数量也在急剧增加。NetFlow 用于记录有关通过路由器、交换机或主机等网络设备的流量的元数据。
2 MIN READ

2025年 5月 7日
使用 Python 通过 OpenUSD 实现 3D 工作流自动化
通用场景描述 (OpenUSD) 提供了一个强大、开放且可扩展的生态系统,用于在复杂的 3D 世界中进行描述、合成、仿真和协作。
2 MIN READ

2025年 5月 7日
使用 NVIDIA NeMo Curator 构建 Nemotron-CC:一个高质量万亿令牌数据集,用于大型语言模型预训练,源自 Common Crawl
对于想要训练先进的 大语言模型 (LLM) 的企业开发者而言,整理高质量的预训练数据集至关重要。为了让开发者能够构建高度准确的 LLM,
2 MIN READ

2025年 5月 6日
LLM 推理基准测试指南:NVIDIA GenAI-Perf 和 NIM
这是 LLM 基准测试系列 的第二篇文章,介绍了在使用 NVIDIA NIM 部署 Meta Llama 3 模型 时,
4 MIN READ

2025年 5月 1日
借助超参数优化实现堆叠泛化:使用 NVIDIA cuML 在15分钟内最大化准确性
堆叠泛化是机器学习 (ML) 工程师广泛使用的技术,通过组合多个模型来提高整体预测性能。另一方面,超参数优化 (HPO)…
3 MIN READ

2025年 5月 1日
借助 NVIDIA cuBLAS 12.9 提高矩阵乘法速度和灵活性
NVIDIA CUDA-X 数学库助力开发者为 AI、科学计算、数据处理等领域构建加速应用。
3 MIN READ

2025年 5月 1日
NVIDIA Blackwell 和 NVIDIA CUDA 12.9 引入基于系列的架构特性
最早进入 NVIDIA GPU CUDA 平台的架构设计决策之一是支持 GPU 代码的向后兼容性。这种设计意味着,
3 MIN READ

2025年 4月 29日
构建应用程序以安全使用 KV 缓存
在与基于 Transformer 的模型 (如 大语言模型 (LLM) 和 视觉语言模型 (VLM)) 交互时,输入结构会塑造模型的输出。
2 MIN READ

2025年 4月 25日
R²D²:利用 NVIDIA 研究工作流程和模型提升灵巧机器人的适应性
如今,Robotic arms 用于组装、包装、检查等更多应用领域。但是,它们仍然经过预编程,可以执行特定的、通常是重复性的任务。
2 MIN READ