数据中心/云

2025年 2月 12日
使用 NVIDIA NeMo 框架进行 LLM 模型剪枝和知识蒸馏
模型剪枝和知识蒸馏是功能强大且经济高效的策略,用于从最初较大的同级获得较小的语言模型。 在一篇“ 如何剪枝和蒸馏 Llama-3.1 8B ”…
4 MIN READ

2025年 2月 11日
NVIDIA DGX 云推出即用型模板,更好地评估 AI 平台性能
在快速发展的 AI 系统和工作负载环境中,实现出色的模型训练性能远远超出芯片速度。这需要对整个堆栈进行全面评估,从计算到网络,再到模型框架。
2 MIN READ

2025年 2月 10日
NVIDIA Grace CPU 与 Arm 软件生态系统集成
NVIDIA Grace CPU 将节能高效的性能提升到了新的高度,正在改变数据中心的设计。Grace CPU 专为数据中心规模打造,
2 MIN READ

2025年 2月 5日
使用 NVIDIA AI Workbench 简化本地和云系统之间的协作
NVIDIA AI Workbench 是一款免费的开发环境管理器 ,用于在 GPUs 上开发、定制 AI 应用并对其进行原型设计。
3 MIN READ

2025年 2月 5日
NVIDIA Blackwell 上的 OpenAI Triton 提升 AI 性能和可编程性
矩阵乘法和注意力机制是现代 AI 工作负载的计算支柱。虽然库如 NVIDIA cuDNN 提供高度优化的实现,
2 MIN READ

2025年 2月 4日
NVIDIA Spectrum-X 网络平台和合作伙伴提升 AI 存储性能达48%
AI 工厂依靠的不仅仅是计算网。当然,连接 GPU 的东西向网络对于 AI 应用的性能至关重要,而连接高速存储阵列的存储网也不容忽视。
1 MIN READ

2025年 1月 31日
CUDA 运行时中的动态加载机制
过去,我们使用 等离线工具将 GPU 设备代码与应用程序一起编译。在这种情况下,GPU 设备代码在 CUDA 运行时内部进行管理。然后,
3 MIN READ

2025年 1月 31日
NVIDIA 集合通信库 2.23 促使新的缩放算法和初始化方法的诞生
NVIDIA 集合通信库 (NCCL) 可实现针对 NVIDIA GPU 和网络进行优化的多 GPU 和多节点通信基元。
2 MIN READ

2025年 1月 30日
掌握 cudf.pandas Profiler 实现 GPU 加速
在 Python 数据科学领域,pandas 长期以来一直是直观数据操作和分析的首选库。但是,随着数据量的增长,
2 MIN READ

2025年 1月 16日
借助 iGenius 和 NVIDIA DGX 云,继续为主权 AI 和受监管行业预训练先进的 LLM
近年来,大语言模型(LLMs)在推理、代码生成、机器翻译和摘要等领域取得了非凡的进步。然而,尽管基础模型具有先进的功能,
4 MIN READ

2025年 1月 13日
借助 NVIDIA DOCA 平台框架,助力新一代 DPU 加速云基础设施
越来越多的企业组织开始采用加速计算来满足生成式 AI、5G 电信和主权云的需求。NVIDIA 发布了 DOCA 平台框架 (DPF),
2 MIN READ

2024年 12月 24日
借助 NVIDIA 全栈解决方案提升 AI 推理性能
AI 驱动的应用的爆炸式发展对开发者提出了前所未有的要求,他们必须在提供先进的性能与管理运营复杂性和成本以及 AI 基础设施之间取得平衡。
2 MIN READ

2024年 12月 19日
聚焦:Stone Ridge Technology 利用 AWS 上的 NVIDIA Modulus 加速油藏模拟工作流
能源勘探中固有的风险和不确定性包括未知的地质参数、流体和岩石属性的变化、边界条件和噪声观测数据。
3 MIN READ

2024年 12月 18日
2024 年 NVIDIA 6G 开发者日的 5 大关键收获
2024 年 NVIDIA 6G 开发者日让 6G 研发社区成员共聚一堂 ,分享见解,并学习使用 NVIDIA 6G 研究工具的新方式。
3 MIN READ

2024年 12月 16日
2024 年热门文章:NVIDIA NIM、语言模型突破和数据科学优化的精要
对于使用 NVIDIA 技术的开发者、研究人员和创新者来说,2024 年又是具有里程碑意义的一年。
2 MIN READ

2024年 12月 12日
NVIDIA Air 简要介绍
AI 的出现带来了一种新型数据中心,即 AI 工厂 ,专门用于处理 AI 工作负载。AI 工作负载的范围和规模可能会有很大差异,
2 MIN READ