云服务

2025年 4月 23日
聚焦:Qodo 借助 NVIDIA DGX 实现高效代码搜索创新
大语言模型 (LLMs) 使 AI 工具能够帮助您更快地编写更多代码,但随着我们要求这些工具承担越来越复杂的任务,其局限性变得显而易见。
3 MIN READ

2025年 4月 2日
LLM 基准测试:基本概念
在过去几年中,作为广泛的 AI 革命的一部分, 生成式 AI 和 大语言模型 (LLMs) 越来越受欢迎。
4 MIN READ

2025年 3月 31日
Volcano 调度程序中防止 GPU 碎片的实用技巧
在 NVIDIA,我们以精准和创新解决复杂的基础设施挑战为豪。当 Volcano 在其 NVIDIA DGX 云调配的 Kubernetes…
3 MIN READ

2025年 3月 26日
聚焦:Tomorrow.io 借助 NVIDIA AI 改变全球天气恢复能力
从指导日常运营的超本地化预测,到启发新气候见解的行星级模型,世界正在进入天气和气候适应能力的新前沿。
2 MIN READ

2025年 3月 18日
NVIDIA Blackwell 实现世界纪录的 DeepSeek-R1 推理性能
NVIDIA 在 NVIDIA GTC 2025 上宣布了创下世界纪录的 DeepSeek-R1 推理性能 。 搭载 8 个 NVIDIA…
5 MIN READ

2025年 3月 18日
在 NVIDIA DGX 云上使用 NVIDIA NeMo Curator 处理 PB 级视频
随着 物理 AI 的兴起,视频内容生成呈指数级增长。一辆配备摄像头的自动驾驶汽车每天可生成超过 1 TB 的视频,
3 MIN READ

2025年 3月 18日
借助 NVIDIA DGX 云基准测试衡量和提高 AI 工作负载性能
随着 AI 功能的进步,了解硬件和软件基础架构选择对工作负载性能的影响对于技术验证和业务规划都至关重要。
2 MIN READ

2025年 2月 11日
NVIDIA DGX 云推出即用型模板,更好地评估 AI 平台性能
在快速发展的 AI 系统和工作负载环境中,实现出色的模型训练性能远远超出芯片速度。这需要对整个堆栈进行全面评估,从计算到网络,再到模型框架。
2 MIN READ

2025年 2月 5日
NVIDIA Blackwell 上的 OpenAI Triton 提升 AI 性能和可编程性
矩阵乘法和注意力机制是现代 AI 工作负载的计算支柱。虽然库如 NVIDIA cuDNN 提供高度优化的实现,
2 MIN READ

2025年 1月 31日
NVIDIA 集合通信库 2.23 促使新的缩放算法和初始化方法的诞生
NVIDIA 集合通信库 (NCCL) 可实现针对 NVIDIA GPU 和网络进行优化的多 GPU 和多节点通信基元。
2 MIN READ

2025年 1月 13日
借助 NVIDIA DOCA 平台框架,助力新一代 DPU 加速云基础设施
越来越多的企业组织开始采用加速计算来满足生成式 AI、5G 电信和主权云的需求。NVIDIA 发布了 DOCA 平台框架 (DPF),
2 MIN READ

2024年 12月 24日
借助 NVIDIA 全栈解决方案提升 AI 推理性能
AI 驱动的应用的爆炸式发展对开发者提出了前所未有的要求,他们必须在提供先进的性能与管理运营复杂性和成本以及 AI 基础设施之间取得平衡。
2 MIN READ

2024年 11月 15日
借助 NVIDIA TensorRT-LLM 分块预填充提高 AI 推理效率和简化部署
在本 博文 中,我们详细介绍了分块预填充,这是 NVIDIA TensorRT-LLM 的一项功能,
1 MIN READ

2024年 11月 15日
NVIDIA NIM 1.4 现已部署可用,推理速度提升 2.4 倍
随着 生成式 AI 重塑各行各业,对可立即部署的高性能推理的需求也在不断增长。 NVIDIA NIM 为 AI…
1 MIN READ

2024年 11月 14日
NVIDIA DOCA 2.9 借助新性能和安全功能强化人工智能和云计算基础设施
NVIDIA DOCA 通过为开发者提供全面的软件框架来利用硬件加速来增强 NVIDIA 网络平台的功能,从而提高性能、安全性和效率。
2 MIN READ

2024年 11月 1日
NVSwitch 和 TensorRT-LLM MultiShot 共同加速 AllReduce 速度达 3 倍
在用户数量可能在数百到数十万之间波动,且输入序列长度随每个请求而变化的生产环境中,部署生成式 AI 工作负载会面临独特的挑战。
1 MIN READ