云服务
2025年 1月 13日
借助 NVIDIA DOCA 平台框架,助力新一代 DPU 加速云基础设施
越来越多的企业组织开始采用加速计算来满足生成式 AI、5G 电信和主权云的需求。NVIDIA 发布了 DOCA 平台框架 (DPF),
2 MIN READ
2024年 11月 15日
借助 NVIDIA TensorRT-LLM 分块预填充提高 AI 推理效率和简化部署
在本 博文 中,我们详细介绍了分块预填充,这是 NVIDIA TensorRT-LLM 的一项功能,
1 MIN READ
2024年 11月 15日
NVIDIA NIM 1.4 现已部署可用,推理速度提升 2.4 倍
随着 生成式 AI 重塑各行各业,对可立即部署的高性能推理的需求也在不断增长。 NVIDIA NIM 为 AI…
1 MIN READ
2024年 11月 14日
NVIDIA DOCA 2.9 借助新性能和安全功能强化人工智能和云计算基础设施
NVIDIA DOCA 通过为开发者提供全面的软件框架来利用硬件加速来增强 NVIDIA 网络平台的功能,从而提高性能、安全性和效率。
2 MIN READ
2024年 11月 1日
NVSwitch 和 TensorRT-LLM MultiShot 共同加速 AllReduce 速度达 3 倍
在用户数量可能在数百到数十万之间波动,且输入序列长度随每个请求而变化的生产环境中,部署生成式 AI 工作负载会面临独特的挑战。
1 MIN READ
2024年 10月 24日
构建 AI 智能体以自动创建软件测试案例
在软件开发中,测试对于确保最终产品的质量和可靠性至关重要。然而,创建测试计划和规范可能耗时且需要大量人力,
6 MIN READ
2024年 10月 21日
IBM 全新推出的 GRANITE 3.0 生成式 AI 模型:小体积、高准确度、高效率
今天,IBM 发布了第三代 IBM Granite,这是一个开放语言模型和辅助工具的集合。前几代 Granite 专注于特定领域的用例;
2 MIN READ
2024年 10月 15日
NVIDIA SuperNIC 驱动新一代 AI 网络发展
在生成式 AI 时代,加速网络对于为大规模分布式 AI 工作负载构建高性能计算结构至关重要。NVIDIA 在该领域继续保持领先地位,
1 MIN READ
2024年 10月 7日
NVIDIA 加速库助力 Microsoft Bing 视觉搜索性能优化
Microsoft Bing 视觉搜索使全球用户能够使用照片作为查询来查找内容。该功能的核心是 Microsoft 的 TuringMM…
3 MIN READ
2024年 9月 17日
AI 智能体与 OODA 循环策略合力优化数据中心运营效率
对于任何数据中心来说,操作大型、复杂的 GPU 集群都不是件容易的事情!这其中存在着巨大的复杂性。在加速计算数据中心,冷却、电源、网络,
2 MIN READ
2024年 9月 16日
借助 NVIDIA 集合通信库实现显存高效、快速初始化和成本估算优化 2.22
在过去几个月中,NVIDIA 集合通信库(NCCL)开发者一直在努力开发一系列新的库功能和错误修复。在本文中,我们将讨论 NCCL 2.22…
2 MIN READ
2024年 9月 6日
利用 NVIDIA Magnum IO NVSHMEM 3.0 实现跨平台应用程序的可移植性和兼容性增强
NVSHMEM 是一个并行编程接口,可为 NVIDIA GPU 集群提供高效且可扩展的通信。NVSHMEM 是 NVIDIA Magnum…
3 MIN READ
2024年 8月 15日
NVIDIA TensorRT 模型优化器 v0.15 提高推理性能扩展模型支持能力
NVIDIA 宣布推出新版 v0.15 NVIDIA TensorRT 模型优化器,这是一种先进的模型优化技术量化工具包,包含量化、
2 MIN READ
2024年 8月 7日
使用 ISO C++语言并行在 GPU 上进行利润和损失建模
上一篇文章“How to Accelerate Quantitative Finance with ISO C++ Standard…
5 MIN READ
2024年 8月 6日
深入了解使用 NVIDIA NIM 优化的新 AI 模型
NVIDIA NIM 微服务作为优化容器提供,旨在加速各种规模的企业的 AI 应用开发,为 AI 技术的快速生产和部署铺平道路。
2 MIN READ
2024年 8月 6日
聚焦:NVIDIA BlueField DPU 助力 Vast 数据平台优化 AI 工作负载
随着对复杂 AI 功能的需求不断增加,VAST Data 推出了 VAST Data Platform,
2 MIN READ