云服务
2024年 9月 17日
AI 智能体与 OODA 循环策略合力优化数据中心运营效率
对于任何数据中心来说,操作大型、复杂的 GPU 集群都不是件容易的事情!这其中存在着巨大的复杂性。在加速计算数据中心,冷却、电源、网络,
2 MIN READ
2024年 9月 16日
借助 NVIDIA 集合通信库实现显存高效、快速初始化和成本估算优化 2.22
在过去几个月中,NVIDIA 集合通信库(NCCL)开发者一直在努力开发一系列新的库功能和错误修复。在本文中,我们将讨论 NCCL 2.22…
2 MIN READ
2024年 9月 6日
利用 NVIDIA Magnum IO NVSHMEM 3.0 实现跨平台应用程序的可移植性和兼容性增强
NVSHMEM 是一个并行编程接口,可为 NVIDIA GPU 集群提供高效且可扩展的通信。NVSHMEM 是 NVIDIA Magnum…
3 MIN READ
2024年 8月 15日
NVIDIA TensorRT 模型优化器 v0.15 提高推理性能扩展模型支持能力
NVIDIA 宣布推出新版 v0.15 NVIDIA TensorRT 模型优化器,这是一种先进的模型优化技术量化工具包,包含量化、
2 MIN READ
2024年 8月 7日
使用 ISO C++语言并行在 GPU 上进行利润和损失建模
上一篇文章“How to Accelerate Quantitative Finance with ISO C++ Standard…
5 MIN READ
2024年 8月 6日
深入了解使用 NVIDIA NIM 优化的新 AI 模型
NVIDIA NIM 微服务作为优化容器提供,旨在加速各种规模的企业的 AI 应用开发,为 AI 技术的快速生产和部署铺平道路。
2 MIN READ
2024年 8月 6日
聚焦:NVIDIA BlueField DPU 助力 Vast 数据平台优化 AI 工作负载
随着对复杂 AI 功能的需求不断增加,VAST Data 推出了 VAST Data Platform,
2 MIN READ
2024年 8月 1日
使用 NVIDIA GenAI-Perf 和 OpenAI 兼容 API 测量生成式 AI 模型性能
NVIDIA 提供 Perf Analyzer 和 Model Analyzer 等工具,帮助机器学习工程师测量和平衡延迟与吞吐量之间的权衡,
2 MIN READ
2024年 7月 30日
MetDesk 和 NVIDIA Earth-2 共同推动能源交易创新
尽管天气预报在过去几十年中不断改进,但气象测量和模型导致的不确定性意味着ensemble forecasts对天气预报仍然至关重要。
4 MIN READ
2024年 7月 30日
利用重新排名技术增强 RAG 管道性能
在快速发展的 AI 驱动应用程序格局中,重新排名已成为提高企业搜索结果的准确性和相关性的关键技术。通过使用先进的机器学习算法,
3 MIN READ
2024年 7月 23日
使用 NVIDIA Bluefield-3 DPU 与 DDN 存储集成加速 AI 基础架构
随着 AI 成为组织创新和竞争优势不可或缺的一部分,对高效且可扩展的基础设施的需求比以往任何时候都更加迫切。
1 MIN READ
2024年 7月 15日
全新 NVIDIA NIM:可适用于 Mistral 和 Mixtral 模型并为您的 AI 项目赋能
大语言模型(LLM)在企业组织中的应用日益广泛,许多企业都将其整合到 AI 应用中。虽然从基础模型着手十分高效,
2 MIN READ
2024年 7月 9日
构建网络语言模型以解锁新的网络安全功能
通用型大型语言模型 (LLM) 已证明其在各个领域的效用,在文本生成和复杂问题解决等应用中提供了巨大的优势。但是,在某些情况下,
3 MIN READ
2024年 6月 13日
使用 NVIDIA DOCA GPUNetIO 解锁 GPU 加速的 RDMA
NVIDIA DOCA GPUNetIO是 NVIDIA DOCA SDK 中的一个库,专门为实时内联 GPU 数据包处理而设计。
3 MIN READ
2024年 6月 12日
在 cuBLAS 中引入分组 GEMM API 以及更多性能更新
最新版本 NVIDIA cuBLAS 库版本 12.5 将继续为深度学习(DL)和高性能计算(HPC)工作负载提供功能和性能。
2 MIN READ
2024年 6月 10日
聚焦:思科借助 NVIDIA BlueField-3 DPU 提高工作负载安全性和运营效率
随着网络攻击变得越来越复杂,组织必须不断采用先进的解决方案来保护其关键资产。其中一种解决方案是Cisco Secure Workload,
2 MIN READ