kubernetes

2025年 6月 25日
NVIDIA DOCA 3.0 助力 AI 平台开启网络新纪元
NVIDIA DOCA 框架已发展成为新一代 AI 基础设施的重要组成部分。从初始版本到备受期待的 NVIDIA DOCA 3.0 发布,
3 MIN READ

2025年 6月 24日
NVIDIA Run:ai 和 Amazon SageMaker HyperPod 携手简化复杂 AI 训练管理
NVIDIA Run:ai 和 Amazon Web Services 引入了集成,使开发者能够无缝扩展和管理复杂的 AI 训练工作负载。
2 MIN READ

2025年 6月 17日
通过 NVIDIA Holoscan for Media 上的全新 AI 应用实例,实现实时 AI 媒体效果增强
直播媒体工作流越来越多地使用 AI 微服务来增强制作能力。然而,先进的 AI 模型大多托管在云端,由于网络延迟、带宽和实时可扩展性方面的限制,
1 MIN READ

2025年 5月 20日
NVIDIA Dynamo 新增 GPU 自动缩放、Kubernetes 自动化和网络优化功能
在 NVIDIA GTC 2025 上,我们宣布推出 NVIDIA Dynamo ,这是一种高吞吐量、低延迟的开源推理服务框架,
2 MIN READ

2025年 4月 29日
NVIDIA NIM Operator 2.0 借助 NVIDIA NeMo 微服务支持提高 AI 部署效率
NVIDIA 的首个版本 NIM 运算符 简化了推理工作流的部署和生命周期管理 NVIDIA NIM 微服务,减少 MLOps、
2 MIN READ

2025年 4月 1日
NVIDIA 开源 Run:ai 调度程序以推动社区协作
今天,NVIDIA 宣布推出 KAI Scheduler 的开源版本,这是一种 Kubernetes-native GPU 调度解决方案,
3 MIN READ

2025年 3月 31日
Volcano 调度程序中防止 GPU 碎片的实用技巧
在 NVIDIA,我们以精准和创新解决复杂的基础设施挑战为豪。当 Volcano 在其 NVIDIA DGX 云调配的 Kubernetes…
3 MIN READ

2025年 3月 25日
借助 NVIDIA Mission Control 实现 AI 工厂自动化
DeepSeek-R1 等先进的 AI 模型证明,企业现在可以构建专用于自己的数据和专业知识的尖端 AI 模型。
2 MIN READ

2025年 3月 5日
借助 NVIDIA NIM 和 NVIDIA Holoscan for Media 增强直播媒体工作流程效率
NVIDIA Holoscan for Media 是一个 NVIDIA 加速平台,专为多供应商实时制作和 AI 而设计。
2 MIN READ

2025年 1月 22日
在 Kubernetes 上实现 NVIDIA NIM 微服务的水平自动缩放
NVIDIA NIM 微服务是可部署在 Kubernetes 上的模型推理容器。在生产环境中,
3 MIN READ

2025年 1月 13日
借助 NVIDIA DOCA 平台框架,助力新一代 DPU 加速云基础设施
越来越多的企业组织开始采用加速计算来满足生成式 AI、5G 电信和主权云的需求。NVIDIA 发布了 DOCA 平台框架 (DPF),
2 MIN READ

2024年 12月 5日
聚焦:Perplexity AI 利用 NVIDIA 推理栈每月服务 4 亿个搜索请求
对 AI 赋能服务的需求持续快速增长,这给 IT 和基础设施团队带来了越来越大的压力。这些团队的任务是配置必要的硬件和软件来满足这一需求,
2 MIN READ

2024年 10月 22日
利用 NVIDIA Triton 和 NVIDIA TensorRT-LLM 及 Kubernetes 实现 LLM 扩展
大语言模型 (LLMs) 已广泛应用于聊天机器人、内容生成、摘要、分类、翻译等领域。State-of-the-art LLMs 和基础模型如…
5 MIN READ

2024年 10月 16日
借助 NVIDIA 云原生堆栈实现 AI 应用开发简化
在快速发展的 AI 和数据科学领域,对可扩展、高效且灵活的基础设施的需求从未如此高。传统基础设施通常难以满足现代 AI 工作负载的需求,
1 MIN READ

2024年 10月 16日
借助 Google Kubernetes Engine 和 NVIDIA NIM 实现高性能 AI 推理扩展
AI 模型的快速演进推动了对更高效、更可扩展的推理解决方案的需求。在企业组织努力利用 AI 的强大功能时,他们在部署、
3 MIN READ

2024年 9月 30日
使用 NVIDIA NIM Operator 在 Kubernetes 上管理 AI 推理流程
NVIDIA NIM 微服务 是一套易于使用的云原生微服务,可缩短产品上市时间,并简化生成式 AI 模型在云、数据中心、
2 MIN READ