kubernetes

2025年 4月 1日
NVIDIA 开源 Run:ai 调度程序以推动社区协作
今天,NVIDIA 宣布推出 KAI Scheduler 的开源版本,这是一种 Kubernetes-native GPU 调度解决方案,
3 MIN READ

2025年 3月 31日
Volcano 调度程序中防止 GPU 碎片的实用技巧
在 NVIDIA,我们以精准和创新解决复杂的基础设施挑战为豪。当 Volcano 在其 NVIDIA DGX 云调配的 Kubernetes…
3 MIN READ

2025年 3月 25日
借助 NVIDIA Mission Control 实现 AI 工厂自动化
DeepSeek-R1 等先进的 AI 模型证明,企业现在可以构建专用于自己的数据和专业知识的尖端 AI 模型。
2 MIN READ

2025年 3月 5日
借助 NVIDIA NIM 和 NVIDIA Holoscan for Media 增强直播媒体工作流程效率
NVIDIA Holoscan for Media 是一个 NVIDIA 加速平台,专为多供应商实时制作和 AI 而设计。
2 MIN READ

2025年 1月 22日
在 Kubernetes 上实现 NVIDIA NIM 微服务的水平自动缩放
NVIDIA NIM 微服务是可部署在 Kubernetes 上的模型推理容器。在生产环境中,
3 MIN READ

2025年 1月 13日
借助 NVIDIA DOCA 平台框架,助力新一代 DPU 加速云基础设施
越来越多的企业组织开始采用加速计算来满足生成式 AI、5G 电信和主权云的需求。NVIDIA 发布了 DOCA 平台框架 (DPF),
2 MIN READ

2024年 12月 5日
聚焦:Perplexity AI 利用 NVIDIA 推理栈每月服务 4 亿个搜索请求
对 AI 赋能服务的需求持续快速增长,这给 IT 和基础设施团队带来了越来越大的压力。这些团队的任务是配置必要的硬件和软件来满足这一需求,
2 MIN READ

2024年 10月 22日
利用 NVIDIA Triton 和 NVIDIA TensorRT-LLM 及 Kubernetes 实现 LLM 扩展
大语言模型 (LLMs) 已广泛应用于聊天机器人、内容生成、摘要、分类、翻译等领域。State-of-the-art LLMs 和基础模型如…
5 MIN READ

2024年 10月 16日
借助 NVIDIA 云原生堆栈实现 AI 应用开发简化
在快速发展的 AI 和数据科学领域,对可扩展、高效且灵活的基础设施的需求从未如此高。传统基础设施通常难以满足现代 AI 工作负载的需求,
1 MIN READ

2024年 10月 16日
借助 Google Kubernetes Engine 和 NVIDIA NIM 实现高性能 AI 推理扩展
AI 模型的快速演进推动了对更高效、更可扩展的推理解决方案的需求。在企业组织努力利用 AI 的强大功能时,他们在部署、
3 MIN READ

2024年 9月 30日
使用 NVIDIA NIM Operator 在 Kubernetes 上管理 AI 推理流程
NVIDIA NIM 微服务 是一套易于使用的云原生微服务,可缩短产品上市时间,并简化生成式 AI 模型在云、数据中心、
2 MIN READ

2024年 9月 2日
使用 NVIDIA NIM 在阿里云容器服务(ACK)中加速 LLM 推理
大语言模型(LLM)是近年来发展迅猛并且激动人心的热点话题,引入了许多新场景,满足了各行各业的需求。随着开源模型能力的不断增强,
4 MIN READ

2024年 3月 27日
借助 NVIDIA NeMo 定制器轻松微调和对齐 LLM
随着 大型语言模型(LLM) 在企业 AI 应用中获得更多吸引力,定制化模型 理解和集成特定行业术语、
1 MIN READ

2024年 3月 18日
如何通过四个步骤将 RAG 应用程序从试点阶段转变为生产阶段
生成式 AI 具有改变各个行业的巨大潜力。人类工作者已经开始使用 大型语言模型(LLM) 来解释、推理和解决复杂的认知任务。
2 MIN READ

2024年 3月 12日
借助 NVIDIA Holoscan for Media 中的新功能简化直播媒体应用程序开发
适用于媒体的 NVIDIA Holoscan 是一个软件定义的平台,用于构建和部署适用于直播媒体的应用程序。
1 MIN READ

2023年 11月 29日
借助 NVIDIA Base Command Platform 简化作业初始化和基于 CPU 的任务
NVIDIA Base Command 平台 提供了日益精简的软件服务工作流程,旨在加速 AI 开发。本文将介绍近期添加的一些新功能,包括:
1 MIN READ