kubernetes
2025年 1月 13日
借助 NVIDIA DOCA 平台框架,助力新一代 DPU 加速云基础设施
越来越多的企业组织开始采用加速计算来满足生成式 AI、5G 电信和主权云的需求。NVIDIA 发布了 DOCA 平台框架 (DPF),
2 MIN READ
2024年 12月 5日
聚焦:Perplexity AI 利用 NVIDIA 推理栈每月服务 4 亿个搜索请求
对 AI 赋能服务的需求持续快速增长,这给 IT 和基础设施团队带来了越来越大的压力。这些团队的任务是配置必要的硬件和软件来满足这一需求,
2 MIN READ
2024年 10月 22日
利用 NVIDIA Triton 和 NVIDIA TensorRT-LLM 及 Kubernetes 实现 LLM 扩展
大语言模型 (LLMs) 已广泛应用于聊天机器人、内容生成、摘要、分类、翻译等领域。State-of-the-art LLMs 和基础模型如…
5 MIN READ
2024年 10月 16日
借助 NVIDIA 云原生堆栈实现 AI 应用开发简化
在快速发展的 AI 和数据科学领域,对可扩展、高效且灵活的基础设施的需求从未如此高。传统基础设施通常难以满足现代 AI 工作负载的需求,
1 MIN READ
2024年 10月 16日
借助 Google Kubernetes Engine 和 NVIDIA NIM 实现高性能 AI 推理扩展
AI 模型的快速演进推动了对更高效、更可扩展的推理解决方案的需求。在企业组织努力利用 AI 的强大功能时,他们在部署、
3 MIN READ
2024年 9月 30日
使用 NVIDIA NIM Operator 在 Kubernetes 上管理 AI 推理流程
NVIDIA NIM 微服务 是一套易于使用的云原生微服务,可缩短产品上市时间,并简化生成式 AI 模型在云、数据中心、
2 MIN READ
2024年 9月 2日
使用 NVIDIA NIM 在阿里云容器服务(ACK)中加速 LLM 推理
大语言模型(LLM)是近年来发展迅猛并且激动人心的热点话题,引入了许多新场景,满足了各行各业的需求。随着开源模型能力的不断增强,
4 MIN READ
2024年 3月 27日
借助 NVIDIA NeMo 定制器轻松微调和对齐 LLM
随着 大型语言模型(LLM) 在企业 AI 应用中获得更多吸引力,定制化模型 理解和集成特定行业术语、
1 MIN READ
2024年 3月 18日
如何通过四个步骤将 RAG 应用程序从试点阶段转变为生产阶段
生成式 AI 具有改变各个行业的巨大潜力。人类工作者已经开始使用 大型语言模型(LLM) 来解释、推理和解决复杂的认知任务。
2 MIN READ
2024年 3月 12日
借助 NVIDIA Holoscan for Media 中的新功能简化直播媒体应用程序开发
适用于媒体的 NVIDIA Holoscan 是一个软件定义的平台,用于构建和部署适用于直播媒体的应用程序。
1 MIN READ
2023年 11月 29日
借助 NVIDIA Base Command Platform 简化作业初始化和基于 CPU 的任务
NVIDIA Base Command 平台 提供了日益精简的软件服务工作流程,旨在加速 AI 开发。本文将介绍近期添加的一些新功能,包括:
1 MIN READ
2023年 9月 14日
使用 NVIDIA Holoscan for Media 进行软件定义广播
广播行业正在经历内容创建、管理、分发和消费方式的转变。这一转变包括从受固定功能设备约束的传统线性工作流程转变为灵活和混合的软件定义系统,
1 MIN READ
2023年 9月 12日
使用 NVIDIA Triton 管理服务扩展深度学习部署
组织正在以前所未有的速度将机器学习(ML)集成到整个系统和产品中。他们正在寻找解决方案,以帮助处理在生产规模部署模型的复杂性。
2 MIN READ
2023年 4月 4日
使用 Dataiku 和 NVIDIA Data Science 进行主题建模和图像分类
这个Dataiku platform日常人工智能简化了深度学习。用例影响深远,从图像分类到对象检测和自然语言处理( NLP )。
4 MIN READ
2023年 3月 20日
在 NVIDIA Base 指挥平台上设计具有灵活工作流的数字孪生
NVIDIA Base Command Platform 提供了自信地开发复杂软件的能力,这些软件符合科学计算工作流程所需的性能标准。
2 MIN READ
2023年 1月 12日
使用 Kubernetes 自动缩放 NVIDIA Riva 部署,用于生产中的语音 AI
语音 AI 应用,从呼叫中心到虚拟助理,严重依赖 自动语音识别 ( ASR )和文本转语音( TTS )。
4 MIN READ