生成式 AI 已经跨越鸿沟并达到“ iPhone 时刻”,现在必须能够扩展以满足指数级增长的需求。可靠性和正常运行时间对于打造企业级生成式 AI 至关重要,尤其是当 AI 成为业务运转的核心时。NVIDIA 正在将专业知识投入到解决方案的开发过程中,助力企业实现这样的飞跃。
推出 NVIDIA AI Enterprise 4.0
最新版 NVIDIA AI Enterprise 助力利用生成式 AI 进行创新的企业加速开发,为企业提供生产就绪型支持、可管理性、安全性和可靠性。
使用 NVIDIA NeMo 快速大规模训练、定制和部署大语言模型
生成式 AI 模型具有数十亿个参数,需要高效的数据训练管道。训练模型的复杂性、针对特定领域任务进行定制以及大规模部署模型都需要专业知识和计算资源。
NVIDIA AI Enterprise 4.0 包括 NVIDIA NeMo,这是一个端到端云原生框架,用于大规模数据管理、大语言模型的加速训练和定制,以及在用户首选平台上优化推理。从云到桌面工作站,NVIDIA NeMo 提供了一个简单易用的方案,并通过加速的基础设施实现性能优化,大幅缩短解决方案的开发时间,提高了投资回报率。
使用 AI 工作流更快地构建生成式 AI 应用
NVIDIA AI Enterprise 4.0 引入了两种新的 AI 工作流,用于构建生成式 AI 应用:采用检索增强生成技术的 AI 聊天机器人和鱼叉式网络钓鱼检测。
生成式 AI 知识库聊天机器人工作流利用检索增强生成技术,能够加快基于专有数据进行调优的生成式 AI 聊天机器人的开发和部署。这些聊天机器人从公司的知识库中检索信息,并用自然语言生成实时回答,从而实现准确地回答特定领域的问题。它使用预训练的大语言模型、NeMo 、NVIDIA Triton 推理服务器,以及包括 Langchain 和矢量数据库在内的第三方工具来训练和部署知识库问答系统。
鱼叉式网络钓鱼检测 AI 工作流使用 NVIDIA Morpheus 和包含 NVIDIA NeMo 的生成式 AI 来训练一个模型,该模型在邮件进入收件箱之前就能检测到高达 90% 的鱼叉式网络钓鱼电子邮件。
防范鱼叉式网络钓鱼电子邮件是一大挑战。原因是鱼叉式网络钓鱼电子邮件与正常电子邮件难以区分,欺诈和合法电子邮件之间的唯一区别是发件人的意图。这也是为什么传统的鱼叉式网络钓鱼检测机制无法满足要求的原因。
随时随地开发 AI
企业采用 AI 可能需要更多熟练的 AI 开发者和数据科学家。组织将需要一个由优化的硬件和软件组成的灵活的高性能基础设施,以最大限度地提高生产力并加快 AI 开发。结合用于工作站的 NVIDIA RTX 6000 Ada 架构 GPU,NVIDIA AI Enterprise 4.0 为 AI 开发者提供了一个单独的平台,开发者可以在这个平台上开发 AI 应用并将其部署到生产中。
除了桌面工作站,NVIDIA 还为 AI 工作负载提供了完整的基础设施组合,包括 NVIDIA H100、L40S、L4 GPU,以及与 NVIDIA BlueField 数据处理单元的加速联网。通过HPE Machine Learning Data Management ( HPE 机器学习数据管理)、HPE Machine Learning Development Environment ( HPE 机器学习开发环境)、Ubuntu KVM 和 Nutanix AHV 虚拟化支持,组织可以使用本地基础设施来运行 AI 工作负载。
管理 AI 工作负载和基础设施
NVIDIA Triton Management Service 是 NVIDIA AI Enterprise 4.0 的独家补充,通过高效利用 GPU 资源的模型编排,可自动在 Kubernetes 中部署多个 Triton 推理服务器。通过从多个来源加载模型和分配计算资源,它简化了部署。Triton 管理服务可以在 NVIDIA LaunchPad 上试用。
NVIDIA AI Enterprise 4.0 还包括集群管理软件 NVIDIA Base Command Manager Essentials,用于简化集群配置、工作负载管理、基础设施监测和使用情况报告。通过动态扩展和基于策略的资源分配,它能够简化 AI 工作负载的管理和部署,同时确保集群的完整性。
新的 AI 软件、工具和预训练的基础模型
NVIDIA AI Enterprise 4.0 还提供更多的框架和工具以推进 AI 开发。NVIDIA Modulus 是一个用于通过简单的 Python 接口构建、训练和调优物理机器学习模型的框架。
通过 Modulus,用户可以利用 AI 增强工程模拟,并进行跨学科的企业级数字孪生应用建模,包括计算流体动力学(CFD)、结构力学和电磁学。Deep Graph Library 容器旨在实现和训练图神经网络,帮助科学家研究分子或金融服务的图结构,以检测欺诈。
最后,还有三个专有预训练基础模型,它们是 NVIDIA TAO 的一部分,能够加快视觉 AI 、缺陷检测和零售损失预防等行业应用投入生产所需的时间。
NVIDIA AI Enterprise 4.0 是迄今为止对该平台最全面的升级。凭借企业级的安全性、稳定性、可管理性和支持,企业可以期待可靠的 AI 正常运行时间和不间断的 AI 卓越表现。
开始使用 NVIDIA AI Enterprise
快速使用 NVIDIA AI Enterprise 的三种方式:
注册 NVIDIA LaunchPad,可在短期内访问试用实验室。
注册现有本地或云基础设施的 90 天免费评估版。
通过 NVIDIA 合作伙伴网络或包括 AWS、Microsoft Azure 和谷歌云在内的大型云服务提供商购买。
NVIDIA AI Enterprise 90 天评估版现已推出。点击“阅读原文”,通过访问 NGC,即可获取免费试用。