生成式人工智能/大语言模型

借助 NVIDIA NeMo Retriever,将企业数据转换为可行见解

在每个行业和每个工作职能部门,生成式 AI 正在激发组织内部的潜力,它将数据转化为知识,并使员工能够更高效地工作。

准确的相关信息对于做出数据支持的决策至关重要。因此,企业会继续投资改进业务数据的存储、索引和访问方式。

根据IDC的全球DataSphere Forecast 2023,预计在2024年将创建11ZB的唯一企业数据。到2027年,这一数字预计将增长到20ZB,其中83%为非结构化数据,而音频和视频数据将占到一半。2027年创建的非结构化数据量将相当于近800万个国会图书馆。在企业环境中,必须从分布在不同数据湖中的数据中挖掘这些信息。

用户可通过多种来源访问这些信息,包括实时控制面板、包含图表、图表和文本混合的手动生成报告、数据库查询以及通用搜索工具。

信息的内容和上下文会随着时间的推移而变化,因此需要反复循环地处理这些来源的信息,并重新评估证据和决策。在回答复杂的业务问题时,此过程可能需要手动处理大量工作,而且非常耗时。这可能会导致信息利用率不足,因为没有一个简单的解决方案可以访问相关数据点。

借助生成式 AI,现在可以构建一个对话式界面,该界面可以使用您的工具并搜索数据来回答问题。换言之,您现在可以与数据进行交流,以做出更快、更明智的决策。 NVIDIA NeMo Retriever 可以在此过程的每个步骤中提供帮助。

什么是 NVIDIA NeMo Retriever?

NVIDIA NeMo 的一部分,NeMo Retriever 是一个用于开发自定义生成式 AI 的端到端平台,支持对企业数据的语义搜索,从而提供高度准确的检索增强响应。开发者可以利用各种 GPU 加速微服务,每种服务都针对特定的任务进行了优化,例如:

  • 以 PDF 报告、Office 文档和其他富文本文件的形式提取大量文档。
  • 对上述内容进行编码和存储,以进行语义搜索。
  • 与现有关系数据库交互。
  • 搜索相关信息以回答业务问题。

这些微服务基于 CUDA 构建,NVIDIA TensorRT, NVIDIA Triton 推理服务器 以及 NVIDIA 软件套件中的许多其他 SDK,可最大限度地提高易用性、可靠性和性能。

A high-level conceptual flow starting with the user on the left, progressing to the agent and application platforms in the center, and NVIDIA NeMo Retriever on the right.
图 1.用户与各种平台交互的高级概念流,以及通过对话式界面以 LLM 代理的形式检索微服务

回答复杂的业务问题通常需要有效的规划和专用工具,并从分布在不同模式下的数据中提取信息(图 1)。这可以通过构建由 LLM 驱动的 AI 代理来实现。为了提供有关由 NeMo Retriever 提供支持的建筑代理的指南,微服务打包了多个参考代理。

这些微服务和智能体可让人类专注于“提出和回答正确的问题”,从而加速从大量数据中提取信息的过程,而这些问题通常很复杂,需要掌握相关领域的专业知识,而无需花费时间进行耗时的手动工作,即查找和编译相关信息以回答这些问题。

解锁全球企业数据

包括 Adobe、Cloudera、Cohesity、DataStax、NetApp 和 Pure Storage 在内的数据平台公司正在与 NVIDIA 合作,利用 NeMo Retriever 将其数据转化为宝贵的商业见解。

  • Adobe 的专有 AI 将帮助解锁全球超过 3 万亿个 PDF 的知识。
  • Cloudera 将通过将 NeMo Retriever 与 Cloudera Machine Learning 集成来扩展其生成式 AI 功能,以释放 25 EB 的企业数据潜力。
  • Cohesity 数据平台客户可以在数据备份和存档中添加生成式 AI 智能。
  • DataStax Astra DB 利用 NVIDIA NeMo Retriever 和 NVIDIA NIM 推理微服务,提高 RAG 应用程序的性能。使用 NVIDIA H100 GPU,它们实现了 10 毫秒的嵌入和索引延迟。
  • NetApp 可解锁 EB 级数据,使客户能够安全地“与其数据对话”,以获取业务见解。
  • Pure Storage 利用 NeMo Retriever 微服务以及 NVIDIA GPU 和 Pure Storage 创建了一个 RAG 工作流,用于全闪存企业存储。因此,Pure 可以加快企业使用自己的内部数据进行 AI 训练的速度,确保使用其最新数据,并消除对 LLM 不断重新训练的需求。

企业检索用例

一旦企业能够轻松访问其信息,他们可以通过无数种方法更好地利用信息。本节探讨了一些用例。在每种情况下,回答商业问题都需要回答一系列有针对性的问答,而这些答案只能通过从不同模式和数据存储中提取信息来生成。

分析软件安全漏洞

对软件容器进行常见漏洞和暴露 (CVE) 分类的过程需要从各种不同的数据源搜索数百条信息,而这一繁琐的手动过程可能需要几天时间。事件触发的 LLM 代理通过执行许多感知 – 推理 – 动作循环来实现此过程的自动化,就像它与自身对话一样。使用 NVIDIA NIM 推理微服务、NeMo Retriever 和 NVIDIA Morpheus 网络安全 AI 框架可以将这一过程缩短到几秒钟。

视频 1.使用事件驱动检索增强生成应用程序,在数秒内分析软件安全漏洞

解决技术问题

考虑以下场景:网络解决方案工程师正在诊断数据中心中的问题。该工程师必须检查机器日志和系统指标,以更好地了解当前的情况。工程师还必须查找单个组件的特定信息片段和行为,以进一步识别受影响的组件。这些信息分布在各种来源中,例如技术文档、原理图和供应商 SKU 目录 (图 2)。

Graphic showing a variety of data sources such as schematics, texts, diagrams, logs, and more.
图 2.回答深度技术问题需要访问原理图、文本、图表、日志等中的各种相关数据点

技术诊断是一个迭代过程。工程师通常需要从问题中反向工作,在多个硬件和软件层之间浏览一系列单独的组件,以找到根本原因。每个组件都有不同的实用程序,并在更大的系统架构中服务于特定用途。迭代过程包括查找有关这些组件的信息,判断日志中的行为是否符合预期行为,在发生意外行为时识别替代方案,然后做出决策。

为主题专家提供特定案例信息的对话式访问权限可以节省时间和精力,使他们能够专注于应用其技术专业知识。这意味着减少停机时间和提高效率会节省成本。无论是在生产车间中断的工厂,还是遇到网络问题的 IT 设施,这种情况都很常见。

用于金融分析的 Copilot

财务分析师投入大量时间整理报告、会计核算表、市场数据、宏观经济趋势等,以评估企业的前景。具体来说,可以考虑由 NVIDIA 负责评估最新收益结果的分析师。该分析师可能会审查 文稿和新闻稿CFO 评论10-K 和 10-Q 报告,以及季度演讲,同时还会分析存储在结构化数据库中的专有模型结果。

Graphic showing a variety of informational data sources to be processed by a large language model.
图 3.分析公司业绩需要访问各种来源的信息

财务分析师可能会提出以下问题:

  • “ NVIDIA 最近一个季度的要点是什么?”
  • “在过去九个月中, NVIDIA 的自由现金流量发生了多少变化?”
  • “与标准普尔 500 指数相比,NVDA 的表现如何?”

这些是分析师可能会花费大量时间研究的基本必备背景问题。回答这些问题所需的数据通常通过引用不同季度的多个报告,从不同的现金流量表中提取信息来找到。通过简化跨多个来源提取数据的过程,分析师可以专注于其关键的创收任务:编写包含公司业绩审查的报告。

企业运营

销售和运营团队需要访问有关客户关系、金融交易和产品库存的数据。他们还需要利用有关市场趋势、竞争格局和财务分析的大量报告,这些报告经过编译后可用于制定业务决策。

此外,在深入研究细节时,通常需要使用 SKU 目录、供应商信息、主题专家评论和其他项目作为参考。这些数据通常包含在组织孤岛、控制面板或单个员工中。因此,由于跨来源的碎片化,这些数据可能未得到充分利用。

收入是销售团队的一项关键绩效指标。要找到正确的信息,需要浏览多个数据源。无论团队是计划下季度、教育客户并为客户提供支持,还是完成交易,用于访问相关信息的统一对话界面都有助于简化流程,并使卖家能够将其专业知识专注于创收任务。

总结

与许多用例一样,本文中介绍的用例需要访问分布在各种模式和数据存储中的信息,以打造一个可以简化回答复杂业务问题的系统。NeMo Retriever 可更大限度地提高必要基础设施的易用性、可靠性和性能,使用户能够“与其数据通信”。

要开始构建使用检索增强生成的应用程序,您可以探索 NVIDIA API 目录,并参考 NVIDIA 生成式 AI 示例。此外,要了解如何将 RAG 应用从试点阶段迁移到生产阶段,请参阅 如何通过四个步骤将 RAG 应用程序从试点阶段转变为生产阶段

1资料来源:IDC,Global DataSphere Forecast,2023 年

 

Tags