生成式人工智能/大语言模型

黑客松获奖者借助 NVIDIA NeMo Agent Toolkit 让代理式 AI 如生

学习新工具包的最佳方式是构建一些真实的东西,这正是开发者在最近的 NVIDIA NeMo Agent 工具包黑客松上所做的。在两周的时间里,不同技能水平 (从学生到经验丰富的专业人士) 的参与者使用开源 NeMo Agent 工具包 (以前称为 AIQ 工具包) 试验、原型设计并创建了智能多智能体 AI 工作流。

通过访问示例项目、技术文档和与 NVIDIA 工程师的办公时间,参与者探索了该工具包的编排、内存和分析功能,通常将它们与其他 NVIDIA 技术相结合,并为上游做出改进。

根据现实世界的适用性、技术执行情况以及他们在实际应用中展示代理式 AI 的效果,对提交的作品进行了评判。结果鼓舞人心:实用的创新项目展示了 AI 智能体如何解决物流、软件开发和个人旅行规划方面的实际问题。

第一名:用于智能车队管理的路线优化智能体

获奖项目由 TCS Smart Mobility Group 的一名成员开发,展示了 NVIDIA NeMo Agent 工具套件、NVIDIA cuOptNVIDIA Omniverse 库的强大集成,以解决复杂的物流和供应链挑战。

此智能系统编排了一个 AI 智能体团队,每个智能体都专门从事自然语言理解、约束提取和路线计算。这些智能体协作解释用户指令,例如“为三辆叉车规划优化路线,将物料从仓库运送到每辆容量有限的卡车”,消除操作限制,并调用 cuOpt 在数秒内计算出最佳路线规划。

TCS 在 Omniverse Kit SDK 上开发了一个应用,以提供仿真环境、测试场景并安全地训练智能体。经过优化后,路线将部署到 NVIDIA Jetson Nano 驱动的自主移动机器人 (AMR) 上,例如 MyAGV 机器人,从而完成完整的仿真到部署流程。

主要特性:

  • 自然语言界面:使用户能够用简单的英语描述物流任务,无需技术命令即可实现直观的交互。
  • 动态多智能体编排:将语言模型、优化引擎和数据流水线连接在一起,自动执行从输入解释到执行的复杂任务。
  • 实时优化:利用 cuOpt 在动态现实环境中快速生成约束感知型路线计划。
  • 从仿真到部署的工作流:在将路线部署到物理机器人之前,使用 Omniverse 对路线进行仿真和验证,确保在现实世界中安全有效地执行路线。

此项目展示了代理式 AI 在与 cuOpt 等高性能 NVIDIA CUDA-X 求解器搭配使用时,如何大幅简化车队管理、降低运营成本,并实现更快、更明智的运营决策。

第二名:OpenCodeReview

OpenCodeReview 为开发者提供 AI 驱动的自动化代码分析,以检测安全漏洞并提高代码质量。该系统使用 NeMo Agent 工具包构建,可扫描选定文件、突出显示问题并提出修复建议,并有效集成到现有工作流程中。

一个突出的功能是能够通过调整配置文件在不同的 AI 模型之间交换,从而实现跨编码标准或团队需求的自定义。开发者无需进行任何提示调优,智能体指令已预先配置,易于使用。开发者还可以灵活使用不同的 AI 模型,一些模型可能更适合某些编程语言,并且可以更轻松地选择适合其用例的最佳模型。

通过利用 NeMo Agent 工具包的编排和内存功能,OpenCodeReview 普及了安全编码实践,使个人开发者、初创公司和大型组织等都可以使用高级审查。通过该工具包,只需更改配置文件,即可轻松更新或添加其他 AI 智能体。

第三名:AI 赋能的出行规划器和体验智能体

此模块化旅行助手直接内置于 NeMo Agent 工具包的示例文件夹中,展示了代理式 AI 如何将分散的旅行任务统一为单一对话式体验。本次提交的作品包括大量工具和大量功能。例如,用户可以:

  • 使用跨 API 的自然语言查询搜索和预订航班。
  • 规划端到端旅程,包括酒店、活动和地图。
  • 依靠弹性数据访问,在 API 中断时使用本地备用数据库。
  • 利用上下文内存保留从航班到酒店再到本地推荐的流程,实现跨任务的自然交互。
  • 通过嵌入式地图和目的地数据可视化出行计划,而在本次提交之前,我们甚至没有意识到用户界面可以实现这一功能。

该工作流由 DeepSeek LLM 提供支持,用于编排查询和 API 交互,并且可轻松与其他模型交换。此工具凸显了个人生产力应用中多步骤、内存感知型智能体交互的强大功能。

荣誉奖:用于检测极小妥协指标的网络智能体

此网络防御工具旨在检测 macOS 系统上的细微妥协指标 (IoC) 。随着网络威胁变得更加复杂和隐蔽,并且通常只留下细微的痕迹 (例如可疑日志条目、不寻常的网络连接或意外流程) 来发出破坏信号,它解决了组织面临的日益严峻的挑战。

主要特性:

  • AI 驱动的检测:AI 以超人类的速度处理和分析大量数据,从而识别模式、检测异常和适应新威胁,提供优于传统手动安全分析的优势。
  • 模块化智能体架构:围绕一个专门的 AI 子智能体团队构建,每个子智能体专注于特定领域 (系统日志、网络活动或运行流程) ,反映真实世界安全运营中心的结构。模块化设计支持轻松扩展:随着威胁的发展或组织需求的变化,可以添加具有专门功能的新次级智能体。
  • 协作工作流:子智能体在协调的工作流中运行,调用适当的工具并分享发现。这可确保对潜在威胁做出全面、统一的响应,从而提高检测速度和准确性。

这种基于智能体的方法将 AI 的速度和智能与人类分析师的专业知识相结合,代表了网络防御的新范式 — — 一种自适应、协作和主动的范式,使组织能够比以往更快、更准确地检测、调查和应对威胁。

从实验到现实解决方案

热门项目通过将 NeMo Agent 工具套件的编排、上下文内存和工具集成功能与开放式 API、Omniverse 的工业 AI 和数据互操作性库以及 cuOpt 等特定领域加速器相结合,充分体现了开发者构建实用的现实 AI 工作流的速度。

无论是协调负责推理叉车容量的物流智能体,还是构建负责审查代码或规划假期的生产力智能体,这些项目都表明,您不需要庞大的团队或庞大的预算来进行创作。

如果您对基于智能体的 AI 感兴趣,现在是时候深入了解了。NeMo Agent 工具包是开源的、有据可查的,专为实验而设计。尝试示例,重新混合智能体,看看您的想法可以发挥多大的作用。

标签