NeMo

2025年 7月 23日
PDF 数据提取方法及其在信息检索中的应用
PDF 是共享财务报告、研究论文、技术文档和营销材料等信息的常用文件格式之一。然而,在构建有效的检索增强生成 (RAG) 系统时,
4 MIN READ

2025年 7月 22日
使用 NVIDIA NeMo 在一个周末内训练一个具备推理能力的 LLM
您是否曾想构建自己的推理模型,但认为它过于复杂或需要大量资源?再想想。借助 NVIDIA 强大的工具和数据集,
4 MIN READ

2025年 7月 21日
传统 RAG 与代理 RAG——AI 智能体如何通过动态知识实现更高智能
是否曾依赖不知道新高速公路旁路或道路突然关闭的旧 GPS?它可能会让您到达目的地,但不是最有效或最准确的方式。
1 MIN READ

2025年 7月 17日
使用 NVIDIA 安全配方保护代理式 AI 系统
随着大语言模型 (LLM) 驱动更多能够执行自主操作、工具使用和推理的代理式系统,企业被其灵活性和低推理成本所吸引。
2 MIN READ

2025年 7月 17日
黑客松获奖者借助 NVIDIA NeMo Agent Toolkit 让代理式 AI 如生
学习新工具包的最佳方式是构建一些真实的东西,这正是开发者在最近的 NVIDIA NeMo Agent 工具包黑客松上所做的。在两周的时间里,
1 MIN READ

2025年 7月 9日
使用 NVIDIA NeMo-RL 进行强化学习:通过 GRPO 复制 DeepScaleR 配方
强化学习 (RL) 是交互式 AI 的支柱。它对于教导智能体推理和从人类偏好中学习、实现多轮工具使用等至关重要。
2 MIN READ

2025年 7月 3日
新视频:使用 NVIDIA Data Flywheel Blueprint 构建可自我提升的 AI 代理
由大语言模型驱动的 AI 智能体正在改变企业工作流,但高昂的推理成本和延迟可能会限制其可扩展性和用户体验。为解决这一问题,
1 MIN READ

2025年 6月 30日
出色的多模态 RAG:Llama 3.2 NeMo 检索器嵌入模型如何提高工作流准确性
数据远不止于文本,它本质上是多模态的,包括图像、视频、音频等,通常采用复杂的非结构化格式。虽然常见的方法是将 PDF、扫描图像、
2 MIN READ

2025年 6月 26日
在 NVIDIA Jetson 和 RTX 上运行 Google DeepMind 的 Gemma 3n
截至今日,NVIDIA 现已支持在 NVIDIA RTX 和 Jetson 上全面推出 Gemma 3n。上个月,
1 MIN READ

2025年 6月 25日
如何使用 NVIDIA NeMo 技能简化复杂的 LLM 工作流程
改进 LLM 的典型方法涉及多个阶段:合成数据生成 (SDG) 、通过监督式微调 (SFT) 或强化学习 (RL) 进行模型训练以及模型评估。
4 MIN READ

2025年 6月 11日
利用 NVIDIA Data Flywheel Blueprint 通过模型蒸馏构建高效的 AI 智能体
随着企业加速采用代理式 AI,团队在扩展智能应用程序的同时管理推理成本方面面临着越来越大的挑战。大语言模型 (LLM) 提供强大的性能,
2 MIN READ

2025年 6月 11日
通过开源 AI-Q NVIDIA Blueprint 与您的企业数据交流
企业数据呈爆炸式增长,PB 级的电子邮件、报告、Slack 消息和数据库的堆积速度比任何人都快。市场调研人员 Gartner 表示,
2 MIN READ

2025年 6月 2日
通过高效的长上下文大语言模型训练扩展到数百万个 Token
大语言模型 (LLM) 的演变标志着其处理和生成文本的能力有了显著提升。在这些发展中,上下文长度的概念 (模型可以处理的单个输入样本中的…
2 MIN READ

2025年 5月 28日
聚焦:使用 Iguazio 的 MLRun 和 NVIDIA NIM 构建可扩展和可观察的 AI 以投入生产
Iguazio (被麦肯锡收购) 与 NVIDIA 的合作使企业组织能够构建生产级 AI 解决方案,这些解决方案不仅具有高性能和可扩展性,
2 MIN READ

2025年 5月 27日
在 NVIDIA Grace Hopper 上分析大型语言模型训练工作流
AI 的快速发展催生了模型大小呈指数级增长的时代,特别是在大语言模型 (LLMs) 领域。这些模型凭借其变革能力,正在推动各行各业的创新。
3 MIN READ

2025年 5月 27日
在 NVIDIA Grace Hopper 上训练大型语言模型的高级优化策略
虽然分析有助于识别效率低下的情况,但高级优化策略对于解决硬件限制和有效扩展 AI 工作负载至关重要。在本文中,我们将探讨 CPU 卸载、
3 MIN READ