检索增强生成 (RAG)

2025年 8月 5日
NVIDIA vGPU 19.0 支持 NVIDIA Blackwell GPU 的图形和 AI 虚拟化功能
虚拟化长期以来一直承诺提高效率和可扩展性。然而,由于图形和计算工作负载的需求不断增加,以及需要找到经济高效的解决方案来提高用户密度,
2 MIN READ

2025年 8月 4日
如何使用 NVIDIA Llama Nemotron 模型通过推理增强 RAG 工作流
检索增强生成 (RAG) 系统面临的一大挑战是处理缺乏明确清晰度或带有隐含意图的用户查询。用户通常会以不准确的方式来表达问题。例如,
4 MIN READ

2025年 7月 24日
借助 NVIDIA cuVS 优化索引和实时检索的向量搜索
AI 赋能的搜索需要高性能索引、低延迟检索和无缝可扩展性。NVIDIA cuVS 为开发者和数据科学家带来了 GPU…
2 MIN READ

2025年 7月 23日
在 Azure 上使用 Apache Spark 和 NVIDIA AI 进行无服务器分布式数据处理
将大量文本库转换为数字表示 (称为嵌入) 的过程对于生成式 AI 至关重要。从语义搜索和推荐引擎到检索增强生成 (RAG) ,
2 MIN READ

2025年 7月 23日
PDF 数据提取方法及其在信息检索中的应用
PDF 是共享财务报告、研究论文、技术文档和营销材料等信息的常用文件格式之一。然而,在构建有效的检索增强生成 (RAG) 系统时,
4 MIN READ

2025年 7月 21日
传统 RAG 与代理 RAG——AI 智能体如何通过动态知识实现更高智能
是否曾依赖不知道新高速公路旁路或道路突然关闭的旧 GPS?它可能会让您到达目的地,但不是最有效或最准确的方式。
1 MIN READ

2025年 6月 30日
出色的多模态 RAG:Llama 3.2 NeMo 检索器嵌入模型如何提高工作流准确性
数据远不止于文本,它本质上是多模态的,包括图像、视频、音频等,通常采用复杂的非结构化格式。虽然常见的方法是将 PDF、扫描图像、
2 MIN READ

2025年 6月 25日
提高嵌入模型准确性,实现定制化信息检索
自定义嵌入模型对于有效的信息检索至关重要,尤其是在处理法律文本、病历或多轮客户对话等特定领域的数据时。通用、
2 MIN READ

2025年 6月 18日
寻找实现准确 AI 响应的最优文本分块策略
分块策略是一种将大型文档分解为较小、可管理的部分的方法,用于 AI 检索。糟糕的分块会导致结果不相关、效率低下并降低业务价值。
3 MIN READ

2025年 6月 18日
使用一个 GPU 运行多模态提取以实现更高效的 AI 工作流
随着企业生成和使用越来越多的多样化数据,从 PDF 和演示文稿等多模态文档中提取见解已成为一项重大挑战。
4 MIN READ

2025年 6月 11日
通过开源 AI-Q NVIDIA Blueprint 与您的企业数据交流
企业数据呈爆炸式增长,PB 级的电子邮件、报告、Slack 消息和数据库的堆积速度比任何人都快。市场调研人员 Gartner 表示,
2 MIN READ

2025年 5月 23日
LLM 推理、AI 智能体和测试时间缩放的简单介绍
智能体一直是应用大语言模型 (LLMs) 解决复杂问题的主要驱动力。自 2023 年 AutoGPT 以来,
2 MIN READ

2025年 5月 7日
概念驱动的 AI 教学助手引导学生获得更深入的见解
在当今的教育环境中,生成式 AI 工具既带来了福音,也带来了挑战。虽然这些工具提供了前所未有的信息获取途径,但也引发了对学术诚信的新担忧。
2 MIN READ

2025年 4月 23日
使用 NVIDIA NeMo 微服务,通过数据飞轮增强 AI 智能体
企业数据不断变化。随着时间的推移,这给保持 AI 系统的准确性带来了重大挑战。随着企业组织越来越依赖 代理式 AI 系统 来优化业务流程,
4 MIN READ

2025年 4月 23日
聚焦:Qodo 借助 NVIDIA DGX 实现高效代码搜索创新
大语言模型 (LLMs) 使 AI 工具能够帮助您更快地编写更多代码,但随着我们要求这些工具承担越来越复杂的任务,其局限性变得显而易见。
3 MIN READ

2025年 4月 16日
使用 NVIDIA NIM 构建 AI 驱动的自动引用验证工具
引文的准确性对于保持学术和 AI 生成内容的完整性至关重要。当引用不准确或错误时,它们可能会误导读者并散布虚假信息。
2 MIN READ