NeMo

2025年 7月 3日
新视频:使用 NVIDIA Data Flywheel Blueprint 构建可自我提升的 AI 代理
由大语言模型驱动的 AI 智能体正在改变企业工作流,但高昂的推理成本和延迟可能会限制其可扩展性和用户体验。为解决这一问题,
1 MIN READ

2025年 6月 30日
出色的多模态 RAG:Llama 3.2 NeMo 检索器嵌入模型如何提高工作流准确性
数据远不止于文本,它本质上是多模态的,包括图像、视频、音频等,通常采用复杂的非结构化格式。虽然常见的方法是将 PDF、扫描图像、
2 MIN READ

2025年 6月 26日
在 NVIDIA Jetson 和 RTX 上运行 Google DeepMind 的 Gemma 3n
截至今日,NVIDIA 现已支持在 NVIDIA RTX 和 Jetson 上全面推出 Gemma 3n。上个月,
1 MIN READ

2025年 6月 25日
如何使用 NVIDIA NeMo 技能简化复杂的 LLM 工作流程
改进 LLM 的典型方法涉及多个阶段:合成数据生成 (SDG) 、通过监督式微调 (SFT) 或强化学习 (RL) 进行模型训练以及模型评估。
4 MIN READ

2025年 6月 11日
利用 NVIDIA Data Flywheel Blueprint 通过模型蒸馏构建高效的 AI 智能体
随着企业加速采用代理式 AI,团队在扩展智能应用程序的同时管理推理成本方面面临着越来越大的挑战。大语言模型 (LLM) 提供强大的性能,
2 MIN READ

2025年 6月 11日
通过开源 AI-Q NVIDIA Blueprint 与您的企业数据交流
企业数据呈爆炸式增长,PB 级的电子邮件、报告、Slack 消息和数据库的堆积速度比任何人都快。市场调研人员 Gartner 表示,
2 MIN READ

2025年 6月 2日
通过高效的长上下文大语言模型训练扩展到数百万个 Token
大语言模型 (LLM) 的演变标志着其处理和生成文本的能力有了显著提升。在这些发展中,上下文长度的概念 (模型可以处理的单个输入样本中的…
2 MIN READ

2025年 5月 28日
聚焦:使用 Iguazio 的 MLRun 和 NVIDIA NIM 构建可扩展和可观察的 AI 以投入生产
Iguazio (被麦肯锡收购) 与 NVIDIA 的合作使企业组织能够构建生产级 AI 解决方案,这些解决方案不仅具有高性能和可扩展性,
2 MIN READ

2025年 5月 27日
在 NVIDIA Grace Hopper 上分析大型语言模型训练工作流
AI 的快速发展催生了模型大小呈指数级增长的时代,特别是在大语言模型 (LLMs) 领域。这些模型凭借其变革能力,正在推动各行各业的创新。
3 MIN READ

2025年 5月 27日
在 NVIDIA Grace Hopper 上训练大型语言模型的高级优化策略
虽然分析有助于识别效率低下的情况,但高级优化策略对于解决硬件限制和有效扩展 AI 工作负载至关重要。在本文中,我们将探讨 CPU 卸载、
3 MIN READ

2025年 5月 14日
使用先进的开放式后训练数据集构建自定义推理模型
合成数据已成为大语言模型 (LLM) 后训练程序的标准组成部分。使用从单个或一组经商业许可的开源 LLM 中合成生成的大量示例,
2 MIN READ

2025年 5月 14日
借助 NVIDIA Nemo 框架,在远程数据中心网络中加速 LLM 训练
多数据中心训练对 AI 工厂至关重要,因为预训练扩展会推动更大模型的创建,导致对计算性能的需求超过单个设施的能力。
2 MIN READ

2025年 5月 12日
在 NVIDIA NeMo 框架的首发日支持下即时运行 Hugging Face 模型
在企业组织努力更大限度地提高其 生成式 AI 投资的价值时,获取最新的模型开发成果对于持续取得成功至关重要。通过在首发日使用先进的模型,
2 MIN READ

2025年 5月 9日
应用具有推理能力的专用大语言模型(LLM)加速电池研究
人工评估材料通常会拖慢电池创新等复杂领域的科学研究,限制了每天只有数十个候选材料的进展。在这篇博客文章中,
3 MIN READ

2025年 4月 23日
使用 NVIDIA NeMo 微服务,通过数据飞轮增强 AI 智能体
企业数据不断变化。随着时间的推移,这给保持 AI 系统的准确性带来了重大挑战。随着企业组织越来越依赖 代理式 AI 系统 来优化业务流程,
4 MIN READ

2025年 4月 9日
在 NVIDIA NeMo Guardrails 中使用 Cleanlab 可信语言模型防止 LLM 幻觉
随着越来越多的企业将 Large Language Models (LLM) 集成到其应用中,他们面临着一个严峻的挑战:
3 MIN READ