代理式 AI/生成式 AI

2025年 10月 15日
通过 NVIDIA Jetson AGX Thor 实现 7 倍生成式 AI 性能,解锁更快速、更智能的边缘模型
NVIDIA 软件生态系统的一大显著优势在于其持续优化的承诺。今年 8 月,NVIDIA 发布了 Jetson AGX Thor,
2 MIN READ

2025年 10月 14日
借助 NVIDIA Parabricks 提高变体识别准确性
NVIDIA Parabricks 是一款专为数据科学家和生物信息学家设计的可扩展基因组学软件套件,专注于基因数据的二级分析。
3 MIN READ

2025年 10月 13日
使用 NVIDIA Dynamo 部署 72B 模型提升 PD 分离性能
在生产环境部署大模型推理服务时,技术团队往往会遇到诸多挑战,例如缺乏成熟的 PD 分离方案、自动扩缩容机制不够灵活、缺乏动态路由,
2 MIN READ

2025年 10月 11日
探索在大模型训练中使用 Megatron-Core 训练框架提高显存使用效率
在大模型训练中,显存(GPU Memory)始终是最稀缺的资源之一。随着模型规模迈入百亿、千亿甚至万亿参数级别,如何在有限显存中“塞下”…
3 MIN READ

2025年 10月 10日
使用 NVIDIA Nemotron 构建日志分析多智能体自校正 RAG 系统
日志是现代系统的核心所在。然而,随着应用规模不断扩大,日志往往演变成一片冗长繁杂的文本海洋,充斥着重复与冗余信息,令人不堪重负。
2 MIN READ

2025年 10月 9日
从助手到对手:利用代理式 AI 开发者工具
越来越多的开发者开始采用支持人工智能的编码工具,例如 Cursor、OpenAI Codex、Claude Code 和 GitHub…
3 MIN READ

2025年 10月 2日
NVIDIA AI Red 团队的实用 LLM 安全建议
近年来,NVIDIA AI 红队(AIRT)已对多款在投产前的支持 AI 的系统进行了潜在漏洞和安全风险评估。
1 MIN READ

2025年 9月 30日
借助 NVIDIA NV-Tesseract-AD 推进行业应用的异常检测
在最近的一篇博客文章中,我们介绍了 NVIDIA NV-Tesseract,这是一系列旨在将异常检测、分类与预测统一到同一框架中的模型。
1 MIN READ

2025年 9月 29日
利用 NVIDIA Run:ai 和 NVIDIA Dynamo 进行快速高效 LLM 推理的智能多节点调度
大语言模型的复杂性呈指数级增长,带来了诸多挑战,例如模型规模超出单个 GPU 的承载能力、对高吞吐量与低延迟工作负载的需求,
3 MIN READ

2025年 9月 25日
如何将计算机视觉工作流与生成式 AI 和推理集成
生成式 AI 为分析现有视频流开辟了全新可能。视频分析正从统计物体演进为将原始视频片段转化为实时理解,从而提供更具价值的可行见解。
3 MIN READ

2025年 9月 23日
使用 NVIDIA Nemotron 构建检索增强生成 (RAG) 智能体
与基于 LLM 的传统系统受限于其训练数据不同,检索增强生成 (RAG) 通过整合相关的外部信息来提升文本生成效果。
5 MIN READ

2025年 9月 23日
借助生成式 AI 通过分子合成途径进行推理
无论是制药、化学还是材料应用,分子设计中反复出现的挑战在于构建可合成的分子。合成性评估通常需要绘制分子的合成路径:
2 MIN READ

2025年 9月 23日
借助 NVIDIA NeMo 在 FP8 精度下提高训练吞吐量
在之前关于 FP8 训练的博文中,我们探讨了 FP8 精度的基础知识 并深入分析了适用于大规模深度学习的 多种扩展方法。
3 MIN READ

2025年 9月 22日
DeepSeek R1 MTP 在 TensorRT-LLM 中的实现与优化
TensorRT-LLM 在 NVIDIA Blackwell GPU 上创下了 DeepSeek-R1 推理性能的世界纪录,
5 MIN READ

2025年 9月 22日
扩展 TensorRT-LLM 中的专家并行度:大规模 EP 的设计与实现
DeepSeek-V3 / R1 等模型采用大规模细粒度混合专家模型 (MoE) 架构,大幅提升了开源模型的质量。
10 MIN READ

2025年 9月 18日
如何使用 NVIDIA Dynamo 减少 KV 缓存瓶颈
随着 AI 模型变得更大、更复杂,推理,即模型生成响应的过程,正成为一项重大挑战。像 GPT-OSS 和 DeepSeek-R1…
4 MIN READ