VLM

2025年 6月 3日
全新 NVIDIA Llama Nemotron Nano 视觉语言模型在 OCR 准确性基准测试中位居榜首
PDF、图形、图表和控制面板等文档是丰富的数据源,在提取和整理时,可提供信息丰富的决策见解。从自动化财务报表处理到改进商业智能工作流程,
2 MIN READ

2025年 5月 18日
使用 NVIDIA AI Blueprint 进行视频搜索和摘要,推动视频分析 AI 智能体的发展
与传统的 Computer Vision (CV) 模型相比, Vision Language Models (VLMs)…
4 MIN READ

2025年 4月 29日
构建应用程序以安全使用 KV 缓存
在与基于 Transformer 的模型 (如 大语言模型 (LLM) 和 视觉语言模型 (VLM)) 交互时,输入结构会塑造模型的输出。
2 MIN READ

2025年 4月 24日
使用 NVIDIA NIM 对游戏进行代理式 LLM 和 VLM 推理基准测试
这是 LLM 基准测试系列的第一篇文章,介绍了在使用 NVIDIA NIM 部署 Meta Llama 3 模型时,
2 MIN READ

2025年 3月 19日
MONAI 集成先进的代理式架构,建立多模态医疗 AI 生态系统
医疗数据的数量和复杂性不断增加,以及对早期疾病诊断和提高医疗效率的迫切需求,正在推动医疗 AI 取得前所未有的进步。
2 MIN READ

2025年 3月 10日
借助 NVIDIA DriveOS LLM SDK 简化自动驾驶汽车应用的 LLM 部署
大语言模型 (LLMs) 在自然语言处理 (NLP) 中表现出非凡的泛化能力。它们广泛应用于翻译、数字助理、推荐系统、上下文分析、代码生成、
2 MIN READ

2025年 2月 26日
使用 NVIDIA NIM 构建基于 VLM 的简单多模态信息检索系统
在当今数据驱动的世界中,即使是从少量数据中检索准确信息的能力,对于寻求精简、有效的快速部署、原型设计或实验解决方案的开发者来说也至关重要。
3 MIN READ

2025年 1月 16日
NVIDIA JetPack 6.2 为 NVIDIA Jetson Orin Nano 和 Jetson Orin NX 模块引入超级模式
NVIDIA Jetson Orin Nano 超级开发者套件 的推出为小型边缘设备开启了 生成式 AI 的新时代。
7 MIN READ

2024年 11月 4日
利用 NVIDIA AI Blueprint 搭建视频搜索和摘要智能代理
本文最初于 2024 年 7 月 29 日发布,但已根据 NVIDIA AI Blueprint 信息进行了大量修改。
2 MIN READ