Metropolis

2025年 3月 31日
工业设施数字孪生中的机器人仿真
工业企业正在采用 物理 AI 和自主系统来实现运营转型。这涉及在工厂和仓库中部署异构机器人车队,包括移动机器人、 人形助手 、
2 MIN READ

2025年 3月 11日
使用 NVIDIA AI Blueprint 构建实时多模态 XR 应用以进行视频搜索和摘要
随着 生成式 AI 和视觉基础模型的最新进展,VLM 呈现了新一波视觉计算浪潮,其中模型能够实现高度复杂的感知和深度上下文理解。
2 MIN READ

2025年 2月 26日
图像和视频理解的视觉语言模型提示工程实践指南
视觉语言模型 (VLMs) 正在以极快的速度发展。2020 年,首批 VLMs 通过使用视觉编码器将视觉理解引入大语言模型 (LLMs) ,
4 MIN READ

2024年 11月 4日
利用 NVIDIA AI Blueprint 搭建视频搜索和摘要智能代理
本文最初于 2024 年 7 月 29 日发布,但已根据 NVIDIA AI Blueprint 信息进行了大量修改。
2 MIN READ

2024年 10月 31日
基于 NVIDIA NIM 的多模态视觉 AI 智能体构建解决方案
视觉数据(从图像到 PDF 再到流式视频)呈指数级增长,这使得人工审查和分析几乎不可能实现。组织正在努力将这些数据大规模转换为切实可行的见解,
3 MIN READ

2024年 8月 27日
简化摄像头校准,提高 AI 驱动的多摄像头跟踪能力
这篇文章是关于构建多摄像头追踪视觉AI应用的系列文章中的第三篇。我们将在第一部分和第二部分中介绍整体端到端工作流程和微调流程,
2 MIN READ

2024年 7月 29日
使用 NVIDIA NIM 和 NVIDIA VIA 微服务构建 VLM 驱动的视觉 AI 代理
传统的视频分析应用程序及其开发工作流通常基于固定功能且受限的模型构建,这些模型旨在仅检测和识别一组选定的预定义对象。 借助生成式 AI、
3 MIN READ

2024年 7月 17日
为边缘开发生成式 AI 驱动的视觉 AI 代理
AI 技术领域的一项令人兴奋的突破是视觉语言模型(VLM),它为视频分析提供了一种更动态、更灵活的方法。
3 MIN READ

2024年 7月 10日
利用合成数据微调 AI 模型提升多摄像头跟踪精度
针对特定用例的大规模合成数据在现实世界的计算机视觉和 AI 工作流程中变得越来越重要。这是因为数字孪生是一种强大的方式,可以为工厂、
4 MIN READ

2024年 6月 24日
NVIDIA Metropolis Microservices 和 NVIDIA Isaac Sim 的实时视觉 AI 从数字孪生到云原生部署
随着视觉人工智能复杂性的增加,精简的部署解决方案对优化空间和流程至关重要。NVIDIA 通过 NVIDIA Metropolis AI…
3 MIN READ

2024年 6月 2日
利用多摄像头追踪工作流程优化大型空间的流程
仓库、工厂、体育场和机场等大片区域通常由数百个摄像头进行监控,以提高安全性并优化运营。通过这些摄像头准确跟踪物体和测量活动称为多摄像头跟踪,
2 MIN READ

2024年 5月 14日
NVIDIA DeepStream 7.0 里程碑式发布,用于下一代视觉 AI 开发
NVIDIA DeepStream 是一个功能强大的 SDK,可以解锁 GPU 加速的构建块,以构建端到端的视觉 AI 管道。
3 MIN READ

2024年 5月 8日
在 NVIDIA DeepStream 中使用单视图 3D 跟踪缓解视觉感知障碍
当涉及到智能视频分析(IVA)应用程序(如交通监控、仓库安全和零售购物者分析)的感知时,最大的挑战之一是闭塞。例如,
2 MIN READ

2024年 3月 18日
如何通过四个步骤将 RAG 应用程序从试点阶段转变为生产阶段
生成式 AI 具有改变各个行业的巨大潜力。人类工作者已经开始使用 大型语言模型(LLM) 来解释、推理和解决复杂的认知任务。
2 MIN READ

2024年 3月 1日
通过线下实践学习,充分利用 NVIDIA GTC 2024
我们很高兴能在圣何塞会议中心参加今年的 GTC 大会,与数千名开发者、行业领导者、研究人员和合作伙伴共襄盛会。通过亲自参加 GTC,
1 MIN READ

2024年 2月 26日
使用边缘计算和视频分析检测实时废弃物污染
在过去的几十年里,随着经济发展和城市化进程的推进,废弃物产生率呈上升趋势。废弃物生产量的增加给全球政府带来了巨大的挑战,
2 MIN READ