计算机视觉/视频分析
2024年 5月 14日
NVIDIA DeepStream 7.0 里程碑式发布,用于下一代视觉 AI 开发
NVIDIA DeepStream 是一个功能强大的 SDK,可以解锁 GPU 加速的构建块,以构建端到端的视觉 AI 管道。
3 MIN READ
2024年 5月 8日
在 NVIDIA DeepStream 中使用单视图 3D 跟踪缓解视觉感知障碍
当涉及到智能视频分析(IVA)应用程序(如交通监控、仓库安全和零售购物者分析)的感知时,最大的挑战之一是闭塞。例如,
2 MIN READ
2024年 5月 3日
基于 VILA 的 NVIDIA 硬件可视化语言模型
视觉语言模型最近有了显著的发展。然而,现有技术通常仅支持一个图像。他们无法在多个图像之间进行推理、支持上下文学习或理解视频。此外,
3 MIN READ
2024年 5月 3日
视觉语言智能与 Edge AI 2.0
VILA 是 NVIDIA Research 和麻省理工学院共同开发的一系列高性能视觉语言模型。这些模型的参数规模从 ~3B 到 ~40B…
3 MIN READ
2024年 4月 17日
使用 GPU 加速的 nvImageCodec 推进医学影像解码
本文将深入分析 DICOM 医学影像的解码功能。AWS HealthImaging 利用 NVIDIA 的 nvJPEG2000 库…
5 MIN READ
2024年 3月 19日
借助生成式 AI 和细胞成像的新模型打破医疗健康领域的障碍
推动医疗健康成像的未来,NVIDIA MONAI 微服务正在创建独特的先进模型和扩展模式,以满足医疗健康和生物制药行业的需求。
1 MIN READ
2024年 3月 12日
使用 NVIDIA GPU 和 VMAF-CUDA 计算视频质量
视频质量指标用于评估视频内容的保真度。它们提供一致的量化测量,用于评估编码器的性能。 VMAF 将人类视觉建模与不断发展的机器学习技术相结合,
4 MIN READ
2024年 3月 8日
cuTENSOR 2.0:用于加速张量计算的全面指南
NVIDIA cuTENSOR 是一个 CUDA 数学库,提供经过优化的张量运算。张量是一种密集的多维数组或数组片段。cuTENSOR 2.
5 MIN READ
2024年 3月 8日
cuTENSOR 2.0:应用程序和性能
虽然 第 1 部分 专注于使用全新的 NVIDIA cuTENSOR 2.0 CUDA 数学库,但本文将介绍其他使用模式,
4 MIN READ
2024年 3月 7日
在 NVIDIA AI 推理平台上使用 Stable Diffusion XL 生成令人惊叹的图像
扩散模型正在各行各业中改变创意工作流程。这些模型通过采用降噪扩散技术,将随机噪声逐步塑造为 AI 生成的艺术,
4 MIN READ
2024年 3月 6日
在 NVIDIA AI 推理平台上使用 Stable Diffusion XL 生成令人惊叹的图像
扩散模型正在各行各业中改变创意工作流程。这些模型通过采用降噪扩散技术,将随机噪声逐步塑造为 AI 生成的艺术,
4 MIN READ
2024年 3月 5日
聚焦:Honeywell 借助 NVIDIA cuDSS 加速工业流程仿真
多年来,传统的工业流程建模和仿真方法一直在努力充分利用多核 CPU 或加速设备以并行运行模拟和优化计算。
2 MIN READ
2024年 2月 26日
使用边缘计算和视频分析检测实时废弃物污染
在过去的几十年里,随着经济发展和城市化进程的推进,废弃物产生率呈上升趋势。废弃物生产量的增加给全球政府带来了巨大的挑战,
2 MIN READ
2024年 2月 6日
生成式 AI 研究聚焦:个性化文本转图像模型
视觉效果生成式 AI是一个根据文本提示创建图像的过程。该技术基于在互联网规模的数据上预训练的视觉语言基础模型。通过提供多模态表示,
2 MIN READ
2024年 1月 29日
使用全卷积网络在 Transformer 模型中模拟注意力机制
在过去十年中,深度学习技术在计算机视觉 (CV) 任务中的应用大幅增加。卷积神经网络 (CNN) 一直是这场革命的基石,展示了卓越的性能,
3 MIN READ
2024年 1月 23日
借助 NVIDIA Metropolis 微服务和 API 构建边缘视觉 AI 应用
通过 NVIDIA Metropolis 微服务,开发者可以利用功能强大的云原生 API 和微服务来构建和定制视觉 AI 应用和解决方案。
4 MIN READ