计算机视觉/视频分析

2024年 5月 14日

NVIDIA DeepStream 7.0 里程碑式发布，用于下一代视觉 AI 开发

NVIDIA DeepStream 是一个功能强大的 SDK，可以解锁 GPU 加速的构建块，以构建端到端的视觉 AI 管道。

3 MIN READ

2024年 5月 8日

在 NVIDIA DeepStream 中使用单视图 3D 跟踪缓解视觉感知障碍

当涉及到智能视频分析（IVA）应用程序（如交通监控、仓库安全和零售购物者分析）的感知时，最大的挑战之一是闭塞。例如，

2 MIN READ

2024年 5月 3日

基于 VILA 的 NVIDIA 硬件可视化语言模型

视觉语言模型最近有了显著的发展。然而，现有技术通常仅支持一个图像。他们无法在多个图像之间进行推理、支持上下文学习或理解视频。此外，

3 MIN READ

2024年 5月 3日

视觉语言智能与 Edge AI 2.0

VILA 是 NVIDIA Research 和麻省理工学院共同开发的一系列高性能视觉语言模型。这些模型的参数规模从 ~3B 到 ~40B…

3 MIN READ

2024年 4月 17日

使用 GPU 加速的 nvImageCodec 推进医学影像解码

本文将深入分析 DICOM 医学影像的解码功能。AWS HealthImaging 利用 NVIDIA 的 nvJPEG2000 库…

5 MIN READ

2024年 3月 19日

借助生成式 AI 和细胞成像的新模型打破医疗健康领域的障碍

推动医疗健康成像的未来，NVIDIA MONAI 微服务正在创建独特的先进模型和扩展模式，以满足医疗健康和生物制药行业的需求。

1 MIN READ

2024年 3月 12日

使用 NVIDIA GPU 和 VMAF-CUDA 计算视频质量

视频质量指标用于评估视频内容的保真度。它们提供一致的量化测量，用于评估编码器的性能。 VMAF 将人类视觉建模与不断发展的机器学习技术相结合，

4 MIN READ

2024年 3月 8日

cuTENSOR 2.0：用于加速张量计算的全面指南

NVIDIA cuTENSOR 是一个 CUDA 数学库，提供经过优化的张量运算。张量是一种密集的多维数组或数组片段。cuTENSOR 2.

5 MIN READ

2024年 3月 8日

cuTENSOR 2.0：应用程序和性能

虽然第 1 部分专注于使用全新的 NVIDIA cuTENSOR 2.0 CUDA 数学库，但本文将介绍其他使用模式，

4 MIN READ

2024年 3月 7日

在 NVIDIA AI 推理平台上使用 Stable Diffusion XL 生成令人惊叹的图像

扩散模型正在各行各业中改变创意工作流程。这些模型通过采用降噪扩散技术，将随机噪声逐步塑造为 AI 生成的艺术，

4 MIN READ

2024年 3月 6日

在 NVIDIA AI 推理平台上使用 Stable Diffusion XL 生成令人惊叹的图像

扩散模型正在各行各业中改变创意工作流程。这些模型通过采用降噪扩散技术，将随机噪声逐步塑造为 AI 生成的艺术，

4 MIN READ

2024年 3月 5日

聚焦：Honeywell 借助 NVIDIA cuDSS 加速工业流程仿真

多年来，传统的工业流程建模和仿真方法一直在努力充分利用多核 CPU 或加速设备以并行运行模拟和优化计算。

2 MIN READ

2024年 2月 26日

使用边缘计算和视频分析检测实时废弃物污染

在过去的几十年里，随着经济发展和城市化进程的推进，废弃物产生率呈上升趋势。废弃物生产量的增加给全球政府带来了巨大的挑战，

2 MIN READ

2024年 2月 6日

生成式 AI 研究聚焦：个性化文本转图像模型

视觉效果生成式 AI是一个根据文本提示创建图像的过程。该技术基于在互联网规模的数据上预训练的视觉语言基础模型。通过提供多模态表示，

2 MIN READ

2024年 1月 29日

使用全卷积网络在 Transformer 模型中模拟注意力机制

在过去十年中，深度学习技术在计算机视觉 (CV) 任务中的应用大幅增加。卷积神经网络 (CNN) 一直是这场革命的基石，展示了卓越的性能，

3 MIN READ

2024年 1月 23日

借助 NVIDIA Metropolis 微服务和 API 构建边缘视觉 AI 应用

通过 NVIDIA Metropolis 微服务，开发者可以利用功能强大的云原生 API 和微服务来构建和定制视觉 AI 应用和解决方案。

4 MIN READ