Deep dive

2025年 7月 2日
通过低精度量化优化用于图像编辑的 FLUX.1 Kontext
FLUX.1 Kontext 是 Black Forest Labs 最近发布的模型,是对社区图像生成模型的一项令人着迷的补充。
3 MIN READ

2025年 7月 1日
适用于有效 FP8 训练的按张量和按块扩展策略
在本博文中,我们将分解主要的 FP8 缩放策略 (按张量缩放、延迟和电流缩放以及按块缩放 (包括 Blackwell 支持的 MXFP8…
2 MIN READ

2025年 6月 30日
出色的多模态 RAG:Llama 3.2 NeMo 检索器嵌入模型如何提高工作流准确性
数据远不止于文本,它本质上是多模态的,包括图像、视频、音频等,通常采用复杂的非结构化格式。虽然常见的方法是将 PDF、扫描图像、
2 MIN READ

2025年 6月 25日
NVIDIA DOCA 3.0 助力 AI 平台开启网络新纪元
NVIDIA DOCA 框架已发展成为新一代 AI 基础设施的重要组成部分。从初始版本到备受期待的 NVIDIA DOCA 3.0 发布,
3 MIN READ

2025年 6月 24日
隆重推出 NVFP4,实现高效准确的低精度推理
为了充分利用 AI,优化至关重要。当开发者考虑优化用于推理的 AI 模型时,通常会想到量化、蒸馏和剪枝等模型压缩技术。毫无疑问,
4 MIN READ

2025年 6月 18日
NVIDIA 集合通信库 2.26 实现性能和监控功能的提升
NVIDIA 集合通信库 (NCCL) 可实现针对 NVIDIA GPU 和网络优化的多 GPU 和多节点通信基元。
3 MIN READ

2025年 6月 17日
通过 NVIDIA Holoscan for Media 上的全新 AI 应用实例,实现实时 AI 媒体效果增强
直播媒体工作流越来越多地使用 AI 微服务来增强制作能力。然而,先进的 AI 模型大多托管在云端,由于网络延迟、带宽和实时可扩展性方面的限制,
1 MIN READ

2025年 6月 16日
使用世界基础模型生成的合成轨迹数据提高机器人学习效果
在机电一体化和机器人 AI 基础模型的进步的推动下,通用型机器人技术已经问世。但关键的瓶颈依然存在:
2 MIN READ

2025年 6月 12日
NVIDIA Holoscan 传感器桥接技术赋予开发者实时数据处理能力
在快速发展的机器人和边缘 AI 领域,高效处理和传输传感器数据的能力至关重要。许多边缘应用正在摆脱单传感器固定功能解决方案,
3 MIN READ

2025年 6月 12日
借助 RAPIDS 单细胞技术推动十亿细胞分析和生物学突破
细胞生物学和虚拟细胞模型的未来取决于大规模测量和分析数据。在过去 10 年里,单细胞实验一直以惊人的速度增长,从数百个细胞开始,
2 MIN READ

2025年 6月 12日
借助 MMseqs2-GPU 和 NVIDIA NIM 加速蛋白质科学序列对齐
蛋白质序列对齐 (比较蛋白质序列的相似性) 是现代生物学和医学的基础。它通过重建进化关系 (技术上称为 homology…
3 MIN READ

2025年 6月 11日
使用 NVIDIA Cosmos Predict-2 构建自定义物理人工智能基础模型
构建更智能的机器人和自动驾驶汽车 (AV) 始于能够理解现实世界动态的物理 AI 模型。这些模型发挥着两个关键作用:
2 MIN READ

2025年 6月 11日
借助全新 NVIDIA Cosmos 世界基础模型简化端到端自动驾驶汽车开发
随着向为自动驾驶汽车 (AV) 提供动力支持的端到端规划模型的转变,人们对基于物理性质的高质量传感器数据的需求也在不断增加。
1 MIN READ

2025年 6月 10日
借助 AI 超级计算和 NVIDIA CUDA-Q Academic 变革量子教育
随着量子计算机的扩展,它们将与 AI 超级计算机集成,以解决世界上一些最具挑战性的问题。这些加速量子超级计算机将运行利用 CPU、
2 MIN READ

2025年 6月 9日
借助 EoRA 快速恢复 LLM 压缩错误的免微调方法
模型压缩技术已经过广泛探索,可减少为大语言模型 (LLM) 或其他大型神经网络提供服务所需的计算资源。 但是,与未压缩的模型相比,
5 MIN READ

2025年 6月 5日
利用 NVIDIA cuML 中的森林推理库加速树模型推理
树集成模型仍然是表格数据的首选,因为它们准确、训练成本相对较低且速度快。但是,如果您需要低于 10 毫秒的延迟或每秒数百万次的预测,
3 MIN READ