NVIDIA 德克萨斯大学,奥斯丁和加州理工学院的研究人员开发了一种简单、高效、即插即用的不确定性量化方法,用于六自由度(自由度)物体姿态估计任务,使用 K 预先训练的估计器与不同的体系结构和/或训练数据源的集合。
研究人员在 2021 年国际机器人与自动化会议( ICRA 2021 )上发表了他们的论文“ 用于深部目标姿态估计的快速不确定性量化( FastUQ ) ”。
FastUQ 主要研究深部目标姿态估计的不确定性量化问题。在基于深度学习的目标姿态估计中(参见 NVIDIA DOPE ),一个很大的挑战是基于深度学习的姿态估计器 MIG 不能对其姿态预测过于自信。
例如,下面的两个图是操纵任务中来自摄影模型的“番茄酱”对象的姿势估计结果。两个结果都很有把握,但左一个是不正确的。
解决的另一个挑战是 sim2real 缺口。通常,基于深度学习的姿态估计器是从合成数据集(由 NVIDIA 的光线跟踪渲染器 NViSII )中训练出来的,但是我们希望将这些估计器应用于现实世界并量化不确定性。例如,左图来自合成 NViSII 数据集,右图来自真实世界。
在本计画中,我们提出一种基于集合的方法来快速量化基于深度学习的姿态估计器的不确定性。这一想法在下面两幅图中得到了证明,在左边的图中,集合中的深层模型彼此不一致,这意味着更多的不确定性;在右图中,这些模型彼此一致,反映了较少的不确定性。
这项研究绝对是跨学科的,由 NVIDIA 的不同研究团队共同努力解决:
- 由 Anima Anandkumar 领导的人工智能算法团队和西雅图的 NVIDIA 人工智能机器人研究实验室正在研究不确定性量化方法
- Jan Kautz 领导的学习和感知研究团队负责训练深部物体姿态估计模型,并从 NVIDIA 的光线跟踪渲染器 NViSII 提供真实感合成数据
为了训练深度估计和生成高保真的真实感合成数据集,团队使用 NVIDIA V100GPU 和 NVIDIA OptiX ( C ++ / CUDA 后端)进行加速。
FastUQ 是一种新的用于深部目标姿态估计的快速不确定性量化方法,具有高效、即插即用的特点,支持一类通用的姿态估计任务。这项研究在自主驾驶和一般自主性方面具有潜在的重大影响,包括更稳健和安全的感知,以及不确定性感知控制和规划。
要了解更多有关研究的信息,请访问 FastUQ 项目网站 。
感谢加州理工学院的史冠亚,他在这篇博文的数字和文字上的帮助。