机器人

NVIDIA 在 ICRA 上展示了关于几何织物、手术机器人等的新机器人研究

在 IEEE 期间的 国际机器人与自动化会议(ICRA)上,于 5 月 13 日至 17 日在日本横滨举行,几何织物将是讨论的热门话题之一。该主题是委员会成员提交的七篇论文之一,由 NVIDIA 机器人研究实验室 及其合作者共同完成,并将在本周的 ICRA 上亮相。

什么是几何织物?

在机器人领域,经过训练的策略本质上是近似的。他们通常会做正确的事情,但有时,他们移动机器人太快,与物体碰撞,或将机器人甩来甩去。无法保证会发生什么。

因此,每当有人在物理机器人上部署经过训练的策略,特别是强化学习训练的策略时,他们都会使用一层低级控制器来拦截策略中的命令。然后,他们转换这些命令,以满足硬件的限制。

视频 1. 几何织物:推广经典力学以捕捉行为物理学

当您在培训 RL 策略时,请在培训期间使用策略运行这些控制器。研究人员确定,他们的 GPU 加速 RL 训练工具可以提供的一个独特价值是对这些控制器进行矢量化,使其在训练和部署期间都可用。这就是这项研究的作用。

例如,研究人形机器人的公司可能会展示带有低级控制器的演示,这些控制器可以平衡机器人,但也可以防止机器人将手臂伸进自己的身体。

研究人员选择矢量化的控制器来自过去的几何织物工作。特别是,本文:几何织物:推广经典力学以捕捉行为物理学,在去年的 ICRA 上获得了最佳论文奖。

DeXtreme 政策 

研究人员在今年的论文中提到的手头操作任务也来自于著名的研究领域 DeXtreme

在这项新工作中,研究人员将这两条研究线合并,在矢量化几何结构控制器的基础上训练 DeXtreme 策略。这使机器人更安全,通过名义的织物行为指导策略学习,并使模拟训练和部署系统化,从而离在生产环境中使用 RL 工具又近了一步。

这创建了一个基础设施,使研究人员能够在训练过程中快速迭代,以获得正确的领域随机化,从而成功地进行 sim2real 部署。例如,通过在训练和部署之间快速迭代,他们可以调整织物结构,并在训练期间添加大量的随机扰动力,以实现远优于先前工作的鲁棒性水平。

在之前的 DeXtreme 工作中,现实世界的实验证明对物理机器人来说非常困难,在实验过程中会磨损电机和传感器,并改变底层控制的行为。有一次,机器人坏了,开始抽烟!

但有了几何结构控制器作为政策的基础并保护机器人,研究人员发现,他们在部署和测试政策时可以更加自由,而不用担心机器人会自我毁灭。

欲了解更多信息,请参阅 几何结构:政策学习的安全指导媒介 或者观看 DeXtreme 示例视频

ICRA 的更多机器人研究 

今年提交的其他值得注意的文件包括:

  • SynH2R
  • 看不见,心里还在
  • 点云世界模型
  • SKT Hang

SynH2R

SynH2R 框架由作者提出品适合训练机器人的真实人类抓握运动生成方法。欲了解更多信息,请参阅 SynH2R:用于学习人机切换的手部对象运动的合成

视频 2. SynH2R:用于学习人机切换的手部对象运动的合成

看不见,心仍在 

RDMemory 作者对机械臂进行了测试,以观察它在看到但后来被遮挡的对象上的反应,从而确保其在多种环境中都能可靠地做出反应。这项工作是在模拟和真实世界的实验中完成的。

欲了解更多信息,请参阅 看不见,心仍在:使用视频跟踪记忆模型对未观测到的物体进行推理和规划 或者观看 RDMemory 示例视频

点云世界模型 

在这个 点云世界模型 中,研究人员建立了一种新的点云世界模型(PCWM)和基于点云的控制策略,这些策略被证明可以提高机器人学习器的性能、减少学习时间和提高鲁棒性。

欲了解更多信息,请参阅 点云模型提高机器人学习者的视觉鲁棒性 相关论文。

SKT-Hang

作者在 SKT-Hang 中研究了机器人如何将各种物体挂在不同的支撑结构上的问题(图 1)。尽管这似乎是一个容易解决的问题,但物体形状和支撑结构的变化却给机器人带来了多项挑战。

A montage picture showing robots holding random objects at various angles.
图 1. SKT Hang 的机器人展示了各种物体以及它们如何以不同角度悬挂

有关更多信息,请参阅 SKT-Hang:通过对象不可知语义关键点轨迹生成悬挂日常对象 和 GitHub /HCIS-Lab/SKT-Hang

视频 3. SKT-Hang:通过对象不可知语义关键点轨迹生成悬挂日常对象

具有手术精度的机器人 

几篇新的研究论文已应用于医院手术环境。

ORBIT 外科 

ORBIT-Surgical 是一个基于物理的手术机器人模拟框架,基于 NVIDIA Isaac Sim 平台上的 NVIDIA Omniverse 实现。

它利用 GPU 并行化来训练强化学习和模仿学习算法,这些算法有助于机器人学习的研究,以增强人类的手术技能。此外,它还支持生成现实的 合成数据,用于主动感知任务。研究人员成功地演示了使用 ORBIT Surgical sim 将学习到的策略真正转移到物理 dVRK 机器人上。

ORBIT Surgical 的底层机器人模拟应用程序将在发布后以免费开源包的形式发布。

欲了解更多信息,请参阅 ORBIT Surgical:一个用于学习外科增强灵活性的开放模拟框架

视频 4. ORBIT Surgical:一个用于学习外科增强灵活性的开放模拟框架

DefGoalNet

这个 DefGoalNet 论文的重点是形状伺服,即一项专门用于控制对象以创建特定目标形状的机器人任务。有关更多信息,请参阅 DefGoalNet:从可变形对象操作的演示中学习上下文目标

视频 5. DefGoalNet:从可变形对象操作的演示中学习上下文目标

在 ICRA 与 NVIDIA Robotics 合作伙伴会面

NVIDIA 机器人合作伙伴正在 ICRA 展示他们的最新进展。

苏黎世的 ANYbotics 介绍了其 ANYmal Research 项目,该项目提供了一个完整的软件包,允许用户访问 ROS 系统的低级控制。ANYmal Research 是一个由数百名研究人员组成的社区,他们来自顶尖的机器人研究中心,包括人工智能研究所、苏黎世联邦理工学院和牛津大学。(IC010 展位)

总部位于慕尼黑的 弗兰卡机器人 重点介绍其与 NVIDIA Isaac 操纵器 一起的合作,展示基于 NVIDIA Jetson 的人工智能动力机器人控制伴侣,以及用于 Matlab 的 Franka 工具箱。(IC050 展位)

在(IC053 展位),Enchanted Tools 展示了其 Jetson 动力的 Mirokaï 机器人。

An image of robots with animated faces being shown off at CES 2023.
图 2:Mirokaï机器人在 2023 年消费电子展上展出(来源:迷人的工具)

了解更多信息

这个 NVIDIA 机器人研究实验室 是一家总部位于西雅图的卓越中心,专注于机器人操作、感知和基于物理的模拟。它是 NVIDIA 研究 的一部分,在全球拥有 300 多名顶尖研究人员,专注于人工智能、计算机图形学、计算机视觉和自动驾驶汽车等领域。

 

Tags