CoRL2021落幕:多模态通向机器人智慧,无模型框架拥抱现实应用( 二 )


而iMAP模型 , 则是第一个使用神经隐式场景表示的SLAM系统 , 能够MLP在没有先验数据的情况下在实时操作中进行训练 , 构建一个密集的、特定于场景的隐式3D占用和颜色模型 。
除了视觉研究 , 机器人的触觉研究也在今年展现出不俗的研究势头 。
CoRL2021落幕:多模态通向机器人智慧,无模型框架拥抱现实应用
文章图片
CoRL2021落幕:多模态通向机器人智慧,无模型框架拥抱现实应用
文章图片
CoRL2021落幕:多模态通向机器人智慧,无模型框架拥抱现实应用
文章图片
其中 , ReSkin是一款利用机器学习和磁传感技术的触觉软传感器 , 能实现无源共形接触(conformalcontact) , 又能根据传感器特性提供主动接触数据 , 可视化地表现其接触定位和力预测 。
此外 , 为解决长期以来软传感器寿命短、退化快的问题 , ReSkin在设计中将磁传感将电子电路从被动接口中分离出来 , 便于更换接口 。
虽然目前的皮肤感知难以起步 , 但在现阶段 , 研究者不约而同将目光聚焦在“指尖感应”上 , 通过深度学习解读高分辨率的触觉数据 , 可实现对手持物体的精细控制和轻而稳的抓取 。
最后 , 在机械臂运动规划的研究中 , 模仿学习成为今年热点 。
CoRL2021落幕:多模态通向机器人智慧,无模型框架拥抱现实应用
文章图片
CoRL2021落幕:多模态通向机器人智慧,无模型框架拥抱现实应用
文章图片
视觉模仿学习可以建模为一个状态估计问题 , 状态定义为对象交互开始时末端执行器的姿势 。 因此在学习中 , 无需使用大量演示或强化学习来明确学习策略 , 也无需储存对与之交互的对象的任何先验知识 , 而是训练一个自我监督的姿态估计器 , 可从单个人类演示中学习各种技能 , 同时还产生一个稳定且可解释的控制器 。
而重头戏--最佳论文奖 , 则将研究聚焦在“灵巧手”上 。
2
最佳论文奖:灵巧手
团队三人来自麻省理工学院计算机科学与人工智能实验室(MITCSAIL) , 分别为陈涛、徐捷 , 以及陈涛的博导PulkitAgrawal 。
巧的是 , 陈涛与徐捷同为2016年本科毕业 , 分别毕业于上海交通大学的机械工程及自动化专业与清华大学计算机科学与技术系 。 目前 , 两人同在MITCSAIL实验室 , 各自师从于ImprobableAI实验室的PulkitAgrawal教授与计算设计和制造组(CDFG)的WojciechMatusik教授 。
在研究方向上 , 两人各有侧重 , 陈涛擅长机器人学习、操作和导航;徐捷擅长机器人仿真、设计协同优化与模拟现实 , 这为两人在灵巧手的合作上奠定了最基本的优势 。
CoRL2021落幕:多模态通向机器人智慧,无模型框架拥抱现实应用
文章图片
从左至右为陈涛、徐捷、PulkitAgrawal
在CoRL会后 , AI科技评论联系到陈涛 , 对项目的研究思路和三人的工作做了详细的了解 。 陈涛谈到 , 这个项目最大的贡献是为大家提供了一种研究思路:如何用强化学习和模仿学习训练灵巧手控制器 , 并且展示了机械手在最为极端的情况(手面朝下)下转动形状任意的物体 。 研究还发现 , 当灵巧手控制器足够鲁棒时 , 即使不知道物体形状信息 , 也可以以高成功率转动任意物体到指定朝向 。
论文中表示 , 这个灵巧手有24个自由度 , 已通过无模型框架重新定位了超2000个形状各异的物体 , 具有非常高的通用性 。
CoRL2021落幕:多模态通向机器人智慧,无模型框架拥抱现实应用
文章图片
对于许多小的圆形物体 , 比如苹果、网球、弹珠 , 成功率接近100% , 对于更复杂的物体 , 如勺子、螺丝刀或剪刀 , 则接近30% 。 研究发现 , 成功率因物体形状而异 , 接下来还要基于对象形状来训练模型来 。