MIT「猎豹」3.9米/s刷新四足机器人世界记录,但还是跑不过苏炳添( 二 )


诚如研究者所言 , 「这个模型当然可以被指导开发一种更流畅的运动形式 , 但此次大家努力的重点只是优化速度」 。
业界趋势:合成数据训练机器狗
教四足机器人运动 , 此前无外乎是两种途径:
摄像头等传感器搜集现实数据 , 然后码农手动编程处理数据;
或码农将传感器搜集的现实数据作为数据训练集 , 训练AI控制四足机器人动作 。
「投多少人工出多少智能」 , 这两种办法其实都是耗时费力 。
MIT「猎豹」3.9米/s刷新四足机器人世界记录,但还是跑不过苏炳添
文章图片
码农手动编程的时间成本与资源耗费不消说 , 环境出个变化就得手工改程序 。
拿现实世界数据使劲训练AI , 现在也遇到瓶颈了 。
现实世界的数据变量实在太丰富 , 各种雄心勃勃要搞全无人L4自动驾驶的大车厂们就因此在训练AI上吃了大瘪:
砾石地、沙地、雪地的路况不同 , 不同风速、湿度、颗粒物状态的空气能见度不同 , 路上各种从活人到井盖的物体运动状况不同 。 越要训练出能因应万象的AI司机 , 现实数据的搜集和处理成本就越大 。
当然如果和马斯克一样跳脱 , 在车上装超级电脑来走数据跑AI 。 理论上也不是不可以 , 只是现实中人会说这种解决方案是神经病 。
穷则思变 , 如果现实数据搞起来太累太麻烦 , 那么换合成数据 , 不是就跑通了么?
现在业界巨擘们纷纷搞模拟环境/合成数据 。 谷歌拿NeRF为Waymo的无人车训练渲染了个模拟旧金山出来 。 英伟达在猛砸资源做OmniverseReplicator 。
MIT「猎豹」3.9米/s刷新四足机器人世界记录,但还是跑不过苏炳添
文章图片
斩牛刀可以用来杀鸡 , 合成数据连参数和变量大到吓人的无人车AI都可以用 , 两足/四足机器人要面临的环境变量少得多 , 自然也可以用 。
2021年起 , 加州大学伯克利分校的研究团队就在用模拟环境训练两足机器人Cassie 。 据称Meta的AI团队也在用模拟环境训练四足机器人 。
MIT团队训练机器猎豹:3小时合成逾百日数据量
四足机器人界的泰山北斗之一、MIT的机器猎豹项目 , 自不甘人后 。
研究团队完全不用摄像头等传感器输入真实外界数据 , 完全在模拟环境中训练控制机器猎豹的AI 。
不得不说 , 效果满好 。
MIT「猎豹」3.9米/s刷新四足机器人世界记录,但还是跑不过苏炳添
文章图片
由MIT研究团队释出的实景对比图像可以看出:
人工预编程的控制软件 , 让机器猎豹的步态更好看 , 但砾石地上的复杂路况大大限制了行动速度与敏捷度 。
而在模拟环境中、通过奖惩机制训练的强化学习AI模型 , 控制下的机器猎豹酷似野狗乱爬 , 但速度和敏捷度提升了不止一个档次 。
MIT研究小组表示 , 他们的环境模拟器在3小时内生成了相当于过百天的各种地形、天气等环境变化数据 , 以此为训练集来用强化学习方法训练机器猎豹的控制AI 。
如此训练出的步态控制模型 , 的确很可能无法判别机器猎豹足下的是冰地还是砾石地 。 但AI判断出形态不稳、步态受干扰、要倒的结果速度可是大大提升了 。
因此机器猎豹步态与形体的因应方案虽然难看 , 但既能高速前冲、又不会同时仆街 , 这个成就在四足机器人界可是前所未有 。
如下图所示 , 用合成数据训练的强化学习AI , 让机器猎豹成功过坎 , 避免了此前的仆街状况 。
MIT「猎豹」3.9米/s刷新四足机器人世界记录,但还是跑不过苏炳添
文章图片
落地前景
MIT计算机科学和人工智能实验室(CSAIL)的研究人员相信 , 他们的技术可以用于提高其它机器人系统能力 , 尤其适用工厂发货前的组装系统 。