新出生的机器狗,打滚1小时后自己掌握走路,吴恩达大弟子成果( 二 )
同时还有一个记忆组件 , 可以基于历史信息 , 对未来的表征向量做出预测 。
最后 , 还包括一个决策组件 , 它能基于视觉感知组件、决策组件的表征向量 , 决定采取怎样的动作 。
文章图片
现在 , 我们回到本次UC伯克利学者提出的方法 。
不难发现 , 其中WorldModelLearning部分的逻辑就是一个经验积累的过程 , BehaviorLearning部分则是一个动作输出的过程 。
文章图片
本篇论文方法的提出 , 主要解决了机器人训练中两方面的问题:
效率和准确率 。
一般来说 , 训练机器人的常规方法是强化学习 , 通过反复实验来调整机器人的运作 。
不过这种方法往往需要非常大量的测试 , 才能达到很好的效果 。
不仅效率低下 , 而且训练需要付出的成本也不低 。
后来 , 不少人提出在模拟器中对机器人进行训练 , 可以很好增效降本 。
但是本文作者认为 , 模拟器训练方法在准确性方面的表现还是不够好 , 只有真实的环境才能让机器人达到最好的效果 。
从结果来看 , 在训练机器狗的过程中 , 只花10分钟时间 , 机器狗就能适应自己的行为了 。
和SAC方法对比来看 , 效果有明显提升 。
文章图片
在机械臂训练过程中 , 这一新方法还克服了视觉定位和稀疏奖励的挑战 , 几小时内的训练成果明显优于其他方法 。
文章图片
研究团队值得一提的是 , 本次带来新成果的研究团队成员 , 也非常令人瞩目 。
其中 , PieterAbbeel是吴恩达的开山大弟子 。
文章图片
他现在是UC伯克利电气工程和计算机科学教授 , 伯克利机器人学习实验室主任 , 伯克利AI研究院共同主任 , 曾加入过OpenAI 。
前不久 , 他还获得了2021ACM计算奖(ACMPrizeinComputing) , 以表彰其在机器人学习方面的贡献 。
与此同时 , 他还是AI机器人公司Covariant的联合创始人 。
文章图片
另一位KenGoldberg , 也是AI领域的顶级专家 。
文章图片
他现在是UC伯克利工程教授 , 研究方向为强化学习、人机交互等 。
2005年 , 他被评选为IEEE院士 。
与此同时 , Goldberg还是一位艺术家 , 是UC伯克利艺术、科技文化研讨会的奠基人 。
此外 , PhilippWu、AlejandroEscontrela、DanijarHafner三人为共同一作 。
其中PhilippWu还只是UC伯克利一位大四的学生 。
OneMoreThing在观看机械狗训练的视频时 , 我们发现研究人员使用的Unitree机械狗 ,
文章图片
这个品牌来自中国企业宇树科技 , 之前登上过春晚的机器小牛 , 也来自它家 。
文章图片
而且 , 最近宇树机器狗集体进行Go1测试的视频曝光 , 还在国外火了一波 。
文章图片
论文地址:
https://danijar.com/project/daydreamer/参考链接:
- 机器|如果苹果不顾品牌价值把手机降价到2000到3000,国产品牌怎么办?
- 机器人|36氪首发 | 辅助出行3.0时代来临,「邦邦机器人」获近亿元B轮融资
- 本文转自:上观新闻核酸采样、设备消杀、储存核酸采样管等一系列动作|机器人“上岗”做核酸采样啦!这里的便民核酸采样亭落地应用
- 首发丨「邦邦机器人」宣布完成近亿元B轮融资,清池资本和博远资本共同领投
- emc|央视记者探访OPPO“自动化”工厂,揭密一部手机是如何诞生的
- |除了智能制造,机器人这两条分支想象空间也被打开
- 南极洲冲击!NASA将机器人送到冰层下,搜寻外星生命的希望激增
- 未来不大可能被机器人所取代的10个职业
- 如果地球突然停止转动,地球上可能会发生的7件事情
- 智能机器人|印度造女性机器人,造价仅4500元,网友:白送我也不要