告别CPU,加速100-1000倍!只用GPU就能完成物理模拟和强化学习训练( 四 )
文章图片
图12:在IsaacGym中实现的三种手内操纵环境的奖励曲线 。 这些结果是通过(a)采用OpenAI观察和LSTM的ShadowHand(b)采用OpenAI观察和前馈网络的ShadowHand(c)采用标准观察的ShadowHand(d)采用标准观察的AllegroHand获得的 。 ShadowHandOpenAI是用不对称的actor-critic和领域随机化训练的 , 而ShadowHand标准和AllegroHand标准是用标准观察和对称的actor-critic训练的 , 没有领域随机化 。
文章图片
图13:(a)采用OpenAI观察和LSTM的ShadowHand , (b)采用OpenAI观察和前馈网络的ShadowHand(c)采用标准观察的ShadowHand(d)采用标准观察的AllegroHand , 每集的连续成功率 。 ShadowHandStandard和AllegroHandStandard都使用前馈网络来实现策略和价值功能 。
文章图片
图14:Trifinger学习了各种灵巧的操纵行为 , 能够将立方体移动到正确的位置和方向 。
3总结
【告别CPU,加速100-1000倍!只用GPU就能完成物理模拟和强化学习训练】研究表明 , IsaacGym是一个高性能和高仿真的平台 , 可以在单个NVIDIAA100GPU上对许多具有挑战性的模拟机器人环境进行快速训练 , 而以前使用传统的RL设置和纯CPU的模拟器则需要大型异构集群的CPU和GPU 。 此外 , 模拟后端也适用于学习具有接触的操作 , 这一点在我们用ANYmal运动和TriFinger立方体摆放进行的模拟到真实的迁移演示中得到了证实 。
- CPU|元宇宙+高端制造+人工智能!公司已投高科技超100亿,股价仅3元
- CPU|E5系列处理器——工作室和生产力专业处理器,小白请勿购买
- 苹果|从5499元跌至3399元,苹果A14+IP68防水,旧款iPhone加速清仓
- Linux|电脑城卖的CPU是intel而不是AMD,和实体店不喜欢卖小米手机是一个道理
- 文和友|泡泡玛特与飞书达成合作 新消费代表企业加速迁移飞书
- CPU|阿里反贪第一人蒋芳,入职23年将7名高层送入狱,连马云都可以查
- CPU|电脑硬件选购技巧之CPU散热,性价比干货,土豪回避
- CPU|性价比不二之选!i5-12400网游测试:已看见锐龙7 5800X尾灯
- 加速行业变革!比亚迪联手美国公司发布无人驾驶配送车
- 摩卡DHT-PHEV开启预售,魏牌全面加速智能混动赛道|新车