历史最高分!腾讯绝悟AI斩获Minecraft AI竞赛冠军( 二 )
文章图片
(不同动作的可视化结果 , AI学会了关注当前图像中的关键区域)
随着游戏推进 , 智能体与人类的策略出现了很大的分歧 。 此时 , 人类数据已经很难用于指导AI 。 绝悟AI使用了自模仿学习(Self-imitationLearning)的思想 , 提出了基于鉴别器的自模仿学习算法 , AI可以从自身过往的成功与失败中获得经验与教训 , 并在察觉到当前状况不妙的时候 , 主动往更好的方向修正 。 对比实验证明 , 在加入自模仿策略后 , 智能体探索到的行为更加一致 , 也可以显著降低进入危险区域的概率 。
对于合成物品等需要长链条的动作序列的任务 , 研究人员也做了细致的优化 。 通过动作序列一致性过滤(ConsistencyFiltering)与基于投票的集成学习(EnsembleLearning) , 模型在合成物品阶段的成功率从35%提升到96% , 一举将最薄弱的链条扭转为了最稳定的制胜点 。
利用高度复杂、高度定制化的游戏场景作训练场 , 腾讯AILab的深度强化学习智能体正不断走近现实 。 棋牌游戏AI“绝艺”从围棋棋盘逐步走向象棋、麻将 , 策略协作型AI“绝悟”从MOBA走向FPS、RTS , 再到如今的3D开放世界MineCraft 。 它们迈向全新挑战的每一步 , 都让AI离解决现实问题、科技向善的大目标更近了一步 。
随着虚实集成世界逐步变成现实 , 这些研究的经验、方法与结论 , 将在真实世界创造更大的实用价值 。
雷峰网
- 苹果|马化腾称,腾讯只是一家普通公司,这是谦虚说法还是有所顾虑?
- 百度|马化腾的一句话,腾讯市值一小时暴涨1400亿港币,马云格局还是小了
- 腾讯研究院|构建美好数字社会,腾讯2022科技向善创新周成功举办
- iqoo neo|开始退场!红米K40最强对手清仓:高通870+独显,直降300历史最低
- 图灵奖|中国科技团队创历史,360打破行业垄断,登顶世界最强人工智能榜
- 腾讯|投出公司的总市值顶两个科创板,腾讯在给哪些企业当“后台”?
- 腾讯|前腾讯员工爆料:鹅厂的末位淘汰制让人心理崩溃!
- 芯片|腾讯立功了,国产芯片迎来好消息,重要程度不亚于华为鸿蒙
- 马化腾|从不大放厥词,马化腾:腾讯随时被替换
- 苹果|马化腾的一句话,腾讯市值一小时暴涨1400亿港币,马云格局还是小