参与者模块提供行动建议。参与者模块可以找到一个使估计的未来成本最小化的最佳行动序列,并在最佳序列中输出第一个行动,其方式类似于经典的最优控制。 - 短期记忆模块可以记录当前情况,预测世界状态,以及相关成本。
构建世界模型的一个关键挑战是如何使该模型能够表示多个模糊的预测。现实世界并不是完全可以预测的:一个特定的情况可能有多种演变的方式,并且许多与情况相关的细节与手头的任务无关。比如,我可能需要预测我开车时周围的汽车会做什么,但我不需要预测道路附近树木中个别叶子的详细位置。那么,世界模型如何学习现实世界的抽象表示,做到保留重要的细节、忽略不相关的细节,并且可以在抽象表示的空间中进行预测呢?
解决方案的一个关键要素是联合嵌入预测架构 (Joint Embedding Predictive Architecture ,JEPA)。JEPA 捕获两个输入(x 和 y)之间的依存关系。例如,x 可以是一段视频,y 可以是视频的下一段。输入 x 和 y 被馈送到可训练的编码器,这些编码器提取它们的抽象表示,即 sx 和 sy。预测器模块被训练为从 sx 预测 sy。预测器可以使用潜在变量 z 来表示 sy 中存在但 sx 中不存在的信息。JEPA 以两种方式处理预测中的不确定性:(1)编码器可能会选择丢弃难以预测的有关 y 的信息;(2)当潜在变量 z 在一个集合上变化时,将导致预测在一个集合上变化一组似是而非的预测。
那么,我们如何训练 JEPA 呢?
截至目前为止,研究者所使用的唯一方法就是“对比”,包括显示兼容 x 和 y 的示例,以及许多 x 和不兼容 y 的示例。但是当表示是高维状态时,这是相当不切实际的。
过去两年还出现了另一种训练策略:正则化方法。当应用于 JEPA 训练时,该方法使用了四个标准:
- 使 x 的表示最大限度地提供关于 x 的信息
- 使 y 的表示最大限度地提供关于 y 的信息
- 使 y 的表示可以从 x 的表示中最大程度地预测
- 使预测器使用尽可能少的潜在变量信息来表示预测中的不确定性
- 软件|为什么教老人用电子产品这么难:他们无法理解抽象符号建立的逻辑
- 图灵奖得主Yann LeCun最新访谈:人工智能面临的三大挑战
- 抽象|设计产品架构的基本方法
- 美无处不在!看看摄影师如何表现自然界中的抽象美
- Java|java培训:如何在Java中选择接口类和抽象类
- 删除|注意你的抽象,伙伴
- vt|当抽象文化遇到虚拟主播,评论区成了文豪的聚集地
- y1993珍贵录像:32岁的LeCun向世界亲自展示了首个CNN
- LeCun在线访谈:我的深度学习之路
- 业务|如何把现实中的业务抽象成产品?