LSTM之父开喷LeCun论文：为啥你不引用我的工作？LeCun沉默未回应明敏发自凹非寺量子位|公众号

明敏发自凹非寺
量子位|公众号QbitAI
语不惊人死不休的LSTM之父JürgenSchmidhube ，又来了。

文章图片
这一回，他把“矛头”对准LeCun ，声称其前不久发表的最新62页论文中，没有正确引用自己实验室1990-2015年的成果。

文章图片
没错，就是LeCun那篇介绍自己未来10年研究方向的论文《APathTowardsAutonomousMachineIntelligence》。
【LSTM之父开喷LeCun论文：为啥你不引用我的工作？LeCun沉默未回应】尽管LeCun已经在论文中声明，其中的很多想法都是来自不同作者。
但Jürgen表示，很多内容读起来似曾相识， “而他并没有正确引用我的论文” ，并且列出10个方面论述了自己的观点。

文章图片
其中不乏LeCun眼中的下一代AI架构世界模型、JEPA等引起热议的部分。
Jürgen直言，自己如此较真并不是因为存在利益冲突，而是希望自己的工作能够得到认可。
目前， LeCun对此还没有回应。
“他引用的论文都太新了”在这次发文中， Jürgen表示LeCun引用的很多论文都太新了，却没有引用早年间的一些“最原创”的论文。
这些早年的研究，正是来自他的团队。
就拿LeCun此次重点提到的世界模型来说。
Jürgen表示，他1990年发表的一篇论文中，就介绍到了其中的几个概念。

文章图片
这篇论文中，描述了两个循环神经网络，可以称为控制器（controller）和世界模型（worldmodel）。
控制器负责尝试发出一系列动作，以在最初的未知环境中尽可能多地积累输入。
世界模型用来学习控制器发出动作后产生的结果。
这种模式也就是现在的rollout算法。
在LeCun的论文中，关于这部分的引用是来自论文“Dyna,anintegratedarchitectureforlearning,planning,andreacting” ，发表于1991年8月。

文章图片
但Jürgen认为，其中提到的集合学习、规划和反应的架构，在此之前就被提出了，正是来自于他们1990年的工作。
因此， LeCun的引用有问题。
除此之外，他还提到LeCun引用的2014年发表的论文GenerativeAdversarialNets ，也是基于他们的工作。
这一点在他之前的发声中就有提及过。
去年， Jürgen表示ResNet、GAN等五大网络都有他的功劳。

文章图片
还有LeCun在论文中提到的核心——联合嵌入预测架构(JEPA) 。
Jürgen认为这是他在1997-2002年时提出过的工作。
诸如此类的问题， Jürgen在博客中列举了将近10处，并列出了大量论文进行论证。
网友：机器学习的所有工作都是他的注脚Jürgen一波操作自然又引来了不少网友围观。
有网友觉得， LeCun也没有说这些想法都是他自己的，他的立场更多是综合了大家想法下提出一个愿景，而且也提供了适当的引用作为参考。
大概他也应该提到你的这些论文！

文章图片
当然更多人是出来吐槽Jürgen了……
你的确是AI领域的一位大佬，但你更出名的是总出来说别人剽窃了你的想法吧。