LSTM之父开喷LeCun论文:为啥你不引用我的工作?LeCun沉默未回应

明敏发自凹非寺
量子位|公众号QbitAI
语不惊人死不休的LSTM之父JürgenSchmidhube , 又来了 。
LSTM之父开喷LeCun论文:为啥你不引用我的工作?LeCun沉默未回应
文章图片
这一回 , 他把“矛头”对准LeCun , 声称其前不久发表的最新62页论文中 , 没有正确引用自己实验室1990-2015年的成果 。
LSTM之父开喷LeCun论文:为啥你不引用我的工作?LeCun沉默未回应
文章图片
没错 , 就是LeCun那篇介绍自己未来10年研究方向的论文《APathTowardsAutonomousMachineIntelligence》 。
LSTM之父开喷LeCun论文:为啥你不引用我的工作?LeCun沉默未回应】尽管LeCun已经在论文中声明 , 其中的很多想法都是来自不同作者 。
但Jürgen表示 , 很多内容读起来似曾相识 , “而他并没有正确引用我的论文” , 并且列出10个方面论述了自己的观点 。
LSTM之父开喷LeCun论文:为啥你不引用我的工作?LeCun沉默未回应
文章图片
其中不乏LeCun眼中的下一代AI架构世界模型、JEPA等引起热议的部分 。
Jürgen直言 , 自己如此较真并不是因为存在利益冲突 , 而是希望自己的工作能够得到认可 。
目前 , LeCun对此还没有回应 。
“他引用的论文都太新了”在这次发文中 , Jürgen表示LeCun引用的很多论文都太新了 , 却没有引用早年间的一些“最原创”的论文 。
这些早年的研究 , 正是来自他的团队 。
就拿LeCun此次重点提到的世界模型来说 。
Jürgen表示 , 他1990年发表的一篇论文中 , 就介绍到了其中的几个概念 。
LSTM之父开喷LeCun论文:为啥你不引用我的工作?LeCun沉默未回应
文章图片
这篇论文中 , 描述了两个循环神经网络 , 可以称为控制器(controller)和世界模型(worldmodel) 。
控制器负责尝试发出一系列动作 , 以在最初的未知环境中尽可能多地积累输入 。
世界模型用来学习控制器发出动作后产生的结果 。
这种模式也就是现在的rollout算法 。
在LeCun的论文中 , 关于这部分的引用是来自论文“Dyna,anintegratedarchitectureforlearning,planning,andreacting” , 发表于1991年8月 。
LSTM之父开喷LeCun论文:为啥你不引用我的工作?LeCun沉默未回应
文章图片
但Jürgen认为 , 其中提到的集合学习、规划和反应的架构 , 在此之前就被提出了 , 正是来自于他们1990年的工作 。
因此 , LeCun的引用有问题 。
除此之外 , 他还提到LeCun引用的2014年发表的论文GenerativeAdversarialNets , 也是基于他们的工作 。
这一点在他之前的发声中就有提及过 。
去年 , Jürgen表示ResNet、GAN等五大网络都有他的功劳 。
LSTM之父开喷LeCun论文:为啥你不引用我的工作?LeCun沉默未回应
文章图片
还有LeCun在论文中提到的核心——联合嵌入预测架构(JEPA) 。
Jürgen认为这是他在1997-2002年时提出过的工作 。
诸如此类的问题 , Jürgen在博客中列举了将近10处 , 并列出了大量论文进行论证 。
网友:机器学习的所有工作都是他的注脚Jürgen一波操作自然又引来了不少网友围观 。
有网友觉得 , LeCun也没有说这些想法都是他自己的 , 他的立场更多是综合了大家想法下提出一个愿景 , 而且也提供了适当的引用作为参考 。
大概他也应该提到你的这些论文!
LSTM之父开喷LeCun论文:为啥你不引用我的工作?LeCun沉默未回应
文章图片
当然更多人是出来吐槽Jürgen了……
你的确是AI领域的一位大佬 , 但你更出名的是总出来说别人剽窃了你的想法吧 。