reddit 网友热议:迷惑行为?|ICLR 2022出现抄袭论文 | reddit

reddit 网友热议:迷惑行为?|ICLR 2022出现抄袭论文 | reddit
文章插图

作者 | 杏花、王晔

编辑 | 青暮
最近,越来越多关于论文抄袭的消息被爆出来,ICLR 2022 也成了“在逃之鱼”。
网友:第二页都是空白的!
这是又发生了啥?
ICLR,全称 International Conference on Learning Representations(国际学习表征会议),2013 年由位列深度学习三巨头之二的 Yoshua Bengio 和 Yann LeCun 牵头创办。
众所周知,Yoshua Bengio 是蒙特利尔大学教授,深度学习三巨头之一,他领导蒙特利尔大学的人工智能实验室(MILA)进行 AI 技术的学术研究。MILA 是世界上最大的人工智能研究中心之一,与谷歌也有着密切的合作。
而 Yann LeCun 就自不用提,同为深度学习三巨头之一的他现任 Facebook 人工智能研究院(FAIR)院长、纽约大学教授。作为卷积神经网络之父,他为深度学习的发展和创新作出了重要贡献。
因此,这个一年一度的会议虽成立时间不长,但已获得学术界广泛认可,被认为是深度学习的顶级会议。然而,如此权威的学术会议上竟出现论文抄袭现象,ICLR 2022 出现抄袭论文在 reddit 引起网友热议。仅针对此事,AI科技评论带大家吃一波瓜。
事件回顾:https://www.reddit.com/r/MachineLearning/comments/qkb6ga/plagiarism_case_detected_iclr_2022_newsdiscussion/
【 reddit 网友热议:迷惑行为?|ICLR 2022出现抄袭论文 | reddit】
1

这篇文论讲了什么?
这篇被 ICLR 2022 认为抄袭的论文提出了 Text-Gen,一种新的对抗性文本生成技术。论文的研究人员发现,Text-Gen 在给定输入文本的情况下,可以快速有效地生成对抗性文本。
reddit 网友热议:迷惑行为?|ICLR 2022出现抄袭论文 | reddit
文章插图
论文地址:https://openreview.net/pdf?id=EO4VJGAllb
例如,为了攻击情感分类模型,Text-Gen 可以使用产品类别作为不应改变评论情感的属性。研究人员在真实世界的 NLP 数据集上进行了实验,从而证明与许多现有的对抗性文本生成方法相比,Text-Gen 可以生成更有意义和多样化的对抗性文本。然后,论文的作者们还进一步使用生成的对抗性示例通过对抗性训练来改进模型,并且证明了生成的攻击对于模型重新训练和不同的模型架构更加稳健。
匆匆一瞥,这貌似是一篇站在“巨人肩膀上”的又一推陈出新之作,且截止被发现抄袭前,这篇论文已经通过双盲评审(double-blind review)。那么,这篇论文为何会被认为抄袭呢?

2

三大罪证,属实不冤
从 ICLR 2022 给出的官方声明中,我们发现,这篇论文被认为抄袭,属实不冤。那它究竟触犯了哪些大忌,让创作者们的心血自此付之一炬?
首先,该论文的多处“采用”其实是直接复制/粘贴自其它论文,但作者却表明这是“引用”。例如,论文的图 1,包括标题,就完全复制/粘贴自另一篇论文 CAT-Gen: Improving Robustness in NLP Models via Controlled Adversarial Text Generation. Wang et al. EMNLP 2020.。
reddit 网友热议:迷惑行为?|ICLR 2022出现抄袭论文 | reddit
文章插图
其次,该论文有两处直接截图自其他论文,但作者没有注明来源。比如,文中的算法 1 来自论文 FreeLB: Enhanced Adversarial Training for Natural Language Understanding. Zhu et al. ICLR 2020.