选自Quantamagazine作者:John Pavlus机器之心编译机器之心编辑部 ...|别再吹CNN 了:简单的区分异同都做不到

选自Quantamagazine
作者:JohnPavlus
机器之心编译
机器之心编辑部主宰AI的CNN居然这么菜:俄罗斯方块换个方向就「不认识」了 。
《芝麻街》中有一个游戏 , 叫做「其中一个不一样(OneofTheseThingsIsNotLiketheOther)」 。 顾名思义 , 参与该游戏的小朋友需要从几个东西中找出那个不一样的 。 对于人类幼崽来说 , 这个任务着实太简单了 , 换着花样玩一百次可能也不会出错 。
选自Quantamagazine作者:John Pavlus机器之心编译机器之心编辑部 ...|别再吹CNN 了:简单的区分异同都做不到
文章图片
但是 , 对于神经网络来说 , 这个游戏就没那么简单了 。 以强大的卷积神经网络(CNN)为例 , 经过训练的CNN可以完成一系列复杂任务 , 甚至比人类完成得还要出色 , 但最近的研究表明 , CNN只能在非常有限的条件下区分两个简单的图案是否相同 。 只要稍微改变这些条件 , 该网络的性能就会随之下降 。
选自Quantamagazine作者:John Pavlus机器之心编译机器之心编辑部 ...|别再吹CNN 了:简单的区分异同都做不到
文章图片
2018年的一项研究表明 , 虽然CNN能够区分图(a)中两只狗的品种 , 但却不知道图(b)(i)中的两个图案其实是一样的 , 只是经过了旋转 。
这些结果在深度学习研究者和认知科学研究者中引起了争议 。 如果工程方面得到提升 , CNN能否像人类幼崽一样区分「相同」和「不同」?还是说CNN的抽象推理能力本身就是有限的 , 无论设计得多么精巧 , 用多少数据训练?
无论哪种猜想是对的 , 大多数研究者都同意一个观点:理解异同关系是智能的重要标志 , 无论这种智能是人工的还是其他形式的 。
「不只你我能够区分『相同』和『不同』 , 很多动物也能做到 , 比如鸭子和蜜蜂 , 」在约翰·霍普金斯大学研究视觉认知的ChazFirestone表示 。
成功区分异同的能力可以被看作人类作出各种推理的基础 。 DeepMind研究者AdamSantoro表示 , 他们公司正在「以一种整体的方式研究异-同关系」 , 即不仅局限于视觉场景 , 还扩展到了自然语言和物理交互 。
「当我让一个AI智能体『捡起玩具车』的时候 , 我的意思是让它捡起我们玩的这辆玩具车 , 而不是隔壁房间那辆 。 」他解释说 。 去年10月份一项关于异同推理的研究也强调了这一点 。 来自布朗大学等机构的研究者在文中写道:「如果没有识别『相同』的能力 , 打造真正智能的视觉推理机器的梦想就会变得无望 。 」
自2013年起 , 异同关系就一直困扰着神经网络 。 当时的人工智能先驱YoshuaBengio及其合作者CaglarGulcehre在论文《KnowledgeMatters:ImportanceofPriorInformationforOptimization》中的研究表明:CNN无法判断若干组俄罗斯方块形状是否相同 。 但这个盲点并没有阻止CNN主宰AI 。 卷积神经网络曾帮助AlphaGo击败了世界上最好的围棋棋手 , 近90%支持深度学习的Android应用都依赖于卷积神经网络 。
这种能力的激增重新点燃了一些研究人员对探索神经网络无法做到的事情的兴趣 。 CNN通过粗略模仿哺乳动物大脑处理视觉输入的方式来学习视觉处理 。 神经网络中一层人工神经元检测原始数据中的简单特征(例如亮度和对比度差异) 。 然后神经网络再将这些特征传递给连续的层 , 这些层将它们组合成更复杂、更抽象的类别 。
根据布朗大学机器学习研究员MatthewRicci的说法 , 异同关系似乎是对CNN局限性一个很好的测试 , 因为它们是「与图像特征无关的最简单问题 。 」也就是说 , 两个对象是否相同并不取决于它们是一对蓝色三角形还是一对红色圆圈 。 特征之间的关系比特征本身更重要 。
2018年 , Ricci、JunkyungKim和ThomasSerre在来自合成视觉推理测试(SVRT)的图像上测试了CNN , SVRT是一组旨在探索神经网络抽象推理技巧的简单图案 。 这些图案由在白色方块上以黑色轮廓绘制的成对不规则形状组成 。 如果一对图案在形状、大小和方向上都相同 , 则被归类为「相同」;否则 , 这一对被标记为「不同」 。