ch温故而知新,6位顶级CV科学家聚首:计算机视觉中的深度学习方法vs传统方法( 三 )


简而言之,廷伯根最为著名的贡献是围绕动物展现出特定行为的方式和原因提出了四个基本问题:(1)行为的动因和机理(2)行为随年龄、经验、环境的发展(3)进化对行为的影响(4)行为对生存的作用。
试想一下,人类视觉系统如何感受到「深度」?
从机理层面上来说,神经网络中存在视网膜、感光神经元等组件,它们会产生多层计算。我们看到的两幅(双目)图的差别让我们可以感受到「深度」。
从行为发展(发育)的角度来说,婴儿初生之时,其感官系统并不能很好地工作,随着时间的迁移,孩子会学会一些技能,学会观察物体的运动。那么,在现实世界中,我们应该如何训练这样的神经网络?
以上两个问题与行为的方式(How)有关,但是我们还需要回答关于「Why」的问题,探究人类为什么会发展出这样的行为。从生物进化的角度来说,发展出双目系统的捕食者可以捕获只有一侧有眼睛的猎物。从功能的角度来说,这些行为对物种的生存是有益的。
从计算机视觉的角度来看,我们需要思考如何构建某种神经架构来捕获这些信息,还需要考虑究竟是使用监督学习、无监督学习,还是自监督学习来完成该任务。上述这些问题是互补的。
ch温故而知新,6位顶级CV科学家聚首:计算机视觉中的深度学习方法vs传统方法
文章插图

在 Jitendra 看来,我们可以通过训练一个大型的神经网络来获得工程应用所需要的能力。但是其背后的原理需要通过光学和自然世界中的统计结果来解释。这有助于我们应对计算机视觉领域发生的巨大变化。如今,我们正处于从监督学习范式转向自监督学习、弱监督学习等范式的过程中。
此外,我们正处于大数据的「陷阱」中。未来,监督信号将从「人工」走向「自然」,我们使用的「大数据」在更多情况下将转变为「小数据」。因此,少样本学习是十分重要的,而这就要求我们设计更多新的网络架构。
温故而知新,了解智能学科的发展历史有助于我们成为更好的研究者!
ch温故而知新,6位顶级CV科学家聚首:计算机视觉中的深度学习方法vs传统方法
文章插图

Jitendra Malik 1986 年 1 月加入加州大学伯克利分校,他目前是电气工程和计算机科学系的 Arthur J. Chick 教授。他还是生物工程系、认知科学和视觉科学组的教员。2002-2004年任计算机科学系主任,2004-2006年和2016-2017年任EECS系主任。2018 年和 2019 年,他在 Menlo Park 担任 Facebook AI Research 的研究总监和站点负责人。
Malik 教授的研究小组致力于计算机视觉、人类视觉计算建模、计算机图形学和生物图像分析等许多不同的主题。
他于 1980 年获得 IIT Kanpur 电气工程最佳毕业生金奖,并于 1989 年获得总统青年研究员奖。他的论文获得了无数最佳论文奖,其中包括五项时间检验奖 - 因在 CVPR 发表的论文而获得的 Longuet-Higgins 奖(两次)和在ICCV发表的论文而获得的 Helmholtz 奖(3次)。他获得了 2013 年 IEEE PAMI-TC 计算机视觉杰出研究员奖,2014 年 K.S.国际模式识别协会傅奖、2016年ACM-AAAI艾伦纽厄尔奖、2018年IJCAI人工智能卓越研究奖、2019年IEEE计算机学会计算机先锋奖。他是 IEEE Fellow和 ACM Fellow 。他是美国国家工程院院士和美国国家科学院院士,美国艺术与科学院院士。
3讨论环节
Q1:这十年来,从经典方法到深度学习方法的转变是如何发生的?请问 Svetlana,在你的研究过程中,这一过程是自顶向下的,还是自底向上的?也就是说,导师们发现了深度学习的强大,并将其介绍给了学生们;还是学生们将这一技术推荐给了导师?