ch温故而知新,6位顶级CV科学家聚首:计算机视觉中的深度学习方法vs传统方法( 五 )


Q3:Andrew Davison 是 SLAM 领域的专家。请问深度学习对你们研究小组的工作有何影响?
Andrew:
我很早就听说过深度学习相关的研究,但那时这与我的研究兴趣相去甚远。直到 2016 年,我才在论文中加入了深度学习的相关技术,用它来解决一些之前难以解决的问题,向 3D 地图加入一些语义信息。在深度学习出现之前,我们可能会通过随机森林等方法来完成该任务。在当时,深度学习这类新的技术取得了巨大成功,人们开始常识使用该技术进行深度估计等任务。相较于传统方法,深度学习技术有时更快也更准确。
因此,我们开始研究如何在 SLAM 领域使用深度学习技术代替手动设计的先验,在这个方向发表了一系列文章。具体而言,我们通过深度学习进行深度预测和多视图优化等工作。然而,大约 2018 年之后,人们发现深度学习技术存在一些系统性误差,网络预测出的深度和方向可能是错误的,我们需要通过多视图的方式来解决这些问题。在我看来,通过深度学习提取的像素级特征向量比手动设计的特征要更加强大,但有时我们也需要回到更传统的几何学、概率化的多视图优化研究上来。
ch温故而知新,6位顶级CV科学家聚首:计算机视觉中的深度学习方法vs传统方法
文章插图

Andrew Davison 是伦敦帝国理工学院机器人视觉教授兼戴森机器人实验室主任。他的长期研究重点是 SLAM(同步定位和映射)及其向通用“空间 AI”的演变:计算机视觉算法,使机器人和其他人工设备能够映射、定位并最终理解周围的 3D 空间并与之交互。他与他的研究小组和合作者一直在开发具有突破性意义的系统,包括 MonoSLAM、KinectFusion、SLAM++ 和 CodeSLAM,最近的奖项包括 ECCV 2016 最佳论文和 CVPR 2018 最佳论文荣誉提名奖。他还积极参与将这项技术转化为实际应用,特别是通过他与戴森合作设计了戴森 360 Eye 机器人吸尘器内部的视觉映射系统。他当选了2017年英国皇家工程院院士。
Q4:Oliva 是人类感知和认知神经科学领域的专家,就你们的领域而言,深度学习对你们的研究带来了哪些变化?有何前景?
Oliva:在认知神经科学领域,我们对此持乐观态度,积极拥抱这种改变。事实上,早在 2011 年我很幸运地将实验室的研究领域从神经科学拓展到了计算机科学。那时,我们开始讨论 Alexnet。
从神经科学家的角度出发,我们认为神经网络是复杂的黑盒。我们开发了一系列方法来研究大脑黑盒的功能。当我们看到一些关于人工神经网络的论文时,一些神经科学家认为人工意义上的大脑为我们带来了一个新的研究领域。他们使用神经科学的方法来研究深度学习模型。
我的研究小组试图为对深度学习模型中的每一层进行评估,提供一些可解释性,并在神经科学的启发下设计一些深度学习模型。此外,我有一些从事计算神经科学的同事开始比较各种物种和人造神经网络,我认为深度学习极大促进了计算神经科学的发展。
ch温故而知新,6位顶级CV科学家聚首:计算机视觉中的深度学习方法vs传统方法
文章插图

Aude Oliva博士 是 MIT-IBM Watson AI Lab 的 MIT 主任,也是 MIT Quest Corporate 和 MIT Schwarzman 计算学院的主任,领导与行业的合作,将自然和人工智能研究转化为更广阔世界的工具。她还是计算机科学和人工智能实验室的高级研究科学家,她负责领导计算感知和认知小组。她的研究是跨学科的,涵盖人类感知和认知、计算机视觉和认知神经科学,并专注于所有三个领域交叉的研究问题。
Q5:在机器机器学习、计算机视觉、自然语言处理等任务中,有一些不易察觉的研究领域正在悄然萌芽。「几何深度学习」就是其中一个研究方向,相较于传统的 CNN,几何深度学习引入了一些其它类型拓扑的归纳偏置,为编码先验知识提供了新的方式。几何深度学习有助于传统方法在深度学习时代焕发新生。另一方面,「具身人工智能」(行为主义人工智能)也是具有广阔前景的研究方向。请问在深度学习领域中,未来有哪些具有潜力的研究方向?