计算机|随着科技的进步,计算机会像人类一样去“看东西”

现在大家都知道,在技术领域里,人类容易接触到的一切都很难反映出来。这也难怪,我们是六百万年进化的产物时,先进的计算机系统和数字机器人只有几十年的历史。然而,它的发展正朝着正确的方向发展,计算机对世界的感知能力的提高,也正好证明了这一点。
我们需要在计算机系统感知世界的方式上做出重大的改进。
计算机|随着科技的进步,计算机会像人类一样去“看东西”
文章插图

今天,大多数计算机视觉系统远远没有达到标准和合理。在悬浮物体、或“走进”某个物体或“重叠”某个物体的背景下,物体的方向性差是目前为止最小的问题。如果我们越来越依赖机器人、自动化甚至是自主系统,我们(不是我们,而是专家)需要在相关系统如何感知世界方面做出重大改进。
麻省理工学院的研究人员是如何提高计算机对世界的认知的?
【 计算机|随着科技的进步,计算机会像人类一样去“看东西”】我们希望乘坐自动驾驶汽车,乘坐无人驾驶的出租车,将繁琐的工作外包给机器人,并尽可能实现一切自动化,因此我们肯定需要开发基于光学相机的系统。
最近,麻省理工学院的研究人员完成了这项工作,向世界展示了他们的最新成果——3DP3,即通过概率编程实现的3D场景感知。
这是一个新的人工智能系统,它尝试达到人类感知世界的水平,而且做得非常好。它通过几张图片学习感知现实世界的物体,并通过那些之前学习过的物体来感知场景。它将真实照片与通过传统深度学习系统和最终3DP3读取的照片进行对比。
计算机|随着科技的进步,计算机会像人类一样去“看东西”
文章插图

在这两种情况下,算法都应该专注于一个特定的对象,并为研究人员提供他们如何准确地看到它的结果。在测试中,研究人员表明,3DP3无法匹配这项任务,仅仅5张基线图像就足以让它有效工作。因此,现在负责的研究人员想要改进它,使其即使在单一来源的材料下也有效,并测试它训练其他神经网络的潜力。
至于3DP3本身的发展,研究人员从人工智能研究的开始就受到概念的启发。根据它,计算机视觉系统可以被看作是计算机图形学的“逆”,正如techny.org指出的那样。考虑到这一点,研究人员开发了概率编程,允许系统根据输入数据检查检测到的物体,看看从相机捕捉到的图像是否与任何场景可能匹配。重要的是,系统能够识别可能的不匹配并纠正它们。