机器学习的出现,是否意味着“古典科学”的过时?

机器学习的出现,是否意味着“古典科学”的过时?
文章图片
作者丨LauraSpinney
译者丨刘媛媛
原文丨Arewewitnessingthedawnofpost-theoryscience?
让我们回忆一下 , IsaacNewton被一个苹果砸中头部 , 然后是怎么提出牛顿第二定律——万有引力的?
大概过程是这样的:大量的实验和数据分析之后 , 他意识到 , 力、质量和加速度之间存在根本的关系 。 然后他制定了一种理论来描述这种关系 , 表示为一个方程“F=ma” , 并用它来预测苹果以外的物体的行为 。 事实证明 , 他的预测是正确的(这对于不要求精确度的人们来说是足够) 。
机器学习的出现,是否意味着“古典科学”的过时?
文章图片
现在 , 我们再来对比一下当今科学发展的新潮流:Facebook的机器学习工具比任何心理学家都更能预测你的偏好;DeepMind开发的AlphaFold , 可以根据蛋白质所含的氨基酸对蛋白质结构做出了迄今为止最准确的预测 。
它们的诞生对于科学界的研究范式来说究竟意味着什么?换句话说:获取知识的最佳方式是什么?科学又从何而来?
1人类的不安
Facebook和AlphaFold没有提供任何理论解释 。 这些算法只是完成工作并且效果还不错 。 我们每天都在见证Facebook预测的社会影响 。 AlphaFold的影响尚未显现 , 但许多人相信它将改变医学 。
一时间 , 它们的理论基础似乎隐居二线 。
2008年 , 时任Wired杂志的主编ChrisAnderson预言了一种理论的消亡 。 他认为 , 现在已经积累了如此多的数据 , 而计算机在发现数据间的关系方面比人类表现的更好 。 很快 , 古老的科学方法 , 即假设、预测、检验 , 将被扔进历史的垃圾箱 。 人们不再寻找事物的本质原因 , 而是满足于数据间的相关性 。
事后看来 , Anderson所看到的情况是真实的 。 大量数据的复杂性无法被我们传统理解的理论所捕捉 。
德国马克斯普朗克生物控制论研究所所长、计算神经科学家PeterDayan说:“因为不知道它们会是什么样子的 , 所以我们甚至没有能力写出对描述有用的理论 。 ”
但Anderson对理论终结的预测似乎为时过早 。 尽管Facebook和AlphaFold这样的无理论基础的预测引擎取得了成功 , 但理论不会消亡 , 此处有以下三个原因 。
第一个原因是 , 我们已经意识到AI , 尤其是神经网络这种机器学习形式 , 无需接受明确的指令即可从数据中学习 , 它们本身是容易出错的 。 想想谷歌搜索引擎和亚马逊招聘工具中记录的偏见就可以明白 。
第二 , 人类对没有理论基础的科学方法深感不安 。 我们就是不喜欢和黑匣子相处 。
第三 , 可能仍然有很多传统类型的理论(即人类可以理解的)可以有效地解释很多事情 , 只是尚未被发现 。
所以理论还没有消亡 , 但它正在改变——也许还会变得面目全非 。 普林斯顿大学心理学家TomGriffiths说:“拥有大量数据时的有意义的理论 , 与仅拥有少量数据时有意义的理论 , 看起来是完全不同 。 ”
Griffiths一直在使用神经网络来帮助改进他所在领域的现有理论 , 即人类决策 。 一个关于人们在涉及经济风险时如何做出决策的流行理论是前景理论 , 它由行为经济学家DanielKahneman和AmosTversky在1970年代提出的(后来Kahneman获得了诺贝尔奖) 。 其核心理念是:人并非总是理性的 。
机器学习的出现,是否意味着“古典科学”的过时?
文章图片
图2DanielKahneman , 人类行为前景理论的创始人之一
在2021年6月的Science杂志上 , Griffiths的小组描述了他们如何在一个庞大的决策数据集上 , 训练一个神经网络模型 , 该数据集包含在10,000个有风险的选择场景中人们做出的决策 , 然后比较模型预测有关前景理论的进一步决策的准确度 。 他们发现前景理论做得很好 , 但是神经网络在突出理论失败的地方(即预测失败的地方)显示出它的价值(参见“数据实战派”报道:) 。