独家专访DeepMind CEO哈萨比斯:我们将看到一种全新的科学复兴( 三 )


25年来 , 哈萨比斯一直在断断续续地“思考”蛋白质 。 20世纪90年代 , 当他还是剑桥大学的一名本科生时 , 他就接触到了这个问题 。 哈萨比斯说:“我的一个朋友对这个问题很着迷 , 他会抓住任何机会(在酒吧里或者打台球的时候)跟我说 , 如果我们能破解蛋白质折叠 , 这将是生物学的变革 。 他的激情始终让我不能释怀 。 ”
这位朋友叫蒂姆·史蒂文斯(TimStevens) , 现在是一名研究人员 , 在剑桥大学从事蛋白质结构研究工作 。 史蒂文斯说:“蛋白质是使地球生命正常工作的分子机器 。 ”
独家专访DeepMind CEO哈萨比斯:我们将看到一种全新的科学复兴
文章图片
(来源:《麻省理工科技评论》)
几乎我们身体做的所有事情都会用到蛋白质:它们消化食物、收缩肌肉、激发神经元、探测光线以及增强免疫反应等等 。 因此 , 理解单个蛋白质的作用 , 对于理解身体是如何工作的、当它们不工作时会发生什么、以及如何修复它们至关重要 。
蛋白质由一串氨基酸组成 , 这些氨基酸通过化学力折叠成一个复杂的既扭曲、又旋转的结 , 所生成的3D形状决定了它的作用 。
例如 , 血红蛋白是一种在体内运送氧气并使血液呈红色的蛋白质 , 它的形状像一个小袋子 , 这让它能捕获肺部的氧气分子 。 而SARS-CoV-2病毒的刺突蛋白结构 , 使其能附着在细胞上 。
问题在于 , 很难从一串氨基酸中找出蛋白质的结构以及功能 , 一条展开的氨基酸串有10^300种可能的形式 , 这是与围棋游戏中所有可能走法的规模相当 。
在实验室中 , 使用X射线晶体学等技术来预测蛋白质结构是一项艰苦的工作 。 无数博士都在研究单一蛋白质的折叠 。
CASP(CriticalAssessmentofStructurePrediction , 结构预测关键评估)竞赛成立于1994年 , 该竞赛历时已久 , 其旨在通过每两年让计算机化预测方法相互竞争来加快研究速度 。 然而 , 没有任何一种技术能达到实验室工作的准确性 。 到2016年 , 相关工作进展已经停滞了十年 。
2016年 , AlphaGo获得成功后的几个月内 , DeepMind雇佣了一些生物学家 , 并成立了一个小型跨学科团队来解决蛋白质折叠问题 。 他们研究的技术在2018年首次被人所知 , 当时DeepMind以显著优势击败了其他技术 , 赢得了CASP13竞赛的奖项 。
然而在生物学世界之外 , 很少有人注意到 。 当AlphaFold2两年后问世时 , 情况发生了变化 。 AlphaFold2赢得了CASP竞赛 , 标志着在预测蛋白质结构上 , AI以和实验室生产模型的精度误差范围 , 首次缩小到只有一个原子的宽度 , 生物学家对它的出色表现感到震惊 。
哈萨比斯说 , 在首尔观看AlphaGo比赛时 , 他想起了一款名为FoldIt的在线游戏 , 这是一款华盛顿大学蛋白质研究人员大卫·贝克(DavidBaker)领导的团队在2008年发布的游戏 。 FoldIt要求玩家以不同的方式折叠蛋白质结构 , 在屏幕上以3D图像的形式呈现 。 游戏背后的研究人员希望 , 随着很多人加入该游戏 , 一些关于某些蛋白质可能形状的数据可能会出现 。 是的 , 它奏效了 , FoldIt玩家甚至为一些新发现做出了贡献 。
二十多岁时 , 哈萨比斯在麻省理工学院做博士后时玩过这款游戏 , 让他感到震惊的是 , 人类的基本直觉可以带来真正的突破 , 无论是在围棋中走一步棋 , 还是在FoldIt中找到一种新的配置 。
哈萨比斯说:“我在想我们实际上对AlphaGo做了什么 。 我们模仿了令人难以置信的围棋大师的直觉 。 我想 , 如果我们可以模拟围棋中那种豁然开朗的感觉 , 那么为什么我们不能将其带入到蛋白质中呢?”