独家专访DeepMind CEO哈萨比斯:我们将看到一种全新的科学复兴( 四 )


在某种程度上 , 这两个问题并没有太大不同 。 就像围棋一样 , 蛋白质折叠是一个极其复杂的组合问题 , 这是暴力计算方法无法比拟的 。 围棋和蛋白质折叠的另一个共同之处是 , 可以获得关于如何解决问题的大量数据 。
其中 , AlphaGo使用了自己在过去积累的经验;AlphaFold使用了蛋白质数据库中现有的蛋白质结构(蛋白质数据库是一个国际数据库 , 包含了生物学家几十年来不断增加的已解决的结构) 。
另据悉 , AlphaFold2使用注意力网络(AttentionNetworks) , 这是一种标准的深度学习技术 , 可以让AI专注于输入数据的特定部分 。 这项技术支撑着像GPT-3这样的语言模型 , 它将神经网络导向句子中的相关单词 。 类似地 , AlphaFold2被导向序列中的相关氨基酸 , 例如在折叠结构中可能在一起的氨基酸对 。
史蒂文斯说:“他们把生物学家几十年来一直在推动的所有东西结合在一起 , 然后在AI领域轻松击败了参与CASP的其他技术 。 ”
独家专访DeepMind CEO哈萨比斯:我们将看到一种全新的科学复兴
文章图片
(来源:DeepMind官网)
AlphaFold已被用于各类研究
独家专访DeepMind CEO哈萨比斯:我们将看到一种全新的科学复兴
文章图片
过去一年里 , AlphaFold2的影响力逐渐扩大 。 DeepMind已经发布了该系统的详细工作原理 , 并发布了源代码 。 该公司还与欧洲生物信息学研究所(EuropeanBioinformaticsInstitute)建立了一个公共数据库 , 该数据库正在填充AI预测的新的蛋白质结构 , 目前有大约80万个条目 , DeepMind表示明年将增加超过1亿个条目——几乎是科学已知的所有蛋白质 。
英国AI药物研发公司Exscientia的首席科学家、牛津大学蛋白质信息学实验室负责人夏洛特·迪恩(CharlotteDeane)表示 , 许多研究人员仍未完全理解DeepMind的成就 。 迪恩也是DeepMind去年在科学期刊Nature上发表AlphaFold的论文的审稿人之一 , 她说:“它改变了你可以问的问题 。 ”
世界各地的一些团队已经开始在抗生素耐药性、癌症和新冠病毒等研究中使用AlphaFold 。 费城福克斯蔡斯癌症中心的罗兰·邓布拉克(RolandDunbrack)是早期使用者之一 , 其领导的团队多年来一直在使用计算机预测蛋白质结构 。
AlphaFold为邓布拉克的工作带来了前所未有的准确性 , 他说:“它们足够精确 , 可以做出生物学判断 , 解释癌症基因的突变 。 我们之前一直尝试用电脑生成模型 , 但经常出错 。 ”
邓布拉克说 , 现在当同事们请他为蛋白质建模时 , 他对他所提供的东西更有信心了 。 他说 , “(不然)我真的很紧张 , 担心他们会回来找我说 , ‘我们的钱都打水漂了 , 你的模型很糟糕——它没有用 。 ’”
邓布拉克表示 , AlphaFold仍然会出错 。 但当它运行良好时 , 很难区分它的预测和实验室产生的结构之间的区别 。 他在一个名为ColabFold的计算机平台上运行AlphaFold预测 , 该平台由哈佛大学支持并在GoogleGPU上运行 。 他说:“每天晚上睡觉前 , 我都会配置一个预测 , 运行它要花上几个小时 。 ”
独家专访DeepMind CEO哈萨比斯:我们将看到一种全新的科学复兴
文章图片
(来源:DeepMind官网)
即使是最好的AI也会出现愚蠢的错误
独家专访DeepMind CEO哈萨比斯:我们将看到一种全新的科学复兴
文章图片
“这是一个非常有用的工具 , 我实验室里的每个人都在使用 。 ”加州大学旧金山分校的结构生物学家克利门特·维巴(KlimentVerba)说 。 维巴主要研究癌症 , 但在COVID-19大流行的最初几周 , 他加入了一个由研究SARS-CoV-2病毒的研究人员组成的松散联盟 , 他想弄清楚SARS-CoV-2病毒的蛋白质是如何劫持宿主蛋白质的 。