独家专访DeepMind CEO哈萨比斯:我们将看到一种全新的科学复兴( 五 )


维巴和他的同事已经为他们感兴趣的病毒蛋白生成了部分结构 , 但仍然缺少一部分 。 许多蛋白质都拥有多个结构域 。 结构域是蛋白质中密集折叠的单元 , 一般每个结构域有几百个氨基酸长 , 而且每个结构域都有着自己单独的功能 。 一个结构域可能与DNA结合 , 另一个结构域可能与另一个蛋白质结合 , 以此类推 。 邓布拉克说:“它们就像是多头野兽 。 ”
从结构上讲 , 域就像一根绳子上的结 , 由松散的、缠绕在一起的线连接起来 。 在维巴正在研究的蛋白质中 , 其团队已经弄清楚了绳子的粗略形状 , 但还没有弄清楚所有绳结的详细结构 。 没有这些细节 , 他们就无法解释它是如何工作的 。
不过 , 他们意识到 , 这种蛋白质是DeepMind已经在AlphaFold上运行并在网上共享的蛋白质之一 。 AlphaFold的预测并不完美 , 它卷起来的线不太对 , 但它具有蛋白质的四个结构域的形状 , 研究人员利用AlphaFold对这些结构域预测 , 并根据它们的大致形状将它们排列起来 , 这已经非常接近 。
维巴说:“我清楚地记得我看到它的那一刻 , 这是惊人的 。 我们现在是世界上唯一拥有完整结构的公司 。 ”他们很快发表了关于此次科学发现的相关出版物 。
维巴认为AlphaFold的优势在于找到尚未被充分研究的蛋白质结构 。 他说:“许多我们关心的蛋白质已经被研究了几十年 , 很多人将毕生精力投入其中 , 所以我们对它们的样子有了相当好的了解 。 ”但这仍然留下了许多未知领域 。
例如 , 维巴对激酶很感兴趣 , 激酶是一种在调节细胞正常功能中起着关键作用的酶 。 如果它们停止正常工作 , 可能会导致癌症 。 人体中大约500种激酶 , 只有大约一半被充分了解过 , 其余的被称为黑暗激酶 。
像维巴和邓布拉克这样的研究人员 , 对于开发针对激酶的抗癌药物很感兴趣 , 而这正是AlphaFold的局限性所在 。
因为在实验室中研究蛋白质的结构成本很高 , 通常只有在蛋白质被选为有希望的候选者时才会进行 , 而这可能需要几个月的药物发现过程 。 迪恩表示 , AlphaFold希望能够扭转这一局面 , 以便加速该过程 。 她说:“现在我可以从结构开始 , 确定它的表面哪里有识别位点 , 以及哪里是可以结合药物分子的地方 。 ”
然而 , 正如迪恩承认的那样 , 要完全理解药物和蛋白质之间的相互作用 , 不仅需要一个静态结构 。 蛋白质不会静止不动 , 它们的结构可通过微妙的重新配置进行循环 。 维巴说:“很多时候 , 这些小的转变是生物功能的关键 。 ”
更重要的是 , 一种蛋白质可能在一种状态下接受药物 , 而在其他状态下则不接受 。 从研究人员目前所看到的情况来看 , AlphaFold似乎只预测了这些结构最常见的状态 , 而这对于药物开发来说可能并不重要 。
当药物与蛋白质结合时 , 蛋白质也会改变形状 , 从而影响药物的作用 。 在最坏的情况下 , 药物与蛋白质的结合或对邻近蛋白质产生不可预测的连锁反应 , 甚至可能逆转药物的设计功能——例如激活而非抑制某些功能 。
独家专访DeepMind CEO哈萨比斯:我们将看到一种全新的科学复兴】在阿斯利康 , 分子AI部门的负责人奥伦奎斯特(OlaEngkvist)认为AI生成的结构最终将有助于识别药物靶标——但现在还不是时候 。 他说:“为了实现变革 , AlphaFold需要有更好的计算方法来理解蛋白质动力学 , 并处理更大的蛋白质复合物 。 ”
DeepMind计划在下一个版本的程序中解决这些问题 , 其中一项工作是生成蛋白质形状的多种变体 , 试图捕捉其动态变化 。 蛋白质移动的方式是由复杂的化学原理和物理原理控制的 , 所以一个完整的移动模型可能需要向AlphaFold提供关于这一过程的大量额外信息 。 这种方法的缺点是 , 信息可能会变成一种约束 , 从而降低了工具的预测能力 。