我们和计算生物学从业者深度聊了聊|对撞派 · 圆桌实录( 三 )


而我们的计算真正能够和实验对比,是所有的计算发展的一个很重要的里程碑和目标,用计算去替代一部分实验,也是我们最终的研发的目的和终点。
我愿意把它定义成这是我们计算生物学的大航海时代的开端。这个时代才刚刚开始。
Q2:在过去的一年,包括AlphaFold2、RosettaFold、以及RNA结构预测在内,计算生物学领域到了一个爆发的节点。有哪些利好的因素导致了这一波突破呢?
A2:从技术的角度去看,很多技术发展包括AI本身,突然的巨变性的变化,往往是因为有多个要素的组合。数据、算力和算法的组合之下,突然这层窗户纸捅破了,就会有很多的结果涌现。现在这三点的结合最终到了一个所谓的奇点(critical point),就会爆发。
所以我想一方面恰好发生于去年,另一方面这三条线的发展也是经历了一个相当于符合客观规律的过程。
其实我觉得整个领域从2016年就具备这样的基础。但是这个领域相比于大家能直观认知的下围棋的 AlphaGo ,还有互联网的一些应用,还是相对小众,并且需要的知识门槛是更高的。所以说它的实际突破的出现,肯定相对来说会更晚。
但是晚到什么程度呢?
从技术发展的趋势上,我觉得是一个十年之内肯定会发生的事情,毕竟所有的要素其实都是具备的。所以说我觉得从2016年到2026年之间,肯定会出现技术的突破,只是说或早或晚,那取决于它的问题有多被行业需要,取决于相关的这些要素有没有被有机的整合到一起。
至于说2021年这个时间点,我觉得在这十年之间,就算 DeepMind 没有在去年做出 AlphaFold2,可能今年、明年像我们这样的玩家,像RosatteFold, 可能也会产生这样的突破,因为刚才所说技术的积淀已经到这样了。
Q3:深势科技也推出了一个中国版的 AlphaFold2 就是我们的 Uni-Fold, 那当时咱们是出于怎么样的动机或者说观察来决定完成这一项工作的呢?
A3:其实我们面临的一个系统性的机会,以及我们希望做到的事情,本质上是用计算替代实验。
在医药、材料、化工等这些领域,面临的问题本质上抽象出来是一样的,大家关注的都是在微观层面怎么样设计出一个有用的分子。
我们抽象的在微观层面上想做的微尺度工业平台,本质上就是三个物理问题:结构、能量和动力学。而结构就像是一个起点或者milestone,对于算法矩阵和商业落地都是至关重要的。
Uni-Fold还有很大潜力可以挖掘,我们也不会止步于此。比如说对蛋白聚合体的结构预测,蛋白和分子结合的结构预测,当然很多比较大的蛋白现在还没有做得很准,我们也可以提升它的精度。
我们还有一系列的比如说强化分子动力学的算法,来和Uni-Fold形成完整的对蛋白结构进行预测、乃至对动态结构进行预测的算法体系,以及这些计算的方法怎样和实验联动,去提升实验的效率,或者是做一些实验上很难做的事情。
所以说我们是要在整个结构生物学领域深刻地去布局前沿的算法,然后最终达到替代不必要的实验,并且让必要进行的实验也能高效稳定地进行,这是我们想达到的最终目的。
Q4:在计算生物学里面,我们会把我们能解决的问题会做一个怎样的分类,或者说我们大概有一个怎样去攻克的一个规划和理解吗。
A4:科学问题普遍上都遵循两种范式。
第一种范式,可被完善地定义成一个物理或者化学问题,意味着可以找到相应的物理模型去很完备地描述它,这种我们就称之为叫规则驱动,或者叫物理驱动的问题。那这种问题最好的办法就是我们精准的求解物理模型。