AI一小时预测出奥密克戎变体结构,误差仅半个原子直径

金磊发自凹非寺
量子位报道|公众号QbitAI
就在这两天 , “天津迎战新冠变异病毒奥密克戎(Omicron)”引发了高度关注 。
奥密克戎最早发现于南非 , 并且席卷了大半个世界 , 在被发现时已经传播三代 。
天津作为此次防疫“主战场” , 截至昨日12时 , 已经累计97例阳性 。
抗击疫情 , 刻不容缓 。
AI一小时预测出奥密克戎变体结构,误差仅半个原子直径
文章图片
而与此同时 , 全球科学家对奥密克戎的研究也没有停滞 。
来自北卡罗来纳大学夏洛特分校的ColbyFord研究团队 , 便在近日发布了其最新研究成果:
利用AI技术 , 几乎准确地预测了奥米克戎的复杂结构 。
他们的工作可以说是“站在巨人的肩膀上” , 具体而言 , 就是利用AlphaFold2和RoseTTAFold , 由此预测出了3D蛋白质结构 。
在论文中 , Ford对研究结果是这样总结的:
奥密克戎受体结合域(RBD)的一些结构变化 , 可能会减少抗体相互作用 , 但不会完全避开现有的中和性抗体 。
简单来说 , 就是现有疫苗对奥密克戎病毒有用 , 但由于其结构的改变 , 降低了抗体的识别能力 。
这就能解释 , 为何现有的奥密克戎感染病例中有已经打过疫苗的患者了 。
但这项研究所提供更深远的意义 , 正如《连线》杂志评价的那样:
AI一小时预测出奥密克戎变体结构,误差仅半个原子直径】可以为未来的药物指明方向 。
AI一小时预测奥密克戎结构
关于这项研究 , 还得追溯到去年的11月27日 。
当日凌晨 , 世卫组织将这个新冠“最凶变种”正式命名为Omicron 。
而就在第二天 , 不列颠哥伦比亚大学(UBC)的SriramSubramaniam便火速下载了发布在网上的基因序列组 , 还安排把奥密克戎的DNA样本运送到实验室中 。
他们想采用的方法是通过显微镜来揭示奥密克戎的蛋白质3D结构 。
与此同时 , ColbyFord也在密切关注着这件事情 。
也是在世卫组织正式命名的前后脚 , 他尝试用免费的AI软件 , 从奥密克戎基因组编码的氨基酸序列中预测其结构 。
仅仅1小时之后 , Ford便得到了他的第一个结果 , 并且很快将它们发布到了网上 。
Subramaniam则是在12月21日 , 发表了他们通过显微镜得到的结果 。
最终结果表明 , Ford用AI技术预测的2个蛋白质结构中 , 有一个被证明是与Subramaniam真实观测结果高度接近——
中心原子的位置误差只有约半埃(大约是氢原子的半径) 。
AI一小时预测出奥密克戎变体结构,误差仅半个原子直径
文章图片
不过Ford认为 , 对于新冠这类病毒 , 研究上的时效显得格外重要 , 毕竟其传播的凶猛程度也是有目共睹的 。
至于Ford所采用的AI方法 , 也正如刚才提到的 , 是基AlphaFold2和RoseTTAFold 。
整体而言 , 他的研究主要包含三大方面 。
第一步 , 是监测变种(VBM)和关切变种(VOC)的序列比较 。
Ford团队下载了新冠病毒的参考基因组 , 以及各种VOC和VBM的前100个全基因组序列 。
对这些基因组再进行一个“对齐”和“修剪”的工作 , 最终留下了1026条序列 。
基于此 , Ford对这1026条序列进行“注释” , 再根据序列相似性确定了该序列上的受体结合基序 。
然后 , 他们用MEGA11.0.10版计算每对序列之间的成对p-距离 , 再使用标准翻译表将尖峰蛋白的这个变体核苷酸序列翻译成氨基酸 。
最终对该序列进行修剪 , 使其只包含穗状蛋白的RBD(第319至541位) 。
第二步 , 是RBD的结构预测 。