效率提升1200倍!麻省理工开发AI制药新模型

效率提升1200倍!麻省理工开发AI制药新模型
文章图片
效率提升1200倍!麻省理工开发AI制药新模型】智东西(公众号:zhidxcom)
编译|夏舍予
编辑|徐珊
智东西7月14日消息 , 据外媒TechXplore报道 , 麻省理工学院的研究人员最近开发了一种叫做EquBind的新模型 , 这个模型可以提前预测新蛋白质分子的结构 , 提升药物开发的效率 。
目前这项技术已经得到了业界内的认可 , 阐述这项技术的论文也将在7月被国际机器学习会议(ICML)会议接收 。
一、速度提升1200倍 , EquBind模型能迅速筛选类药物分子目前 , 药物研发是一件漫长而又昂贵的事情 。 其中最主要的原因就是开发药物的成本十分昂贵 。 这种成本不仅包括数十亿美元的资金投入 , 还包括长达数十年的研究时间 。
而且在研发的过程中 , 90%的药物都会因为无效或副作用太多而研发失败 , 只有10%的药物能够顺利通过食品和药物管理局的检查 , 被批准上市 。
因此 , 制药公司会提高研发成功药品的价格 , 来弥补研发失败药品造成的损失 , 所以目前有些药物的价格居高不下 。
效率提升1200倍!麻省理工开发AI制药新模型
文章图片
一些蛋白质分子结构
如果研究人员想要进行药物开发 , 就要先找到有开发潜力的类药物分子(drug-likemolecules) 。 药物研发进程缓慢还有另一个重要的原因 , 那就是现存的类药物分子数量庞大 。 数据显示 , 目前现存的类药物分子多达1016种 , 这个数字远远超出了现有的分子计算模型的计算上限 。
为了处理数据如此庞大的分子 , 加快药物开发的进程 , 麻省理工学院电子工程和计算机科学系的研一学生HannesSt?rk开发了一种叫做“EquBind”的几何深度学习模型 。 EquBind比现存最快的分子计算对接模型运行速度快1200倍 , 能够更快地找到类药物分子 。
二、EquBind模型能精准预测蛋白质结构 , 提升药物研发效率目前大多数传统的分子计算对接模型都是通过一种叫做“配体-蛋白质”(ligand-to-proteinbinding)的方法寻找类药物分子 。 具体而言 , 模型需要先接收大量的样本分子 , 然后让配体与各种分子进行结合 , 然后模型再对不同分子进行评分 , 再以最后的排名来筛选出最合适的分子 。 但是这种做法流程繁复 , 模型寻找类药物分子的效率较低 。
HannesSt?rk对这个过程做了一个形象的比喻 , 他说:“以前的典型的‘配体-蛋白质’方法就好像是试图让模型把钥匙插入有很多钥匙孔的锁 , 模型要花费大量的时间为钥匙和每一个锁孔的适配度打分 , 再选出最合适的那个 。 ”
他继续解释道:“而EquBind可以跳过最花费时间的步骤 , 可以在遇到新分子时提前预测最合适的‘锁孔’ , 这就是所谓的‘盲配对’(blinddocking) 。 EquBind有内置的几何推理算法 , 能够帮助模型学习分子的基本结构 。 这个算法可以让EquBind在遇到新的分子时直接预测出最合适的位置 , 而不用花费大量的时间尝试不同的位置并打分 。 ”
效率提升1200倍!麻省理工开发AI制药新模型
文章图片
麻省理工学院
三、EquBind模型已在业界成功应用 , 作者期待更多反馈这个模型引起了治疗公司Relay的首席数据官帕特·沃尔特斯(PatWalters)的注意 。 沃尔斯特建议HannesSt?rk的研究小组用这种模型来进行用于治疗肺癌、白血病和胃肠道肿瘤的药物开发 。 通常而言 , 用于这些领域药物的蛋白质配体很难用大多数传统的方法对接 , 但是EquBind却能让它们成功对接 。