利用知识图谱和分子图,湖大等开发药物筛选新模型

机器之心专栏
机器之心编辑部
当下的分子相互作用预测方法还有进步的空间吗?当然有!湖南大学曾湘祥教授团队联合伊利诺伊大学芝加哥分校PhilipSYu教授和湘潭大学林轩博士开发了一种名为KG-MTL的新方法 , 它是一种新颖的大规模知识图谱增强多任务学习模型 , 通过充分利用知识图谱和分子图中的特征信息来预测分子间的相互作用 。
分子相互作用预测在药物发现和自然科学等领域中发挥着至关重要的作用 , 这个问题也十分具有挑战性 , 现有的大多数方法不能准确地利用知识图谱和分子图的信息 。
在本文中 , 研究人员提出了一种大规模的知识图谱增强多任务学习模型KG-MTL , KG即KnowledgeGraph(知识图谱) , 旨在描述药物、基因、疾病等实体及它们之间的关联 。 MTL即MultiTaskLearning(多任务学习) , 在学习一个问题的同时 , 可以通过使用共享机制来获得其他相关问题的知识 。 具体地 , KG-MTL设计了一个新颖的共享单元以协同的方式从知识图谱和分子图中提取特征 , 充分利用了知识图谱和分子图的信息 。
研究人员进行了一系列实验 , 证实了本文提出的KG-MTL方法在两个分子相互作用的预测任务上均优于最先进的方法 , 即药物-靶标相互作用预测和化合物-蛋白质相互作用预测 。
利用知识图谱和分子图,湖大等开发药物筛选新模型
文章图片
论文地址:https://ieeexplore.ieee.org/document/9815157
引言
靶标之间的分子相互作用预测在药理学和临床应用等领域起着至关重要的作用 , 预测未知靶点之间的未映射关系 , 即分子相互作用预测(MIP) , 典型的MIP管道以药物和靶标(例如蛋白质或基因)的特征作为输入并输出给定药物-靶标对的相互作用概率 。 然而 , 计算的方法准确识别分子的相互作用仍然具有挑战性 。
研究人员提出了一种新颖的大规模知识图谱增强多任务学习模型KG-MTL , 其思路简单且直观 , 采用多任务学习策略将分子图的拓扑结构和KG中相应的药物实体相结合 。 此外 , 曾湘祥教授团队联合亚马逊AI等单位联合构建了全面的生物知识图谱 , 包含了药物、疾病、蛋白质、基因、途径和表型等知识信息 , 因此可以从KG中挖掘大量潜在的药物-靶标相互作用 , 这些相互作用可通过知识图谱中的查询模式来提高其他任务的预测性能 。
KG-MTL的框架如下图1所示 , 该框架由DTI、CPI、共享单元三个模块组成 。
利用知识图谱和分子图,湖大等开发药物筛选新模型
文章图片
图1KG-MTL的框架
论文重点介绍了分子相互作用预测的两个代表性应用:药物-靶标相互作用(DTI)和化合物-蛋白质相互作用(CPI)预测 。
方法
基于图的方法
最近 , 各种深度神经网络和图神经网络(GNNs)在分子相互作用预测方面取得了优异的性能 。 然而 , 这些方法要么只考虑分子的局部特征 , 要么考虑大多数生物实体相对较小方面的方法 。 通过与基于图(或基于网络的)方法的比较 , KG-MTL可从分子图中自动提取药物的拓扑结构特征 , 也可从大规模知识图谱中获取药物与其他实体之间的语义关系信息 。
基于知识图谱的方法
最近 , 关于分子相互作用预测的研究也应用大规模知识图谱(KG)来提取各种生物实体信息 。 现有模型通常通过各种嵌入方法提取药物特征 , 直接从KG中学习实体嵌入 , 同时很容易忽略药物与其他实体之间的语义关系和拓扑特征 。
与这一系列方法相比 , KG-MTL在这些方面与它们不同:
为进一步提高两个任务之间的预测性能 , 研究人员提出的框架同时考虑了多种类型的药物实体和来自知识图谱的关系以及来自分子图的邻域结构信息;