利用知识图谱和分子图,湖大等开发药物筛选新模型( 二 )


开发了一个有效的共享单元模块 , 通过使用多任务学习策略来训练在该框架下运作良好的两个任务 。
实验
数据集和评估指标
实验使用4个数据集评估KG-MTL:(1)DrugBank收集独特的生物信息学和化学信息学资源 , 其中包含了16553个药物-靶标对、(2)DrugCentral包含9477种药物-靶标对、(3)Human和(4)C.elegans是整合各种资源的高质量数据集 。 为了评估性能 , 实验采用了准确率(ACC)、ROC曲线下的面积(AUC)和Precision-recall曲线下面积(AUPR)作为指标 。
DTI实验
为了验证KG-MTL在DTI任务上的性能 , 研究人员将DrugBank和DrugCentral作为DTI任务采用的数据集 。 同时将KG-MTL的模型性能与传统的机器学习方法、基于图的方法和基于知识图谱的方法及采用的单任务辩题模型进行了对比 , 实验结果表明KG-MTL中采用的共享单元可以提高单任务模型的性能 。
利用知识图谱和分子图,湖大等开发药物筛选新模型
文章图片
表1DTI任务的结果
CPI实验
为了验证KG-MTL在CPI任务上的性能 , 研究人员采用Human和C.elegans数据集作为CPI任务使用的数据集 。 同时 , 将传统的机器学习方法、基于图的方法、基于知识图谱的方法和单任务模型变体与KG-MTL进行对比 , 实验结果表明KG-MTL中的共享单元同样可以提升单任务性能 。
利用知识图谱和分子图,湖大等开发药物筛选新模型
文章图片
表2CPI任务的结果
消融实验
为了研究共享单元的不同操作和学习策略如何提高所提出模型的性能 , 研究人员对KG-MTL的以下变体进行了消融研究:
KG-MTL-S是KG-MTL的变体 , 它消除了共享单元和学习策略 。 因此 , 可以采用KG-MTL-Sdti和KG-MTL-Scpi分别表示单个DTI任务和CPI任务;
KG-MTL-L消除了共享单元的交叉操作 , 仅保留了线性操作;
KG-MTL-C删除了共享单元的线性操作 , 并保留了交叉操作 。
两种任务的消融实验结果如表1和表2所示 。 结果表明 , 包括线性和交叉操作在内的共享单元以及学习策略对这两个任务都有效 。 在所有变体中 , KG-MTL-S与KG-MTL相比具有最显著的性能差距 , 这表明共享单元在帮助模型共同捕获从分子图和知识图谱中提取的药物特征方面贡献最大 , 从而提高了预测性能 。
此外 , 所提方法在所有数据集中均优于KG-MTL-L和KG-MTL-C , 证明了设置完整的共享单元有利于提高预测性能 。
总结
靶标之间的分子相互作用预测(如DTI和CPI预测)在药理学和临床应用等许多领域起着关键作用 。 本文专注于分子相互作用预测 , 该预测要求模型捕获药物和靶标相关的相互作用 。 然而 , 以前的工作采用不充足的信息来表示药物特征 , 忽略了知识图谱中的语义信息 。
为了解决这一局限性 , 本文提出了一个KG-MTL的新框架 , 该框架在多任务学习的视角下开发了一种新的共享单元 , 分别从化合物的分子图和知识图谱的药物实体的语义关系中捕获信息 。 在真实数据集上的实验结果表明 , KG-MTL可以提高药物-靶标相互作用预测和化合物-蛋白质相互作用预测任务的性能 。
THEEND
转载请联系本公众号获得授权
利用知识图谱和分子图,湖大等开发药物筛选新模型】投稿或寻求报道:content@jiqizhixin.com