ai|自动编码器的原理,也适用于在潜在空间中进行全局优化

ai|自动编码器的原理,也适用于在潜在空间中进行全局优化

文章图片

ai|自动编码器的原理,也适用于在潜在空间中进行全局优化

文章图片

ai|自动编码器的原理,也适用于在潜在空间中进行全局优化

文章图片


自动编码器的原理和学习到的潜在空间也适用于在潜在空间中进行全局优化 。 在潜在空间中搜索所需属性的最优值 。 解码器用于将这些最优解转化为相应的化学结构 , 结变分自编码器实现使用贝叶斯优化 。 温特等人进一步提出了一种使用粒子群优化和潜在空间的方法来生成具有所需特性的化合物 。 基于AI的从头设计方法 , 如基于结构的设计、虚拟图书馆导航或药物化学转化需要一个选择步骤 , 从更大的想法集中找到有前途的分子 。

有趣的分子应该匹配目标特性曲线 , 作为主要和有利的物理化学和ADMET特性作为辅助要求的高活性 。 科学家的研究已经表明由“先验”网络生成的化合物受到化学训练集的强烈影响 。 因此 , 应该谨慎地生成这样的训练集 。 为了将虚拟分子的生成偏向于理想的属性空间 , 可以使用各种评分函数 。 虽然通常评分仅在设计或枚举过程结束时进行 , 但基于AI的生成设计将评分作为整体反馈步骤纳入结构生成引擎 。

对评分函数的拟合被传播回设计引擎以生成下一个结构集合 , 这可能为设计问题提供更好的解决方案 。 因此 , 新生成的集合本质上携带有关祖细胞的信息 , 并且新结构以迭代方式拟合到基础函数 。 在这个迭代过程中 , 会生成数以万计的分子 , 需要对其进行评估 。 因此 , 任何有用的功能都应该快速可靠地识别显示有利化学基序的虚拟分子 。 其他需要更多计算能力的方法只能在此类工作流程结束时应用 , 以进一步对有希望的提案进行排名 。

因此 , 为生成设计步骤进行了足够的评分功能 , 显着影响新分子的性质和多样性 。 仔细选择有意义且经过验证的功能以控制生成的化学反应并专注于与项目相关的活动岛 , 这一点至关重要 。 此外 , 我们在基于AI的设计引擎上的经验表明 , 与以蛮力方式结合典型内部设置中可用的所有可用物理化学和机器学习可能性相比 , 少数评分函数的仔细平衡会导致更可靠和稳健的结果 。

我们认为评分是一个两步过程 , 通过将最相关和最快速的函数直接包含到生成设计步骤中 , 以及以多维方式使用其他评分函数从更大的虚拟提案集合中选择有趣的分子AI引擎 。 典型的评分函数基于与先前先导分子的相似性或总结先前项目知识的统计模型来捕获分子特征 。 导出这些函数的计算方法可以大致分为以下几类 。 这些将在以下各节中讨论 。 药物分子的特征在于理化特性和ADME特性 , 如溶解度、溶出率、肠和脑吸收、代谢、血浆蛋白结合和组织分布 。

在先导优化中将这些特性调整到与有利的药代动力学特性相对应的范围是至关重要的 。 然而 , 这些参数中有许多是相关的 , 一个参数的修改也会调节其他参数 。 logP作为生物系统中分布的亲脂性度量的基本作用经常被证明 。 利平斯基等人的一项极具影响力的研究提出了一组简单、直观的描述词 , 作为对化合物的警示 , 这些化合物不太可能通过被动肠道途径口服吸收 。 从那时起 , 已有报道将此概念扩展到其他化学空间区域 , 如碎片、命中或大环 。