机器学习指导催化剂设计,提高反应的产率

编辑/绿萝
准确识别催化活性的描述符对深入理解催化作用 , 以及为催化剂筛选奠定基础至关重要 。 然而 , 常用方法的可预测性和准确性低 。
近日 , 美国纽约州立大学石溪分校(SUNYSB)和布鲁克海文国家实验室(BNL)的化学家开发了一种新的机器学习(ML)框架 , 该框架可以锁定多步化学转化的哪些步骤应该进行调整以提高生产率 。 该方法可以帮助指导催化剂的设计 。
该研究以「Enhanceddescriptoridentificationandmechanismunderstandingforcatalyticactivityusingadata-drivenframework:revealingtheimportanceofinteractionsbetweenelementarysteps」为题 , 发表在《CatalysisScience&Technology》上 。
该论文第一作者WenjieLiao说:「我们的目标是确定反应网络中的哪个基本步骤或哪个步骤子集控制催化活性 。 」
以铜基催化剂上的CO加氢制甲醇为例 , 该反应由七个相当简单的基本步骤(基元反应)组成 。 该团队开发了使用铜基催化剂分析CO转化为甲醇的方法 。
领导这项工作的化学家PingLiu说:「我们使用这个反应作为我们的ML框架方法的一个例子 , 但是你可以将任何反应放入这个框架中 。 」
机器学习指导催化剂设计,提高反应的产率
文章图片
将多步化学反应想象成具有不同高度的山丘的过山车 。 每个山丘的高度代表从一个步骤到下一个步骤所需的能量 。 为了加快整体反应 , 催化剂必须针对影响最大的一个或多个步骤 。
传统上 , 寻求改善这种反应的科学家会计算每次改变一个活化障碍可能会如何影响整体生产率 。 这种类型的分析可以确定哪个步骤是「限速」的 , 哪些步骤决定了反应的选择性——也就是说 , 反应物是生成期望的产物 , 还是通过其他途径生成不想要的副产物 。
但是 , 据Liu说 , 「这些估计结果非常粗略 , 对于一些催化剂组有很多错误 。 这对催化剂设计和筛选非常不利 , 而这正是我们正在努力做的事情 。 」
新的机器学习框架旨在改进这些估计 , 以便科学家能够更好地预测催化剂将如何影响反应机制和化学品产量 。
「现在 , 我们不是一次解决一个障碍 , 而是同时解决所有障碍 。 我们使用机器学习来解释该数据集 。 该方法提供了更可靠的结果 , 包括反应中的各个步骤如何协同工作 。 」Liao说 。
在这里 , 研究人员开发了一种替代方法 , 该方法遵循完善的从数据中提取知识的框架 , 以提高描述符识别的准确性和效率 。 还采用了常用的「速率控制程度」(DRC)分析方法进行比较 。 这种新方法利用了全局敏感性分析中的代理模型和机器学习(ML) , 与正交多项式函数等传统代理模型相比 , ML可以访问一系列灵活的非参数回归模型 , 提供有效的数据驱动函数逼近 。
结果表明 , 新方方法比现有的基于尺度关系和导数的方法要准确得多 , 能够大大提高描述符识别和速率预测的准确性 。 更重要的是 , 它还可以通过评估代理模型进行动力学分析计算成本的增加可以忽略不计 , 因此可以提取更好的机制理解和最终设计指南 。
构建模型
科学家们首先构建了一个数据集来训练他们的机器学习模型 。 该数据集是基于DFT计算的活化能 , 通过反应的七个步骤 , 将原子的一种排列方式转变为另一种排列方式 。 然后 , 科学家们进行了基于计算机的模拟 , 以探索如果他们同时改变所有七个激活障碍会发生什么——一些上升 , 一些下降 , 一些单独 , 一些成对 。
「我们包含的数据范围是基于对这些反应和催化系统的以往经验 , 在有趣的变化范围内 , 这可能会给你带来更好的性能 。 」Liu说 。