将理论注入深度学习,对过渡金属表面进行可解释的化学反应性预测

编辑|萝卜皮
尽管最近数据采集和算法开发取得了进展 , 但机器学习(ML)在实际催化剂设计中的应用面临着巨大挑战 , 这主要是由于其有限的普遍性和较差的可解释性 。
弗吉尼亚理工学院的研究人员开发了一种融合理论的神经网络(TinNet)方法 , 该方法将深度学习算法与完善的d带化学吸附理论相结合 , 用于过渡金属表面的反应性预测 。
使用活性位点集合中的简单吸附物(例如 , OH、O和*N)作为代表性描述符物种 , 该团队证明TinNet在预测性能方面与纯数据驱动的ML方法相当 , 同时具有固有的可解释性 。
将物理相互作用的科学知识纳入从数据中学习 , 进一步阐明了化学键的性质 , 并为ML发现具有所需催化特性的新基序开辟了新途径 。
该研究以「Infusingtheoryintodeeplearningforinterpretablereactivityprediction」为题 , 于2021年9月6日发布在《NatureCommunications》 。
将理论注入深度学习,对过渡金属表面进行可解释的化学反应性预测
文章图片
简单分子或其碎片在固体表面的吸附能通常用作多相催化中的反应性描述符 。 由于精确求解多电子薛定谔方程的计算成本巨大 , 因此快速发现具有动力学有利描述符值的结构基序(例如使用量子化学计算)很有吸引力 , 但仍然是一项艰巨的任务 。
在这方面 , 由Hammer和N?rskov开创的d带化学吸附理论已被广泛用于理解d区金属及其化合物的反应趋势 。 然而 , 由于理论框架的微扰性质和大的变化 , 其使用单个d带特征(例如d电子的数量、d带中心和d带上边缘)的定量预测精度受到限制 。 高通量催化剂筛选中的位点特性 。
近年来 , 机器学习(ML)已成为一种替代方法 , 来预测具有手工制作或算法衍生特征的催化位点的化学反应性 。 通过从足够数量的abinitio数据中学习原子、离子或分子与底物的相关相互作用 , 可以比传统实践更快地计算吸附特性数量级 , 并在实验测试之前缩小候选材料的范围 。
黑盒ML模型的一个主要限制 , 特别是对于重新兴起的深度学习算法 , 是很容易学习一些在训练和测试样本上看起来都很好的相关性 , 但在标记数据之外不能很好地泛化 。 为了缓解这个问题 , 由关键性能指标或模型不确定性引导的主动学习工作流 , 已被用于加速探索可访问设计空间的巨大的、本质上无限的大小 。
然而 , 模型开发需要大量数据样本以及解释模型预测的困难对其采用高性能催化材料的自动搜索提出了巨大挑战 。
将理论注入深度学习,对过渡金属表面进行可解释的化学反应性预测
文章图片
图示:注入理论的神经网络(TinNet)的示意图 。 (来源:论文)
在此 , 研究人员提出了一种融合理论的神经网络(TinNet)方法来预测过渡金属表面的化学反应性;更重要的是 , 提取对化学键性质的物理见解 , 可以将其转化为催化剂设计策略 。 将物理相互作用的科学知识纳入数据驱动的机器学习方法是催化科学的一个新兴研究领域 。
目前 , 在完全集成的ML框架内还没有开发出这样的化学吸附混合替代模型 , 该框架相当准确(~0.1-0.2eV误差)并可在不同样品之间转移 。 通过使用深度学习算法(如卷积神经网络)从「从头开始学习」吸附特性 , 同时尊重结构设计中公认的化学吸附的d带理论 , TinNet可以应用于广泛的d块金属位点和自然编码键相互作用的物理方面 。
将理论注入深度学习,对过渡金属表面进行可解释的化学反应性预测
文章图片
图示:模型开发 。 (来源:论文)
研究人员展示了在封端的金属间化合物和近表面合金上使用吸附的羟基(*OH)作为代表性描述符物种的方法 , 例如在碱性电解质中寻找用于金属催化O2还原、CO2还原和H2氧化的有效电催化剂 。