可对药物分子进行表征的几何深度学习( 二 )
许多相关的分子特性(例如 , 平衡能、原子电荷或物理化学特性 , 如渗透性、亲油性或溶解性)对于某些对称操作是不变的 。 因此 , 对于化学应用 , 设计在预定义对称群作用下等变变换的神经网络是可取的 。
如果目标特性在分子对称变换后发生变化(例如 , 在分子反转时改变的手性特性或在分子旋转时改变的矢量特性) , 则会出现例外情况 。 在这种情况下 , 等变神经网络的归纳偏差(学习偏差)将不允许对对称变换的分子进行区分 。
虽然神经网络可以被视为通用函数逼近器 , 但结合先验知识(如合理的几何信息)已经发展成为神经网络建模的核心设计原则 。 通过结合几何先验 , GDL可以提高模型的质量 , 并绕过与将数据强制转换为欧几里得几何(例如 , 通过特征工程)相关的几个瓶颈 。 此外 , GDL提供了新的建模机会 , 例如低数据机制中的数据增强 。
文章图片
图示:分子图的深度学习 。 (来源:论文)
分子GDL
GDL在分子系统中的应用具有挑战性 , 部分原因是有多种有效的方式来表示相同的分子实体 。 分子表示可以根据它们不同的抽象级别以及它们捕获的物理化学和几何方面进行分类 。 重要的是 , 所有这些表示都是同一现实的模型 , 因此适用于某些目的 , 而不适用于其他目的 。 GDL提供了对同一分子的不同表示进行试验的机会 , 并利用其内在的几何特征来提高模型的质量 。 此外 , 由于其特征提取(特征学习)能力 , GDL一再证明在为手头的任务提供相关分子特性的见解方面很有用 。
论文中 , 作者描述了最流行的分子GDL方法及其在化学中的应用 , 根据用于深度学习的各自分子表示进行分组:分子图和点云、网格、表面和字符串符号 。
文章图片
图示:化学语言建模 。 (来源:论文)
总结
化学中的GDL使研究人员能够利用非结构化分子表示的对称性 , 从而提高用于分子结构生成和性质预测的计算模型的灵活性和多功能性 。
这些方法补充了基于分子描述符或其他人工工程特征的化学信息学 。 对于通常以需要工程规则为特征的建模任务(例如 , 从头设计的分子构建和CASP的反应位点规范) , GDL扩展了现有的方法库 。 在已发表的GDL应用程序中 , 每个分子表示都显示出特征性的优势和劣势 。
SMILES等分子串已被证明特别适合生成式深度学习任务 , 例如从头设计和CASP 。 这一成功可能归功于这种化学语言的直接语法 , 它促进了下一个标记和序列到序列的预测 。 对于分子特性预测 , SMILES字符串可能由于其非单一性而受到限制 。
分子图已被证明可用于属性预测 , 部分原因是它们的人类可解释性以及易于包含所需的边缘和节点特征 。 3D信息的结合(例如 , E(3)-不变或SE(3)/E(3)-等变信息传递)有助于量子化学相关建模 , 而在药物发现应用中 , 这种方法往往无法明显平衡模型增加的复杂性 。 E(3)等变GNN也已应用于构象感知从头设计 , 但正在等待实验验证 。
分子网格长期以来一直是大型静态分子系统(例如蛋白质)学习任务的标准3D表示 。 它们以用户定义的分辨率(体素密度)和输入网格的欧几里得结构捕获信息的能力使3DCNN高效并适用于蛋白质和其他大分子 。 然而 , 最近在Transformer网络、GNN和测地线CNN方面取得的进展已经使模型达到了最先进的性能 。
最后 , 分子表面是目前GDL的前沿 。 我们期待在不久的将来GDL在分子表面上有许多有趣的应用 。
- 本文转自:新民晚报图说:超市工作人员把年货订单交给达达快送骑士 采访对象提供(下同)虎年...|春节消费报告:年货“小时达”成新年俗,就地过年
- 别人连接我家WIFI,可以看我家摄像头吗?
- 华擎|三大运营商为何会全部被美国禁止搞移动业务?与对付华为一个到理
- Intel|英特尔12代酷睿35W型号上市:最高可选16核i9-12900T 功耗还更低
- 再见雄伟!SpaceX龙飞船内部是这样的,或许可以让你感叹不已
- 超高对比度|会发光的舞台
- 刘强东:成功背后有爱情,将章泽天女儿宠成公主,对前任儿子有愧
- 本文转自:中国数字科技馆爱因斯坦的广义相对论(就是那个统一了空间、时间与引力的理论)预言...|我们能利用黑洞的能量吗?
- 苹果申请汽车智能天窗专利 可通过改变透明度控制进入车内光线
- 本文转自:北青网北京2022年冬奥会开幕可以看得出今年的冬奥会有着鲜明的科技背景。|科技智慧奥运:九号机器人助力北京冬奥会智能化新体验