人工智能预测RNA和DNA结合位点,以加速药物发现( 二 )
接下来 , 研究人员开发了基于体素的核链结构视图 , 每个体素代表物理空间中的一个1?3立方体 , 并存储对应于特定类型原子密度的八个通道 。 然后将体素化的表示馈送到3D卷积神经网络 , 该网络对与结合位点有关的核酸结构中的片段进行评分 。 获得的基于结构的深度学习模型称为BiteNetN , 可预测结合位点界面中心的坐标、每个中心的概率分数以及结合位点中每个核苷酸的分数 。
BiteNetN
数据集
为了训练BiteNetN深度学习模型 , 研究人员构建了一个包含1933个核酸-配体复合物的大型数据集 , 包括不同类型的1065个DNA和886个RNA结构(18个结构同时包含DNA和RNA) 。
模型
文章图片
图示:BiteNetN的工作流程 。 (来源:论文)
【人工智能预测RNA和DNA结合位点,以加速药物发现】研究人员使用3DCNN架构在精选的核酸结构上训练BiteNetN , 证明在蛋白质-小分子分子和蛋白质-肽结合位点检测方面表现最佳 , 上图说明了BiteNetN工作流程 。
文章图片
图示:演示BiteNetN适用于不同类型的DNA或RNA结构 。 (来源:论文)
与其他方法的比较
为了比较BiteNetN与其他方法的性能 , 研究人员获得了四种不同方法的结合位点预测:Rsite、Rsite2、RBind、RNAsite , 用于十个测试集 。 研究人员计算了现有方法的加权AP、ROCAUC和MCC性能指标 , 以及在设计的数据集上训练的10个BiteNetN模型 。
「大多数早期的方法只适用于RNA , 特别是单链 。 我们的方法适用于DNA和两条或更多条链 。 我们甚至可以看到当多个分子纠缠在一起时出现的额外位点 。 」论文的作者IgorKozlovskii说 。
文章图片
图示:数据集上的加权AP、ROCAUC和MCC性能指标 。 (来源:论文)
实例探究
结合位点是大分子的结构和动态特性;因此 , 预测结合位点的方法应区分具有开放和折叠结合位点的构象 , 并适用于构象集合的分析 。 为了证明BiteNetN用于相关的核酸配体结合位点检测问题 , 研究人员测试了HIV-1的反式激活反应区域和ATP适体 。
文章图片
图示:与小分子结合的七种TARRNA结构的AP、ROCAUC和MCC性能指标 。 (来源:论文)
文章图片
图示:在野生型ATP适体及其G6A突变体的ATP结合和ATP未结合MD轨迹上计算的结合位点得分 。 (来源:论文)
总之 , 该团队想强调的是 , 核酸结构在原子组成和结构折叠上都不同于蛋白质结构 , 因此难以直接应用蛋白质结合位点检测方法 。 在这里 , 该团队为涵盖各种核苷酸的核酸结构设计了一种特定的类型 , 适用于DNA和RNA , 以及它们的多链复合物 。
他们设计的BiteNetN , 在构建的测试集上始终优于其他方法 。 BiteNetN具有特定的构象 , 正如我们通过分析结合小分子的七种不同HIV-1TARRNA结构所证明的那样 。 它有助于大规模分析 , 例如构象集合或突变变异分析 , 如ATP适体案例研究所示 。 最后 , BiteNetN可以使用RNA和DNA复合物 , 包括多条链 。
开源链接:https://sites.skoltech.ru/imolecule/tools/bitenet/
论文链接:https://academic.oup.com/nargab/article/3/4/lqab111/6441762#316112271
相关报道:https://phys.org/news/2022-01-artificial-intelligence-rna-dna-sites.html
- 京东|大数据!2018-2021安徽高考录取人数、分数线及排名,2022安徽高考预测!
- 求婚|外媒预测北京冬奥会奖牌榜:挪威21金登顶,美国7金,中国6金
- 机器|人工智能代替人类大部分工作就是一个笑话
- 算法|人工智能的中国模式,传统国学中的思维,隐藏终极算法
- 京东|阿里被冷落?央行数字人民币选择京东,人民日报的预测应验了
- 冬奥会冰壶比赛请来“人工智能解说员”,让观众对冰壶运行轨迹一目了然
- 2030年领跑全球?中国新型人工智能曝光,美国瞬间坐不住了
- “人工智能解说员”参加北京冬奥 带你看懂冰壶比赛
- 阿里巴巴|人工智能要动摇科学家的地位?阿里达摩院发布十大科技趋势
- |网友:一直以为中国在人工智能领域很强,但事实可能有点不一样