《科学》发布2021年十大科学突破:AlphaFold预测蛋白结构居首

撰文:朱哼哼
编审:王哈哈
排版:李雪薇
2021年11月17日 , Science杂志公布了2021年的年度科学突破榜单 , AlphaFold和RoseTTA-fold两种基于人工智能预测蛋白质结构的技术位列榜首 。
《科学》发布2021年十大科学突破:AlphaFold预测蛋白结构居首
文章图片
除此之外 , 年度科学突破还包括:开发针对COVID-19的抗病毒药、μ子的新测量、火星地震观测、从土壤恢复古代人类DNA、CRISPR体内应用、对早期人类发展的新见解、使用迷幻类药物治疗PTSD、开发用于治疗传染病的单克隆抗体以及聚变能生成的进步 。
《科学》发布2021年十大科学突破:AlphaFold预测蛋白结构居首
文章图片
此外 , Science杂志还评选了三个年度科学故障(breakdowns) , 包括实现气候目标的希望渺茫、阿尔茨海默病药物引发愤怒 , 以及科学家们因新冠疫情受到排斥和攻击 。
本文主要介绍本年度最重要的科学突破——基于人工智能的蛋白质结构预测 。
结构生物学持续50多年的困惑
我们都知道 , 蛋白质是生命活动的主要承担者 , 甚至毫不夸张的说 , 没有蛋白质就没有生命 。 因此 , 长期以来蛋白质都是生命科学工作者研究的重点 。 而其中 , 蛋白质的结构更是众多生命科学工作者研究的热点 , 毕竟其主要功能是由结构决定的 。
1957年 , JohnC.Kendrew和MaxF.Perutz通过X射线晶体学确定了第一个蛋白质结构 。 不久之后 , ChristianB.AnfinsenJr.提出蛋白质的结构在热力学上是稳定的 , 似乎可以根据蛋白质的氨基酸序列来预测蛋白质的三维结构 。
然而 , 蛋白质的结构复杂性远超人们的想象 。 依据中心法则 , 蛋白质主要是由DNA转录成RNA , 再翻译成肽链后组装而来 , 一个蛋白质分子是由一条或几条多肽链组成 , 多肽链则折叠成特有的形状 。 同时 , 蛋白质分子的专一形状是由4个层次的结构决定的 , 包括一级、二级、三级和四级结构 , 前一级结构决定后一级结构 。
其中多肽链的氨基酸序列是一级结构 , 一级结构中的部分肽链卷曲或折叠产生二级结构 。 二级结构经过一系列的构象改变形成三维结构即三级结构 , 一般为球状或纤维状 。 三级结构有特定的结构域 , 形成结合位点或调节位点 , 可以结合特定结构的物质 , 行使特定的功能 。 两条或两条以上的多肽链组成的蛋白质 , 可以形成四级结构 。
《科学》发布2021年十大科学突破:AlphaFold预测蛋白结构居首
文章图片
图|蛋白质3D结构(来源:NatCommun)
因此 , 从ChristianB.AnfinsenJr.理论提出至今50多年的时间里 , 科学家始终无法解决蛋白质折叠的问题 , 对于蛋白质结构的了解依旧十分有限 。
而近年来 , 随着冷冻电子显微镜技术的发展 , 可以在没有结晶样本的条件下观察蛋白质结构 , 使得蛋白质结构研究有所进展 。 不过 , 冷冻电镜是非常昂贵的设备 , 只有极少数的实验室才有条件配备 , 对于广大科研工作者非常不友好 。 因此 , 生命科学界亟需新的方法解决蛋白质折叠问题 。
AI助力解决蛋白质结构预测难题
随着计算机科学的发展 , 此前曾有学者提出利用计算机模型解决蛋白质折叠问题 。 虽然这一想法是可行的 , 但是在随后数十年的时间里 , 人们开发的各种计算机模型预测蛋白结构的准确性始终有限 。
在过去25年中 , 国际蛋白质结构预测大赛(CASP)一直关注这个领域的进展 , 试图寻找能够完美解决蛋白质折叠问题的计算机模型 。 直到第14届大赛CASP14大赛成功举办 , DeepMind旗下的AlphaFold系统在蛋白质结构预测方面表现出了无与伦比的准确性 。