终于有人用 AIGC「干正事」了—— 设计蛋白质( 二 )


人类想设计蛋白质 , 归根到底是想让这种强大的生物元件来为自己服务 。 我们可以先设想一个需要的功能 , 然后看什么样的结构来实现功能 。 最初的要求可能是:瞄准某个靶点的药物分子、在细胞膜表面专门运送某种物质的蛋白……科学家最想拥有的「魔法」是 , 去设计一个自然界原来并不存在的蛋白质 。
蛋白质设计领域的领军人物大卫·贝克(DavidBaker)将这个正在发生的进程称为「蛋白质设计革命」 , 「这场革命与人类历史上发生过的其它科技革命类似 , 我们将可以用新的方式来操控世界……通过『蛋白质设计革命』 , 我们将学会用前所未有的方式 , 来操控生物分子 。 」他目前是华盛顿大学的计算生物科学家 , 在AlphaFold2模型推出之前 , 他带领团队推出的预测蛋白质方式是学界的主流模型 。
终于有人用 AIGC「干正事」了—— 设计蛋白质
文章图片
DavidBaker|来源:华盛顿大学蛋白质设计研究所
如今 , 他的实验室也走在蛋白质设计的前沿 。 12月初实验室发布了最新的模型RFdiffusion(射频扩散) , 这个模型将AI绘画领域的扩散模型创新地融入蛋白质设计中 。
另一个团队也发布了类似的成果 , 波士顿的蛋白质设计公司GenerateBioBiomedicines , 发布了一个蛋白质设计程序Chroma 。 这两项最新的研究成果 , 都可以对性能、结构先做一些设定 , 再依据这些设定来生成全新的蛋白质 。
来自贝克团队的一位成员说 , 「我们生成的蛋白质与现有的蛋白质完全没有相似性 。 」GenerateBiomedicines的CTO则形容 , 「我们可以在几分钟内发现花费了数百万年的进化是什么」 。 除了根据条件来重新设计 , 两个团队的最新模型还可以生成蛋白质片段 , 将片段与已经存在的结构匹配 。
这次研究中出现了让大卫·贝克非常惊喜的结果——生成了一种附着在甲状腺旁激素上的蛋白质 。 「它凭空想出了这种蛋白质设计」 。 这种蛋白质的功能是控制血液中的钙水平 。 在设计时 , 科学家只是告诉模型荷尔蒙的信息 , 然后让它生成一种与之结合的蛋白质 。 接下来 , 在实验室测试这种蛋白的时候 , 他们发现 , 新设计出的蛋白和激素紧密连接 , 甚至超出了现有的药物 。
终于有人用 AIGC「干正事」了—— 设计蛋白质
文章图片
DavidBaker实验室设计的环状蛋白质|来源:华盛顿大学蛋白质设计研究所
02
设计蛋白质的「魔法」
如果说提出对图画的描述 , 让AI帮你作画已经超出想象;提出一个对蛋白质的要求 , 让AI帮你设计出这样一个分子 , 更像是一种超级能力 。 大自然花了上亿年形成蛋白质进化规律 , 人类虽然不能完全翻译这些规律 , 却可以发明强大的工具 , 并对它发出指令:「生产一个可以与X结合的分子」 。
扩散模型已经在AI绘画显示了威力 。 最基础的直觉原理来源于物理学 。 在环境中 , 气体分子会高浓度区域扩散到低浓度区域 , 这个过程 , 也类似噪声逐步扩散、最终导致信息丢失 。
将这个原理运用在图像生成 , 便是将「噪声逐步扩散、最终信息丢失」的过程逆向运作 。 先生成一张充满大量噪声的图片 , 再基于AI能力 , 一边猜测哪些对于最终的图像而言是「噪点」 , 将其去除 , 那么剩下的便是所需的「信息」 。 通过迭代 , 在噪声中反复提取出「信息」 , 最终生成被指定的图片 。
为什么扩散模型用于蛋白质设计 , 会有更强大的结果呢?极客公园咨询了两位计算机生物学领域的学者 。 他们表示 , 目前会有一些依据模型特点的推测 , 但还很难说清楚 。 不过目前的研究结果 , 已经证明了扩散模型的潜力 。 Baker实验室表示:射频扩散方法在许多问题上优于现有的蛋白质设计方法 。