AlphaFold「奠基人」周耀旗:用37年的边角料研究,找一座「精神乌托邦」( 八 )


这次成功给了周耀旗极大鼓舞 , 在和Dor的不断改进中 , 使用机器学习方法预测的主链二级结构达到了80%的准确度(当时最高) 。
在周耀旗看来 , 或许他可以冲击一个更难的问题:绕过粗略的三态二级结构 , 直接预测连续的二面角(psi角) 。
这是结构生物信息学领域一个长期存在的问题 , 学术上既定的习惯是避开直接预测连续的角度 。
周耀旗也吃了瘪 , 因为无法处理好角度的周期性问题 , 导致预测出来的误差过大 。
多次碰壁下 , 2006年 , Ofer回到了以色列创业 , 周宏毅完成博士后去GeorgiaTech做专职研究员 , 周耀旗也离开了布法罗 , 以正教授的身份在印第安纳大学开始了第二段教职 。
AlphaFold「奠基人」周耀旗:用37年的边角料研究,找一座「精神乌托邦」
文章图片
周耀旗和他在印第安纳的部分团队:学生赵慧英(左一 , 现中山大学孙逸仙医学院副研究员) , 李职秀(左二 , 澳大利亚昆士兰技术大学研究员) , 德州学院访问教授王吉华 , 博士后詹剑 , 杨跃东(右一) 。 背后就是用预测主链二面角构建蛋白质结构的论文招贴
虽然之前对psi角度预测不算成功 , 但周耀旗仍旧不死心 , 将这个课题交给了生物物理专业出身的博士后薛斌 。
2007年 , 周耀旗和薛斌首次使用神经网络预测蛋白质主链真实二面角 , 同时预测psi和phi , 从而可以直接构建主链结构 。 在当时 , 这是世界上第一个同时预测psi和phi真实连续角度的方法 , 但误差还是比较大(psi的误差38°) , 仅仅发表在影响因子3左右的《蛋白质》期刊 。
后来 , 杨跃东(现为中山大学计算机学院教授、国家超算广州中心副总工程师)、EshelFaraggi、詹剑(现深圳湾实验室研究员)等人进组 , 通过团队不断地改进 , 2009年 , 他们成功将psi的角度误差降到了33° 。
2011年 , 周耀旗和团队又有了重大发现:通过预测真实角度来建立、约束、和能量优化主链结构 , 完全不需要用蛋白质的已知结构 , 或者已知结构碎片来作为模块 。
周耀旗和团队欣喜 , 他们多年来的工作 , 为蛋白质结构预测和重建 , 开辟了一条新路 。 通过不断地改进 , 他们不仅证明了连续分布的二面角可以准确预测 , 而且通过二面角可以直接构建准确的蛋白质结构、从而为若干年后的第一个端到端深度学习的预测方法 , 搭好了框架 。
一场由AlphaFold掀起的革命性突破 , 也在此刻落下了时代的注脚 。
2013年 , 带着这些成果 , 周耀旗以正教授身份被引进澳大利亚格里菲斯大学 , 开始同时进行计算和实验的研究 。
AlphaFold「奠基人」周耀旗:用37年的边角料研究,找一座「精神乌托邦」
文章图片
周耀旗(右一) , 澳大利亚格里菲斯大学糖组学研究所的实验室
周耀旗在计算方面也有了新的合作伙伴 , 格里菲斯大学的KuldipPaliwal教授 。 Paliwal是国际著名的机器学习专家 , 曾第一个提出双向循环神经网络 。 在与Paliwal的合作中 , 周耀旗开始使用不同深度的深度学习方法 , 进一步改进蛋白质连续角度预测 。
AlphaFold「奠基人」周耀旗:用37年的边角料研究,找一座「精神乌托邦」
文章图片
KuldipPaliwal教授
经过一年的努力 , 2014年 , 在两人合作的第一篇论文中 , 终于解开了困扰周耀旗八年的问题——如何解决角度的周期性 。
他们将角度的直接预测 , 改成先预测SIN和COS , 再通过计算ARCTAN来得到真实角度 , 从而避开了角度的周期性 。
有了这个思路 , 周耀旗和Paliwal又用了五年时间 , 一点一点将psi角的误差从33°降到30°、27°、最终降到23° , phi的误差降到了16° 。