我们和计算生物学从业者深度聊了聊|对撞派 · 圆桌实录( 二 )


现在蛋白质结构上面还有很多问题,因为在真实的场景下面,蛋白质是会在不同环境里相互作用的。我们在做药物、理解生物学、诊断疾病的时候,肯定不能只单独地看某一个蛋白质内部的解剖。我觉得我们还是要在真实场景中采集蛋白质,观察它在真实的细胞里面、体液里面是一个什么样的状态。从而进行结构和功能的分析,这样会更有价值。
Q4:对于更为动态,变化也更为丰富的这个蛋白质组织领域,我们在利用 AI 去对它做一些预测和分析的时候,从 AI 的角度来看,会觉得它有额外的难度吗?会在建模上造成一些其他的困难吗?
A4:在蛋白这种领域,虽然它动态,但是我觉得这不是问题。在宏观世界,我们产生的数据给我们非常大的便利,我们可以预测春运,我们可以知道新冠的流行的状态。
相对于问题的复杂度和对应的算法,缺乏足够的数据是一个更大的问题。
虽然这十几年来蛋白质测量的成本一直在降低,但还是零点几美金才可以测一个蛋白质,而我们有数以千计万计的蛋白质,还需要进一步的改进。这也是我们欧米在努力的,我们希望他的成本尽可能低到比基因组还要低,这样的话我们就可以非常快地高效地产生足够的数据。然后一定会有足够好的 AI 的算法去解决这些问题。
Q5:我们了解到蛋白质是可以作为一种更为动态和直接的生物标记物的。它是怎样如何和 AI 具体结合起来,进行疾病判断的呢?
A5:第一个核心,整个流程的背后是蛋白质组分析的核心技术,就是怎么从少量的样品,肉眼都看不到的组织里面提取数以千计、数以万计的蛋白。
然后第二个核心,就是我们怎么样建立一个与之相适应的 AI 模型,从数千万的蛋白中挑出那么 10 来个左右的蛋白进行诊断。
第三个就是产品化,我们怎么样让这个这测量这十几个蛋白成本尽可能的低,达到消费级要低于每个蛋白 0.1 美金以下,希望是越低越好,这样越低我们就可以更广泛的使用。
Q6:对于整个计算生物学来说,这个领域现在大概发展到了什么程度?
A6:目前计算生物学实际上是高度依赖数据的,因为文本的数据多,因为图像的数据多,因为基因组的数据多,所以大家的主要的这个关注度在这个方面。
然后现在我们可以非常有信心的说这个蛋白质组的数据会也会越来越多。AlphaFold2的出现就是这样一个突破。作为最重要的一个分子,蛋白质组会在结构、动态、功能、网络等方面都被进一步开发。
第二场:对谈深势科技深势科技致力于以新一代分子模拟技术解决微尺度工业设计难题。以打造切实服务于药企、材料商和科研机构的模拟研发平台为主要业务方向,以解放研发工作者的生产力为主要业务目标。
对谈嘉宾:
孙伟杰(左一):深势科技创始人,首席执行官
张林峰(左二):深势科技创始人,首席科学家
我们和计算生物学从业者深度聊了聊|对撞派 · 圆桌实录
文章插图
Q1:AlphaFold2 对于整个学科领域来说究竟意味着什么呢?
A1:更宏观来看,AlphaFold2是一种将AI极致地与前沿科学的数据相结合,解决前沿科学问题的新的范式。
无论是在大的分子结构预测、药物筛选,还是材料、化工等别的学科上,这样的机会是广泛存在的。
将 AI 与 Science 相结合,这其实也是 AlphaFold2 所给我们带来的一个系列性的、涉及所有的 Science 行业的一个可能性。
AlphaFold2 的出现是一个捅破窗户纸的,让大家意识到原来我们的 AI 计算真正产生了一个可以和实验精度去媲美的这样的一套算法工具。