达摩院|AI for Science时代,知识何存?

达摩院|AI for Science时代,知识何存?
文章插图

AI for Science为何重要?实际上,它是比知识与数据协同范式的影响更为深远的发展方向。
“科学研究有两大基本目的:一是寻求基本规律,二是解决实际问题。在量子力学建立之时,狄拉克就预言说寻求基本规律的任务已大体完成,但因为其数学问题太复杂,用基本原理来解决实际问题非常困难。直到上世纪 50 年代电子计算机开始投入使用,以及微分方程数值方法的出现,人类才第一次大规模实现了从基本原理出发解决实际问题的能力,并由此构建起了现代工业和技术赖以生存的基础。”
“但这依然没有解决「维数灾难」问题,而机器学习恰恰是我们过去缺乏的工具。机器学习、科学计算、高性能计算三大工具的结合,将推动科学研究从小农作坊模式转变到大平台模式,即由整个科学家群体共同努力构建基础模型、基础算法和工具。这样的大平台将极大地提升整体科研的效率。”
“数百年来,以数据驱动的开普勒范式和以第一性原理驱动的牛顿范式是科学研究的两大基本范式。当下正在蓬勃兴起的 AI for Science 有可能促使两种既有范式的深度融合,激发一场新的科学革命。《达摩院 2022 十大科技趋势》将 AI for Science 列为重要趋势,无疑是看到了人工智能和传统科研结合带来的巨大潜能。我希望它能帮助推动更多科研工作者投身其中,加速这场科学革命的进程。”鄂维南院士表示。
12月28日,阿里巴巴达摩院发布2022十大科技趋势,这是达摩院连续第四年发布前沿科技趋势预测。
通过「定量发散」与「定性收敛」结合的研究方法,达摩院分析了159个领域近三年770万篇公开论文、8.5万份专利,挖掘其中热点领域及重点技术突破,深度访谈近100位科学家,提出了2022年可能照进现实的十大科技趋势,覆盖人工智能、芯片、计算和通信等领域。
这其中,达摩院首先提及的便是AI for Science。
AI for Science为何重要?实际上,它是比知识与数据协同范式的影响更为深远的发展方向。
如今,AI for Science已经从下游走向上游,也就是从劳动密集的实验数据分析转向智力密集的科学规律发现。这里的科学规律,不仅仅是指已有的,还有全新和未知的。这本就是自然而然的过程,毕竟科学规律其实就是更加凝练的实验数据归纳。而从现象到实验数据再到科学规律,人工智能对科学的影响,就是将整个过程加速了,并扩展到了人类未能触及的边界。在条件充足的领域比如生命科学,这个过程的推进更加迅速。
AI for Science面向“维数灾难”难题,这是智能被抽象出来后要面对的更高阶考验。而另一方面,面向类人智能的大模型发展已进入冷静期,人们不再为动辄万亿参数规模的新模型感到惊讶。在未来,大模型将成为基础知识库般地存在,并对端侧的小模型进行知识迁移,让小模型在此基础上去学习适应垂直环境。可以说,大模型与小模型的协同定义了新的“知识-工程”概念,如同力学工程以经典力学为参考一样,小模型也将以大模型为参照,在具体的、独特的、不确定的场景中发挥作用。
无论是AI for Science还是大小模型协同进化,都预示着知识将被重新定义。
而在知识将被重新定义之前,已有知识和数据智能的协同也在发挥重要作用。这其中,非常典型的发展趋势就包括AI助力绿色能源(比如,精准的电网功率预测)和AI助力高精度医疗导航(比如,癌症的辅助诊疗)。这些变化是源于已有知识的不完备性,也就是知识不能代表真实世界。结合了数据智能之后,技术才能触及真实世界的每一个角落。