北大数院校友成果登数学四大顶刊,偏微分方程突破,可用于W-GAN

梦晨萧箫发自凹非寺
量子位报道|公众号QbitAI
数学界神秘的偏微分方程领域 , 再次被突破了!
来自中科大的陈世炳教授等人 , 开发了一套全新的数学方法 , 直接打破了领域内专家20多年来的既有认知 。
相关论文已被数学四大顶刊之一《数学年刊》接受 , 将在接下来的某一期正式发表 。
北大数院校友成果登数学四大顶刊,偏微分方程突破,可用于W-GAN
文章图片
这篇论文突破了一个关键的非线性偏微分方程 , 它与我们机器学习中熟悉的最优传输理论息息相关 。
最优传输理论 , 类似“找出把物品从A运到B的最佳方法” , 用几何方法来衡量概率分布的距离、给概率分布建模 。 像机器学习中的W-GAN , 就属于最优传输问题 。
让丘成桐院士1982年获菲尔茨奖的卡拉比猜想证明 , 就与这个方程相关 。
2018年的菲尔茨奖 , 再次颁给了在这个方程、以及最优传输问题上做出贡献的AlessioFigalli 。
究竟是什么方程如此关键 , 这次数学家们又做出了什么重要突破?
一起来看看 。
最优传输“逃不开”的方程
这个关键的非线性偏微分方程 , 名叫蒙日-安培方程 。
它的提出 , 要从18世纪法国数学家加斯帕尔·蒙日(GaspardMonge)对最优传输问题的研究说起 。
最初 , 这个理论主要用来解决不连续分布的物体运输问题 , 类似于搬箱子:
将ABC初始地的箱子运到CDE目的地 , 确保每个目的地有1个箱子 , 求最佳的运输方法 。
后来 , 蒙日开始思考一类问题:对于连续分布的物体 , 例如一团沙子 , 用什么方法将它运输到等体积的洞中 , 才是最省力的?
他发现 , 有不少这类连续情形下的最优传输问题 , 都能转化为一类方程的边值问题 。
蒙日之后 , 安培进一步对它做了深入研究 , 方程也被命名为蒙日-安培方程:
北大数院校友成果登数学四大顶刊,偏微分方程突破,可用于W-GAN
文章图片
△蒙日-安培方程一般形式
这个方程要怎么理解呢?
举个例子 , 我们常见的“以图搜图”功能 , 其实就与蒙日-安培方程相关 。
在通过图像匹配进行搜索时 , “搜图”功能会将输入图像与网上的图像进行一个对比 。 以黑白照片为例 , 可以将颜色深度看成是一个概率分布(白色为0 , 黑色为1) 。
因此 , 两张照片匹配的问题 , 可以看成是两个概率分布的匹配问题 。
1991年 , YannBrenier在研究中发现 , 这类连续概率分布的匹配问题 , 对应地可以写成一个梯度映射y=Du(x),其中u是一个凸函数,且满足
北大数院校友成果登数学四大顶刊,偏微分方程突破,可用于W-GAN
文章图片
根据黑塞矩阵(HessianMatrix) , 有:
北大数院校友成果登数学四大顶刊,偏微分方程突破,可用于W-GAN
文章图片
其中λ是u的黑塞矩阵的特征根 , 是λ的k次初等多项式:
北大数院校友成果登数学四大顶刊,偏微分方程突破,可用于W-GAN
文章图片
当k=1时 , 它就是我们熟悉的Laplace方程;当k=n时 , 它就是蒙日-安培方程 。
近几年 , 深度学习飞速发展 , 最优传输问题随之成为研究热点 , 对蒙日-安培方程的研究也进一步兴起 。
名噪一时的WassersteinGAN , 用求Wasserstein距离的方法改善了GAN的稳定性 。
求解Wasserstein距离正是一个最优传输问题 , 需要用到蒙日-安培方程 。
纽约州立大学石溪分校的顾险峰教授认为 , 深度学习用到的数据可以看成是高维数据空间中一个低维流形上的概率分布 。
北大数院校友成果登数学四大顶刊,偏微分方程突破,可用于W-GAN
文章图片
GAN所学习的正是这个流形的结构 , 用编码、解码映射来表示 , 就将GAN隐空间中的数据分布转换成了几何上的最优传输问题 。