发布者认证信息(营业执照和身份证)未完善,请登录后完善信息登录
 终于理解AI 求解偏微分方程新基准登 NeurIPS,发现 JAX 计算速度比 PyTorch 快 6 倍,LeCun 转发:这领域确实很火 - 最新消息 - 客集网
Hi,你好,欢迎来到客集网
  • 产品
  • 求购
  • 公司
  • 展会
  • 招商
  • 资讯
  • 解梦
当前位置: 首页 » 资讯 » 五金建材 找商家、找信息优选VIP,安全更可靠!
终于理解AI 求解偏微分方程新基准登 NeurIPS,发现 JAX 计算速度比 PyTorch 快 6 倍,LeCun 转发:这领域确实很火 - 最新消息
发布日期:2023-09-27 03:00:33  浏览次数:16

用 AI 求解偏微分方程,这段时间确实有点火。

但究竟什么样的 AI 求解效果最好,却始终没有一个统一的定论。

现在,终于有人为这个领域制作了一个名叫 PDEBench 的完整基准,论文登上了 NeurIPS 2022。

PDEBench 不仅能当成一个大型偏微分方程数据集,也能作为新 AI 求解偏微分方程的基准之一 ——

不少“老前辈”的预训练模型代码都能在这里找到,作为一个比对基础。

例如去年大火了一阵的 FNO,几秒钟求解出传统方法需要计算 18 个小时的偏微分方程,代码就被放进了 PDEBench 中。

这个新基准一出,LeCun 也激情转发:这领域确实很火。

所以,AI 求解偏微分方程的优势是什么,这一基准具体提出了哪些评估方法?

为啥用 AI 求解偏微分方程?

偏微分方程(PDE,Partial Differential Equation),是一个生活中常见的方程。

包括预报天气、模拟飞机空气动力、预测疾病传播模型,都会用到这个方程。

目前北大数学系“韦神”韦东奕的研究方向之一,就是流体力学中的数学问题,其中就包括偏微分方程中的 Navier-Stokes 方程。

所以,为啥要用 AI 来求解偏微分方程?

训练 AI 的本质,是找到一种尽可能逼近真实结果的模型。

用 AI 求解偏微分方程,其实也是找到一种代理模型,来模拟偏微分方程模型。

代理模型指找到一种近似模型,在计算量更小的同时,确保计算结果与原来的偏微分方程尽可能相似。

这与传统的数值方法求解偏微分方程有着异曲同工之妙。

传统方法往往需要通过将连续问题离散化(类似在一个连续函数上切割出很多小点),来对方程进行近似求解。

然而,传统的数值方法非常复杂,计算量也很大;采用 AI 方法训练出来的模型,却模拟得又快又好 ——

继 2017 年华盛顿大学提出 PDE-FIND 后,2018 年谷歌 AI 又提出了数据驱动求解偏微分方程的方法,都比传统方法要快上不少,让更多人开始关注到 AI 求解偏微分方程这一领域。

2019 年,布朗大学应用数学团队提出一种名叫 PINN (物理激发的神经网络)的方法,彻底打开了 AI 在物理学领域的广泛应用。

这篇论文在理论上虽然没有 PDE-FIND 和谷歌 AI 的方法突破性强,却给出了非常完整的代码体系,使得开发人员很容易上手,让更多研究者开发出了不同的 PINN,如今它也成为 AI 物理最常见的框架和词汇之一。

△PINN

去年加州理工大学和普渡大学团队发表的一项研究,更是将偏微分方程计算时间从传统求解的 18 个小时降低为 1 秒钟。

这篇论文提出了一种名为 FNO (傅里叶神经算子)的方法,基于傅里叶变换给神经网络加上“傅里叶层”,进一步节省了近似模拟算子的计算量。

除此之外,也有不少研究人员通过训练一些经典 AI 模型,来求解偏微分方程,如 U-Net 等。

不过,无论是 FNO、U-Net 还是 PINN,都还是基于各自给出的基准来评估 AI 计算偏微分方程的效果。

有没有一个更统一、更通用的框架来评估这个领域的新突破?

更全面的 AI 偏微分方程基准

在这样的背景下,研究人员提出了一种名叫 PDEBench 的基准。

首先是基准中包含的数据集,目前这些数据集已经全部归纳到 GitHub 中:

这里面包括不少经典偏微分方程问题,如 Navier-Stokes 方程,达西流模型、浅水波模型等等。

随后,PDEBench 提出了几个指标,来从不同角度更全面地对 AI 模型进行评估:

最后,PDEBench 还包含了几种经典模型的预训练模型代码,并将它们作为评估其他模型的基准之一,包括上述提到的 FNO、U-Net、PINN 等。

例如研究团队将这几个模型分别基于各数据集进行了训练,得出的均方根误差(RMSE)如下,也说明它们在不同偏微分方程问题上的表现并不一样:

除此之外,团队还将数据格式进行了统一,同时针对 PDEBench 的可扩展性进行了优化,因此任何人都能参与进来,给这一基准加入更多的数据集、或是更多基准模型。

值得注意的是,团队试了试分别在 PyTorch 和 JAX 两种框架上运行几种预训练模型,发现 JAX 的速度大约是 PyTorch 的 6 倍。

看来以后搞相关研究可以试试 JAX 框架了。

作者介绍

作者们来自德国斯图加特大学,欧洲 NEC 研发中心,还有澳大利亚联邦科学与工业研究组织(CSIRO)旗下的 Data61 数字创新中心。

Makoto Takamoto,欧洲 NEC 研发中心高级研究员,毕业于京都大学,研究方向是图像处理、图神经网络和科学机器学习。

Timothy Praditia,斯图加特大学博士研究生,研究兴趣是开发基于数据驱动和先验物理知识的神经网络模型。

论文地址:

/abs/

PDEBench 地址:

/pdebench/PDEBench

参考链接:

[1]/Mniepert/status/

[2].com/s/Rbw2QFavSn8N7pPGS05o6w

本文来自微信公众号:量子位 (ID:QbitAI),作者:萧箫

VIP企业最新发布
最新VIP企业
背景开启

客集网是一个开放的平台,信息全部为用户自行注册发布!并不代表本网赞同其观点或证实其内容的真实性,需用户自行承担信息的真实性,图片及其他资源的版权责任! 本站不承担此类作品侵权行为的直接责任及连带责任。

如若本网有任何内容侵犯您的权益,请联系 QQ: 1130861724

网站首页 | 信息删除 | 付款方式 | 关于我们 | 联系方式 | 使用协议 | 版权隐私 | 网站地图 (c)2014-2024 Rights Reserved 鄂公网安备42018502007153 SITEMAPS 联系我们 | 鄂ICP备14015623号-21

返回顶部