微信扫一扫,关注公众号

  • 科技行者

  • 算力行者

见证连接与计算的「力量」

首页 中山大学开发PASSAT:让AI预测天气像物理学家一样思考

中山大学开发PASSAT:让AI预测天气像物理学家一样思考

2025-07-09 09:39
分享至:
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2025-07-09 09:39 科技行者

这项突破性的研究来自中山大学的郑佳琦、凌青教授团队,以及深圳市气象创新研究院的冯业荣博士,他们的研究成果发表于2025年5月的arXiv预印本平台。有兴趣深入了解的读者可以通过论文编号arXiv:2505.04918v1访问完整论文,相关代码和模型也已在GitHub开源(https://github.com/Yumenomae/PASSAT_5p625)。

说起天气预报,我们每天都在关注,但很少有人知道这背后的科学原理有多复杂。传统的天气预报就像一个经验丰富的老师傅,依靠复杂的物理公式来推算未来的天气变化,但这种方法计算量巨大,就像用算盘做复杂运算一样费时费力。近年来,人工智能技术的兴起为天气预报带来了新的可能性,就像给老师傅配备了计算机,预报速度大大提升。

然而,现有的AI天气预报模型存在一个关键问题:它们要么像一个只会死记硬背的学生,完全依赖历史数据进行预测,忽略了天气变化的物理规律;要么像一个只会纸上谈兵的理论家,虽然懂得物理原理,却忽略了地球是圆的这一基本事实,在处理数据时就像把橘子皮强行摊平一样,产生了严重的扭曲。

正是基于这些挑战,中山大学的研究团队开发了PASSAT模型。这个名字来自"Physics-ASSisted And Topology-informed"的缩写,顾名思义,它既懂得物理规律,又充分考虑了地球的球面特性。这就像培养了一个既有理论知识又有实践经验的天气预报专家,能够更准确地预测未来的天气变化。

在5.625度分辨率的ERA5数据集上的测试结果显示,PASSAT不仅超越了目前最先进的深度学习天气预报模型,甚至在某些指标上超过了欧洲中期天气预报中心的业务化数值天气预报模型IFS T42。这意味着,这个AI模型已经具备了接近甚至超越传统专业天气预报系统的能力。

一、天气预报的两大阵营:物理派与数据派的较量

要理解PASSAT的创新之处,我们首先需要了解天气预报领域的两大流派。第一个流派是传统的数值天气预报,它就像一个严谨的物理学家,试图用精确的数学公式来描述大气中每一个分子的运动。这种方法基于牛顿力学、热力学等基本物理定律,通过求解复杂的偏微分方程组来预测天气变化。

想象一下,如果你要预测一颗篮球从高处落下后的轨迹,物理学家会告诉你可以用重力加速度公式来精确计算。天气预报中的数值模式就是这样工作的,只不过它处理的不是一颗篮球,而是整个大气层中无数个"空气块"的运动。每个空气块都遵循物理定律:受到重力、气压梯度力、科里奥利力等多种力的作用,同时还要考虑水汽凝结、辐射传输等复杂过程。

这种方法的优势在于它有坚实的物理基础,就像有了牢固的地基,预报结果通常比较可靠。但问题是,大气中的物理过程极其复杂,许多小尺度现象(比如云的形成、湍流等)很难用简单的公式完全描述。这就像试图用数学公式描述一群鸟的飞行轨迹一样,理论上可行,但实际操作起来异常困难。

第二个流派是近年来兴起的数据驱动方法,特别是深度学习模型。这些模型就像一个记忆力超强的学生,通过分析大量历史天气数据来寻找规律。它们不需要了解复杂的物理公式,而是通过神经网络自动发现数据中的模式。

这种方法的最大优势是速度快。一旦训练完成,深度学习模型可以在几分钟内完成传统数值模式需要几小时才能完成的计算,就像从算盘升级到了超级计算器。近年来,谷歌的GraphCast、华为的Pangu、英伟达的FourCastNet等模型都在这个方向上取得了令人瞩目的成果。

但是,纯粹的数据驱动方法也有明显的局限性。它们就像一个只会背答案的学生,在面对训练数据中没有出现过的极端天气情况时,往往表现不佳。更重要的是,这些模型通常将地球表面简化为平面网格进行处理,这就像把地球仪强行压扁成平面地图一样,必然会产生扭曲。

研究团队发现,这种扭曲在高纬度地区尤其严重。想象一下世界地图,你会发现靠近南北极的格陵兰岛看起来比实际大得多,这就是将球面投影到平面时产生的扭曲。同样的问题也存在于AI天气预报模型中:靠近极地的天气模式会被严重扭曲,影响预报的准确性。

二、PASSAT的巧妙设计:让AI同时掌握物理学和地理学

面对传统方法的困境,研究团队提出了一个巧妙的解决方案:既然物理派和数据派各有所长,为什么不让它们强强联合呢?PASSAT就是这样一个"混血儿",它试图结合两个流派的优势,同时避免各自的缺陷。

PASSAT的核心思想是将天气演变分解为两个主要过程。第一个是平流过程,就像河水冲刷着河床上的沙石一样,大气中的风会携带着温度、湿度等天气要素四处流动。这个过程可以用经典的平流方程和纳维-斯托克斯方程来精确描述,就像我们可以用物理公式计算河水的流速一样。

第二个过程是地气相互作用,这就复杂得多了。它包括太阳辐射加热、云的形成与消散、地表与大气之间的热量交换等等,就像一个巨大的化学实验室,里面发生着无数复杂的反应。这些过程很难用简单的数学公式完全描述,就像你很难用公式预测一锅汤的最终味道一样。

对于第一个过程,PASSAT选择相信物理学。它使用经典的偏微分方程来计算空气的流动,就像一个严谨的物理学家一样。但对于第二个过程,PASSAT则采用了深度学习的方法,让神经网络通过分析历史数据来学习这些复杂的相互作用规律。

更巧妙的是,PASSAT还解决了地球球面的问题。传统的AI模型将天气数据投影到平面网格上进行处理,就像用平面地图来导航一样,会产生扭曲。PASSAT则直接在球面上进行计算,就像使用真正的地球仪一样,避免了投影带来的误差。

具体来说,PASSAT使用了球面图神经网络。想象一下,如果你要在地球仪上标记各个城市之间的关系,你会发现相邻城市之间的实际距离和在平面地图上看到的距离可能差别很大。球面图神经网络就是考虑了这种真实的球面距离关系,让AI能够更准确地理解地球上不同地点之间的相互影响。

这种设计的好处是显而易见的。在处理极地地区的天气时,传统方法可能会认为相距很远的两个点实际上是相邻的(因为平面投影的扭曲),而PASSAT则能正确理解它们在球面上的真实关系。这就像使用GPS导航时,如果软件理解地球是圆的,就能给出更准确的路径规划。

三、技术细节:PASSAT如何在球面上"思考"天气

为了让PASSAT能够在球面上进行计算,研究团队需要解决许多技术挑战。首先是如何在球面上表示天气数据。想象一下,如果你要在篮球表面贴上许多小标签来记录不同位置的温度,你需要一个系统的方法来确定每个标签的位置和它们之间的关系。

PASSAT将地球表面视为一个单位球面,并在这个球面上建立了一个图神经网络。网络中的每个节点代表地球表面的一个位置,就像在地球仪上插上的一枚小旗帜。节点之间的连接则根据它们在球面上的实际距离来确定,距离越近的节点连接越紧密,就像朋友圈中关系密切的人更容易相互影响一样。

在5.625度分辨率的数据集上,PASSAT总共设置了2048个节点,均匀分布在地球表面。这些节点之间的连接关系通过Haversine公式计算,这个公式专门用于计算球面上两点之间的最短距离,就像计算从北京到纽约的最短飞行路线一样。

接下来是如何在球面上求解物理方程。传统的平流方程在平面直角坐标系中比较容易处理,但在球面坐标系中就复杂多了。这就像在平地上画直线很容易,但在球面上"直线"实际上是弧线一样。

研究团队将平流方程改写为球面坐标形式。在这个坐标系中,任何一点的位置用经度和纬度来表示,就像我们在地图上标记地理位置一样。速度场也分解为沿经线方向和纬线方向的分量,分别对应南北方向和东西方向的风速。

特别值得注意的是,在球面坐标系中,同样的风速在不同纬度的表现是不同的。在赤道附近,东西方向的风可以覆盖很大的距离,但在极地附近,同样的角速度对应的实际距离要小得多。这就像在地球仪的不同位置转动同样的角度,在赤道附近移动的距离比在极地附近大得多。PASSAT在处理这种几何效应时引入了cosθ项(θ是纬度),确保计算结果符合球面几何学的规律。

对于纳维-斯托克斯方程,PASSAT同样将其扩展到球面坐标系。这个方程描述了流体(在这里是空气)的运动规律,考虑了各种力的作用:气压梯度力推动空气从高压区流向低压区,科里奥利力因为地球自转而产生,粘性力则阻碍空气的流动。在球面坐标系中,这些力的表达式都变得更加复杂,需要考虑球面的曲率效应。

四、神经网络架构:让AI学会复杂的地气相互作用

虽然PASSAT使用物理方程来处理平流过程,但对于复杂的地气相互作用,它还是需要依靠神经网络的学习能力。这部分的设计就像为AI配备了一个专门的"天气感知器",能够识别和预测各种复杂的大气物理化学过程。

PASSAT的神经网络部分采用了球面图神经网络架构,包含一个主干网络和两个分支。这种设计就像一个经验丰富的气象专家,有一套基础的观测和分析能力(主干网络),同时还有两个专门的技能:一个是估算初始风场(速度分支),另一个是评估地气相互作用的强度(相互作用分支)。

主干网络的作用是提取和处理输入的天气数据,就像一个数据预处理专家,将原始的温度、气压、风速等信息转换为神经网络能够理解的特征表示。这个网络通过多层的图卷积操作,让每个位置的信息能够与周围相邻位置进行交流,就像邻里之间互通消息一样。

速度分支负责估算每个天气变量的初始速度场。这里的"速度"不是指风速,而是指这些天气变量本身的变化趋势。比如,某个区域的温度是在上升还是下降,湿度是在增加还是减少。这些信息对于后续的平流计算至关重要,就像你需要知道河水的流向才能预测树叶会飘向哪里一样。

相互作用分支则专门负责估算地气相互作用的效应。这是整个系统中最具挑战性的部分,因为它需要模拟大气中各种复杂的物理化学过程:太阳辐射如何加热地表,海洋如何影响大气湿度,云层如何影响辐射平衡等等。这些过程的复杂程度就像一个巨大的化学反应网络,传统的物理方程很难完全描述,但神经网络可以通过学习历史数据中的模式来近似这些复杂关系。

神经网络的基本构建模块采用了节点-边连接和节点-节点聚合的设计。这种设计的核心思想是让信息能够在网络中高效地传播。节点-边连接负责在相邻位置之间传递信息,就像邻居之间的对话;节点-节点聚合则负责整合来自多个方向的信息,就像一个人综合考虑多个朋友的建议来做决定。

特别重要的是,整个神经网络都是在球面拓扑结构上运行的。这意味着网络中每个节点的"邻居"关系都是根据球面距离来确定的,而不是平面距离。这种设计确保了AI模型能够正确理解地球表面不同位置之间的真实空间关系,避免了传统方法中因为平面投影而产生的扭曲。

五、时间积分方案:让预测一步步走向未来

有了物理方程和神经网络,PASSAT还需要一个合理的时间推进方案,就像制定一个详细的行程计划,让预测能够一步步从当前时刻走向未来。这个过程中涉及到许多精妙的技术细节。

PASSAT采用了自回归的预测方式,就像连续拍照记录一个过程一样。每隔一个时间步长(在这里是6小时),PASSAT会输出一次预测结果,然后将这个结果作为下一步预测的输入。这种方法允许模型进行长期预测,可以一直预测到144小时(6天)后的天气情况。

但在每个6小时的大时间步内,PASSAT还需要进行更精细的时间积分。研究团队发现,物理方程的数值求解对时间步长非常敏感,就像炒菜时火候的把握一样,时间步太大可能导致计算不稳定,时间步太小又会大大增加计算量。

经过仔细的测试和优化,PASSAT选择了0.2小时作为内部积分的时间步长。这意味着在每个6小时的预测周期内,模型会进行30次精细的物理计算,确保数值解的稳定性和准确性。这就像制作一部动画电影,需要足够密集的帧数才能保证动作的连贯性。

然而,这种精细的时间积分带来了一个新的挑战:计算效率。如果神经网络需要在每个0.2小时的时间步都运行一次来估算地气相互作用,那么计算量将会非常巨大,训练过程也会变得非常缓慢。

为了解决这个问题,研究团队采用了一个巧妙的策略:神经网络只在每小时运行一次,估算出的地气相互作用效应在接下来的一小时内保持不变。这种近似是合理的,因为地气相互作用相比于大气流动来说变化较为缓慢,就像海洋的温度变化比波浪的起伏要慢得多一样。

在具体的算法实现中,PASSAT使用了欧拉方法进行数值积分。虽然这不是最高精度的积分方法,但它简单稳定,适合在深度学习框架中实现。研究团队还对初始速度场进行了约束,将其限制在[-0.005, 0.005]的范围内,这样可以确保数值计算的稳定性,避免出现不合理的极值。

六、训练策略:教会AI理解天气的艺术

训练PASSAT就像培养一个气象专家一样,需要精心设计的课程和练习。整个训练过程使用了1979年到2015年的ERA5再分析数据,这是目前质量最高、覆盖最全面的全球大气数据集之一,可以说是气象数据中的"黄金标准"。

训练数据包含了五个关键的天气变量:2米高度的温度(我们日常感受到的气温)、850百帕压强层的温度(代表低层大气状况)、500百帕压强层的位势高度(反映大气环流形势)、以及10米高度的东西向和南北向风速。这些变量就像描述一个人的身高、体重、年龄等基本特征一样,能够相当全面地刻画大气的基本状态。

PASSAT的训练采用了自回归方式,就像教一个学生逐步解决连续的问题一样。模型需要学会根据当前的天气状况,预测未来6小时、12小时、18小时和24小时的天气变化。这种训练方式确保了模型不仅能进行短期预测,还能维持长期预测的准确性。

特别值得注意的是PASSAT的损失函数设计。除了常规的预测误差损失外,研究团队还引入了三个正则化项来约束初始速度场。第一个正则化项限制速度场的幅值,防止出现不合理的极大风速;第二个和第三个正则化项则约束速度场的空间梯度,确保风场的变化是平滑的,避免出现不现实的急剧变化。

这种设计的必要性可以用一个类比来理解:如果你在画一幅风景画,不仅要确保画面整体协调(预测准确),还要确保画笔的使用合理(速度场约束),不能出现突兀的笔触或者不合理的色彩跳跃。

训练过程使用了AdamW优化器,这是目前深度学习中最流行的优化算法之一,相当于给学习过程配备了一个聪明的个人教练。学习率采用余弦退火策略,从1e-3逐渐降低到3e-7,这就像学习过程中逐渐减小步伐,在接近最优解时更加小心谨慎。

整个训练在四块GeForce RTX 2080显卡上进行,总批量大小为8,训练50个周期。虽然这个配置相比于一些大型AI模型来说并不算豪华,但对于PASSAT这样的专业化模型来说已经足够。这也体现了PASSAT设计的另一个优势:相对较小的模型规模使得它更容易部署和使用。

七、实验结果:PASSAT的优异表现

当PASSAT接受严格的测试时,它展现出了令人印象深刻的性能。研究团队使用2017年和2018年的数据作为测试集,这相当于让PASSAT参加一场"盲考",预测它从未见过的天气情况。

在与其他先进AI模型的比较中,PASSAT在几乎所有指标上都取得了最佳成绩。无论是温度、风速还是位势高度的预测,PASSAT都表现出了更高的准确性和更强的稳定性。特别值得关注的是,PASSAT在长期预测(72小时以上)中的优势更加明显,这对于实际的天气预报应用来说非常重要。

与传统的数值天气预报模型相比,PASSAT的表现同样令人惊喜。在大多数情况下,PASSAT的预测精度超过了IFS T42模型,要知道IFS T42是欧洲中期天气预报中心的业务化产品,在全世界气象部门中广泛使用。更重要的是,PASSAT的计算速度比传统数值模式快得多,这在实际应用中具有巨大的价值。

当然,最高精度的IFS T63模型仍然在某些指标上略胜一筹,但这个模型的分辨率更高(1.9度 vs 5.625度),计算代价也大得多。考虑到计算效率和预测精度的平衡,PASSAT展现出了很好的性价比。

为了验证物理约束和球面拓扑的重要性,研究团队还进行了详尽的消融实验。他们分别测试了没有物理约束的PASSAT(纯数据驱动)、没有球面拓扑的PASSAT(使用平面投影)、以及两者都没有的版本。

结果清楚地表明,物理约束和球面拓扑都对模型性能有重要贡献。特别有趣的是,不同的天气变量对这两种信息的依赖程度不同。温度预测从物理约束和拓扑信息中获得的改善相当,而风速和位势高度的预测则更多地受益于球面拓扑信息。这个发现为我们理解不同天气要素的预测机制提供了有价值的洞察。

从可视化结果来看,PASSAT的预测在空间分布上非常接近真实观测,无论是大尺度的环流形势还是中小尺度的天气系统,都能得到较好的再现。特别是在处理复杂的天气模式(如锋面、气旋等)时,PASSAT展现出了良好的形态保持能力,这对于实际的天气预报应用来说至关重要。

八、突破与局限:PASSAT的光明前景与现实挑战

PASSAT的成功代表了AI天气预报领域的一个重要里程碑。它首次成功地将物理约束、球面拓扑和深度学习技术有机结合,创造出了一个既有理论基础又有实践价值的混合模型。这种设计理念对于其他地球科学应用领域也具有重要的借鉴意义。

从技术创新的角度来看,PASSAT解决了长期困扰AI天气预报的两个核心问题。首先是物理一致性问题:通过显式地求解物理方程,PASSAT确保其预测结果符合基本的物理定律,这大大提高了预测的可靠性,特别是在面对极端天气事件时。其次是几何扭曲问题:通过直接在球面上进行计算,PASSAT避免了平面投影带来的系统性误差,这在全球尺度的预测中特别重要。

PASSAT的另一个重要贡献是展现了混合建模的巨大潜力。通过让AI和物理模型各自发挥所长,PASSAT既保持了计算效率,又确保了预测质量。这种思路可能会启发更多类似的研究,推动整个领域向着更加智能和可靠的方向发展。

然而,PASSAT目前也存在一些局限性,这些都是未来研究需要关注的方向。首先是分辨率问题。当前的PASSAT在5.625度分辨率上训练和测试,这对于全球尺度的预测来说是合适的,但对于区域性的精细预报还有待提高。更高分辨率意味着需要处理更多的数据和更复杂的物理过程,这对计算资源和模型设计都提出了更高要求。

其次是天气变量的覆盖范围。目前PASSAT主要关注五个基本的天气变量,但实际的天气系统还涉及降水、云量、辐射等多个要素。如何将这些变量纳入模型框架,并保持整体的一致性和稳定性,是一个值得深入研究的问题。

第三是极端天气事件的处理能力。虽然PASSAT在常规天气预报中表现优异,但对于台风、暴雨、热浪等极端事件的预测能力还需要进一步验证。这些事件往往涉及复杂的多尺度相互作用,需要模型具备更强的泛化能力。

从实际应用的角度来看,PASSAT还需要考虑如何与现有的气象业务系统集成。虽然它在计算效率上比传统数值模式有明显优势,但要真正替代或者补充现有系统,还需要经过严格的业务化验证和优化。

九、未来展望:AI天气预报的新时代

PASSAT的成功预示着AI天气预报正在进入一个新的发展阶段。传统的"要么纯物理、要么纯数据"的对立思维正在被"物理+数据"的协同思维所取代。这种转变不仅仅是技术路线的改变,更代表了我们对复杂系统建模认识的深化。

在短期内,我们可能会看到更多类似PASSAT的混合模型出现。不同的研究团队可能会尝试不同的物理约束方式、不同的神经网络架构、不同的时空分辨率组合,从而推动整个领域的快速发展。这种百花齐放的局面对于技术进步是非常有利的。

中期来看,AI天气预报模型可能会在以下几个方向取得突破:更高的时空分辨率、更全面的物理过程覆盖、更强的极端事件预测能力、以及更好的不确定性量化。这些改进将使AI模型能够更好地服务于实际的气象业务需求。

长期而言,AI天气预报可能会重新定义整个气象科学的研究范式。通过AI模型,我们可能会发现一些传统物理理论难以解释的大气现象,从而推动大气科学理论的发展。同时,AI模型的快速计算能力也可能使得实时的高分辨率预报成为可能,为防灾减灾、农业生产、能源管理等领域带来革命性的改变。

当然,这个美好前景的实现还需要解决许多挑战。数据质量和可获得性仍然是制约因素,计算资源的需求也会随着模型复杂度的提高而增加。更重要的是,如何确保AI模型的预测是可解释、可信赖的,这对于关系到公共安全的天气预报来说至关重要。

PASSAT为我们展示了一条可行的技术路径:通过巧妙地结合物理知识和机器学习技术,我们可以构建既高效又可靠的预测模型。这种思路不仅适用于天气预报,也可能启发其他地球科学领域的研究,如海洋预报、气候预测、地震预警等。

说到底,PASSAT的故事告诉我们,在人工智能时代,我们不需要抛弃传统的科学知识,而是要学会如何让AI与传统知识更好地结合。正如PASSAT让AI学会了像物理学家一样思考天气,未来的AI系统可能会在更多领域展现出这种"知识+智能"的强大力量。这项来自中山大学的研究为我们描绘了一个充满希望的未来图景,在这个图景中,科学知识与人工智能将携手为人类创造更大的价值。

Q&A

Q1:PASSAT模型是什么?它和传统天气预报有什么不同? A:PASSAT是中山大学开发的AI天气预报模型,它的独特之处在于既使用物理方程(像传统预报一样)又运用深度学习技术,并且直接在地球球面上计算而不是平面投影。这让它比纯AI模型更符合物理规律,比传统数值模式计算更快速。

Q2:为什么要在球面上计算而不是平面上? A:就像把地球仪压成平面地图会产生扭曲一样,传统AI模型在平面上处理天气数据也会产生误差,特别是在高纬度地区。PASSAT直接在球面上计算,避免了这种几何扭曲,让预测更准确,尤其是全球范围的天气预报。

Q3:PASSAT的预测准确度如何?普通人能用到吗? A:在测试中,PASSAT在多数指标上超过了目前最先进的AI天气模型,甚至在某些方面超过了欧洲业务化预报系统IFS T42。不过它目前还是科研成果,需要进一步验证和优化才能应用到实际的天气预报服务中,普通用户暂时还无法直接使用。

分享至
0赞

好文章,需要你的鼓励

推荐文章
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-