微信扫一扫,关注公众号

  • 科技行者

  • 算力行者

见证连接与计算的「力量」

首页 阿贡实验室AERIS系统:让AI像天气预报员一样预测地球未来90天

阿贡实验室AERIS系统:让AI像天气预报员一样预测地球未来90天

2025-09-30 10:50
分享至:
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2025-09-30 10:50 科技行者

这项由美国阿贡国家实验室的Vaino Hatanpaa、Eugene Ku、Jason Stock等多位科学家领导的突破性研究发表于2025年9月,详细介绍了名为AERIS的地球系统模型。这个革命性的AI系统能够像经验丰富的天气预报员一样,准确预测未来90天内地球大气的变化。有兴趣深入了解技术细节的读者可以通过arXiv:2509.13523v1访问完整论文。

天气预报一直是人类与自然博弈中的重要工具,关系到农业生产、灾害防范和日常生活的方方面面。传统的天气预报系统就像一台复杂的计算器,需要输入无数的物理方程式来模拟大气的运动。这种方法虽然科学严谨,但面临着巨大的挑战:计算量庞大、预报精度有限,而且很难处理那些难以用方程描述的复杂现象。

阿贡实验室的研究团队提出了一个全新的思路:既然人类能够通过观察历史天气数据学会预报,那么AI系统是否也能通过"观察"海量历史数据来学会预测未来呢?这就像训练一个天才学徒,让它通过研究过去40年的天气记录,掌握大气运动的规律和奥秘。

一、AI学会"看懂"地球大气的密码

要让AI系统学会预测天气,首先要教会它如何理解地球大气这个复杂的系统。研究团队选择了一个叫做Swin Transformer的AI架构作为AERIS的"大脑"。这个架构的工作原理有点像人类观察风景的方式:我们不会一次性看整个天空,而是先观察局部区域,然后逐渐将这些局部信息整合起来形成完整的画面。

Swin Transformer采用了"窗口注意力"机制,将全球大气数据分割成一个个小窗口,每个窗口大小约为30×30或60×60个像素点。这就像把地球表面划分成无数个小方格,AI系统先仔细观察每个方格内的天气变化,然后再将这些局部信息拼接起来理解全球天气的整体态势。更巧妙的是,这些观察窗口在不同的处理层中会发生位移,确保AI能够捕捉到跨越不同区域的天气现象。

为了让AI更好地理解天气数据,研究团队采用了一种叫做"扩散模型"的训练方法。这种方法的工作原理很有趣:系统首先学习如何从纯随机的噪声中逐步"清理"出真实的天气图像。这个过程就像一位艺术家从模糊的草图开始,逐步添加细节,最终完成一幅精美的画作。通过这种训练方式,AI不仅学会了预测天气,还能够生成多种可能的天气情景,为决策者提供不确定性评估。

二、超越传统计算的并行处理革命

训练如此复杂的AI系统需要enormous计算资源,这就像同时指挥成千上万名厨师协作完成一道复杂的大餐。传统的并行计算方法就像让厨师们排成一条长龙,一个接一个地完成各自的任务,效率有限。研究团队创新性地提出了SWiPe(Sequence-Window Parallelism)并行策略,这种方法更像是将厨师们分成多个小组,每个小组负责处理特定的食材,同时各组之间协调配合。

SWiPe的核心思想是利用Swin Transformer的窗口结构特性。由于每个注意力窗口相对独立,系统可以将不同的窗口分配给不同的计算单元并行处理。这就像将一幅巨大的拼图分发给多个人同时拼装,每个人负责自己的区域,最后再将结果组合起来。这种方法大大减少了计算单元之间需要传递的数据量,提高了整体效率。

更进一步,SWiPe将窗口并行与现有的序列并行、流水线并行和数据并行技术巧妙结合。序列并行就像将一本书的章节分给不同的人同时阅读,流水线并行则像工厂装配线一样让数据依次通过不同的处理阶段,而数据并行则是让多个处理器同时处理不同批次的数据。四种并行策略的协调配合,让AERIS能够在Aurora超级计算机的10,080个节点上稳定运行,实现了前所未有的计算规模。

三、从13亿到800亿参数的AI气象学家

AERIS系统提供了多个不同规模的模型版本,参数数量从13亿到800亿不等。这些参数可以理解为AI系统的"知识存储量",参数越多,系统能够记住和理解的天气模式就越复杂。最小的13亿参数版本就像一位有一定经验的气象预报员,能够处理常见的天气现象;而800亿参数的版本则像是一位阅历丰富的资深专家,能够识别和预测极其复杂的大气动力学过程。

研究团队在训练这些模型时使用了欧洲中期天气预报中心(ECMWF)提供的ERA5再分析数据集,这是一个包含了过去40年全球天气观测数据的巨大宝库。数据的空间分辨率达到0.25度,相当于在赤道附近每隔约30公里就有一个观测点。这种高分辨率数据使得AI系统能够捕捉到细致入微的天气变化,包括局地的温度波动、风速变化和湿度分布。

训练过程采用了物理加权的损失函数,这意味着系统在学习时会更加重视那些对天气预报更为关键的变量。比如,接近地面的温度和风速变化对人类活动影响更大,因此在训练过程中被赋予更高的权重。这种设计确保了AI系统能够优先学会预测那些最重要的天气要素。

四、Aurora超级计算机上的性能奇迹

在Aurora超级计算机上,AERIS创造了令人震惊的性能记录。这台位于阿贡国家实验室的超级计算机拥有10,080个计算节点,每个节点配备6块英特尔Max 1550 GPU,总共超过12万个GPU单元。AERIS在这个庞大的计算平台上实现了10.21 ExaFLOPS的持续计算性能,峰值性能更是达到了11.21 ExaFLOPS。

要理解这个数字的意义,我们可以这样比较:如果一台普通的个人电脑每秒能够进行10亿次计算,那么AERIS系统的计算能力相当于1000万台这样的电脑同时工作。这种计算能力的实现不仅依赖于硬件的强大,更重要的是SWiPe并行策略的巧妙设计。

系统在扩展性测试中表现优异,弱扩展效率达到95.5%,强扩展效率为81.6%。弱扩展测试就像测试一支军队在人数增加时能否保持同样的行军速度,而强扩展测试则是看固定的任务能否通过增加人手来更快完成。AERIS在两方面的出色表现证明了其设计的优越性。

研究团队还在芬兰的LUMI超级计算机上进行了验证实验,虽然规模较小(1,008个节点),但同样取得了0.54 ExaFLOPS的性能,证明了AERIS的跨平台适应能力。

五、预测精度的全面提升

AERIS在天气预报精度方面的表现令人印象深刻。在中期天气预报(1-14天)的测试中,AERIS与两个重要的基准系统进行了对比:一个是谷歌DeepMind开发的GenCast扩散模型,另一个是欧洲中期天气预报中心的IFS集合预报系统,后者是目前业界广泛使用的数值天气预报标杆。

测试结果显示,AERIS在多项关键指标上都优于或持平于这些先进系统。在纬度加权均方根误差(RMSE)这个衡量预报准确性的核心指标上,AERIS的表现与GenCast不相上下,在某些时间段甚至略胜一筹。在连续排名概率评分(CRPS)这个评估概率预报质量的指标上,AERIS同样表现出色,特别是在预报初期(1-3天)和后期(10-14天)都显示出优势。

更值得关注的是,AERIS在长期稳定性方面展现出了独特的优势。传统的AI天气预报模型往往在预报时间超过两周后就会出现不稳定现象,预报结果逐渐偏离现实。但AERIS能够稳定运行长达90天的预报,这在AI气象预报领域是前所未有的成就。

六、极端天气事件的精准捕捉

AERIS在预测极端天气事件方面的能力尤其引人注目。研究团队选择了2020年的两个重要案例进行详细分析:飓风劳拉(Hurricane Laura)和欧洲热浪事件。

飓风劳拉是2020年大西洋飓风季节中最具破坏性的风暴之一,于8月27日在路易斯安那州登陆,造成190亿美元的经济损失和47人死亡。AERIS成功地在飓风登陆前7天就准确预测了其路径,在5天前准确预测了登陆地点,甚至连飓风在墨西哥湾的快速增强过程都被准确捕捉。这种预报精度对于灾害防范和人员疏散具有重要意义。

2020年8月的欧洲热浪是另一个极端天气事件的典型案例。当时英国等地区经历了异常高温,对公共健康和能源供应造成了严重影响。AERIS在热浪来临前一周就成功识别出了这个异常天气模式,预测的温度变化曲线与实际观测高度吻合。这种提前预警能力对于公共卫生部门制定应对措施具有重要价值。

七、季节性预报的重大突破

AERIS最令人瞩目的成就之一是其在季节性预报方面的突破。季节性预报是指预测未来几个月内的气候趋势,这比短期天气预报要困难得多,因为需要考虑海洋、陆地和大气之间的复杂相互作用。

在厄尔尼诺现象的预测测试中,AERIS展现出了remarkable的能力。厄尔尼诺是赤道太平洋海表温度异常变化引起的全球性气候现象,对全球天气模式有深远影响。AERIS能够准确预测Nino 3.4指数(衡量厄尔尼诺强度的重要指标)长达90天的变化趋势,包括春季预报障碍期间的不确定性变化。

研究团队还通过霍夫默勒图(Hovmoller diagram)分析了热带地区对流耦合波动的传播特征。这些波动是热带天气系统的重要组成部分,影响着季风、热带气旋和其他重要天气现象。AERIS能够准确模拟这些波动在经度和时间上的传播模式,至少保持3周的预报技巧,在90天的时间尺度上依然显示出合理的变率特征。

八、技术创新与未来应用前景

AERIS的成功不仅体现在预报精度的提升,更重要的是其所代表的技术创新路径。传统的数值天气预报依赖于物理方程的求解,而AERIS则是通过学习历史数据中隐含的模式来进行预测。这种数据驱动的方法具有几个显著优势:首先是计算效率的大幅提升,一旦训练完成,生成预报只需要几秒钟时间;其次是能够自然地处理那些难以用传统物理方程描述的复杂现象;最后是具有更好的扩展性,可以通过增加训练数据来持续改进性能。

研究团队在论文中提到了几个重要的发展方向。一致性蒸馏技术可以将多步骤的扩散过程压缩到单步,大幅减少推理时间和计算成本。多步微调方法可能进一步提升预报技巧。此外,将AERIS适配到更高分辨率的数据和其他数据集也是重要的研究方向。

从实际应用的角度来看,AERIS技术有望在多个领域发挥重要作用。在农业领域,准确的季节性预报可以帮助农民制定种植计划和灌溉策略。在能源行业,长期天气预报对于可再生能源的规划和电网调度具有重要价值。在保险和金融领域,准确的极端天气预测可以帮助评估风险和制定对冲策略。

九、面临的挑战与发展限制

尽管AERIS取得了令人瞩目的成就,但研究团队也坦诚地讨论了当前面临的挑战和限制。首先是计算资源的巨大需求,训练大规模模型需要大约一周的exascale计算时间,相当于150万个节点小时的计算资源。这样的计算需求限制了技术的普及和应用。

模型的预报校准问题是另一个重要挑战。当前的AERIS系统在中期预报中表现出过度自信的特点,即预报的不确定性范围偏小。研究团队认为这可能通过改进初始条件扰动方法和调整随机搅动策略来解决。

由于AERIS是纯数据驱动的模型,它可能会产生一些在物理上不合理的预报结果。虽然在大多数情况下这种现象并不明显,但在极端条件下可能会出现问题。此外,要使AERIS成为业务化的预报系统,还需要在实时数据同化和初始化方面进行进一步的技术开发。

研究团队还指出,当前的科学验证主要基于13亿参数的模型,而更大规模模型的训练仍在进行中。由于训练成本极高,全面评估这些大型模型的性能需要更长的时间和更多的资源投入。

十、AI气象预报的未来图景

AERIS的成功标志着AI在科学应用领域达到了新的高度,也预示着天气和气候预报即将进入一个新的时代。过去50年来,数值天气预报通过不断改进物理方程和计算方法,将有效预报技巧从3天提升到了近8天。现在,基于AI的方法正在展示出更大的潜力。

这种技术转变的意义不仅在于预报精度的提升,更在于预报成本的大幅降低。传统的全球数值天气预报需要大型超级计算机运行数小时才能完成一次预报,而AI模型一旦训练完成,就可以在几秒钟内生成同样精度的预报。这种效率提升将使高质量的天气预报服务能够惠及更广泛的用户群体。

AERIS的成功也为其他地球系统科学领域提供了重要启示。海洋预报、地震预测、生态系统动态模拟等领域都可能从类似的AI方法中受益。随着计算能力的不断提升和算法的持续改进,我们有理由相信,AI将在理解和预测复杂的地球系统方面发挥越来越重要的作用。

当然,AI预报系统不会完全取代传统的数值预报方法,更可能的情况是两者相互补充,形成更加强大和可靠的预报体系。物理模型提供理论基础和机制理解,而AI模型提供高效的计算和模式识别能力。这种混合方法有望在未来几年内推动天气和气候预报科学达到新的高度。

研究团队在论文结尾展望了这一技术可能带来的深远影响。从短期来看,AERIS类型的系统可能会改变气象服务的提供方式,使得个性化、高精度的天气预报成为可能。从长期来看,这种技术可能会重新定义我们对地球系统的理解方式,从基于物理定律的演绎推理转向基于数据模式的归纳学习。

说到底,AERIS不仅仅是一个技术突破,更代表了科学研究范式的重要转变。它证明了在大数据和强大计算能力的支持下,机器学习可以在复杂的自然系统建模方面达到甚至超越传统方法的水平。这为我们应对气候变化、自然灾害防范等重大挑战提供了新的工具和思路。对于普通人而言,这意味着未来我们可能会享受到更加准确、及时和个性化的天气服务,无论是日常出行规划还是重大决策制定,都将受益于这一技术进步。

Q&A

Q1:AERIS系统是什么?它与传统天气预报有什么区别?

A:AERIS是阿贡国家实验室开发的AI天气预报系统,参数规模从13亿到800亿不等。与传统预报依靠物理方程计算不同,AERIS通过学习40年历史天气数据来预测未来,就像一个经验丰富的气象专家。它的预报速度更快(几秒钟vs几小时),能稳定预测90天,在极端天气预测方面表现尤其出色。

Q2:AERIS在Aurora超级计算机上的10.21 ExaFLOPS性能意味着什么?

A:这相当于1000万台普通电脑同时工作的计算能力,是AI科学应用领域迄今为止的最高记录。这种性能通过创新的SWiPe并行策略实现,能够同时处理地球大气的复杂计算。如此强大的计算能力使AERIS能够在保持高精度的同时处理全球0.25度分辨率的天气数据。

Q3:普通人什么时候能用上AERIS这样的AI天气预报?

A:目前AERIS仍是科研阶段的系统,需要超级计算机运行。但它代表的技术方向将逐步改变天气服务。随着算法优化和硬件发展,未来几年我们可能会享受到更准确、个性化的天气预报服务,特别是在极端天气预警和长期气候预测方面。

分享至
0赞

好文章,需要你的鼓励

推荐文章
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-