当前位置:首页 > 科技资讯 > 正文

气象AI新突破:VA-MoE模型实现高效增量预报

香港大学与浙江大学等研究团队发布「变量自适应专家混合模型(VA-MoE)」。该模型通过分阶段训练与变量索引嵌入机制,使不同专家模块专注于特定类型的气象变量,在新增变量或站点时,无需全量重训即可扩展模型,同时确保精度并大幅减少计算成本。

天气预报作为影响社会运行与防灾决策的关键领域,持续面临大气系统复杂多变带来的挑战。数值天气预报(NWP)长期以来一直是该领域的主流手段,通过求解偏微分方程模拟关键变量的演变过程。近年来,人工智能技术在气象建模中展现出巨大潜力,催生了「气象人工智能(AI4Weather)」这一新兴交叉方向。

然而,现有AI气象模型大多基于理想假设,即所有气象变量在训练和预测时均可同步获取,这与实际观测中数据来源多样、采集频率不一的情况严重不符。为应对这一挑战,香港大学、浙江大学等机构的研究团队设计了「增量天气预报(IWF)」新范式,推出「变量自适应专家混合模型(VA-MoE)」。该模型通过分阶段训练与变量索引嵌入机制,使不同专家模块专注于特定类型的气象变量,在新增变量或站点时,无需全量重训即可扩展模型,同时确保精度并大幅减少计算成本。

相关研究成果以「VA-MoE: Variables-Adaptive Mixture of Experts for Incremental Weather Forecasting」为题,已被计算机视觉领域国际顶会 ICCV25 接收。

研究亮点:

* 首次对天气预报增量学习新范式进行系统性探索,构建了可量化评估模型扩展性与泛化能力的基准

* 提出首个专为增量大气建模设计的框架 VA-MoE,通过变量索引嵌入驱动的上下文变量激活实现专家专业化

* 基于 ERA5 数据集的大规模实验表明,在数据量减半、参数量缩减至25%的条件下,VA-MoE在高空变量预报中显著优于同类模型

气象AI新突破:VA-MoE模型实现高效增量预报 VA-MoE 增量学习 气象预报 人工智能 第1张

论文地址:https://arxiv.org/abs/2412.02503

ERA5 数据集的高空与地面变量划分

该研究以欧洲中期天气预报中心(ECMWF)发布的主流大气再分析数据集 ERA5 为实验基础,覆盖 1979 年至今的连续气象观测数据。从时间维度划分,数据集被明确分配至实验的不同阶段:初始训练阶段采用 1979-2020 年的 40 年数据;增量训练阶段使用 2000-2020 年的 20 年数据;测试阶段则选取 2021 年全年气象变量数据。

在变量配置上,实验共涉及 5 个高空变量与 5 个地面变量。高空变量包括 Z(位势高度)、Q(比湿)、U(东西向风速)、V(南北向风速)、T(温度);地面变量包括 2 米气温 T2M、10 米东风速 U10、10 米南风速 V10、平均海平面气压 MSL、地面气压 SP 等。

气象AI新突破:VA-MoE模型实现高效增量预报 VA-MoE 增量学习 气象预报 人工智能 第2张

VA-MoE:面向增量学习的变量自适应气象预报模型架构

VA-MoE 的核心运行逻辑围绕「两阶段训练范式」展开。第一阶段为「初始阶段」,仅使用高空变量训练模型;第二阶段为「增量阶段」,在冻结第一阶段已训练参数的前提下,加入地面变量,仅训练为新变量新增的模块。从架构基础来看,VA-MoE 以 Transformer 为核心 backbone,但针对气象数据的多尺度、强关联特性做了关键优化。

气象AI新突破:VA-MoE模型实现高效增量预报 VA-MoE 增量学习 气象预报 人工智能 第3张

VA-MoE 性能验证:精度媲美主流模型,增量学习优势显著

为系统评估 VA-MoE 在气象预报中的实际效能,研究团队围绕「精度、效率与扩展性」3 个维度,基于真实气象数据构建了完整的实验体系。

实验核心是将 VA-MoE 与当前 9 种主流气象 AI 模型进行对比。关键区别在于训练逻辑:对比模型多采用「高空与地面变量一次性联合训练」的传统方式,而 VA-MoE 采用「先高空、后地面」的两阶段增量策略。

在预报精度方面

气象AI新突破:VA-MoE模型实现高效增量预报 VA-MoE 增量学习 气象预报 人工智能 第4张

AI 驱动气象预报革新,突破传统数值模型边界

在 VA-MoE 所关注的「高效适配多变量、降低更新成本与提升预报精度」方向上,全球学术界与企业界正形成合力。学术界在模型架构创新与数据利用效率方面取得重要突破。

论文标题:End-to-end data-driven weather prediction

论文地址:https://www.nature.com/articles/s41586-025-08897-0