气象AI新突破：VA-MoE模型实现高效增量预报

主机测评网
科技资讯
2026-05-04
1016

香港大学与浙江大学等研究团队发布「变量自适应专家混合模型（VA-MoE）」。该模型通过分阶段训练与变量索引嵌入机制，使不同专家模块专注于特定类型的气象变量，在新增变量或站点时，无需全量重训即可扩展模型，同时确保精度并大幅减少计算成本。

天气预报作为影响社会运行与防灾决策的关键领域，持续面临大气系统复杂多变带来的挑战。数值天气预报（NWP）长期以来一直是该领域的主流手段，通过求解偏微分方程模拟关键变量的演变过程。近年来，人工智能技术在气象建模中展现出巨大潜力，催生了「气象人工智能（AI4Weather）」这一新兴交叉方向。

然而，现有AI气象模型大多基于理想假设，即所有气象变量在训练和预测时均可同步获取，这与实际观测中数据来源多样、采集频率不一的情况严重不符。为应对这一挑战，香港大学、浙江大学等机构的研究团队设计了「增量天气预报（IWF）」新范式，推出「变量自适应专家混合模型（VA-MoE）」。该模型通过分阶段训练与变量索引嵌入机制，使不同专家模块专注于特定类型的气象变量，在新增变量或站点时，无需全量重训即可扩展模型，同时确保精度并大幅减少计算成本。

相关研究成果以「VA-MoE: Variables-Adaptive Mixture of Experts for Incremental Weather Forecasting」为题，已被计算机视觉领域国际顶会 ICCV25 接收。

研究亮点：

* 首次对天气预报增量学习新范式进行系统性探索，构建了可量化评估模型扩展性与泛化能力的基准

* 提出首个专为增量大气建模设计的框架 VA-MoE，通过变量索引嵌入驱动的上下文变量激活实现专家专业化

* 基于 ERA5 数据集的大规模实验表明，在数据量减半、参数量缩减至25%的条件下，VA-MoE在高空变量预报中显著优于同类模型

气象AI新突破：VA-MoE模型实现高效增量预报 VA-MoE 增量学习气象预报人工智能第1张

论文地址：https://arxiv.org/abs/2412.02503

ERA5 数据集的高空与地面变量划分

该研究以欧洲中期天气预报中心（ECMWF）发布的主流大气再分析数据集 ERA5 为实验基础，覆盖 1979 年至今的连续气象观测数据。从时间维度划分，数据集被明确分配至实验的不同阶段：初始训练阶段采用 1979-2020 年的 40 年数据；增量训练阶段使用 2000-2020 年的 20 年数据；测试阶段则选取 2021 年全年气象变量数据。

在变量配置上，实验共涉及 5 个高空变量与 5 个地面变量。高空变量包括 Z（位势高度）、Q（比湿）、U（东西向风速）、V（南北向风速）、T（温度）；地面变量包括 2 米气温 T2M、10 米东风速 U10、10 米南风速 V10、平均海平面气压 MSL、地面气压 SP 等。

气象AI新突破：VA-MoE模型实现高效增量预报 VA-MoE 增量学习气象预报人工智能第2张

VA-MoE：面向增量学习的变量自适应气象预报模型架构

VA-MoE 的核心运行逻辑围绕「两阶段训练范式」展开。第一阶段为「初始阶段」，仅使用高空变量训练模型；第二阶段为「增量阶段」，在冻结第一阶段已训练参数的前提下，加入地面变量，仅训练为新变量新增的模块。从架构基础来看，VA-MoE 以 Transformer 为核心 backbone，但针对气象数据的多尺度、强关联特性做了关键优化。

气象AI新突破：VA-MoE模型实现高效增量预报 VA-MoE 增量学习气象预报人工智能第3张