香港大学与浙江大学等研究团队发布「变量自适应专家混合模型(VA-MoE)」。该模型通过分阶段训练与变量索引嵌入机制,使不同专家模块专注于特定类型的气象变量,在新增变量或站点时,无需全量重训即可扩展模型,同时确保精度并大幅减少计算成本。
天气预报作为影响社会运行与防灾决策的关键领域,持续面临大气系统复杂多变带来的挑战。数值天气预报(NWP)长期以来一直是该领域的主流手段,通过求解偏微分方程模拟关键变量的演变过程。近年来,人工智能技术在气象建模中展现出巨大潜力,催生了「气象人工智能(AI4Weather)」这一新兴交叉方向。
然而,现有AI气象模型大多基于理想假设,即所有气象变量在训练和预测时均可同步获取,这与实际观测中数据来源多样、采集频率不一的情况严重不符。为应对这一挑战,香港大学、浙江大学等机构的研究团队设计了「增量天气预报(IWF)」新范式,推出「变量自适应专家混合模型(VA-MoE)」。该模型通过分阶段训练与变量索引嵌入机制,使不同专家模块专注于特定类型的气象变量,在新增变量或站点时,无需全量重训即可扩展模型,同时确保精度并大幅减少计算成本。
相关研究成果以「VA-MoE: Variables-Adaptive Mixture of Experts for Incremental Weather Forecasting」为题,已被计算机视觉领域国际顶会 ICCV25 接收。
研究亮点:
* 首次对天气预报增量学习新范式进行系统性探索,构建了可量化评估模型扩展性与泛化能力的基准
* 提出首个专为增量大气建模设计的框架 VA-MoE,通过变量索引嵌入驱动的上下文变量激活实现专家专业化
* 基于 ERA5 数据集的大规模实验表明,在数据量减半、参数量缩减至25%的条件下,VA-MoE在高空变量预报中显著优于同类模型
论文地址:https://arxiv.org/abs/2412.02503
该研究以欧洲中期天气预报中心(ECMWF)发布的主流大气再分析数据集 ERA5 为实验基础,覆盖 1979 年至今的连续气象观测数据。从时间维度划分,数据集被明确分配至实验的不同阶段:初始训练阶段采用 1979-2020 年的 40 年数据;增量训练阶段使用 2000-2020 年的 20 年数据;测试阶段则选取 2021 年全年气象变量数据。
在变量配置上,实验共涉及 5 个高空变量与 5 个地面变量。高空变量包括 Z(位势高度)、Q(比湿)、U(东西向风速)、V(南北向风速)、T(温度);地面变量包括 2 米气温 T2M、10 米东风速 U10、10 米南风速 V10、平均海平面气压 MSL、地面气压 SP 等。
VA-MoE 的核心运行逻辑围绕「两阶段训练范式」展开。第一阶段为「初始阶段」,仅使用高空变量训练模型;第二阶段为「增量阶段」,在冻结第一阶段已训练参数的前提下,加入地面变量,仅训练为新变量新增的模块。从架构基础来看,VA-MoE 以 Transformer 为核心 backbone,但针对气象数据的多尺度、强关联特性做了关键优化。
为系统评估 VA-MoE 在气象预报中的实际效能,研究团队围绕「精度、效率与扩展性」3 个维度,基于真实气象数据构建了完整的实验体系。
实验核心是将 VA-MoE 与当前 9 种主流气象 AI 模型进行对比。关键区别在于训练逻辑:对比模型多采用「高空与地面变量一次性联合训练」的传统方式,而 VA-MoE 采用「先高空、后地面」的两阶段增量策略。
在预报精度方面:
在 VA-MoE 所关注的「高效适配多变量、降低更新成本与提升预报精度」方向上,全球学术界与企业界正形成合力。学术界在模型架构创新与数据利用效率方面取得重要突破。
本文由主机测评网于2026-05-04发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260542551.html