生成式人工智能扩散模型在气象领域中的研究与应用进展
doi: 10.13878/j.cnki.dqkxxb.20241126001
周爽1 , 张金满1 , 田伟守2 , 陈子轩1 , 冯雪1 , 赵增保1 , 杨元建3
1. 河北省气象服务中心,河北 石家庄 050021
2. 甘肃省气象信息与技术装备保障中心,甘肃 兰州 730020
3. 南京信息工程大学大气物理学院,江苏 南京 210044
基金项目: 中国气象局揭榜挂帅项目(CMAJBGS202209a) ; 河北省气象局科研开发项目(23zc07)
Research and application progress of generative artificial intelligence diffusion model in meteorology
ZHOU Shuang1 , ZHANG Jinman1 , TIAN Weishou2 , CHEN Zixuan1 , FENG Xue1 , ZHAO Zengbao1 , YANG Yuanjian3
1. Hebei Meteorological Service Center, Shijiazhuang 050021 ,China
2. Gansu Meteorological Information and Technical Equipment Support Center, Lanzhou 730020 ,China
3. School of Atmospheric Physics, Nanjing University of Information Science and Technology, Nanjing 210044 , China
摘要
在全球气候变化加剧和极端天气事件频发的背景下,准确预测天气和气候变化变得愈发重要。传统气象模型在模拟复杂大气系统和处理高维数据方面存在局限性,在一定程度上制约了预测的精度和可靠性。近年来,生成式人工智能模型,尤其是扩散模型(diffusion model)凭借其强大的生成能力和多模态数据处理能力,在图像合成、自然语言处理等领域取得了显著进展。鉴于其在高质量样本生成和多样性表达方面的优势,研究者开始探索扩散模型在气象领域的应用潜力。本文综述了扩散模型在气象领域的应用现状和前景,重点关注其在降水预报、数据同化、空间降尺度和极端天气事件模拟等关键性任务中的表现。研究表明,扩散模型为处理复杂天气系统提供了新的技术途径,给气象学领域带来了全新的研究范式和技术创新。未来扩散模型有望与传统物理模型深度融合,在天气预报、气候变化预估和极端事件预警等方面发挥重要作用。
Abstract

In the context of accelerating global climate change and increasingly frequent extreme weather events, accurate weather and climate prediction has become critically important for safeguarding human society and the natural environment.Traditional meteorological models face significant challenges in simulating complex atmospheric systems and handling high-dimensional data, limiting the accuracy and reliability of both short-term weather forecasts and long-term climate projections.In recent years, revolutionary advancements in artificial intelligence (AI), particularly in generative models, have shown remarkable potential across a range of scientific domains.Among these, diffusion models have emerged as a particularly promising approach, owing to their stable training processes, unique generative mechanisms, and superior sample quality.This paper provides a comprehensive review of diffusion models and their applications within meteorological science, focusing on their current implementation, performance characteristics, and future prospects across multiple meteorological subfields.

The review first establishes the theoretical foundations of diffusion models, detailing their core mechanisms, including the forward and reverse diffusion processes.It then explores the intrinsic connections between diffusion models and meteorological science, emphasizing shared mathematical frameworks and physical principles such as stochastic processes, Bayesian inference, and multi-scale dynamics.Building on this foundation, the paper systematically examines four key application areas where diffusion models have demonstrated particular promise.In precipitation forecasting, models such as LDCast, PreDiff, GED, and DiffCast have achieved significant improvements in generating diverse precipitation scenarios and accurately capturing extreme events.For data assimilation, approaches such as SDA, DiffDA, and SLAMS integrate heterogeneous, sparse, and noisy observational data into weather fields while significantly reducing computational costs compared to traditional methods.In spatial downscaling, models like CorrDiff, StormCast, and STVD enhance spatial resolution from coarse global climate models to fine-scale regional predictions while maintaining physical consistency and capturing local terrain effects.In weather system simulation, models such as SEEDS and GenCast have shown strong capabilities in modeling complex atmospheric dynamics and producing high-quality ensemble forecasts that reflect the inherent uncertainties in weather prediction.

Despite these advancements, several challenges remain, including high computational demands, maintaining physical consistency, ensuring long-term model stability, and improving model interpretability to foster greater trust among meteorologists.Looking ahead, the paper identifies five promising research directions:climate change scenario generation, multi-scale weather-climate joint modeling, meteorological data completion and reconstruction, linking global and regional scales, and uncertainty quantification in meteorological modeling.These emerging applications span a wide range of temporal and spatial scales, from microscale to macroscale and from short-term forecasts to long-term projections.The integration of diffusion models with traditional physical physics-based weather models holds significant potential for improving forecast accuracy, enhancing climate model resolution, and advancing extreme weather early-warning systems.As technology innovation progresses and interdisciplinary collaboration deepens, diffusion models are expected to play an increasingly critical role in meteorological research and operational applications, offering powerful new tools for understanding atmospheric phenomena and addressing the challenges of climate change.

随着全球气候变化加剧,极端天气事件频发、广发、重发,准确预测天气和气候变化对于保障人类社会和自然环境的安全越发重要(IPCC,2021)。然而,大气系统的复杂性、数据的高维性和动态性使得传统的气象模型在精确预测方面存在较大局限性。这些局限性不仅影响短期天气预报的准确性,也对长期气候模型的可靠性提出了挑战(Bauer et al.,2015)。
近年来,人工智能(artificial intelligence,AI)在计算机视觉、自然语言处理等领域取得了革命性进展,推动了AI在包括气象在内的多领域创新应用,例如Pangu-Weather(Bi et al.,2023)和NowcastNet(Zhang et al.,2023)等先进的气象预测模型能够对天气系统进行精确学习和模拟,为准确可靠、快速响应的气象服务提供了可靠支撑。
在AI的众多模型中,扩散模型以其独特的生成机制脱颖而出,受到广泛关注,在图像生成领域,研究者通过扩散模型提升生成质量与多样性(Dhariwal and Nichol,2021),将ImageNet数据集(Deng et al.,2009)256×256图像的弗雷歇初始距离(Fréchet inception distance,FID;Heusel et al.,2017)分数从BigGAN-deep(Brock et al.,2018)的6.95优化至4.59。在文本到图像生成中,引导语言到图像扩散生成与编辑技术(guided language to image diffusion for generation and editing,GLIDE;Nichol et al.,2021)通过引入扩散模型取得了显著突破,在微软通用物体情境识别数据集(Microsoft common objects in context MS-COCO,MS-COCO;Lin et al.,2014)数据集上的FID分数达到12.24,大幅优于DALL-E模型(Ramesh et al.,2021)的28,在人类评估中表现突出,照片真实度获得91%的偏好率。梦境融合(DreamFusion;Poole et al.,2022)使用扩散模型进行三维生成,显著提升了其性能。对比语言-图像预训练模型(CLIP B/32;Radford et al.,2021)的评估达到75.1%,接近真实图像水平(77.1%)。在三维几何一致性上的提升尤为显著,从Dream Fields(Jain et al.,2022)的1.4%大幅提升至58.5%。在生物信息学中,等变扩散模型(equivariant diffusion model,EDM;Hoogeboom et al.,2022)利用扩散模型生成三维分子,显著提升了性能。在原子稳定性评估上扩散模型达到98.7%,远超基线模型E-NF(Garcia et al.,2021)的85.0%。在分子稳定性指标上,扩散模型从E-NF的4.9%大幅提升至82.0%,且生成速度提高了16倍。在数据增强方面,潜在扩散模型(latent diffusion model,LDM;Rombach et al.,2022)表现出色,生成的三维脑部磁共振成像图像在FID指标上达到0.007 6,远低于基于GANs(Goodfellow et al.,2014)的基线模型(如VAE-GAN的0.157 6和LSGAN的0.023 1),此外,LDM在条件生成中展现了高精度,如脑室体积的相关系数达到0.972,脑年龄预测的相关系数为0.692,显著提升了合成图像的可控性和实用性。这些量化结果表明,扩散模型通过更稳定的训练过程、更高的生成保真度及跨模态适应性,正在重塑生成式AI的技术边界。
尽管在图像生成等领域已经证明了其巨大潜力,扩散模型在气象学的应用仍处于探索阶段,其引入为气象数据生成和预测提供了全新的方法论,预示着在提高天气预测精度和可靠性方面的更大探索空间,同时可能揭示大气过程的深层次机制,为理解复杂的气象现象提供了新的视角。扩散模型在气象领域的应用,包括从原始观测数据中学习并生成新的数据样本、模拟天气模式、预测极端气候事件,以及增强现有数值天气预报模型的能力,不仅有望提升气象预测的精准度,还可能有力推动该领域技术创新与应用探索,促进跨学科交叉融合发展。
本文对扩散模型在气象领域应用的研究进行较详尽的整理和汇总,探讨模型的设计原理和它们在气象数据预测中的应用案例,以及它们如何帮助解决传统气象模型遇到的问题。此外,本文还评估了扩散模型在气象学中的潜在优势、面临的挑战,以及未来的发展方向,为这一新兴领域的研究提供了全面的视角。
1 扩散模型概述
1.1 扩散模型的定义与发展
扩散模型是一类深度生成模型,其灵感来源于非平衡热力学,通过模拟一个逐步添加随机噪声的过程(前向过程),然后再学习如何逆转这一过程(逆扩散过程),从而生成高质量的数据样本(Sohl-Dickstein et al.,2020)。
Song et al.(2019)提出了基于分数估计的生成模型NCSN(noise conditional score networks),该方法通过估计不同噪声尺度下数据分布的梯度,结合朗之万动力学采样来生成数据。Ho et al.(2020)提出了DDPM(denoising diffusion probabilistic models),之后扩散受到广泛关注,成为扩散模型发展的重要转折点,DDPM提出了一个固定的噪声调度(noise schedule),控制每一步添加的噪声强度。通过重参数化技巧(reparameterization trick)将随机采样过程转化为确定性计算,从而使得梯度可以通过反向传播进行计算。Song et al.(2020)进一步提出了基于随机微分方程(SDE)的统一理论框架,揭示了DDPM和NCSN本质上是连续时间随机过程的两种特例。该框架不仅从理论上统一了两种方法,更重要的是为扩散模型的设计和优化提供了新的数学工具。这一理论突破推动了后续一系列改进工作,如采样效率的提升和生成质量的优化。
扩散模型不仅在图像生成任务中展现出卓越性能,还被成功应用于自然语言处理、音频合成和信号处理等多个领域,显著拓展了生成模型的应用范围和能力边界(Kong et al.,2020; Ramesh et al.,2022)。这些突破性工作推动了整个生成模型领域的进步,并为扩散模型在各个领域的创新应用奠定了基础。
1.2 扩散模型的基本原理
以DDPM为例,前向过程(forward process):表示在已知xt-1的条件下,xt的条件概率分布。它是一个逐步向数据添加噪声的马尔可夫链,直至数据完全变成噪声(Ho et al.,2020)。这个过程可以表示为:
qxtxt-1=Nxt;1-βtxt-1,βtI
(1)
其中:t是时间步,表示扩散过程中的某一步; βt是噪声调度参数,控制每一步的噪声量,通常随着t的增加而增加,噪声的强度逐渐增大; 1-βtxt-1是高斯分布的均值,表示在xt-1的基础上进行缩放的系数; βtI表示在时间步t时,向数据中添加的高斯噪声的方差。
逆扩散过程(reverse process):逆扩散过程的目标是从噪声中恢复出原始数据。这个过程通过训练一个神经网络来预测每一步去噪所需的均值和方差,从而逐步减少噪声,最终生成目标数据样本(Ho et al.,2020)。逆过程可以表示为:
pθxt-1xt=Nxt-1;μθxt,t,Σθxt,t
(2)
其中:μθΣθ由神经网络输出,分别预测均值和方差; θ是神经网络的参数,在实际实现中,通常固定方差,只学习均值。
1前向(反向)扩散过程的马尔可夫链通过缓慢添加(去除)噪声来生成样本(引自Ho et al.(2020)
Fig.1Schematic of the Markov chain for the forward (reverse) diffusion process, in which a sample is generated by gradually adding (or removing) noise (adapted from Ho et al. (2020) )
扩散模型的损失函数通常基于变分下界(evidence lower bound,ELBO)来构建,其目的是最小化模型预测的噪声和实际噪声之间的差异。在实际应用中,DDPM通过预测噪声来简化目标,具体是训练神经网络εθ来预测噪声ε,损失函数为预测噪声和实际噪声之间的均方误差(MSE):
Lt=Ex0,r,tε-εθxt,t2
(3)
其中:εθxt,t)是神经网络的输出,表示模型预测的噪声。
1.3 扩散模型与气象科学的理论联系
气象系统是地球上最为复杂的自然系统之一,其行为展现出典型的混沌特征。这种复杂性不仅体现在大气运动的多变性上,更反映在其内在的动力学机制中(Lorenz,1963)。理解和预测大气系统的行为一直是气象学家和物理学家面临的重大挑战,也是推动大气科学不断发展的动力(Palmer,2000)。近年来,随着机器学习技术的进步,特别是扩散模型的出现,为研究这一复杂系统提供了新的工具和视角,扩散模型的特性与大气系统的某些本质特征展现出一定的相似性,这为其在气象学中的应用奠定了理论基础。
为了深入理解扩散模型在气象学中的潜力,首先需要审视大气系统的复杂性及其对传统建模方法的挑战。大气系统具有以下几个关键特征:1)高度非线性。大气中存在大量非线性相互作用,如大气-海洋耦合、云-辐射反馈等(Dijkstra and Nonlinear,2013)。2)对初始条件敏感。这一特性最著名的例证就是Edward Lorenz发现的“蝴蝶效应”(Lorenz,2007)。微小的初始条件差异可能在预测过程中被放大,导致完全不同的结果。3)多尺度动力学。大气运动涵盖了从微米尺度的湍流到全球尺度的大气环流(Majda and Klein,2003)。这些不同尺度的过程相互作用、相互影响,形成了复杂的多尺度动力学系统。4)复杂反馈机制。大气系统中存在多重正反馈和负反馈机制。例如,冰雪反照率反馈是一个正反馈机制,而地表温度与长波辐射的关系则是一个负反馈机制(Roe,2009)。5)临界现象与相变。大气系统中存在一些临界现象,如对流的触发、云的形成等(Peters and Neelin,2006)。
扩散模型与气象科学的理论联系远比表面看起来要紧密得多,这种联系植根于两个领域共同的数学基础和物理原理。从数学角度来看,扩散模型和大气动力学模型都可以用偏微分方程来描述。扩散模型的核心是Fokker-Planck方程,它描述了概率密度函数随时间的演化; 而在气象学中,Navier-Stokes方程则描述了流体运动。这两类方程都包含扩散项和对流项,反映了系统中的随机扩散过程和确定性演化。扩散模型中的反向过程(从噪声重建信号)可以类比于气象学中的数据同化技术。数据同化旨在将观测数据与数值模型相结合,以获得大气状态的最佳估计(Kalnay,2003)。这个过程在数学上可以表述为贝叶斯推断问题,而扩散模型的训练过程本质上也是一种贝叶斯推断,两者都试图从噪声和不完整的信息中重建完整的状态。
从动力系统理论的角度来看,扩散模型和大气系统都表现出对初始条件的敏感依赖性(Strogatz et al.,1994)。在扩散模型中,这体现为不同的随机种子可能导致生成不同的结果; 在气象系统中,这就是著名的“蝴蝶效应”。这种混沌特性使得长期预测变得困难,但同时也为集合预报方法提供了理论基础(Leutbecher and Palmer,2008)。扩散模型和气象模型都涉及多尺度问题的处理(Kingma et al.,2021)。扩散模型通过逐步添加和移除不同尺度的噪声,能够学习数据的多尺度结构。这与大气模型中处理从微观湍流到大尺度环流的多尺度相互作用有着惊人的相似性。两者都需要在不同尺度上捕获关键特征,并理解这些特征之间的相互作用。
从信息论的角度来看,扩散模型的训练过程可以被理解为最小化真实数据分布和模型生成分布之间的Kullback-Leibler(KL)散度(Song et al.,2020)。这与气象学中使用最大熵原理来构建统计力学模型有着深刻的联系(Jaynes,1957)。两者都试图在已知信息的约束下,找到最不确定(即最大熵)的概率分布。
2 扩散模型在气象领域中的具体应用
扩散模型作为一类新型生成模型,在样本生成方面具有两个突出优势:一是通过逐步去噪过程,能够生成高质量、细节丰富的样本,这种精细的生成机制使其能够更好地还原复杂的物理过程和动力特征; 二是其生成过程的随机性使其天然具备产生多样化样本的能力,无需额外的随机扰动或后处理。这些优势为突破气象预报中的关键瓶颈提供了新的可能性,在降水预报中,其细节丰富的生成能力有助于更准确地刻画局地降水特征。在数据同化过程中,其对物理过程的准确还原可以更好地融合观测数据与天气场。在空间降尺度任务中,精细的生成机制能够更好地重建小尺度特征。在天气系统模拟中,多样化的样本生成能力则为集合预报提供了高效的技术路径。
2.1 在降水预报中应用
生成模型可以生成多个可能的降水情景,这有助于量化预报的不确定性。这对风险评估和决策支持非常有价值,特别是在区域性极端降水事件频发的背景下(马丽等,2024)。对于罕见的极端降水事件,传统模型可能表现不佳。但生成模型通过其生成过程,可以更好地模拟这些低概率但高影响的事件。相对于传统的数值天气预报模型提供一个单一的预测值,如“未来6 h降水量为10 mm”,生成模型可以生成数百个可能的降水情景,并提供每种情景的概率分布,比如GANs和扩散模型,不仅给出了最可能的降水量,还量化了预报的不确定性(陈元昭等,2019)。而且,扩散模型相对于GANs具有显著优势。GANs在训练过程中容易出现模式崩溃问题(Goodfellow et al.,2014),导致生成的样本多样性不足,而Dharwal and Nichol(2021)的研究表明,扩散模型不仅训练过程更稳定,还能生成更高质量的样本。
瑞士联邦气象和气候局的Leinonen et al.(2023)开发了潜在扩散模型预报(latent diffusion forecasting,LDCast),这是一个基于潜在空间条件扩散模型LDM的降水临近预报系统,包含预报器、去噪器和变分自编码器VAE(Kingma and Welling,2014)3个主要组件。他们使用了2018—2021年4—9月的瑞士雷达降水数据集,这些数据的时间分辨率为5 min,空间分辨率为1 km。与生成对抗网络GANs和其他统计模型相比,LDCast在降水预测的准确性上表现更好,尤其是在预测降水率方面; 同时相比于GANs,LDM训练更稳定,计算成本更低,不易受到模式崩溃的影响。在连续分级概率评分(continuous ranked probability score,CRPS;Hersbach,2000)方面,LDCast在多个空间尺度上都优于深度降水生成模型(deep generative model of rainfall,DGMR; Ravuri et al.,2021)和PySTEPS预报系统(Pulkkinen et al.,2019),特别是在较长的预报时间上。这代表LDCast能够生成更多样化的预测结果,并且这些结果的分布更接近理想的概率分布,从而能更准确地反映预测的不确定性。这对于像天气预测这样的领域尤为重要,因为不确定性的准确表达对于做出可靠预测至关重要。
香港科技大学的Gao et al.(2024)提出了同样基于潜在扩散模型LDM的降水临近预报模型PreDiff。该团队曾经提出了Conv-LSTM(Shi et al.,2015)神经网络对降水进行预测,成为了该领域的SOTA(state of the arts),并成功用于视频外推等其他领域。PreDiff是在SEVIR(the storm event imagery; Veillette et al.,2020)数据集上训练的。和LDCast一样,PreDiff的一个重大进步是其概率性预报能力。传统的确定性模型,如ConvLSTM、PredRNN(Wang et al.,2017)或PhyDNet(Guen and Thome,2020)等在面对高度不确定的未来时,往往会生成模糊的预报结果,因为它们倾向于平均所有可能的结果。相比之下,PreDiff基于潜在扩散模型,能够生成多个可能的未来场景。这种方法允许模型生成清晰、多样化的预报结果,更好地表示预报的不确定性,捕捉到多种可能的天气发展路径。例如,在面对一个可能发展成暴雨或迅速消散的天气系统时,PreDiff可以生成多个不同强度的预报,而不是生成一个模糊的“平均”结果。
在图片生成质量方面,PreDiff取得了显著进步。在SEVIR数据集上,PreDiff在弗雷歇视频距离(Fréchet video distance,FVD; Unterthiner et al.,2018)指标上的表现远超其他模型,FVD是一个评估生成视频质量的指标,更低的分数表示生成的预报在视觉上更接近真实数据分布。PreDiff的优异表现意味着它生成的预报在视觉上更逼真,更接近实际的降水模式。同时,PreDiff通过引入知识对齐机制,在遵循物理约束方面取得了重大突破。这一机制允许模型在生成过程中考虑物理定律和领域知识。
博洛尼亚大学的Asperti et al.(2023)开发了生成式集合扩散模型(generative ensemble diffusion,GED)。他们使用了ERA-5(Hersbach,2020)再分析数据集的子集,该数据集涵盖了2016—2021年中欧地区的每小时降水数据,以及风速、陆地-海洋掩膜和地理位势高度等辅助气象特征。GED方法的核心理念是利用扩散模型生成多个可能的天气情景,这种方法能够更好地模拟天气系统的随机性和不确定性。随后,通过一个精心设计的后处理网络,将这些多样化的情景综合成最终的降水预测。该方法的技术核心包括采用U-Net(Ronneberger et al.,2015)结构的去噪网络和无分类器的条件扩散方法。研究者们认为,这种方法不仅能提高预测的准确性,还能为气象学家提供更丰富的天气可能性信息,尤其是在面对极端天气事件时。
将GED与多个传统的U-Net模型,包括Core U-Net、Broad U-Net和Weather Fusion U-Net(WF-UNet),进行了全面比较。评估过程采用了多项量化指标,主要包括MSE、准确率、精确率和召回率。结果显示,GED方法在所有评估指标上都显著优于传统U-Net模型,尤其是在预测未来3 h的降水情况时表现突出。具体来说,在EU50数据集上,GED方法在1、2和3 h的预测中明显优于其他对比模型。此外,研究还特别强调了GED方法在处理罕见极端天气事件方面的卓越表现。这一点尤为重要,因为准确预测极端天气事件对防灾减灾具有重大意义。
此外,布里斯托大学的Addison et al.(2024)开发了一种基于扩散模型的机器学习方法(CPMGEM),用于高分辨率(8.8 km)的区域气候模式(CPM)在英格兰和威尔士地区的日均降水模拟。通过与CPM模拟结果的对比,证明了该方法能够以较低的计算成本生成具有真实空间结构的高分辨率降水样本,并且在极端事件(如100年一遇的强度)的表现上也具有较好的技巧; 上海交通大学的Grona et al.(2024)提出了CasCast,可以在高分辨率(1 km)下进行训练和预报,并在潜空间中使用扩散模型进行概率建模,显著提高了对区域极端降水的预报技巧(在某些指标上,相比基线模型提升高达91.8%); 哈尔滨工业大学的Yu et al.(2024)提出了DiffCast,用于短期降水预报。该框架将降水系统分解为全局确定性运动和局部随机变化两部分,分别用确定性组件和随机扩散组件来建模,在4个公开的雷达回波数据集上进行的大量实验表明,DiffCast框架显著提高了各种骨干网络的预测性能,在多个评价指标上,相比基线模型取得了显著提升,尤其是在细节丰富程度和不确定性表达方面表现出色。
2.2 在数据同化中的应用
数据同化是在动态系统中基于观测数据来推断系统状态的过程。随着观测技术的发展,特别是气象卫星的广泛部署,可获取的观测数据量大幅增加。然而,由于计算资源的限制,当前业务系统只能同化其中5%~10%的卫星数据,尽管这些数据已经包含了对特定预报最关键的信息(Bauer et al.,2015)。此外,传统方法在处理长时间序列或复杂高维系统时,不仅计算开销大,还存在难以处理强非线性动力过程、难以准确刻画误差协方差结构等问题。近年来,随着机器学习特别是生成式模型在处理高维数据方面取得突破,为解决这些问题提供了新的思路。
Rozet and Louppe(2023)提出了SDA(score-based data assimilation)方法,这是一种新的数据同化方法,其核心创新在于利用基于得分的生成模型来表示动态系统的状态轨迹,并通过将长轨迹分解为子轨迹来实现高效学习和推断。该方法将观测模型与训练过程解耦,实现了零样本观测场景的适应性,并能够非自回归地同时生成所有状态。SDA避免了传统方法中反复模拟或微分物理模型的计算负担,同时提供了对整个轨迹后验分布的估计。在Lorenz(1963)Kolmogorov(1991)等复杂系统的实验中,特别是在处理稀疏观测和高噪声情况时,SDA展现出了优秀的性能。
英伟达的Manshausen et al.(2024)利用扩散模型训练模型生成符合高分辨率快速刷新天气模式(high-resolution rapid refresh model,HRRR; Benjamin et al.,2015)产品分布的天气场。利用SDA框架将稀疏气象站数据融入模型,生成降水和地表风场,并首次在千米尺度上实现了基于得分的气象站数据同化。即使只使用有限的观测数据(约40个气象站),该方法在地表风场估计上就已经优于HRRR分析场,降水误差也与HRRR分析场相当。同时模型展现出学习到的物理关系,能够根据部分变量重建缺失变量。总之提供了一种简单、可扩展的方法,可以低成本、低延迟地生成千米尺度的集合再分析,与业务系统相当,为未来更复杂的数据同化系统奠定了基础。
欧洲中期天气预报中心(Europen Centre for Medium-Range Weather Forecasts,ECMWF)和苏黎世联邦理工学院提出了DiffDA(Huang et al.,2024),该模型利用预训练的GraphCast(Lam et al.,2023)神经网络作为扩散模型的骨干网络,在推理阶段采用稀疏观测条件,尝试将地面气象观测站、高空探测气球、飞机测量和卫星反演数据同化到0.25°×0.25°的格点数据中。数据同化对天气预报和气候建模至关重要,但传统方法计算成本高。相比之下,DiffDA大幅降低了计算成本,单个高端PC即可在15~30 min内完成一次数据同化。DiffDA首次将Inpainting技术(Lugmayr et al.,2022)应用到数据同化过程中,用来整合稀疏的观测数据。Inpainting是一种在扩散模型训练完成后,在生成或推理阶段使用的技术,它允许模型在给定部分已知信息的情况下,生成或重建缺失的部分,并已成功应用于图像修复、文物修复、医学成像等领域。
DiffDA通过3类实验全面验证了其同化性能。在单步数据同化实验中,通过结合48 h预报和不同数量的观测列进行同化,结果表明即使在观测数据极少的情况下(如4 000个观测点,占总数据的不到0.4%),同化数据的精度也优于原始预报。当观测列增加到40 000个时,部分变量的同化误差甚至低于6 h预报误差。自回归数据同化实验模拟了连续同化过程,发现非固定采样策略能有效控制误差累积,保持同化数据的稳定性。基于同化数据的预报实验则显示,使用同化后的数据进行48 h预报,其误差可与直接使用ERA-5数据的72 h预报相媲美,这意味着同化数据在预报中的使用只会导致最多24 h预报时效的损失。尽管如此,DiffDA仍存在一些局限性。目前,该模型仅支持单时间步的点测量作为观测,主要关注三维空间的同化,实验主要基于模拟观测(使用ERA-5数据)。下一步,该机构计划支持更广泛的观测类型,如卫星图像和雷达探测,处理多时间步的观测数据,并探索如何使用这种方法来改善长期天气和气候预测。
哥伦比亚大学的Qu et al.(2024)提出了SLAMS(score-based latent assimilation in multimodal setting)。SLAMS在潜在空间中进行基于得分的数据同化,能够同时处理多模态数据,它使用VAE将不同模态的异构数据(如背景状态、地面站观测和卫星图像)映射到一个统一的潜在空间(latent space)。在这个潜在空间中,SLAMS采用扩散模型作为生成框架,实现条件生成和贝叶斯推断。具体来说,它使用得分匹配来训练扩散模型,并通过反向随机微分方程进行采样(Song et al.,2020)。这种方法不仅能够处理多模态输入,还能生成分析状态的集合,从而实现不确定性量化。此外,SLAMS通过在潜在空间中操作,提高了对低分辨率、噪声和稀疏输入的鲁棒性。这种创新方法为处理复杂的地球系统数据同化问题提供了一个灵活而强大的框架。
SLAMS的表现在多种复杂情况下都令人鼓舞,研究团队通过一系列严格的测试,模拟了现实世界中常见的数据问题,如低分辨率、高噪声和稀疏采样。具体来说,他们将数据分辨率降低到原来的1/20,添加了相当大的噪声(σ2=4.0),并模拟了大范围的数据缺失(每16个点取样一次)。结果显示,SLAMS在这些困难条件下依然保持了稳定性,特别是在处理高空大气数据时,引入卫星观测信息带来了明显改善。研究者使用Wasserstein距离(Martin et al.,2017)来衡量模型输出与真实数据的接近程度,发现SLAMS在大多数情况下都优于传统的基于像素的方法。这些发现意味着SLAMS有潜力应对真实世界数据同化中的各种挑战,尤其是在处理多源、不完美数据时表现出色,这为提高天气预报和气候模型的准确性提供了新的可能。
2.3 在空间降尺度中的应用
空间分辨率是地球系统模拟中的关键问题。地球系统模拟通常以较粗的分辨率进行,高分辨率模拟的计算成本非常高(Hourdin et al.,2017; 杨淑贤等,2022)。尽管传统的降尺度方法(如统计降尺度和动力降尺度)在一定程度上能够提高数据的分辨率,但它们往往面临多重挑战:首先需要消耗大量计算资源进行区域模式嵌套运算; 其次在捕捉复杂系统(如极端降水事件、局地地形效应等)的非线性特征时存在精度不足的问题; 第三,传统方法难以量化预测的不确定性,无法提供概率分布预测。值得注意的是,在计算机视觉领域,类似的降尺度问题通常被称为超分辨率重建(super-resolution,SR),该深度学习的方法被成功应用到气象要素降尺度中(匡秋明等,2022),随着生成式人工智能的发展,从早期的GANs到扩散模型,都为解决超分辨率问题提供了新思路。其中,Saharia et al.(2023)首次将扩散模型引入超分辨率任务,开发出SR3模型,在CelebA-HQ和ImageNet数据集上实现了超过传统GANs方法4.7 dB的峰值信噪比(PSNR)提升,同时生成结果的细节纹理更加自然逼真。这一技术突破启发了气候学界,研究者开始尝试将扩散模型的概率生成框架引入气候降尺度领域,通过构建物理约束下的条件扩散模型,在降低计算成本的同时提升对复杂气候过程的精细化表征能力。
斯坦福大学的Watt and Mansfield(2024)基于扩散模型进行气候数据的降尺度。将2°分辨率的ERA-5气候再分析数据提升到0.25°的分辨率,研究区域为美国大陆,该研究处理了3个具体变量:2 m气温、100 m纬向风和100 m经向风。模型还使用了额外的输入特征,包括地形高度、陆海分布等固定特征,以及月份和1 d中的时间等时间信息,以提高预测准确性。
他们采用了多层次的评估方法来验证模型性能,在定量指标方面使用了平均绝对误差(MAE)评估预测准确性,扩散模型在2 m气温、100 m纬向风和经向风3个变量上的MAE分别为0.328℃、0.308 m·s-1和0.319 m·s-1,优于U-Net的表现(0.384℃、0.335 m·s-1和0.348 m·s-1)。还使用了CRPS评估概率预测质量,扩散模型在这3个变量上的CRPS分别为0.254、0.224和0.232。在空间分布方面,扩散模型在复杂地形区域(如落基山脉)表现出色,能更好地捕捉地形引起的局部变化。频谱分析显示,扩散模型在所有空间尺度上都表现更好,特别是在处理高频变化时优势明显。通过生成30个样本的集合预测,研究发现模型在空间梯度较大的区域(如山地地形和天气锋面)会给出较高的不确定性估计,这与物理规律相符。虽然其计算成本比U-Net高,但比直接运行高分辨率气候模型要低许多,显示出实际应用潜力。研究表明,扩散模型在提供高质量、带有不确定性估计的高分辨率气候数据方面具有明显优势。
Google Research的Lopez-Gomez et al.(2024)提出了一种新的气候模型降尺度方法,结合了动力降尺度和生成式人工智能。他们提出的混合方法包含两个步骤:首先使用RCM(regional climate model)将地球系统模型ESM(earth system model)输出降尺度到一个中等分辨率(45 km),然后使用扩散模型进一步将分辨率提升到更高精度(9 km)。这种方法巧妙地结合了基于物理的模型的泛化能力和扩散模型的高效采样特性,不仅显著降低了计算成本,还保持了结果的物理一致性。该篇文章使用第六次国际模式耦合计划(CMIP6)多模型集合的美国西部降尺度数据集(western United States downscaled dataset,WUS-D3)对该方法进行了全面评估。结果显示,该混合方法在多个方面都优于传统方法,首先,相比偏差校正和空间分解方法(bias correction and spatial disaggregation,BCSD),新方法的CRPS降低了40%以上。其次,在捕捉气象场的频谱特征和多变量相关性方面表现更好,这对于评估复合极端天气事件(如由圣安娜风引发的野火风险)特别重要。第三,该方法能够生成概率分布预测,为不确定性量化提供了更好的支持。在计算效率方面,该方法仅使用了原始动力降尺度2.5%的计算资源就实现了相似的效果。研究还特别验证了该方法在处理未见过的气候模型数据时的泛化性能,结果表明即使只用单个气候模型的数据训练,该方法也能很好地处理其他模型的数据。作者通过对比不同季节、不同区域(如沿海地区、山区等)的表现,证明了该方法在各种情况下都能保持稳定的性能。这些结果表明,该方法为大规模气候模型集合的区域降尺度提供了一个实用且高效的解决方案,对于提高区域气候变化风险评估的准确性具有重要意义。
CorrDiff(Mardani et al.,2025)是由NVIDIA开发的Earth-2项目中的一个先进生成式随机降尺度模型,它通过创新的机器学习方法,将全球天气模型的25 km分辨率数据转化为2 km高分辨率的天气预报。这一模型采用了一个两阶段降尺度策略,首先利用UNet结构的回归模型预测高分辨率数据的条件平均值,这一步骤能够捕捉到大尺度到小尺度变化的主要趋势。紧接着,通过一个精心设计的扩散模型对残差进行校正,这一步骤对于提高生成数据的高保真度至关重要,确保了生成的高分辨率天气数据在细节上的准确性和在物理上的合理性。
这种结合回归和扩散的策略不仅提高了模型的预测精度,还增强了对复杂气象现象的模拟能力。CorrDiff模型的评估结果表明,它在预测技能上具有显著优势,其均方根误差(RMSE)和CRPS均优于现有的基线模型,有效地捕捉到了天气现象的关键特征。此外,功率谱(power spectra)分析(Kane and Teixeira,1990)进一步证实了模型在各个空间尺度上对大气动力学特征的准确再现,这表明CorrDiff在模拟大气环流和天气系统时保持了高度的物理一致性。同时,概率分布比较显示,CorrDiff能够精确模拟极端天气事件的统计特性,包括对重尾分布(heavy-tailed distribution; Pisarenko and Rodkin,2010)和极端值的准确预测,这对于提高极端天气事件的预报能力具有重要意义。
CorrDiff模型的案例研究进一步展示了其在模拟台风和锋面系统等复杂气象现象方面的出色表现,这些现象因其动态复杂性和空间尺度的多样性,对天气预报模型提出了严峻挑战。模型在这些案例中的细节刻画,不仅证明了其在天气预报中的高性能,也展现了其在捕捉和再现复杂气象现象方面的潜力。此外,CorrDiff模型在计算效率和能源效率方面具有显著优势,如在单个GPU上的运行速度比传统模型快22倍,能源效率提高了1 300倍以上,这些评估结果共同证明了CorrDiff模型在天气预报中的实用性和前瞻性。
2024年8月,英伟达公司继CorrDiff之后又提出了StormCast(Pathak et al.,2024),用于模拟千米尺度的对流允许天气模型。StormCast同样采用上述的两步法,结合确定性回归和随机扩散来生成高分辨率的中尺度天气预报。它使用3.5 a的HRRR小时数据进行中尺度状态训练,并使用ERA-5再分析数据进行综合尺度条件约束。该模型能够生成3 km分辨率、12 h自回归预报,包含多个垂直层级的99个大气变量。作为首个能够产生真实对流动力学(包括湿空气上升流和冷池)的千米尺度天气模型的生成式机器学习模型,StormCast为改进中尺度天气预报开辟了新的途径。
研究团队对StormCast进行了全面评估,在降水预报方面,StormCast的分数技巧评分(fractions skill score,FSS)与HRRR相当,特别是在前12 h内。对于轻度降水(20 dBZ阈值),StormCast集合概率匹配平均(PMM)预报在3~5 h内甚至优于HRRR。此外,StormCast生成的功率谱和概率分布与实际观测非常接近,相对误差不到20%。在定性评估中,StormCast成功模拟了复杂的对流动力学,包括垂直连贯的湿空气上升流和冷池结构。这些结果表明,StormCast不仅能够产生准确的预报,还能捕捉到复杂的大气物理过程。通过结合机器学习的效率和传统数值模型的物理基础,StormCast为未来天气预报和气候降尺度应用提供了有价值的新方法,展示了生成式机器学习在模拟复杂的千米尺度大气动力学方面的巨大潜力。
加利福尼亚大学欧文分校的Srivastava et al.(2023)提出了一种用于概率降水降尺度的方法STVD(spatiotemporal video diffusion),用于提高气候模型中的降水预测分辨率。研究团队使用了FV3GFS(Putman and Lin,2009; NOAA的全球大气模型)的输出数据,这些数据是基于11个初始条件集合的13个月模拟,提供了相当于11 a的参考数据。STVD的主要任务是将200 km水平分辨率的“粗网格”降水数据降尺度到25 km水平分辨率的“细网格”,实现了8倍的分辨率提升。FV3GFS使用立方球面网格结构,全球表面被分为6个面片,粗网格中每个面片为48×48点阵,精细网格中为384×384点阵。STVD结合了确定性下采样器和条件扩散模型,利用时空注意力机制处理低分辨率输入序列,并生成随机残差添加细节。这种方法能够捕捉降水的多模态分布,利用时间信息改善预测,并准确模拟与地形相关的降水模式。STVD的创新之处在于将视频超分辨率技术应用于气候科学领域,解决了传统降尺度方法中的模式平均问题。该方法不仅提高了降水预测的空间分辨率,还保持了时间连贯性和物理一致性。
STVD采用了多种指标来全面衡量性能。这些指标包括CRPS、MSE、地球移动距离(EMD;Rubner et al.,2000)、99.999百分位误差(PE)和空间自相关误差(SAE;Cliff and Ord,1984)。实验结果表明,STVD在所有这些指标上都优于现有方法。特别是,STVD在捕捉极端降水事件和复杂地形(如山脉)对降水模式的影响方面表现出色。研究团队还进行了广泛的消融实验,证明了时间上下文信息和额外气候输入数据对模型性能的重要性。此外,他们探讨了模型在不同采样步数下的精度-真实性权衡,为实际应用提供了灵活性。在定性分析中,STVD生成的高分辨率降水图像在视觉上更接近真实数据,能够更好地捕捉细节特征。这些结果表明,STVD为气候变化适应性规划、极端天气预测、水资源管理等领域提供了更精确的降水预测工具,具有重要的科学和实际应用价值。
2.4 在天气模拟中的应用
2022年至今,气象大模型炙手可热,FourCastNet首次将空间分辨率提高到0.25°,Pangu-Weather在部分预报变量的精度上首次超过传统数值模式预报,GraphCast能够在90%预报变量上超过传统数值预报,虽然基于回归的机器学习模型在预测技巧得分上表现出色,但它们的预测结果在物理一致性上存在显著问题。Bonavita(2024)指出,这些模型的预测结果在能量谱上与训练数据(如ERA-5)和传统的数值天气预报模型有显著差异,其有效分辨率接近500~700 km,远低于名义上的0.25°分辨率,尤其是在中小尺度天气现象(如空间尺度小于300~400 km的天气现象)上,这些模型的表现不佳,无法有效捕捉较小尺度的天气细节,导致预测结果过于平滑(黄小猛等,2024)。扩散模型可以提供更精确和详细的模拟结果,这些模型能够捕捉大气系统的复杂动态,从而生成高度逼真的天气模拟结果。扩散模型的一个关键优势在于其能够模拟天气系统的随机性和不确定性,这对于准确预测极端天气事件和局部气候变化尤为重要。
Google Research团队提出的可扩展的集成包络扩散采样器(scalable ensemble envelope diffusion sampler,SEEDS;Li et al.,2024)方法创新性地将扩散模型应用于天气预报领域,为大规模集合预报的生成提供了一个高效解决方案。该方法采用改良的ViT(vision transformer; Dosovitskiy et al.,2021)架构,通过轴向注意力机制处理气象数据,在20 a的全球集合预报系统(Zhou et al.,2017)回顾预报和ERA-5再分析数据上进行训练。实验表明,仅需1~2个物理模型预报作为种子,就能在TPU上3 min内生成256个高质量的集合成员。通过RMSE、距平相关系数(ACC)、CRPS等多个预报技能评分的系统评估,SEEDS不仅达到而且在某些方面超越了传统的31成员全球集合预报系统系统。研究发现,SEEDS可能已经学习到了大气系统的内在动力学结构(attractor of the atmosphere),这使得模型能够有效扩展相空间的包络面(envelopes of the phase),预测出与种子预报有较大偏差的极端事件。研究团队通过两种模式(生成式集合模拟模式和生成式后处理模式)的设计实现了这一目标,其中生成式集合模拟模式模式专注于模拟现有预报系统的分布,而生成式后处理模式模式通过融合ERA-5再分析数据来修正预报偏差。特别是在近地面温度预报中,当再分析数据混合比例达到约50%时,系统性偏差得到了显著改善。这种灵活的设计为业务化天气预报提供了实用的技术方案。关于生成式AI中常见的“幻觉”问题,研究表明,SEEDS生成的样本与被模拟模型的轨迹具有良好的相关性,并展现出相似的能谱、空间连贯性和变量相关性。然而,研究团队也承认,现有的诊断方法还不足以完全排除个别样本中出现“幻觉”的可能性。
Google DeepMind团队提出了GenCast(Price et al.,2025),这也是一种基于扩散模型的机器学习方法,具有显著的技术优势。它通过迭代细化过程生成未来的天气状态,使用去噪神经网络逐步去除噪声,生成全球15 d的集合预报,分辨率为0.25°,预报时间步长为12 h。GenCast的训练数据来自ERA-5再分析数据集,涵盖了40 a的历史天气数据。与NWP相比,GenCast在计算效率和预报速度上表现出色,能够在8 min内生成15 d的全球预报。此外,GenCast生成的集合成员具有高空间一致性和物理合理性,能够很好地捕捉天气系统的复杂动态和不确定性。在评估效果方面,GenCast在多个指标上显著优于ECMWF的集合预报系统。GenCast在97.2%的评估目标上表现出更高的预报技能,尤其是在短期预报(1~5 d)和极端天气事件的预测上表现尤为突出。模型在预测热带气旋路径、风能发电等方面也表现出色,能够为决策者提供更准确的概率预报。此外,GenCast的集合成员具有较高的空间一致性和物理合理性,能够很好地捕捉天气系统的空间特征和多变量关系。这些评估结果表明,GenCast在天气预报的精度和可靠性上具有显著优势,为未来的业务天气预报提供了新的可能性。
3 未来发展趋势与前景预测
随着扩散模型在气象学领域的应用不断深入,其发展正从解决局部问题向应对系统性挑战转变。前述的降水预报、数据同化等应用主要聚焦于单一过程或特定尺度的优化,而未来的发展将更加注重多尺度、多过程的整体解决方案,时间上从天气尺度延伸至气候尺度,空间上从区域尺度扩展至全球尺度。以下5个方向代表了扩散模型在气象学中最具潜力的应用领域,涵盖了从微观到宏观、从短期到长期的多个时空尺度:气候变化情景生成、多尺度天气-气候联合建模、气象数据补全与重建、全球-区域尺度联动和气象模型不确定性量化。通过探索这些新兴应用,有望在提高预报精度、增进气候认知、支持决策制定等方面取得突破性进展,为应对全球气候变化挑战提供强有力的科技支撑。
3.1 气候变化情景生成
扩散模型可以用于生成多样化的未来气候情景,为气候变化影响评估和适应策略制定提供支持。这一应用的重要性在于传统气候模型往往提供有限数量的未来情景,而扩散模型可以生成大量可能的情景,更全面地覆盖未来的不确定性,生成的情景可以包含极端事件和罕见气候模式,有助于评估“最坏情况”和“尾部风险”,这些情景可以为政策制定者、城市规划者和行业决策者提供更丰富的信息基础,支持更具弹性的长期规划。然而这一应用也面临挑战,如确保生成的情景在物理上合理,以及与现有气候模型的集成等。
3.2 多尺度天气-气候联合建模
探索将扩散模型应用于天气-气候耦合系统,实现从天气尺度到气候尺度的无缝预测,打破传统天气预报和气候预测之间的界限,提供更连贯的跨尺度预测。
这有助于理解短期天气事件如何影响长期气候变化,以及气候变化如何影响天气模式,并为季节性预报和次季节预报提供新的方法论。这对农业、水资源管理等领域至关重要,这一应用需要解决的挑战包括如何在模型中有效表示不同时间尺度的物理过程,以及如何处理大规模计算需求。
3.3 气象数据补全与重建
利用扩散模型的生成能力,对历史气象数据中的缺失部分进行补全,或重建古气候记录。这一应用的价值在于提高历史气象数据集的完整性,为气候研究提供更可靠的长期数据,帮助恢复因仪器故障、战争或其他原因导致的数据缺失,提高数据的连续性,为古气候重建提供新的工具,结合地质证据和代用指标,生成更详细的古气候场景。
3.4 全球-区域尺度联动
开发基于扩散模型的全球-区域尺度联动预报系统,实现从全球到局地的一体化预报;提供更连贯的多尺度预报,减少全球模型和区域模型之间的不一致性;改善局地预报的边界条件,提高区域和局地预报的准确性,有助于研究全球气候变化对区域和局地天气的影响。这一应用需要解决的技术挑战包括如何在模型中有效处理不同尺度的大气动力学,以及如何设计计算高效的多尺度模型架构。
3.5 气象模型不确定性量化
探索利用扩散模型的概率生成特性,更好地量化和表征气象模型预报的不确定性,这一研究方向的重要性在于提供更准确的概率预报,有助于风险评估和决策制定,改善集合预报系统的性能,特别是在表征极端事件的不确定性方面,帮助识别模型预报中的系统性偏差和不确定性来源,为模型改进提供指导。这一应用需要解决的挑战包括如何有效表示和传达复杂的多维不确定性信息,以及如何将扩散模型的不确定性量化与传统集合预报方法相结合。
4 结论与讨论
本文全面回顾了扩散模型在气象领域的应用进展。研究表明,扩散模型在多个气象应用场景中展现出了显著优势:扩散模型在降水预报上能够生成多样化的降水情景,提供更准确的概率分布预测,特别是在处理极端降水事件时表现出色; 基于扩散模型的数据同化方法,如SDA、DiffDA和SLAMS,能够有效处理多模态、稀疏和噪声数据,提高同化效率和精度。在空间降尺度方面,CorrDiff、StormCast和STVD等模型展示了扩散模型在提高空间分辨率方面的潜力,能够生成更细致、物理一致的高分辨率天气场; 对于天气模拟,SEEDS和GenCast等模型证明了扩散模型在模拟复杂大气动力学和预测极端天气事件方面的能力。
尽管扩散模型在气象领域取得了显著进展,但仍面临一些挑战。模型处理大规模数据时的计算复杂度仍然较高,这限制了它们在实时天气预报中的应用。此外,在保证物理一致性方面需要进一步改进,以确保模型的可靠性。在长期预测中,生成的高分辨率数据的稳定性也需要进一步验证,以提高预测的准确性。在天气模拟中,尽管模型能够模拟复杂的大气动力学,但在模拟某些特定大气过程(如云微物理过程)时的精确度还有待提高。最重要的是,模型的可解释性仍是一个普遍存在的挑战,这可能影响气象学者对模型结果的信任和使用。
解决这些挑战将是未来研究的重要方向,也是推动扩散模型在气象学中更广泛应用的关键。但同时,扩散模型为气象学带来了新的研究范式和技术创新,有望在提高天气预报准确性、增强气候模型分辨率以及改进极端天气预警等方面发挥重要作用。随着技术的不断进步和跨学科合作的深入,扩散模型有望在未来气象科学研究和业务应用中占据重要地位。这不仅能够提高我们对气象现象的理解,还能为应对气候变化挑战提供有力支持。
1前向(反向)扩散过程的马尔可夫链通过缓慢添加(去除)噪声来生成样本(引自Ho et al.(2020)
Fig.1Schematic of the Markov chain for the forward (reverse) diffusion process, in which a sample is generated by gradually adding (or removing) noise (adapted from Ho et al. (2020) )
Addison H, Kendon E, Ravuri S, et al., 2024. Machine learning emulation of precipitation from km-scale regional climate simulations using a diffusion model[EB/OL]. arXiv: 2407. 14158. DOI: 10. 48550/arXiv. 2407. 14158.
Asperti A, Merizzi F, Paparella A, et al., 2023. Precipitation nowcasting with generative diffusion models[EB/OL]. arXiv: 2308. 06733. DOI: 10. 48550/arXiv. 2308. 06733.
Bauer P, Thorpe A, Brunet G, 2015. The quiet revolution of numerical weather prediction[J]. Nature, 525(7567): 47-55. DOI: 10. 1038/nature14956.
Benjamin S G, Weygandt S S, Brown J M, et al., 2015. A North American hourly assimilation and model forecast cycle: the rapid refresh[J]. Mon Wea Rev, 144(4): 1669-1694. DOI: 10. 1175/mwr-d-15-0242. 1.
Bi K F, Xie L X, Zhang H H, et al., 2023. Accurate medium-range global weather forecasting with 3D neural networks[J]. Nature, 619(7970): 533-538. DOI: 10. 1038/s41586-023-06185-3.
Bonavita M, 2024. On some limitations of current machine learning weather prediction models[J]. Geophys Res Lett, 51(12): e2023GL107377. DOI: 10. 1029/2023GL107377.
Brock A, Donahue J, Simonyan K, 2018. Large scale GAN training for high fidelity natural image synthesis[EB/OL]. arXiv: 1809. 11096. DOI: arxiv. org/abs/1809. 11096v2.
陈元昭, 林良勋, 王蕊, 等, 2019. 基于生成对抗网络GAN的人工智能临近预报方法研究[J]. 大气科学学报, 42(2): 311-320. Chen Y Z, Lin L X, Wang R, et al., 2019. A study on the artificial intelligence nowcasting based on generative adversarial networks[J]. Trans Atmos Sci, 42(2): 311-320. DOI: 10. 13878/j. cnki. dqkxxb. 20190117001. (in Chinese).
Cliff A D, Ord J K, 1984. Spatial processes: models & applications[J]. Quarterly Review of Biology, 147(3): 515. DOI: 10. 2307/5981590.
Deng J, Dong W, Socher R, et al., 2009. ImageNet: a large-scale hierarchical image database[C]//2009 IEEE Conference on Computer Vision and Pattern Recognition, Miami, FL, USA. DOI: 10. 1109/CVPR. 2009. 5206848.
Dhariwal P, Nichol A, 2021. Diffusion models beat GANS on image synthesis[EB/OL]. arXiv: 2105. 05233. DOI: 10. 48550/arXiv. 2105. 05233.
Dijkstra H A, Nonlinear, 2013. Climate dynamics[M]. Cambridge, UK: Cambridge University Press. DOI: 10. 1017/cbo9781139034135.
Dosovitskiy A, Beyer L, Kolesnikov A, et al., 2021. An image is worth 16x16 words: transformers for image recognition at scale[EB/OL]. arXiv: 2010. 11929. DOI: 10. 48550/arXiv. 2010. 11929.
Gao Z, Shi X, Han B, et al., 2024. Prediff: precipitation nowcasting with latent diffusion models[EB/OL]. arXiv: 2307. 10422v2. DOI: 10. 48550/arXiv. 2307. 10422.
Garcia S V, Hoogeboom E, Fuchs F, et al., 2021. E(n) equivariant normalizing flows[EB/OL]. arXiv: 2105. 09016. DOI: 10. 48550/arXiv. 2105. 09016.
Gong J C, Bai L, Ye P, et al., 2024. CasCast: skillful high-resolution precipitation nowcasting via cascaded modelling[EB/OL]. arXiv: 2402. 04290. DOI: 10. 48550/arXiv. 2402. 04290.
Goodfellow I J, Pouget-Abadie J, Mirza M, et al., 2014. Generative adversarial networks[EB/OL]. arXiv: 1406. 2661. DOI: 10. 48550/arXiv. 1406. 2661.
Guen V L, Thome N, 2020. Disentangling physical dynamics from unknown factors for unsupervised video prediction[C]//2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition(CVPR). Seattle, WA, USA: 11471-11481. DOI: 10. 1109/CVPR42600. 2020. 01149.
Hersbach H, 2000. Decomposition of the continuous ranked probability score for ensemble prediction systems[J]. Wea Forecasting, 15(5): 559-570. DOI: 10. 1175/1520-0434(2000)015<0559: dotcrp>2. 0. co;2.
Hersbach H, Bell B, Berrisford P, et al., 2020. The ERA5 global reanalysis[J]. Quart J Roy Meteor Soc, 146(730): 1999-2049. DOI: 10. 1002/qj. 3803.
Heusel M, Ramsauer H, Unterthiner T, et al., 2017. GANs trained by a two time-scale update rule converge to a local Nash equilibrium[EB/OL]. arXiv: 1706. 08500. DOI: 10. 48550/arXiv. 1706. 08500.
Ho J, Jain A, Abbeel P, 2020. Denoising diffusion probabilistic models[EB/OL]. arXiv: 2006. 11239. DOI: 10. 48550/arXiv. 2006. 11239.
Hoogeboom E, Satorras V G, Vignac C, et al., 2022. Equivariant diffusion for molecule generation in 3D[C]//International conference on machine learning: 8867-8887. DOI: 10. 48550/arXiv. 2203. 17003.
Hourdin F, Mauritsen T, Gettelman A, et al., 2017. The art and science of climate model tuning[J]. Bull Amer Meteor Soc, 98(3): 589-602. DOI: 10. 1175/bams-d-15-00135. 1.
Huang L W, Gianinazzi L, Yu Y J, et al., 2024. DiffDA: a diffusion model for weather-scale data assimilation[EB/OL]. arXiv: 2401. 05932. DOI: 10. 48550/arXiv. 2401. 05932.
黄小猛, 林岩銮, 熊巍, 等, 2024. 数值预报AI气象大模型国际发展动态研究[J]. 大气科学学报, 47(1): 46-54. Huang X M, Lin Y L, Xiong W, et al., 2024. Research on international developments of AI large meteorological models in numerical forecasting[J]. Trans Atmos Sci, 47(1): 46-54. DOI: 10. 13878/j. cnki. dqkxxb. 20231201001. (in Chinese).
IPCC, 2021. Climate change 2021: the physical science basis[R]. Cambridge, United Kingdom and New York: Cambridge University Press.
Jain A, Mildenhall B, Barron J T, et al., 2022. Zero-shot text-guided object generation with dream fields[C]//2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). New Orleans, LA, USA: 857-866. DOI: 10. 1109/CVPR52688. 2022. 00094.
Jaynes E T, 1957. Information theory and statistical mechanics[J]. Phys Rev, 106(4): 620-630. DOI: 10. 1103/PhysRev. 106. 620.
Kalnay E, 2003. Atmospheric modeling, data assimilation and predictability[M]. Cambridge, UK: Cambridge University Press. DOI: 10. 1017/cbo9780511802270.
Kane R P, Teixeira N R, 1990. Power spectrum analysis of the time-series of annual mean surface air temperatures[J]. Clim Change, 17(1): 121-130. DOI: 10. 1007/BF00149003.
Kingma D P, Welling M, 2014. Auto-encoding variational Bayes arXiv: 1312. 6114V11. DOI: 10. 48550/arXiv. 1312. 6114.
Kingma D P, Salimans T, Poole B, et al., 2021. Variational diffusion models[J]. Advances in Neural Information Processing Systems, 34: 21696-21707.
Kolmogorov A N, 1991. The local structure of turbulence in incompressible viscous fluid for very l arge Reynolds numbers[J]. Proc R Soc Lond A, 434(1890): 9-13. DOI: 10. 1098/rspa. 1991. 0075.
Kong Z F, Ping W, Huang J J, et al., 2020. DiffWave: a versatile diffusion model for audio synthesis[EB/OL]. arXiv: 2009. 09761. DOI: arxiv. org/abs/2009. 09761v3.
匡秋明, 沈晨凯, 于廷照, 等, 2022. 多尺度残差金字塔网络模型三维气象要素降尺度研究[J]. 大气科学学报, 45(5): 660-673. Kuang Q M, Shen C K, Yu T Z, et al., 2022. Weather statistical downscaling using a 3D multi-scale residual Laplacian pyramid network[J]. Trans Atmos Sci, 45(5): 660-673. DOI: 10. 13878/j. cnki. dqkxxb. 20220424002. (in Chinese).
Lam R, Sanchez-Gonzalez A, Willson M, et al., 2023. Learning skillful medium-range global weather forecasting[J]. Science, 382(6677): 1416-1421. DOI: 10. 1126/science. adi2336.
Leinonen J, Hamann U, Nerini D, et al., 2023. Latent diffusion models for generative precipitation nowcasting with accurate uncertainty quantification[EB/OL]. arXiv: 2304. 12891. DOI: 10. 48550/arXiv. 2304. 12891.
Leutbecher M, Palmer T N, 2008. Ensemble forecasting[J]. J Comput Phys, 227(7): 3515-3539. DOI: 10. 1016/j. jcp. 2007. 02. 014.
Li L Z, Carver R, Lopez-Gomez I, et al., 2024. Generative emulation of weather forecast ensembles with diffusion models[J]. Sci Adv, 10(13): eadk4489. DOI: 10. 1126/sciadv. adk4489.
Lin T Y, Maire M, Belongie S, et al., 2014. Microsoft COCO: common objects in context[M]//Computer Vision—ECCV 2014. Cham: Springer International Publishing: 740-755. DOI: 10. 1007/978-3-319-10602-1_48.
Lopez-Gomez I, Wan Z Y, Zepeda-Núñez L, et al., 2024. Dynamical-generative downscaling of climate model ensembles[EB/OL]. arXiv: 2410. 01776. DOI: 10. 48550/arXiv. 2410. 01776.
Lorenz E N, 1963. Deterministic nonperiodic flow[J]. J Atmos Sci, 20(2): 130-141. DOI: 10. 1175/1520-0469(1963)020<0130: dnf>2. 0. co;2.
Lugmayr A, Danelljan M, Romero A, et al., 2022. RePaint: inpainting using denoising diffusion probabilistic models[C]//2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). New Orleans, LA, USA: 11451-11461. DOI: 10. 1109/CVPR52688. 2022. 01117.
马丽, 武永利, 董春卿, 等, 2024. 太行山复杂地形下华北暖季极端降水的时空分布特征[J]. 大气科学学报, 47(3): 438-449. Ma L, Wu Y L, Dong C Q, et al., 2024. Spatial-temporal distribution characteristics of extreme precipitation in the warm season in North China under the complex topography of the Taihang Mountains[J]. Trans Atmos Sci, 47(3): 438-449. DOI: 10. 13878/j. cnki. dqkxxb. 20230614001. (in Chinese).
Majda A J, Klein R, 2003. Systematic multiscale models for the tropics[J]. J Atmos Sci, 60(2): 393-408. DOI: 10. 1175/1520-0469(2003)060<0393: smmftt>2. 0. co;2.
Manshausen P, Cohen Y, Harrington P, et al., 2024. Generative data assimilation of sparse weather station observations at kilometer scales[EB/OL]. arXiv: 2406. 16947. DOI: 10. 48550/arXiv. 2406. 16947v3.
Mardani M, Brenowitz N, Cohen Y, et al., 2025. Residual corrective diffusion modeling for km-scale atmospheric downscaling[J]. Commun Earth Environ, 6: 124. DOI: 10. 1038/s43247-025-02042-5.
Martin Arjovsky, Soumith Chintala, Léon Bottou, 2017. Wasserstein generative adversarial networks[C]//Proceedings of the 34th International Conference on Machine Learning-Volume70. Sydney, Australia.
Nichol A, Dhariwal P, Ramesh A, et al., 2021. GLIDE: towards photorealistic image generation and editing with text-guided diffusion models[EB/OL]. arXiv: 2112. 10741. DOI: 10. 48550/arXiv. 2112. 10741v3.
Palmer T N, 2000. Predicting uncertainty in forecasts of weather and climate[J]. Rep Prog Phys, 63(2): 71-116. DOI: 10. 1088/0034-4885/63/2/201.
Pathak J, Cohen Y, Garg P, et al., 2024. Kilometer-scale convection allowing model emulation using generative diffusion modeling[EB/OL]. arXiv: 2408. 10958. DOI: 10. 48550/arXiv. 2408. 10958v1.
Peters O, Neelin J D, 2006. Critical phenomena in atmospheric precipitation[J]. Nat Phys, 2: 393-396. DOI: 10. 1038/nphys314.
Pisarenko V F, Rodkin M V, 2010. Heavy-tailed distributions in disaster analysis[M]. Dordrecht: Springer. DOI: 10. 1007/978-90-481-9171-0.
Poole B, Jain A, Barron J T, et al., 2022. DreamFusion: text-to-3D using 2D diffusion[EB/OL]. arXiv: 2209. 14988. DOI: 10. 48550/arXiv. 2209. 14988.
Price I, Sanchez-Gonzalez A, Alet F, et al., 2025. Probabilistic weather forecasting with machine learning[J]. Nature, 637(8044): 84-90. DOI: 10. 1038/s41586-024-08252-9.
Pulkkinen S, Nerini D, A Pérez Hortal, et al., 2019. Pysteps-a community-driven open-source library for precipitation nowcasting[J]. DOI: 10. 13140/RG. 2. 2. 31368. 67840.
Putman W M, Lin S, 2009. A finite-volume dynamical core on the cubed-sphere grid[C]//ASP Conference. Yokohama, Japan.
Qu Y Q, Nathaniel J, Li S L, et al., 2024. Deep generative data assimilation in multimodal setting[EB/OL]. arXiv: 2404. 06665. DOI: 10. 48550/arXiv. 2404. 06665.
Radford A, Kim J W, Hallacy C, et al., 2021. Learning transferable visual models from natural language supervision[EB/OL]. arXiv: 2103. 00020. DOI: 10. 48550/arXiv. 2103. 00020 Ramesh A, Pavlov M, Goh G, et al., 2021. Zero-shot text-to-image generation[EB/OL]. arXiv: 2102. 12092. DOI: 10. 48550/arXiv. 2102. 12092.
Ramesh A, Dhariwal P, Nichol A, et al., 2022. Hierarchical text-conditional image generation with CLIP latents[EB/OL]. arXiv: 2204. 06125. DOI: 10. 48550/arXiv. 2204. 06125.
Ravuri S, Lenc K, Willson M, et al., 2021. Skilful precipitation nowcasting using deep generative models of radar[J]. Nature, 597(7878): 672-677. DOI: 10. 1038/s41586-021-03854-z. Roe G, 2009. Feedbacks, timescales, and seeing red[J]. Annu Rev Earth Planet Sci, 37: 93-115. DOI: 10. 1146/annurev. earth. 061008. 134734.
Rombach R, Blattmann A, Lorenz D, et al., 2022. High-resolution image synthesis with latent diffusion models[C]//2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). New Orleans, LA, USA: 10674-10685. DOI: 10. 1109/CVPR52688. 2022. 01042.
Ronneberger O, Fischer P, Brox T, 2015. U-Net: convolutional networks for biomedical image segmentation[EB/OL]. arXiv: 1505. 04597. DOI: 10. 48550/arXiv. 1505. 04597.
Rozet F, Louppe G, 2023. Score-based data assimilation[EB/OL]. arXiv: 2306. 10574. DOI: 10. 48550/arXiv. 2306. 10574.
Rubner Y, Tomasi C, Guibas L J, 2000. The earth mover's distance as a metric for image retrieval[J]. Int J Comput Vis, 40(2): 99-121. DOI: 10. 1023/A: 1026543900054.
Saharia C, Ho J, Chan W, et al., 2023. Image super-resolution via iterative refinement[J]. IEEE Trans Pattern Anal Mach Intell, 45(4): 4713-4726. DOI: 10. 1109/TPAMI. 2022. 3204461.
Shi X J, Chen Z R, Wang H, et al., 2015. Convolutional LSTM network: a machine learning approach for precipitation nowcasting[J]. Adv Neural Inf Process Syst. DOI: 10. 1007/978-3-319-21233-3_6.
Sohl-Dickstein J N, Weiss E A, Maheswaranathan N, et al., 2020. Deep unsupervised learning using nonequilibrium thermodynamics. arXiv: 1503. 03585. DOI: 10. 48550/arXiv. 1503. 03585.
Song Y, Ermon S, Block A, et al., 2019. Generative modeling by estimating gradients of the data distribution[EB/OL]. arXiv: 1907. 05600. DOI: 10. 48550/arXiv. 1907. 05600.
Song Y, Sohl-Dickstein J, Kingma D P, et al., 2020. Score-based generative modeling through stochastic differential equations[EB/OL]. arXiv: 2011. 13456 DOI: 10. 48550/arXiv. 2011. 13456.
Srivastava P, Yang R H, Kerrigan G, et al., 2023. Precipitation downscaling with spatiotemporal video diffusion[EB/OL]. arXiv: 2312. 06071. DOI: 10. 48550/arXiv. 2312. 06071.
Strogatz S, Friedman M, Mallinckrodt A J, et al., 1994. Nonlinear dynamics and chaos: with applications to physics, biology, chemistry, and engineering[J]. Comput Phys, 8(5): 532. DOI: 10. 1063/1. 4823332.
Unterthiner T, van Steenkiste S, Kurach K, et al., 2018. Towards accurate generative models of video: a new metric & challenges[EB/OL]. arXiv: 1812. 01717. DOI: 10. 48550/arXiv. 1812. 01717.
Veillette M, Samsi S, Mattioli C, 2020. Sevir: a storm event imagery dataset for deep learning applications in radar and satellite meteorology[J]. Advances in Neural Information Processing Systems, 2020, 33: 22009-22019.
Wang Y, Long M, Wang J, et al., 2017. Predrnn: recurrent neural networks for predictive learning using spatiotemporal LSTMs[C]//Proceedings of the 31st International Conference on Neural Information Processing Systems. DOI: 10. 5555/3294771. 3294855. Watt R A, Mansfield L A, 2024. Generative diffusion-based downscaling for climate[EB/OL]. arXiv: 2404. 17752. DOI: 10. 48550/arXiv. 2404. 17752.
杨淑贤, 零丰华, 应武杉, 等, 2022. 人工智能技术气候预测应用简介[J]. 大气科学学报, 45(5): 641-659. Yang S X, Ling F H, Ying W S, et al., 2022. A brief overview of the application of artificial intelligence to climate prediction[J]. Trans Atmos Sci, 45(5): 641-659. DOI: 10. 13878/j. cnki. dqkxxb. 20210623003. (in Chinese).
Yu D M, Li X T, Ye Y M, et al., 2024. DiffCast: a unified framework via residual diffusion for precipitation nowcasting[C]//2024 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Seattle, WA, USA: 27758-27767. DOI: 10. 1109/CVPR52733. 2024. 02622.
Zhang Y C, Long M S, Chen K Y, et al., 2023. Skilful nowcasting of extreme precipitation with NowcastNet[J]. Nature, 619(7970): 526-532. DOI: 10. 1038/s41586-023-06184-4.
Zhou X Q, Zhu Y J, Hou D C, et al., 2017. Performance of the new NCEP global ensemble forecast system in a parallel experiment[J]. Wea Forecasting, 32(5): 1989-2004.: DOI: 10. 1175/waf-d-17-0023. 1.

地址:江苏南京宁六路219号南京信息工程大学    邮编:210044

联系电话:025-58731158    E-mail:xbbjb@nuist.edu.cn    QQ交流群号:344646895

大气科学学报 ® 2025 版权所有  技术支持:北京勤云科技发展有限公司