-
北极地区常年被海冰覆盖,在全球气候调节中起到重要作用。根据最新的IPCC-AR6报告显示,北极海冰的覆盖范围呈现逐年下降的趋势,到2050年前,极有可能在夏季出现整个北极海域无冰的情况(Li et al.,2021),且北极海域的海冰消融趋势几乎不可逆转。一方面,气温的升高使得冰盖融化,另一方面,冰盖融化的正反馈效应加剧全球气候变暖(Screen and Simmonds,2010)。
-
北极海冰的大面积消融将对人类的生产、生活造成巨大影响,比如海平面的持续升高,寒潮天气加剧等,但是也给北极资源的开发利用带来了发展机遇。例如随着海冰覆盖的持续减少,北极航道的通航时间将会延长,商业价值将会显著提升。尤其是北极的东北航道,在夏季已经部分解冻,船舶可在夏季月份通航(Stroeve et al.,2012)。然而,北极的开发利用还面临诸多困难,一方面现有的基础设施尚不完备,应急响应和救援能力差,另一方面北极特有的极端气候条件和大量的海冰、浮冰增加了船舶的安全风险(Zhang et al.,2020)。因此,北极海域的海冰预报极为重要,尤其是天气尺度(1~10d)的预报是影响航行决策的关键,也是目前北极海域的“气象”导航研究的热点(Mohammadi-Aragh et al.,2018)。
-
随着观测技术的进步和发展,北极海域的观测资料逐渐积累增加,海量的与极地海冰变化相关的数据正在不断地由多源的观测系统获取。极地科学领域与其他科学领域一样,正在经历一场数据革命。深度学习技术,这项已经改变了许多学科(如自然语言处理、电脑视觉)的新兴技术,也即将对极地海冰传统的模拟和预报手段带来巨大的变革,为人们更好地理解极地海冰变化的规律,预测海冰未来的演变提供了可能。
-
本文将从以下四个方面进行现有研究工作的总结和未来发展趋势的展望:一是分析为什么要用深度学习进行海冰预测;二是说明单纯使用深度学习技术进行海冰预报的局限性;三是阐述深度学习技术与海洋领域专业知识的结合方向;四是证明深度学习技术与专业知识相结合的可行性。
-
1 深度学习在海冰预报中的适用性
-
海冰的变化规律极为复杂,其生长、融化、运动和形变是紧密相连的。海冰的变化包含着极其丰富而复杂的多尺度物理过程,其生长、融化、运动和形变是紧密相连的,其尺度范围从毫米到厘米级的冰结晶结构、卤水和气泡微结构、冰上积雪颗粒结构和海冰析盐通道,到数十厘米至数十千米级的不规则冰块,再到上千公里级的海冰环流及其伴随的淡水输送(刘骥平等,2021)。
-
目前,海冰预报主要依赖数值模式预报和统计预报两类方法,而深度学习正是一种较为新兴的统计预报方法。数值模式是从已知的物理规律出发,基于海冰的动力学、热力学和厚度分布等规律实现上述海冰变化过程的模拟和预报。基于明确的物理变化规律,考虑多种影响海冰变化的要素,模式预报可以给出误差稳定并且可解释性强的预报结果(Kaminski et al.,2018)。海冰模式经过多年的研究,发展逐渐由一维模式向三维模式、热力模式向热力动力模式、区域模式向全球模式发展(聂思程,2018),参数化方案不断完善。海冰模式,预报业务较为成熟,通过与大气模式、海洋模式耦合,提高海冰物理过程的刻画能力(Hunke et al.,2013;Fu et al.,2021)。例如美国的ACNFS(Arctic Cap Nowcast/Forecast System)和加拿大的GIOPS(Global Ice Ocean Prediction System)海冰预报系统就是将发展较为成熟的海洋或气象模式与海冰模式耦合,将温度、盐度和海流等信息同化到背景场中(Smith et al.,2016)。当前数值模式预报业务较为成熟,气候系统中极地海冰变化的主要过程,如基本热力学和动力学,在海冰模式中得到了很好的理解和描述(Hunke et al.,2010)。
-
但近年来极地海冰的快速变化及其物理特性的变化,极大地增加了海冰模式物理参数化方案和模拟结果的不确定性,对海冰模式分辨率有了更高的要求。并且自然界中还有很多现象目前无法给出明确的物理规律,例如小尺度的海冰动力学和海冰形变,以及海冰范围的变化等(Girard et al.,2009;Hutchings et al.,2011;Kim et al.,2021)。因此,为了保证高分辨率多尺度特征下对海冰过程的模拟精度,实现对大气-海冰-海洋复杂相互作用以及冰内物理过程进行多尺度更细致的刻画和模拟,数值模式需要不同尺度且变量齐备的观测数据以及更为复杂的物理模型(刘骥平等,2021)。而短期内,小尺度海冰变化的规律尚不明确,不同模式耦合的参数化方案还有待完善,物理模型的发展遇到瓶颈。此外,计算机的算力和极地海域观测设备部署的可行性都制约着海冰数值模式的发展。
-
除了数值模式预报外,统计预报也是海冰预报的重要方法。不同于模式预报需要事先明确物理规律,统计预报是由数据驱动的,从数据本身出发,利用统计学方法挖掘和拟合出海冰的变化规律。当面对复杂的因子以及尚未明确的影响规律时,统计预报在一定程度上可以弥补模式预报的不足(Horvath et al.,2020)。因此,面对模式预报的困境,可以尝试通过统计预报的方法从数据中拟合海冰的变化规律,或挖掘各因子对海冰的影响规律,进行区域或全局的海冰预报。
-
统计预报因受到算法局限性和资料不足的双重限制,起步较晚,在海冰预报中的应用还有很大的研究空间。直到近十年随着遥感卫星观测技术的发展,海冰观测资料的获取难度不断降低,并且这些观测资料可以公开获取,为统计学方法在海冰预报中的进一步应用提供了数据支持。但由于海冰变化的高度非线性,传统的统计学方法因模型本身的限制,很难准确地拟合海冰的变化规律。比如Wang et al.(2016)基于向量自回归模型的海冰预报,使用的资料空间分辨率较低(2°×2°的水平网格),模型本身的非线性拟合能力也有限。
-
近几年,深度学习算法因其出色的非线性拟合能力,逐渐引起了研究者的重视。深度学习善于从数据中提取变化规律,模拟复杂的动力系统或者非线性变化,符合人们对自然规律的认知,并且可以达到甚至超越数值模式的模拟效果(Reichstein et al.,2019)。在其他领域,如计算机图像识别和自然语言领域,深度学习的应用较为广泛和成熟,而在海冰预报领域,之前受制于观测数据的限制,深度学习并无法取得理想的预报效果。而大量卫星观测数据和高质量再分析数据的公开发布,为深度学习在海冰预报领域的发展提供了土壤。
-
相对于模式预报而言,深度学习作为一种统计预报方法,除了可以绕开数值模式的发展困境外,还可以在占用较少运算资源的情况下,得到快速准确的预报结果,并且便于部署。相对于传统统计预报而言,深度学习的算法复杂度更高,拟合能力更强,更适合从长时间序列、高分辨率数据中提取海冰的变化规律。
-
目前,深度学习在海冰预报领域的主要工作是研究不同网络结构的深度学习方法对海冰多尺度时空序列预报的适用性。目前应用到海冰预报中的深度学习模型,主要有长短期记忆网络(LSTM)、卷积神经网络(CNNs)和卷积长短期记忆网络(ConvLSTM)三种。Chi and Kim(2017)单纯依赖观测到的海冰密集度数据,利用LSTM(一种考虑时间维度传递的信息,逐格点进行预报的时间递归神经网络)模拟了海冰密集度的中期变化过程,通过与自回归模型(一种基于统计的时间序列数据模型)的对比显示长短时记忆网络的性能优于传统统计模型。Choi et al.(2019)在此基础上提取了海冰密集度数据内部统计特征,作为海冰密集度的全局信息引入网络中,弥补传统网络中只考虑局地信息的缺陷,结果显示,新方法可以提高海冰密集度的预报准确性。虽然LSTM可以考虑时间序列的信息,但无法进行空间信息的处理,需要把二维空间数据转换成一维数据进行计算,在此过程中很难保留原有的空间结构特征,而CNNs通过卷积层、池化层和全连接层可实现对空间信息高效提取。Wang et al.(2017)基于合成孔径雷达图像,利用CNNs预测了北极圣劳伦斯湾的海冰密集度,研究表明CNNs能够更好地提取空间特征,相对于传统深度学习方法预测准确可提升8%左右。但CNNs只能进行空间信息的提取,无法处理时间序列的信息。因此,面对LSTM和CNNs各自的优势和不足,ConvLSTM应运而生,该模型结合了LSTM和CNNs的优势,既可以处理时间维度的信息,又可以进行空间信息的提取。有学者利用ConvLSTM模型的优势,基于海冰密集度周平均资料实现对北极巴伦支海域海冰密集度周尺度的预报(Liu et al.,2021c)。Liu et al.(2021a)采用更高频的海冰密集度逐日资料,基于ConvLSTM实现了北极海域的逐日预报,性能较仅用CNNs提升了13%。
-
上述研究表明,基于深度学习方法构建的海冰预报模型较传统统计预报模型有较大的优势,仅仅通过对海冰密集度数据时空信息的深入挖掘就能较好地刻画海冰密集度的变化规律,提高海冰密集度预报的有效性。但由于海冰变化复杂的多尺度物理过程,不同尺度的海冰变化和大气海洋环境变化密切相关,仅依赖于对海冰密集度数据变化规律的挖掘是不够的,尤其是在融池现象较为严重的夏秋季节。
-
2 深度学习在海冰预报中的局限性
-
深度学习的发展得益于计算机的发展和进步,被广泛用于语言处理和图像分类等领域(Yoo et al.,2019;Wang et al.,2020)。虽然深度学习可以应用到海冰预报中,但毕竟是从其他领域发展而来,直接应用到海冰预测中会存在适用性和局限性问题,需要与气象海洋领域的专业知识相结合。总体而言,深度学习在海冰预报中的应用具有以下3方面的局限性:
-
1)海冰数据的不确定性。深度学习作为数据驱动的方法,虽然不需要先验的物理规律,但对训练数据有着较高的要求,训练数据中的噪音会影响到模型的预报效果(Reichstein et al.,2019)。目前由于卫星观测技术的限制,海冰密集度的观测数据在夏秋季节的准确性较差。在夏秋季节,海冰处于消融状态,由于消融和冻结的差异,会在北极海域形成融池(Perovich et al.,2007)。由于夏季北极海域有着不同形态的海冰以及不同大小的融池,导致反照率存在极大的差异,对卫星观测结果有着极大的影响(Mäkynen et al.,2014)。因此海冰观测的准确性在夏季时会有所降低,单纯的海冰密集度数据中有着许多的噪音。
-
2)海冰变化规律的复杂性。由于不同地区大气环流、洋流模式、水文特征都存在很大的差异,海冰的变化呈现出很强的变异性和时空异质性(Mioduszewski et al.,2019;张天媛等,2019)。有研究表明,北极海域的海冰密集度变化规律复杂,不同地区的变化趋势不同,并且除了单纯的上升、下降趋势外,还出现了包括U形曲线在内的各种波动型趋势(张天媛等,2019)。深度学习虽然擅长拟合复杂的非线性规律,但毕竟多用于图像处理等领域,目前主流的MAE和SSIM等损失函数都是考虑误差的大小或者视觉对比的差异,并没有针对海冰的空间异质性或者局地差异性进行模型训练的损失函数(Wang et al.,2004)。因此单纯的套用深度学习模型无法使其完全适用于海冰密集度变化规律的刻画和预报。
-
3)深度学习模型的时间依赖性。以ConvLSTM为例,虽然该模型综合了CNNs和LSTM的优点,可以同时处理时空维度的信息,但该模型依旧存在着局限性。ConvLSTM与传统的时间循环网络类似,都存在时间依赖问题,即当输入数据的时间序列过长时,会遗忘历史信息,发生梯度消失或爆炸现象,导致模型无法收敛(Wang et al.,2018)。而海冰密集度的短期预报是基于长时间序列的,需要考虑多个历史时刻,输入5d、10d甚至更长的时间序列(Liu et al.,2021b)。因此,针对海冰密集度的短期预报,需要对现有模型进行改进,克服模型的时间依赖问题。
-
3 深度学习与海冰变化物理过程的融合
-
无论是深度学习在海冰预报中的局限性还是未来可能的发展方向,都是需要气象海洋领域的专业知识作为支撑来实现突破和进一步发展的。从海冰短期预报的角度看,深度学习与专业知识结合的方向主要有3个:
-
1)输入数据的选择与筛选。考虑到海冰数据的不确定性,需要根据气象海洋领域的专业知识,引入大气和海洋中与海冰变化相关的要素来刻画海冰的变化规律,减少海冰数据中噪音的影响。同时,也要根据专业知识对众多的相关因子进行筛选降维,以免造成数据维度爆炸的问题。
-
2)物理机理的约束。考虑到海冰变化规律的复杂性,需要使深度学习模型在训练中能着重考虑海冰的变化特征,而不是单纯从图像领域的角度考虑格点损失的大小。因此需要与专业知识相结合,通过改进损失函数等方法加入物理机理的约束,使深度学习模型更加适用于海冰短期预报。
-
3)长时间序列的处理。考虑到ConvLSTM的时间依赖性问题,以及海冰短期预报的长时间序列输入,需要引入新的模型或对现有模型进行改进,使其能够更加适用于海冰密集度长时间历史资料的处理和预报。
-
3.1 因子选择与筛选
-
影响海冰变化的因子有很多,并且随着卫星观测数据和再分析数据的完善,许多因子的数据都可以较为方便地获取(Peng et al.,2013;Hersbach et al.,2020)。通过多因子数据进行海冰密集度的预报,可以在一定程度上克服海冰资料中噪音的影响,改善预报结果的准确性。例如Kim et al.(2018)基于海冰卫星数据和高分辨率局地气候模式集合预报结果,利用人工神经网络方法刻画不同气候因子与海冰密集度之间的非线性关系,通过对北极喀拉海和巴伦支海2006—2016年逐月海冰密集度进行回报检验该方法的平均RMSE约为20%。
-
但可能对海冰变化产生影响的因子有很多,要把所有因子都放入模型中进行训练是不现实的。一方面影响海冰的要素较多,时间和空间纬度的集合造成数据维度爆炸,使得模型收敛困难;另一方面各因子对海冰变化的贡献和相关性不一致,若输入太多与海冰变化相关性弱的因子反而会降低模型的预报效果。因此,因子的选择和筛选是数据处理和模型训练中极为重要的一环。
-
而单纯地依靠深度学习知识很难胜任因子选择和筛选工作,这就需要气象海洋领域专业知识的支撑。例如根据海冰与气象海洋要素相互作用的研究,除了数值模式所考虑的海冰、温度和盐度等要素外,气温变化(Mudryk et al.,2018)、湿度输送(Lee et al.,2017)、风场模式(Smedsrud et al.,2017)、云覆盖(Cox et al.,2016)和海洋热通量(Carmack et al.,2015)等因子也对局地海冰变化有着重要贡献。基于专业领域的研究,可以充分考虑海冰的动力和热力学过程以及与其余要素的相互作用关系,将海表温度、风场和海洋热通量等对局地海冰变化贡献较大的气象海洋要素从众多因子中选择出来。利用多因子数据进行模型的训练,既可以削弱海冰观测资料中噪音的影响,也可以使模型更好地模拟海冰的时空异质性的。其次,如果输入的因子过多导致算力不足或模型收敛困难,可通过相关性或重要性对影响因子进行排序,通过专业知识选择靠前部分的因子,达到降维的目的。此外,还可以通过EOF或PCA的方法筛选出合适的模态,在保证模型训练效果的同时降低数据维度。
-
3.2 物理约束的加入
-
深度学习方法,如卷积神经网络和卷积长短期记忆网络,主要是应用于图像处理领域,进行图像的识别和分类,在模型训练过程中主要是基于MAE或SSIM等损失函数进行迭代计算。但这些损失函数只能考虑图片误差的大小,或是从图像识别的角度出发,考虑亮度、对比度和空间结构(Wang et al.,2004),没有体现海冰变化的物理过程。而对于海冰预报而言,不同海洋区域对于环境要素的响应不同,海冰变化的异质性无法通过对比度或空间结构等图像领域的知识进行刻画。
-
因此深度学习需要与气象海洋的专业知识相结合,对损失函数进行改进,加入体现海冰变化规律的物理约束,以此进行网络的迭代和参数的更新。例如对于海冰密集度的局地变化差异,可以在损失函数中加入空间梯度的计算,除了考虑总体误差的大小外,还考虑了相邻格点间的变化梯度,提高了模型的预报效果(Liu et al.,2021b)。或者,还可以考虑海冰与气象海洋要素(如偶极子和北冰洋涛动指数等)的相关性,对海冰的预报结果进行EOF分析,选取其中代表性的模态与气象海洋要素进行相关性的计算,通过相关性的约束进行网络的更新迭代。此外,考虑到海冰的动力学和热力学方程,可以根据尺度分析,选取其中相对重要的要素,计算海冰与这些要素间变化趋势的差异,将相关要素的变化趋势作为网络训练的约束。
-
3.3 模型的改进
-
目前,深度学习在海冰预报中的应用多为季节或月尺度,而天气尺度或天尺度的应用较少。并且海冰的逐日变化作为一种高频变化,预报难度要明显高于季节或月尺度变化,这就对深度学习模型本身提出了更高的要求,以更准确地对复杂非线性系统进行模拟。
-
此外,海冰和其余气象海洋要素的观测资料多为包含时空信息的三维数据,除了海冰的局地变化外,未来时刻与历史时刻的关系也极为重要,因此需要完善深度学习模型对时空序列的处理能力。目前,卷积长短期记忆网络可以进行时空序列的计算,但存在时间依赖性问题,即输入数据的历史序列过长时会发生梯度消失现象,因此需要对现有模型进行改进。一方面可以引入注意力机制,使深度学习模型的权重相对集中于海冰以及相关性高的气象海洋要素中,忽略或减少次要要素和信息的影响。另一方面可以对网络结构进行改进,类似于改进的预测循环神经网络(PredRNN++)中的高速公路层,将历史时刻的信息直接传递到当前时刻,减少历史信息的遗忘,改善梯度消失现象(Wang et al.,2018)。
-
4 融合式海冰深度学习预报模型效果
-
从上述现有工作的总结和分析中可以看出,深度学习在海冰预报领域的应用是可行的,并且与气象海洋领域专业知识的结合具有较大的发展前景。此方面进行的相关研究证明了深度学习与专业知识的结合的确可以取得更好的预报效果。
-
4.1 与数值模式对比
-
虽然相比于数值模式预报而言,深度学习预报的起步较晚,但在大数据的支撑下,深度学习未来所能达到的预报效果并不会比模式差。以目前现有的研究工作为例,Liang et al.(2020)评估了第九次中国国家北极研究考察队的海冰数值预报产品(ArcIOPS)旧版本和新版本的预报准确性,24h预报的RMSE在14%以上,而在相同预报时间下,基于卷积长短期记忆网络24h预报结果的RMSE在10%左右(Liu et al.,2021a),如图1所示。
-
4.2 与单纯应用深度学习对比
-
随着深度学习与气象海洋专业知识的结合,未来深度学习将会在海冰预报领域得到进一步的发展。基于专业知识,可以进行多因子的选择和筛选、物理约束的加入以及模型的改进。从图2的三组对比中可以看出,深度学习与专业知识结合后,确实可以取得更好的预报效果(Wang et al.,2018)。
-
图2中的“ConvLSTM”代表使用的深度学习模型为卷积长短期记忆网络;“PredRNN+++”代表在卷积长短期记忆网络基础上改进得来的预测循环神经网络;“Self”代表输入的因子为海冰密集度单因子;“Multi”代表输入的因子为海表温度、气温、表皮温度、平均海面气压和海冰密集度共5种因子;“MAE-loss”代表模型训练时使用的损失函数为深度学习领域传统的MAE损失函数;“Grad-loss”代表模型训练时使用的损失函数为加入梯度约束后改进而来的梯度损失函数。图2a—c对应于本文提到的三方面改进,柱状图的DIFF突出显示了不同模型预报效果的差异,蓝色部分的比例越大,表明模型预报误差的改进效果越明显。从预报结果的对比来看,深度学习与专业知识的结合是很有必要的。
-
图1 ArcIOPS旧版本和新版本海冰数值预报产品以及卷积长短期记忆网络2018年8—9月海冰密集度预报误差
-
Fig.1 ArcIOPS old and new versions of sea ice numerical prediction products and ConvLSTM prediction error of sea ice concentration from August to September 2018
-
图2 2020年海冰密集度预报误差(MAE;图中DIFF是绿色线条值减紫色线条值):(a)卷积长短期记忆网络的单因子与多因子对比;(b)Grad-Loss(引入梯度约束后)与MAE损失函数对比;(c)卷积长短期记忆网络与改进后的网络对比
-
Fig.2 Prediction error (MAE) of sea ice concentration in 2020 (The DIFF in the figure is derived from the green line minus the purple line):(a)single-factor versus multifactor comparison of ConvLSTM;(b)comparison between Grad-Loss (after introducing gradient constraint) and MAE loss function;(c)comparison between ConvLSTM and PredRNN++
-
总体而言,深度学习作为一种新兴的统计学方法,在海冰预报上的应用很大的发展空间,特别是天气尺度(1~10d)的短期预报。未来可以将深度学习的应用点放到海冰的短期预报上,提取海冰的高频变化规律。一方面可以从深度学习领域入手,提出新的深度学习方法或改进现有模型;另一方面可以尝试将深度学习方法与气象海洋专业知识相结合,提高深度学习的适用性。深度学习究其本质是一种数据驱动的统计方法,随着探测手段的进步和观测资料的增加,深度学习的优势也会逐渐凸显。此外,深度学习在捕捉运动规律上有着独特的优势,因此在资料充足的情况下,深度学习在浮冰和冰山运动轨迹的预测上将会有优异的效果。
-
参考文献
摘要
在全球气候变暖背景下,北极海冰呈现出逐年消融的趋势。海冰的消融给北极的开发利用带来了重要机遇,例如北极航道通航潜力的显现。但北极航道开通还面临着诸多困难,尤其是海冰变化机理的复杂性和海冰预报的不确定性以及由此带来的航行安全风险。近年来,深度学习因其强大的非线性拟合能力,逐渐在海冰预报领域中崭露头角。本文对近年来深度学习在北极海冰预报中的国内外研究状况进行了梳理,分析了深度学习在海冰预报中的应用背景,指出了单纯地应用深度学习进行海冰预报的局限性,阐述了深度学习方法与气象海洋专业知识的结合点,展望了未来的研究动态和发展趋势。
Abstract
Arctic sea ice continues to shrinking with the global warming,creating a significant chance to shipping on the Arctic routes.However,some issues still hinder the opening of Arctic shipping routes.Especially,the navigation safety is threatened by the uncertainty of sea ice prediction due to the complex physical mechanism of sea ice change.In recent years,deep learning algorithms,having excellence in tackling nonlinear fitting problems,have shown increased evidence of potential to address the problem of sea ice prediction.This paper provides a critical review of existing deep learning methods developed for sea ice prediction.First,the deficiency of numerical model in sea ice prediction was analyzed,leading out the advantage of deep learning methods.Second,the limitations of adopting deep learning methods only were pointed out in light of the characteristics of sea ice.Finally,the possible paths to adopting specialized knowledge of meteorology and oceanography into deep learning methods so as to provide a better prediction model were discussed.
Keywords
Arctic sea area ; sea ice prediction ; deep learning ; Arctic shipping route