-
10~30d延伸期预报因其时效超过了确定性预报的理论上限(2周左右)(Lorenz,1969),预报对象的时间尺度又小于短期气候预测的月、季时间尺度,因此成为“无缝隙预报”中的难点热点(Hoskins,2013)。关于延伸期的准确预报,由于理论研究不完备,还存在较多困难,然而这一时段的预报对开展防灾减灾工作,促进经济社会可持续发展具有极其重要的价值和意义(杨秋明,2015)。
-
随着对大气系统认识和研究的不断深入以及观测资料的增多,已有许多观测和理论研究表明,大气中存在10~20d的准双周振荡及30~60d的季节内振荡(Instra Seasonal Oscillation,ISO)、绕球遥相关型(Circum Global Teleconnection,CGT)、南半球绕球遥相关性(Southern Circum Global Teleconnection wave train,SCGT)、热带地区30~50d振荡(Madden and Julian Oscillation,MJO)等低频信号为10~30d的延伸期天气提供了有用的低频信息(Madden and Julian,1971;李崇银,1990;Waliser et al.,2003;李崇银,2004;Ding and Wang,2005;孙国武等,2008;张庆云等,2008;Zhu et al.,2015;Gao et al.,2019;Hsu et al.,2020;徐邦琪等,2020;杨双艳和李天明,2020;Zhu et al.,2020),为延伸期预报方法的研究提供了依据。丑纪范和徐明(2001)、丑纪范等(2010)基于数值预报结果指出10~30d的预报虽然超出了逐日天气预报的可预报时效,但仍存在着可预报分量,可通过一定的方法将可预报分量提取出来,从而对特定的可预报分量在延伸期尺度上进行预报。近年来我国多位学者通过各种方法分解大气中的可预报分量,并在10~30d的延伸期预报实验中取得了较好的效果(王阔等,2012a,2012b;封国林等,2013;曾宇星等,2013;王启光等,2014)。
-
延伸期预报的方法基本有两类,分别为动力模式和统计方法(Waliser et al.,2003;何金海等,2013;章毅之,2017)。动力模式主要有对模式初始场的同化、可预报分量的提取、利用历史资料信息对模式误差进行订正、模式延伸期预报效果的评估以及利用数值模式预报资料的动力—统计等方法(任宏利和丑纪范,2005;丑纪范等,2010;陈官军和魏凤英,2012;王启光等,2012;郑志海等,2012,2013)。统计方法大多基于观测资料和大气低频信号(琚建华等,2010;何金海等,2013;洪梅等,2015;张韧等,2014)。大气季节内振荡特征的研究成果为延伸期统计预报方法的研究提供了基础和依据(梁萍和丁一汇,2012;孙国武等,2017)。
-
近年来,学者针对延伸期预报方法开展了多角度应用和研究。已有研究表明低频天气图方法对强降水过程的延伸期预测效果较好(陈青等,2014;孙昭萱等,2016;孙国武等,2017)。李勇(2016)研究指出集合平均预报对大范围降水过程期间主要影响系统的预报具有较好的稳定性,在延伸期预报时效内大尺度环流调整具有较好的表现。陈官军和魏凤英(2012)指出我国南方夏季出现的持续性强降水过程与大气季节内振荡有密切关系。贾旭伟等(2016)基于低频振荡对西北地区中西部延伸期内降水的预报研究表明对低频要素场的拟合准确度随预报时效增长逐渐降低,但后期趋于稳定。杨秋明(2014a,2014b,2015)建立了扩展复数自回归模型、多变量时滞回归模型以及多变量时滞回归模型和主成分复数自回归模式的混合预报模型等一系列简化的时变线性预测模型,对区域极端天气过程的预报时效有明显的提高(杨秋明,2018)。扩展复数自回归模型(ECAR)对与暴雨过程对应的低频分量的非线性增长过程预测效果较好,对长江下游低频降水预测时效最长可达43d(杨秋明等,2014a),后又将该模型用于长江下游温度低频分量的延伸期预测,发现能够提前20~25d预报出长江下游地区夏季持续高温过程(杨秋明,2018)。多变量时滞回归模型(MLR)能够提前25~30d预测出20~30d时间尺度的长江下游低频降水(杨秋明,2015),章毅之等(2017)基于不同时间尺度的江南地区降水低频分量和东亚地区850hPa低频经向风主成分建立的MLR模型,对持续性强降水过程和降水低频位相的正负转换预测效果好,对50~70d时间尺度的江南低频降水的平均预报技巧高达0.92。多变量时滞回归模型和主成分复数自回归模型的混合预报模型(MLR/PC-CAR)对20~30d时间尺度的长江下游低频降水预测时效为50d左右(杨秋明等,2014b)。
-
寒潮的主要特点是剧烈降温和大风,有时还伴有雪、雨凇和霜冻等,是中国北方冬半年主要灾害性天气之一(陈豫英等,2010;乔雪梅和刘普幸,2020),极易造成大范围的冻灾和风灾,对社会经济、生态环境等带来重大影响。现有的中、短期预报和30d以上的短期气候预测难以满足公众及政府部门对气象信息的需求,且寒潮过程整个生命期一般为2~3周,属于低频波,具有一定的可预测性。目前对于延伸期寒潮预报的研究较少,主要集中在对寒潮源地、路径、天气系统成因及预报方法等方面的研究,且大多数对高低温的延伸期预报方法是基于集合预报进行研究的,利用低频资料建立对延伸期寒潮的站点预报模型具有一定创新意义。因此,本文使用Butterworth带通滤波器(Murakami,1984)对1°×1°的FNL再分析资料进行滤波得到低频资料,基于低频资料,利用偏最小二乘的方法建立西北地区共376个站冬半年(12月—次年5月)延伸期(10~30d)寒潮预测模型,对西北地区冬半年的大范围的寒潮过程进行预测试验。根据影响西北地区(陕西、宁夏、甘肃、青海、新疆以及内蒙古110°E以西的地区)寒潮天气的冷空气源地和路径,本文中选取50°~120°E、30°~80°N欧亚大陆为关键区。
-
1 资料和方法
-
1.1 资料与选取标准
-
选取2000—2013年西北地区376个国家站逐日最低气温,美国国家环境预报中心的FNL再分析资料(https://rda.ucar.edu)。在整个北半球对FNL资料进行Butterworth带通滤波,得到10~20d的低频资料,选取关键区内(50°~120°E,30°~80°N)的500hPa、700hPa高度场、经向风和纬向风场低频资料用于建模。规定当天国家站降温幅度≥8℃的站数超过20站为一个寒潮日,少于20站则为非寒潮日。
-
本文使用CS评分方法评估模型的预测效果,计算方法(陈伯民等,2017)为:
-
I CS=(预测正确日数)/(预测正确日数+空报日数+漏报日数)。
-
对于强降温过程,预测正确日数为降温日在所预测时段内的日数(允许偏差1d),空报日数为所预测时段内不包含实际降温日的日数,漏报日数为实际降温日未包含在所预测时段内(允许偏差1d)的日数。
-
1.2 偏最小二乘法回归模型
-
偏最小二乘回归(PLS)是对多元线性回归模型的一种扩展,可以在一个算法下同时实现回归建模(多元线性回归)和数据结构简化(主成分分析)过程。在样本数小于变量数的情况下仍可使用,所以该预报模型在建立时并不需要很长时间的训练样本,可大大缩短建模时间(从几年可以缩短到30d),常用于数值预报产品的释用(蒋国兴等,2006)。
-
设有p个自变量{x1,x2,…,xp}和q个因变量{y1,y2,…,yq},有n个观测样本点,构成自变量因变量的数据矩阵X和Y。偏最小二乘回归方法分别在X与Y中提取成分t1和u1,即t1是x1,x2,…,xp的线性组合,u1是y1,y2,y3,…,yq线性组合。提取过程中t1和u1要满足以下两点:1)t1和u1应尽可能大的携带他们各自数据矩阵变异信息。2)t1和u1的相关程度能够达到最大(陆洪涛,2014)。在第一个成分t1和u1被提取后分别实施X对t1和Y对t1的回归。若此时回归方程已达到要求精度,则算法停止,否则将利用X被t1解释后的残余信息以及Y被t1解释后的残余信息进行第二个成分的提取(杨国栋,2013)。如此反复,设定当前k个成分解释变量的比率达到90%时满足精度要求,算法终止。最终对X共提取了k个成分t1,t2,…,tk,偏最小二乘法回归将通过实施ym(m=1,2,…,q)对t1,t2,…,tk的回归,最终表达成ym关于原变量x1,x2,…,xp的回归方程,偏最小二乘回归的基本方程式参见杨国栋(2013)和陆洪涛(2014)。
-
本文只关注降温幅度这个单因子,因此采用单因变量的偏最小二乘回归方法,建立10~30d寒潮延伸期预测模型。选取2000—2013年冬半年92个寒潮日与35个非寒潮日作为样本集,将关键区内(50°~120°E,30°~80°N)寒潮日和非寒潮日前10~30d的500hPa和700hPa高度场、经、纬向风场6种不同要素低频资料分别作为自变量,单站127d的降温幅度作为因变量,分别构建标准化的自变量矩阵X和因变量矩阵Y。提取10~20d的低频滤波资料矩阵X的主成分,建立主成分与单站降温幅度Y的关系,进而建立西北区376个站的寒潮延伸期偏最小二乘法预测模型(每种模型为西北区376站10~30d逐日预测模型,共7 896个)。偏最小二乘回归的具体建模步骤见许凤华(2006)、杨国栋(2013)和陆文涛(2014)。
-
2 低频资料与最优训练集
-
为测试训练集样本数量对建模结果的影响,随机对一单站建立第10d模型,选取3~91d作为训练集长度,调试最优训练集长度。气温预报的均方根误差(Root Mean Square Error,RMSE)能很好地反映气温预报的技巧(智协飞等,2018),因此本文采用RMSE作为训练期长度调试的预报检验指标。6种要素低频资料在不同训练期长度的平均RMSE如表1所示。由此可知,各低频资料的RMSE随训练集长度的增加变化趋势基本一致,即随着训练期长度的增加,RMSE逐渐减小。训练期长度小于50d时RMSE波动较大,平均RMSE维持在6以上;训练期长度超过50d时,RMSE变化趋于平稳,平均RMSE小于6;训练期长度在80~90d时变化平稳,波动较小(图略)。因此可以判断训练集长度越长,RMSE越小,且变化越平稳。故选取2000—2013年共127个个例作为训练集,进行模型的训练。对比训练期长度为3~91d时不同低频资料的平均RMSE,可以发现500hPa低频高度场与500hPa低频经向风场RMSE较小,值分别为6和6.1;其次是700hPa低频高度场与700hPa低频经向风场,值分别为6.3和6.2;500hPa与700hPa的低频纬向风场的RMSE最高,值分别为7和7.1(表1)。由此,500hPa低频高度场资料的适用性在6种要素低频资料中最高,其次是500hPa低频经向风场资料。
-
由以上分析可知500hPa低频高度场的适用性最好,故选取2000—2013年共127个个例(92个寒潮日与35个非寒潮日的个例)前10d 500hPa低频高度场和单站降温幅度(单站观测资料有缺测,实际用于建模的个例少于127个),建立单站第10d偏最小二乘法延伸期预测模型,选取个例发生前11d 500hPa低频高度场和单站降温幅度,建立第11d的预测模型,以此类推,建立西北五省376个国家站第10~30d的延伸期寒潮预测模型。
-
以2017年1月7日的寒潮过程(寒潮日)和2017年1月14日的非寒潮过程(非寒潮日)为例,检验延伸期寒潮预报模型的预测能力。实况观测显示,2017年1月7日降温幅度超过8℃的站主要集中在陕北、宁夏及内蒙和甘肃部分地区(图1a),且有53站降温幅度超过8℃;而2017年1月14日非寒潮日仅有6站降温幅度超过8℃,且降温站点分布较为分散(图1b)。
-
图1 寒潮日(a;2017年1月7日)和非寒潮日(b;2017年1月14日)的实测降温幅度
-
Fig.1 Observed temperature drop amplitudes on(a) the cold wave day(7January 2017) and(b) the non-cold wave day(14January 2017)
-
图2为提前10~30d预测的寒潮日(2017年1月7日)降温幅度,第10~30d的预测结果在图中按时间顺序放置,图中所标数字为预测的降温幅度超过8℃的站点总数。10~30d模型预测的降温站点分布与实况(图1a)较为吻合。降温幅度超过8℃的站数从第10d至第30d分别为36、54、51、27、7、6、17、33、48、59、60、44、18、23、34、43、41、31、21、19、19,这21d中共有15d达到文中规定的寒潮标准。寒潮日10~30d的站点平均命中率为39.7%,提前第11、12、18、20、21、25d的命中率超过50%,其中提前第11d预测的命中率最高,为67%,而提前第14d与第15d预测的命中率最低,为9%。10~30d的平均空报率为35%(表2)。综合所述,该模型对寒潮日的预测效果较好。
-
对于非寒潮日(2017年1月14日)提前10~30d的预测表明,降温幅度超过8℃的站数从第10d至第30d分别为8、4、0、3、2、4、7、9、2、1、1、0、0、0、8、2、1、2、2、1、0(图3),未达到规定的寒潮天气过程。预测的寒潮日与非寒潮日中,降温幅度达到8℃以上的站数差别较大,其中寒潮日预测中平均每天有32.9站的降温达8℃以上,而非寒潮日平均每天为2.7站。对比寒潮日与非寒潮日的预测,可以看出,该模型能够较好地预测寒潮日和非寒潮日,预测结果具有一定的参考价值。
-
利用已建立的延伸期寒潮预测模型对2014—2017年冬半年的寒潮进行预测试验。除去实况资料缺失的12d,该时段共有728d的实况降温幅度资料,共76个寒潮日,652个非寒潮日。该模型回报的西北区站点降温幅度的命中率如表3所示,10~30d平均命中率为11.5%,除个别预测时间的命中率低于10%以外,其余预测时间的命中率均高于10%,其中提前第15d预测的命中率最高,达14%;提前10~30d平均空报率70.3%,其中提前第11d的空报率最高,为74%,提前第20d与第28d预测的空报率最低,为67%。
-
图2 模型对寒潮日(2017年1月7日)站点降温的延伸期(10~30d)预报结果(红色:降温幅度≥8℃;绿色:降温幅度<8℃)
-
Fig.2 Extended-range(10—30d) forecast results of sation temperature drop forecasted by the model on the cold wave day(7January 2017)(red:temperature drop≥8℃;green:temperature drop<8℃)
-
为了开展寒潮预测模型的应用及评估,假定模型预测的降温幅度≥8℃的站数超过25、20、15站为一个寒潮日,分别计算了2014—2017年冬半年寒潮日的CS评分,如表4所示。规定当日降温幅度≥8℃的站数超过25站为寒潮日时,则提前10~30d预测的平均CS评分为0.091,若规定当日降温幅度≥8℃的站数超过20站时,则平均CS评分为0.095,若规定当日降温幅度≥8℃的站数为15站时,则平均CS评分达0.1,故当日降温幅度≥8℃的站数超过15站为一个寒潮日时,与实际寒潮日对应较好,因此,在实际应用中,可选取此标准对模型的预测结果进行释用。另外,当日降温幅度≥8℃的站数超过25站、20站、15站规定的寒潮日,提前12d的预测效果最好,CS评分分别达0.122、0.116、0.117,超过25站、20站规定的寒潮日,提前17d预测效果最差,CS评分分别为0.061、0.070,超过15站规定的寒潮日,提前22d效果最差,CS评分为0.091。由CS评分可以看出,该模型对寒潮空报日数较高,应根据实际环流形势和预报经验进行适当消空处理。
-
图3 模型对非寒潮日(2017年1月14日)站点降温的延伸期(10~30d)预报结果(红色:降温幅度≥8℃;绿色:降温幅度<8℃)
-
Fig.3 Extended-range(10—30d) forecast results of sation temperature drop forecasted by the model on the non-cold wave day(14January 2017)(red:temperature drop≥8℃;green:temperature drop<8℃)
-
3 结论
-
选取2000—2013年冬半年寒潮过程的降温幅度及其前10~30d的500hPa、700hPa高度场、经纬向风场低频资料,利用偏最小二乘回归方法建立西北区共376个站的延伸期(10~30d)寒潮预测模型。该模型以2017年1月7日寒潮日与2017年1月14日非寒潮日为例进行试报,并对2014—2017年冬半年西北区寒潮进行了回报试验,结果表明:
-
1)随机建立单站第10d的预测模型进行最优训练集长度的选取,发现训练集长度越长,RMSE越小且越平稳;500hPa低频高度场资料的适用性最好,其次是500hPa低频经向风场资料。
-
2)该模型对2017年1月7日寒潮日与2017年1月14日非寒潮日的预测结果表明,该模型能够提前10~30d较好的预测寒潮日和非寒潮日,其中寒潮日平均每天有32.9站的降温幅度≥8℃,而非寒潮日平均每天有2.7站的降温幅度≥8℃,能够很好区分寒潮日和非寒潮日。该模型提前10~30d预测的寒潮日站点平均命中率为39.7%,最高可达67%。
-
3)该模型对2014—2017年冬半年的寒潮延伸期回报试验结果表明,该模型提前10~30d的平均命中率为11.5%,其中提前第15d预测的命中率最高,为14%;平均空报率为70.3%。因此该模型对西北区延伸期寒潮的预测有一定参考价值,但对寒潮的空报日数较高,应适当消空。另外,规定当预测的降温幅度≥8℃的站数超过25站、20站、15站为一个寒潮日时,CS评分表明,当预测降温幅度≥8℃的站数超过15站为一个寒潮日时,平均CS评分为0.1,预测的寒潮日与实际寒潮日对应最好,在该模型的实际应用中,可将此作为判断有无寒潮发生的依据。
-
本文对寒潮延伸期内的预测方法进行了初步探索性研究,使用的资料和方法均较单一,偏最小二乘法建立的预测模型对寒潮具有一定预测能力,但整体预测的空报率较高,今后一方面需要投入大量工作对该模型进行改进和订正,另一方面需要进一步研究延伸期的预测方法,尝试使用更多元资料建立新的模型,以期提升延伸期寒潮等灾害性天气的预测。
-
参考文献
摘要
利用2000—2013年西北地区376个国家站逐日最低气温及NCEP FNL再分析资料,基于西北区站点降温幅度和欧亚大陆500 hPa低频高度场,使用偏最小二乘回归方法建立西北区站点寒潮延伸期预测模型,分别以2017年1月的一个寒潮日和非寒潮日为例进行预测试验,并对2014—2017年冬半年(共728 d)西北地区的寒潮进行回报试验。结果表明,该模型能够提前10~30 d较好预测寒潮日与非寒潮日,对寒潮日提前10~30 d预测的降温幅度≥8 ℃的站数平均为32.9个,命中率最高可达67%,而对非寒潮日提前10~30 d预测的降温幅度≥8 ℃的站数平均为2.7个。对2014—2017年冬半年西北地区延伸期寒潮日的预测结果显示,该模型提前10~30 d预测的平均站点命中率为11.5%,空报率为70.3%。规定降温幅度≥8 ℃的站数超过15个时为一个寒潮日,则平均CS评分为0.1,预测的寒潮日与实际寒潮日对应最好。该模型可用于西北区地区延伸期寒潮的预测,具有一定的参考价值。
Abstract
Based on the daily minimum temperature data of 376 national stations in Northwest China and NCEP FNL reanalysis data from 2000 to 2013,the temperature drop amplitude of the stations and the 500 hPa low-frequency height field in Eurasia were analyzed.An extended-range forecast model of cold wave at stations in Northwest China was established by the partial least squares regression method,and the cold wave day and the non-cold wave day in January 2017 were predicted as an example.The cold wave forecast experiment was carried out using the data in Northwest China in winter half year from 2014 to 2017 (728 d in total).Results show that the model can well predict cold wave days and non-cold wave days 10—30 d in advance.The average number of stations with temperature drop≥8 ℃ predicted 10—30 d in advance for cold wave days is 32.9,with the highest hit rate of 67%,while the average number for non-cold wave days is 2.7.The forecast results of cold wave days in Northwest China during the extended-range of winter half year from 2014 to 2017 show that,the average station hit rate predicted by the model 10—30 d in advance is 11.5%,and the empty rate is 70.3%.It is a cold wave day,When the number of stations with temperature drop≥8 ℃ exceeds 15.The average CS score is 0.1,and the predicted cold wave day corresponds to the actual cold wave day best.Therefore,the model can be used to predict the cold wave during the extended-range in Northwest China,and has a certain reference value.