-
干旱是一种由于水分短缺而引发的极端天气和气候现象,具有持续时间长,影响范围广等特点(袁星等,2020)。它严重影响了自然环境和人类生活,制约着社会经济的可持续发展(王莺等,2022)。我国是干旱频繁且受灾严重的国家之一(孙博等,2023),干旱灾害每年给我国造成数百万吨的粮食减产和超过百亿人民币的经济损失(Su et al.,2018)。气象干旱作为传统的干旱类型之一(姜大膀和王晓欣,2021),通常是复合干旱的第一阶段(Zeng et al.,2022),研究其趋势和规律有助于提供早期预警,预防和减轻干旱发生,也是后续研究水文干旱、农业干旱和社会经济干旱等的基础和保障(Zhang et al.,2016)。
-
为了量化干旱的严重程度,较为常用的方法就是构建干旱指数来表征(宋艳玲,2022)。例如:帕默尔干旱指数(Palmer drought severity index,简称PDSI; Palmer,1965)、标准化降水蒸散指数(standardized precipitation evapotranspiration index,简称SPEI; Vicente-serrano et al.,2010)和标准化降水指数ISP(standardized precipitation index,简称SPI; McKee et al.,1993)等。PDSI基于水量平衡原理采取降水、气温、土壤含水量等数据计算,物理意义比较清晰,但PDSI也存在计算复杂和时间尺度固定等局限性(Wells et al.,2004)。SPEI克服了PDSI在固定时间尺度上的不足,它通过归一化潜在蒸散发(potential evapotranspiration,简称PET)和降水之间的差值来描述灵活时间尺度的干旱特征(孟鑫和智协飞,2016)。SPEI虽然相比SPI还考虑了温度对干旱的影响,但在昼夜温差较大的高原地区SPI的适用性更强(王作亮等,2019),相比之下,SPI由于仅需要输入降水,且计算方法简单、尺度灵活等特点被广泛应用于干旱研究当中(Guttman,1999; 吕纯月等,2021)。
-
降水数据的精确性直接决定了干旱事件特征的可信度,因此提高降水的估算精度是识别干旱的先决条件。获取的方法主要有地面雨量计观测、降水雷达观测和遥感卫星反演(Sun et al.,2018)。传统的地面雨量站在地形复杂、偏远地区分布不均,难以获取降水连续的时空分布格局(Kidd et al.,2017)。降水雷达的维护修理成本高昂,且雷达信号容易受到复杂地形的遮挡,导致在高寒的地形复杂区域效果不佳(Xu et al.,2019)。相比之下,遥感降水产品具有覆盖范围较广、精度较高和时空连续等优点,现已被广泛应用于水文气象的研究之中(唐国强等,2015)。然而,全球遥感降水产品众多,它们的性能存在区域异质性(Beck et al.,2017)。复杂的地形和极端气候都会制约遥感降水产品的精度,从而影响产品的性能(Li et al.,2023),单一的遥感降水产品在高寒、地形复杂地区的应用存在巨大挑战(Pradhan et al.,2022)。
-
随着人工智能技术的发展,机器学习的兴起为多源遥感产品的性能提高提供了一个新的解决思路和方案。机器学习方法能够弥补传统建模运算复杂的问题,因此被广泛应用于气象和水文的研究之中(何慧等,2021)。比如,张娟等(2023)基于遥感产品和气象站点数据,利用随机森林(RF)构建综合干旱指数,分析甘肃省农作物生长季旱情时空格局和变化规律,结果表明利用随机森林模型监测干旱精度较高。杨轩等(2023)利用3种机器学习算法融合TRMM、GPM、CMORPH、CHIRPS、PERSIANN-CDR 5种月尺度栅格降水产品,融合产品各月均表现较高精度,其中随机森林算法模型产品在冬季表现较优。Jiang et al.(2023)利用多元线性回归,前馈神经网络,随机森林(RF)和长短期记忆模型4种机器学习模型融合卫星降水和再分析降雨产品,融合产品均减少了原始产品的误差,其中随机森林在暴雨条件下表现最好。综上可知,机器学习方法在融合多源遥感降水领域表现了明显的优势,但是基于机器学习的遥感降水融合性能在高寒、稀缺资料地区的性能研究相对薄弱。利用机器学习融合多源降水产品数据,进而准确刻画少资料地区的气象干旱特征成为重要亟待解决的科学问题。
-
黄河源区地处青藏高原腹地,平均海拔4 000 m以上,地形复杂多样,常年极端低温。黄河源区生态环境脆弱,且对气候变化和人类活动等干扰极其敏感(韩兰英等,2021)。但是,黄河源的流域面积较小,不足整个黄河流域面积的1/4,产流量约占黄河径流量的1/3以上,有“黄河水塔”的美誉(张成凤等,2020)。黄河水资源的稳定性对黄河流域的经济高质量发展和生态文明建设的实现起到决定性的作用。基于此,本研究选取3套典型长序列遥感降水产品(PERSIANN-CDR、CHIRPS v2.0、MSWEP v2.0),利用随机森林模型(RF),开展多源遥感降水产品的数据融合研究,评估融合产品的性能,并利用标准化降水指数(SPI)和游程理论,探究黄河源区的气象干旱的时空演变特征,可为黄河源区的干旱预警预报和水资源管理提供科学的参考依据。
-
1 资料和方法
-
1.1 研究区概况
-
黄河源区(95°86′~103°40′E,32°16′~36°12′N)位于青藏高原东北部,地势西北高东南低,源区降水随纬度增加而减少,多年平均降水量约510 mm,流域面积约为12.2×104 km2。源区内地势高,气候寒冷,海拔高度在2 672~6 065 m,区域内存在季节性和多年冻土区(Bai and Liu,2018; 张成凤等,2019; 靳铮等,2020; 姚秀萍等,2022)。黄河源区的气象站点和地形高程如图1所示。
-
图1 黄河源区示意图
-
Fig.1 Schematic diagram of the source region of the Yellow River
-
1.2 数据来源
-
气象站点数据选自黄河源及其周边地区40个站点,该数据来自国家气象信息中心(http://data.cma.cn/),时间范围为1983—2013年。并选取了3套典型长序列遥感降水产品,包括PERSIANN-CDR、CHIRPS v2.0、MSWEP v2.0(以下简称PERSIANN、CHIRPS、MSWEP)。其中PERSIANN产品基于人工神经网络提供长期的一致性较好的高分辨率降水估算,利用GridSat-B1卫星的红外辐射作为PERSIANN模型的输入数据,并且采取全球降水数据集GPCP产品对模式的输出结果进行偏差校正(Ashouri et al.,2015)。MSWEP是一套全球多源加权融合的降水数据集,其融合了地面观测数据,降水卫星和大气再分析数据(Beck et al.,2019)。MSWEP与其他全球降水产品相比性能较优,并且在资源稀缺的干旱地区具有较好的适用性(彭振华等,2021; 吕爱锋和亓珊珊,2022)。CHIRPS是一套准全球(50°S~50°N)降水观测资料,它基于全球超过20 000个地面雨量站数据,热红外观测数据和大气再分析数据等,提供了一套长期的、高分辨率的、多时间尺度的降水数据集(Funk et al.,2015)。为了评估的一致性,本研究空间分辨率均为0.25°×0.25°,选取的研究时段为1983—2018年。3种遥感降水产品的汇总如表1所示。
-
1.3 研究方法
-
1.3.1 标准化降水指数(SPI)
-
由McKee et al.(1993)研究的标准化降水指数(SPI)被广泛用于干旱研究之中。计算SPI仅需要输入降水,有效减少了多种变量所带来的不确定性。SPI的计算应用于干旱研究中一般要求降水序列超过30 a,当SPI为正值表明为湿润的气候环境,而负值表明为干燥的气候环境。SPI可采取灵活的时间尺度来量化干旱事件,本文选取1个月、3个月、6个月、12个月4个典型的时间尺度(SPI1,SPI3,SPI6,SPI12),结合国家气象干旱等级(GB/T20481-2017),干旱等级的划分如表2所示。
-
1.3.2 统计评价指标
-
为定量研究融合降水产品在黄河源区的气象干旱性能,本研究选取了5种常用的统计评价指标,包括相关系数CC(correlation coefficients,简称CC)、均方根误差ERMS(root mean square errors,简称RMSE)、相对偏差Bias(Bias)、Kling-Gupta系数EKG(KGE)和标准差DST(standard deviation,简称STD)。相关系数越高、均方根误差越低、相对偏差越接近于0、Kling-Gupta系数越高、标准差越小表明统计性能越好,各指标的计算公式如下:
-
其中:n为样本容量;、分别为观测降水的估算降水和均值;分别为观测降水的均值和标准差,σs、μs分别为降水产品估计值的均值和标准差;分别为降水产品的估算降水和均值;分别代表站点数据或者降水产品数据的估算降水和均值。
-
1.3.3 随机森林
-
随机森林(RF)是Breiman(2001)提出的由多个决策树组成的机器学习算法。具有精度高、参数少、模型稳定的特点(方秀琴等,2021)。虽然决策树作为一种非参数方法在回归和分类问题上表现良好,但决策树的训练容易出现过拟合的问题。RF解决了这个问题,模型如下:
-
其中:YRF为随机森林的融合结果; γ为随机森林中决策树的个数; X为测试集的输入数据; fi为第i棵决策树的预测结果。
-
本研究1983—2013年融合数据在黄河源的目标变量为站点降水,输入变量为3套网格化遥感降水产品。训练格点与站点的选取按照距离最近原则,每个格点与最近站点的距离均小于16 km,其中随机抽样70%的数据作为训练集,30%的数据为验证集。
-
1.3.4 Mann-Kendall检验
-
Mann-Kendall的检验是一种非参数方法。其优点是不需要样本遵从一定的分布,也不受少数异常值的干扰,更适用于类型变量和顺序变量,计算也比较简便,被广泛应用于水文气象的趋势分析和突变检验。但是Mann-Kendall检验不适用于检测有多个突变点的序列(魏凤英,2007)。
-
对于具有n个样本量的时间序列t,定义累计数Ak:
-
可见,累计数Ak是第i个时刻数值大于j时刻数值个数的累计数。假定时间序列随机独立,定义统计量:
-
其中:UF1=0;E(Ak)与V(Ak)分别是累计数Ak的平均值与方差。其公式如下:
-
将时间序列t生成其对应的逆序列,重复上述计算过程。同时使得UBk=-UFk,如果UFk和UBk在0.05显著水平线内(临界值为±1.96)有交点,则交点认为是突变点。
-
1.3.5 游程理论与干旱特征指标
-
本研究通过游程理论来确定干旱事件,根据McKee et al.(1993)的研究,如果干旱指数连续多个月低于阈值,则认定其为干旱月份。本研究认为当SPI持续2个月以上小于-1时会发生一次干旱事件。统计干旱频次N(drought events number)。选择平均干旱历时MDD(mean drought duration)、平均干旱烈度MDS(mean drought severity)、平均干旱强度MDI(mean drought intensity)和平均干旱极值MDP(mean drought peak)等评价指标评价融合降水捕获黄河源的气象干旱特征,计算公式如下:
-
式中:t1 是干旱事件结束的时间;t0 是干旱事件开始的时间;i 是第i 次的干旱事件; j为某次干旱事件中干旱指数;Di 是第i 次干旱事件的干旱历时;Si 是第i 次干旱事件的干旱烈度;Ii 是第 i 次干旱事件的干旱强度;Pi 是第 i 次干旱事件的干旱极值。
-
2 结果分析
-
2.1 融合降水集在站点尺度的性能
-
图2展示了站点降水和不同遥感降水产品,以及数据融合产品在站点尺度的散点分布。由图可知,各降水产品均能较好地捕获站点降水的波动(CC>0.89),3套原始遥感降水产品中CHIRPS产品表现最优(EKG=0.89,ERMS=19.8 mm,Bias=2.1%),其次为MSWEP产品(EKG=0.85,ERMS=19.9 mm,Bias=8.0%),表现最差的是PERSIANN产品(EKG=0.70,ERMS=25.8 mm,Bias=15.6%); 融合数据集RF相较于3套遥感降水产品拥有更好的性能(EKG=0.97,ERMS=10.7 mm,Bias=-0.9%),表明基于RF融合的降水在黄河源地区具有较好的适用性。
-
图2 站点降水和融合降水产品RF的降水散点图(a)、站点降水和遥感降水产品PERSIANN的降水散点图(b)、站点降水和遥感降水产品MSWEP的降水散点图(c)、站点降水和遥感降水产品CHIRPS的降水散点图(d)
-
Fig.2 Scatter plots of precipitation data: (a) station precipitation vs. fused precipitation product (RF) ; (b) station precipitation vs. remote sensing precipitation product (PERSIANN) ; (c) station precipitation vs. remote sensing precipitation product (MSWEP) ; (d) station precipitation vs. remote sensing precipitation product (CHIRPS)
-
图3 展示了融合降水产品性能的空间分布。融合降水在站点尺度的性能总体较优(CC>0.93,EKG>0.90),表明融合降水能够较好地捕获站点降水的波动。由图3b可知,融合降水的RMSE总体较低,呈现西北部低东南部高的空间分布格局。由图3d可知,融合降水的BIAS总体较低,在源区东北部有负偏差。证明了机器学习降水融合的可行性,可用此方法估算区域降水。
-
利用泰勒图展现各个降水产品与观测值之间相关系数,标准差和均方根误差之间的差异(Taylor,2001),各降水产品与站点降水间的距离越小表明其性能越好。由图4a可知,在月尺度各个降水产品性能总体较优(CC>0.95),相对差异较小,其中融合降水数据集RF性能相对较好(CC>0.99)。由图4b可知,在年尺度各降水产品的性能不如月尺度,3套原始遥感降水产品中表现最优的是CHIRPS,其次是MSWEP,PERSIANN产品相对较差。融合降水数据集RF性能相对于3套不同的遥感降水产品拥有更好的性能(CC>0.90),证明了融合降水数据集RF在黄河源模拟降水更接近站点降水数据。
-
图5a和图5b分别是站点降水和降水产品的年内波动及年际波动。在验证期融合数据集RF与站点降水的年内波动最接近(EKG=0.98),3套原始的遥感降水产品中CHIRPS年内波动模拟相对较好(EKG=0.96),其次是MSWEP(EKG=0.91),PERSIANN模拟降水最差(EKG=0.81)。其中MSWEP和PERSIANN在夏季有明显高估降水。
-
在验证期融合数据集RF与站点降水的年际波动最接近(EKG=0.89),3套遥感降水产品中CHIRPS年际波动模拟相对较好(EKG=0.86),其次是MSWEP(EKG=0.73),PERSIANN模拟降水的年际波动最差(EKG=0.59)。其中MSWEP和PERSIANN有明显高估降水。
-
2.2 基于融合降水数据集的黄河源降水特征
-
2.2.1 融合降水数据集在黄河源降水空间分布
-
基于训练好的站点融合降水产品RF,按照距离逐格点匹配其最近的气象站点,逐格点进行降水融合得到格网融合降水产品。并逐格点统计1983—2018年黄河源的月均降水量。融合降水和3套原始遥感降水产品1983—2018年在黄河源的年均降水量的空间分布如图6所示。融合降水和3套遥感降水的空间分布总体保持一致,均能捕获黄河源自东南向西北递减的空间分布格局。PERSIANN产品的降水在黄河源东西部波动更大,且东南部有明显的高估(均值49.4 mm/mon); CHIRPS产品虽然降水均值接近融合降水数据集(均值44.9 mm/mon),但在源区西北部有着明显低估; MSWEP产品和融合降水RF空间分布较为一致,但高估了部分格点的降水(均值46.5 mm/mon)。
-
图3 融合降水产品相关系数(a)、均方根误差(b)、Kling-Gupta系数(c)、相对偏差(d)的空间分布
-
Fig.3 Spatial distribution of statistical metrics for the fused precipitation product: (a) correlation coefficient; (b) root mean square error; (c) KGE; (d) BIAS
-
图4 不同降水产品性能的泰勒图:(a)月尺度;(b)年尺度
-
Fig.4 Taylor diagram of performance comparing the different precipitation products: (a) monthly scale; (b) annual scale
-
2.2.2 融合降水数据集在黄河源降水突变点识别
-
本研究采用 Mann-Kendall 突变检验法来确定黄河源降水的突变年份。由图7知,黄河源 1983-2018 年融合降水集呈显著增加趋势,年均降水序列UF 与其逆序列 UB 有且仅有一个交点,此交点位于 2006 年左右且位于两条 0.05 显著水平线之间,此突变点有效。则黄河源降水突变年份为 2006 年。
-
2.3 融合降水数据集在黄河源气象干旱特征
-
2.3.1 融合降水数据集在黄河源气象干旱趋势
-
逐格点计算1983—2018年黄河源4种时间尺度的SPI指标(SPI1、SPI3、SPI6和SPI12)。图8展示了1983—2018年黄河源SPI变化趋势的空间分布,其中SPI的值大于0表示该格点趋于湿润。在4个时间尺度(SPI1、SPI3、SPI6、SPI12)1983—2018年黄河源呈现SPI增加趋势,SPI1趋势的格点均值为2.2×10-3,随着时间尺度增加,SPI的增加趋势更加突出(SPI12趋势的格点均值为4.0×10-3),即趋于湿润。黄河源西北部上升趋势大于东南部,随着时间尺度的增加,源区东西趋势波动更大。各格点均通过了置信度为95%的显著性检验,表明黄河源近36年气象干旱趋缓。
-
图5 站点降水与降水产品的降水量(单位:mm)波动:(a)年内波动;(b)年际波动
-
Fig.5 Temporal variation of station precipitation compared to precipitation products (units:mm) : (a) monthly variation within a year; (b) interannual variation
-
图6 基于随机森林格点产品和3套遥感降水在黄河源的月均降水量(单位:mm)空间分布:(a)融合降水产品RF;(b)遥感降水产品PERSIANN;(c)遥感降水产品MSWEP;(d)遥感降水产品CHIRPS
-
Fig.6 Spatial distribution of monthly precipitation (units:mm) in the source region of the Yellow River based on the fused precipitation product (RF) and three remote sensing precipitation datasets: (a) fused monthly precipitation product (RF) ; (b) remote sensing monthly precipitation product (PERSIANN) ; (c) remote sensing monthly precipitation product (MSWEP) ; (d) remote sensing monthly precipitation product (CHIRPS)
-
图7 1983—2018年黄河源的降水量Mann-Kendall突变点识别
-
Fig.7 Identification of Mann-Kendall mutation points in precipitation trends in the Yellow River source region from 1983 to 2018
-
图8 基于融合降水集的黄河源SPI趋势:(a)SPI1趋势;(b)SPI3趋势;(c)SPI6趋势;(d)SPI12趋势
-
Fig.8 Trends in the SPI (based on the fused precipitation dataset) in the source region of the Yellow River: (a) SPI1 trend; (b) SPI3 trend; (c) SPI6 trend; (d) SPI12 trend
-
2.3.2 融合降水数据集在黄河源气象干旱监测空间分析
-
根据游程理论识别干旱频次(N),由表3可知随着时间尺度的增大,干旱频次趋于减少。降水突变前(2006年)识别的干旱频次要多于降水突变后。在短时间尺度(SPI1)上识别的干旱频次在4个时间尺度中最多,利用SPI1分析降水突变前后的干旱特征。图9展示了降水突变前后黄河源SPI1的干旱特征指标。由图可知,1983—2006年黄河源SPI1的平均干旱历时(MDD)均值为1.82,相较于2007—2018年更长,降水突变前后均呈现干旱历时东北高西南低的空间分布格局,但降水突变后的干旱历时波动更大。1983—2006年黄河源SPI1的平均干旱烈度(MDS)均值为2.42,相较于2007—2018年更严重,降水突变前呈现中部低四周高的空间分布格局,降水突变后呈现北高南低的空间分布格局。1983—2006年黄河源SPI1的平均干旱强度(MDI)均值为1.72,相较于2007—2018年略低,降水突变前后均呈现干旱历时东北低东南高的空间分布格局,但降水突变后的源区南北干旱强度波动更大。1983—2006年黄河源SPI1的平均干旱极值(MDP)均值为1.91,相较于2007—2018年更严重,降水突变前呈现西南低,西北和东南高的空间分布格局,降水突变后呈现东北低、西北和东南高的空间分布格局。
-
3 结论与讨论
-
3.1 结论
-
本研究利用随机森林模型,开展多源遥感降水产品的数据融合研究,评估融合产品的性能,并利用标准化降水指数(SPI)和游程理论,探究黄河源区的气象干旱的时空演变特征,结论如下:
-
1)融合降水数据集在站点尺度性能优于3套原始遥感降水产品,具有高相关系数,低均方根误差,低相对偏差和高Kling-Gupta系数的特点,能够较好地捕获观测降水的年内和年际波动。证明了融合降水在黄河源区有着良好的适应性。
-
2)融合降水数据集和3套遥感降水产品时空格局相对一致,1983—2018年黄河源降水量和各时间尺度的SPI呈现显著增加趋势,降水突变点在2006年。表明近36 a源区降水增加,气象干旱趋缓。
-
3)2006年前黄河源SPI1的平均干旱事件历时长、烈度强和极值大,但2006年后干旱事件特征趋缓; 黄河源西北部干旱历时和烈度较高,东南部干旱强度和极值较高。
-
3.2 讨论
-
国内外学者开展机器学习对于干旱的研究与本文的侧重不同。张娟等(2023)研究的随机森林模型侧重于多因子的农业干旱的研究,方秀琴等(2021)研究的随机森林模型侧重在全球不同的气候区来建立干旱评估的模型,本文构建的随机森林模型侧重于对多源遥感降水产品的数据融合,评估融合降水集对干旱监测的性能。
-
图9 黄河源1983—2018年突变点前(a)、后(b)干旱事件特征空间分布:(a1、b1)MDD;(a2、b2)MDS;(a3、b3)MDI;(a4、b4)MDP
-
Fig.9 Spatial distribution of drought event characteristics in the source region of the Yellow River (1983—2018) (a) before and (b) after the abrupt change point: (a1, b1) MDD; (a2, b2) MDS; (a3, b3) MDI; (a4, b4) MDP
-
本研究发现融合数据集在黄河源1983—2018年降水量呈现显著增加趋势,年降水量在2006年发生突变,与谷鑫鑫等(2019)、张鸣等(2023)研究结果较为一致。本研究发现融合数据集在黄河源1983—2018年SPI呈现显著增加趋势,与Li et al.(2024)研究结果一致,证明了近36年黄河源气象干旱趋缓。许昕彤等(2023)评估MSWEP产品1981—2020年捕获黄河流域气象干旱的能力,与本研究对比低估了干旱历时和极值,原因可能是游程理论识别干旱阈值和降水产品差异导致的不同。
-
虽然本研究对数据来源、研究方法等进行严格的质量控制,但不可避免地存在不确定性。首先,本文选择了适用性较为广泛的随机森林机器学习模型,未考虑与其他的机器学习模型进行对比分析,可能会存在不确定性。其次,干旱指数仅选择常用监测干旱指数标准化降水指数,而目前干旱指数众多,未来会采取不同干旱指数在黄河源地区评估,提升干旱监测效果; 最后,本文仅研究了黄河源气象干旱的特征,但水文干旱等事件对黄河源的生态保护与经济发展同样重要,未来会考虑研究多个机器学习模型、多个干旱指数融合降水集捕获干旱特征。
-
参考文献
摘要
遥感降水产品可为气象干旱精准监测提供近实时、多时空分辨率的降水数据,但其性能易受复杂地形和极端气候的影响,基于机器学习的多源数据融合方法为提高复杂地形和偏远地区遥感降水产品精度和干旱监测能力提供了新思路。基于此,本研究以资料稀缺的黄河源为研究区,利用随机森林(random forest,简称RF)方法生成了黄河源区长序列(1983—2018年)高精度的格网降水数据集,并基于该数据集利用标准化降水指数(standardized precipitation index,简称SPI)和游程理论方法识别气象干旱事件,阐明融合降水产品数据集对气象干旱事件特征的捕获能力。结果表明:1)基于机器学习的降水融合数据集在站点尺度性能方面优于3套原始遥感降水产品,能较理想地捕获降水的年内和年际波动;2)黄河源降水和4个时间尺度的SPI(SPI1、SPI3、SPI6和SPI12)均呈显著增加趋势(通过0.05信度的显著性检验),表明近36年黄河源区降水增加,气象干旱趋缓;3)降水突变点发生在2006年,2006年前的平均干旱事件历时长、烈度强和极值大,但2006年后干旱事件特征趋缓;空间分布上,源区西北部干旱历时和烈度较高,东南部干旱强度和极值较高。
Abstract
Remote sensing precipitation products provide near real-time,multi-temporal,and spatially resolved precipitation data,which are essential for accurate meteorological drought monitoring.However,their accuracy is often compromised by complex terrain and extreme climate conditions.Machine learning-based data fusion methods offer a novel solution to for enhancing the precision of remote sensing precipitation products,particularly in challenging environments.This study focuses on the source region of the Yellow River,a data-scarce area with complex topography,to develop a high-resolution gridded precipitation dataset and evaluate its utility in drought monitoring.
Using the Random Forest (RF) model,a long-term (1983—2018) high-accuracy precipitation dataset was generated by fusing multiple remote sensing precipitation products.The fused dataset was applied to identify meteorological drought events using the Standardized Precipitation Index (SPI) and run theory.Temporal and spatial characteristics of drought events were analyzed to assess dataset’s capability to capture drought dynamics.Key findings include:1) The fused precipitation dataset outperformed three individual remote sensing precipitation products (PERSIANN-CDR,MSWEP v2.0,and CHIRPS v2.0) at the station scale,exhibiting higher correlation coefficients (CC),lower root mean square errors (RMSE),reduced relative bias,and improved Kling-Gupta efficiency (KGE).The dataset accurately captured both monthly and inter annual variations,demonstrating its adaptability to the Yellow River source region.2) Precipitation and SPI values across four temporal scales (SPI1,SPI3,SPI6,and SPI12) exhibited statistically significant increasing trends (P<0.05),indicating increased precipitation and a reduction meteorological drought severity over the past 36 years.3) An abrupt change in precipitation occurred in 2006.Prior to this point,the region experienced more frequent and severe droughts with longer durations,higher intensities,and greater extremes.After 2006,drought characteristics became milder.Spatially,the northwest of the source region experienced longer and more severe droughts,while the southeast exhibited higher drought intensity and extremes.
This study provides critical insights into precipitation and drought dynamics in the source region of the Yellow River,supporting efforts in meteorological drought early warning,water resource management,and regional climate adaptation.The observed increasing precipitation trend and alleviation of drought conditions are vital for developing sustainable development strategies and disaster mitigation plans.
The research underscores the potential of integrating remote sensing products with machine learning techniques to improve the accuracy and applicability of climate datasets,especially in regions with limited ground-based observations and complex topography.The fused dataset not only demonstrated enhanced accuracy but also provided a robust foundation for analyzing the spatiotemporal evolution of meteorological drought events.Future work could extend this approach to other regions and incorporate additional hydrometeorological variables for more comprehensive drought assessments.