close
close

Ruimtelijke verdeling van terrestrische neerslag onthult variërende overeenkomsten tussen datasets in verschillende omgevingen

Ruimtelijke verdeling van terrestrische neerslag

Begrijpen hoe de neerslag wordt verdeeld over verschillende landtypen en hun overeenkomstige klimatologische eigenschappen is cruciaal voor de voortgang van de studie van de mondiale watercyclus. Onze resultaten kunnen worden gebruikt als referentie voor het toeschrijven van vroegere en toekomstige veranderingen in het functioneren van de mondiale watercyclus, of om de representatie ervan in klimaatmodellen te evalueren. We verwachten ook dat toekomstig onderzoek een vergelijkbare verdeling zal toepassen in de andere componenten van de watercyclus, zoals verdamping en afvoer. Wanneer deze variabelen ook geanalyseerd zullen zijn, zullen we een consistenter beeld krijgen van de vochtuitwisseling tussen het land en de atmosfeer, evenals de opslag ervan over het land. Terrestrische neerslag is een goed beginpunt, vanwege de toenemende beschikbaarheid van gegevens, waarvan ook in dit onderzoek gebruik is gemaakt.

Volgens hetzelfde principe gebruiken alle onderzoeken naar de mondiale watercyclus de neerslag op aarde als de meest betrouwbare component voor het schatten van het mondiale massabudget. Onze resultaten van 114 duizend km3 per jaar laten een goede match zien met de baanbrekende studies van Oki en Kanae9 en Trenberth et al.7waar de totale neerslag op het land werd gerapporteerd op 111 en 113 duizend km3 per jaar respectievelijk. Als we bovendien kijken naar de mondiale schattingen van de neerslag op aarde in recentere onderzoeken, lijkt onze mondiale schatting zeer dicht bij hun mediaan te liggen. In hun chronologische literatuuroverzicht van mondiale waterbudgetstudies hebben Vargas Godoy et al.1 laten zien dat de 11 onderzoeken die sinds 2009 zijn gepubliceerd een mediaan van terrestrische neerslag hebben van 113 duizend km3 per jaar (bereik 110 tot 126 duizend km3). Al deze resultaten pleiten ervoor dat we de afgelopen twintig jaar ons vertrouwen in de schatting van de totale neerslag op het land hebben vergroot door de onzekerheid ervan aanzienlijk te beperken.

Als we kijken naar de ruimtelijke indeling van Oki en Kanae9, zien we kleine afwijkingen in de drie soorten landbedekking die daar worden gepresenteerd. Bossen lijken 54 duizend km te ontvangen3 per jaar versus 47 duizend in ons onderzoek, grasland 31 versus 28 duizend km3 per jaar, en akkerland 11 versus 18 duizend km3 per jaar. Deze verschillen kunnen worden toegeschreven aan de satellietvooruitgang in de karakterisering van landtypes, maar ook aan de veranderingen in de landbedekking die zich de afgelopen vijftien jaar hebben voorgedaan. Niettemin is de nabijheid van de resultaten bemoedigend en ondersteunt deze de verdeling over de andere typen landbedekking. In vergelijking met de resultaten van Schlesinger en Jasechko14, zien we ook enige overeenstemming in de relatieve verdeling over biomen. De twee dominante biomen, namelijk tropische regenwouden en graslanden, lijken in onze studie een groter deel van de neerslag te ontvangen, namelijk respectievelijk 42% versus 35% en 18% versus 14%. Integendeel, er is tot 1% verschil in gematigde bossen (14% van de totale neerslag in onze analyse), boreale bossen (8%), gematigde graslanden (5%), woestijnen (4%), steppen (2%) , Mediterrane biomen (1%). De meest waarschijnlijke reden voor de discrepantie kan worden gevonden in het feit dat Schlesinger en Jasechko14 laat de schatting voor subtropische bossen en graslanden achterwege, aangezien deze, als deze in aanmerking wordt genomen, zou resulteren in waarden die vergelijkbaar zijn met onze bevindingen. Een interessante implicatie van deze match is het potentieel om de biomen met een hoge dataset-overeenkomst te gebruiken als voorspellers in de extrapolatieschema’s voor het genereren van gerasterde datasets.

De voordelen van de dataset-overeenkomstbenadering

Alle neerslagschattingen zijn van elkaar afhankelijk. Er is een grote mate van overlap in de brongegevens, dat wil zeggen de meetstationnetwerken, die betrekking hebben op de verschillende observatiegegevensproducten, evenals het gebruik van sommige gegevenssets door andere (Fig. 5a). Het is dus geen verrassing dat het merendeel van de kruiscorrelatiecoëfficiënten van de mondiale jaarlijkse neerslag boven de 0,8 ligt voor de jaarlijkse neerslagtijdreeksen (Fig. 5b). Dit is het resultaat van de verschillende methodologische benaderingen die op dezelfde ruwe gegevensrecords worden toegepast. Of het nu gaat om het kalibratieproces van de satellietsensoren, de assimilatieschema’s van de heranalyses, of de extrapolatiemethode van de gerasterde stationproducten. In principe gebruikt elke methode een overdrachtsfunctie om de som van de oppervlakteneerslag voor elke roostercel te voorspellen. Als datasets vergelijkbare methoden en/of bronnen gebruiken die resulteren in een hoge kruiscorrelatie, zullen de gemiddelde schattingen onvermijdelijk worden beïnvloed, omdat in ons onderzoek alle waarnemingen als even plausibele schattingen worden beschouwd. Dit zou impliceren dat er een soort ‘observationele democratie’ bestaat, die elke sterk tegengestelde ‘mening’ of uitschieter dempt.

Fig. 5: Kwalitatieve en kwantitatieve datasetrelaties.
figuur 5

A Generatiedatasetrelaties (dataset “genealogieën”). De pijlen geven de richting van de gegevenstoepassing aan (GPCC maakt bijvoorbeeld gebruik van CRU-TS). Dezelfde kleur duidt op een gegevensproductfamilie die bronnen deelt. GPM-IMERG en MSWEP worden als een individuele familie beschouwd, omdat ze alleen gegevens uit vijf of meer bronnen gebruiken, maar niet in enig ander dataproduct worden gebruikt. B Kruiscorrelatienetwerk voor gegevenssets. De netwerkranden vertegenwoordigen het hoogste derde deel van de gecorreleerde paren onder de datasets. C Dataset gemiddeld afstandsnetwerk. De netwerkranden vertegenwoordigen het kleinste derde deel van de gemiddelde afstand tussen elk datasetpaar. CMORPH, CHIRPS en PERSIANN niet inbegrepen vanwege de beperking van de wereldwijde dekking. D Relaties voor het genereren van gegevenssets nadat alleen de kruiscorrelatie en de gemiddelde afstand tot de netwerkranden zijn behouden B En C.

Een soortgelijk probleem is gerezen in het geval van klimaatmodelsimulaties. Het werd al snel duidelijk dat de aanname van ‘modeldemocratie’ kan leiden tot aanzienlijke vertekeningen in de schattingen van de ensemblestatistieken17. In hetzelfde onderzoek wordt ook betoogd dat het hanteren van de ‘modeldemocratie’-benadering van de grote modellenensembles een robuustere methode zou kunnen zijn vergeleken met wegings- of subsamplingbenaderingen zonder testen buiten de steekproef. In het geval van gerasterde waarnemingen is een objectieve toetsing buiten de steekproef of enige andere vorm van evaluatie niet mogelijk, aangezien er geen grondwaarheid bestaat. Er zijn maar heel weinig regio’s met meetnetwerken met hoge resolutie (<10 km), voor verschillende klimatologieën, hoogteverschillen, enz., waardoor ze geschikt zijn voor evaluatie op mondiale schaal. Daarom is er, ondanks het voortdurende onderzoek naar de datafusietechnieken of de validatie van klimaatmodellen, geen eenvoudige manier om deze uitdaging aan te pakken, omdat de werkelijke waarde van elke rastercel onbekend blijft.18.

Is er een manier om onderscheid te maken of hoge correlatie (Fig. 5b) en vergelijkbare gemiddelde waarden (Fig. 5c) het gevolg zijn van structurele overeenkomsten tussen de datasets (dezelfde bronnen/methoden) en niet een bevestiging van lagere onzekerheid? Door eenvoudigweg de kruiscorrelatie- of gemiddelde afstandsmetrieken te gebruiken, is het moeilijk te zeggen. Als we echter naar de ‘genealogische’ informatie tussen de datasets kijken (Fig. 5a), kunnen we ontwarren of wat we zien een robuuste of een vertekende schatting is (Fig. 5d). Als twee datasets een directe structurele relatie hebben en een hoge correlatie en een lage gemiddelde afstand delen, kunnen ze worden beschouwd als alternatieve versies van dezelfde dataset. Dit is bijvoorbeeld het geval bij GPCC en MSWEP. Integendeel, in de meeste gevallen komen dataproducten uit dezelfde familie niet overeen in termen van kruiscorrelatie en gemiddelde afstand, bijvoorbeeld ERA5-Land en EM-Aarde. Hier kunnen we aannemen dat de datasets extra inzicht bieden aan het datasetensemble met veel minder structurele overlap.

Door deze methodologie toe te passen kan ‘observationele democratie’ redelijke resultaten opleveren door de datasets te behouden die aanzienlijk lijken af ​​te wijken van het ensemblegemiddelde. Daarom stellen we voor om eerst het hele scala aan variabiliteit van gegevensbronnen te presenteren, en vervolgens de observationele getrouwheid aan te pakken in termen van het kwantificeren van de overeenkomst tussen de gegevenssets. Op deze manier vergroten we het verklarende vermogen van de resultaten, ten koste van de voorspelbaarheid als gevolg van de toegenomen onzekerheid. Het is onvermijdelijk dat deze aanpak gevoelig is voor de drempelselectie die bepaalt welke datasets als vergelijkbaar worden beschouwd en welke niet. Desondanks kan het zeer verhelderend zijn bij het bepalen van de invloed van deze relaties op onze mondiale schattingen, zoals we hieronder zullen zien.

De impact van onenigheid in de datasets op de mondiale neerslagstromen

Zelfs als we geen absoluut vertrouwen kunnen hebben in de afhankelijkheden en overlap van datasets, kan het raamwerk voor datasetovereenkomsten functioneren als een indicator voor de meest plausibele bronnen van vooringenomenheid. In ons geval is het gemakkelijk in te zien dat MSWEP sterk lijkt op GPCC, en GPCP op GPM-IMERG (Fig. 5d en aanvullende tabel S3). Bovendien zijn ze alle vier gekoppeld aan talrijke andere datasets (figuur 5a), wat impliceert dat hun schattingen herhaaldelijk naar de andere dataproducten kunnen worden verspreid. Om de impact van de mogelijke overlapping te onderzoeken, hebben we onze mondiale schattingen herhaald, waarbij we deze vier datasets in meerdere combinaties buiten beschouwing hebben gelaten. In alle gevallen waren de verschillen niet groter dan 1% voor het gemiddelde mondiale neerslagvolume en 3% voor klimaatgemiddelden. Dit komt omdat hun schattingen zo dicht bij het ensemblegemiddelde liggen dat de schatting van het gemiddelde ongevoelig wordt voor verwijdering ervan. Dienovereenkomstig kunnen we de gevolgen onderzoeken van het verwijderen van enkele voor de hand liggende uitschieters, dat wil zeggen CPC en de NCEP-familie (NCAR, DOE en CMAP; figuren 4 en 5b, c). Opnieuw blijven de resultaten onder de 1%, hoogstwaarschijnlijk als gevolg van het grote aantal datasets en de symmetrie van de uitbijters, aangezien twee ervan het mondiale gemiddelde onderschatten en twee overschatten. Door alle datasets te bewaren, behouden we daarom de maximale informatie, zonder ernstige gevolgen voor de schatting van mondiale of klimatologische gemiddelden.

De andere kant van de medaille is de onzekerheid als gevolg van onenigheid over de datasets. Omdat het sterk afhankelijk is van de neerslagintensiteit en zijn top bereikt boven droge en bergachtige gebieden, is de impact ervan op onze resultaten vrij laag (figuur 3 en aanvullende figuren S6-S9). Meer onderzoek naar de regio’s waar de dataset het vaak oneens is, zou echter een van de hoekstenen van toekomstig onderzoek moeten zijn. Hoewel de rastercellen met een lage dataset-overeenkomst een klein deel van het mondiale neerslagtotaal ontvangen, kunnen ze worden gevonden in regio’s met een hoge ecologische en sociaal-economische betekenis. We zien dat de sterkste inconsistenties liggen in dorre zones die ongeveer 41% van het landoppervlak van de aarde beslaan, met een bevolking van meer dan twee miljard mensen, die zich voornamelijk bezighouden met landbouw- en pastorale activiteiten die gevoelig zijn voor de beschikbaarheid van water.19. Op dezelfde manier spelen bergen of hooggelegen zones die ook grote verschillen vertonen een belangrijke rol bij de vorming van gletsjers, sneeuwvelden en watervoerende lagen die water gedurende langere perioden opslaan. Een uitzondering hierop is onvruchtbaar land, waar er een grotere overeenkomst bestaat tussen heranalyses en de andere gegevensbronnen. Dit zou kunnen betekenen dat de heranalyses van de landoppervlakteschema’s niet ideaal zijn en de transpiratie en de waterstroom naar de atmosfeer overschatten, en dus een hogere lokale recycling van regenval. Ten slotte kunnen toekomstige veranderingen in neerslagpatronen en -hoeveelheden kritische gevolgen hebben voor de beschikbaarheid van water en het ecologisch functioneren in dorre of bergachtige gebieden. Het verbeteren van onze inschatting van de componenten van de watercyclus, vooral in regio’s met een lage waarnemingsgetrouwheid, is dus cruciaal voor een beter beheer van de watervoorraden en het verzachten van de gevolgen van extreme klimaatschommelingen.

De beste manier om de betrouwbaarheid van observaties te vergroten is door de in-situ monitoringnetwerken uit te breiden. Een vereenvoudigd voorbeeld van het belang van grondstations voor de betrouwbaarheid van de dataset kan worden aangetoond als we de stations van het GHCN-netwerk beschouwen (aanvullende figuur S11). Hoewel elk dataproduct een iets ander stationsnetwerk gebruikt voor interpolatie, validatie of assimilatie, is het onderzoeken van de relatie tussen de locaties van GHCN-stations en de overeenkomst tussen gridceldatasets behoorlijk informatief. Ongeveer 60% van de gridcellen met ten minste één station van het GHCN-netwerk hebben een bovengemiddelde en hoge datasetovereenkomst. Helaas dekt dit slechts 5% van het elektriciteitsnet. In de overige 95% van de rastercellen zonder stations vertoont slechts 30% een bovengemiddelde of hoge datasetovereenstemming. Als dit het geval is voor jaarwaarden bij een resolutie van 0,25°, dan mogen we een nog sterkere onenigheid verwachten bij hogere spatio-temporele resoluties. Het wereldwijd vergroten van het aantal neerslagstations is de enige tastbare aanpak om dit probleem te verhelpen en de waarnemingsgetrouwheid te verbeteren.