Home Notizie recenti Un modello per milioni di località consente una migliore previsione delle condizioni...

Un modello per milioni di località consente una migliore previsione delle condizioni climatiche e ambientali

40
0
Un modello per milioni di luoghi

Un framework sviluppato dagli statistici KAUST consente la modellazione di una gamma di set di dati meteorologici e ambientali da un massimo di 2 milioni di località a livello globale. Attestazione: KAUST; Heno Hwang

Uno schema di modellizzazione più rapido e statisticamente accurato consente una migliore previsione del clima e delle condizioni ambientali su scale molto grandi.

La combinazione di metodi statistici sfumati con una solida piattaforma computazionale parallela ha consentito uno schema di modellizzazione che predice meglio le condizioni ambientali pur essendo abbastanza efficiente da coprire milioni di posizioni di monitoraggio.

Il nuovo approccio di modellazione sviluppato da KAUST affronta un ostacolo di vecchia data al miglioramento delle previsioni meteorologiche e climatiche: come implementare statistiche non gaussiane per set di dati geospaziali molto grandi.

“Nelle statistiche spaziali, l’obiettivo principale è utilizzare i dati osservati nelle stazioni di monitoraggio per prevedere le condizioni in luoghi non osservati”, spiega Sagnik Mondal, uno studente di dottorato del gruppo di ricerca statistica di Marc Genton. “Questi tipi di previsioni sono necessari per molti tipi di applicazioni meteorologiche e climatiche. Al giorno d’oggi, tuttavia, il numero di punti di osservazione può raggiungere milioni, il che va oltre la capacità degli approcci computazionali tradizionali, e i modelli gaussiani tradizionali non riescono a catturare statisticamente valori estremi .”

Un modello gaussiano è una semplice descrizione statistica di un set di dati basato su un valore medio “medio” e distribuzioni simmetriche a valori più alti e più bassi: l’iconica “curva a campana”. Tuttavia, molte variabili ambientali e le loro derivate, come l’intensità delle precipitazioni, la velocità del vento, i giorni senza pioggia oi giorni al di sopra di una certa temperatura, non sono simmetriche nella loro distribuzione. Piuttosto, hanno probabilità di picco che si aggirano vicino allo zero ma possono, in rare occasioni, raggiungere estremi significativamente elevati. Questa lunga “coda” verso valori estremi con probabilità molto bassa non può essere catturata dai modelli gaussiani ma sta diventando sempre più importante sotto il cambiamento climatico.

“In questo lavoro, abbiamo applicato il modello geh di Tukey, che è un modello spaziale non gaussiano con due parametri aggiuntivi per adattarsi alle distribuzioni asimmetriche e acquisire meglio i valori estremi”, afferma Mondal.

Sebbene il modello di Tukey sia chiaramente vantaggioso per i dati meteorologici, non è abbastanza efficiente da applicare in pratica a grandi insiemi di dati geospaziali come un tradizionale calcolo sequenziale. Tuttavia, può essere notevolmente migliorato parallelizzando i calcoli.

“I modelli gaussiani sono già stati parallelizzati, quindi abbiamo deciso di implementare per la prima volta il modello Tukey utilizzando un’architettura parallela all’avanguardia”, afferma Mondal.

Eseguendo il nuovo schema di modellazione sul supercomputer Shaheen-II di KAUST, il team di ricerca ha dimostrato le prestazioni del modello utilizzando i dati delle precipitazioni reali provenienti da oltre 300.000 località in tutta la Germania e utilizzando un set di dati sintetico di oltre 800.000 stazioni.

“Il nostro framework ci consente di adattare il modello esatto a set di dati fino a 1 milione di posizioni e, con ulteriori approssimazioni, fino a 2 milioni di posizioni”, afferma Mondal. “Utilizzando calcoli paralleli, stiamo fornendo una strada per la modellazione di dati geospaziali su larga scala”.

Lo studio è stato pubblicato nell’ambito del 2022 IEEE International Parallel and Distributed Processing Symposium (IPDPS).


Articolo precedenteGli australiani con disabilità e i loro assistenti sono più a rischio di senzatetto, disturbo da stress post-traumatico dopo le inondazioni
Articolo successivoInseguendo i biomarcatori della sindrome di Rett: gli studi EEG notturni potrebbero migliorare l’assistenza?