Visitatori

Un progetto di citizen science per i dati idrologici: SIREN (Saving Italian hydRological mEasuremeNts)

In Italia, la raccolta dei dati idro-meteorologici è stata gestita a livello nazionale dal Servizio Idrografico e Mareografico Nazionale (SIMN) fin dai primi anni del 1900. Lo smantellamento del SIMN, effettuato circa 30 anni fa, ha avuto come conseguenza il trasferimento dei compiti di gestione della rete di monitoraggio e di raccolta dati ad un livello regionale, cioè a 19 Regioni e 2 Province Autonome. Questo cambiamento ha determinato problemi nella disponibilità di dati completi e omogenei per l’intero Paese.

Per quanto riguarda gli anni più recenti, i dati sono disponibili in formato digitale, facilmente utilizzabili da chi ne fa richiesta all’ente regionale di competenza. Le misure idrologiche storiche sono invece spesso disponibili solo nella versione stampata degli Annali Idrologici, prodotti dal Servizio Idrografico e Mareografico Nazionale. In passato qualche lavoro di recupero di queste informazioni è stato effettuato ma i risultati ottenuti sono da considerarsi come parziali, limitati a qualche anno e/o qualche regione.

Questa mancanza di dati in formato digitale è un problema?

Decisamente sì! Uno dei maggiori problemi che idrologi e climatologi devono affrontare è il numero limitato di informazioni storiche che possono essere utilizzate per testare nuove metodologie o per addestrare modelli. Questa mancanza di informazioni è ancora più critica in una nazione come l’Italia, con una morfologia complessa e un clima che cambia da zona a zona.

Il recupero di questa notevole mole di dati non solo permetterebbe di comprendere meglio il clima del secolo scorso ma servirebbe anche a stimare come il clima e il ciclo idrologico potrebbero cambiare in futuro.

Perché è importante digitalizzare le serie storiche?

Prendiamo come caso studio il Piemonte. In Figura 1 abbiamo riportato una stima del numero di serie storiche delle portate medie giornaliere disponibili per ogni anno in Piemonte. Solamente le osservazioni più recenti, a partire dal 1995 (in grigio), sono disponibili in formato elettronico attraverso il portale dell’Arpa Piemonte.

Fig. 1: numero di serie storiche di portate medie giornaliere disponibili in Piemonte per anno. In azzurro sono indicate le serie storiche disponibili unicamente nei volumi degli Annali Idrologici.

Le serie meno recenti (prima del 1995, in azzurro) sono invece riportate nei volumi degli Annali Idrologici. Queste ultime rappresentano una porzione significativa e, in questo caso, maggioritaria, delle osservazioni di portata media giornaliera complessivamente disponibili in Piemonte. Tuttavia, un massiccio sforzo di digitalizzazione è necessario per renderle facilmente utilizzabili.

In Figura 2 è riportato un esempio di serie storica di portate giornaliere per il Fiume Tanaro a Montecastello. Le osservazioni dal periodo che va dal 1942 al 1985 sono disponibili negli Annali Idrologici, mentre solo le osservazioni dal 1996 al 2010 sono disponibili in formato elettronico. In Figura 2 sono anche riportate le serie delle portate medie in primavera ed autunno (in basso), con le relative medie di lungo termine nei due periodi. La differenza fra i valori di questi due periodi risulta chiaramente visibile e suggerisce la presenza di trend nel regime idrologico.

Questo esempio evidenzia l’importanza della digitalizzazione e della ricostruzione delle intere serie storiche, specialmente quando l’analisi di trend e cambiamenti nei regimi idrologici sono oggetto di studio.

Fig. 2: serie storica di portate medie giornaliere del Fiume Tanaro a Montecastello e portate medie in primavera (marzo, aprile e maggio) e autunno (settembre, ottobre e novembre). Le linee orizzontali indicano la media di lungo termine sui due periodi.

In altre parole… abbiamo bisogno del tuo aiuto per recuperare i dati storici!

Nell’ambito del progetto SIREN (Saving Italian hydRological mEasuremeNts) miriamo a digitalizzare questi dati coinvolgendo la popolazione nel processo di trascrizione degli Annali Idrologici.

La fase 1 del progetto SIREN sarà dedicata al recupero delle misure di portata giornaliera.

Perché abbiamo bisogno del tuo aiuto? Perché, semplicemente, non possiamo usare qualche software di riconoscimento ottico dei caratteri?

Nonostante i notevoli miglioramenti raggiunti negli ultimi anni dai software di riconoscimento ottico dei caratteri (OCR) e dalle tecniche di apprendimento automatico e di intelligenza artificiale, in molti casi l’approccio di digitalizzazione più accurato è ancora basato sulla trascrizione manuale.

La maggior parte di questi record sono stampati su vecchi documenti e l’inchiostro è parzialmente danneggiato. In queste condizioni, ad esempio, un “8” può essere facilmente identificato come “3” da un software.

Inoltre, queste tavole contengono diverse correzioni manoscritte eseguite da persone diverse, quindi con calligrafie diverse. Tutte queste peculiarità limitano l’applicabilità di approcci automatici standardizzati.

Se vuoi contribuire alla digitalizzazione di questi dati, su https://www.zooniverse.org/projects/siren-project/siren-project potrai trovare tutte le informazioni del progetto ed un tool per la digitalizzazione! Anche solo 10 minuti del tuo tempo saranno preziosi per il progetto!


Gruppo di ricerca formato da Paola Mazzoglio, Luca Lombardo, Alberto Viglione, Francesco Laio e Pierluigi Claps del Dipartimento di Ingegneria dell’Ambiente, del Territorio e delle Infrastrutture del Politecnico di Torino e da Miriam Bertola della Vienna University of Technology. Progetto lanciato dal Politecnico di Torino – Dipartimento di Ingegneria dell’Ambiente, del Territorio e delle Infrastrutture in occasione della Giornata Mondiale dell’Acqua, 22 marzo 2023.

Leave a Reply

You can use these HTML tags

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>