AI applicata alla previsione della diffusione dell’epidemia
A deep learning approach for Spatio-Temporal forecasting of new cases and new hospital admissions of COVID-19 spread in Reggio Emilia, Northern Italy. Journal of Biomedical Informatics (2022). Autori: V. Sciannameo, A. Goffi, G. Maffeis, R. Gianfreda, D.J. Pagliari, T. Filippini, P. Mancuso, P. Giorgi-Rossi, L.A. Dal Zovo, A. Corbari, M. Vinceti, P. Berchialla. DOI:10.1016/j.jbi.2022.104132.
ABSTRACT
Contesto: Dal febbraio 2020, l’epidemia di COVID-19 si è rapidamente diffusa in tutta Italia. Alcuni studi hanno mostrato un’associazione tra fattori ambientali, quali PM10, PM2,5, NO2, temperatura, umidità relativa, velocità del vento, radiazione solare e mobilità con la diffusione dell’epidemia. In questo lavoro, abbiamo cercato di prevedere tramite Deep Learning la trasmissione in tempo reale della SARS-CoV-2 nella provincia di Reggio Emilia utilizzando una griglia con risoluzione 12 km × 12 km, includendo informazioni satellitari.
Metodi: Ci siamo concentrati sulla provincia di Reggio Emilia, che è stata severamente colpita dalla prima ondata dell’epidemia. Gli output includono nuovi casi da SARS-CoV-2 e ricoveri ospedalieri COVID-19. Sono analizzati i dati relativi all’inquinamento, alla meteorologia e alla mobilità. Il dominio di simulazione spaziale comprende la provincia di Reggio Emilia in una griglia di 40 celle di 12 km2. Abbiamo implementato un ConvLSTM (Convolutional Long Short Term Memory), ovvero un approccio di deep learning spazio-temporale, per eseguire una media mobile su una finestra di 7 giorni e prevedere il 7° giorno successivo. Abbiamo utilizzato come set di training e validazione i nuovi casi giornalieri e i ricoveri ospedalieri da agosto 2020 a marzo 2021. Infine, abbiamo valutato i modelli in termini di Errore Assoluto Medio (MAE) rispetto al Valore Osservato Medio (MOV) e all’Errore Quadratico Medio (RMSE) sui dati da aprile a settembre 2021. Abbiamo testato le prestazioni di diverse combinazioni di variabili di input per trovare il miglior modello di previsione.
Risultati: I nuovi casi giornalieri di infezione, la mobilità e la velocità del vento sono risultati fortemente correlati con la previsione dei nuovi ricoveri ospedalieri COVID-19 (MAE = 2,72 nella provincia di Reggio Emilia; MAE = 0,62 a Reggio Emilia città), mentre per i nuovi casi giornalieri sono state utilizzate le variabili di mobilità, radiazione solare, PM2,5 e nuovi casi stessi, con opportuni sfasamenti temporali.
Interpretazione: la ConvLSTM ha ottenuto buone prestazioni nella previsione delle nuove infezioni da SARS-CoV-2 e dei nuovi ricoveri ospedalieri da COVID-19. La rappresentazione spazio-temporale permette di sfruttare la robustezza dei dati limitrofi per fare previsioni a livello di cella, ottenendo previsioni accurate anche a livello di regione, il che è fondamentale per aiutare ad ottimizzare la distribuzione in tempo reale delle risorse sanitarie durante un’emergenza epidemica.