Sirio 26-29 marzo 2024
Share

La ricerca

Coronavirus, attenzione a non dare i numeri (giusti)

Davide Tosi, esperto di "big data", aveva fatto centro. I dati reali hanno pienamente confermato il suo modello di predizione dei contagi da Covid-19, pubblicato il 2 marzo. L'ottimismo dello studioso: «Stiamo per raggiungere il numero massimo di contagi, ma bisognerà aspettare la fine di aprile per arrivare all'azzeramento dei nuovi casi giornalieri. Le misure hanno funzionato, per questo è vietato abbassare la guardia».

Stefania CECCHETTI

31 Marzo 2020
Davide Tosi

In questi giorni di numeri a raffica e di angosce da bollettino della Protezione Civile, c’è uno studioso che ha sempre invitato all’ottimismo, tanto da finire sui principali media nazionali e persino sulla BBC. È Davide Tosi, esperto di “big data”, ricercatore presso l’Università dell’Insubria e professore aggiunto presso la Bocconi.

Cominciamo con un chiarimento, cosa sono i big data?
Sono grosse quantità di dati in campi diversi, dalla medicina ai trasporti, eterogenei per dimensioni e significati. Sono “open” cioè disponibili sui portali ufficiali – per esempio l’Istat o, come nel caso del Covid, la Protezione Civile – e possono essere elaborati per costruire conoscenza.

La sua curva di previsione, pubblicata il 2 marzo, per i contagi da Covid in Regione Lombardia e in Italia è finita addirittura sulla BBC. Di cosa si tratta?
È una curva che in matematica si chiama sigmoide (perché ha la forma di una “s”) o logistica. Descrive la crescita di una popolazione, in questo caso gli infetti totali da Covid. Sull’asse orizzontale abbiamo il tempo, su quello verticale il numero dei contagi totali. E sottolineo totali: si tratta di un dato cumulativo giorno per giorno, che non sottrae i guariti.

Perché questa scelta di non sottrarre i guariti?
Perché includevano i guariti anche le curve analizzate in Cina. E aderire ai dati della Cina era utile ai fini della previsione, perché i dati preliminari che avevamo erano molto simili, dal punto di vista matematico e statistico, a quelli cinesi (per il confronto con la curva dei contagi di Wuhan si veda il grafico allegato). Ovviamente, ogni curva analizza aspetti diversi, ma tutte sono interconnesse tra di loro, per esempio la mia curva logistica dipende dalla curva “gaussiana” dei contagi giornalieri, quella che fa il conto, giorno per giorno, di quanti contagi in più si sono avuti.

E se il numero dei contagiati non è corretto? Sappiamo che non a tutti viene fatto il tampone. È possibile che queste incertezze abbiano inficiato le previsioni?
Sì, in questi studi le variabili incontrollabili ci sono e possono inficiare le previsioni. Non parlo solo dei dati sui contagi, che possono essere incompleti, ma anche dell’influenza che le scelte politiche hanno sullo sviluppo di una pandemia.

Le sue previsioni si sono dimostrate però corrette, sia per il picco che per il plateau. Vogliamo anzitutto definire questi concetti?
Il picco coincide con il numero massimo di contagi giornalieri registrati. Guardando la sigmoide, è il “flesso” (o punto di cambiamento) centrale, lì dove la tangente da crescente comincia a diminuire la sua pendenza. Per capirsi, il punto dove la curva comincia ad avere la concavità non più verso l’alto ma verso il basso. Il plateau coincide invece con lo stabilizzarsi del numero dei contagi totali, quando cioè il numero dei nuovi contagi giornalieri si avvicina allo zero. Guardando la sigmoide, è poco prima della cima, là dove la tangente tende verso lo zero.

Nella sua curva in quale data si collocano picco e plateau?
Il picco è stato raggiunto il 17 marzo per Regione Lombardia e il 21 marzo per i dati nazionali. Il plateau italiano è atteso tra un paio di giorni. Avevo parlato di 60 mila contagi a plateau, siamo invece già a 80 mila, è possibile che al plateau arriveremo a 100 mila contagi. Una sottostima che può apparire pesante, ma non lo è considerando gli ordini di grandezza con cui abbiamo a che fare. Su 60 milioni di abitanti un errore di 20-40 mila significa poco più dello zero per cento. In termini di vite è tantissimo, ma in termini statistici è un errore minimo.

E poi? Tutti attendiamo con ansia una discesa…
La mia curva, dal momento che non sottrae i guariti, si ferma al plateau, tanto è vero che si tratta di una S, non c’è discesa. Potrebbe solo risalire se, per assurdo, i contagi ripartissero. Per capire le dinamiche della discesa bisogna guardare invece la curva gaussiana dei contagi giornalieri. E quelli stanno già scendendo, basta guardare per esempio i dati di Regione Lombardia. Eravamo a +1800 nuovi contagio il 26 marzo, +1600 il 27 marzo, + 1300 il 28 marzo e +600 il 29 marzo.

Quando possiamo prevedere che i nuovi contagi giornalieri scenderanno a zero?
Nel giro di un mese dal plateau, quindi a fine aprile. Dato confermato anche da modelli che sono stati pubblicati in questi giorni. Sono necessari circa due cicli di incubazione controllata dopo il plateau. Anche per la Cina è stato così, anche se i cinesi sembrano essere stati un po’ più bravi di noi. La loro curva è stata molto simile alla nostra nel salire, più ripida di quello che sembra la nostra nella discesa. Questo perché siamo stati meno rigorosi nel seguire le norme di distanziamento sociale.

Però lei sostiene che le misure messe in atto dal Governo e dalle Regioni siano state fondamentali…
Sicuramente. Ai primi di marzo, quando io ho pubblicato il mio studio, erano molto diffusi modelli di previsione esponenziali (si veda la linea tratteggiata arancione nel secondo grafico allegato), che prevedevano per metà marzo 300 mila contagi. Questo perché le pandemie tendenzialmente seguono modelli esponenziali, se non si mettono in atto tempestivamente misure di distanziamento. Il fatto che la curva si sia appiattita, dando un minimo di respiro al sistema sanitario, è merito dei sacrifici che abbiamo fatto. Ed è per questo che adesso non possiamo assolutamente abbassare la guardia.