I dati sono una miniera d'oro. Saperli leggere e interpretare può far farti fare un salto di qualità in tutti i settori della vita, dall'economia alla scuola, passando per la salute e lo sport. Ad esempio, come leggere efficacemente i dati sulla pandemia senza dipendere solo dai programmi televisivi? In questo articolo ti consiglio quattro semplici regole di base.
1) Cerca le fonti più attendibili da cui prendere le informazioni.
Generalmente ci sono due tipi di fonti in cui aggiornarsi su internet:
- Esistono delle "repository", cioè degli archivi online, in cui è possibile trovare i dati aggiornati sulla pandemia scaricabili in Excel o in altri formati. Ad esempio, l'Open Data Portal dell'Unione Europea: https://data.europa.eu/euodp/en/data/dataset/covid-19-coronavirus-data
- Inoltre, ci sono poi dei siti che oltre ad avere un archivio di dati scaricabile ti permettono di visualizzare i dati attraverso figure e grafici aggiornati. Ad esempio, puoi consultare una fonte ufficiale, come quella del Ministero della Salute e la Protezione Civile, in cui troverai una pagina con numeri e grafici interattivi sull'andamento dell'epidemia: http://opendatadpc.maps.arcgis.com/apps/opsdashboard/index.html#/b0c68bce2cce478eaac82fe38d4138b1. Oppure puoi fare riferimento a fonti giornalistiche, come il Sole 24 Ore: https://lab24.ilsole24ore.com/coronavirus/. Un altro sito utile che ti segnalo in cui trovare e confrontare i dati della pandemia nei vari stati del mondo è invece Wordometers: https://www.worldometers.info/coronavirus/
2) Acquisisci i concetti di base della statistica descrittiva, come media, deviazione standard e percentuale.
La media aritmetica viene calcolata sommando tutti i valori a nostra disposizione e dividendo questo risultato per il numero complessivo dei dati. La media ci dà una descrizione semplice ed immediata di una misura.
In termini generali e divulgativi, la deviazione standard invece ci dice quanto una misura varia rispetto alla media. Più questo valore è alto, più la misura fluttuerà attestandosi sopra e sotto il valore medio. Al contrario, più basso sarà questo valore e meno la misura fluttuerà rispetto alla media, Consideriamo ad esempio l'indice di Rt di ogni regione, misura che è definita sul sito del Sole 24 Lab come "il numero di infezioni prodotte da una persona nell’arco del suo periodo infettivo". Ogni regione ha un valore medio di Rt e alcune regioni potrebbero mostrare un numero medio simile, ma la misura può essere più o meno variabile da zona a zona, ad esempio fluttuando di molti decimali sopra e sotto il valore medio in una regione, ed essere più "stabile" e non variare molto in un'altra zona.
La percentuale è la grandezza di una misura rispetto ad un'altra che viene presa come riferimento. La percentuale delle persone positive al Covid-19 rispetto al numero totale di persone testate può essere un esempio di tale calcolo. La percentuale è una statistica utilissima per "normalizzare" una misura. Nella sezione del sito cerebest.com/neuroscienze trovi altri esempi di numeri in percentuale attraverso esempi legati al mondo del marketing e dello sport che ti mostro attraverso report interattivi 4.0.
3) Visualizza!
La vista è uno dei sensi più importanti per l'uomo. Non a caso, nel cervello la parte dedicata alla visione, la corteccia visiva, è una delle aree più vaste in assoluto. Perché allora non sfruttare questo senso così importante per noi? Per rendere un fenomeno più chiaro "a vista d'occhio" ti consiglio di leggere i numeri attraverso dei grafici o delle figure. Sarà più semplice interpretarli e dargli un senso. Dai grafici è possibile capire tantissime cose. Ad esempio notare come varia un fenomeno nel tempo, oppure confrontare due misure in un solo sguardo mettendole vicine o nella stessa figura.
4) Per interpretare meglio un dato dobbiamo normalizzarlo.
Per capire perché è importante leggere un dato normalizzato e cosa cambia rispetto ad un dato "grezzo", guarda questi due video che ho creato attraverso il codice del Bar Chart Race Project (https://pypi.org/project/bar-chart-race/) utilizzando i dati dell'EU Open Data Portal aggiornati al 3/11/2020. Nel primo video ti mostro i casi totali di COVID-19 registrati giornalmente in alcuni paesi del mondo.
Ho messo insieme i numeri di Francia, Brasile, Belgio, Cina nello stesso grafico. Ma questi stati hanno lo stesso numero di abitanti? Il numero di abitanti di uno stato può influenzare la probabilità di avere più o meno persone contagiate all'interno del paese? Possono essere confrontanti paesi come la Cina che ha oltre un miliardo di abitanti e il Belgio che ne ha circa undici milioni? Ti mostro adesso un secondo video in cui per gli stessi stati ho calcolato la percentuale di casi di COVID-19 totali registrati ogni giorno rispetto al totale della popolazione dello stato.
L'ordine finale degli stati nei due video è lo stesso? No. Utilizzando i dati "grezzi" sui contagi di un paese, oppure quelli normalizzati rispetto al numero totale di abitanti attraverso la percentuale, assistiamo a due scenari in parte differenti. Ad esempio, nel secondo video abbiamo visto che uno stato come il Belgio, che ha molti meno abitanti del Brasile, abbia comunque al 3/11/2020 una percentuale più alta di casi totali positivi al COVID-19 se confrontati sul totale delle loro rispettive popolazioni. Guardando invece il primo video in cui sono mostrati i casi di contagio totali giornalieri non normalizzati, il Belgio si attesta al quinto posto tra i paesi di questa triste classifica, mentre il Brasile è al primo. Normalizzare i dati "grezzi", come il numero dei contagiati totali giornalieri, rispetto alle variabili che possono avere un'influenza significativa su questi numeri, come la grandezza della popolazione di uno stato, il numero dei tamponi eseguiti, il numero di persone testate e molto altro, ci permette di avere una base di riferimento solida per capire l'andamento di un fenomeno e confrontare questa misura anche tra contesti in parte differenti, ad esempio per le loro caratteristiche demografiche, come il Brasile e il Belgio.
Come avrai visto i numeri ci danno delle informazioni preziosissime, anche per comprendere l'evento storico che stiamo vivendo. Mi raccomando, affidati sempre a fonti autorevoli da cui prendere le informazioni, tieni a mente alcuni concetti statistici di base, visualizza i dati attraverso figure e grafici e normalizzali per poterli comparare tra contesti (es. regioni o nazioni) differenti. Questa è solo una piccola parte delle informazioni che si possono ottenere dai dati che ti ho mostrato. Ad esempio, dai big data, è possibile creare attraverso tecniche di Intelligenza Artificiale dei modelli che ci aiutino a prevedere l'andamento futuro di un evento, come ad esempio la curva epidemiologica del COVID, o qualsiasi altro fenomeno, come la prestazione sportiva di un atleta. Per ottenere maggiori informazioni dai big data, che possono aiutarti in qualsiasi ambito della tua vita, il consiglio è quello di non improvvisarvi e di affidarti sempre ad un esperto.