Qualche giorno fa leggevo una discussione sull’incremento dei casi positivi di Covid-19, con una fazione favorevole all’incremento lineare e l’altra favorevole a quello esponenziale.
Non ho trovato particolarmente interessante e utile la discussione. Ma mi ha dato l’occasione per rispolverare una delle primissime analisi fatte all’ inizio della pandemia, quella sui fattori di contagio: https://www.emigrantrailer.com/corona-virus-covid-19-fattori-di-contagio-e-decessi-in-italia/.
Allora, mi concentrai sui motivi per cui la Lombardia era risultata al centro del ciclone di questa pandemia, relativamente alle altre regioni italiane. E ne era venuto fuori un diretto legame con la popolazione, la densitá abitativa, il numero di over 65, la mobilitá territoriale.
Successivamente avevo poi arricchito l’analisi andando ad osservare altri fattori di rilievo come l’ attitudine al fumo, l’obesitá, e l’ uso di alcolici: https://www.emigrantrailer.com/corona-virus-covid-19-age-smoke-alcohol-obesity-and-health-among-different-nations-and-italian-regions/.
A suo tempo non mi ero spinto a cercare correlazioni lineari, esponenziali, o di qualunque altro tipo. Il motivo é che eravamo agli inizi di uno scenario totalmente impredicibile. Sarebbe stato un errore madornale e dettato da estrema superficialitá.
Oggi, dopo otto mesi, conosciamo molto piú di questo virus; almeno sulla base dei dati ufficiali che ci vengono forniti. Ebbene, in questi giorni mi sono fatto una domanda diversa: é possibile che sussista una correlazione lineare tra uno o piú di questi fattori e l’incremento dei casi da Covid-19 negli ultimi tre mesi?
La domanda non é fine a se stessa. Ma, serve per capire eventualmente quali siano le misure da adottare e proporre.
Ho preso in esame l’ incremento dei casi positivi per tutte le regioni italiane tra il 1 Agosto 2020 e il 24 Ottobre 2020. Ho utilizzati i dati forniti dalla Protezione Civile Italiana in queste due date: https://github.com/pcm-dpc/COVID-19/tree/master/schede-riepilogative.
Ho poi incrociato il valore dei casi positivi per ciascuna regione italiana con i seguenti fattori, i cui valori sono stimati alle date piú recenti secondo la banca dati ISTAT (https://www.emigrantrailer.com/come-accedere-alle-banche-dati-e-allo-storico-istat/):
- Popolazione regionale (Figura 1)
- Densitá abitativa per regione (Figura 2)
- Numero dei Comuni per regione (Figura 3)
- Popolazione regionale con etá superiore ai 65 anni (Figura 4)
- Numero di fumatori (Figura 5)
- Numero di persone in sovrappeso e obese (Figura 6)
- Numero di consumatori abituali di alcolici (Figura 7)
- Numero totale di decessi per problemi respiratori tra il 2008 e il 2017 (Figura 8)
Prima di procedere devo fare alcune premesse.
Prima premessa: sui grafici ho scritto il titolo degli assi, del grafico e di alcune regioni in lingua inglese per permettere una comprensione del grafico anche a chi non é italiano. Insomma, i miei amici tedeschi e americani ultimamente mi hanno cazziato che oramai scrivo tutto in italiano (ma tra un pó ritorno alle lingua di base del mio sito, l’ inglese).
Seconda premessa: sui grafici non riporto i nomi di tutte le regioni e i numeri graficati, solo per pulizia grafica. Trovate al fondo dell’articolo una tabella riassuntiva con numeri e regioni.
Terza premessa: le considerazioni che faccio sui grafici sono a titolo personale, frutto dell’analisi puramente numerica. Non ho modo né tempo di fare una ricerca scientifica piú accurata con ulteriori approfondimenti e su base ancora piú locale (vedi province e comuni). Chiedo venia, ma esiste un Comitato Tecnico Scientifico, un Governo e tanti ottimi ricercatori che fanno questo di mestiere.
Andiamo al dunque: che cosa é emerso?
In Figura 1 si puó osservare una buona correlazione lineare tra i casi positivi e la popolazione regionale; maggior numero di abitanti, maggior numero di casi positivi; minor numero di abitanti, minor numero di casi positivi. Si puó altresí osservare che per alcune regioni c’é uno scostamento significativo dalla linea ideale. In particolare Lombardia e Campania hanno molti piú positivi rispetto al valore teorico. Situazione opposta si registra per tre regioni del meridione: Puglia, Calabria e Sicilia.
La Figura 2 mostra una scarsa correlazione lineare tra i casi positivi e la densitá di popolazione, espressa in abitanti per chilometro quadrato. Si puó infatti osservare che la Lombardia eccede significativamente dalla linea ideale, cosí come Piemonte e Toscana. Tante regioni sono poi al di sotto della linea ideale su cui si collocano Campania, Lazio, Veneto ed Emilia Romagna.
La Figura 3 mostra una scarsa correlazione lineare tra i casi positivi e il numero di Comuni per regioni. In questo caso la Lombardia é abbastanza correlata. Sono piuttosto regioni come Campania, Lazio, Toscana, Piemonte e Calabria che si discostano significativamente dalla linea ideale.
La Figura 4 mostra una piú che buona correlazione con la popolazione regionale con etá superiore ai 65 anni. Il fatto che negli ultimi mesi il numero dei giovani contagiati sia aumentato non implica necessariamente trascurare quella che, sin dalle prime settimane, era stata indicata come la fascia piú a rischio. E questi dati, almeno a livello numerico, sembrano confermare questa speciale attenzione.
La Figura 5 mostra una scarsa correlazione lineare tra i casi positivi e il numero di fumatori abituali per regione. Variazioni significative per Campania e Lombardia (entrambe in eccesso), e per Puglia (in difetto).
La Figura 6 mostra una buona correlazione con la popolazione regionale in sovrappeso e obesa. La maggior parte delle regioni non si discosta di molto dalla linea ideale.
La Figura 7 mostra una buona correlazione con i consumatori abituali di alcolici. Campania e Puglia registrano le differenze piú significative rispetto alla linea ideale.
La Figura 8 mostra una buona correlazione con i decessi per problemi respiratori registrati tra il 2008 e il 2017. Come spiegato tempo fa ( https://www.emigrantrailer.com/corona-virus-covid-19-dati-storici-su-decessi-per-problemi-respiratori-in-italia-e-attuale-situazione/) le regioni piú colpite dal Covid-19 sono anche quelle che storicamente hanno riportato decessi per problemi alle vie respiratorie. Insomma, sono le regioni giá potenzialmente piú soggette ad una emergenza sanitaria.
Che cosa ci dicono questi grafici? Possiamo utilizzare questi dati per proporre alternative alle “semplici chiusure” proposte in questi giorni (e anche in passato)?
Ci dicono delle cose abbastanza scontate e che si continuano ad ignorare come é stato fatto nella prima fase: le regioni italiane hanno una storia, una popolazione e una dinamicitá completamente diversa l’una dall’altra.
Il tutto si puó sintetizzare dicendo che, personalmente, ritengo senza logica un lockdown a livello nazionale, e spero non si arrivi nuovamente a questa soluzione. Sono sempre stato favorevole ad eventuali lockdown localizzati, a livello regionale (se dovesse proprio servire), ma soprattutto a livello provinciale e/o comunale qualora si abbiano delle criticitá localizzate. Ma a livello nazionale é abbastanza difficile da giustificare. Non si possono paragonare le situazioni della Lombardia e della Campania con quelle del Molise e della Basilicata. Solo per fare un esempio. Perché si dovrebbero penalizzare le attivitá in queste ultime due regioni, che hanno una situazione completamente diversa? Faccio davvero fatica a capire.
Vale lo stesso ragionamento per le varie chiusure che sono state annunciate nelle ultime ore attraverso il nuovo Dpcm del 24 Ottobre 2020 (http://www.governo.it/sites/new.governo.it/files/DPCM_20201024.pdf).
In questo contesto di chiusure, trovo quantomeno discutibile (ed inaccettabile), poco professionale, e antidemocratico, che non venga spiegato ai cittadini con quale parametro si stabiliscono le relative regole. Faccio un esempio a me vicino (vedi Figura 9).
In Germania, sono state stabilite regole per la ristorazione in base al numero di casi positivi su 100.000 abitanti in una settimana. Se il numero di nuovi casi positivi supera 35 per 100.000 abitanti, viene raccomandato il coprifuoco per i servizi di ristorazioni e l’implementazione di misure piú restrittive sui protocolli di sicurezza. Se il numero supera 50 per 100.000 abitanti, diventa obbligatorio il coprifuoco dalle ore 23 e diventa obbligatorio il divieto di alcolici. É un protocollo valido a livello nazionale, ma, sulla base di questo parametro di confronto, non si attuano misure restrittive dove non é necessario. In questo modo, si permette ad aree poco colpite di continuare a “vivere” in modo normale, nel rispetto delle regole di base di questa pandemia: utilizzo mascherina, distanziamento sociale e pulizia di base delle mani. E non si penalizzano economie su scala locale e nazionale. E di questo aspetto se ne giovano tutti, anche a livello mentale.
È solo un esempio, ma é per far capire che c’é un parametro inconfutabile (il numero di nuovi casi positivi per 100.000 abitanti in una settimana) che tutti possono valutare ed, in base a quel parametro, possono capire come sta agendo il governo nazionale o regionale. Ora qualcuno mi spiega sulla base di quale parametro é stato stabilito con l’ennesimo Dpcm che le nuove restrizioni vanno dal 26 ottobre fino al 24 Novembre. Perché il 24 Novembre e non il 23 oppure il 22 oppure il 28 Novembre? È stato per caso fissato un parametro specifico, che so il numero di terapie intensive per abitanti o qualsiasi altra cosa? Quando a Luglio criticavo l’estensione dello Stato di Emergenza (https://www.emigrantrailer.com/covid-19-litalia-la-seconda-ondata-lo-stato-di-emergenza-e-la-mascherina/) temevo appunto l’ennesimo Dpcm senza un minimo di logica, con il rischio che nuovamente non si vada ad intervenire dove serve per convivere con questo virus. E se qualcuno non é d’accordo, mi deve peró spiegare con quale parametro io, cittadino, posso capire come (e se) questo governo sta gestendo il paese. E giusto per capirci: non sto auspicando o supportando gli oppositori di Conte o i sostenitori di Salvini e i Meloni: sono anni luce lontani dalle mie idee politiche! E non sto neanche sostenendo i negazionisti o i ribelli delle ultime ore. Ma, sto facendo una critica costruttiva e una domanda precisa al governo dei Cinque Stelle e del PD. Da cittadino dotato di un minimo di intelligenza. Non tanta. Ma sufficiente per farsi questa domanda. Vivo all’estero in un paese, dove non tutto funziona benissimo, ma fatta questa domanda, ho anche la risposta.
Comunque, non volendo chiudere l’analisi con il precedente paragrafo dove emerge sicuramente un pó di frustazione per quello che viene proposto agli italiani, torno alla modalitá propositiva. Abbiamo alternative? Secondo me sí. Non ho la pretesa di sostituirmi a politici, esperti, medici, virologi e quanti altri. Sono proposte alternative, e se non possono essere applicate, mi piacerebbe conoscere la motivazione:
- Utilizzare il parametro “nuovi casi positivi per 100.000 abitanti in una settimana“, a livello provinciale, per applicare regole piú restrittive, quali chiusura anticipata di bar, ristoranti, e altri luoghi di affollamento (palestre, spa, etc.), ma solo dove si rende necessario. Una volta fissata la soglia (50 nuovi positivi su 100.000 abitanti in una settimana, per esempio), le regioni provvedono a diramare il comunicato settimanale in merito alle varie provincie e alle misure da attuare. Giuro, non é cosí complicato. E non servono tante persone per fare sto lavoro. In altri paesi funziona cosí;
- Fissare delle soglie orarie per l’ accesso degli over 65 e di persone a rischio (affette da varie patologie) a luoghi di potenziale affollamento (tipo supermercati, farmacie, etc.). Si é fatto cosí in alcuni paesi europei all’inizio della pandemia e non vedo perché non possa essere applicata questa norma. Si potrebbe fissare una fascia oraria mattutina (8-10) ed una pomeridiana (15-16), con accesso esclusivo solo a queste persone. I dati di Figura 4 supportano la necessitá di una speciale attenzione per questa fascia di etá. E si potrebbe addirittura pensare ad un apposito servizio Taxi per anziani (a spese dello Stato), in modo che, durante i loro spostamenti, evitino gli assembramenti sugli autobus o metropolitana;
- Fissare delle fasce orarie con numero max di accesso alle palestre e piscine. Perché continuare a penalizzarle? Fare sport é forse l’unica cosa sensata per mantere allenato fisico e cervello in un anno cosí stressante. Tra l’altro i dati di Figura 6 supportano questa ipotesi, in quanto il sovrappeso e l’obesitá sembrano essere un elemento chiave nella diffusione di questo virus e del suo livello di gravitá (https://www.ilpost.it/2020/09/10/obesita-covid-19-coronavirus/). È vero che il nuovo DPCM non impedisce lo sport all’ aperto ma ci stiamo avviando alla stagione invernale e forse non é per tutti allenarsi o tenersi in forma in condizioni meteorologiche sfavorevoli (freddo, pioggia, neve, etc.), tra l’altro col rischio di ammalarsi ed aggravare poi la situazione ospedaliera per altre patologie. Le palestre e le piscine potrebbero concordare un calendario settimanale con gli iscritti e rendere visibili gli orari di accesso alle singole persone. Anche qui, basta un foglio excel (per esempio). E sarebbe socialmente fondamentale per non affossare completamente l’importanza di questi luoghi come viatico per l’aggregazione, l’ integrazione e l’educazione;
- Indicare modalitá, numeri e tempistiche per il rafforzamento delle strutture ospedaliere e del sistema di trasporti pubblici. Avendo letto il DPCM, mi é sfuggito il paragrafo sul rafforzamento delle strutture sanitarie e dei trasporti pubblici. Il fatto che non ci sia, l’ho trovato alquanto curioso dal momento che, da giorni, da destra e sinistra, si sente e legge che le strutture ospedaliere sono al collasso. E che l’assembramento sui messi pubblici é stato un fattore per questa seconda ondata. Ecco, se trovate il paragrafo, cortesemente fatemi un cenno.
Sono solo alcune delle alternative possibili. Ce ne saranno sicuramente altre decine e centinaia. Non chiedo che vengano tutte prese in considerazione da chi “gestisce” questo paese. Ma, mi preoccupa l’unica soluzione basata sulla “chiusura”.
Che succede se il vaccino non arriva in tempo o non funziona come atteso? Che succede se nel frattempo il virus muta e il vaccino diventa inefficace? Che succede se arriva in parallelo un altro virus?
Non mi piace che l’unica proposta di soluzione sia: chiudiamo il piú possibile, fermiamoci tutti, vediamo che succede, incrociamo le dita e speriamo che Dio ce la mandi buona.
É da incoscienti. É da incompetenti.
Buon inizio di settimana …e di semi-lockdown.
Andrea De Filippo
______________________________________________________________________________
Lo sforzo è buono, però dal mio punto di vista diversi grafici non portano a una conclusione solida e anzi possono portare a conclusioni fuorvianti.
La prima figura che correla numero di positivi a numero di abitanti è chiara, e si può spiegare sulla base di modelli come il modello SRI.
La seconda sulla densità è già più complessa: ci sono più casi positivi perché è più densa la popolazione o forse perché una regione più densa spesso ha più abitanti in generale? Per avere la risposta bisogna fare un’analisi multivariata. E lo stesso principio si applica a fumo o alcol: ci sono più positivi perché ci sono più fumatori o perché semplicemente ci sono più persone (tipo in figura 1)?
In sincerità, analisi univariate di questo tipo per me sono inaccettabili se volte a trarre conclusioni, specialmente polemiche. Se si vuole dire la propria sulla base di analisi di dati allora l’analisi deve essere impeccabile. E se non si è esperti allora bisogna riconoscere di non essere in una posizione tale da trarre conclusioni.
Ciao Roberto. Grazie del commento e della critica. Come spiegavo in un’altra risposta, ho messo a disposizione tutti i dati (vedi tabella) per lasciare a chi é esperto il modo di fare l’analisi multivariata, che condivido essere la piú appropriata. Le correlazioni qui riportate sono correlazioni basiche che non hanno lo scopo di trovare la soluzione al problema (non credo di averlo mai scritto). Lo scopo é appunto quello di mettere in luce la complessitá del problema guardando a piú aspetti (se legge gli articoli di Marzo troverá solo tabelle per far capire che un unico parmetro non basta). E questo stesso ragionamento va applicato per stabilire la gravitá della situazione: non basta il numero di casi positivi per definirla tale. Va incrociato con il numero di tamponi, il numero di decessi, il numero di ricoverati in terapia intensiva, il numero di persone in isolamento, l’etá dei contagiati, il numero di strutture sanitarie presenti, e cosí via. Non é compito mio fare queste correlazioni: non ho né il tempo né la qualifica né tantomeno i dati giornalieri per province e comuni (che sarebbe piú appropiato per le valutazioni). É compito del Comitato Tecnico Scientifico, che é lí per fare questo mestiere. Ed é dovere del governo rendere trasparenti questi dati e queste correlazioni (cosí evitiamo di farle noi in modo approssimativo). Si eviterebbe tante discussioni e polemiche. Non trova?
Interessante articolo. Non mi è chiaro o forse mi è sfuggito se l’analisi è stata fatta in maniera bivariata oppure ha implementato una regressione multivariata, per eliminare eventuali bias da variabile omessa.
Inoltre, Condivido la linea di un lockdown parametrizzato alle criticità locali. Tuttavia nelle ultime settimane sono state alcune Regione a chiedere al Governo di uniformare le restrizioni a livello nazionale o addirittura di chiudere tutto. Mi chiedo cosa sia emerso dal tavolo di confronto tra Governo-Regioni. Forse le Regioni stesse non hanno voluto prendersi la responsabilità di valutare/monitorare le criticità locali.
Infine, sulla proposta dell’accesso limitato a palestre/piscine le segnalo che è già stato fatto da Maggio/Giugno. Aspetto che contraddice ancor di più la scelta di chiuderle dato che molte palestre hanno investito molto per garantire distanziamento, igiene e numero di posti limitato. Proposta alternativa? Investire nei controlli per chiudere chi non rispetta le regole, laddove veramente si creano assembramenti.
Un saluto,
Jb
Grazie del commento.
L’eventuale responsabilitá tra Governo e Regioni la risolvi in un secondo se fissi un parametro di riferimento comune a tutti. Tipo il numero di casi positivi per 100.000 abitanti in una settimana. É un dato accessibile a tutti, eviterebbe confusioni e scarico di responsabilitá.
Sulle palestre/piscine, sono d’accordo. É il motivo per cui fatico a comprendere il nuovo DPCM. E sarei d’accordo anche su maggiori controlli.
Infine, l’analisi é una semplice correlazione lineare con una sola variabile. Il motivo é che analisi multivariate avrebbero richiesto molto piú tempo e una mole di dati ulteriori sui fattori di contagio che non possono essere sviscerati nel mio tempo libero. Ho messo a disposizione tutti i dati analizzati in formata tabellare, proprio per dare l’opportunitá a chi fa queste analisi di mestiere di poter approfondire. Ed ho altri dati da mettere a disposizione, se dovessero servire.
Un saluto
Andrea