/covid19italia

Primary LanguageJupyter NotebookCreative Commons Attribution 4.0 InternationalCC-BY-4.0


NOTA BENE: dopo l'annuncio del repository ufficiale della Protezione Civile con i dati sul COVID-19, abbiamo bloccato l'aggiornamento automatico dei dati a partire dai PDF pubblicati sul loro sito.


Cosa c'è in questo repo

Alla data del 4 marzo 2020 - dopo circa 15 giorni dal primo caso "italiano" - non c'è in Italia una fonte ufficiale che pubblichi i dati in modalità machine readable.

Questo repository sarà aggiornato una volta al giorno - intorno alle 19:30 - per scaricare dal sito della Protezione Civile i 2 file PDF denominati Dati di riepilogo nazionale (pdf) e Dettaglio per provincia (pdf) e trasformarli in formati leggibili da una "macchina".

I file sono aggiornati dalla Protezione Civile ogni giorno intorno alle 18:00.

Sul numero di deceduti la Protezione Civile riporta che "potrà essere confermato solo dopo che l’Istituto Superiore di Sanità avrà stabilito la causa effettiva del decesso".

Nota

Questo sistema potrebbe smettere di funzionare da subito, dopo una modifica effettuata dai gestori del sito della Protezione Civile.

Questa è l'occasione per chiedere anche noi al Ministero della Sanità e alla Protezione Civile di produrre - oltre a questi necessari file PDF pensati per fare la dovuta e utile rassegna stampa - dei file e/o dei servizi in formato machine readable, con licenza aperta, certificati, completi, il più possibile disaggregati, aggiornati e con lo storico dei dati nel tempo.

Se verrà attivato qualche servizio ufficiale di stato che farà quanto descritto, è molto molto probabile che questo servizio verrà spento.

Come contribuire

Qui le note su COME CONTRIBUIRE al progetto. Grazie a Nicola Procopio per la redazione di queste note.

Output

File CSV con i dati per provincia (i contagiati)

Dai dati pubblicati ogni giorno, viene prodotto un archivio, con i dati dei vari giorni. Il primo giorno di cui abbiamo raccolto i dati è 2 marzo 2020.

Il file è questo e la struttura è quella di sotto:

provincia numero regione datetime
Bergamo 372 LOMBARDIA 2020-03-03
Lodi 482 LOMBARDIA 2020-03-03
Cremona 287 LOMBARDIA 2020-03-03
in fase di verifica e aggiornamento 36 LOMBARDIA 2020-03-03
--- --- --- ---

Ne viene prodotta pura una copia con il codice ISTAT provinciale.

Nota bene: si tratta del campo Codice dell'Unità territoriale sovracomunale (valida a fini statistici) presente nella risorsa ISTAT "Elenco dei codici e delle denominazioni delle unità territoriali".

provincia numero regione datetime codiceISTAT
Abruzzo da verificare 1 ABRUZZO 2020-03-03
L'aquila 1 ABRUZZO 2020-03-03 066
Pescara 1 ABRUZZO 2020-03-03 068
Teramo 3 ABRUZZO 2020-03-03 067
--- --- --- --- ---

File CSV con i dati riepilogo

Dai dati pubblicati ogni giorno, viene prodotto un archivio con i dati dei vari giorni. Il primo giorno di cui abbiamo raccolto i dati è 2 marzo 2020.

Il file è questo e la struttura è quella di sotto:

Regione Ricoverati con sintomi Terapia intensiva Isolamento domiciliare Totale attualmente positivi DIMESSI GUARITI DECEDUTI CASI TOTALI TAMPONI datetime
Lombardia 698 167 461 1326 139 55 1520 9577 2020-03-03
Emilia Romagna 187 24 187 398 4 18 420 2012 2020-03-03
Veneto 49 19 229 297 7 3 307 10176 2020-03-03
Piemonte 13 3 40 56 56 458 2020-03-03
--- --- --- --- --- --- --- --- --- ---

API

Dati di riepilogo

I dati sono accessibili anche in formato Json attraverso API:

NOTA: dopo l'annuncio da parte della protezione civile, le API sono state agganciate ai dati del repository ufficiale

Esempio:

Gli ultimi dati disponibili per ogni singola regione https://openpuglia.org/api/?q=getdatapccovid-19

Gli ultimi dati disponibili per la singola regione dove reg = nome regione https://openpuglia.org/api/?q=getdatapccovid-19&reg=lombardia

Serie storica dei dati disponibili per regione dove reg = nome regione e mode = ts https://openpuglia.org/api/?q=getdatapccovid-19&reg=lombardia&mode=ts

Tutti i dati disponibili https://openpuglia.org/api/?q=getdatapccovid-19&mode=ts


Per completezza si documentano anche le veccie API che utilizzano i dati raccolti da onData

Dati per provincia

es. https://openpuglia.org/api/?q=getdatacovid-19&reg=lombardia

dove reg = nome regione

consente di ottenere l'ultimo dato disponibile per ogni provincia di quella particolare regione. Omettendo il nome della regione verranno restituiti i dati relativi a tutte le province per cui esiste il dato

https://openpuglia.org/api/?q=getdatacovid-19

La serie storica dei dati disponibili può essere richiesta introducendo mode=ts nella query string.

es. https://openpuglia.org/api/?q=getdatacovid-19&reg=lombardia&mode=ts

Omettendo la regione vengono restituiti tutti i dati disponibili

https://openpuglia.org/api/?q=getdatacovid-19&mode=ts

Dati di riepilogo

es. https://openpuglia.org/api/?q=getsummarycovid-19&reg=lombardia

dove reg = nome regione

consente di ottenere il riepilogo dei dati disponibili per quella regione. Omettendo il nome della regione verranno restituiti i dati relativi a tutte le regioni per cui esiste il dato

https://openpuglia.org/api/?q=getsummarycovid-19

La serie storica dei dati disponibili può essere richiesta introducendo mode=ts nella query string. I dati sono cumulativi, ossia si riferiscono ai totali complessivi riferiti alla data indicata

es. https://openpuglia.org/api/?q=getsummarycovid-19&reg=lombardia&mode=ts

Omettendo la regione vengono restituiti tutti i dati disponibili

https://openpuglia.org/api/?q=getsummarycovid-19&mode=ts

È un lavoro a cura di Vincenzo Patruno. Un grazie a #openpuglia per l'hosting.

Archivio dei PDF pubblicati

I PDF pubblicati verranno archiviati in questa cartella.

Archiviazione automatica su Web Archive

A partire dal 4 marzo 2020, ogni giorno verrà creata una copia delle pagine sottostanti e degli URL che ciascuna contiene (quindi anche dei PDF citati sopra):

Dati accessori di riferimento

Altri progetti a tema

Ringraziamo Matteo Brunati per lo spunto.

Ringraziamo Luca Salvioli Mariani (Il Sole 24 Ore) per lo storico precedente al 2 marzo.

Chi usa (o è stato ispirato da) questi dati