📅️ Última actualização: 4 de Abril de 2020, 12h30
ℹ️ Fonte dos dados: Direcção Geral de Saúde - Ministério da Saúde Português, através do dashboard do COVID-19 (aqui e dos relatórios de situação publicados diariamente desde 03/03/2020.
❗Dados de casos confirmados por concelho: Apesar da DGS estar actualmente a fornecer dados de casos confirmados por concelho, optamos por não os incluir (assim como recursos geográficos complementares) em virtude da incerteza metodológica e do grau de incompletude que actualmente os caracteriza. Iremos rever esta decisão à medida que a situação se desenvolve.
👁️ Utilizaste estes dados para análises/plataformas/notícias?: Deixa-nos detalhes aqui.
⚔️ TAIKAI Fight COVID-19 Open Challenge: Juntámos esforços com a TAIKAI para estimular o uso de dados abertos para estudar esta pandemia. Vejam como podem ajudar. No website damos algumas sugestões de projetos, mas obviamente que a vossa criatividade é o limite!
Embora a comunicação e partilha de dados por parte do Ministério de Saúde Português tenha melhorado consideravelmente ao longo da crise do COVID-19, ainda está longe de ideal (havendo a destacar o exemplo do repositório da Protecção Civil Italiana no GitHub).
A informação disponibilizada pela Direcção Geral de Saúde (DGS), para além de não ter o nível de granularidade da das autoridades italianas, também não é disponibilizada em formatos abertos e facilmente inspeccionáveis/manipuláveis. Ficam assim dificultadas tarefas de análise, modelação e visualização por parte da comunidade (quer mais informal, quer mais académica/industrial) disposta a colaborar no combate à pandemia com as ferramentas que conhece: as de análise de dados.
❗ O compromisso deste repositório é justamente esse: todos os dias enquanto esta pandemia durar, o ficheiro data.csv
será actualizado com a informação mais recente disponibilizada pela Direcção Geral de Saúde. Esta informação será extraída do relatório de situação o mais rapidamente possível após a sua disponibilização (que costuma ser ~12h00 GMT+00:00).
A estrutura base deste ficheiro, desenhada para fácil manipulação em Excel/Python/R não mudará, podendo a comunidade analítica considerá-lo um alvo imutável (em termos de localização e estrutura) para, por exemplo, alimentar plataformas de visualização/modelação. De notar que, mediante a evolução do formato dos relatórios de situação, poderão ser adicionadas novas colunas, mantendo-se claro a retrocompatibilidade. Fontes adicionais de dados poderão também ser adicionadas.
Porque tudo começa com bons dados.
- Como achatar a curva? O que revelam as experiências dos países, por Rui Barros e Dinis Correia (Público)
- Ainda há Covid-19 amanhã?, por Miguel Mano
- COVID-19 Portugal Data, por Rui Calheno
- Resumo COVID-19, por Pedro Lima
- COVID-19 Cases, por @hrmartins
- Novos casos diários do vírus de corona COVID-19 por região, por @giuppo
- Dashboard tech4COVID19, por Manuel Banza
O repositório está organizado da seguinte forma:
data.csv
: o Pastel de Nata.archive/
: arquivo de todos os relatórios de situação disponibilizados pela DGS, em formato.pdf
. Os relatórios são disponibilizados diariamente, desde o dia 03-03-2020.notebooks/
: contém um notebook Python com um exemplo simples de como carregar e visualizar os dados.extra/
: contém fontes de dados extras que podem ser usadas para complementar as análises dos restantes dados. As descrições dessas fontes de dados encontram-se dentro de um README nessa pasta.
Autor: Carlos Matos | Grupo IFT
Dados em versão API com resposta JSON, atualização diária conforme esta base de dados e dados da OMS para o endpoint dos dados mundiais por país. Acesso via RapidApi, com exemplos de requisição e resposta, exemplos de clients e SDK.
Uma explicação do conteúdo em data.csv
.
📝 ARS: Administração Regional de Saúde
Nome da coluna | Significado | Possíveis valores |
---|---|---|
data |
Data da publicação dos dados. | DD-MM-YYYY |
data_dados |
Data e hora da recolha dos dados apresentados (quando omitida nos relatórios, assume-se como sendo a data da publicação dos dados). Geralmente, os dados são reportados até às 24h do dia anterior à data (equivalentes às 00h do dia de data , sendo este último o formato utilizado). |
DD-MM-YYYY HH:MM |
confirmados |
Casos confirmados | Inteiro >= 0 |
confirmados_arsnorte |
Casos confirmados na ARS Norte | Inteiro >= 0 |
confirmados_arscentro |
Casos confirmados na ARS Centro | Inteiro >= 0 |
confirmados_arslvt |
Casos confirmados na ARS Lisboa e Vale do Tejo | Inteiro >= 0 |
confirmados_alentejo |
Casos confirmados na ARS Alentejo | Inteiro >= 0 |
confirmados_arsalgarve |
Casos confirmados na ARS Algarve | Inteiro >= 0 |
confirmados_acores |
Casos confirmados na Região Autónoma dos Açores | Inteiro >= 0 |
confirmados_madeira |
Casos confirmados na Região Autónoma da Madeira | Inteiro >= 0 |
confirmados_estrangeiro |
Casos confirmados no estrangeiro | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador. A partir de 28-03-2020, este indicador deixou de ser reportados e os respectivos casos imputados às ARS/Regiões de origem. |
confirmados_novos |
Número de novos casos confirmados comparativamente ao dia anterior. É uma coluna calculada a partir da diferença nos casos confirmados entre dias consecutivos. |
Inteiro >= 0 |
recuperados |
Total de casos recuperados | Inteiro >= 0 |
obitos |
Total de óbitos | Inteiro >= 0 |
internados |
Número de pacientes COVID-19 internados | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
internados_uci |
Número de pacientes COVID-19 internados em Unidades de Cuidados Intensivos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
lab |
Número de casos suspeitos a aguardar resultados laboratoriais | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
suspeitos |
Total de casos suspeitos (tendo a definição sido actualizada a 29/02/2020) desde 01/01/2020 | Inteiro >= 0 |
vigilancia |
Número de casos sob vigilância pelas autoridades de saúde | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
n_confirmados |
Número de casos cuja suspeita de infecção não se confirmou | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
cadeias_transmissao |
Número de cadeias de transmissão do SARS-CoV-2 activas | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
transmissao_importada |
Número de casos confirmados com transmissão por via de infectados de outros países | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
confirmados_0_9_f |
Número de casos confirmados do sexo feminino na faixa etária 0-9 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
confirmados_0_9_m |
Número de casos confirmados do sexo masculino na faixa etária 0-9 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
confirmados_10_19_f |
Número de casos confirmados do sexo feminino na faixa etária 10-19 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
confirmados_10_19_m |
Número de casos confirmados do sexo masculino na faixa etária 10-19 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
confirmados_20_29_f |
Número de casos confirmados do sexo feminino na faixa etária 20-29 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
confirmados_20_29_m |
Número de casos confirmados do sexo masculino na faixa etária 20-29 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
confirmados_30_39_f |
Número de casos confirmados do sexo feminino na faixa etária 30-39 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
confirmados_30_39_m |
Número de casos confirmados do sexo masculino na faixa etária 30-39 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
confirmados_40_49_f |
Número de casos confirmados do sexo feminino na faixa etária 40-49 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
confirmados_40_49_m |
Número de casos confirmados do sexo masculino na faixa etária 40-49 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
confirmados_50_59_f |
Número de casos confirmados do sexo feminino na faixa etária 50-59 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
confirmados_50_59_m |
Número de casos confirmados do sexo masculino na faixa etária 50-59 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
confirmados_60_69_f |
Número de casos confirmados do sexo feminino na faixa etária 60-69 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
confirmados_60_69_m |
Número de casos confirmados do sexo masculino na faixa etária 60-69 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
confirmados_70_79_f |
Número de casos confirmados do sexo feminino na faixa etária 70-79 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
confirmados_70_79_m |
Número de casos confirmados do sexo masculino na faixa etária 70-79 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
confirmados_80_plus_f |
Número de casos confirmados do sexo feminino na faixa etária 80+ anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
confirmados_80_plus_m |
Número de casos confirmados do sexo masculino na faixa etária 80+ anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
sintomas_tosse |
Percentagem de casos infetados que reportaram o sintoma de tosse. Conforme informa a DGS, estes dados são relativos apenas a uma %, não-especificada e variável, dos infectados. | fracção entre [0, 1] ou vazio para os dias em que a DGS não reportava este indicador |
sintomas_febre |
Percentagem de casos infetados que reportaram o sintoma de febre. Conforme informa a DGS, estes dados são relativos apenas a uma %, não-especificada e variável, dos infectados. | fracção entre [0, 1] ou vazio para os dias em que a DGS não reportava este indicador |
sintomas_dificuldade_respiratoria |
Percentagem de casos infetados que reportaram o sintoma de dificuldades respiratórias. Conforme informa a DGS, estes dados são relativos apenas a uma %, não-especificada e variável, dos infectados. | fracção entre [0, 1] ou vazio para os dias em que a DGS não reportava este indicador |
sintomas_cefaleia |
Percentagem de casos infetados que reportaram o sintoma de cefaleias. Conforme informa a DGS, estes dados são relativos apenas a uma %, não-especificada e variável, dos infectados. | fracção entre [0, 1] ou vazio para os dias em que a DGS não reportava este indicador |
sintomas_dores_musculares |
Percentagem de casos infetados que reportaram o sintoma de dores musculares. Conforme informa a DGS, estes dados são relativos apenas a uma %, não-especificada e variável, dos infectados. | fracção entre [0, 1] ou vazio para os dias em que a DGS não reportava este indicador |
sintomas_fraqueza_generalizada |
Percentagem de casos infetados que reportaram o sintoma de fraqueza generalizada. Conforme informa a DGS, estes dados são relativos apenas a uma %, não-especificada e variável, dos infectados. | fracção entre [0, 1] ou vazio para os dias em que a DGS não reportava este indicador |
confirmados_f |
Número total de confirmados do sexo feminino | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava directamente este indicador |
confirmados_m |
Número total de confirmados do sexo masculino | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava directamente este indicador |
obitos_arsnorte |
Total de óbitos na ARS Norte | Inteiro >= 0 |
obitos_arscentro |
Total de óbitos na ARS Centro | Inteiro >= 0 |
obitos_arslvt |
Total de óbitos na ARS Lisboa e Vale do Tejo | Inteiro >= 0 |
obitos_alentejo |
Total de óbitos na ARS Alentejo | Inteiro >= 0 |
obitos_arsalgarve |
Total de óbitos na ARS Algarve | Inteiro >= 0 |
obitos_acores |
Total de óbitos na Região Autónoma dos Açores | Inteiro >= 0 |
obitos_madeira |
Total de óbitos na Região Autónoma da Madeira | Inteiro >= 0 |
obitos_estrangeiro |
Total de óbitos no estrangeiro | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador. A partir de 28-03-2020, este indicador deixou de ser reportados e os respectivos casos imputados às ARS/Regiões de origem. |
recuperados_arsnorte |
Total de pacientes recuperados na ARS Norte | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
recuperados_arscentro |
Total de pacientes recuperados na ARS Centro | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
recuperados_arslvt |
Total de pacientes recuperados na ARS Lisboa e Vale do Tejo | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
recuperados_alentejo |
Total de pacientes recuperados na ARS Alentejo | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
recuperados_arsalgarve |
Total de pacientes recuperados na ARS Algarve | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
recuperados_acores |
Total de pacientes recuperados na Região Autónoma dos Açores | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
recuperados_madeira |
Total de pacientes recuperados na Região Autónoma da Madeira | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
recuperados_estrangeiro |
Total de pacientes recuperados no estrangeiro | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador. A partir de 28-03-2020, este indicador deixou de ser reportados e os respectivos casos imputados às ARS/Regiões de origem. |
obitos_0_9_f |
Número total de óbitos de pacientes do sexo feminino na faixa etária 0-9 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
obitos_0_9_m |
Número total de óbitos de pacientes do sexo masculino na faixa etária 0-9 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
obitos_10_19_f |
Número total de óbitos de pacientes do sexo feminino na faixa etária 10-19 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
obitos_10_19_m |
Número total de óbitos de pacientes do sexo masculino na faixa etária 10-19 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
obitos_20_29_f |
Número total de óbitos de pacientes do sexo feminino na faixa etária 20-29 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
obitos_20_29_m |
Número total de óbitos de pacientes do sexo masculino na faixa etária 20-29 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
obitos_30_39_f |
Número total de óbitos de pacientes do sexo feminino na faixa etária 30-39 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
obitos_30_39_m |
Número total de óbitos de pacientes do sexo masculino na faixa etária 30-39 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
obitos_40_49_f |
Número total de óbitos de pacientes do sexo feminino na faixa etária 40-49 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
obitos_40_49_m |
Número total de óbitos de pacientes do sexo masculino na faixa etária 40-49 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
obitos_50_59_f |
Número total de óbitos de pacientes do sexo feminino na faixa etária 50-59 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
obitos_50_59_m |
Número total de óbitos de pacientes do sexo masculino na faixa etária 50-59 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
obitos_60_69_f |
Número total de óbitos de pacientes do sexo feminino na faixa etária 60-69 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
obitos_60_69_m |
Número total de óbitos de pacientes do sexo masculino na faixa etária 60-69 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
obitos_70_79_f |
Número total de óbitos de pacientes do sexo feminino na faixa etária 70-79 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
obitos_70_79_m |
Número total de óbitos de pacientes do sexo masculino na faixa etária 70-79 anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
obitos_80_plus_f |
Número total de óbitos de pacientes do sexo feminino na faixa etária 80+ anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
obitos_80_plus_m |
Número total de óbitos de pacientes do sexo masculino na faixa etária 80+ anos | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava este indicador |
obitos_f |
Número total de óbitos de pacientes do sexo feminino | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava directamente este indicador |
obitos_m |
Número total de óbitos de pacientes do sexo masculino | Inteiro >= 0 ou vazio para os dias em que a DGS não reportava directamente este indicador |
Definições exactas de alguns destes termos constam do glossário do Plano Nacional de Preparação e Resposta à Doença por novo coronavírus (COVID-19) (página 65 em diante). A 26/03/2020, a soma do número de pacientes recuperados por ARS/Região Autónoma nem sempre é igual ao número total de recuperados. A DGS reportou os dados desta forma, indicando que o diferencial correspondia a "21 casos recuperados laboratorialmente" e a "aguardar mais informação."
Uma outra métrica com potencial interesse científico, o número de casos com base na data de início de sintomas, é também reportada pela DGS. No entanto, é apenas disponibilizado um gráfico de eixos esparsos, o que pode introduzir erros de aproximação na transcrição e comprometer a factualidade dos dados. Por essa razão, esta informação é propositadamente excluída.
Quaisquer sugestões de dados complementares (provenientes de fontes oficiais), inconsistências nos dados ou melhorias genéricas, à vontade ➡️ Issues ou Pull Requests.
A Data Science for Social Good Portugal é uma comunidade aberta de cientistas de dados, amantes de dados e entusiastas de dados que querem atacar problemas que importam verdadeiramente. Acreditamos no poder dos dados para transformar a nossa sociedade para o melhor e para todos.
@dssgPT | fb.com/DSSGPortugal | Instagram @dssg_pt | LinkedIn