/mitma-covid

Data processing tool for MITMA covid data

Primary LanguagePython

mitma-covid

Herramienta para procesar los datos del Estudio de movilidad con Big Data elaborado por el Ministerio de Transportes (MITMA) para el estudio de las medidas contra el COVID-19.

Se pueden visualizar los datos en este mapa.

map

Para generar los datos desde cero usar:

python src/data.py

Esto descargará los datos desde la primera fecha del estudio (21 Febrero 2020) hasta día de hoy y los procesará. Si ya tiene los datos descargados y procesados de una vez anterior y solo quiere actualizarlos con los datos recientes, puede usar:

python src/data.py --update

Esto mirará cuál es el último día descargado y bajará/procesará todos los días posteriores.

Notas metodológicas:

El estudio tiene un nota metodológica con indicaciones generales, pero añadiremos aquí algunos detalles relevantes. Puede ser también útil consultar la nota metodológica del estudio anterior en el que se basa el estudio actual.

Los archivos de maestria1 tienen las siguientes columnas:

  • fecha: día considerado
  • origen / destino: códigos de los municipios para el estudio. Si el código viene sucedido por un _AM quieres decir que pertenece a una agrupación de municipios realizada por el MITMA para aumentar el tamaño de la muestra. Los municipios que componen estas agrupaciones son municipios que pertenecen siempre a la misma provincia. El mapeo de municipios del INE a agrupaciones del MITMA se puede realizar usando el archivo relaciones_municipio_mitma.csv.
  • periodo: periodo horario {0-23}
  • distancia: distancia de los viajes en rangos con límites 500m, 2km, 5km, 10km, 50km, 100km {'0005-002', '002-005', '005-010', '010-050', '050-100', '100+'}
  • viajes: numero de viajes realizados
  • viajes_km: numero de km realizados

Errores en los datos:

  • los datos originales no contienen el archivo correspondiente al domingo 12 de Julio para maestra1 y municipio. En los archivos originales se pone el link erróneo al fichero de maestra1 y distrito. Como apaño hemos duplicado a mano el archivo del 05 de Julio (domingo anterior) y reemplazado las fechas por el 12 de Julio (ver misc.py). También se puede elegir procesar el dataset obviando esa fecha.