Herramienta para procesar los datos del Estudio de movilidad con Big Data elaborado por el Ministerio de Transportes (MITMA) para el estudio de las medidas contra el COVID-19.
Se pueden visualizar los datos en este mapa.
Para generar los datos desde cero usar:
python src/data.py
Esto descargará los datos desde la primera fecha del estudio (21 Febrero 2020) hasta día de hoy y los procesará. Si ya tiene los datos descargados y procesados de una vez anterior y solo quiere actualizarlos con los datos recientes, puede usar:
python src/data.py --update
Esto mirará cuál es el último día descargado y bajará/procesará todos los días posteriores.
Notas metodológicas:
El estudio tiene un nota metodológica con indicaciones generales, pero añadiremos aquí algunos detalles relevantes. Puede ser también útil consultar la nota metodológica del estudio anterior en el que se basa el estudio actual.
Los archivos de maestria1
tienen las siguientes columnas:
fecha
: día consideradoorigen
/destino
: códigos de los municipios para el estudio. Si el código viene sucedido por un_AM
quieres decir que pertenece a una agrupación de municipios realizada por el MITMA para aumentar el tamaño de la muestra. Los municipios que componen estas agrupaciones son municipios que pertenecen siempre a la misma provincia. El mapeo de municipios del INE a agrupaciones del MITMA se puede realizar usando el archivorelaciones_municipio_mitma.csv
.periodo
: periodo horario{0-23}
distancia
: distancia de los viajes en rangos con límites 500m, 2km, 5km, 10km, 50km, 100km{'0005-002', '002-005', '005-010', '010-050', '050-100', '100+'}
viajes
: numero de viajes realizadosviajes_km
: numero de km realizados
Errores en los datos:
- los datos originales no contienen el archivo correspondiente al domingo 12 de Julio para
maestra1
ymunicipio
. En los archivos originales se pone el link erróneo al fichero demaestra1
ydistrito
. Como apaño hemos duplicado a mano el archivo del 05 de Julio (domingo anterior) y reemplazado las fechas por el 12 de Julio (vermisc.py
). También se puede elegir procesar el dataset obviando esa fecha.