/censo2017

Una Base de Datos de Alto Rendimiento del Censo 2017 de Chile.

Primary LanguageRCreative Commons Zero v1.0 UniversalCC0-1.0

Censo 2017 (Paquete R)

Project Status: Active – The project has reached a stable, usable state and is being actively developed. Lifecycle: stable GH-actions codecov CRAN status DOI Buy Me a Coffee Status at rOpenSci Software Peer Review

Acerca de

Provee un acceso conveniente a mas de 17 millones de registros de la base de datos del Censo 2017. Los datos fueron importados desde el DVD oficial del INE usando el Convertidor REDATAM creado por Pablo De Grande y ademas se proporcionan los mapas que acompanian a estos datos. Estos mismos datos en DVD posteriormente quedaron disponibles en las Bases de Datos del INE.

Despues de la primera llamada a library(censo2017) se le pedira al usuario que descargue la base usando censo_descargar_base() y se puede modificar la ruta de descarga con la variable de entorno CENSO_BBDD_DIR. La variable de entorno se puede crear con usethis::edit_r_environ().

La documentacion esta disponible en https://docs.ropensci.org/censo2017/.

Publico objetivo

Estudiantes, academicos e investigadores que necesiten un acceso conveniente a datos censales directamente en R o RStudio.

Requerimientos de instalacion

Esta libreria necesita 3.5 GB libres para la crear la base de datos localmente. Una vez creada la base, esta ocupa 1.0 GB en disco.

Instalacion

Version estable

install.packages("censo2017")

Version de desarrollo

# install.packages("remotes")
remotes::install_github("ropensci/censo2017")

Valor agregado sobre los archivos SHP y REDATAM del INE

Esta version de la base de datos del Censo 2017 presenta algunas diferencias respecto de la original que se obtiene en DVD y corresponde a una version DuckDB derivada a partir de los Microdatos del Censo 2017 en formato DVD.

La modificacion sobre los archivos originales, que incluyen geometrias detalladas disponibles en Cartografias Censo2017, consistio en unir todos los archivos SHP regionales en una unica tabla por nivel (e.g en lugar de proveer R01_mapa_comunas, …, R15_mapa_comunas combine las 15 regiones en una unica tabla mapa_comunas).

Los cambios concretos respecto de la base original son los siguientes:

  • Nombres de columna en formato “tidy” (e.g. comuna_ref_id en lugar de COMUNA_REF_ID).
  • Agregue los nombres de las unidades geograficas (e.g. se incluye nom_comuna en la tabla comunas para facilitar los filtros).
  • Aniadi la variable geocodigo a la tabla de zonas. Esto facilita mucho las uniones con las tablas de mapas en SQL.
  • Tambien inclui las observaciones 16054 to 16060 en la variable zonaloc_ref_id. Esto se debio a que era necesario para crear una llave foranea desde la tabla mapa_zonas (ver repositorio Cartografias Censo2017) y vincular el geocodigo (no todas las zonas del mapa estan presentes en los datos del Censo).

Ademas de los datos del Censo, inclui la descripcion de las variables en formato tabla (y no en XML como se obtiene del DVD). La ventaja de esto es poder consultar rapidamente lo que significan los codigos de variables y su etiquetado, por ejemplo como explico en la historia del proyecto.

Relacion de Censo 2017 con Chilemapas

Todos los datos de estos repositorios contemplan 15 regiones pues los archivos del Censo se entregan de esta forma y este paquete esta 100% orientado a facilitar el acceso a datos.

Por su parte, chilemapas se centra unicamente en los mapas y tambien usa las cartografias del DVD del Censo para entregar mapas simplificados (de menor detalle y mas livianos). Chilemapas cuenta con una transformacion de codigos para dar cuenta de la creacion de la Region de Niuble.

En resumen, censo2017 permite construir estadisticas demograficas y chilemapas ayuda a mostrarlas en un mapa usando ggplot2 (u otro paquete como tmap).

Cita este trabajo

Si usas censo2017 en trabajos academicos u otro tipo de publicacion por favor usa la siguiente cita:

Mauricio Vargas (2020). censo2017: Base de Datos de Facil Acceso del Censo
  2017 de Chile (2017 Chilean Census Easy Access Database). R package version
  0.1. https://docs.ropensci.org/censo2017/

Entrada para BibTeX:

@Manual{,
  title = {censo2017: Base de Datos de F\'acil Acceso del Censo 2017 de Chile
(2017 Chilean Census Easy Access Database)},
  author = {Mauricio Vargas},
  year = {2020},
  note = {R package version 0.1},
  url = {https://docs.ropensci.org/censo2017/},
  doi = {10.5281/zenodo.4277761}
}

Contribuciones

Para contribuir a este proyecto debes estar de acuerdo con el Codigo de Conducta de rOpenSci. Me es util contar con mas ejemplos, mejoras a las funciones y todo lo que ayude a la comunidad. Si tienes algo que aportar me puedes dejar un issue o pull request.

Agradecimientos

Muchas gracias a Juan Correa por su asesoria como geografo experto.

Aportes

Si quieres donar para aportar al desarrollo de este y mas paquetes Open Source, puedes hacerlo en Buy Me a Coffee.