/data-scientist-examples

Ejemplos de limpieza de datos para Data Scientist (pandas, csv, xlsx, urllib3, numpy, y más)

Primary LanguageJupyter NotebookGNU General Public License v3.0GPL-3.0

Recopilación de datasets y su transformación

En éste repositorio puede encontrar ejemplos de datasets y sus respectivos procesos para poder obtener los datos de una forma más limpia y simple de comprender

SISA COVID-19

  • Obtención de datos del dataset de la página oficial de SISA (Sistema Integrado de Información Sanitaria Argentino)
  • Los datos que se obtienen de éste dataset se actualizan por día, por lo tanto, pueden variar los resultados de un día a otro.

Datos Abiertos Oficiales

  • Éste mismo se obtiene de otro repositorio (https://github.com/SistemasMapache/Covid19arData) subido por @vlasvlasvlas
  • Los datos que se obtienen de éste dataset se actualizan por día, por lo tanto, pueden variar los resultados de un día a otro.

IMPORTANTE

  • El dataset de SISA no explica en demasía como se compone el mismo, por lo tanto es más "propenso" a datos érroneos