DA-promoC-Mod2-sprint2

Repositorio del módulo 2, sprint 2.

Este repositorio contiene los ejercicios del módulo 2, sprint 2, del Bootcamp de Análisis de Datos de Adalab en que se trabajan las siguientes temáticas: EDA ,Limpieza y ETL.

Indice 💻

  1. EDA
  2. Limpieza
  3. ETL
  4. Integrantes

1.EDA 📑

En este primer apartado hemos llevado a cabo el análisis exploratorio de los datos (EDA), esto nos ha permitido analizar e investigar un conjunto de datos y conocer inicialmente con qué estamos trabajando.

  1. Mod2-2-EDA-1.ipynb > Exploración inicial del dataframe
  2. Mod2-EDA-2.ipynb > Exploración de valores nulos y outliers
  3. Mod2-2-EDA-3.ipynb > Análisis exploratorio gráfico

Carpeta: datos: Contiene los archivos utilizados para la realización de los ejercicios.

2. Limpieza :broom:

En este segundo bloque realizamos los primeros cambios en nuestros datos, de este modo los preparamos para que sean lo más útiles posible de cara a responder las preguntas que nos planteadas.

  1. Mod2-2-Limpieza1.ipynb > Primeros pasos de limpieza
  2. Mod2-2-Limpieza2.ipynb > Limpieza de columnas de tipo string
  3. Mod2-2-Limpieza3.ipynb > Detección y limpieza de outliers
  4. Mod2-2-Limpieza4.ipynb > Procesado de los valores nulos
  5. Mod2-2-Limpieza5.ipynb > Procesado de valores nulos mediante la librería Sklearn

Carpeta: datos: Contiene los archivos utilizados para la realización de los ejercicios.

  1. ETL 🌠

En este punto hemos extraído, transformado y cargado los datos (ETL) para su procesado.

  1. Mod2-2-ETL1.ipynb > Obtención de datos de una API
  2. Mod2-2-ETL2.ipynb > Transformación I : Limpieza
  3. Mod2-2-ETL3.ipynb > Transformación II : Clases y Funciones de Limpieza
  4. Mod2-2-ETL4.ipynb > Carga I : Creación de una BBDD e inserción de datos
  5. Mod2-2-ETL5.ipynb > Carga II : Clases y Funciones BBDD e inserción
  • Archivos main.py y soporte.py > Son los archivos correspondientes a la lección ETL6 en la que aprendemos a crear un ejecutable en Python

Carpeta: datos y files: Contienen los archivos utilizados y generados en la realización de los ejercicios.

4. Integrantes 👩👩

*Ximena *Marta