/ETL_and_analysis

bda-modulo-3-evaluacion-final-saira2911 created by GitHub Classroom

Primary LanguageJupyter Notebook

Evaluacion final Modulo 3 Adalab

🌟 Proceso ETL

¡Hola! en este repositorio se encuentra la evaluación final resuelta por Ana Saira Castellano sobre el módulo de análisis y transformación de datos del bootcamp Data Analytics de Adalab.

💻 Herramientas utilizadas

La prueba se ha realizado en VSCode en archivos ".ipynb" y ".py".

Las librerías utilizadas han sido:

  • Pandas
  • Numpy
  • Seaborn
  • Matplotlib
  • IPython.display
  • mysql.connector

📂 Organizacion

  • Evaluación final mod_3: pdf con los ejercicios solicitados en la evaluación.

  • main: archivo .py, en el que se exploran y modifican los datos (Fase 1), además incluye la creación de la bbdd y la creación e inserción de datos en las tablas en mysql.

  • visualizaciones: archivo .ipynb donde se realiza el análisis y las visualizaciones solicitadas (Fase 2).

  • A_B_Testing: archivo .ipynb donde se realizan las distintas pruebas necesarias para el A/B Testing (Fase 3).

  • Carpeta files: contiene los csv originales, el csv final (después de la transformación) y el archivo (.sql) para la creación de la bbdd y las tablas.

  • Carpeta src: contiene varios archivos de soporte .py :

    • support_transformacion: contiene todas las funciones para la exploración y transformación de los datos.
    • support_conexion: contiene todas las funciones para la creación de la bbdd y la creación e inserción de datos de las tablas en mysql. Además hay dos funciones de transformación de int64 y float64 a int y float para que la inserción de los datos se complete correctamente.
    • query_creacion: contiene las consultas necesarias para la creación de la bbdd y la creación e inserción de datos en las tablas en mysql.

📆 Fechas

La evaluación se realizó el día 05/04/2024

✔ Objetivo

El objetivo de la evaluación es comprobar que se han adquirido los conocimientos impartidos sobre transformación y análisis de datos:

  • Realizar un análisis EDA
  • Limpiar y transformar de los datos incluyendo gestión de nulos y duplicados.
  • Crear un conjunto de visualizaciones útiles para facilitar la comprensión de los datos y cómo se relacionan las variables.
  • Completar el proceso de ETL y Pipeline
  • Realizar un análisis A/B Testing

💭 Colaboracion

Por favor, siéntete libre de utilizar e inspirarte en estos ejercicios o de sugerir mejoras en cuanto a la resolución de los mismos. ¡Muchas gracias! 😄