¡Hola! en este repositorio se encuentra la evaluación final resuelta por Ana Saira Castellano sobre el módulo de análisis y transformación de datos del bootcamp Data Analytics de Adalab.
La prueba se ha realizado en VSCode en archivos ".ipynb" y ".py".
Las librerías utilizadas han sido:
- Pandas
- Numpy
- Seaborn
- Matplotlib
- IPython.display
- mysql.connector
-
Evaluación final mod_3: pdf con los ejercicios solicitados en la evaluación.
-
main: archivo .py, en el que se exploran y modifican los datos (Fase 1), además incluye la creación de la bbdd y la creación e inserción de datos en las tablas en mysql.
-
visualizaciones: archivo .ipynb donde se realiza el análisis y las visualizaciones solicitadas (Fase 2).
-
A_B_Testing: archivo .ipynb donde se realizan las distintas pruebas necesarias para el A/B Testing (Fase 3).
-
Carpeta files: contiene los csv originales, el csv final (después de la transformación) y el archivo (.sql) para la creación de la bbdd y las tablas.
-
Carpeta src: contiene varios archivos de soporte .py :
- support_transformacion: contiene todas las funciones para la exploración y transformación de los datos.
- support_conexion: contiene todas las funciones para la creación de la bbdd y la creación e inserción de datos de las tablas en mysql. Además hay dos funciones de transformación de int64 y float64 a int y float para que la inserción de los datos se complete correctamente.
- query_creacion: contiene las consultas necesarias para la creación de la bbdd y la creación e inserción de datos en las tablas en mysql.
La evaluación se realizó el día 05/04/2024
El objetivo de la evaluación es comprobar que se han adquirido los conocimientos impartidos sobre transformación y análisis de datos:
- Realizar un análisis EDA
- Limpiar y transformar de los datos incluyendo gestión de nulos y duplicados.
- Crear un conjunto de visualizaciones útiles para facilitar la comprensión de los datos y cómo se relacionan las variables.
- Completar el proceso de ETL y Pipeline
- Realizar un análisis A/B Testing
Por favor, siéntete libre de utilizar e inspirarte en estos ejercicios o de sugerir mejoras en cuanto a la resolución de los mismos. ¡Muchas gracias! 😄