/Challenges

Mono-repo containing several challenges in a variety of Data Science and Machine Learning topics.

Primary LanguageJupyter NotebookMIT LicenseMIT

Challenges

Este mono-repositorio contiene la solución a varias pruebas técnicas, challenges, ya sea presentados en procesos de entrevista o como desafíos personales. Los challenges empresariales han sido anonimizados para respetar la privacidad, y se dejan los links si se encuentran a las fuentes (kaggle, universidades, blogs, etc). En cada carpeta se encuentra un archivo README.md con una descripción más detallada de cada challenge así como los datasets utilizados.

Challenge 1 - Análisis de datos de Airbnb (kaggle nyc airbnb)

Tarea basada en este challenge de kaggle donde se proporciona un conjunto de datos de publicaciones de hospedajes en la plataforma Airbnb para la ciudad de Nueva York. El objetivo es demostrar conceptos prácticos de calidad y limpieza de datos, y construir un reporte por barrio de los precios de los hospedajes. Esta parte de la prueba se encuentra en el archivo Airbnb.ipynb

Challenge 2 - Modelos predictivos de calidad de vino (UCI ML Wine Quality)

Tarea de análisis en un conjunto de datos de características físicas y químicas de vinos de Vinho Verde basada en este paper de la UCI (University of California, Irvine). El objetivo es entrenar modelos de regresión para predecir la calidad del vino en función de sus características. Esta parte de la prueba se encuentra en el archivo VinhoVerde.ipynb

Challenge 3 - Fine tuning DistilBERT para Squadv2 (HuggingFace Transformers)

Open In Colab

Tarea de fine tuning de un modelo de lenguaje pre-entrenado para responder preguntas en base a un contexto. El modelo utilizado es DistilBERT y el conjunto de datos es SQuAD2.0. Esta parte de la prueba se encuentra en el enlace de colab, o respaldado en el archivo DistilBERT.ipynb.

Challenge 4 - Plant Seedlings Classification (Kaggle Plant Seedlings Classification)

Tarea de clasificación de imágenes de plantas basada en este challenge de kaggle. El objetivo es entrenar un modelo de clasificación de imágenes para identificar 12 especies de plantas. Esta parte de la prueba se encuentra en el archivo PlantSeedlings.ipynb.

Challenge 5 - RNN on Apple Stock Prices (GithubIo Apple Stock Prices)

Tarea de predicción de series de tiempo basada en este blog "NanoDegree". El objetivo es entrenar un modelo de redes neuronales recurrentes para predecir el precio de las acciones de Apple. Esta parte de la prueba se encuentra en el archivo AppleStock.ipynb.

Challenge 99 - Varios challenges menores de prueba de concepto

Tareas de prueba de concepto de diversos temas como FastAPI, O(n), y otros tópicos generales de programación. Esta parte de la prueba se encuentra en la carpeta 99 - Varios.

Licencia

Este proyecto está bajo la licencia MIT - ver el archivo LICENSE.md para más detalles. Siéntete libre de utilizar el código y los datos para tus propios proyectos.