/Proyectos

Que factores influyen al momento de vender un automóvil.

Primary LanguageJupyter Notebook

Data Scientist

Nombre Proyecto Módulo Descripción Librerías usadas
Modelo de predicción de valor de automóviles Aprendizaje automático utilizando algoritmos de gradiente como: Xgboost, CatBoost y Light GBM Un servicio de venta de autos usados está desarrollando una aplicación para averiguar rápidamente el valor de mercado de tu coche. Tenemos acceso al historial: especificaciones técnicas, versiones de equipamiento y precios. Crearemos un modelo que determine el valor de mercado. pandas, matplotlib.pyplot, numpy, time, sklearn, catboost, lightgbm, xgboost
Modelo de predicción de pozo petrolífico mas rentable Aprendizaje automático en negocios. A/B test. Trabajamos para la compañía minera OilyGiant. Nuestra tarea es encontrar el mejor lugar para un nuevo pozo. Con los parámetros de los pozos de petróleo de la región construiré un modelo para predecir el volumen de reservas en los nuevos pozos y seleccionaré los pozos de petróleo con los valores estimados más altos. pandas, matplotlib.pyplot, numpy, sklearn
Modelo de predección en recuperación de minas de oro Implementación de métricas personalizadas en Modelos de Machine Learning El proyecto consiste en preparar un modelo de machine learning que deberá predecir la cantidad final de oro obtenido desde el mineral de oro sin procesar. Para esto, disponemos de los datos de extracción y purificación. pandas, matplotlib.pyplot, numpy, sklearn
Modelo para sugerir clientes similares Aprendizaje automático con algoritmos KNN. Una compañía de seguros desea resolver varias tareas tales como encontrar clientes que sean similares a un cliente determinado, predecir la probabilidad de que un nuevo cliente reciba una prestación del seguro, predecir el número de prestaciones de seguro que un nuevo cliente pueda recibir y proteger los datos personales de los clientes. pandas, numpy, math, seaborn, sklearn
Modelo para detetectar comentarios negativos Aprendizaje automático para textos NLP El objetivo del proyecto es entrenar un modelo para detectar las críticas negativas de forma automática. Para lograrlo, utilizaremos un conjunto de datos de reseñas de películas de IMDB con leyendas de polaridad para construir un modelo para clasificar las reseñas en positivas o negativas. pandas, matplotlib.pyplot, numpy, math, seaborn, tqdm, re, sklearn, nltk, spaCy, lightgbm, pytorch
Modelo de recomendación de planes telefónicos Aprendizaje Supervisado Desarrollaremos un modelo que analice el comportamiento de los clientes y recomendarle el mejor plan. Tenemos acceso a los datos de comportamiento de los suscriptores que ya se han cambiado a los planes nuevos. Para esta tarea de clasificación crearemos un modelo que escoja el plan mas adecuado. pandas, matplotlib.pyplot, sklearn
Modelo para predecir la edad de un retrato Modelo de visión artificial con redes neuronales La empresa Good Seed la cual es una cadena de supermercados requería que se implemente un modelo que le ayude a detectar la edad de los clientes al momento de realizar el pago, con el fin de filtrar la venta de licor a menores de edad. pandas, matplotlib.pyplot, numpy, seaborn, tensorflow, keras
Modelo de predicción de abandono de servicio Aprendizaje supervisado Los clientes de un banco se están yendo y es más barato salvar a los clientes existentes que atraer nuevos. Tenemos los datos sobre el comportamiento pasado de los clientes y la terminación de contratos con el banco. Crearemos un modelo que sea capaz de predecir si un cliente dejará el banco pronto. pandas, matplotlib.pyplot, sklearn
Modelos de predicción de pedidos de taxi por hora Series temporales Una compañía de taxis ha recopilado datos históricos sobre pedidos de taxis en los aeropuertos. Para atraer a más conductores durante las horas pico, necesita predecir la cantidad de pedidos de taxis para la próxima hora. Construiré un modelo para dicha predicción. pandas, matplotlib.pyplot, numpy, statsmodels, sklearn, lightgbm

Proyectos Data Analyst

Nombre Proyecto Módulo Descripción Librerías usadas
Análisis ventas videojuegos EDA, Análisis estadístico de datos En este proyecto se realiza un análisis bastante minucioso de las ventas de videojuegos tomando en cuenta la consola, el perfil de usuario y la región. pandas, matplotlib.pyplot, numpy, math, scipy
Análisis de que plan telefónico genera mayor retorno a la empresa Análisis estadístico de datos La empresa Megaline nos entregó un registro de sus planes de servicio y sus clientes, este proyecto identifica que plan telefónico genera un mayor retorno para la empresa. pandas, matplotlib.pyplot, numpy, math, scipy
Análisis de viajes en taxi en Chicago Recopilación y almacenamiento de datos (SQL) En este proyecto se realizó la extracción del conjunto de datos mediante consultas SQL a una base de datos Postgresql. Luego se realizó la cantidad de viajes realizado por las diferentes compañias de taxis. Además se realizó un análisis del tiempe de viaje de los mismos. pandas, matplotlib.pyplot, scipy
Análisis de riesgo de incumplimiento de prestatarios Preprocesamiento de datos El proyecto consiste en preparar un informe para la división de préstamos de un banco. Se averigua si el estado civil y el número de hijos de un cliente tienen un impacto en el incumplimiento de pago de un préstamo. pandas, matplotlib.pyplot, numpy
Análisis de características que influyen en el precio de un vehiculo Análisis exploratorio de datos (EDA) Este proyecto consiste en realizar un análisis para determinar que características son los mas influyentes al momento de asignar el precio de un vehículo. pandas, matplotlib.pyplot, numpy