Instructor: Alan Badillo Salas
Módulo 1: Configuración óptima del entorno para minería de datos
- Usar Python y Jupyter Notebook
- ¿Qué es la clasificación?
Módulo 2: Clasificación con estimadores de scikit-learn
- Estimadores de scikit-learn
- Preprocesamiento
- Pipelines
Módulo 3: Predicción con árboles de decisión y recomendaciones con análisis de afinidad
- Cargando el conjunto de datos
- Árboles de decisión
- Predicción de resultados deportivos
- Random Forest
- Recomendar películas mediante el análisis de afinidad
- Análisis de afinidad
- Lidiar con el problema de la recomendación de películas
- Comprender el algoritmo Apriori y su implementación
Módulo 4: Características y transformadores scikit-learn
- Extracción de características
- Selección de características
- Creación de funciones
- Análisis de componentes principales
- Creando tu propio transformador
Módulo 5: Social Media Insights con Naive Bayes
- Desambiguación
- Descarga de datos de una red social
- Transformadores de texto
- Naive Bayes
- Aplicación de Naive Bayes
- Obtener funciones útiles de los modelos
Módulo 6: Recomendaciones con Graph Mining
- Cargando el conjunto de datos
- Obtener información de seguidores de Twitter
- Creando una gráfica
- Encontrar subgrafos
Módulo 7: Clustering de artículos de noticias
- Descubrimiento de temas de tendencia
- Extraer texto de sitios web arbitrarios
- Agrupación de artículos de noticias
- El algoritmo k-means
- Agrupación de conjuntos