/CC5205

Introducción a la Minería de Datos

Primary LanguageShell

CC5205

Repositorio del curso Minería de Datos dictado en el Departamento de Ciencias de la Computación de la Universidad de Chile

Slides

  1. Clase 1: Introducción a la Minería de Datos

  2. Clase 2: Datos

  3. Clase 3: Análisis Exploratorio de Datos - Google colab con los códigos de ejemplo.

  4. Clase 4: Introducción a la Clasificación - Framework y Evaluación

  5. Clase 5: Algoritmos de clasificación - Árboles, KNN, Naive Bayes

  6. Clase 6: Modelos Lineales - Regresión y Clasificación

  7. Clase 7: Support Vector Machines

  8. Clase 8: Clustering - Introducción y Algoritmos

  9. Clase 9: Validación de Clusters

  10. Clase 10: Selección y Reducción de atributos

  11. Clase 11: Introducción a las Redes Neuronales

Material Extra

  1. Material Extra 1: Fundamentos Matemáticos para Minería de Datos y Machine Learning

  2. Material Extra 2: Límites Estadísticos de la Minería de Datos

  3. Material Extra 3: Clustering de Series de Tiempo

  4. Material Extra 4: Clustering - Casos de Estudio

  5. Material Extra 5: Privacidad en Minería de Datos

  6. Material Extra 6: Minería de Reglas de Asociación

  7. Material Extra 7: Ética en Datos

  8. Material Extra 8: Ética en Machine Learning - Identificando riesgos y estrategias de mitigación

  9. Material Extra 9: Grandes Modelos de Lenguaje - Recorrido Histórico

Links

  1. Libro: Introduction to Data Mining (Second Edition), Software and Tutorials
  2. Libro: Hands-on Machine Learning with Scikit-Learn, Keras and TensorFlow (Third Edition) Notebooks
  3. Libro: Mining of Massive Datasets de Jure Leskovec., Anand Rajaraman y Jeff Ullman
  4. Fundamentals of Data Visualization by Claus O. Wilke
  5. Maching Learning Mastery
  6. Repositorio antiguo del curso por Mauricio Quezada
  7. Proyectos de años anteriores
  8. Perfil de Hans Rosling en TED
  9. Python Machine Learning book code repository
  10. Machine learning examples: A collection of machine learning examples and tutorials
  11. KDnuggets: sitio Web muy popular sobre DM, ML, AI, etc
  12. Centroid Initialization Methods for k-means Clustering - KDnuggets
  13. Nested Cross-Validation for Machine Learning with Python
  14. Mathematics for Machine Learning
  15. FAISS a library for very fast clustering
  16. Data Transformation: Standardization vs Normalization
  17. Machine learning sucks at covid by Cory Doctorow