/AprendizajeNOSupervisado_2024

Curso de Aprendizaje NO Supervisado

Primary LanguageJupyter Notebook

AprendizajeNOSupervisado 2022

Curso de Aprendizaje NO Supervisado DiploDatos

Valeria Rulloni, Laura Alonso Alemany

Archvos de clases en: https://drive.google.com/drive/folders/1qJ8cYKJz_0-j-f-zvvr9RWFGLRj3H35L

Contenidos:

  • Clustering
  • Embeddings
  • Aprendizaje Semi-Supervisado
  • Reglas de Asociación

Práctico entregable: Utilizar la base de jugadores “players_22.csv” disponible en la página de Kaggle https://www.kaggle.com/datasets/stefanoleone992/fifa-22-complete-player-dataset . Considerar que la base 2022 no tiene el mismo formato que la base vista en clase, a los nombres de las variables se les agregó una keyword para identificar a qué tipo de habilidad corresponde.

Con la nueva base, realizar un análisis análogo al que realizamos en el cursado de la materia con los datos FIFA2019. Realice comentarios en cada parte (verbose=True ;))

1- Análisis exploratorio de la base. 2- Evaluación visual e intuitiva de a dos variables numéricas por vez. 3- Uso de dos técnicas de clustering: por ejemplo k-medias, DBSCAN, mezcla de Gaussianas y/o alguna jerárquica. Elección justificada de hiper-parámetros 4- Evaluación y Análisis de los clusters encontrados. 5- Pregunta: ¿Se realizó alguna normalización o escalado de la base? ¿Por qué ? 6- Uso de alguna transformación (proyección, Embedding) para visualizar los resultados y/o usarla como preprocesado para aplicar alguna técnica de clustering.