/mcdaa-intro-cd

Repositorio del Curso Introduccion a Ciencia de Datos de la Maestria en Ciencia de Datos y Aprendizaje Automatico

Primary LanguageJupyter Notebook

mcdaa-intro-cd

William Shakespeare, nació el 23 de abril de 1564 en Stratford-upon-Avon, Inglaterra y en lo que hoy en día parecería una vida corta (52 años), se transformó en una figura titánica del mundo de la literatura. Este dramaturgo y poeta inglés dejó un legado imborrable con sus más de 39 obras literarias, existen al menos dos corrientes que discuten incluso hoy en día la atribución de ciertas obras, entre entre las que se destacan sus tragedias y comedias, obras como "Hamlet", "Romeo y Julieta" y "El rey Lear". Ya sea si has leído alguna obra de William Shakespeare o no, es muy probable que reconozcas algunas frases con origen en su obra como "Ser o no ser, esa es la cuestión" o "El amor es un humo hecho con el vapor de suspiros". Estas líneas no solo demuestran su maestría lingüística, sino que también reflejan las intrigas universales sobre el amor, el poder y la tragedia, manteniendo su relevancia a través de los siglos.

En este trabajo llevado adelante en el contexto del primer Laboratorio [2] del curso Introducción a la Ciencia de Datos de la Facultad de Ingeniería, UdelaR, edición 2024, nos proponemos adentrarnos en la obra de William Shakespeare con un enfoque de ciencia de datos, analizando sus principales obras utilizando algunas técnicas sencillas de análisis de datos.

Esperamos que disfrutes este viaje a través de los datos, el tiempo y principalmente, de la lengua inglesa, tanto como nosotros lo hemos disfrutado.

"Ten más de lo que muestras habla menos de lo que sabes."

William Shakespeare

Pasos para Setup con Pyenv

Ejecutar los siguientes pasos en una terminal:

  1. Crear ambiente pyenv y activarlo

[OPCIONAL]: En caso de no tener instalado aún Python 3.12.0

pyenv install 3.12.0

Luego:

pyenv virtualenv 3.12.0 intro-cd
pyenv activate intro-cd
eval "$(pyenv init --path)"
  1. Instalar depdencias
pip install -r requirements-lock.txt
  1. Descarga Modelo Spacy
python -m spacy download en_core_web_sm
python -m spacy download en_core_web_lg
  1. Crear un Kernel específico para esto
ipython kernel install --user --name introcd

Ahora debería poder ejecutar el siguiente comando para levantar jupyter notebook localmente y correr el laboratorio:

jupyter notebook laboratorio_1.ipynb

También puede ejecutarlo desde VSCode o Google Colab, sin embargo recomendamos el uso de JupyterLab para una mejor experiencia.

Informes y Experimentos

Este trabajo se realizó en dos partes: Laboratorio 1 y Laboratorio 2. Por esa razón el repositorio se organiza en dos subcarpetas que contienen todos los recursos necesarios para replicar los experimentos. A su vez, cada directorio contiene su propio archivo README.md con instrucciones, notebooks y dependencias python indicadas en archivos requirements.txt.

Parte Directorio 2
👉 Laboratorio 1 Tarea1
👉 Laboratorio 2 Tarea2

Referencias

  1. Instalación de Jupyter con pyenv https://brandonrozek.com/blog/jupyterwithpyenv/

  2. Spacy Models Downlaod https://spacy.io/usage/models