/AnalisisyVisualizacion

Repositorio para la materia Análisis y Visualización de Datos

Primary LanguageJupyter NotebookMIT LicenseMIT

Diplomatura AACSyA 2018 - FaMAF - UNC

Análisis y Visualización de Datos

Requisitos de Instalación

Hay dos manejadores principales de paquetes para Python: conda y pip. Para este curso les recomendamos usar anacondaconda, ya que funciona también como un manejador de entornos (como virtualenv). Además de ello, las notebooks estarán escritas para Python 3.

Instalación Anaconda en Unix

Para configurar el entorno de trabajo con jupyter y todas las herramientas necesarias para este curso, pueden ejecutar los siguientes comandos:

$ wget https://repo.anaconda.com/archive/Anaconda3-2018.12-Linux-x86_64.sh
$ bash Anaconda3-2018.12-Linux-x86_64.sh
$ source ~/.bashrc
$ conda create --name diplodatos python=3.6 anaconda
$ source activate diplodatos

Instrucciones más completas aquí cortesía de Digital Ocean.

Instalación Anaconda en windows

Solamente hay que descargar el instalar (para python 3) y hacer doble click para que se instale. Sigan todos los pasos, pero confirmen Agregar conda a la variable PATH, a pesar de que tenga un warning.

Luego, abrir la consola (cmd) y ejecutar los últimos dos

$ conda create --name diplodatos python=3.6 anaconda
$ activate diplodatos

Si ya tenían conda instalado, comprueben que la versión instala seaborn 0.9 y no la 0.8, que a pesar de no ser un major release tiene varios major changes que hacen que los ejemplos de Internet. Ej: catplot (0.9) vs factorplot (0.8). Instalar manualmente seaborn 0.9 hace que, en algunas distribuciones, se rompa jupyter, así que en ese caso les recomendamos que i) reinstalen anaconda o ii) usen seaborn 0.8 directamente.

Si prefieren utilizar otro manejador de paquetes distinto de conda, las librerías que utilizaremos son:

  • matplotlib
  • numpy
  • pandas
  • seaborn

Usando jupyter

Para lanzar una notebook, ingresar a la consola y navegar hasta el directorio en el que se encuentra la notebook. Allí, activar el environment (con activate diplodatos para Windows y source activate diplodatos. Esto deben hacerlo cada vez que abran una consola nueva. En este mismo directorio pueden ejecutar jupyter para abrir las notebooks:

$ jupyter notebook

Con esto debería abrirse una nueva pestaña en el navegador que muestra el contenido del directorio en el que se abrió jupyter. Si esto no sucede, pueden copiar la dirección (de localhost) y abrirla directamente en el navegador. Copiar la dirección completa, con el token de seguridad.

Opcionales

Las siguientes librerías son necesarias para correr los ejemplos con R:

$ conda install -c r r-essentials rpy2

Datasets

Los datasets con los que estaremos trabajando se encuentran en https://drive.google.com/drive/folders/1yDFFyIiEf6wbA8LE7bVEBXBuz8Fq4dlv?usp=sharing. No todos son necesarios, la mayoría los usamos sólo en ejemplos.