/ACI777

Curso de Análisis de Datos de la UDLA

Primary LanguageJupyter Notebook

ACI777

Imagen_UDLA

Curso de Análisis de Datos

Imagen_FINE

Profesor: Dante Travisany

El análisis de datos y el machine learning han conquistado la industria moderna, algunas tareas del machine learning son:

  1. Sugerir resultados en búsquedas online.
  2. Reconocimiento de voz en smartphones y software de ofimática.
  3. Predecir comportamiento de clientes, el clima y un gran etcétera.

En este curso entenderemos el concepto de datos, sus formatos; procesos fundamentales como la limpieza (curación o Data cleaning), métricas explorativas que nos permitiran conducir el análisis, generar visualizaciones y poder realizar el procesamiento para la construcción de modelos predictivos. Desde un componente práctico y uno teórico.

Unidad I - Puesta a punto

En esta unidad veremos una introducción a diversos trabajos donde se realiza análisis de datos y pondremos a punto los toolkits que utilizaremos durante el curso.

  1. Introducción al análisis de datos, toolkit y ejemplos prácticos.

    1. Tutorial Instalación de Anaconda
  2. Repaso de Python.

    1. Introducción a Jupyter Notebooks

    2. Práctico Python en Jupyter Notebooks

  3. Paquetes para cálculo científico, ciencia de datos y aprendizaje automático.

    1. Práctico de Paquetes en Python
  4. Introducción a git.

    1. Instalación de Git.
    2. Práctico git en github.
  5. Evaluación Ejercicio 1

    1. Ejercicio 1, Primer Proyecto Github con un Jupyter Notebook

Unidad II - Estadística, Datos y Pandas

En esta unidad repasaremos herramientas de estadística descriptiva y luego exploraremos el paquete Pandas de Python.

  1. Estadística Descriptiva.
  2. Formatos de archivos de datos y su manipulación.
  3. Pandas y la exploración de datos.
  4. Filtrado de datos.
  5. Estadística Predictiva.
  6. Toma de decisiones.

Unidad III - Aprendizaje de Máquina

  1. Clasificación.
  2. Entrenamiento de Modelos.
  3. Máquinas de vectores de soporte.
  4. Arboles de decisión y Random Forest.
  5. Reducción de dimensionalidad.
  6. Aprendizaje No Supervisado.
  7. Visualización.

Unidad IV - Deep Learning

  1. Introducción a las redes neuronales.
  2. Entrenamiento de redes neuronales profundas.
  3. Visión Computacional.