El análisis de datos y el machine learning han conquistado la industria moderna, algunas tareas del machine learning son:
- Sugerir resultados en búsquedas online.
- Reconocimiento de voz en smartphones y software de ofimática.
- Predecir comportamiento de clientes, el clima y un gran etcétera.
En este curso entenderemos el concepto de datos, sus formatos; procesos fundamentales como la limpieza (curación o Data cleaning), métricas explorativas que nos permitiran conducir el análisis, generar visualizaciones y poder realizar el procesamiento para la construcción de modelos predictivos. Desde un componente práctico y uno teórico.
En esta unidad veremos una introducción a diversos trabajos donde se realiza análisis de datos y pondremos a punto los toolkits que utilizaremos durante el curso.
-
Introducción al análisis de datos, toolkit y ejemplos prácticos.
- Tutorial Instalación de Anaconda
-
Repaso de Python.
-
Introducción a Jupyter Notebooks
-
Práctico Python en Jupyter Notebooks
-
-
Paquetes para cálculo científico, ciencia de datos y aprendizaje automático.
- Práctico de Paquetes en Python
-
Introducción a git.
-
Evaluación Ejercicio 1
- Ejercicio 1, Primer Proyecto Github con un Jupyter Notebook
En esta unidad repasaremos herramientas de estadística descriptiva y luego exploraremos el paquete Pandas de Python.
- Estadística Descriptiva.
- Formatos de archivos de datos y su manipulación.
- Pandas y la exploración de datos.
- Filtrado de datos.
- Estadística Predictiva.
- Toma de decisiones.
- Clasificación.
- Entrenamiento de Modelos.
- Máquinas de vectores de soporte.
- Arboles de decisión y Random Forest.
- Reducción de dimensionalidad.
- Aprendizaje No Supervisado.
- Visualización.
- Introducción a las redes neuronales.
- Entrenamiento de redes neuronales profundas.
- Visión Computacional.