/DataWrang33

Repositorio para centralizar el material del módulo 4 de la G33

Primary LanguagePython

Módulo 4 - Data Wrangling

Objetivo del módulo: Entender del proceso de Extracción Transofrmación y Carga (ETL) 📥 🔄 📤 ☁ Y llevarlo a cabo a través de un proyecto

En el módulo se priorizará el cómo y donde podemos conseguir datos para nuestros proyectos

Sesión 1 - Introducción a Data Wrangling / Data Engineering ☁️

· Presentación

· Challenge práctica de Pandas

· Carpeta con datos para ejercicio de pandas

Sesión 2 - Bases de Datos No relacionales (NoSQL)

· Descargar Mongo Compass

· Crear cuenta en Mongo Atlas

· Presentación de BD No relacionales

· Colab de BD No relacionales_Codigo Base

· Colab de BD No relacionales_RESUELTO EN CLASE

· Carpeta con datos para nuestro cluster [Spotify, Amazon, etc]

Sesión 3 - ➕ More NoSQL DB con DODB usando Mongo 🍂 + APIs 🌐:

· Continuación con Colab Mongo

· Presentación de APIS

Sesión 4 - Modo código para entender las APIs (o sea la parte práctica de APIs)

· Colab de APIs · Colab de APIs_ RESUELTO EN CLASE

Documentación de APIs Utilizadas en clase

Sesión 5 - Web Scrapping

Presentación Web Srapping

Descarga Google Chrome

Descarga Driver para Chrome

Estos 2 sí los necesitaremos para la clase, los demás pueden esperar para la próxima

Descarga Visual Studio Puede ser Visual Studio o cualquier editor de código/tetxo que uds quieran (Sublime, Atom, El editor de notas de la propia compu, etc...)

Descarga Python Desktop

Sesión 6 - Web Scrapping (Parte práctica) 🤖 🕷

Colab Web Scrapping

Sesión 7 - Construye tu API 🤖 🕷

Código base

Código RESUELTO EN CLASE

Descargar Postman

Software para hacer pruebas de peticiones

Sesión 8 - Deploy API a Producción 🤖 🕷

Requirements Configuracion

Crear cuenta en github.com

Crear cuenta en glitch.com

Para guiarse: REPO Referencia