/dataengineering-roadmap

Un repositorio más con conceptos básicos, desafíos técnicos y recursos sobre ingeniería de datos en español 🧙✨

MIT LicenseMIT

Roadmap 2024 - Data engineering en español

Un repositorio más con conceptos básicos, desafíos técnicos y recursos sobre ingeniería de datos en español 🧙✨

¿Te gustaría aportar al repositorio? Visitá la guía de contribución

Nota: la siguiente ruta de aprendizaje está diseñada a criterio personal con la idea de facilitar el estudio de aquellos interesados en la ingeniería de datos con material libre, gratuito y en español que encontré en internet. No es una guía definitiva ni un curso, es una lista de recursos que puede ser mejorada con el tiempo con contribuciones de la comunidad.

📚 Libros de ingeniería de datos en inglés

Roadmap illustration

Programación

🚀 Fundamentos

Comenzamos con la comprensión de los conceptos fundamentales de programación y lógica. Esta sección puede ser desarrollada simultáneamente con el aprendizaje del lenguaje de programación que elijan.

🐍 Lenguaje de programación

Recomiendo iniciar con Python debido a su curva de aprendizaje amigable y su prevalencia en la industria actual. No obstante, es importante destacar que el procesamiento de datos también puede realizarse con R, Java, Scala, Julia, entre otros.

🔄 Control de versiones con Git

El aprendizaje sobre el control de versiones no solo es valioso al trabajar en equipos, sino que también nos proporciona la capacidad de rastrear, comprender y gestionar los cambios realizados en nuestro proyecto y así mantener un desarrollo eficiente y colaborativo.

🛠️ Más herramientas

Bases de datos

🚀 Fundamentos

En esta instancia toca aprender sobre las bases de datos. La elección del gestor de bases de datos a utilizar queda a tu criterio, aunque personalmente recomiendo PostgreSQL para datos estructurados y MongoDB para datos no estructurados. Sin embargo, existen muchas otras opciones: MySQL, SQLite y demás.

📊 SQL

También aprenderás SQL, un lenguaje de consulta para gestionar y manipular las bases de datos relacionales.

📐 Diseño

Ahora seguimos con conceptos más avanzados que nos servirán para diseñar bases de datos, datalake, datawarehouses, esquemas, etcétera.

Big Data

Lo siguiente es entender algunos conceptos de Big Data. Además, resulta interesante adquirir conocimientos básicos sobre inteligencia artificial, inteligencia de negocios y análisis de datos sin la necesidad de profundizar demasiado.

🚀 Fundamentos

📊 Analítica (opcional)

🤖 Inteligencia artificial (opcional)

📈 Inteligencia de negocios (opcional)

Procesamiento de Datos

En esta sección está el corazón de la ingeniería de datos, veremos que son los data pipelines, qué es un ETL, orquestadores, y más.

🔍 ETL y Data Pipelines

🎭 Orquestadores

🏰 Arquitecturas

Cloud

Es útil tener conocimientos de cloud computing. Llegado a este punto, te recomendaría considerar la preparación de certificaciones oficiales. Aunque estos exámenes suelen tener un costo, puedes encontrar recursos de preparación gratuitos y oficiales de los proveedores más conocidos en la industria.

☁️ Fundamentos de la nube

📜 Certificaciones oficiales

Búsqueda Laboral

Finalmente te dejo algunas lecturas y videos que ofrecen consejos y experiencias relacionadas con la búsqueda laboral en el ámbito de sistemas. Más adelante, se agregarán desafíos técnicos y otros recursos vinculados al tema.

🔍 Consejos

🛠️ Desafíos técnicos

En proceso 😊


Si te resultó útil este repositorio, regalame una estrella ⭐

Static Badge Static Badge