/ChallengeCoderio

Desarrollo de pipeline como respuesta al challenge de _Coderio

Primary LanguagePython

Coderio challenge

Report Bug

Sobre el proyecto

Desarrollo de pipeline como respuesta al challenge de _Coderio. El pipeline en desarollo integra:

  • AWS s3 como fuente de datos
  • Python como extractor y orquestador del flujo de datos.
    • Boto3, SDK de AWS, para conexion y manejo de los servicios cloud
    • Sqlalchemy para conexiones y ejecucion de scripts sql
    • Pandas para manipulacion de datos
  • Postgres
  • Pgadmin, interface de la base de datos
  • Docker como el integrador
  • Docker compose para el despliegue

Pre-requisitos

  • Docker version 20.10.8
  • Docker-compose version 1.29.2

Init

  1. Clone the repo
    git clone https://github.com/Luisarg03/ChallengeCoderio.git
  2. Create containers on distros Linux
    sudo docker-compose up
  3. Una vez deplago los contenedores se podra acceder a Pgadmin desde:
    localhost:5050

LOGIN:

SERVER

  • host: pg_container
  • port: 5432
  • user: root
  • password: root


Pipeline roadmap


tareas que faltan completar

  • Update automatico sobre el esquema WH
  • Generar tabla de logeo de actividades
  • Minimizar codigo en los distintos modulos
  • Analisis de las tablas FCT en los esquemas correspondientes
  • Mejorar rendimiento de pipeline

Contribucion

  1. Fork the Project
  2. Create your Feature Branch (git checkout -b feature/AmazingFeature)
  3. Commit your Changes (git commit -m 'Add some AmazingFeature')
  4. Push to the Branch (git push origin feature/AmazingFeature)
  5. Open a Pull Request

Licencia

free license for distribution 🖤

ContactO

Name - luisarg03

Project Link: https://github.com/Luisarg03/ChallengeCoderio