Desarrollo de pipeline como respuesta al challenge de _Coderio. El pipeline en desarollo integra:
- AWS s3 como fuente de datos
- Python como extractor y orquestador del flujo de datos.
- Boto3, SDK de AWS, para conexion y manejo de los servicios cloud
- Sqlalchemy para conexiones y ejecucion de scripts sql
- Pandas para manipulacion de datos
- Postgres
- Pgadmin, interface de la base de datos
- Docker como el integrador
- Docker compose para el despliegue
- Docker version 20.10.8
- Docker-compose version 1.29.2
- Clone the repo
git clone https://github.com/Luisarg03/ChallengeCoderio.git
- Create containers on distros Linux
sudo docker-compose up
- Una vez deplago los contenedores se podra acceder a Pgadmin desde:
localhost:5050
- user: admin@admin.com
- password: root
- host: pg_container
- port: 5432
- user: root
- password: root
- Update automatico sobre el esquema WH
- Generar tabla de logeo de actividades
- Minimizar codigo en los distintos modulos
- Analisis de las tablas FCT en los esquemas correspondientes
- Mejorar rendimiento de pipeline
- Fork the Project
- Create your Feature Branch (
git checkout -b feature/AmazingFeature
) - Commit your Changes (
git commit -m 'Add some AmazingFeature'
) - Push to the Branch (
git push origin feature/AmazingFeature
) - Open a Pull Request
free license for distribution 🖤
Name - luisarg03
Project Link: https://github.com/Luisarg03/ChallengeCoderio