shravan-kuchkula/udacity-data-eng-proj4

Developed an ETL pipeline for a Data Lake that extracts data from S3, processes the data using Spark, and loads the data back into S3 as a set of dimensional tables. Lake Processing: Spark, Lake Storage: S3

Jupyter Notebook

Stargazers

abdulshake
San Antonio, Texas
asaane88
austyngo
Ay00la
University of Ilorin
capsu86
haris-m-aslam
Trivandrum
igvog
DataArt
JeanM1996
Loja-Ecuador
jpurrutia
K-G-PRAJWAL
Amazon
neilrjones
OcularIT Solutions, Inc
nexxyb
samadarshad
sammymutahigicheru
@DVT
SaudAlmoter
trijuhari